본문 바로가기

[IT/Programming]

음성 인식 (Speech Recognition) 프로그램

728x90
반응형
# 음성 인식 (Speech Recognition) 프로그램 크롬 브라우저를 사용하면 구글에서 제공하는 음성인식 기술을 컴퓨터에서도 손쉽게 사용할 수 있음. 인식률도 괜찮고, 짱 좋은듯? 다른 인터넷 브라우저로 구글에 접속했을때는 안되는걸로 봐서 크롬 브라우저에 프로그램이 내장되어 있고, 구글 페이지에서 이 프로그램을 동작시키는듯함. 구글에서 브라우저를 개발하고 무료로 배포한게 이런거 써먹기 위함인듯도? 여러가지 보안관련 제약 때문에 인터넷에서 임의의 윈도우 프로그램을 동작시키는건 제한되어 있을테니까. ## TOC ## 사용 방법 사용 방법은 매우 간단. 그냥 크롬 브라우저 열면 빈 페이지에 구글 검색창이 하나 뜨는데, 검색창 오른편의 마이크 모양을 누르면 됨. 아니면 크롬 브라우저로 구글 메인 페이지 에 접속해도 마찬가지로 검색창 오른편에 마이크 아이콘이 있을거임. ## 언어 설정 내가 한국에서 접속해서 그런건지, 아니면 내 계정의 언어설정이 한국어로 되어 있어서 그런건지, 음성 검색을 할때 한국어 기준으로 음성을 인식함. 그래서 영어로 말해도 대부분 그 발음을 한글로 표현해주는 경우가 많음. 영어로 음성을 인식시키고 싶다면 구글 영어 페이지 로 접속해서 사용해야 하는듯. 반대로 외국에서 생활하시거나 개인 구글 언어 설정이 영어로 되어 있는 사람이 한국어로 음성을 인식시키고 싶다면, https://www.google.com/?hl=ko 로 접속하면 된다. 다른 언어들도 인식이 될거 같은데, 적절한 해당 언어 code 를 ?hl 부분에 입력해서 접속하면 될듯? 2 Letter code Language Codes 는 참고해서... 대충 프랑스어는 "FR", 독일어는 "DE", 중국어는 "ZH", 일본어는 "JA" 등임. ## 어떤 알고리즘을 사용한걸까? 기본적으로 기계 학습 (Machine Learning) 코드를 쓴거 같긴한데... Deep Learning (그중에서도 deep neural networks 방법?) 썼을듯? 구글은 training data 를 많이 가지고 있을테니, 초기 조건이랑 코드들만 잘 설계해 놨다면 기계학습 시키는 과정은 금방 해냈을거 같음. 나도 조잡하게나마 이런 코딩 좀 해보면서 기계학습 알고리즘들 공부 및 개발해보고 싶은데... ## RRA
  1. https://www.google.com/
  2. https://www.google.com/?hl=en
  3. sitepoint.com - ISO 2 Letter Language Codes
  4. kipid's blog - 기계 학습 (Machine Learning)
728x90
반응형