시리(Siri)에 적용된 음성 인식 기술은 무엇일까요?

2022.02.06 17:52 4,343 조회

안녕하세요, 데이크루 1기로 활동 중인 '므인'입니다.

아이폰 유저라면 모두가 알고 있는 내 손안에 개인비서 시리(Siri)에 적용된 음성 인식 서비스에 대해 소개하고자 합니다.


"시리야~"라고 부르면 인식하여 응답하는 이 서비스는 2011년 애플에서 출시한 음성 기반 개인비서 서비스입니다.

이를 시작으로 해외 뿐만 아니라 많은 국내 기업에서 음성 기반 서비스를 출시하며 많은 사람들의 관심 속에 성장하였습니다.


많은 제품들 속에서 음성 인식 기술을 만나보실 수 있는데요, 이 기술에 대해 간단하게 정리해보겠습니다.



음성 인식 기술

컴퓨터가 마이크와 같은 소리 센서를 통해 얻은 음향학적 신호(acoustic speech signal)단어나 문장으로 변환시키는 기술을 말합니다.


이 기술에는 크게 3가지 과정이 있습니다.

  1. STT (speech-to-text) 기술
  2. NLP 기술
  3. TTS (text-to-speech) 기술



STT (speech-to-text) 기술

사용자의 음성을 텍스트로 변환하는 기술입니다.

주변 소음에서 원하는 소리를 파악하고 발음과 단어를 인식하여 컴퓨터가 이해할 수 있도록 텍스트로 변환해야 합니다.



NLP 기술

Natural Language Processing 즉, 자연어 처리 기술을 말하며 인공지능의 기술 중 하나입니다.

자연어는 사람이 의사 소통을 위해 사용하는 언어이며, 자연어 처리는 컴퓨터가 자연어를 이해하고 처리하는 기술입니다.