You cannot see this page without javascript.

알리바바와 40인의 도둑 이야기에 나오는 신기한 동굴의 문은 ‘열려라. 참깨’라는 말에 문이 열린다. 옛날부터 사람들은 사람 아닌 물건, 혹은 동물들이 사람 말을 알아듣는 이야기를 많이 만들어냈는데, 이것이야말로 궁극의 상상력이 아닐까 싶다. 하지만, 정작 사람은 아무 불편 없이 다른 사람 말을 듣고 이해하는 것으로 보아, 분명히 그 속에는 말을 이해하는 원리가 있을 것이고, 오늘날에는 그 원리를 이용한 음성인식 제품들이 많이 만들어지고 있다.

 

 

사람이 소리를 내는 원리

우리가 소리를 알아듣는 방법을 이해하기 위해서는, 우선 사람이 소리를 내는 방법을 알아야 한다. 우리가 소리를 내면, 공기를 매질로 한 파동이 만들어지고, 그 파동은 듣는 사람의 귀 고막을 두드리는 것으로서 음성 정보를 전달하게 된다. 그럼, 사람은 소리를 어떻게 내는 것일까? 첫 번째 단계는, 횡격막이 수축하면서 허파 속의 공기가 밖으로 나오게 된다. 이때 목에 있는 성문(聲門)을 지나게 되는데, 성문에는 성대(聲帶)라는 한 쌍의 주름이 있다.

 

우리가 ‘아~’라는 음을 발성하면서 손을 목에 대었을 때 진동을 느끼게 되는데 바로 그 부분이 성대가 떨리고 있는 부분이다. 그럼 왜 그곳에서는 진동이 발생하게 될까? 우리는 지하철 플랫폼에서 전동차가 막 지나갈 때, 플랫폼 쪽에서부터 철로 방향으로의 힘을 느끼게 되는데, 이것은 베르누이의 정리때문에 발생하는 일이다. 사람의 성문에서도 그런 현상이 발생한다. 공기가 성문을 지나게 될 때 그 부분의 압력이 낮아지고, 힘은 압력이 높은 곳에서 낮은 곳으로 향하므로 그 결과 양옆에 있는 성대들이 서로 부딪히게 된다. 성문에서 발생하는 이러한 사건들은 사람의 목소리에 어떤 영향을 주는 것일까? 바로 음의 높낮이(pitch)를 결정하게 된다. 우리가 공기를 빠르게 보내면 압력이 더 낮아지고, 성대들이 서로 부딪히는 속도는 빨라지며 음의 높이는 높아지게 된다.

 

그럼, 실제 ‘아’, ‘어’와 같은 소리의 언어적 정보는 어디에서 만들어지는가? 성대에서 입술과 콧구멍까지의 통로를 성도(聲道)라고 부르는데 바로 이 성도를 지나면서 여러 가지 음이 만들어지게 된다. 성도의 상태, 즉 입을 크게 벌렸는지 작게 벌렸는지, 혀끝이 윗잇몸에 붙었는지 아닌지와 같은 여러 가지 상태에 따라서 다양한 소리가 나오게 된다.


성도(성대에서 입술 또는 콧구멍에 이르는 통로)의 시상단면(矢狀斷面)
<출처 : wikipedia>

 

 

음성 파형으로부터 언어 정보를 추출하는 방법

‘카’라고 발성했을 때의 음성 파형

  

위에 보이는 그림은 ‘카’라고 발성했을 때의 음성 파형이다. 위 그림에서 0.13초까지 ‘ㅋ’ 음에 해당하는 음성 파형이고 그 이후부터는 ‘아’ 음에 해당한다. ‘ㅋ’과 ‘아’ 음소(音素) 파형 중 ‘아’ 파형을 관찰해보면 시간 축 상에서 커다랗게 나타나는 피크 (peak)들이 보이는 것을 알 수 있다. 바로 이 피크들의 간격을 주기라고 말하고 이 시간 차이가 성대가 떨리는 주기와 일치하게 된다. 한편 ‘ㅋ’ 파형은 그런 피크들이 보이지 않는데 성대가 떨리지 않고 난류를 일으킨 무성음이기 때문이다. 그럼 음성 인식기는 위 음성 파형으로부터 어떻게 어떤 말인지 알아낼까?
 
음성 인식기는 음성 파형이 주어지게 되면, 매 1/100 초 단위로 그 시점에 있는 약 0.02초 정도 길이의 음편(音片)을 가져와서 분석하게 된다. 그 짧은 길이의 음성 파형은 여러 단계의 신호 처리를 거치게 되고 최종적으로 10개 이상의 숫자들이 나오게 되는데, 이 숫자들은 바로 그 시점에서의 성대와 성도의 상태를 나타내는 숫자들이다. 좀 더 쉽게 설명하면, 그 시점에서의 성대 진동 횟수와 입 모양을 그릴 수 있는 숫자들이다. 한편, 음성 인식 측면에서 보면, 사람은 어떠한 음높이의 ‘학교’라는 말을 들어도 모두 ‘학교’라는 언어 정보를 추출한다. 즉, 성대의 진동 주기는 언어 정보와 무관하다. 그러므로 그 숫자 중에서 성대 진동과 관련된 숫자들은 버리고 더이상 사용하지 않는다. 위의 이야기를 비유적으로 설명하면 다음과 같이 요약할 수 있다. 성문에서부터 입까지 찍는 특수한 사진기가 있다고 가정하고 그 사진기는 초당 100회 사진을 찍게 된다. 음성 인식은, 그 사진들을 시간 축으로 나열해 놓고 어떤 말일까 계산하는 과정이다.

 

 

연속 음성 인식기의 원리

음성인식 기술은 그 기술의 난이도에 따라 ‘고립 단어 인식’과 ‘연속 음성 인식’으로 크게 나뉜다. 예를 들어 인식 대상 어휘가 ‘서울’, ‘부산’ 두 개라고 가정하자. 이때 전자는 ‘서울’과 ‘부산’ 딱 두 개 어휘만 인식하는 기술이고, 후자는 이 두 개 어휘의 모든 조합, 즉 ‘서울 서울’, ‘서울 부산 서울’과 같이 어떠한 길이의 어휘 조합도 모두 인식하는 기술이다. 당연히 후자가 더 어려운 기술이다. 그리고 사람과 같은 수준의 음성 인식기를 개발하고자 한다면, 후자의 기술이 사용되어야 한다. ‘연속 음성 인식’을 수학식으로 표현하면 아래와 같다.

 

  

 

음성 인식을 위해서는 당연히 소리를 우선 들어야 하고, T 시간까지 발성된 음성이라면 이 음성은 라고 쓰자. 다음 단계는, 어떤 말일까 예측을 해야 하는데 그 말이 몇 개의 단어로 되어 있는지 모르므로 이라고 쓰고 여기서 m은 단어의 수가 된다. 첫 번째 식의 의미는, 음성이 주어졌을 때 모든 단어 조합에 대해서 가장 확률적으로 가능성이 큰 단어 열이 바로 우리가 찾고 싶은 단어 열이고 그것이 음성인식의 결과 이라는 의미이다.


위에서 첫 번째 식은 베이즈 정리 (Bayes’ Theorem)에 의해서 두 번째 식이 되고, 는 해당 음성 자체가 입력될 확률인데 이 값은 어떤 단어 열을 선택하든 언제나 분모로 있으므로 전체 식에 영향을 주지 않아 제거할 수 있다. 마지막 식에서 을 음향 모델(acoustic model)이라고 부르고 을 언어 모델(language model)이라고 부르는데, 이 두 모델의 확률 곱이 최대가 되는 이 우리가 찾고 싶은 최종 결과이다.


그럼, 두 모델의 의미는 무엇일까? 우선 을 보면 음성 파형을 의미하는 가 없다. 즉, 파형을 보지도 않고 그 음성이 무엇일까 예측하는 확률이다. 예를 들어, 오늘이 올림픽 개최일이라고 가정하자. 그렇다면, 사람들은 아마도 ‘올림픽’이라는 단어를 사용할 가능성이 클 것이다. 그러므로 누군가 무슨 말을 했는데 그 말을 맞추어야 한다면, ‘올림픽’ 아니냐고 이야기하는 것이 가장 합리적인 생각일 것이다. 정리하면 은 사람이 발화 시점에 어떤 단어들을 말할 확률을 미리 계산해서 가지고 있는 값이다. 두 번째로 은 단어 ‘올림픽’을 발성했을 때 해당 음성이 발성될 확률을 의미한다. 예를 들어 네 살배기 어린아이가 ‘올림픽’을 발성하는 것과 성인이 발성하는 것, 그리고 성우가 발성하는 것은 쉽게 생각해도 음의 명료성에서 크게 차이가 있을 것이다. 어린아이가 발성한 ‘올림픽’은 ‘올림’이 ‘우리’처럼 들려서 어쩌면 ‘우리 엄마’에 가깝게 들릴지도 모르고, 그러면  가  보다 더 높은 확률값을 가지게 된다.

 

 

빠르게 인식하는 방법

위 음성 인식 수식을 보면, 모든 후보가 되는 단어 열에 대한 확률을 모두 구해야 하고 그 중 가장 높은 확률을 낸 단어 열을 선택하게 되어 있다. 한편, 단어 열 길이에 대해 제한이 없으므로, 상식적으로 생각해도 우리가 찾아야 하는 탐색 공간은 무한대가 되어 버린다. 그러므로 어떻게 빠르게 단어 열을 찾을 것인가가 중요한 문제가 된다. 이에 대한 해결책은 매우 단순하다. 모든 후보 단어 열에 대한 가능성을 열어두고 음성을 듣다가 정답이 아닐 것 같은 후보들을 탈락시키는 것이다. 마치 축구에서 토너먼트 경기를 하면서 한 팀씩 탈락하는 것처럼, 음성을 들으면서 가능성이 없는 후보는 빨리 탈락시킨다. 음성 신호가 모두 처리되었을 때는 그 험한 경쟁에서 살아남은 최종 승리자가 최종 인식 결과가 된다.

 

 

 

이상호 / NHN 기술연구팀 팀장
KAIST에서 한국어 문서-음성 변환 시스템에서의 운율 생성 모델로 박사학위를 받은 후, LG에서 음성 인식기 개발에 참여했으며, 현재는 네이버 음성 검색 시스템을 개발하는 기술연구팀에서 근무하고 있다.


발행일 
2011.03.24




원문출처 : http://www.soonpeng.co.kr/index.php?document_srl=1045166
profile
엮인글 :
List of Articles
번호 제목 글쓴이 조회 수sort 날짜
공지 심심타파 잼있는 글 많이 올려 주세요....(냉무) [1] Chanyi 10521 2003-06-10

좋은글 좋은글귀"시간은 동전이다" [1]

[좋은글귀]"시간은 동전이다" 님이라는 글자에 점 하나만 찍으며 남이라는 유행가 가사가 있습니다. 그리고 삶이라는 글자에 "ㅏ"하나만 보태면 사람이라는 글자가 됩니다.. 삶을 아름답게 이끄는 힘은 바로 사람입니다. "드라마 부활 유신혁의 대사" NO를 거구로 쓰면 전진을 의미하는 ON이 된다 모든 문제에는 반드시 문제를 푸는 열쇠가 있다 "노먼 빈센트 빌" 시간은 동전이다 그것은 그대가 가진 유일한 동전이며 그 동전을 어디에 쓸지는 오직 그대만이 결정할 수 있다 위대한 사람은 단번에 높은 곳에 뛰어오른 것이 아니다 괴로움...

  • 2011-12-11

좋은글 Best Friend란? file [1]

BEST FRIEND 'B'elieve - 항상 서로를 믿고 'E'njoy - 같이 즐길 수 있고 'S'mlie - 바라만 봐도 웃을 수 있고 'T'hanks - 서로에게 감사하며 'F'eel - 말하지 않아도 느낄 수 있고 'R'espect - 서로를 존경하면서 'I'dea - 떨어져 있어도 생각하고 'E'xcuse - 잘못을 용서하고 'N'eed - 서로를 필요로 하고 'D'evelop - 서로의 장점을 개발해 주는 사람

  • 2011-10-07

좋은글 살 못 빼는 사람들의 21가지 특징

먹는 것과 관련된 7가지 특징 - 밥을 자주 거른다. 특히 아침을 자주 거른다. - 밤에 무언가를 자주 먹는다 - 귀찮아서 저녁은 주로 외식을 한다. - 과일이나 아채를 잘 먹지 않는다. - 군것질을 자주, 꾸준히, 많이 한다. - 많이 먹는 것을 좋아한다. - 좋은 식습관과 나쁜 식습관의 사이를 자주 오간다. (꾸준한 식습관을 유지하지 못한다.) 운동과 관련된 7가지 특징 - 움직이지 않고 앉아서 지내는 것을 좋아한다. (Couch Potato라고 불리는 사람들입니다.) - 운동에 잘 참여하지 않으려고 한다. - 한가지 운동을 꾸준히 하지 못하고 ...

  • 2011-07-29

좋은글 마우스랜드 file

올해 대통령선거 반드시 쥐를 뽑아라???

  • 2012-02-15

좋은글 브라를 권장한 역사적 배경 file

 브라는 원래 가슴을 지탱하기 위해서, 아님 기분 좋게 자극하기 위해서 착용하게 된 걸까? 중학교 때, 나의 합창선생님께서는 우리들에게 불어로 어떻게 국가를 부르는지 가르쳐 주셨다. 그런데 우리들이 어떤 단락의 가사를 잘 기억하게 하기 위해: “Car ton bras sait porter l'epee,” 그녀는 말했다. “브라가 어떤 역할을 한다고? 그건 지탱해주는 거 야. 그러니 “sait porter”는 “bras” 다음에 오는 거란 걸 기억하도록!”(번역 주: 원래 노 래 가사의 의미는 “왜냐면 당신의 팔이 검을 드는 걸 알기 때문에.”지만 영어 ‘브라’를 비...

  • 2011-07-29

좋은글 2006년 UN 선정 최고의 동시 file [3]

When I born, I black. 내가 태어났을때, 난 검다. When I grow up, I black. 내가 성장할때, 난 검다. When I go in sun, I black. 내가 햇볕에 나갈때, 난 검다. When I cold, I black. 내가 추울때, 난 검다. When I scared, I black. 내가 두려울때, 난 검다. When I sick, I black. 내가 아플때, 난 검다. And when I die, I still black. 그리고 내가 죽을때, 난 여전히 검다. You white folks... 너네 백인들은... When you born, you pink. 너가 태어났을때, 넌 분홍이다. When you grow up, you white. 너가 성장할때, 넌 희다. ...

  • 2011-11-24

좋은글 담쟁이-도종환 file

 어쩔 수 없는 벽이라고 우리가 느낄 때 그 때 담쟁이는 말 없이 그 벽을 오른다 물 한 방울 없고, 씨앗 한 톨 살아 남을 수 없는 저것은 절망의 벽이라고 말할 때 담쟁이는 서두르지 않고 앞으로 나아간다 한 뼘이라도 꼭 여럿이 함께 손을 잡고 올라간다 푸르게 절망을 다 덮을 때까지 바로 그 절망을 잡고 놓지 않는다 저것은 넘을 수 없는 벽이라고 고개를 떨구고 있을 때 담쟁이 잎 하나는 담쟁이 잎 수천개를 이끌고 결국 그 벽을 넘는다 도종환...담쟁이

  • 2012-01-02

좋은글 설민석 명량해전 스페셜인강 1부, 2부

설민석 명량해전 스페셜인강 1부, 2부 명량해전 영화보러가기전에 볼만한 영상입니다. ㅎㅎ

  • 2014-08-10

좋은글 선택 file

선택지난 2007년 세상을 떠난 세계적인 이탈리아 테너가수 루치아노 파바로티 (Luciano Pavarotti)는 어렸을 때부터 성악에 천부적인 재능이 보였다. 하지만 파바로티는 고등학교를 졸업할 무렵, 진로를 결정할 수 없었다. 수학을 잘했기 때문에 수학 교사가 되고 싶었고, 성악가가 되고 싶기도 했다. 둘 다 욕심이 났다. 교사가 되는 것은 실패 확률이 별로 없는 안전한 길이었고, 성악가가 되는 것은 성공 보장이 없는 험난한 길이었다. '성악도 하고 싶고, 학교 교사도 하고 싶은데 어떡하지?' 이 때 아버지가 고민하고 있는 파바로티의...

  • 2012-11-27

좋은글 천성을 바꾸어 놓는 힘 file

천성을 바꾸어 놓는 힘 Refrain tonight, And that shall lend a kind of easiness To the next abstinence; the next more easy; For use almost can change the stamp of nature, And either master the devil, or throw him out With wondrous potency. (Hamlet 3.4.167-172) 오늘 하룻밤 참고 극기해 보시오. 그러면 내일 참기는 한결 쉬워지고 그 다음엔 더더욱 수월해진다오. 대저 습관이란 천성을 바꾸어 놓는 법, 비상한 힘이 있어 악마를 굴복시켜 몰아내 버리지요. (『햄릿』3막 4장 167-172행) * abstinence (도덕,종교,건강상...

  • 2012-04-17

좋은글 환경을 탓하지마라 file

환경을 탓하지마라

  • 2012-11-18

좋은글 The bear(이런교사가 되길)

The bear 진한 모성애를 느낄 수 있죠. 저는 교사로서 학생들의 뒤에서 그들의 어려움을 같이 느끼고 고민하고 힘이 되어줘야 겠다라고 생각은 하는데 .....*^^*

  • 2013-02-07

좋은글 뒤바뀐 우열반 file [3]

영국의 한 학교에서 있었던 일입니다. 학기 초, '우수한' 아이들로 편성된 학급이 '우둔한' 학급으로, '우둔한' 학급은 '우수한' 학급으로 컴퓨터에 잘못 입력되는 일이 발생했습니다. 그로부터, 5개월이 지나고 나서야 학사관리가 잘못됐다는 사실을 발견하게 되었습니다. 당황한 학교 측은 컴퓨터의 오류에 대해 아무에게도 말하지 않은 채 학생들에게 다시 시험을 치르도록 했습니다. 그런데, 놀랍게도 원래 우수한 아이들의 성적이 크게 떨어진 것이었습니다. 왜냐하면 이들은 학기 내내 선생님들에 의해 열등하고 학습능력이 부족한 ...

  • 2009-12-04

좋은글 그대 가슴에서 빛나는 것은 [2]

별을 보았다 그대 가슴에서 빛나는 것은 별이었다 세상에는 없는 것이라고 떠나지마라 더 이상 길은 없는 것이라고 돌아서지마라 그대 가슴 무너질 때에도 저 별은 저 하늘에서 빛나고 있었고 그대 마음 헤매일 때에도 저 별은 그대 가슴에서 빛나고 있었으니 그대가 보지 못했다 그대가 보려고 하지 않았을 뿐 별이 빛을 발하는 것은 저 하늘 그대에게 보여주는 아름다운 진실이니 그대 품으라 그대 가슴으로 저 별빛을 안으라 그대 그렇게 빛나게 될 것이니 -홍광일의 <가슴에 핀 꽃>중에서- 나는 오늘도 꼴갑을 떨며 세상을 걸어가고 있...

  • 2012-04-25

좋은글 칼레의 시민 file

칼레의 시민프랑스 북부 도시 칼레는 1347년 백년전쟁 당시 영국군에 포위되었다. 1년 가까이 영국의 공격에 저항했지만 칼레 시에 지원은 없었다. 먹을 것도 없는 절망적인 상황에서 결국 백기를 들 수밖에 없었다. 승리를 거두자, 영국 왕 에드워드 3세는 말했다. "칼레의 시민들을 하나도 남김없이 죽이겠다!" 칼레 시는 영국 왕에게 사절을 보내 여러 번에 걸쳐 협상을 간청했다. "좋다. 그러면 시민들의 목숨은 보장하마. 그러기 위해서는 그동안 영국군을 애먹인 대가에 대한 책임을 져야 한다." 영국왕은 시민 대표 6명을 뽑아 보내...

  • 2012-05-30

좋은글 EBS 이야기 한국사 file

요약한국사.hwp EBS 이야기 한국사 · 이야기 한국사 (신병주) 1 ~ 16강 조선의 왕 태조, 태종, 세종, 광해군, 효종, 숙종, 영조, 정조의 통치 철학과 현재에 주는 메시지. 역사 속 사건과 인물에 대한 화두 던지기 왕과 그 주변을 둘러싼 인물들의 활약과 갈등 · 이야기 한국사 (김상태) 17 ~ 23강 개화와 수구의 줄다리기에서 해방과 분단까지 한국 근현대사에 대한 올바른 이해 사진으로 보는 근현대사 · 이야기 한국사 (전덕재) 24 ~ 31강 한국사에 관한 주요한 이슈나 주제를 체계적으로 정리하여 이야기식으로 설명한다. · 이야기 한...

  • 2015-01-21

좋은글 100점짜리 인생을 살고 싶으신가요? file

100점짜리 인생을 살고 싶으신가요? 100점짜리 인생을 살기 위한 조건을 찾을 수만 있다면 누구나 완벽한 삶을 누릴 수 있겠지요. 그러면 지금부터 그 조건을 찾아볼까요? 일단 알파벳 순서대로 숫자를 붙입니다. A는 1, B는 2, C는 3, 그리고 마지막 Z는 26이 됩니다. 이제 영어 단어 중에서 알파벳에 붙은 숫자의 합이 100이 되는 단어를 찾으면 됩니다. 여러분이 인생에서 나름대로 중요하다고 생각하는 것을 나타내는 영어 단어를 떠올려 보세요. 우선 열심히 일하면 성공한 인생을 살 수 있겠지요? “Hard work”는 몇 점일까요? 98점이...

  • 2011-10-02

좋은글 단 하루의 시간이 내게 주어진다면 file [1]

덜 미워하고 더 사랑하겠습니다. 덜 가지고 더 행복하겠습니다. 눈물을 흘리는 대신 웃겠습니다. 다가오지 않은 내일을 두려워하는 대신 오늘을 열심히 살겠습니다. 잘못된 결정을 후회하는 대신 새로운 결정을 내리겠습니다. 실패를 안타까워하는 대신 다시 무언가를 시작하겠습니다. 아프다고 말하는 대신 아픔을 견디겠습니다. 바쁘다고 말하는 대신 쌓인 일을 하나씩 해 나가겠습니다. 남들에게 어떻게 보일까 걱정하는 대신 나 자신에게 어떻게 보일까 생각하겠습니다. 남들의 잘못을 용서하는 대신 나 자신의 잘못을 뉘우치겠습니다...

  • 2011-11-01

좋은글 기계의 음성인식 원리

알리바바와 40인의 도둑 이야기에 나오는 신기한 동굴의 문은 ‘열려라. 참깨’라는 말에 문이 열린다. 옛날부터 사람들은 사람 아닌 물건, 혹은 동물들이 사람 말을 알아듣는 이야기를 많이 만들어냈는데, 이것이야말로 궁극의 상상력이 아닐까 싶다. 하지만, 정작 사람은 아무 불편 없이 다른 사람 말을 듣고 이해하는 것으로 보아, 분명히 그 속에는 말을 이해하는 원리가 있을 것이고, 오늘날에는 그 원리를 이용한 음성인식 제품들이 많이 만들어지고 있다. 사람이 소리를 내는 원리 우리가 소리를 알아듣는 방법을 이해하기 위해서는,...

  • 2011-07-22

좋은글 어느 소년원 학생의 시 file

- 어느 소년원 학생의 시 난 우리 어머니께 감사란 단어 몰랐네 매일 용돈달라 밥해달라 옷사달라 무조건 바라기만 했네 우리 어머니, 나 하나 바라보시는 아들바라기 같은 꽃 어느 날 내게 말하더라 너를 뱃속에 열달 데리고 다닌 값 무료 너가 아플 때 밤 지새가며 간호한 값 무료 너 때문에 지금까지 여러 해 힘들어하고 눈물 흘린 값 무료 너로 인해 수많은 불안으로 지샌 밤들도 모두 무료 이거 말고도 너에 대한 나의 진정한 사랑은 모두 다 무료 어머니의 말에 저절로 눈물이 나오더라.

  • 2012-05-21
본 사이트에서는 회원분들의 게시된 이메일 주소가 무단으로 수집되는 것을 거부합니다. 게시된 정보 및 게시물의 저작권과 기타 법적 책임은 자료제공자에게 있습니다. 이메일:chanyi@hanmail.net Copyright © 2001 - 2022 EnjoyEnglish.co.kr. All Right Reserved.