제가 초등학교에 다니던 시절에는 대부분의 아이들이 ‘주산학원’이라는 곳을 다녔습니다. 지금은 거의 사라졌지만, 그 당시에는 동네마다 주산학원 하나씩은 있었고, 주산학원 한 번쯤 안 가본 어린이는 거의 없었습니다.

그 당시 주산학원은 요즘의 영어학원과 비슷한 인기였습니다. 초등학교 입학하기 전부터 주산 조기교육을 시키는 부모도 많았습니다.

당시 부모님들이 아이들을 주산학원에 보낸 이유는 학교에서 산수(수학)점수를 높일 수 있고, 배워두면 나중에 취직할 때도 쓸모 있을 것이라는 기대가 있었기 때문입니다.

당시 부모님들은 불과 10~15년 이후 집집마다 책상 위에 PC가 놓여져 있으리라고는 전혀 생각하지 못했습니다. 물론 당시에도 컴퓨터라는 존재 자체는 알았지만, 주변에서 컴퓨터를 직접 본 사람은 없었습니다. 10년 뒤를 조금이라도 예측했다면 주산보다는 컴퓨터나 다른 것을 가르쳤을 것입니다.

결국 컴퓨터의 활성화는 주산학원에 쏟아 부은 시간과 비용을 아깝게 만들어 버렸습니다.(물론 주산이 아이들의 연산능력을 향상시키고, 두뇌계발에 도움이 될 수는 있습니다.)

요즘은 영어학원이 대세입니다. 영어유치원, 조기유학 등 영어를 못 하면 미래의 낙오자가 될 것 같은 위협을 느낍니다.

하지만 영어학원 인기는 영원할까요? 언젠가는 영어학원에 다닌 시간에 대해서도 “괜히 영어를 배우느라 돈과 시간을 낭비했다”라는 생각이 들 가능성은 없을까요?

최근 외신에 따르면, 구글이 외국어 동시통역이 가능한 스마트폰의 애플리케이션을 개발 중이라고 합니다.

스마트폰에 대고 한국어로 얘기하면 저절로 상대방에게 영어로 통역돼 들리고, 그가 영어로 얘기하면 한국어로 들리게 한다는 취지입니다.

이같은 ‘자동 통역’ 기술이 완벽해진다면 더 이상 영어학원에 돈과 시간을 쏟아부을 필요가 없을 것입니다.


어쩌면 영어에 모든 시간과 비용을 사용한 학생보다 그 시간에 책을 읽고 이런 저런 경험을 더 많이 한 학생이 취직도 쉽게 될 수 있을 것입니다.


자동 통역은 구글 이외에도 많은 기업들이 도전하고 있습니다. 일본 NEC는 전용 안경을 쓰면 상대방의 말을 자동으로 번역해 보여주는 제품을 선 보이기도 했습니다.(관련 기사)

국내에서도 엘엔아이소프트 등이 자동통역을 연구하고 있습니다.
 
물론 자동통역은 바벨탑을 쌓는 것에 비유될 정도로 어려운 기술입니다. 신의 영역에 도전하는 것이라고 할까요.

자동통역을 위해서는 음성인식, 자동번역, 음성합성의 기술이 완벽하게 조화를 이룰 수 있어야 가능합니다. 현재로서는 이 세 기술 중 어느 것도 완벽하지는 않습니다.

하지만 언젠간 자동통역도 현실화 될 것입니다. 1~2년 내에는 어렵다고 할 지라도 10년 뒤에는 어떨까요? 현재의 기술 발달 속도라면 10년 뒤에는 자동통역이 일상화 될 수도 있지 않을까요.

만약 10년 뒤에 자동 통역이 흔한 기술이 돼 버린다면, 어쩌면 현재 영어 유치원, 영어학원, 조기유학으로 수백, 수천만원을 들여 공부하고 있는 아이들은 헛된 낭비를 하고 있는 것일지도 모릅니다.

그들이 취직할 때가 되면 영어 실력보다 다른 능력을 요구할 지도 모르니까요.

저작자 표시 비영리 변경 금지
신고


`1990년대 후반 영화배우 안성기씨가 TV에서 “본부! 본부”를 외치는 모습이나, 김혜수씨가 휴대폰에 대고 “우리~집”이라고 속삭였던 휴대폰 광고를 기억하십니까? 휴대폰에 내장된 음성 다이얼링 기능을 소개하기 위한 광고들이었죠.


하지만 인상적인 광고에도 불구하고 음성 다이얼링 기능을 실제로 사용하는 사람은 많지 않았습니다. 낮은 음성인식률 때문입니다. 요즘 나오는 휴대폰에도 음성 다이얼링 기능이 있더군요. 하지만 그 때의 학습효과 때문일까요? 그 때보다 훨씬 음성인식률이 높아졌음에도 음성 다이얼링 기능을 사용하는 사람을 주변에서 본 적이 없는 것 같습니다.

이처럼 음성인식 기술은 꽤 오랫동안 촉망받아온 IT기술이었지만, 지금까지는 성공사례가 많지 않았습다. 응용분야가 무궁무진할 것으로 예상돼 관심을 끌었지만, 기술이 기대만큼 따라주지 못했던 것입니다.

그런데 최근 다시 음성인식에 대한 관심이 커지고 있는 것 같습니다.

최근 구글이 선보인 스마트폰 ‘넥서스원’ 중에 눈에 띄는 기능이 바로 이 음성인식입니다. 넥서스원에 탑재된 안드로이드 2.1에서는 모든 텍스트를 음성으로 작성할 수 있도록 보이스 키보드가 장착돼 있다고 합니다. 음성 다이얼링 기능은 기본이고, 음성으로 이메일을 보내거나 트위터에 글을 올리는 것도 가능한 것으로 알려지고 있습니다. 물론 웹검색도 음성으로 할 수 있습니다.

제가 직접 넥서스원을 사용해 보지 않아서 얼마나 정확하게 음성을 인식하는지는 알 수 없습니다만, 꽤 좋은 성능을 보인다는 평가를 받고 있는 것 같습니다. 구글의 음성인식 기술은 구글이 직접 개발한 것입니다.

마이크로소프트도 비슷한 기술을 보갖고 있죠. MS의 스티브 발머 사장은 7일 미국 라스베가스 CES 전시회에서 태블릿 PC를 들고나와 “더 이상 키보드는 필요 없다”고 말했습니다. 터치와 음성인식이 키보드를 대신한다는 것입니다.

구글이나 MS 같은 회사들이 직접 음성인식 기술 개발에 매진한다는 것은 이 기술이 얼마나 많은 가치를 가진 것인지 짐작케 합니다. 그러나 아직은 구글∙MS의 음성인식 기술이 세계 최고는 아니라고 합니다. 세계에서 최고의 기술은 뉘앙스 커뮤니케이션이라는 회사가 보유하고 있다고 합니다.

하지만 MS나 구글, 뉘앙스커뮤니케이션이 한국어 음성인식을 위해 과감한 투자를 할 가능성은 높지 않습니다. 한국어를 사용하는 사람들은 한국인밖에 없고, 한국 시장은 너무 작아서 투자 매력도가 떨어지죠.

결국 한국어 음성인식은 국내 기술로 해결해야할 숙제입니다.
그럼 국내 음성인식 기술은 어디까지 와 있을까요?

1990년대 말이나 2000년대 초반만 해도 국내에도 음성인식 분야에 뛰어든 많은 회사들이 있었습니다. 대부분 벤처기업이었죠. 하지만 음성인식은 하루아침에 가능한 기술이 아닙니다. 지속적인 연구와 그에 걸맞는 투자가 병행돼야 하는 매우 어려운 분야입니다.

그래서 벤처기업이 도전하기에는 매우 어렵습니다. 많은 벤처기업들이 음성인식 분야에 뛰어들었지만, 대부분 실패하고 말았습니다. 물론 아직까지 살아남아 연구개발을 지속하는 회사들이 있습니다. 그러나 그들은 음성인식보다는 다소 쉬운 기술인 음성합성이나 TTS(문자를 음성으로 변환하는 기술) 등에 주력하고 있습니다.

하지만 한국어 음성인식이 엉망은 아닙니다. 이미 음성인식 기술은 우리 일상에 많이 퍼져 있습니다. 최근 현대-기아자동차를 구매한 분은 아실 것입니다. 현대∙기아차의 최신 모델에는 오디오-비디오 내비게이션이 내장돼 있습니다.

일반적인 내비게이션에도 음성인식 기술이 포함된 제품이 출시되고 있습니다. 대표적인 것이 파인디지털의 ‘파인드라이브 보이스’입니다. 운전중에 위험하게 목적지를 손으로 입력하지 않고, 말로 목적지를 입력할 수 있습니다.

또 어제(7일)에는 KTH가 모바일 맛집 검색에 음성인식을 접목했다고 발표했습니다. 스마트폰(옴니아)에 “신사동 TV에 반영된 맛집”이라고 말로 입력하면, 결과를 보여준다고 합니다. KTH는 앞으로 파란 웹 검색에도 이를 반영할 계획인 것 같습니다.

파인디지털이나 KTH의 기술은 한국전자통신연구원(ETRI)에서 이전받은 것입니다. ETRI는 음성인식처럼 많은 투자가 필요한 기술에 대한 연구를 대신하고 기술을 기업에 이전해 주는 서비스를 제공하고 있습니다.

ETRI 음성처리연구팀 이윤근 팀장에 따르면, 현재 우리나라의 음성인식 기술 수준은 세계 최고 수준에서 크게 모자라지 않다고 합니다. 물론 음성인식도 분야마다 상황마다 각기 다르지만 현재 ETRI 기술은 90% 이상의 음성인식률을 보인다고 합니다.


어쩌면 한국어 음성인식 기술이 더 발전하면 제가 기사도 말로 쓰는 시대가 올 지도 모르겠습니다.
저작자 표시 비영리 변경 금지
신고

티스토리 툴바