이 멋진 안경의 이름은 에코스피치. 코넬대학 연구진이 만든 첨단 기기다. 시각 보조 능력은 다른 안경들과 다르지 않다. 대신 입 모양을 분석하는 방식으로 착용자가 하는 말을 인식한다. 안경테에 음파를 방출하고 수신하는 작은 스피커와 마이크가 붙어있기 때문이다. 속삭이거나 소리 없이 말해도 주인이 내린 명령을 알아듣는다.
개발진들은 이번 달 독일에서 열리는 '컴퓨팅 시스템의 인적 요인에 관한 기계 컴퓨팅 학회'에서 연구 성과를 발표할 예정이다.
루이동 장 코넬대학교 정보과학 연구진은 "목소리를 낼 수 없는 사람들에게 저희 음성인식 기술은 음성 신시사이저에 연결해서 사용할 훌륭한 입력장치다"며 "노트북이나 스마트폰 같은 기기에 블루투스 페어링해서 조용히 조작할 수도 있다"고 주장했다.
12명이 참여한 성능 실험에서 에코스피치는 개별적으로 말한 명령어 31개와 연속적으로 발음한 숫자들을 인식했다. 오류율은 10% 미만이었다.
에코스피치는 좌우 안경 렌즈에 각각 스피커와 마이크가 달린 구조다. 스피커에서 음파가 나와 입술에서 반사되어 반대편 마이크에 닿는 방법으로 작동한다. 스피커는 초음파에 가까운 약 20킬로헤르츠 음파를 방출한다. 파장이 입술에 닿은 후 반사되고 회절하면 패턴이 나온다. 마이크는 메아리 형태들이 각각 어떤 명령어를 의미하는지 파악해낸다. 마치 소형 음파탐지기처럼 작동하는 방식이다.
인공지능 기계학습이 음파에서 단어를 추론하는데 도와줄 수 있다. AI는 특정 명령어를 알아듣도록 훈련받는다. 사용자에 맞춰 성능을 향상하는 미세 조정을 할 수도 있다. 약 6~7분 정도 소요된다.
음파 센서는 오디오 앰프를 장착한 마이크로 컨트롤러에 위치한다. 보통 USB 케이블을 통해 노트북과 연결해 사용한다. 실시간 시연에서 블루투스로 스마트폰과 통신하는 저전력 버전의 에코스피치를 공개하기도 했다. 안경은 무선으로 안드로이드 스마트폰에 명령어를 전달했다. 음악 재생, 스마트 기기 작동, 음성 비서 활용 같은 조작을 할 수 있었다.
프란시스 짐브레티에리 코넬대학교 정보과학과 교수는 "안경 속 데이터를 외부 클라우드에 송출하는 대신 사용자의 스마트폰에서 처리하기 때문에 민감한 개인정보가 유출되지 않는다"고 밝혔다. 또한 오디오 데이터는 일반적으로 비디오나 이미지 파일보다 적은 에너지로 전송 및 재생할 수 있다.
※이 기사는 popsci.com 원문을 바탕으로 작성됐으며, 번역은 파퓰러사이언스코리아 소속 기자가 도왔습니다.
/ 글 CHARLOTTE HU 기자 & 육지훈 기자