인공지능(AI) 번역 음성인식 기술 전문기업 엘솔루가 고려대학교 'Speech and Language Processing Lab(이하 SLP)'과 함께 고성능 한국어 화자 인증 및 식별 시스템 개발에 나선다고 11일 밝혔다.
양측이 개발하는 시스템은 기존 음성 인식 모델의 인코더 분리 후 데이터 학습 및 소음을 제거하는 ‘생성형 사전 학습 모델’과 화자를 식별할 수 있는 '음성 인식 화자 분리 시스템'으로 구성된다.
이러한 시스템은 최근 자동 회의록 시스템, AI 스피커, 사물인터넷, 금융 서비스, 공공기관 민원상담 등 다양한 산업에서 활발하게 도입되고 있다.
김찬우 고려대 SLP 연구소장이 이번 시스템의 핵심 개발자로 나선다. 구글, 마이크로소프트, 삼성전자를 거친 그는 AI 음성처리 개발 분야의 글로벌 최고 전문가 중 한 명으로 손꼽힌다. 구글 AI 스피크 '구글 홈'과 삼성전자 '빅스비, '가우스' 등 개발을 주도했다.
이번 프로젝트에 함께 참여하는 엘솔루 글로벌 최고기술책임자(CTO)인 이종혁 포항공대 명예교수는 포항공대 IT학부장 및 애플 R&D 센터장을 역임했다. 국내 자연어처리 분야의 최고 권위자로 불린다.
고성능 한국어 화자 인증 및 식별 시스템은 향후 금융·공공기관에서 한국인 본인 인증과 다자간 회의록 서비스에 적극적으로 도입될 것으로 기대된다.
문종욱 엘솔루 대표는 "앞으로 개발될 이번 시스템은 기대 이상의 품질로 업무 효율과 생산성을 극대화 시킬 것으로 예상된다"며 "빠른 언어 확장을 통해 전 세계 화자 인증 및 식별 시장 또한 선도할 것"이라고 말했다.