통화 음성을 문자로 변환시켜주는 인공지능 음성인식 서비스 ‘VITO’…“AI 플라이휠(선순환 구조)로 지속 성장하겠다”
‘return 0;’ 과거 개발자들은 프로그래밍 C언어에서 문제없이 코드를 입력한 후 마지막에 ‘return 0;’를 적는다. ‘return 0;’는 메인 함수의 종료를 알리는 코드다. 2018년 카이스트 출신 개발자들은 문제없이 성공적으로 서비스를 개발하자는 의미로 ‘리턴제로’라는 인공지능 스타트업을 창업했다. 리턴제로는 통화 내용을 문자로 전환해 보여주는 AI 통화 서비스 ‘VITO(비토)’를 서비스하고 있다.
이참솔 리턴제로 대표는 19일 서울 서초구 본사에서 가진 이투데이와의 인터뷰에서 “데이터가 중요한 머신러닝 시대에 무엇이 사람들에게 이바지할 수 있을지와 풀지 못한 문제들이 무엇인지 생각했다”며 “고민 끝에 음성인식과 통화녹음이란 결론이 나왔다”고 서비스 개발 배경을 설명했다. 음성이라는 것은 발화 시점이 지나가면 사라져 버리듯 이런 일상 속 불편함에서 이 대표는 기회를 찾았다. 음성이라는 매개체 중 통화 녹음에 주목한 것이다.
이 대표는 국내 문자 서비스 시장은 카카오톡과 여러 SNS 플랫폼을 통해 성장했지만 통화 및 음성 시장은 지난 10년 동안 정체돼 있었다고 말했다. 이 대표는 “한국의 음성 데이터 시장은 다른 국가들보다 많이 뒤처져 있다”며 “스마트 AI 스피커에도 또박또박 말해야 알아듣는 수준이었다”고 말했다. 이어 “어떻게 하면 유난히 비문 많고 뭉개지는 지저분한 한국어를 AI가 듣게 할까 고민해 자체 기술을 개발했다”고 강조했다.
지난해 4월 출시된 눈으로 보는 AI 통화 앱 비토는 말 그대로 통화 내용을 문자로 바꿔준다. 코로나19 장기화로 비대면 통화업무가 잦은 시기, 비토는 녹음한 통화를 다시 들으며 글로 옮기고 메모하는 번거로운 수고를 덜어준다. 카카오톡 채팅창처럼 통화가 끝나면 실시간으로 통화 내용이 문자로 저장된다.
비토의 핵심 기술은 크게 2가지다. 먼 거리에서 속삭이는 소리까지 들을 수 있는 ‘소머즈 엔진’과 음성 문자화(STT) 기술을 통해 사용자 목소리를 분석해 발화자를 분리하는 ‘모세 엔진’이 있다. 이 대표는 “소머즈는 한 미국 드라마에서 초능력 청력의 소유자에서 생각해 냈고, 모세는 바닷길이 열리는 ‘모세의 기적’에서 영감을 받았다”고 말했다. 이 강점들로 높은 음성인식을 해낼 수 있다는 것이다.
이 대표는 비토의 미래 성장을 긍정적으로 봤지만, 위기도 느끼고 있었다. 지난달 23일 SKT가 비토와 같은 음성 통화 내용을 문자로 바꿔주는 베타 서비스를 시작해서다. 기존 T전화의 통화 녹음 기능에 STT, 대화 분석 등 AI 기술을 더했다. 대기업이 시장에 진입하면서 비토의 시장 비중이 줄어들 가능성이 높아졌지만, 이를 바라보는 이 대표는 오히려 담담했다.
이 대표는 “원래 스타트업에서 뭘 만들다 보면 통상 대기업이 따라 만든다”며 “경쟁 상대가 나오는 건 스타트업 하다 보면 많이 겪는 것이고, 대기업이랑 싸우는 건 거의 필연이라고 생각한다. 그래서 저희가 더 잘해야 한다”고 힘있게 말했다.
이 대표는 비토의 경쟁력을 “사용자에게 좋은 경험을 주는 서비스를 만드는 것”이라며 “애초부터 가난한 스타트업의 입장으로 많은 사람에게 서비스할 수 있는 최적화를 계속 많이 해왔다. 굉장히 저렴한 가격에 이 기술을 사용할 수 있게 준비가 돼 있다”고 설명했다. 위기에서 기회를 찾겠다는 것이다.
이 대표의 말처럼 비토는 승승장구하고 있다. 정식 서비스 출시인 올해 4월 대비 약 8개월 만에 누적 다운로드 수 75% 성장했다. 11월 말 기준 비토 앱 누적 다운로드는 44만6000건을 기록했다. 혁신적인 기술력과 성장가능성으로 리턴제로는 다양한 VC(벤처캐피털)로부터 러브콜을 받았다. 누적 투자액은 198억 원이다. 최근에는 사업영역을 넓혀 올 3분기에는 중국 시장에 진출했고, B2B 사업도 시작했다.
이 대표는 비토를 통해 축적된 인공지능 데이터로 전에 없던 ‘게임체인저’ 역할을 하는 서비스를 만들겠다고 했다. 그는 “인공지능이 더 많은 데이터를 학습하는 서비스 고도화를 통해 AI 플라이휠(선순환 구조)을 토대로 지속 성장하겠다”며 “큰 양의 데이터를 가지고 학습시키고 서비스를 만드는 기업들에 기회가 올 것”이라고 말했다.
AI 업계에 따르면 향후 5년 안에 인공지능 및 머신러닝의 정교함이 향상될 것으로 전망한다. 이 대표는 이 시기에 큰 기회의 파도가 올 수 있다고 바라봤다. 이 대표는 “그 파도 속 싸움에서 살아남는다면 그다음의 대기업이 될 수 있다”고 전망했다. 현재의 완성된 함수에서 빠져나와 다른 함수를 펼칠 수 있는 기반인 ‘return 0;’처럼 말이다.