[인터뷰] 정승환 라이언로켓 대표 “중앙집권 AI 아닌 대중을 위한 새 패러다임 보여줄 것”

입력 2022-07-05 05:00

  • 작게보기

  • 기본크기

  • 크게보기

AI 스타트업 라이언로켓 정승환 대표 인터뷰
자체 개발한 딥러닝 기반 음성·영상 합성 기술
온에어스튜디오로 전년 동기 대비 10배 성장
“경험해 보지 못한 즐거움과 몰입감 제공할 것”

▲4일 서울 중구 을지로 본사에서 진행된 이투데이와의 인터뷰에서 정승환 라이언로켓 대표가 보유하고 있는 AI 원천기술에 대해 설명하고 있다. (심민규 기자 wildboar@)

4차 산업혁명 시대가 도래하면서 핵심 기술 중 하나인 인공지능(AI)이 고도화하고 있다. 집안 곳곳에 AI 스피커가 보급된 것은 물론이고 스마트폰 앱 곳곳에 눈에 보이지 않는 AI 기술들이 접목됐다. 심지어 가상인간 아이돌까지 만들어졌다. 이제는 AI와 일상을 함께한다고 해도 과언이 아니다. 이에 따라 AI가 발전하는 가운데 기술 분화도 빠르게 이뤄졌다.

AI업계는 향후 AI 기술이 2가지 분야로 나뉠 것으로 예측했다. 중앙에서 막대한 양의 정보를 쉽게 처리할 수 있어 손쉽게 사람들을 검열할 수 있는 ‘중앙집권화’ AI와 대중들이 AI를 통해 자기 자신을 표현하고 개선, 발전할 수 있도록 돕는 ‘대중친화’ AI다. 집권과 자유. 이 두 가지 갈림길 속에 지금껏 대중들이 경험해보지 못한 즐거움과 몰입감을 주겠다는 스타트업이 있다. AI 기술 스타트업 라이언로켓이다.

정승환 라이언로켓 대표는 4일 서울 중구 을지로 본사에서 진행된 본지와의 인터뷰에서 “AI 안면 기술 등이 사람들을 검열하는 중앙 집권을 강하게 만들 수 있다”면서도 “시야를 돌리면 이 기술을 통해 콘텐츠를 생성할 수 있다”고 말했다. 이어 “이 기술이 중앙 집권이 아니라 대중들을 위한 기술로 바라본다”며 “사람들이 조금 더 자기 자신을 잘 표현할 수 있고, 내 삶을 개선할 수 있게 하는 AI 기술을 개발하고 있다”고 덧붙였다. 음성·영상 합성 분야의 원천 기술을 보유한 라이언로켓의 기술이 대중들을 위해 제작되고 있다는 점을 강조한 것이다.

이런 방대한 목표와 달리 라이언로켓은 출발은 소소했다. 2019년 3명의 대학생이 시각장애인을 위한 오디오북 제작 프로젝트를 기획하면서 창업이 시작됐다. 사무실도 없이 학교 기숙사에서 딥러닝 기반의 음성 기술만을 가지고 그들은 AI가 특정 사람이 목소리로 문장을 읽어 내려가는 텍스트 음성 변환 기술을 국내 최초로 상용화했다. 정 대표는 “기존 시장에 나와 있는 오디오북은 자체적으로 성우가 다 녹음을 해야 하기에 수요도 적고 굉장히 오래 걸렸다”며 “음성을 만드는 기술로 오디오북을 만들면 시각장애인분들에게 책을 많이 드릴 수 있겠다는 생각이 출발점이었다”고 말했다.

라이언로켓이 가진 TTS(Test To Speech)는 적은 양의 음성 데이터만 있어도 이를 AI가 학습하고 목소리 톤, 억양, 속도 등 특징을 분석해 짧은 시간 텍스트를 자동으로 말하는 고품질 인공지능 음성을 생성할 수 있다. 기존 음성 변환 기술이 자음·모음으로 나눠 소리를 붙인 것과 달리 TTS는 목소리의 말뭉치를 그대로 학습해 실현해냈다.

AI 텍스트 음성 변환 기술로 라이언로켓은 대기업들의 러브콜을 받았다. 하지만 창업 초기 이를 거절하고 음성에서 영상으로 기술을 확장했다. 음성의 AI 알고리즘을 바탕으로 자연스러운 입 모양 영상 생성 기술을 개발했다. 텍스트만으로 영상을 제작할 수 있는 TTV(Text to Video) 기술로 30분 분량의 적은 데이터로도 진짜 사람이 말하는 것과 같은 영상을 만들어냈다.

▲AI 스타트업 라이언로켓의 인공지능 기반 콘텐츠 제작 플랫폼 ‘온에어스튜디오’ 서비스. (사진제공=라이언로켓)

라이언로켓은 음성·영상 합성 분야의 원천 기술을 보유한 후 이 기술을 누구나 쉽게 사용할 수 있는 ‘온에어스튜디오’ 플랫폼을 제작했다. 온에어스튜디오는 인공지능 보이스, 가상모델을 활용해 영상을 제작할 수 있도록 하는 라이언로캣의 핵심 서비스다. 원하는 AI 목소리를 선택하고 텍스트 입력만으로 더빙, 자막, 영상 제작까지 한 번에 완성해 누구나 쉽고 빠르게 영상 콘텐츠를 만들 수 있다. 정 대표는 “음성 생산 기술에서 출발해서 영상까지 확장해 더 큰 시장을 바라보고 있는 단계”라며 “온에어스튜디오에 쌓인 데이터를 분석한 다음 차별화된 서비스를 만들기 위해 가설을 세워 분석하고 테스트하고 있다”고 계속해서 기술을 혁신하고자 하는 의지도 내비쳤다.

꾸준한 혁신의 결과는 데이터로 입증됐다. 온에어스튜디오의 올해 1~5월 기준 가입자 수가 지난해 같은 기간보다 5배 이상 증가했다. 온에어스튜디오를 통해 만들어진 프로젝트 수도 동기간 내 4배 이상 늘었다. 이에 따라 라이언로켓 매출 추이 또한 급성장해 지난해보다 10배 이상 증가하는 성과를 보였다. 라이언로켓은 65억 원 규모의 시리즈A 투자를 유치한 바 있다.

라이언로켓의 도전은 멈추지 않는다. 정 대표는 온에어스튜디오를 키워나가면서 글로벌 시장까지 바라봤다. AI 원천 기술을 활용한 2가지 새로운 사업도 준비하고 있었다. 정승환 대표는 “AI 기술을 통해 사람들이 상상했던 것을 눈으로 다 보여줄 수 있게 하는 것이 목표”라며 “대중들이 그동안 경험해 보지 못한 즐거움과 몰입감을 제공할 수 있도록 고도화된 연구개발에 주력해 전에 없던 새로운 패러다임을 제시해 나갈 것”이라고 힘차게 말했다.

▲4일 서울 중구 을지로 본사에서 진행된 이투데이와의 인터뷰 후 정승환 라이언로켓 대표가 기념촬영을 하고 있다. (심민규 기자 wildboar@)

심기자의 ‘N행시’
‘N행시 짓기’는 단순히 언어 나열이지만, 이를 통해 사람의 유머와 순발력 그리고 통찰력까지 알 수 있는 언어의 요리다. 기자는 지금까지 인터뷰를 통해 수많은 사람의 N행시를 들어왔다. 그들의 N행시를 소개한다.

※정승환 라어언로켓 대표의 5행시

라- 라이언로켓이 뭐하는 회사냐고요?

이- 이런 AI 서비스를 만들고 있어요.

언- 언(온)에어스튜디오에 들어와 보세요.

로- 로봇인지 사람인지 모르시겠죠? 따라올 테면 따라와 보세요.

켓- 켓(캐)치 미 이프 유 캔(Catch Me If You Can)!

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소