"이미지도 인간처럼 설명"…LG AI연구원, '캡셔닝 AI' 첫 공개

입력 2023-06-19 10:05

  • 작게보기

  • 기본크기

  • 크게보기

▲이미지 상의 다양한 요소와 특징을 인식해 설명글과 키워드를 생성하는 캡셔닝 AI. (사진제공=LG)

LG그룹이 국제 AI 학회에서 첫 번째 생성형 AI 상용화 서비스를 공개했다. 학회 기간 중 그룹 내 주요 계열사의 AI 인재 확보도 동시에 나선다는 계획이다.

LG AI연구원은 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 ‘CVPR 2023’에서 이미지 검색 시장에 변화를 가져올 ‘캡셔닝 AI’를 처음 공개했다고 밝혔다.

‘생성형 AI’ 상용화 서비스인 캡셔닝 AI는 인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다.

LG AI연구원은 AI가 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있도록 ‘제로샷 이미지 캡셔닝’ 기술을 적용했다. 이는 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 이미지상의 다양한 요소와 특징을 인식하고, 그 관계를 이해하고 설명할 수 있게 하는 기술이다.

캡셔닝 AI는 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다. 문장이나 단어의 길이와 개수에 따라 다르지만, 평균적으로 5개 문장과 10개의 키워드를 10초 이내에 생성한다. 이미지 범위를 1만 장으로 확장하면 2일 이내에 작업을 끝낼 수 있어 빨리 맞춤형 이미지 검색ㆍ관리 시스템 구축이 가능하다.

▲18일 진행한 워크숍에서 이홍락 LG AI연구원 CSAI가 캡셔닝 AI에 적용한 제로샷 이미지 캡셔닝 기술에 대해 설명하고 있다. (사진제공=LG)

LG에 따르면 캡셔닝 AI는 LG AI연구원과 셔터스톡의 긴밀한 협력으로 탄생했다. 셔터스톡은 세계 최대 플랫폼 기업으로, LG AI연구원과 데이터 학습부터 서비스 개발까지 함께했다. 특히 양사는 AI 모델 개발 과정에서 학습 데이터의 편향성ㆍ선정성 등 AI 윤리 검증을 진행하고, 저작권 투명성도 확보했다.

세잘 아민 셔터스톡 CTO는 “현재 글로벌 고객사 10곳을 대상으로 ‘얼리 액세스(앞서 해보기) 프로그램’을 진행하며 캡셔닝 AI 기술을 발전시켜 나가고 있다”며 “캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것”이라고 강조했다.

LG AI연구원은 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 ‘캡셔닝 AI’ 서비스를 시연할 계획이다.

한편 이번 워크숍에서는 ‘LG 글로벌 AI 챌린지’ 시상식도 열렸다. 자체 개발한 AI 모델의 이미지 이해 능력을 평가하는 이번 대회에는 총 142개 연구팀이 참여했다. 챌린지 1, 2위를 차지한 난징과기대, 카이스트(KAIST) 소속 참가자들은 워크숍에서 연구 성과를 발표하기도 했다.

LG AI연구원은 22일까지 진행하는 학회 기간 중 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 LG의 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나선다.

이를 위해 19일에는 학회에 참가한 석ㆍ박사 학생들을 대상으로 네트워킹 행사인 ‘LG AI 데이’를 진행한다. 20일부터는 3일간 LG 각 계열사의 AI 연구 인력과 채용 담당자들이 LG 통합 부스에서 각 사의 최신 AI 기술 시연과 채용 상담을 진행한다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소