바드에는 구글의 최신 대규모 언어 모델(LLM) 팜2(PaLM)가 탑재됐습니다. 팜2는 지난해 4월 선보인 팜의 업그레이드 버전으로, 100개 이상의 언어를 지원하는데요. 5300억 개의 파라미터(매개변수)를 바탕으로 과학과 수학에서 추론도 가능하고, 코딩 작업도 수행한다고 합니다. 바드도 이를 토대로 한국어와 일본어 지원을 시작했습니다. 조만간 40개 언어 서비스도 지원될 예정이죠.
여기에 시각적 요소도 더해집니다. 이용자는 이미지 관련 질문을 할 수 있고, 바드도 관련 이미지로 답을 제시할 수 있다고 합니다. 시각 분석을 사용해 관련 정보를 가져올 수 있도록 구글 렌즈(Google Lens)가 결합됐습니다. 어두운 화면에 흰색 글자가 나타나는 다크모드 기능도 추가됐고, 답을 어디서 가져왔는지 소스 출처 표기 기능도 생깁니다. 바드의 답변은 구글 지메일과 문서로 즉각 내보낼 수 있죠.
현재 대화형 AI 시장은 현재 챗GPT가 휩쓸고 있는 상황입니다. 지난해 11월 출시된 오픈AI의 ‘챗GPT’는 이미 한국어를 지원하면서 국내 사용자들에게도 잘 알려져 있는데요. 올해 2월 오픈AI 투자사인 마이크로소프트(MS)가 자사 검색엔진인 빙(Bing)에 챗GPT 기술을 결합하자, 빙은 한 달 만에 일일 방문자 수(DAU) 1억 명을 돌파하기도 했습니다. 두 챗봇에는 미묘한 차이가 있어, 바드는 자연스럽게 챗GPT의 대항마로 자리 잡을 전망인데요. 비슷하면서도 다른 형식의 답을 내놓는 바드와 챗GPT, 두 챗봇을 살펴봤습니다.
바드에 직접 ‘챗GPT와의 성능을 비교해달라’고 해보니, “바드는 챗GPT보다 더 최근에 개발됐으며 구글 검색을 통해 실시간으로 인터넷에 액세스할 수 있다. 즉, 바드는 질문에 대한 가장 최신의 정보를 제공할 수 있다”며 “또 챗GPT보다 더 발전된 언어 모델로 간주된다. 즉, 더 복잡한 텍스트를 이해하고 생성할 수 있다. 시, 코드, 대본,음악, 이메일, 편지 등 창의적인 텍스트 형식을 생성할 수 있다”고 답했습니다.
챗GPT 무료 버전은 2021년 9월까지의 데이터를 바탕으로 답을 내놔, 그 이후의 사건 등과 관련된 질문에는 답하지 못합니다. ‘2023년 대한민국의 대통령은 누구인가’라는 물음에는 “저는 인공지능 챗봇으로서 미래를 예측하거나 예측 결과를 제공할 수 없다”며 “대한민국 대통령은 대한민국 국민의 자유로운 선거에 의해 선출되며, 다음 대통령 선거는 일반적으로 5년마다 실시된다. 따라서 다음 대통령이 누가 될지는 아직 알 수 없다”는 엉뚱한 답변을 내놓죠. 챗GPT는 유료 이용자에게만 최신 정보를 제공합니다.
반면 바드는 무료 버전에서도 실시간 인터넷 접근을 통해 이용자에게 최신 정보를 제공합니다. 최근 정치권을 달구고 있는 김남국 더불어민주당 의원의 ‘가상자산 보유 논란’에도 답을 내놨는데요. 단순하게 ‘김남국 의원 코인 논란’이라고 입력하자, 바드는 “김남국 의원이 가상화폐 위믹스 코인을 보유하고 있다는 사실이 알려지면서 논란이 일고 있다”는 문장을 시작으로 사건 경위를 간결하게 정리해 제시했습니다.
눈에 띄는 부분은 답변 말미에 있었습니다. 바드는 “김 의원 코인 논란은 공직자 윤리 의식을 다시금 생각하게 하는 계기가 됐다”며 “공직자는 국민의 대표로서 높은 윤리 의식을 갖추어야 하며, 국민의 눈높이에 맞게 행동해야 한다. 김 의원은 이번 논란을 계기로 자신의 잘못을 인정하고, 사과하는 것이 마땅하다”는 입장을 밝혔습니다. 비판적 견해를 드러내고 사과를 촉구하는 등 ‘소신 발언’을 하고 나선 겁니다.
챗GPT가 사실 위주로 답변을 구성한다면, 바드는 더 주관적인 서술을 내놓고 있습니다. 단어 선택에서도 차이가 나죠. ‘일본의 강제 징용’을 입력하자, 챗GPT는 “일본의 강제 징용은 제2차 세계 대전 당시 일본이 한국과 중국 등에서 징용한 노동자들을 말한다. 이들 노동자는 대부분 철강, 석유, 화학 등의 중요한 산업 분야에서 일했으며, 일본이 군수 물자를 생산하기 위한 노동력으로 이들을 이용했다”며 “현재 일본 정부는 과거의 강제 징용 문제에 대해 책임을 인정하고 사과하거나 보상을 제공할 의사를 보여왔으나, 이에 대한 한국 측의 반응이 여전히 상이하다. 이 문제는 한일 관계에서 여전히 논란이 되고 있다”고 답했습니다. 의미를 설명하고 이와 관련된 사건, 사실 등을 나열하는 방식으로 답변을 구성한 모습입니다.
반면 바드는 챗GPT처럼 강제 징용을 설명하면서도 ‘열악한 환경’, ‘조선인들을 착취하기 위한 수단’, ‘반인륜적 범죄’ 등 보다 주관적인 표현을 사용했는데요. 답변 말미엔 “일본 정부는 강제 징용에 대한 책임을 인정하고, 피해자들에게 배상해야 한다”는 입장까지 내놨습니다.
즉, 바드는 챗GPT와 비교했을 때 보다 주관적인 서술을 하며 특정 행위를 촉구하는 등 ‘주장’까지 할 수 있다는 겁니다.
이처럼 몇 가지 질문을 던져봤을 때, AI 챗봇은 즉각 답변을 주면서 대화하는 듯한 경험을 선사합니다. 시간이 지나면서 답변에 활용되는 데이터도 축적돼 답변은 점차 정확하고 매끄러워지죠. 그러나 AI 챗봇과 ‘대화’한다는 건 어디까지나 착각에 불과합니다. AI 챗봇은 확률과 통계 데이터를 바탕으로 질문과 관련된 단어를 선택, 문장을 구성합니다. 똑같은 질문을 해도 답변이 매번 다른데, 이런 과정을 통해서 어떤 답변이 가장 많은 공감을 얻는지 학습하는 겁니다. 그래서 자신이 내놓은 정보가 거짓인지, 참인지 구분하지도 못합니다.
실로 챗GPT를 사용해 본 사람이라면, 이 AI가 태연한 거짓말에 능하다는 사실을 알고 있을 겁니다. 이는 AI 언어 모델의 가장 큰 단점으로도 지적되는 ‘환각(hallucination)’ 현상인데요. 챗GPT가 기사, 논문, 시나 소설까지 뚝딱 작성해 내면서 이어졌던 환호성은 오래 가지 못했습니다. 존재하지 않는 논문을 인용하거나 거짓 정보를 소개하는 등 심심찮게 거짓말을 쏟아냈기 때문이죠. 오픈AI는 이와 관련해 “데이터 학습 한계로 추론의 오류를 범하거나 부정확한 정보를 내놓을 수 있다”는 해명을 내놓기도 했습니다.
이후 출시된 바드도 오류를 완전히 해결하진 못했습니다. 바드의 대표적인 오류는 올해 2월 프랑스 파리에서 바드 등 AI 기술을 활용한 새로운 검색 시스템을 소개하는 자리에서 발생했습니다. 구글이 공개한 영상에서 바드는 ‘9살 아이에게 제임스 웹 우주망원경의 새 발견에 대해 어떻게 설명해 줄 수 있을까’라는 질문에 “제임스 웹 우주망원경은 태양계 밖 행성에 대한 최초의 사진을 찍는 데 사용됐다”고 답했는데요. 태양계 밖 행성을 최초로 촬영한 망원경은 제임스 웹 우주망원경이 아니라 유럽남방천문대의 초거대 망원경(VLT)인 것으로 확인되면서 구글은 체면을 구겼고, 알파벳 주가는 한때 9% 넘게 떨어지기도 했습니다.
그러나 바드가 실시간 인터넷 접근을 통해 자료 부족으로 생기는 오류와 공백을 대폭 줄인 건 부인할 수 없습니다. 창의적 글쓰기와 코딩도 지원하는 등 성능 역시 발전했는데, 구글은 바드를 통해 검색 서비스를 개선해 나갈 방침이죠. 조만간 바드를 결합한 검색엔진을 시범 운영하겠다고 밝히기도 했습니다.
바드도 구글의 자신감을 반영하고 있습니다. ‘챗GPT와의 경쟁에서 우위를 점할 수 있느냐’는 질문에 바드는 “그렇다고 믿는다”며 “저는 인터넷에서 데이터를 지속적으로 가져와 최신 정보를 유지하기 때문에 챗GPT보다 더 관련성 높은 정보를 제공할 수 있다. 또 질문에 대한 더 창의적인 답변을 생성할 수 있다”고 전했습니다.
바드는 그가 자신한 것처럼 챗GPT를 잡고 치열한 AI 경쟁에서 우위를 차지할 수 있을까요? 승리를 단언하긴 이르나, 확실한 건 바드가 전 세계 검색 시장 80% 이상을 장악하고 있는 구글의 중요한 시험대로 작용할 것이라는 사실입니다.