
▲ 카카오가 한국형 하이브리드 멀티모달 언어모델을 공개했다. (사진=카카오 제공)
[e-뉴스 25=백지나 기자] 카카오가 지식 기반의 일반 대화와 추론 모드를 모두 지원하는 하이브리드 멀티모달 언어모델을 내놨다.
카카오는 5일 일상 대화부터 논리적 사고가 필요한 복잡한 문제 해결까지 하나의 모델로 처리할 수 있는 자체 개발 신규 AI 모델 '카나나-v-4b-하이브리드' 성능을 공개했다고 밝혔다.
이번 새 모델은 지난해 7월 글로벌 AI 공유 플랫폼 '허깅페이스'에 오픈소스로 공개한 '카나나-1.5-v-3b'를 토대로 개발됐다.
단순 이미지를 텍스트로 변환하거나 설명하는 수준을 넘어 사람처럼 정보를 종합하고 계산하며 스스로 검산하는 과정을 거치는 것이 특징이다.
이를 통해 인공 지능 모델이 가진 환각 현상을 최소화할 수 있다는 게 카카오 설명이다.
또 복잡한 형태의 표나 영수증, 수학 문제 등 까다롭고 복합적인 문제나 상황에서 발생하기 쉬운 계산 실수와 조건 누락을 줄이고 정확도를 한층 높였다고 카카오는 부연했다.
특히 한국어 논리 전개 능력에서 독보적 경쟁력을 입증했다고 카카오는 전했다.
기존 글로벌 모델의 경우 한국어 질문을 영어로 번역해 사고한 뒤 재번역해 답했지만, 이 모델은 한국어 질문을 있는 그대로 이해하고 사고하도록 학습됐다.
이를 바탕으로 대학수학능력시험 사회탐구와 수학 문제에서 한국어의 미묘한 조건들을 이해해 높은 정답률을 기록했다.
한국 교육 체계를 기반으로 하는 AI 학력 평가 벤치마크인 '코넷'(KoNET)에서는 92.8점을 획득했다.
국내외 다른 AI 모델과 비교해도 과학과 공학, 일반 시각 질의응답, 문서 이해는 물론 복잡한 추론이 필요한 영역에서도 우수한 성능을 보였다고 카카오는 밝혔다.
카카오는 단계별로 정교하게 설계된 학습 과정을 통해 모델 성능을 고도화했다.
기초 학습과 장문 사고 사슬, 오프라인 강화학습, 온라인 강화학습으로 이어지는 4단계의 고도화된 학습 절차를 거쳤다는 설명이다.
카카오는 향후 사용자가 모델을 선택할 필요 없이 AI가 질문 복잡도를 스스로 판단한 뒤 일반·추론 모드를 직접 자동 전환해 동작할 수 있는 형태로 고도화할 계획이다.
이를 통해 하나의 대화창에서 단순한 질문과 복잡한 분석 요청에 자연스럽고 끊임없는 사용 경험을 제공하겠다는 것이다.
김병학 카카오 카나나 성과리더는 "이번 새 모델은 한국어 환경에서 가장 자연스럽고 정확하게 생각하고 답변할 수 있는 모델"이라며 "한국어에 특화된 높은 성능과 효율을 갖춘 자체 AI 모델 개발을 통해 글로벌 무대에서 경쟁력을 높이겠다"고 말했다.