서울--(뉴스와이어)--인공지능 언어 데이터 기업 플리토(대표 이정수, 코스닥 300080)가 자사 통합 크라우드소싱 플랫폼의 기능 고도화를 완료했다고 27일 밝혔다. 이번 플랫폼 고도화 작업으로 생성형 AI를 포함한 거대언어모델(LLM)의 성능 향상을 위한 ‘인간 피드백형 강화학습(RLHF: Reinforcement Learning from Human Feedback)’용 데이터 구축이 더욱 용이해졌다는 것이 회사측 설명이다.
‘인간 피드백형 강화학습(RLHF)’은 사람 작업자의 피드백을 보상 신호로 활용해 AI 모델의 언어 출력 생성 과정을 학습시키는 방식으로, 거대언어모델(LLM)의 자연스러운 대화 생성, 정확도 높은 정보 검색, 다국어 번역 등 고품질 언어 생성을 위한 성능 향상을 위해 전 세계적으로 수요가 크게 증가하고 있다.
플리토는 자체 플랫폼에 총 10가지 유형의 강화학습 데이터 생산을 위한 기능 및 작업 환경 구축을 완료했다. △챗봇의 답변을 평가하고 정확한 답변으로 수정하는 작업 △주어진 이미지의 내용을 기술하는 작업 △주어진 글을 요약 등 요청에 맞게 편집하는 작업 △주어진 명령에 따라 답변을 도출하는 작업 △전문 분야별 파인튜닝을 위한 프롬프트-응답 데이터셋 구축 작업 △자동 코딩을 위한 코딩 생성 작업 △정보 검색 시 정확한 결과 도출을 위해 시스템이 취하는 과정의 생성 작업 △멀티모달 학습을 위한 텍스트, 이미지, 음성 등의 태깅 작업 등이 포함된다.
블룸버그 산하 연구기관인 블룸버그 인텔리전스의 조사 결과에 따르면, 생성형 AI 시장은 향후 10년간 42%의 연평균 성장률로 급성장할 것으로 예상된다. 텍스트 요약, 콘텐츠 생성, 감정 분석, 다양한 산업 및 분야별 챗봇, 실시간 통번역 서비스 등 생성형 AI 기반 서비스의 수요 증가로 약 2800억달러(한화 약 360조)의 새로운 소프트웨어 수익이 창출될 것으로 전망하고 있다.
플리토는 기존 다국어 번역 및 코퍼스(말뭉치) 구축 플랫폼의 기능 확장 및 고도화를 완료함으로써 국내외 수요가 급증하는 강화학습 데이터 구축을 선제적으로 제안하고, 2024년을 사업기회 외연 확장 및 본격적인 글로벌 사업 확대의 원년이 될 것으로 기대하고 있다.
플리토 이정수 대표는 “LLM의 편향성과 할루시네이션(환각 현상)은 줄이고 모델 출력 품질과 관련성을 높여 다양한 산업에서 실질적 가치를 제공하기 위해서는 강화학습이 필수적”이라며 “10년간의 통합 플랫폼 구축 및 운영 노하우를 바탕으로, LLM 성능 향상을 위한 고품질 강화학습 데이터 구축 분야에서도 국내를 넘어 글로벌 시장에서의 사업 경쟁력 확보를 위해 최선을 다하겠다”고 밝혔다.