thebell

전체기사

[코스닥 AI 모니터]'데이터 자산’ 갖춘 플리토, AI 전방시장 개화 반긴다①‘R&D 강화’ 다양한 정제 시스템 구축, '초개인화 서비스' 자신

윤필호 기자공개 2023-02-28 08:17:47

[편집자주]

2016년 구글 딥마인드가 바둑 인공지능(AI) ‘알파고’로 세상에 충격을 남겼다. 6년이 지난 2022년 '챗GPT'가 새로운 AI의 가능성을 열며 파장을 안기고 있다. 기대와 우려가 교차하는 가운데 자본시장을 중심으로 국내 기술력을 가늠하려는 시도가 잇따르고 있다. 더벨은 AI 기술을 개발하고 활용하려는 코스닥 상장사의 사업 현황과 가능성을 살펴보고자 한다.

이 기사는 2023년 02월 23일 16:09 thebell 에 표출된 기사입니다.

코스닥 상장사 플리토(Flitto)는 국내에서 생소한 언어 데이터 관련 사업을 영위한다. 독자적 수익모델을 보유한 덕분에 처음으로 ‘사업모델 기업’ 특례상장을 통해 코스닥 시장에 입성하면서 주목을 받았다.

최근 첨단 대화형 인공지능(AI) ‘챗GPT’의 등장과 함께 전방시장의 확장 가능성이 커지면서 재차 관심이 쏠리고 있다. 그간 연구개발(R&D)에 공을 들이며 대규모 데이터 정제 시스템을 구축했고 우호적 경영환경 조성에 기대를 키우는 모습이다.

플리토는 지난 2019년 국내 기업 최초로 기술특례 상장제도인 '사업모델기업'을 적용해 상장했다. 기술력 평가가 어려운 업종이었음에도 독자적 모델로서 가치를 인정받았다. 실제로 기술보증기금과 한국기업데이터로부터 각각 A등급을 받았다. 사업은 크게 집단지성을 활용한 번역 플랫폼과 언어 데이터 판매로 나뉜다.

상장 당시에는 언어 장벽을 깨겠다는 목표를 내세우면서 번역 앱 ‘플리토’가 주목을 받았다. 최근에는 챗GPT로 데이터 판매 사업에 보다 관심이 쏠리는 모습이다. 두 사업은 각자 별도로 운영하는 방식이 아니라 상호 서비스를 결합하며 시너지를 만들어내는 구조다. 플랫폼을 통해 수집한 언어 데이터는 내부적으로 검수, 정제를 거쳐 판매된다. 이 과정에서 고객사가 원하는 언어와 유형, 특성, 수량 등을 맞춘다.

언어 데이터 구축 절차(자료=플리토 제공)

이 같은 사업 구조로 초기에는 플랫폼 사업에서 주로 수익을 냈다. 실제로 2016년 이전까지 데이터 판매 매출은 거의 없었다. 그러다 2016년부터 AI 번역기가 본격적으로 등장하면서 데이터 판매 매출도 발생하기 시작했다. 플리토는 2019년 상장을 계기로 매출 항목을 세분화하기 시작했다.

데이터 판매 사업은 전방 시장인 AI 산업의 성장에 힘입어 점차 플랫폼 사업을 뛰어넘는 수익을 올리며 주력 캐시카우 역할을 수행했다. 지난 2020년 42억원에서 2021년 79억원으로 88.6% 늘었다. 지난해 3분기 누적 기준 매출액은 71억원을 기록했다. 전체 매출에서 차지하는 비중은 73.1%에 달했다.

지난해 챗GPT의 등장으로 플리토가 경영을 펼치기 위한 우호적인 환경이 마련됐다. 생성형 언어 AI 서비스가 본격화되면서 AI 전방 시장에도 다양한 서비스가 나타나고 있기 때문이다. 이들 AI 기업에게 필요한 것은 무엇보다 대규모의 정제된 데이터다.


플리토도 챗GPT의 등장 이전부터 이 같은 변화에 대비해 데이터 정제 시스템 마련에 필요한 각종 연구개발(R&D)를 진행했다. 이미 상장 전부터 인공신경망 기계번역(NMT) 기반 번역엔진을 도입해 그간 집단지성을 통해 쌓은 번역 데이터를 학습시켜 서비스의 질적 향상을 꾀한 경험이 있다. 이를 통해 독자, 청자의 연령과 학습상황 등 배경에 기반해 맞춤형 번역을 제공하는 초개인화 서비스 모델을 구상하고 있다.

이정수 플리토 대표는 “AI 학습에 필요한 범위가 넓어졌고 개개인 선호를 따지는 ‘용인 가능성(acceptability)‘의 중요성도 커지고 있어 이런 수요에 대응한 시스템이 필요하다”며 “챗GPT와 같은 생성형 AI는 언어를 만들기 위해 데이터가 필요한데 이를 위해 데이터를 가장 빠르게 정제해서 만드는 시스템을 구축했다”고 설명했다.

이어 “다양한 엔진 학습을 위한 센터를 만들었고 일간 수집 데이터 규모도 2년전 7만개에서 현재 50만개로 6배 이상 늘었다”며 “기존 번역 데이터를 비롯해 대화, OCR, 태깅 데이터 등 다양한 분야에서 카테고리별로 세분화하는 기술도 개발 중이다”고 덧붙였다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 5층, 6층대표/발행인성화용 편집인이진우 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자김용관
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.