thebell

전체기사

[thebell interview]정무경 디노티시아 대표 “AI 보편화 이끌 것"사피온 CTO 출신…벡터 DB 시스템 소프트웨어 내년 상반기 상용화

이채원 기자공개 2024-12-20 07:32:57

이 기사는 2024년 12월 16일 15:21 thebell 에 표출된 기사입니다.

“작은 디바이스에서도 거대언어모델을 활용할 수 있는 기술을 개발하고 있다. 궁극적으로 AI 서비스의 가격을 낮춰 모두가 쉽게 AI를 활용하는 세상을 만드는 것이 목표다."

정무경 디노티시아 대표(사진)는 최근 서울시 서초구에 위치한 본사에서 더벨과 만나 이같이 말했다. 정 대표는 1976년생으로 한국과학기술원(KAIST) 전기및전자공학과 박사 학위를 취득한 후 삼성전자 종합기술원에서 전문연구원으로 재직했다. SK텔레콤에서는 AI 액셀러레이터(Accelerator)를 담당했고 사피온에서 최고기술책임자(CTO)를 역임했다.

그는 지난해 4월 말 사피온을 나와 6월 말 디노티시아 법인을 세웠다. 정 대표의 주요 이력에 다수 VC는 믿음을 보였다. 지난해 시드 라운드에서 140억원 투자를 받았고 이달 210억원 프리시리즈A 투를 마무리 지었다.

◇벡터 DB 기술력 보유…내년 하반기 본격 수주

디노티시아의 주력 제품은 두 가지로 나뉜다. 디노티시아의 벡터 DB는 텍스트, 이미지, 동영상과 같은 다양한 형태의 데이터를 고차원 벡터(숫자 형태)로 변환해 컴퓨터가 쉽게 유사한 내용을 검색할 수 있도록 돕는 데이터베이스 기술이다. 이 기술은 사용자의 요청을 기반으로 데이터의 의미와 맥락을 분석하는 시멘틱 서치(데이터의 의미·맥락 기반 검색)를 가능하게 한다. 보다 정확하고 관련성 높은 검색 결과를 제공한다는 장점이 있다.

정 대표는 “최근 1~2년 사이에 거대언어모델(LLM)을 기반으로 한 서비스가 상용화되고 있고 LLM 서비스를 선보이기 위해서는 대부분 검색 증강 생성 기술(RAG) 시스템을 활용한다”며 “LLM 서비스를 차별화 시키려면 유저의 질문에서 답을 만들어줄 수 있는 근거가 되는 정보를 수집해 오는 것이 중요한데 이때 필요한 것이 백터 데이터베이스다”고 말했다.

따라서 그는 “회사들은 AI 기술 차별화를 위해 자신만의 데이터를 핸들링할 수 있는 백터 DB가 필요하다”고 설명했다. 또 백터 DB 서비스 규모가 커지고 담아야할 데이터량이 많아지면 데이터를 뽑아내는 기술이 중요해질 것이라고 봤다.

정 대표는 “서비스에서 좋은 데이터를 선별하고자 하는 요구사항이 늘어날수록 벡터DB의 성능과 효율이 중요해진다”며 “대규모 데이터를 빠르게 처리하려면 소프트웨어가 아닌 하드웨어가 필요하다”고 말했다.

회사는 벡터 데이터베이스를 구현하기 위한 반도체 칩을 개발 중이다. 벡터연산 전용 가속 반도체 칩인 VDPU(Vector Data Processing Unit)가 그것이다. 정 대표는 “벡터 데이터 연산에 특화된 반도체 칩을 사용할 시 AI 서비스를 수행하는 과정에서 전력을 적게 소모하면서도 성능도 올라간다”고 했다.

디노티시아가 두 번째로 주력하는 사업은 데이터베이스와 거대언어모델(LLM)을 합치는 기술이다. 그는 “LLM은 벡터 DB 기술과 합쳐지면 파라미터(매개변수) 갯수를 줄이고도 높은 성능을 발휘할 수 있다고 생각한다”며 “LLM과 벡터DB 기술을 통합한다면 작은 디바이스에서도 LLM을 처리할 수 있는 제품이 나올 수 있다”고 말했다.

그는 LLM이 작아지면 AI의 민주화가 가능해질 것이라고 봤다. 정 대표는 “LLM이 손바닥 만한 크기로 구현된다는 것은 AI 가격이 저렴해진다는 것과 같다”며 “AI를 누구나 사용할 수 있도록 만들고 싶다”고 말했다.

벡터 데이터베이스(DB) 시스템 소프트웨어는 내년 상반기 상용화될 전망이다. 정 대표는 “다수 기업과 POC(기술검증)를 진행하고 있고 하드웨어까지 탑재된 벡터 DB 제품은 내년 하반기에 나올 예정이다”며 “실질적인 수주는 내년 하반기부터 발생할 것으로 보인다”고 말했다.

◇의료·콘텐츠 분야 접목 가능…고성능 대형언어모델 오픈소스로 공개

디노티시아는 벡터 DB 사용 분야를 의료를 넘어 콘텐츠까지 넓힐 계획이다. 회사는 지난 9월 고려대학교 안암병원, 고려대학교 첨단의료영상연구소와 의료 AI 분야 발전을 위한 업무협약을 체결했다.

정 대표는 “데이터가 방대한 시대에서 하나의 파일을 찾기 위해서는 상당한 시간과 노력이 필요하다”며 “벡터 DB 시스템으로는 사용자의 요청을 기반으로 데이터의 의미와 맥락을 분석하는 시멘틱 서치도 가능해 의료 영상에서도 유용하게 쓰일 수 있다”고 말했다.

따라서 그는 영상을 많이 보유하고 있는 미디어 회사에도 이 기술이 적용되면 시너지가 날 것이라고 봤다. 정 대표는 “미디어 회사들은 데이터룸에 수많은 데이터를 쌓아놓고 있다”며 “옛날 영상과 정보를 찾는데도 AI가 활용될 수 있어 다수 미디어 회사들과도 같이 일하고 있다”고 전했다.

최근 디노티시아는 자체 개발한 고성능 대형언어모델(LLM) 파운데이션 모델 ‘디엔에이(DNA): Dnotitia AI’를 오픈소스로 공개했다. 정 대표는 “디노티시아가 만든 파운데이션 모델을 외부에 공개하고 향후에는 기술을 더욱 고도화해나갈 방침이다”고 했다. 파운데이션 모델은 광범위한 데이터에 대해 훈련된 기계 학습 또는 딥 러닝 모델을 말한다.

마치 업스테이지가 자체 개발한 거대 언어모델인 솔라(Solar)를 공개한 것과 같이 이후 다양한 산업에서 AI 적용사례를 만들겠다는 심산이다.

디노티시아는 향후 디엔에이 파운데이션 모델을 기반으로한 생성형 AI 어시스턴스(Assistant)의 베타 테스트를 시작한다. AI 어시스턴스는 한국 문화와 맥락을 깊이 이해하는 기능이 탑재돼 한국 사용자들에게 특화된 서비스를 제공한다는 점이 특징이다. 검색, 요약, 번역, 데이터 분석, 보고서 작성, 코딩 등 주요 LLM 서비스 기능을 모두 지원한다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >

더벨 서비스 문의

02-724-4102

유료 서비스 안내
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 4층, 5층, 6층대표/발행인성화용 편집인김용관 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자황철
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.