thebell

전체기사

[i-point]크라우드웍스, AI 데이터 전처리 핵심 기술 특허 출원'문서 복잡도 분석 매트릭스'로 문서 복잡도 4단계로 구분

이종현 기자공개 2025-04-22 09:21:30

이 기사는 2025년 04월 22일 09시19분 thebell에 표출된 기사입니다

인공지능(AI) 테크 기업 크라우드웍스는 자사의 AI 데이터 전처리 솔루션 '알피 널리지 컴파일러'에 적용된 핵심 기술 '문서 복잡도 분석 기반 문서 자동화 처리 기술'에 관한 특허를 출원했다고 22일 밝혔다.

크라우드웍스에 따르면 AI 에이전트 개발에 요구되는 비정형 데이터 전처리 과정에서 문서 특징을 고려하지 않고 일괄 자동화를 적용할 경우 복잡한 문서에서 인식률이 떨어진다. 실제 전처리 대상 문서가 수십만 페이지에 달하는 경우도 적지 않은 만큼 문서 복잡도를 기반으로 자동화 범위를 판단하고 전문가 투입 여부를 사전에 결정하는 것이 필수 전략이라는 설명이다.


이번에 출원한 기술은 처리할 문서의 복잡도를 정량적으로 분석해 4단계로 분류한다. 구조가 단순한 수준의 문서는 자동화 전처리를 우선 적용하고, 구조가 복잡해 오류 발생 가능성이 높은 문서는 전문가 파싱을 병행해 맥락과 판단을 반영해 전처리할 수 있는 기준을 제시한다.

해당 기술은 크라우드웍스의 AI 데이터 전처리 솔루션 알피 날리지 컴파일러에 적용되고 있다. 해당 솔루션은 광학문자판독(OCR), 파싱(Parsing), 청킹(Chunking)을 통해 다양한 문서를 AI가 이해할 수 있는 형태의 데이터로 변환한다.

김우승 크라우드웍스 대표는 "문서 복잡도 분석을 통해 AI 데이터 전처리의 효율성을 높인 것은 국내외 업계 최초 사례"라며 "이번 특허 출원을 통해 AI 데이터 전문성을 바탕으로 차별화된 경쟁력을 다시 한번 입증했다. 데이터 전처리 방식을 고민하던 기업들로부터 문의가 이어지는 중"이라고 말했다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >

더벨 서비스 문의

02-724-4102

유료 서비스 안내
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 4층, 5층, 6층대표/발행인성화용 편집인김용관 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자황철
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.