[i-point]크라우드웍스, 라이선스 확보한 고품질 데이터셋 유통·판매 개시전문가가 직접 구축한 산업별 특화 고품질 데이터셋
이종현 기자공개 2024-11-18 13:05:23
이 기사는 2024년 11월 18일 13:04 thebell 에 표출된 기사입니다.
크라우드웍스가 법적 리스크가 없는 고품질 데이터셋 유통·판매 사업을 본격 개시한다고 18일 밝혔다.크라우드웍스에 따르면 AI 시장에서 데이터 라이선스와 투명성이 강조되고 있다. 유럽연합(EU)은 인공지능(AI) 기업들에게 학습 데이터 정보 공개를 의무화했고, 미국에서는 저작권 침해 소송이 증가하는 추세다. 이처럼 라이선스를 확보한 AI 학습용 데이터셋의 중요성이 커지는 가운데 크라우드웍스가 검증된 데이터셋 유통에 나섰다.
크라우드웍스가 판매하는 데이터셋은 라이선스를 확보한 산업 특화 데이터셋이다. 데이터셋 라인업에는 △웍스원 데이터셋 △광고 분석 △건강검진 결과 △전문 지식 Q&A △기업 정보 △도서 △뉴스 기사 등이 포함됐다. 저작권 침해, 개인정보보호 등 법적 리스크가 없고 AI가 아닌 검증된 전문가가 구축해 전문성과 신뢰성이 높다고 강조했다.
웍스원 데이터셋은 숫자, 문장, 글 등 기업에서 자주 사용하는 답변 형식이나 동사, 문체 등 AI가 기업이 선호하는 표현으로 답할 수 있도록 설계된 데이터셋이다. 크라우드웍스의 소형언어모델(SLM) '웍스원(WorksOne)'이 이 데이터셋을 학습했다. 회사 측은 "타 모델과 비교 테스트에서 기업이 원하는 다양한 요구사항과 답변 유형을 만족하는 결과물을 얻을 수 있음을 확인했다"고 전했다.
광고분석 데이터셋은 국내 광고 1만여건의 광고 데이터를 분석해 만들었다. 이 밖에도 240개 국가 3억 개 이상의 최신 기업 정보를 포함하는 기업정보 데이터셋과 장르와 카테고리별 도서(e-book) 데이터셋, 1만5000여건의 건강검진 결과 데이터셋, 5억건 이상의 뉴스 기사 데이터셋, 16개 분야별 전문가가 생성한 전문지식 Q&A 데이터셋 등을 구매할 수 있다.
김우승 크라우드웍스 대표는 "AI 프로젝트가 성공하려면 데이터의 양적 확대보다 품질에 집중해야 한다"며 "양질의 데이터가 부족한 상황에서 신뢰할 수 있는 데이터셋 공급을 통해 기업의 AI 프로젝트 성공을 돕고 건강한 AI 생태계를 만들어갈 것"이라고 말했다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >
관련기사
best clicks
최신뉴스 in 전체기사
-
- [i-point]휴마시스, 짐바브웨 리튬 함유 광상 RC드릴링 작업 진행
- [i-point]크라우드웍스, 대한민국 AI 안전컨소시엄 합류
- '존재감 키우는' 김건호, 취임 1년만 삼양그룹 미래 사업 중책
- [캐시플로 모니터]컬리, 미래 성장 위한 안정적 '현금활용법'
- '외형 확장' 빙그레, 지주사 체제로…책임 경영 강화
- [한세실업을 움직이는 사람들]폴 파산트 팀장, 현지 디자인 접목 '키맨'
- 폰드그룹 품 안긴 브랜드유니버스, 정체성 유지 '방점'
- [Red & Blue]'반등 조짐' 자람테크놀로지, '뉴로모픽 컴퓨팅' 진전
- 도드람 런천미트, 동남아 수출 확대 '가속화'
- '범죄피해자 지원' 장재진 오리엔트 회장, 국무총리 표창
이종현 기자의 다른 기사 보기
-
- [i-point]휴마시스, 짐바브웨 리튬 함유 광상 RC드릴링 작업 진행
- [i-point]크라우드웍스, 대한민국 AI 안전컨소시엄 합류
- [Company Watch]슈어소프트테크, 최대 실적 경신에도 '아쉬움'
- [i-point]한컴, 다문화 아동 청소년 대상 한국어·SW 교육
- [Company Watch]'코스닥 새내기' 사이냅소프트, 혹독한 신고식
- 한컴이노스트림, '도장 인식 시스템' 특허 취득
- [Company Watch]'유해사이트 차단' 플랜티넷, 3분기 실적 개선세 뚜렷
- 'IPO 출사표' 와이즈넛, 3000억대 몸값 제시 '투심 관건'
- [Company Watch]'공모가 하회' 인스피언, 주가 우하향 '골머리'
- 이에이트, AI 딥러닝 시뮬레이션 기술 개발