thebell

인더스트리

'범국가 신약투자' 건강 데이터 활용 '신약배당' 정책 제안 연합학습 활용한 AI 모델 개발…국민 동의 필요조건, 실효성은 '아직'

한태희 기자공개 2025-06-12 10:11:02

이 기사는 2025년 06월 11일 17시39분 thebell에 표출된 기사입니다

막대한 돈과 시간이 필요한 신약에 우리 국민들이 손쉽게 투자할 수 있는 길이 열린다면. 국민 건강 데이터를 AI(인공지능) 신약 개발에 활용하고 기술수출이나 상업화 과정에서 발생하는 수익을 국민들에 배당 형태로 환원하자는 아이디어가 나왔다.

국내 단일 의료보험 체계에 축적된 건강 데이터를 AI 모델에 학습시켜 신약 개발의 효율을 높이자는 정책제안이다. 데이터를 외부로 옮기지 않고 AI 모델이 직접 움직이는 형태의 '연합학습' 기법이 대안으로 제시됐다.

하지만 아직 정책 구상 초기 단계인 만큼 보상 구조 등이 명확하지 않다. 또 개인정보 유출 우려도 있다. 국민 동의를 얻어야 하는 만큼 정책의 실효성은 아직 미지수다.

◇개인정보 공유 방법 한계 극복, 데이터 표준화로 산업적 활용 확대

한국제약바이오협회는 11일 '국민신약배당 정책 제안'을 주제로 온라인 설명회를 열었다. 국민의 바이오 데이터를 AI 신약 개발에 활용할 수 있도록 지원하고 이 과정에서 창출되는 수익 일부를 국민에게 배당하는 구조를 만들자는 게 골자다.

김화종 한국제약바이오협회 K-MELLODDY 사업단장이 연사로 섰다. 김 단장은 작년 초 한국제약바이오협회 AI신약융합연구원의 초대 연구원장으로 부임했다. 작년 3월부터 K-MELLODDY 사업단장을 역임하고 있다.

그는 "ChatGPT 같은 언어모델과 달리 바이오 분야에서는 약물에 대한 우리 몸의 반응을 담은 AI 모델이 부족하다"며 "우리나라는 단일 의료보험 체계를 기반으로 데이터가 잘 정리돼 있지만 산업적 활용은 아직 미흡하다"고 말했다.

가장 큰 장벽은 개인정보 공유 방법의 한계다. 개인 식별 정보를 임의 값으로 치환하는 가명화, 데이터를 암호화해 공유하거나 분석하는 방식은 원본 데이터 노출 위험이 있다. 데이터 결합 기관이 중간에 개입하면 실시간 분석이 불가하다는 어려움도 있다.

온라인 정책제안 설명회를 진행한 김화종 단장. (출처=한국제약바이오협회)

김 단장이 내건 대안은 '연합학습' 기법이다. 연합학습은 데이터를 외부로 반출하지 않고 역으로 AI 모델을 기관에 심은 뒤 학습시킨다. AI 모델을 먼저 개발하고 이 목적에 필요한 데이터만 학습과 표준화에 사용하는 방법이다.

그는 "연합학습은 데이터가 외부로 나가지 않고 먼저 만든 AI 모델이 직접 기관으로 가서 학습을 수행한다"며 "처음부터 목적을 정해두고 다양한 실세계 데이터를 확보하는 만큼 사용 목적이 안정되고 성능이 우수한 모델을 확보할 수 있다"고 말했다.

이번 정책 제안은 한국제약바이오협회가 진행 중인 '연합학습 기반 신약개발 가속화 프로젝트(K-MELLODDY) 사업'의 연장선이다. K-MELLODDY 사업 기간은 2024년부터 2028년까지 5년간 진행되며 총 사업비로는 약 348억원이 투입된다.

◇정부 주도 제도 마련 필요성 역설, 국민 설득 의도 정책 제안

개인정보 보호만큼 중요한 과제는 국민 설득이다. 자신의 데이터를 민간에서 활용해 수익을 낸다면 국민이 이를 무조건적으로 허용할 수 있을까. 김 단장은 이러한 부담을 줄이는 관점에서 수익의 일부를 공유하는 '신약배당' 정책을 제안하게 됐다고 설명했다.

김 단장은 "약물 타깃 설정, 바이오마커 발굴, 약효 예측 또는 개인화된 정밀 의료까지 포괄하는 게 AI 모델"이라며 "공공 데이터를 신약 개발에 쓸 수 있도록 안전한 기술이 있어야 하고 제도가 필요하며 이를 정부 주도로 마련해야 한다"고 말했다.

한국제약바이오협회 제공.

김 단장은 이번 구상이 정책 제안 단계로 아직 구체화된 사항은 없다고 밝혔다. 이날 설명회 역시 사업 설명이 아닌 정책 제안 자리임을 강조했다. 신 정부의 바이오 공약과 연계해 정부 부처와 합의를 통해 추진된 사업이냐는 질문에도 선을 그었다.

그는 "데이터의 원천 제공자인 국민 동의를 얻는 게 첫 번째 과제"라며 "연합학습을 통해 한 병원의 데이터만 들여다보던 곳이 20개 병원의 데이터를 볼 수 있게 된다면 다양한 연구로 확장을 시도해볼 수 있을 것"이라고 말했다.

이어 "수익 구조에 대해서는 비율은 정해야겠지만 상당히 단순한 방식이 되어야 할 것 같다"며 "국민에 수익의 일부를 공유한다는 내용을 처음부터 계약하고 축적한 데이터를 사용한 뒤 정산하는 방식이 고려될 수 있다"고 덧붙였다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >

더벨 서비스 문의

02-724-4102

유료 서비스 안내
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 4층, 5층, 6층대표/발행인성화용 편집인김용관 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자황철
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.