아이젠사이언스, 국가 차원 ‘연합학습 기반 신약개발 가속화 프로젝트’ AI 솔루션 개발 주관 연구기관 선정
아이젠사이언스 외 광주과학기술원, 목암생명과학연구소, 전북대산학협력단, 한국과학기술원 등 총 5개 기관이 연구 주관
민한서 기자
2024-07-29



▲ 아이젠사이언스 로고[출처=아이젠사이언스 공식 홈페이지]

인공지능(AI) 기반 신약개발 선도 기업 아이젠사이언스(대표 강재우)는 국가 차원 ‘연합학습 기반 신약개발 가속화 프로젝트’의 AI 솔루션 개발 주관 연구기관으로 선정됐다고 밝혔다.

향후 5년간 총 348억 원의 예산이 투입될 예정인 프로젝트는 보건복지부와 과학기술정보통신부가 공동으로 추진하는 대규모 국책 사업이다.

연합학습(Federated Learning) 플랫폼 구축 및 개발, 신약개발 데이터 활용 및 품질관리, 연합학습 플랫폼 활용 AI 솔루션 개발 등 총 3개의 과제로 구성돼 있다.
신약개발 분야에서 AI 기술 적용의 가장 큰 난관은 양질의 데이터가 부족하다는 점이다. 이를 해결하기 위해 본 프로젝트는 연합학습 기술을 활용한 ADMET()흡분대배) 예측 모델 개발에 초점을 맞추고 있다.

연합학습은 각 참여 기관의 민감한 데이터를 외부와 공유하지 않으면서도 다양한 기관의 풍부한 데이터를 AI 학습에 활용할 수 있게 하는 혁신적인 기술이다.

기술의 핵심 원리는 데이터를 중앙 서버에 모으지 않고 AI 모델이 각 참여 기관의 로컬 환경에서 학습을 수행하는 것이다.

학습 과정에서 각 기관에서 훈련된 모델은 중앙 서버로 전송돼 통합되고 이후 다시 각 기관에 배포되는 방식으로 모델이 개선된다.

이를 통해 정보 유출의 위험을 최소화하면서도 다양한 데이터로부터 학습이 가능해진다. 결과적으로 개별 기관이 보유한 제한적인 데이터만으로는 불가능했던 고성능 AI 모델 개발이 가능해질 전망이다.

아이젠사이언스는 최신 LLM(Large Language Model) 기술을 이용해 방대한 과학 문헌 데이터에서 ADMET 관련 정보를 자동으로 추출하는 방법을 통해 학습에 활용할 수 있는 데이터를 추가로 확보하는 방법을 제안했다.

LLM 기술을 이용해 예측 결과를 단순히 수치로 제시하는 것을 넘어 그 결과의 해석과 근거를 설명하도록 개발할 계획이다.

예를 들어 ‘이 화합물은 CYP3A4 억제제일 가능성이 높으며 A 작용기와 연관이 있다’와 같은 설명을 제공할 수 있어 신약개발 연구자들의 의사결정에 유용한 정보를 제공할 수 있다.

아이젠사이언스의 의생명 분야 특화 LLM 기술력은 이미 세계 선도 수준에 있다. 최근 고려대, 영국의 명문 임페리얼 칼리지 런던과 공동으로 ‘Meerkat’ LLM을 개발했다.

‘Meerkat’ LLM은 오픈AI(OpenAI)의 GPT-4를 능가하는 놀라운 성능으로 미국 의사면허시험(USMLE)에서 85.8점을 기록하며 AI 커뮤니티에 큰 화제를 불러일으켰다. 평균 합격선인 60점을 월등히 뛰어넘는 점수다.

참고로 아이젠사이언스 외 광주과학기술원, 목암생명과학연구소, 전북대산학협력단, 한국과학기술원 등 총 5개 기관이 이 연구를 주관한다.

강재우 아이젠사이언스 대표는 “아이젠사이언스가 보유한 세계 최고 수준의 AI 기술력과 실제 신약개발 경험이 시너지를 일으켜 이 프로젝트의 성공을 이끌어낼 것이다. 이번 프로젝트를 통해 한국의 AI 기반 신약개발 기술을 세계 최고 수준으로 끌어올리겠다”고 포부를 밝혔다.
저작권자 © 엠아이앤뉴스, 무단전재 및 재배포 금지
관련 기사
ICT·과학 분류 내의 이전기사
주간 HOT ISSUE