본문으로 건너뛰기
← 블로그로 돌아가기
AI모델HOT

GPT-RosalindOpenAI가 신약 개발에 뛰어들다

7분 읽기
#OpenAI#GPT-Rosalind#생명과학#신약 개발#drug discovery#AI 헬스케어#바이오텍#단백질 공학

핵심 요약

OpenAI가 2026년 4월 17일, 생명과학 전용 추론 모델 GPT-Rosalind를 공개했습니다. DNA 구조 발견에 기여한 로잘린드 프랭클린의 이름을 딴 이 모델은 화학, 단백질 공학, 유전체학 전반에 걸친 과학적 추론에 최적화되어 있습니다. BixBench 벤치마크에서 GPT-5.4를 제치고 1위를 기록했으며, Amgen, Moderna, Allen Institute, Thermo Fisher Scientific과의 파트너십을 통해 신약 개발 파이프라인에 실전 투입됩니다.

관련 글: RecovryAI FDA 돌파구 지정 — 생성형 AI 의료기기의 첫 관문


OpenAI의 첫 도메인 특화 모델

GPT-Rosalind는 OpenAI가 범용 모델 노선에서 벗어나 처음으로 특정 산업에 특화된 모델을 내놓은 사례입니다. 기존 GPT 시리즈가 "모든 것을 조금씩" 다뤘다면, Rosalind는 생명과학이라는 단일 도메인에 집중합니다.

핵심 역량은 네 가지로 정리됩니다:

  • 증거 종합(Evidence Synthesis): 논문, 실험 데이터, 데이터베이스를 교차 분석하여 생물학적 가설을 생성
  • 실험 설계(Experimental Planning): 분자 클로닝 프로토콜부터 후속 실험까지 다단계 워크플로우를 설계
  • 도구 활용(Tool Use): 50개 이상의 과학 도구 및 데이터베이스와 연동 — Codex Life Sciences 플러그인으로 확장
  • 서열-기능 해석(Sequence-to-Function): DNA/RNA 서열에서 기능을 예측하고 돌연변이 효과를 분석

OpenAI는 이 모델이 "타깃 발견에서 신약 승인까지 통상 10~15년이 걸리는 과정을 단축하는 것"을 목표로 한다고 밝혔습니다.


벤치마크 — 범용 모델을 넘어서다

GPT-Rosalind는 생명과학 특화 벤치마크에서 기존 범용 모델 대비 뚜렷한 성능 차이를 보였습니다.

BixBench (생물정보학)

모델Pass@1
GPT-Rosalind0.751
GPT-5.40.732
GPT-50.728
Grok 4.20.698
GPT-5.20.611
Gemini 3.1 Pro0.550

LABBench2 (연구 과제)

11개 과제 중 6개에서 GPT-5.4를 상회했습니다. 특히 CloningQA — 분자 클로닝 프로토콜의 종단간 시약 설계 — 에서 가장 큰 격차를 기록했습니다.

Dyno Therapeutics 평가

Dyno Therapeutics와의 공동 평가에서 인간 전문가 대비 성능을 측정했습니다:

과제인간 전문가 대비 순위
RNA 예측상위 5% (95th percentile)
서열 생성상위 16% (84th percentile)

RNA 예측에서 인간 전문가의 95%를 넘어선 수치는, 이 모델이 단순한 보조 도구가 아니라 연구 파트너급 성능에 도달했음을 시사합니다.


Amgen부터 Moderna까지 — 파트너 라인업

OpenAI는 GPT-Rosalind를 일반에 공개하지 않았습니다. 대신 Trusted Access Program이라는 제한된 접근 구조를 도입했습니다.

현재 확인된 파트너:

파트너영역활용 방향
Amgen바이오의약품단백질 치료제 설계 최적화
ModernamRNA 백신/치료제mRNA 서열 최적화, 항원 설계
Allen Institute뇌과학/세포생물학대규모 세포 데이터 분석
Thermo Fisher Scientific연구 장비/시약실험 워크플로우 자동화

접근 조건은 까다롭습니다. 미국 내 자격을 갖춘 Enterprise 고객만 신청 가능하며, 조직 거버넌스와 안전 감독 체계를 갖춰야 합니다. 연구 프리뷰 기간 동안 사용료는 무료 — 기존 크레딧이나 토큰을 차감하지 않습니다.

이 배포 방식은 GPT 시리즈의 "API 공개 → 누구나 사용" 패턴과 정반대입니다. 생명과학이라는 고위험 도메인에서 오용을 방지하려는 의도가 명확합니다.


Codex Life Sciences 플러그인

GPT-Rosalind와 함께 공개된 Codex Life Sciences 플러그인도 주목할 부분입니다. 이 플러그인은 GitHub에서 무료로 접근 가능하며, 연구자들이 AI 모델을 50개 이상의 과학 도구 및 데이터 소스에 연결할 수 있게 합니다.

연구자가 "이 단백질의 3D 구조를 예측하고, 관련 논문을 검색하고, 돌연변이 영향을 시뮬레이션하라"는 복합 요청을 하면, 모델이 적절한 도구를 선택하고 순서대로 실행합니다. 기존에는 각 도구를 수동으로 돌려야 했던 작업입니다.


왜 지금인가 — AI + 바이오의 교차점

OpenAI가 생명과학에 집중하는 배경에는 몇 가지 흐름이 있습니다.

첫째, AI 신약 개발 시장의 폭발적 성장입니다. 2026년 기준 AI 기반 신약 개발 시장은 빠르게 확대되고 있으며, 대형 제약사들이 AI 파트너십에 수십억 달러를 투입하고 있습니다.

둘째, 도메인 특화의 필요성입니다. 범용 모델은 일반적인 과학 질문에는 답할 수 있지만, 분자 클로닝 시약 설계나 단백질 돌연변이 효과 예측 같은 전문 과제에서는 한계가 있었습니다. GPT-Rosalind는 이 격차를 메우기 위해 설계됐습니다.

셋째, 경쟁 구도입니다. Google DeepMind의 AlphaFold가 단백질 구조 예측을 장악한 상황에서, OpenAI는 "구조 예측" 대신 "연구 워크플로우 전체"를 타깃으로 차별화를 시도합니다.


전망

GPT-Rosalind가 실제 신약 개발 기간을 단축할 수 있을지는 아직 검증이 필요합니다. 벤치마크 성능과 실전 성과 사이에는 늘 간극이 있고, 생명과학은 그 간극이 특히 큰 분야입니다.

그러나 한 가지는 분명합니다. AI 모델이 "범용에서 특화로" 이동하는 흐름이 본격화되고 있다는 점입니다. OpenAI가 GPT-Rosalind로 생명과학을, Google이 AlphaFold로 구조생물학을 공략하는 사이에, 남은 도메인 — 재료과학, 기후 모델링, 법률 — 에서도 비슷한 움직임이 나올 가능성이 높습니다.

개인적으로는, Trusted Access Program이라는 제한적 배포 모델이 더 의미 있는 변화라고 봅니다. "더 많은 사람에게 더 빠르게"가 아닌, "적합한 사람에게 안전하게" — 이 방향이 고위험 AI 배포의 표준이 될 수 있습니다.


참고

Share
JJY
JJYAuthor

AI, 웹 보안, 개발 환경에 관심이 많습니다.

새 글 알림 받기

스팸 없이 새 포스트만 전달합니다.

관련 포스트