2024년, 저희는 Azure AI Foundry의 의료 AI 모델 모델 카탈로그를 소개하게 되어 매우 기뻤습니다. 이 컬렉션에는 Microsoft, Microsoft Research, 파트너, NVIDIA 및 Hugging Face의 타사 모델을 포함하여 의료 및 생명 과학 분야를 위한 18개의 오픈 소스 모델이 포함되어 있습니다. 이 출시는 전 세계 의료 개발자에게 접근 가능하고 발전된 AI 모델을 제공하겠다는 약속을 보여주는 중요한 이정표였습니다.

그 중요한 순간 이후, 상당한 발전이 있었습니다. 저희 팀은 파트너와 고객에게 이익을 제공하기 위해 카탈로그를 지속적으로 확장하면서 Foundry 모델의 Foundry 모델의 관리형 컴퓨팅 제공을 부지런히 개선해 왔습니다. 현재 카탈로그에는 30개 이상의 엄선된 의료 및 생명 과학 모델이 있으며, 더 많은 모델이 개발 중에 있습니다.

AI 모델 자산 보호 기능 출시

오픈 소스 모델로 강화된 현재 Foundry 모델 카탈로그는 의료 분야에서 AI를 민주화하려는 노력의 증거입니다. 이러한 모델은 개발자 커뮤니티 내에서 협업과 혁신을 장려합니다.

관리형 컴퓨팅은 이제 모델 제공업체에 상당한 이점을 제공하여 보안 및 경제적 이점을 모두 제공하는 자산 보호 및 포괄적인 수익 창출 프레임워크를 제공합니다. 향상된 보안은 독점 모델이 무단 액세스로부터 보호되어 귀중한 자산과 보안의 기밀성을 유지하도록 보장합니다. 반대로 오픈 소스 모델은 투명성, 유연성 및 가속화된 혁신과 같은 이점을 제공합니다.

차원	IP 보호 모델	오픈 소스 모델
액세스 제어	엄격한 액세스 정책; 보안 환경에서 호스팅; 자산은 암호화되거나 컨테이너화됩니다.	완전히 공개; 명시적으로 라이선스가 부여되지 않은 경우 누구에게나 액세스 가능
코드 및 가중치 보호	코드가 노출되지 않음; 자산 유출 없이 관리형 컴퓨팅에서 추론을 수행할 수 있습니다.	소스 코드 및 모델 가중치가 완전히 노출됨; 자산 도난으로부터 보호되지 않음
맞춤화	제한적; 제공업체와의 협업 필요	매우 사용자 정의 가능; 개발자는 재교육하거나 수정할 수 있습니다.
지원 및 SLA	Azure SLA 및 지원 구조와 함께 제공	보장된 지원 또는 가동 시간이 없는 커뮤니티 기반
혁신 주기	추가 보안 검토 및 통제된 환경을 통한 집중 반복	글로벌 개발자 기여로 인한 빠른 실험 및 진화
보안 및 규정 준수	완전히 감사 가능; 관리형 인프라를 통해 ISO, HIPAA, GDPR 등을 충족할 수 있습니다.	실제 시나리오에서 규정 준수를 위해 인증하거나 감사하기 어렵습니다.

Microsoft는 독립 소프트웨어 공급업체(ISV), 학술 의료 센터(AMC), 공급업체, 지불인 및 제약 회사를 비롯한 파트너와 긴밀히 협력하여 AI 모델 개발 및 게시를 포함한 고품질의 지속 가능한 솔루션을 구축합니다.

모델 자산 보호 이해

자산 보호는 고유하고 독점적인 AI 솔루션을 제공하는 모델 제공업체에게 여전히 가장 중요한 문제입니다. 이를 해결하기 위해 모델 가중치 및 추론 런타임과 같은 모델 자산에 대한 무단 액세스를 방지하는 배포 템플릿 기능을 구현했습니다.

자산 보호는 다음 두 가지 측면에서 보장됩니다.

모델 자산 및 런타임 컨테이너는 최종 사용자가 직접 액세스할 수 없습니다.
- 모델 메타데이터와 실제 데이터는 분리되어 있습니다. 공용 스토리지 컨테이너 레지스트리를 사용하면 사용자가 모델, 배포 템플릿 및 환경(컨테이너 정보 포함)의 메타데이터를 읽을 수 있지만 모델 가중치 및 컨테이너와 같은 실제 데이터는 네트워크 경계 뒤에 있으며 별도의 권한 제어로 보호됩니다.
- 프로덕션 테넌트의 보호된 레지스트리에 대한 액세스는 엄격하게 관리 및 제어됩니다.
최종 사용자는 모델을 제공하는 컨테이너의 동작을 조정할 수 없습니다.
- 배포 템플릿은 모델 제공업체가 작성하고 유효성을 검사합니다. 유효성이 검사된 배포 템플릿만 배포에 사용할 수 있습니다.
- 폐쇄형 배포 프로세스는 모델을 제공하는 컨테이너가 최종 사용자에 의해 조정되지 않고 의도한 대로만 작동/유효성이 검사되도록 보장합니다. 최종 사용자가 임의의 컨테이너를 사용하여 모델을 제공하려고 하면 모델이 승인된 배포 템플릿만 사용하도록 강제되므로 요청이 거부됩니다. 이 방법을 사용하면 사용자가 구독 내에서 모델을 배포할 수 있도록 하면서 모델 자산을 독점적으로 유지할 수 있습니다.

제약 및 생명 과학 분야로 모델 확장

AI의 약물 발견에서의 중요성은 아무리 강조해도 지나치지 않으며, 연구자들이 복잡한 생물학적 문제를 해결하는 방식을 혁신합니다. Microsoft Research(MSR) 팀은 혁신적인 단백질 모델을 적극적으로 개발하고 있으며, 현재 Azure AI Foundry 카탈로그에 통합되고 있습니다.

EvoDiff: 구조 기반 모델로는 접근할 수 없는 바람직한 속성을 가진 새로운 단백질을 설계하는 데 사용할 수 있는 단백질 서열의 확산 기반 생성 모델입니다.
BioEmu: 단백질 기능의 기초가 되는 단백질의 역동적인 유연성을 포착하고 정적 모델이 놓치는 통찰력을 드러내는 실험적 정확도로 구조적 앙상블을 생성하는 최초의 모델입니다.

현재 연구 단계에서는 AI가 단백질 폴딩, 서열 생성 및 분자 설계를 가속화하여 약물 개발과 관련된 시간과 비용을 크게 줄일 수 있는 능력을 보여줍니다. NVIDIA의 BioNeMo 청사진과 같은 AI 기반 모델은 고안정성 단백질을 예측하고 효과적인 약물 표적을 식별하는 데 있어 머신 러닝의 힘을 입증합니다.

이러한 모델은 현재 생물학 고객을 위한 Foundry 모델 카탈로그에서 사용할 수 있으며, Generative Virtual Screening 청사진의 추가 모델이 곧 제공될 예정입니다.

ProteinMPNN은 고안정성 기능성 단백질을 예측하여 단백질 기반 약물 개발 및 합성 생물학에서 혁신을 창출하고 지원합니다.
OpenFold2는 아미노산 서열에서 3차원 단백질 구조를 예측합니다. 약물 표적을 식별하고 효과적인 의약품을 설계하는 데 도움이 됩니다.
RfDiffusion은 세포 환경 전체에서 분자 확산을 시뮬레이션하여 수송 메커니즘 및 상호 작용에 대한 통찰력을 제공합니다. 신호 전달, 대사 경로 및 약물 전달 시스템을 연구하는 데 필수적이며 치료 전략 개발에 도움이 됩니다.
MSA-search (Multi Sequence Alignment)는 여러 단백질 서열을 정렬하여 유사점과 차이점을 식별하며, 비교 유전체학 및 진화 생물학에 매우 중요합니다. 진화적 관계와 기능적 보존을 이해하는 데 도움이 되어 유전 연구 및 진화 연구를 발전시킵니다.

진단 정확도 향상을 위한 병리학 기초 모델

Microsoft Research와 협력하여 Paige.ai는 수년에 걸쳐 최첨단 디지털 병리학 기초 모델을 개발해 왔습니다.

Virchow: 다양한 암 병리학 애플리케이션에서 진단 정확도를 향상시키는 것으로 입증된 최초의 백만 슬라이드 수준의 기초 모델입니다.
Virchow2: 향상된 성능으로 Virchow를 기반으로 하며, 계산 효율성과 진단 정확도 사이의 최적의 균형을 유지합니다.
Virchow2G: 최대 다운스트림 애플리케이션 정확도에 최적화된 대규모 Virchow-2 변형입니다.
Virchow2G-mini: 진단 성능을 최소한으로 저해하면서 높은 처리량을 위해 조정된 소형 Virchow-2 변형입니다.
Prism: 진단 분류와 바이오마커 예측 모두에서 뛰어난 디지털 병리학의 최초의 멀티모달 슬라이드 수준의 기초 모델 중 하나입니다.

카탈로그에 모델을 제공하는 것은 중요한 성과이지만, Model Context Protocol(MCP) 및 Model Agents를 사용하여 여러 모델을 연결함으로써 진정한 잠재력이 실현됩니다. 이 통합은 다양한 모델 간의 원활한 협업을 가능하게 하여 집단적 기능을 향상시키고 보다 포괄적인 통찰력을 제공합니다. MCP 및 Model Agents를 활용하면 각 모델의 기능을 극대화하여 보다 정확한 예측, 향상된 진단 및 최적화된 치료 전략을 얻을 수 있습니다. MSBuild’25부터 Azure AI Foundry에서 최근 출시된 의료 에이전트 오케스트레이터로 에이전트 여정을 시작합니다.