Biomni:通用生物醫學AI智能體
Biomni是斯坦福大學和基因泰克等機構合作開發的生物醫學工具,能自主完成遺傳學、基因組學、微生物學、藥理學和臨床醫學等領域的復雜研究任務。它結合大語言模型推理和檢索增強規劃技術,從海量文獻中提取所需工具和數據,動態組合執行研究流程。測試顯示,該系統在多個生物醫學任務中表現突出,有望提升科研效率并推動臨床應用。
Biomni核心部分:
Biomni包括Biomni-E1(統一軟件數據環境)和Biomni-A1(基于環境的智能體)兩個部分:
Biomni-E1:整合了150個專業工具、105個軟件包和59個數據庫,所有資源都經過人工驗證。例如,它接入了PDB、OpenTarget等數據庫的網絡API,同時將部分數據下載到本地數據湖并轉為結構化格式。
Biomni-A1:采用三項關鍵技術——大語言模型驅動的工具篩選、以代碼作為通用執行接口、自適應規劃策略。它支持動態調用定制化資源、組合復雜工作流(如循環與并行操作),并能基于生物醫學知識持續優化研究計劃。
性能表現
基準測試:在人類最后考試(HLE)中,準確率達到17.3%,遠高于基礎大語言模型的6.0%;在LAB-Bench數據庫問答(DbQA)任務中,準確率達到74.4%,與人類專家水平(74.7%)相當;在序列問答(SeqQA)任務中,準確率達到81.9%,超過人類表現的78.8%。
實際任務:在變異優先級排序、藥物重定位等8類任務中,性能較基礎大語言模型提升402.3%,顯著優于同類工具。
應用案例
可穿戴設備數據分析:解析了458份傳感器數據,發現餐后平均體溫升高2.19℃的現象及個體代謝差異。
多組學研究:處理了33萬+條測序數據,驗證了已知基因調控關系,并發現了AUTS2等新轉錄因子。
實驗設計:在基因克隆任務中,生成的實驗方案準確性達到人類專家水平。在實際實驗室操作中,按照其方案成功完成克隆,測序結果與預期完全匹配。
相關鏈接
https://www.biorxiv.org/content/10.1101/2025.05.30.656746v1.full