Gemini 2.5 Pro與Gemini 2.5相比較,有哪些提升?
Gemini 2.5 Pro是谷歌最新發布的ai模型,相比Gemini 2.5,Gemini 2.5 Pro在推理、編碼、多模態支持和上下文處理等方面都優于Gemini 2.5,是谷歌目前最智能的AI模型。
推理能力
Gemini 2.5 Pro:推理能力大幅提升,在零工具推理任務中得分為18.8%,是GPT-4.5(6.4%)的三倍。它在“人類最后的考試”中也取得了18.8%的準確率。
Gemini 2.5:雖然也具備推理能力,但在復雜推理任務中的表現不如2.5 Pro。
編碼能力
Gemini 2.5 Pro:在編碼方面表現出色,能夠快速生成復雜的代碼。例如,它可以在一分鐘內生成一個簡單的無限跑酷游戲。在SWE-Bench Verified測試中,它獲得了63.8%的高分。
Gemini 2.5:編碼能力較弱,無法像2.5 Pro那樣快速生成復雜的代碼應用。
多模態支持
Gemini 2.5 Pro:支持文本、音頻、圖像、視頻和代碼庫等多種輸入形式。它在視覺推理和圖像理解方面表現出色,視覺推理得分為81.7%,圖像理解得分為69.4%。
Gemini 2.5:雖然也支持多模態輸入,但在處理復雜多模態任務時不如2.5 Pro。
上下文窗口
Gemini 2.5 Pro:支持100萬個token的上下文窗口,未來將擴展到200萬個token。在長上下文評測中,其得分遠超競爭對手。
Gemini 2.5:上下文窗口較小,處理長文檔和復雜對話的能力不如2.5 Pro。
性能表現
Gemini 2.5 Pro:在多個基準測試中名列前茅,例如在GPQA和AIME 2025測試中表現卓越。它在LMArena排行榜上位居第一。
Gemini 2.5:性能不如2.5 Pro,在復雜任務處理和多模態理解方面表現較弱。
Gemini 2.5 Pro 實驗版本現已在 Gemini 應用程序中為 Gemini Advanced 用戶提供:http://gemini.google.com/app