豆包剛上線的深度思考與DeepSeek相比較,哪個更好?
當別家都已經推出了深度思考推理模型,字節卻一直沒有任何消息。實際上,字節一直在內部進行測試,已經進行了相當長時間的灰度測試,并且一直保持著低調的態度。
然而,今天總算有了新的進展,豆包的“深度思考”模式終于正式上線了,我們將它和DeepSeek比較一下,有什么不同,哪個更好。
搜索與思考的結合方式
DeepSeek:將深度思考和搜索分開處理,用戶需要自己選擇是否打開思考和聯網。例如,當用戶提出問題時,DeepSeek會先聯網查詢所有相關內容,然后再根據這些內容和問題給出回答。
豆包深度思考:將思考和搜索融合在一起,先思考再搜索,且在搜索過程中會不斷思考和調整搜索方向。例如,對于“《鵲刀門傳奇2》演員在《鄉村愛情》中的角色”這一問題,豆包會先將問題拆分為多個步驟,逐步思考和搜索,而不是一次性搜索所有內容。
問題處理邏輯
DeepSeek:在處理復雜問題時,可能會直接搜索大量信息后給出答案,但這種做法可能導致答案不夠準確,尤其是在涉及多個關聯信息時。
豆包深度思考:采用類似Agent的邏輯,先對問題進行規劃和思考,明確需要解決的子問題,然后分步驟進行搜索和驗證。例如,在回答關于《哈利·波特》系列電影的關鍵細節問題時,豆包會分多輪搜索,逐步完善答案。
搜索過程與質量
DeepSeek:搜索過程較為單一,可能在復雜問題上出現信息不完整或不準確的情況。例如,在回答《鵲刀門傳奇2》演員問題時,DeepSeek給出的答案中主角信息缺失較多。
豆包深度思考:通過多輪搜索和思考,逐步完善答案,最終結果的質量和準確性相對較高。在測試中,豆包的回答正確率能達到80%左右,且在一些復雜問題上表現更好。
性能與成本
DeepSeek:未明確提及性能和成本,但從其搜索方式來看,可能在處理復雜問題時效率較低。
豆包深度思考:具有較高的性價比,速度快,且免費無限使用。大多數問題在20多秒內就能給出回答,最長不超過50秒。相比之下,Openai的DeepResearch雖然輸出質量高,但消耗時間長且成本高。
用戶體驗
DeepSeek:用戶需要手動選擇是否聯網和思考,操作相對復雜。
豆包深度思考:用戶只需提出問題,豆包會自動進行思考和搜索,操作更簡單,且結果更符合用戶預期。
總的來講,豆包的深度思考功能通過結合推理和搜索,提供了更為深入和準確的答案,而DeepSeek則更側重于搜索和用戶自主選擇,還有就是感覺豆包的速度更快。