豆包剛上線的深度思考與DeepSeek相比較,哪個更好?
當(dāng)別家都已經(jīng)推出了深度思考推理模型,字節(jié)卻一直沒有任何消息。實際上,字節(jié)一直在內(nèi)部進行測試,已經(jīng)進行了相當(dāng)長時間的灰度測試,并且一直保持著低調(diào)的態(tài)度。
然而,今天總算有了新的進展,豆包的“深度思考”模式終于正式上線了,我們將它和DeepSeek比較一下,有什么不同,哪個更好。
搜索與思考的結(jié)合方式
DeepSeek:將深度思考和搜索分開處理,用戶需要自己選擇是否打開思考和聯(lián)網(wǎng)。例如,當(dāng)用戶提出問題時,DeepSeek會先聯(lián)網(wǎng)查詢所有相關(guān)內(nèi)容,然后再根據(jù)這些內(nèi)容和問題給出回答。
豆包深度思考:將思考和搜索融合在一起,先思考再搜索,且在搜索過程中會不斷思考和調(diào)整搜索方向。例如,對于“《鵲刀門傳奇2》演員在《鄉(xiāng)村愛情》中的角色”這一問題,豆包會先將問題拆分為多個步驟,逐步思考和搜索,而不是一次性搜索所有內(nèi)容。
問題處理邏輯
DeepSeek:在處理復(fù)雜問題時,可能會直接搜索大量信息后給出答案,但這種做法可能導(dǎo)致答案不夠準(zhǔn)確,尤其是在涉及多個關(guān)聯(lián)信息時。
豆包深度思考:采用類似Agent的邏輯,先對問題進行規(guī)劃和思考,明確需要解決的子問題,然后分步驟進行搜索和驗證。例如,在回答關(guān)于《哈利·波特》系列電影的關(guān)鍵細節(jié)問題時,豆包會分多輪搜索,逐步完善答案。
搜索過程與質(zhì)量
DeepSeek:搜索過程較為單一,可能在復(fù)雜問題上出現(xiàn)信息不完整或不準(zhǔn)確的情況。例如,在回答《鵲刀門傳奇2》演員問題時,DeepSeek給出的答案中主角信息缺失較多。
豆包深度思考:通過多輪搜索和思考,逐步完善答案,最終結(jié)果的質(zhì)量和準(zhǔn)確性相對較高。在測試中,豆包的回答正確率能達到80%左右,且在一些復(fù)雜問題上表現(xiàn)更好。
性能與成本
DeepSeek:未明確提及性能和成本,但從其搜索方式來看,可能在處理復(fù)雜問題時效率較低。
豆包深度思考:具有較高的性價比,速度快,且免費無限使用。大多數(shù)問題在20多秒內(nèi)就能給出回答,最長不超過50秒。相比之下,Openai的DeepResearch雖然輸出質(zhì)量高,但消耗時間長且成本高。
用戶體驗
DeepSeek:用戶需要手動選擇是否聯(lián)網(wǎng)和思考,操作相對復(fù)雜。
豆包深度思考:用戶只需提出問題,豆包會自動進行思考和搜索,操作更簡單,且結(jié)果更符合用戶預(yù)期。
總的來講,豆包的深度思考功能通過結(jié)合推理和搜索,提供了更為深入和準(zhǔn)確的答案,而DeepSeek則更側(cè)重于搜索和用戶自主選擇,還有就是感覺豆包的速度更快。