豆包剛上線的深度思考與DeepSeek相比較,哪個(gè)更好?
當(dāng)別家都已經(jīng)推出了深度思考推理模型,字節(jié)卻一直沒(méi)有任何消息。實(shí)際上,字節(jié)一直在內(nèi)部進(jìn)行測(cè)試,已經(jīng)進(jìn)行了相當(dāng)長(zhǎng)時(shí)間的灰度測(cè)試,并且一直保持著低調(diào)的態(tài)度。
然而,今天總算有了新的進(jìn)展,豆包的“深度思考”模式終于正式上線了,我們將它和DeepSeek比較一下,有什么不同,哪個(gè)更好。
搜索與思考的結(jié)合方式
DeepSeek:將深度思考和搜索分開(kāi)處理,用戶需要自己選擇是否打開(kāi)思考和聯(lián)網(wǎng)。例如,當(dāng)用戶提出問(wèn)題時(shí),DeepSeek會(huì)先聯(lián)網(wǎng)查詢所有相關(guān)內(nèi)容,然后再根據(jù)這些內(nèi)容和問(wèn)題給出回答。
豆包深度思考:將思考和搜索融合在一起,先思考再搜索,且在搜索過(guò)程中會(huì)不斷思考和調(diào)整搜索方向。例如,對(duì)于“《鵲刀門(mén)傳奇2》演員在《鄉(xiāng)村愛(ài)情》中的角色”這一問(wèn)題,豆包會(huì)先將問(wèn)題拆分為多個(gè)步驟,逐步思考和搜索,而不是一次性搜索所有內(nèi)容。
問(wèn)題處理邏輯
DeepSeek:在處理復(fù)雜問(wèn)題時(shí),可能會(huì)直接搜索大量信息后給出答案,但這種做法可能導(dǎo)致答案不夠準(zhǔn)確,尤其是在涉及多個(gè)關(guān)聯(lián)信息時(shí)。
豆包深度思考:采用類似Agent的邏輯,先對(duì)問(wèn)題進(jìn)行規(guī)劃和思考,明確需要解決的子問(wèn)題,然后分步驟進(jìn)行搜索和驗(yàn)證。例如,在回答關(guān)于《哈利·波特》系列電影的關(guān)鍵細(xì)節(jié)問(wèn)題時(shí),豆包會(huì)分多輪搜索,逐步完善答案。
搜索過(guò)程與質(zhì)量
DeepSeek:搜索過(guò)程較為單一,可能在復(fù)雜問(wèn)題上出現(xiàn)信息不完整或不準(zhǔn)確的情況。例如,在回答《鵲刀門(mén)傳奇2》演員問(wèn)題時(shí),DeepSeek給出的答案中主角信息缺失較多。
豆包深度思考:通過(guò)多輪搜索和思考,逐步完善答案,最終結(jié)果的質(zhì)量和準(zhǔn)確性相對(duì)較高。在測(cè)試中,豆包的回答正確率能達(dá)到80%左右,且在一些復(fù)雜問(wèn)題上表現(xiàn)更好。
性能與成本
DeepSeek:未明確提及性能和成本,但從其搜索方式來(lái)看,可能在處理復(fù)雜問(wèn)題時(shí)效率較低。
豆包深度思考:具有較高的性價(jià)比,速度快,且免費(fèi)無(wú)限使用。大多數(shù)問(wèn)題在20多秒內(nèi)就能給出回答,最長(zhǎng)不超過(guò)50秒。相比之下,Openai的DeepResearch雖然輸出質(zhì)量高,但消耗時(shí)間長(zhǎng)且成本高。
用戶體驗(yàn)
DeepSeek:用戶需要手動(dòng)選擇是否聯(lián)網(wǎng)和思考,操作相對(duì)復(fù)雜。
豆包深度思考:用戶只需提出問(wèn)題,豆包會(huì)自動(dòng)進(jìn)行思考和搜索,操作更簡(jiǎn)單,且結(jié)果更符合用戶預(yù)期。
總的來(lái)講,豆包的深度思考功能通過(guò)結(jié)合推理和搜索,提供了更為深入和準(zhǔn)確的答案,而DeepSeek則更側(cè)重于搜索和用戶自主選擇,還有就是感覺(jué)豆包的速度更快。