PaSa
PaSa簡(jiǎn)介
PaSa-Agent.ai是字節(jié)跳動(dòng)推出的一個(gè)基于強(qiáng)化學(xué)習(xí)的學(xué)術(shù)論文檢索AI智能體,能夠自動(dòng)調(diào)用搜索引擎、閱讀論文并追蹤引文網(wǎng)絡(luò),為用戶(hù)提供精準(zhǔn)的學(xué)術(shù)文獻(xiàn)檢索服務(wù)。

PaSa核心功能:
智能檢索:PaSa-Agent能夠像人類(lèi)研究者一樣,PaSa能夠根據(jù)用戶(hù)輸入的學(xué)術(shù)問(wèn)題生成多樣化的搜索關(guān)鍵詞,自動(dòng)調(diào)用搜索引擎,并執(zhí)行多次搜索,生成并執(zhí)行多樣化的搜索關(guān)鍵詞,以覆蓋更廣泛的學(xué)術(shù)文獻(xiàn)。
復(fù)雜查詢(xún)處理:專(zhuān)為處理復(fù)雜的學(xué)術(shù)查詢(xún)?cè)O(shè)計(jì),能夠理解詳細(xì)的研究需求,包括特定算法、研究方法或領(lǐng)域內(nèi)的細(xì)微差別。
引文網(wǎng)絡(luò)導(dǎo)航:不僅查找論文,還能通過(guò)PaSa追蹤相關(guān)論文的引文網(wǎng)絡(luò),幫助用戶(hù)發(fā)現(xiàn)相關(guān)文獻(xiàn)和研究背景。
支持多領(lǐng)域查詢(xún):雖然目前主要支持計(jì)算機(jī)科學(xué)領(lǐng)域的學(xué)術(shù)查詢(xún),但未來(lái)將逐步擴(kuò)展到其他學(xué)科領(lǐng)域。
閱讀和分析論文內(nèi)容:通過(guò)Crawler和Selector兩個(gè)核心組件,PaSa能夠高效地收集和篩選相關(guān)論文,確保檢索結(jié)果的精確性。
選擇相關(guān)參考文獻(xiàn):PaSa能從海量文獻(xiàn)中篩選出與用戶(hù)查詢(xún)最相關(guān)的參考文獻(xiàn),提供全面且準(zhǔn)確的搜索結(jié)果。
PaSa性能亮點(diǎn):
超越傳統(tǒng)搜索引擎:在RealScholarQuery基準(zhǔn)上,PaSa-7B模型在recall@20和recall@50指標(biāo)上分別比Google Scholar高出37.78%和39.90%,顯示了其在學(xué)術(shù)搜索領(lǐng)域的卓越性能。
與大型語(yǔ)言模型結(jié)合:盡管訓(xùn)練于合成數(shù)據(jù),PaSa的性能超越了包括Google、Google Scholar、以及支持搜索的GPT-4o在內(nèi)的多個(gè)基線(xiàn)系統(tǒng)。
PaSa技術(shù)原理:
PaSa的核心包括兩個(gè)主要的LLM智能體:Crawler和Selector。Crawler負(fù)責(zé)通過(guò)搜索引擎收集與用戶(hù)查詢(xún)相關(guān)的學(xué)術(shù)論文,而Selector則負(fù)責(zé)精讀每一篇論文,評(píng)估其是否符合用戶(hù)需求。PaSa使用強(qiáng)化學(xué)習(xí)(RL)和近端策略?xún)?yōu)化(PPO)算法進(jìn)行訓(xùn)練,通過(guò)合成數(shù)據(jù)集AutoScholarQuery和真實(shí)世界查詢(xún)基準(zhǔn)RealScholarQuery來(lái)提升搜索效率和準(zhǔn)確性。

PaSa應(yīng)用場(chǎng)景:
PaSa適用于學(xué)術(shù)研究、教育和企業(yè)研發(fā)等多個(gè)領(lǐng)域。在學(xué)術(shù)研究中,PaSa可以幫助研究人員快速定位領(lǐng)域內(nèi)的里程碑論文,避免漏檢冷門(mén)研究。在教育領(lǐng)域,學(xué)生可以使用自然語(yǔ)言描述需求,PaSa自動(dòng)推薦分級(jí)文獻(xiàn)。在企業(yè)研發(fā)中,PaSa可以實(shí)時(shí)追蹤最新技術(shù)動(dòng)態(tài):
學(xué)術(shù)研究:研究人員可以利用PaSa快速找到相關(guān)文獻(xiàn),節(jié)省時(shí)間,提高研究效率。
文獻(xiàn)綜述:在撰寫(xiě)文獻(xiàn)綜述時(shí),PaSa可以幫助研究者全面收集和分析相關(guān)文獻(xiàn)。
教育領(lǐng)域:教師和學(xué)生可以使用PaSa進(jìn)行課題研究和文獻(xiàn)查找,提升學(xué)習(xí)效果。
跨學(xué)科研究:PaSa的多領(lǐng)域支持使其適用于跨學(xué)科的研究項(xiàng)目,幫助研究者獲取不同領(lǐng)域的文獻(xiàn)。
如何使用PaSa-Agent.ai進(jìn)行學(xué)術(shù)查詢(xún)和文獻(xiàn)檢索?
在線(xiàn)使用
訪(fǎng)問(wèn)網(wǎng)站:訪(fǎng)問(wèn)PaSa-Agent.ai網(wǎng)站。
輸入查詢(xún):在搜索框中輸入您的學(xué)術(shù)問(wèn)題或研究主題。
獲取結(jié)果:系統(tǒng)會(huì)自動(dòng)調(diào)用搜索引擎,瀏覽相關(guān)論文并追蹤引文網(wǎng)絡(luò),最終提供精準(zhǔn)、全面的學(xué)術(shù)論文檢索結(jié)果。
本地部署
數(shù)據(jù)準(zhǔn)備:下載并準(zhǔn)備數(shù)據(jù)集,包括AutoScholarQuery和RealScholarQuery。
模型準(zhǔn)備:下載PaSa-7b-Crawler和PaSa-7b-Selector的模型檢查點(diǎn)。
運(yùn)行PaSa:按照提供的指南克隆GitHub倉(cāng)庫(kù),安裝依賴(lài)項(xiàng),并運(yùn)行PaSa。
PaSa-Agent.ai還具備強(qiáng)化學(xué)習(xí)優(yōu)化的能力,使用合成數(shù)據(jù)集AutoScholarQuery進(jìn)行訓(xùn)練,這個(gè)數(shù)據(jù)集包含35,000個(gè)細(xì)粒度學(xué)術(shù)查詢(xún)及其對(duì)應(yīng)的論文。此外,PaSa還開(kāi)發(fā)了RealScholarQuery基準(zhǔn),收集真實(shí)的學(xué)術(shù)查詢(xún),以評(píng)估其在更真實(shí)場(chǎng)景下的表現(xiàn)。
提交您的產(chǎn)品
Ai應(yīng)用
Ai資訊
AI生圖
AI生視頻
FastbuildAI









