Hyper-RAG：清華大學(xué)和西安交通大學(xué)提出的超圖驅(qū)動(dòng)的檢索增強(qiáng)生成方法

映技派于2025-04-20發(fā)布在Ai產(chǎn)品

Hyper-RAG是什么？

Hyper-RAG 是清華大學(xué)和西安交通大學(xué)提出的一種超圖驅(qū)動(dòng)的檢索增強(qiáng)生成方法，它通過(guò)超圖技術(shù)提升大型語(yǔ)言模型（LLM）在專(zhuān)業(yè)領(lǐng)域知識(shí)建模中的精準(zhǔn)度，減少模型生成內(nèi)容時(shí)的“幻覺(jué)”現(xiàn)象。實(shí)驗(yàn)表明，Hyper-RAG 在多個(gè)數(shù)據(jù)集上平均準(zhǔn)確率較傳統(tǒng)圖方法提升12.3%，且在復(fù)雜查詢下性能穩(wěn)定，適用于醫(yī)療、金融等高可靠需求領(lǐng)域。

Hyper-RAG：清華大學(xué)和西安交通大學(xué)提出的超圖驅(qū)動(dòng)的檢索增強(qiáng)生成方法.webp

Hyper-RAG核心原理

Hyper-RAG 的核心在于利用超圖來(lái)同時(shí)捕捉原始數(shù)據(jù)中的低階關(guān)聯(lián)（成對(duì)關(guān)系）和高階關(guān)聯(lián)（多實(shí)體關(guān)系）。傳統(tǒng)的基于圖的 RAG 方法（如 Graph RAG 和 Light RAG）只能表示成對(duì)關(guān)系，無(wú)法有效處理復(fù)雜的多實(shí)體關(guān)系，這會(huì)導(dǎo)致信息丟失，進(jìn)而影響 LLM 的輸出準(zhǔn)確性。而超圖能夠通過(guò)超邊表示多個(gè)實(shí)體之間的復(fù)雜關(guān)系，從而提供更全面的知識(shí)表示。

Hyper-RAG功能特征：

超圖知識(shí)表示：通過(guò)超圖結(jié)構(gòu)捕捉多實(shí)體復(fù)雜關(guān)系，減少信息丟失，實(shí)現(xiàn)更完整、準(zhǔn)確的知識(shí)表示。
檢索增強(qiáng)生成：結(jié)合超圖檢索，精準(zhǔn)提取相關(guān)知識(shí)，優(yōu)化生成回答，降低幻覺(jué)現(xiàn)象，提升回答可信度。
復(fù)雜查詢處理：能夠高效處理多實(shí)體和復(fù)雜關(guān)系的查詢，性能穩(wěn)定，適應(yīng)復(fù)雜問(wèn)題解答。
高效檢索效率：輕量級(jí)檢索速度快，兼顧準(zhǔn)確率，適合實(shí)時(shí)性要求高的場(chǎng)景。
領(lǐng)域適應(yīng)性強(qiáng)：適用于醫(yī)療、金融、法律等多領(lǐng)域，可定制化，通用性高。
減少幻覺(jué)現(xiàn)象：通過(guò)知識(shí)校準(zhǔn)，減少因模型知識(shí)不足導(dǎo)致的錯(cuò)誤生成。
可擴(kuò)展性強(qiáng)：知識(shí)庫(kù)動(dòng)態(tài)更新，可與不同規(guī)模的語(yǔ)言模型結(jié)合，適應(yīng)性強(qiáng)。

Hyper-RAG工作流程

知識(shí)庫(kù)構(gòu)建：從特定領(lǐng)域的語(yǔ)料庫(kù)中提取實(shí)體和關(guān)系，構(gòu)建超圖知識(shí)庫(kù)。
檢索增強(qiáng)：通過(guò)超圖檢索技術(shù)，從知識(shí)庫(kù)中提取與查詢相關(guān)的知識(shí)。
生成回答：將檢索到的知識(shí)與用戶的問(wèn)題一起輸入到 LLM 中，生成更準(zhǔn)確的回答。

實(shí)驗(yàn)結(jié)果

在神經(jīng)科學(xué)任務(wù)上，Hyper-RAG 的準(zhǔn)確率比直接使用 LLM 平均提升了 12.3%，并且比 Graph RAG 和 Light RAG 分別高出 6.3% 和 6.0%。
在查詢復(fù)雜性增加的情況下，Hyper-RAG 的性能保持穩(wěn)定，而其他方法的性能則會(huì)下降。
在九個(gè)不同領(lǐng)域的數(shù)據(jù)集上，Hyper-RAG 的性能比 Light RAG 提高了 35.5%。
此外，Hyper-RAG 的輕量級(jí)變體 Hyper-RAG-Lite 在檢索速度上達(dá)到 Light RAG 的兩倍，性能提升了 3.3%。

Hyper-RAG：清華大學(xué)和西安交通大學(xué)提出的超圖驅(qū)動(dòng)的檢索增強(qiáng)生成方法.webp

Hyper-RAG應(yīng)用場(chǎng)景

輔助診斷：Hyper-RAG 可以結(jié)合醫(yī)學(xué)知識(shí)庫(kù)，幫助醫(yī)生快速準(zhǔn)確地分析病歷、癥狀和檢查結(jié)果，提供診斷建議，減少誤診率。
風(fēng)險(xiǎn)評(píng)估：通過(guò)超圖結(jié)構(gòu)捕捉金融數(shù)據(jù)中的復(fù)雜關(guān)系（如企業(yè)之間的關(guān)聯(lián)、市場(chǎng)動(dòng)態(tài)等），Hyper-RAG 可以更精準(zhǔn)地評(píng)估金融風(fēng)險(xiǎn)，為投資決策提供支持。

Hyper-RAG 的優(yōu)勢(shì)在于它能處理復(fù)雜的多實(shí)體關(guān)系，并通過(guò)超圖結(jié)構(gòu)減少信息丟失，在需要精準(zhǔn)知識(shí)支持和高可靠性輸出的領(lǐng)域方面有非常廣的潛力。

論文：https://arxiv.org/abs/2504.08758

Github：https://github.com/iMoonLab/Hyper-RAG