LettuceDetect:RAG系統幻覺檢測工具,速度快、成本低、精確定位。
LettuceDetect是什么?
LettuceDetect 是一個用于檢索增強生成(RAG)系統的幻覺檢測工具,它通過比較答案與上下文,識別答案中未被支持的部分,從而檢測幻覺內容。
LettuceDetect核心特點
解決現有方法的局限性:LettuceDetect 解決了傳統編碼器方法的上下文窗口限制和基于大型語言模型(LLM)方法的計算效率低下的問題。
基于 ModernBERT:該工具利用 ModernBERT 的擴展上下文處理能力(支持最多 8192 個 token),能夠處理長文本。
高精度與高效性:它在 RAGTruth 數據集上表現出色,示例級別檢測的 F1 分數達到 79.22%,比之前的最優模型 Luna 提高了 14.8%。同時,它在單個 GPU 上每秒可處理 30 到 60 個樣本。
Token 級別檢測:LettuceDetect 是一個基于 Token 分類的模型,它將上下文、問題和答案作為輸入,逐個判斷答案中的 Token 是否由上下文支持。
優化推理性能:采用更小的模型尺寸,實現更快的推理速度。
長上下文處理:該工具利用 ModernBERT 的擴展上下文處理能力(支持最多 8192 個 Token),能夠處理長文本,從而更準確地判斷答案是否受上下文支持。
技術實現
訓練和評估:LettuceDetect 在 RAGTruth 數據集上進行訓練和評估,利用 ModernBERT 進行長上下文處理。
模型和代碼許可:提供 MIT 許可,模型和代碼可以自由使用,并已集成到 Hugging Face 中,可以通過一行代碼加載模型。
LettuceDetect 的應用場景:
金融領域:檢測金融咨詢、財務分析中的錯誤信息,防止誤導用戶。
法律領域:保證法律咨詢、合同解讀準確,降低法律風險。
醫療健康:輔助醫療咨詢和診斷,避免因幻覺誤診。
客戶服務:提高企業客服機器人回答準確性,增強用戶信任。
教育領域:確保智能輔導和在線學習內容可靠。
企業知識管理:保障內部知識管理系統輸出信息準確。
高風險行業:結合多種檢測方法,提升系統輸出可信度。
GitHub 倉庫:https://github.com/KRLabsOrg/LettuceDetect