SurfSense:一個開源AI研究代理,可作為NotebookLM和Perplexity的開源替代品
SurfSense是什么?
SurfSense 是一款開源的 ai 研究助手,它不僅具備強大的研究能力,還深度整合了個人知識庫,是 NotebookLM、Perplexity 和 Glean 等工具的有力替代品。SurfSense 的核心優勢在于其個人知識庫的深度整合,支持將包括文檔、圖片等在內的 27 種文件格式 上傳到個人知識庫,方便用戶構建自己的知識體系。此外,SurfSense 還支持語義搜索、問答、總結和分析功能,用戶可以通過自然語言與知識庫互動,獲取引用答案。
SurfSense 的另一個亮點是其強大的外部數據源連接能力。它能夠連接到多個外部平臺,如搜索引擎(Tavily、LinkUp)、Slack、Linear、Notion、YouTube 和 GitHub 等。這種連接能力使得用戶可以將日常工作流中的信息源統一整合到 SurfSense 中,進一步提升研究和知識管理的效率。
此外,SurfSense 還支持將聊天對話或研究內容轉換為播客,這為用戶提供了一種全新的知識分享和消費方式。SurfSense 的開源特性也意味著用戶可以根據自己的需求進行定制和擴展,進一步提升其功能和適用性。
SurfSense核心功能
集成個人知識庫:用戶可上傳 27 種文件格式的個人文件到專屬知識庫,通過 “知識圖譜大腦” 自動將保存內容組織成結構化知識網絡,方便用戶以自然語言查詢并快速獲取精準答案。
自然語言交互:采用自然語言對話設計,用戶能像聊天一樣與知識庫交互,它不僅基于個人知識庫,還結合外部數據源提供帶參考的全面回答。
開源和隱私保護:開源且支持本地化部署,用戶可在本地運行并與本地 LLMs 配合,其核心數據存儲基于 neo4j 圖數據庫,確保數據隱私和安全。
高級 RAG 技術:支持 150 多個 LLM 和 6000 多個嵌入模型,利用先進排序技術提升搜索相關性,采用分層索引和混合搜索技術,將語義搜索和全文搜索結合,提供最優搜索體驗。
瀏覽器擴展:其瀏覽器擴展可幫助用戶將任意網頁,包括受認證保護的網頁保存至知識庫。
SurfSense技術架構
后端:基于 FastAPI 構建,使用 PostgreSQL(帶有 pgvector 支持)、SQLAlchemy、FastAPI Users 等技術組合,能處理復雜 API 需求和快速處理大數據量。
前端:采用 Next.js、React 和 TypeScript 構建,結合 Tailwind CSS 等技術,提供流暢和個性化的 UI 體驗。擴展使用 Manifest v3 技術,能很好地整合到現代瀏覽器中。
SurfSense應用場景
學術研究:學者可跨項目建立文獻庫,快速檢索歷史筆記或相關概念。
內容創作:記者或博主能在知識庫中存儲采訪記錄和網頁快照,生成帶參考的文章草稿或播客內容。
企業知識管理:團隊通過自托管 SurfSense 創建內部知識庫,集成 Slack 討論和 Notion 文檔。
開發者工作流:程序員可保存代碼片段、API 文檔或 Stack Overflow 答案,并隨時查詢技術細節。
項目地址
官網:https://www.surfsense.net/
Github:https://github.com/MODSetter/SurfSense