ArXiv Paper Summarizer:基于Python的arXiv論文摘要工具
ArXiv Paper Summarizer是什么?
ArXiv Paper Summarizer是一個基于 Python 的 arXiv 論文摘要ai工具,利用免費的 Gemini API 實現論文內容提取與總結,支持單 / 批量 URL 處理、關鍵詞檢索及每日自動摘要功能,適合科研人員快速獲取文獻關鍵信息。
ArXiv Paper Summarizer核心功能
單篇論文摘要:輸入 ArXiv 論文 URL(需為摘要頁而非 PDF 鏈接),生成內容總結。
批量 URL 摘要:將多個 URL 存入links.txt,一次性處理并保存結果到result.txt。
關鍵詞檢索與批量摘要:通過keywords_summarizer.py指定關鍵詞(如 “transformer, sparsity”)和日期范圍(如 2017-2024),自動檢索相關論文并生成摘要。
每日自動摘要(通過 Google Apps Script):配置關鍵詞和 Google Doc,每日定時檢索新論文,將標題、鏈接和摘要自動更新到文檔中。支持自定義執行時間(如午夜)和郵件通知。
ArXiv Paper Summarizer應用場景
快速獲取研究進展:研究人員和學生可以快速了解特定領域的最新研究進展。
研究趨勢跟蹤:通過關鍵詞批量摘要功能,可以跟蹤新的研究趨勢。
文獻綜述輔助:幫助研究人員在撰寫文獻綜述時快速獲取相關論文的核心內容。
ArXiv Paper Summarizer安裝與配置
1. 環境要求
Python 3.11
Conda(環境管理)
Gemini API 密鑰(需從 Google 獲取)
2. 步驟
# 克隆倉庫 git clone https://github.com/Shaier/arxiv_summarizer.git cd arxiv_summarizer # 創建并激活Conda環境 conda create -n arxiv_summarizer python=3.11 conda activate arxiv_summarizer # 安裝依賴 pip install -r requirements.txt
3. 配置 API 密鑰
打開url_summarize.py,替換第 5 行的YOUR_GEMINI_API_KEY為實際密鑰。
自動摘要功能需在daily_arxiv.txt腳本中同時配置docId(Google Doc ID)和apiKey。
使用示例
單篇摘要
python url_summarize.py > 輸入1(單篇) > 輸入URL:https://arxiv.org/abs/2410.08003
批量 URL 摘要
在links.txt中每行添加一個 URL
運行:
python url_summarize.py > 輸入2(批量)
關鍵詞檢索
python keywords_summarizer.py > 輸入關鍵詞:"machine learning, computer vision" > 輸入開始日期:2023-01-01 > 輸入結束日期:2023-12-31
自動每日摘要設置
創建 Google Doc
新建文檔,復制 URL 中的文檔 ID(如123HEM4h5aQwygDk_A-xNaJ8CUoyMZTFsChyMk)。
配置 Google Apps Script
訪問Google Apps Script,新建項目。
將daily_arxiv.txt內容粘貼到編輯器,替換docId、apiKey和keywords數組。
測試與調度
手動運行腳本測試,確認 Google Doc 更新。
在 “觸發器” 中設置每日定時執行(如選擇 “每天午夜”)。
Github:https://github.com/Shaier/arxiv_summarizer