cpdown:將網頁內容復制為Markdown格式文本
cpdown 是一款實用的瀏覽器插件,主要功能是幫助用戶將網頁內容復制為純凈的 Markdown 格式,解決了傳統復制方式中 HTML 標簽混亂的問題。它不僅能夠一鍵復制網頁內容,還能提取 YouTube 視頻字幕,并自動過濾網頁廣告和無用元素,同時顯示內容的 token 數量,方便對接大語言模型(LLM)。此外,它還支持鍵盤快捷鍵操作,極大地提升了工作效率。
功能特點
一鍵復制網頁內容:通過點擊瀏覽器工具欄的 cpdown 圖標或使用鍵盤快捷鍵,用戶可以快速將網頁內容復制為 Markdown 格式。
提取 YouTube 視頻字幕:在觀看 YouTube 視頻時,用戶可以輕松地將視頻字幕以 Markdown 格式復制。
自動過濾網頁廣告和無用元素:自動移除網頁中的腳本、樣式、iframe 等不必要的 HTML 元素,確保復制的內容干凈整潔。
顯示內容的 token 數量:顯示復制內容的 token 數量,這對于需要與大語言模型(LLM)對接的用戶來說非常實用。
支持鍵盤快捷鍵操作:用戶可以通過自定義的鍵盤快捷鍵快速復制內容。
應用場景
內容創作者(如博客作者、文章寫手):可以快速將在線內容轉換為 Markdown 格式,便于在編輯器中進行排版和編輯。
學術研究者:在閱讀在線論文時,能夠輕松復制關鍵信息到 Markdown 文檔中,方便整理和引用。
知識分享者:在社交媒體、論壇等平臺上分享內容時,可以將網頁內容快速格式化為 Markdown,使分享的內容更加清晰和專業。
技術棧
Cursor:優化開發者的開發體驗。
WXT (Web Extension Toolkit):作為構建瀏覽器擴展的基礎框架。
React:用于構建用戶界面的 JavaScript 庫。
Shadcn UI:提供用戶界面組件。
Sonner:實現 toast 通知功能。
Tailwind CSS:實用的 CSS 框架,用于樣式設計。
Defuddle 和 Mozilla Readability:用于提取網頁主體內容并清理 HTML 代碼。
Turndown:將 HTML 轉換為 Markdown。
tiktoken:計算復制內容的 token 數量。
項目特點
一鍵復制:通過工具欄圖標或快捷鍵快速復制網頁內容。
內容提取:利用 Defuddle 或 Mozilla Readability 算法提取主體內容,剔除冗余 HTML 元素。
自定義配置:支持用戶根據需求調整設置,如選擇提取算法、開關成功提示、開啟慶祝動畫等。
跨平臺兼容:同時支持 Chrome 和 Firefox 瀏覽器。
使用方法
打開您想要復制的網站。
點擊瀏覽器工具欄中的 cpdown 圖標,或使用鍵盤快捷鍵。
頁面內容將被復制為 Markdown 格式到剪貼板。
將 Markdown 內容粘貼到您需要的任何地方。
開源項目鏈接
GitHub 倉庫地址:https://github.com/ysm-dev/cpdown