
LiberSonora
LiberSonora簡介
LiberSonora 是一個開源的有聲書工具集,其名稱寓意“自由的聲音”。LiberSonora 工具集能夠提供多種功能,包括智能字幕提取、ai 標題生成和多語言翻譯。
LiberSonora 主要功能:
智能字幕提取:LiberSonora 可以從音頻文件中自動提取字幕,極大地簡化了有聲書的制作過程。
AI 標題生成:LiberSonora能自動為音頻內容生成適當的標題,幫助用戶更好地組織和管理他們的作品。
多語言翻譯:LiberSonora支持多種語言的翻譯功能。
GPU 加速:LiberSonora 支持 GPU 加速,處理速度更快。
多模型選擇:靈活的模型選擇,支持本地Ollama、DeepSeek和OpenAI等多種大模型。
批量處理有聲書:強大的批量處理功能,輕松處理大量有聲書。
本地音頻處理:離線處理服務器本地音頻文件,省去文件傳輸步驟。
手動檢查輸出結果:便捷的手動檢查功能,可手動命名也可讓 AI 重新生成。
LiberSonora 亮點:
開源自由:采用 MIT 許可證,真正的開源免費,音頻處理與大模型推理全程本地離線運行,自主可控,數據安全有保障。
功能創新:提供獨特的AI技術業處理音頻與文本生成能力。
便捷部署:項目容器化,開發與部署便利,支持 API,輕松集成到個人工作流。
模塊化設計:各功能模塊獨立,可單獨啟動特定服務(如音頻增強、字幕識別等)
靈活定制:支持自定義大模型,針對特定任務提升效果,配置靈活多樣,滿足不同需求
LiberSonora使用場景:
LiberSonora非常內容創作用戶、小型出版社、視頻博主、播客以及任何對制作有聲內容感興趣的群體。
如何使用?
1. 克隆項目倉庫:
首先,您需要克隆LiberSonora的GitHub倉庫到本地。打開終端或命令提示符,運行以下命令:
git clone https://github.com/LiberSonora/LiberSonora
2. 進入項目目錄:
cd LiberSonora
3. 啟動 Docker 容器:
docker-compose -f docker-compose.gpu.yml up -d
4. 查看容器運行日志:
docker-compose -f docker-compose.gpu.yml logs -f
5. 訪問界面:
打開瀏覽器,訪問 xxx.xxx.xxx.xxx:8651(將 xxx.xxx.xxx.xxx 替換為您的服務器 IP 地址),您將看到LiberSonora的Web界面。您可以通過這個界面管理有聲書文件,提取字幕,生成標題,進行多語言翻譯等。
6. 使用API:
如果您希望通過API集成LiberSonora,可以參考項目文檔中的API接口說明。您可以使用HTTP請求與LiberSonora進行交互,實現自動化處理。
7. 處理音頻文件:
將您的有聲書音頻文件放入指定的目錄,LiberSonora會自動處理這些文件,生成字幕和標題,并支持多語言翻譯。
GitHub:https://github.com/LiberSonora/LiberSonora
與LiberSonora相關工具
- 用戶登錄