我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Simple Subtitling:自動生成影視字幕工具

Simple Subtitling是什么?

Simple Subtitling 是一個能自動給影視作品生成字幕的ai工具。它用 WhisperX 技術把音頻文件變成帶時間戳和說話人 ID 的字幕文件(SRT)。然后通過說話人嵌入提取和聚類來分配說話人ID,并且在有音頻范例時可以分配確切的說話人姓名。具體來說,它先把音頻轉成文本,加上時間戳;再提取每個說話者的特征,用凝聚層次聚類(AHC)把特征分組,最后給說話人分配 ID。要是用戶提供了演員的語音樣本,它還能給說話人命名。這個工具就是為了讓字幕生成更簡單,讓影視作品更方便觀看。

simple-subtitle.webp

Simple Subtitling功能特點

  • 語音識別與時間戳生成:使用 WhisperX 技術,能夠逐字逐句精準識別音頻內容,并生成帶時間戳的語音文本。

  • 說話人識別:通過提取句子級別的說話人嵌入,并應用凝聚層次聚類(AHC)對嵌入進行分組,從而分配說話人 ID。

  • 支持多語言:支持多種語言的音頻輸入,并可生成對應的字幕。

  • 自定義設置:用戶可以指定音頻樣本目錄,為說話人分配確切名稱。

  • 高精度語音識別和聚類:實現高精度的語音識別和聚類,準確地將語音轉換為文字,并對不同說話人的語音進行分類,提高字幕的準確和可讀性。

Simple Subtitling安裝及使用方法

安裝步驟

  • 創建并激活一個名為simplesub的conda環境,指定Python版本為3.11。

  • 在該環境下安裝項目所需的Python包,通過pip install -r requirements.txt命令完成。

  • 還需要安裝ffmpeg,具體安裝方法可參考相關文檔。

使用方法

基本用法

運行python main.py --input_file [INPUT_FILE_PATH] --output_file [OUTPUT_SRT_PATH],例如python main.py --input_file data/friends.wav --output_file result/friends.srt,這將根據輸入的音頻文件生成字幕文件。

使用音頻范例指定說話人姓名

首先按照特定結構組織--exemplar_dir目錄,每個子文件夾代表一個說話人,里面包含該說話人的音頻樣本。

然后運行python main.py --input_file [INPUT_FILE_PATH] --output_file [OUTPUT_SRT_PATH] --exemplar_dir [PATH_OF_EXEMPLARS],例如python main.py --input_file data/friends.wav --output_file result/friends_exemplars.srt --exemplars exemplars。

參數說明

  • input_file:輸入音頻文件的路徑。

  • output_file:輸出字幕文件(SRT格式)的路徑。

  • whisper_model_type:Whisper模型的類型,默認為'medium',可以在相關文檔中查看可選類型。

  • language:語言代碼(兩個字母,如英語為'en'),如果為None,Whisper會在前30秒檢測語言,默認為None。

  • embedding_model:說話人嵌入提取器,可選'ecapatdnn'或'wespeaker',默認為'wespeaker'。

  • n_cluster:如果已知說話人數量,可以指定該參數,默認為None。

  • distance_threshold:如果n_cluster未指定,這是AHC(凝聚層次聚類)的距離閾值,默認為0.8。

  • exemplar_dir:包含音頻范例的目錄路徑,默認為None。

  • exemplar_threshold:用于決定“未知”說話人的余弦相似度閾值,默認為0.2。

Github:https://github.com/JaesungHuh/simple-subtitling

收藏
#字幕網
最新工具
CrowdCore
CrowdCore

一款通過AI實現精準網紅匹配、自動化外聯溝通及深度數據分析的網紅...

Medeo
Medeo

創作者的專屬AI視頻工作室。無論你有多少素材,哪怕只有一句話,他...

百雀AI外貿員
百雀AI外貿員

一款專為外貿企業量身定制的AI工具,具備24小時不間斷工作能力,...

SurveyGO卷姬
SurveyGO卷姬

清華面壁智能團隊推出的AI論文寫作工具,通過自研的 LLMxMa...

AiAssistWorks
AiAssistWorks

一個在Google Workspace Marketplace上...

Aithor
Aithor

一款AI驅動的研究,AI寫作助手,可以幫助用戶生成高質量的學術和...

CodeBuddy
CodeBuddy

騰訊云代碼助手,AI時代的智能編程伙伴,支持代碼生成、補全、診斷...

FalcoCut
FalcoCut

一款功能非常實用的多語言本地化AI視頻生成與編輯工具,支持視頻翻...

Cloud Studio
Cloud Studio

騰訊云推出的在線集成開發環境(IDE),讓開發者不用在本地安裝軟...

AI外貿員Zoe
AI外貿員Zoe

百型智能推出的國內首個專注于外貿行業的垂直智能Agent,能夠根...

主站蜘蛛池模板: 霍州市| 古田县| 龙海市| 香港| 阳江市| 宣恩县| 阿城市| 文昌市| 南阳市| 甘孜| 九台市| 昌都县| 兴城市| 泾阳县| 杂多县| 宜宾市| 庆安县| 镇雄县| 南丰县| 巫溪县| 临猗县| 贵港市| 遂宁市| 呼伦贝尔市| 乌海市| 乾安县| 偏关县| 乌审旗| 承德市| 瓦房店市| 林口县| 上饶市| 嘉峪关市| 香港 | 和平县| 庐江县| 高淳县| 通渭县| 黔西| 游戏| 绥德县|