我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

Simple Subtitling:自動生成影視字幕工具

Simple Subtitling是什么?

Simple Subtitling 是一個能自動給影視作品生成字幕的ai工具。它用 WhisperX 技術把音頻文件變成帶時間戳和說話人 ID 的字幕文件(SRT)。然后通過說話人嵌入提取和聚類來分配說話人ID,并且在有音頻范例時可以分配確切的說話人姓名。具體來說,它先把音頻轉成文本,加上時間戳;再提取每個說話者的特征,用凝聚層次聚類(AHC)把特征分組,最后給說話人分配 ID。要是用戶提供了演員的語音樣本,它還能給說話人命名。這個工具就是為了讓字幕生成更簡單,讓影視作品更方便觀看。

simple-subtitle.webp

Simple Subtitling功能特點

  • 語音識別與時間戳生成:使用 WhisperX 技術,能夠逐字逐句精準識別音頻內容,并生成帶時間戳的語音文本。

  • 說話人識別:通過提取句子級別的說話人嵌入,并應用凝聚層次聚類(AHC)對嵌入進行分組,從而分配說話人 ID。

  • 支持多語言:支持多種語言的音頻輸入,并可生成對應的字幕。

  • 自定義設置:用戶可以指定音頻樣本目錄,為說話人分配確切名稱。

  • 高精度語音識別和聚類:實現高精度的語音識別和聚類,準確地將語音轉換為文字,并對不同說話人的語音進行分類,提高字幕的準確和可讀性。

Simple Subtitling安裝及使用方法

安裝步驟

  • 創建并激活一個名為simplesub的conda環境,指定Python版本為3.11。

  • 在該環境下安裝項目所需的Python包,通過pip install -r requirements.txt命令完成。

  • 還需要安裝ffmpeg,具體安裝方法可參考相關文檔。

使用方法

基本用法

運行python main.py --input_file [INPUT_FILE_PATH] --output_file [OUTPUT_SRT_PATH],例如python main.py --input_file data/friends.wav --output_file result/friends.srt,這將根據輸入的音頻文件生成字幕文件。

使用音頻范例指定說話人姓名

首先按照特定結構組織--exemplar_dir目錄,每個子文件夾代表一個說話人,里面包含該說話人的音頻樣本。

然后運行python main.py --input_file [INPUT_FILE_PATH] --output_file [OUTPUT_SRT_PATH] --exemplar_dir [PATH_OF_EXEMPLARS],例如python main.py --input_file data/friends.wav --output_file result/friends_exemplars.srt --exemplars exemplars。

參數說明

  • input_file:輸入音頻文件的路徑。

  • output_file:輸出字幕文件(SRT格式)的路徑。

  • whisper_model_type:Whisper模型的類型,默認為'medium',可以在相關文檔中查看可選類型。

  • language:語言代碼(兩個字母,如英語為'en'),如果為None,Whisper會在前30秒檢測語言,默認為None。

  • embedding_model:說話人嵌入提取器,可選'ecapatdnn'或'wespeaker',默認為'wespeaker'。

  • n_cluster:如果已知說話人數量,可以指定該參數,默認為None。

  • distance_threshold:如果n_cluster未指定,這是AHC(凝聚層次聚類)的距離閾值,默認為0.8。

  • exemplar_dir:包含音頻范例的目錄路徑,默認為None。

  • exemplar_threshold:用于決定“未知”說話人的余弦相似度閾值,默認為0.2。

Github:https://github.com/JaesungHuh/simple-subtitling

收藏
#字幕網
最新工具
Chessigma
Chessigma

一個免費的國際象棋分析工具,能分析你在 Chess、Liches...

Chronas
Chronas

一個將歷史與地理結合的互動平臺。你可以通過該Chronas查看不...

Hordes.io
Hordes.io

一款基于瀏覽器免費的多人在線戰略游戲,屬于 .io 類型,玩法類...

MineFun.io
MineFun.io

一款在線方塊風格游戲,有跑酷模式,玩家能跳躍、躲障礙,挑戰多種地...

Transcriptik
Transcriptik

一個免費的TikTok視頻轉錄工具,操作簡單,用戶只需粘貼視頻鏈...

8 Ball Pool
8 Ball Pool

是游戲工作室 Miniclip 開發的一款熱門在線臺球游戲,支持...

Minecraft Classic
Minecraft Classic

一個免費的,基于瀏覽器的Minecraft版本,可在帶完整鍵盤的...

稿定證件照
稿定證件照

稿定設計推出的在線證件照制作工具。可以在線換底色、改尺寸、美化人...

稿定摳圖
稿定摳圖

稿定設計推出的在線摳圖工具,能快速處理圖片背景。支持一鍵摳圖,上...

LocallyTools
LocallyTools

安全、免費、可離線使用的本地工具集合,LocallyTools把...

主站蜘蛛池模板: 离岛区| 兰州市| 长泰县| 措勤县| 三江| 化德县| 余干县| 庆城县| 密山市| 徐闻县| 廉江市| 巍山| 中宁县| 尼勒克县| 饶阳县| 安吉县| 米林县| 西吉县| 华亭县| 德昌县| 临江市| 盐边县| 青海省| 韶关市| 淳化县| 泸水县| 广灵县| 阿鲁科尔沁旗| 舟山市| 斗六市| 从化市| 翁牛特旗| 哈尔滨市| 唐山市| 屏山县| 紫阳县| 凤城市| 昆山市| 西华县| 贵定县| 江孜县|