跳至主要內容

Design with Code

簡單記錄使用 open ai whisper 辨識影片產生字幕

Open ai 推出的 whisper 語音變識工具,不得不說現在 ai 真是越來越強大,可以變識多種語言

今天要簡單記錄變識影片產出字幕。

安裝 whisper

因本身使用 macos 就直接使用 `brew` 來安裝

brew install openai-whisper

安裝會需要花一些時間,在使用時相依套件影片轉檔工具 `ffmpeg` 有問題裡重新安裝:

brew uninstall librist --ignore-dependencies
brew uninstall mbedtls --ignore-dependencies
brew reinstall ffmpeg 

裝完後執行 `whisper -h` 看使用方法,可以得知支援語系不少

openai-whisper-help

轉譯指令

whisper --output_format srt --language English --model tiny --task transcribe video.mp4

簡單說明參數

--output_format srt # 輸出格式是 srt
--language English # 辨識英文
--model tiny # 語言模型有很多種,我單純用英文 tiny 還可以,有試著辨識中文,但至少要 small 以上,才夠準確
--task transcribe # 我只是要轉字幕所以使用 transcribe
最後一個參數 video.mp4,要辨識音檔也可以。

整體花費時間 一小時多的影片,使用 tiny 模型辨識英文,花費17分鐘

還有試著變識中文一小時多的影片,使用 small 模型,花費超過30鐘。

只使用 Macbook M1 Air 無風扇機型,勉強可以啦。

能有這樣的錯誤率少的變識真的強大!

留言