Open ai 推出的 whisper 語音變識工具,不得不說現在 ai 真是越來越強大,可以變識多種語言
今天要簡單記錄變識影片產出字幕。
安裝 whisper
因本身使用 macos 就直接使用 `brew` 來安裝
brew install openai-whisper
安裝會需要花一些時間,在使用時相依套件影片轉檔工具 `ffmpeg` 有問題裡重新安裝:
brew uninstall librist --ignore-dependencies
brew uninstall mbedtls --ignore-dependencies
brew reinstall ffmpeg
裝完後執行 `whisper -h` 看使用方法,可以得知支援語系不少
轉譯指令
whisper --output_format srt --language English --model tiny --task transcribe video.mp4
簡單說明參數
--output_format srt # 輸出格式是 srt
--language English # 辨識英文
--model tiny # 語言模型有很多種,我單純用英文 tiny 還可以,有試著辨識中文,但至少要 small 以上,才夠準確
--task transcribe # 我只是要轉字幕所以使用 transcribe
最後一個參數 video.mp4,要辨識音檔也可以。
整體花費時間 一小時多的影片,使用 tiny 模型辨識英文,花費17分鐘
還有試著變識中文一小時多的影片,使用 small 模型,花費超過30鐘。
只使用 Macbook M1 Air 無風扇機型,勉強可以啦。
能有這樣的錯誤率少的變識真的強大!
留言