Buzz 用 AI 一鍵影音轉文字:免費準確的語音轉字幕、逐字稿軟體
之前在電腦玩物中介紹過一款 AI 語音轉文字的「單機軟體」:「WhisperDesktop 語音轉文字免費單機軟體,AI 影片字幕實測比較」,利用 OpenAI 的 Whisper 算法來將語音內容轉換成逐字稿,效果不錯,而且因為使用電腦本身的硬體運算,所以軟體使用上也完全免費。
今天要介紹的是另一款類似的電腦單機軟體:「 Buzz 」,它可以同時支援 Windows、 Mac、 Linux 等不同作業系統,而且介面操作更簡單,轉換效果(取決於你使用的 Whisper 模型大小)與速度(取決於你的電腦硬體)也很好。
這類語音轉文字工具,因為 OpenAI 的 Whisper 算法的加入,轉換出來的影片字幕、錄音逐字稿的效果,可以說有超大幅度的提升,在實用性上更能節省大量的手動修正時間,例如可以用在:
- 學生記錄課堂筆記
- 工作人員會議記錄
- 拍攝影片後進行訪談字幕製作
- YouTube創作者快速產生字幕等等
接下來,就簡單示範一下「 Buzz 」的操作流程,以及實際測試的效果。
2024/6/10 我常用的 AI 工具:如何用 11 款 AI 工具打造高效率工作流程,我目前最頻繁應用實例
2024/9/21 更新:Google 錄音 App 內建 AI 轉錄繁體中文語音逐字稿,可中英日切換
Buzz 操作流程
安裝完成後,一開啟「 Buzz 」,我們只會看到一個匯入影音檔案的「+」按鈕,先匯入我們要轉換文字的影片或錄音檔案。
接著會彈出一個設定畫面:
- 預設選擇 Whisper AI 模型,你也可以試試看不同的。
- 要覺得使用的運算模型大小,模型愈大,正確度愈高,但需要的電腦硬體也愈高,運算時間也會增加:
- 預設是 tiny ,但起碼要 small 以上大小,才有讓人很滿意的文字轉換效果。
- 轉換方式如果是單純的語音轉文字,就選擇 Transcribe 即可。
- 最後設定要轉換出來的檔案格式。
- 按下「 Run 」。
基本操作上非常簡單直覺。
因為是單機軟體, AI 的運算用我們自己電腦的資源,所以速度基本上取決於我們用什麼設備的電腦,最好有獨立顯示卡。
但如果是沒有獨立顯示卡的筆電可不可以?還是可以的。
例如下面我使用沒有獨立顯示卡的 Surface Pro 來測試,轉換的是一個 100 MB、 20 分鐘長度的錄音檔案(WAV)。
- 當我選擇 tiny 運算模型時,轉換時間是 5 分鐘 48 秒。
- 當我選擇 Small 運算模型時,轉換時間是 24 分鐘 21 秒。
轉換效果比較:
選擇 tiny 運算模型雖然比較快,但是和 Small 模型轉換出來的文字結果,有明顯的落差。
下圖左方是「 Small 」模型轉換出來的結果,右方是「 Tiny 」模型轉換出來的結果。
「 Small 」模型的文字正確度、流暢度明顯的優異許多,基本上已經是只需要很少修正的逐字稿了。而如果使用更大的運算模型,正確度也會繼續提高。
有興趣的朋友,也可以進一步研究:
大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:
- 「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。
- 時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」
- 目前最新著作:《防彈筆記法》
- 訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)
- 訂閱「電腦玩物電子報」,不定期出刊。
我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。
(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:Buzz 用 AI 一鍵影音轉文字:免費準確的語音轉字幕、逐字稿軟體)
請問一定要安裝在C槽 或桌面嗎? 安裝在其他地方出現錯誤碼
回覆刪除我的不会
刪除感謝分享,我臨時被要求產出逐字稿,對我來說是個褔音~ 謝謝
回覆刪除我裝了Buzz,每次要執行都閃退。暈~ 本來以為是我的檔案太大或是電腦效能比較差,但連貼youtube十分鐘內的影片網址都閃退,真的很傻眼。
回覆刪除