YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔
讀者推薦的最新「影片自動上字幕」軟體,更加厲害:「pyTranscriber 影片自動上字幕免費軟體!10分鐘搞定1小時影片」。
「 Google 文件」中內建的「語音轉文字」功能,我自己常常在寫稿、採訪、開會時利用。雖然他沒辦法像是「訊飛輸入法」那樣自動加上標點符號,也不會像是「雅婷逐字稿」那樣自動分段。但是 Google 文件在網路順暢的情況下,語音辨識的速度與成功率是非常高的。
不過,我也常常收到讀者的提問:「 Google 文件的語音輸入工具,在人對著電腦麥克風講話時的辨識率很高。但是如果想要播放 YouTube 影片、錄音檔案,讓 Google 文件轉成文字檔,卻很奇怪,有些電腦可以,有些電腦卻沒辦法(在同一個影片、錄音檔的情況下)。」
這樣一來,確實有點麻煩。
首先,檢查影片、錄音檔案本身品質:
想要將 YouTube 影片,或是硬碟中的影片檔案、錄音檔案,轉成文字檔。同時想要透過免費又高準確度的 Google 文件、 Google 翻譯來語音轉文字。但卻遇到下面這個「可能」問題:
- 在同一台電腦、同一個瀏覽器中,可以一個分頁播放影片,一個分頁用 Google 文件轉成文字嗎?為什麼有的裝置可以,有的裝置不行?
- 如果使用兩台電腦,一台播影片或錄音檔案,一台用 Google 文件轉文字,但可能同個影片,卻有些電腦可以?有些時候不行?
首先,影片、錄音檔案本身的「品質」有沒有辦法語音辨識?是我會檢查的第一個要點。
影片、錄音檔案本身「人聲」要乾淨清楚,如果發音本身就不清楚、口音太重,或有很多環境音(即使是細細碎碎的雜音),或是演講場地空氣回聲沒有過濾。這些情況下,要用 Google 文件語音轉文字都很難成功。
在影片、錄音檔案本身有品質的情況下,下面「三個方法」,可以試試看。
或是可以看看下面這段影片,介紹三種 Google 語音轉文字相關工具的應用案例。方法一:同台電腦、同個瀏覽器,影片直接轉文字檔
我會先嘗試第一個方法。
如果驅動程式與硬體支援,那麼同一台筆電,同一個瀏覽器,打開 YouTube 、錄音檔,又另外打開 Google 文件,也可以直接同時語音轉文字。
在電腦中播放著影片、錄音檔語音的情況下,開啟一份新的「 Google 文件」,開啟上方[工具]中的[語音輸入],按下麥克風按鈕。
- 確認是使用 Google Chrome 瀏覽器。
- 確認電腦、筆電有麥克風。
那麼這時候就可以直接語音轉文字。
下圖一整篇快 4000 字的文字稿,就是我這樣從 YouTube 影片轉換過來的。
除了 Google 文件,「 Google 翻譯」的電腦網頁版也是好用的語音轉文字工具,用翻譯功能,開啟語音翻譯,就能一次輸入[5000字]的語音轉文字內容。
你甚至可以用這個方法,把外語影片轉成文字檔的同時,順便翻譯!
(附註, Google 翻譯還可以這樣利用:Google 翻譯 App 升級即時鏡頭翻譯,但 Google 智慧鏡頭明顯效果更好)
以下是我用第一個方法的測試影片,可以簡單看看其效果(語音轉文字時聲音開得比較大,請注意音量)。
方法二:免裝軟體,開啟電腦喇叭的立體聲混音設定
但是,在不同的硬體裝置下,第一個方法有時候沒辦法成功。
這時候我會試試看第二個方法,直接去調整電腦喇叭的音效設定。
點擊 Windows 右下方的系統列,在[喇叭]上點擊右鍵,選擇[音效]。
打開[聲音]的控制面板,切換到[錄製]分頁。
先在清單空白處點擊右鍵,選擇[顯示已停用的裝置]。
在已停用的錄音裝置中,找找看是否有[ Stereo Mix (立體聲混音)]這個項目,在該項目上點擊右鍵,選擇[啟用],並進一步點擊[設定成預設裝置]。
就這樣設定即可。
回到電腦,播放影片、錄音,然後打開 Google 文件、翻譯的語音輸入工具,應該就可以進行語音轉文字了。
方法二要注意的就是,語音轉文字完成後,要回到[音效]設定,把錄製裝置改回系統預設的裝置,要不然其他原本可用的麥克風、語音輸入功能,會變得無法使用喔!
方法三:安裝 Virtual Audio Cable ,無聲情況下語音轉文字
如果方法二還是不行,那就來試試看方法三。
方法三需要安裝一個「 Virtual Audio Cable (虛擬音源線)」軟體。不過會帶來一個額外的好處:
- 可以無聲轉錄,這個方法是透過虛擬音源線,直接把影片訊號,傳送到虛擬錄音裝置,過程中「不會發出聲音」:
- 在安靜環境不會吵到別人,因為喇叭不出聲
- 在吵雜環境也可以轉錄,因為不會收錄外界聲音
- 在旁邊講話也沒關係,同上理由
你可以到下面網站安裝「 Virtual Audio Cable (虛擬音源線)」,直接安裝即可開始使用,基本需求時,不需要複雜設定。
不過「 Virtual Audio Cable (虛擬音源線)」不是完全免費的軟體,所以當使用超過一個小時時,會出現[試用版]這樣的語音干擾。
「 Virtual Audio Cable (虛擬音源線)」安裝完成後,同樣右鍵點擊 Windows 右下方系統列的喇叭,選擇[開啟音效設定]。
然後把輸出裝置、輸入裝置,兩個裝置都設定成[ Line 1 ]這條虛擬音源線即可。
這樣一來,同樣的流程,先播放 YouTube 影片、錄音檔,不過這時候因為聲音走 Line 1 這條虛擬音源線,你會發現喇叭沒有發出聲音,這是正常的。
接著來到 Google 文件、翻譯,開啟語音輸入,會發現語音開始轉成文字輸入進來。
這個方法的好處就是「無聲」,所以不會受到外界其他聲音干擾,也不會發出聲音干擾外界。無論是在咖啡館、辦公室、家裡,都可以「安靜地」完成語音轉文字。
當然,要把影片、錄音檔案的語音轉成文字,還有其他方法:
- 用手機播放影片、錄音檔案,打開電腦的 Google 文件進行語音辨識。(不過這個方法更加要求影片、錄音的人聲品質要非常清晰)
- 從電腦播放聲音,從手機的訊飛輸入法轉成文字
- 等等
如果你還有什麼好辦法,也歡迎一起留言討論。
有興趣的朋友,還可參考[用手機就能把中文廣播、錄音檔轉文字:在 Evernote 做逐字稿]、[用聽書養成效率加倍的閱讀習慣:聽說讀寫合一的讀書筆記法]、[10 個免費語音轉文字工具,支援中文提升多種文書工作效率]等文章。
(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:YouTube 影片、錄音檔語音自動轉 Google 文件、翻譯文字檔)
請問MACBOOK可以使用嗎?
回覆刪除第一個方法一定可以
刪除但是第二、第三個方法就要另外研究 Mac 上如何設定了
來毛遂自薦一下:
回覆刪除https://blog.pulipuli.info/2019/01/web-speech-to-text-speech-recognition.html
我自己做的,可以載入錄音檔、影片檔、YouTube網址
然後自動產生有時間戳記、分段的字幕檔
操作起來像是這樣子
http://4.bp.blogspot.com/-0qcbQLRg3vI/XeIHJ26g70I/AAAAAAAEbiQ/U0M1fzExEhkpVdYvOBi3RZBunCLC3s3QgCK4BGAYYCw/s1600/anime.gif
感謝分享,其實我確實也正在測試您的這個工具喔
刪除您好, 想請教一下,
回覆刪除我使用了方案三, 可以成功的進行錄音轉換成文字, 但是GOOGLE文件必須要一直在打開的狀態, 不能跳至其他分頁, 也不能使用其他軟體,
請問這樣是否正常?
是否有其他方法可以背景作業, 在轉換文字時可以同時進行其他工作?
感謝分享!
一樣有這個問題,目前發現在 GOOGLE 翻譯使用可以背景轉逐字稿,或許您可以改使用 Google 翻譯進行逐字稿
刪除