Google Gemini Deep Research 實測比較:自動蒐集資料、推理分析、撰寫報告的 AI 研究助理



如果生成式 AI 不只會針對問題直接文字接龍出答案,而是會:「先寫好一份研究計畫,接著自動根據計畫去蒐集資料,針對資料進行推理分析,最後把整理出的結果撰寫成研究報告。」甚至能夠「同時摘要數十篇參考資料,並一口氣自動完成3000字以上的文章」,那這樣是不是在人與 AI 協同合作的過程中, AI 可以幫助我們獲得品質更好、更有效的內容草稿呢?這就是這篇文章想要測試的 Google Gemini Deep Research 目前可以做到的事情。

我最近寫了一篇文章:「如何用 AI 工具提升工作效率?三個關鍵步驟讓生成結果更精準有效」,其實就是在分享我自己的 AI 協作流程中,我會把工作分成三階段:讓 AI 蒐集資料、讓 AI 分析資料並做推理,最後才能 AI 輸出成果。雖然要「自己手動」分成三個階段,但因為是 AI 協作,也不會多花太多時間,而這樣確實大多數時候生成的結果是更正確、更深入、更有用的。

不過,如果 AI 可以「像個代理人」一樣,自己「自動化」的跑完上述流程呢?我們只要丟出一個題目, AI 就會分析自己需要找哪些資料?接著自動研究分析這些資料,然後推理出有效的論述結構,最後根據資料與架構撰寫出完整報告,而這一切步驟, AI 會像是一個「研究助理」一樣自己自動跑完所有流程。

上述不是想像,而是最近 Google 推出的「 Gemini 1.5 Pro Deep Research 」 AI 模型,就可以實現這個自動化研究助理的功能,並且已經可以使用(需要擁有 Google Gemini Advanced 付費帳戶)。

所以這篇文章,來幫大家測試看看這樣的 AI 研究助理,可以做到什麼程度的成果。並且我會實際比較幾種不同的 AI 模型,來看看他們生成的效果如何。

先來看「 Gemini 1.5 Pro Deep Research 」與幾種 AI 模型可以到哪裡使用(有些免費即可使用),再來看看他們生成的成果實測比較。

如果想直接看看 AI 生成的完整內容成果的朋友,歡迎看看我分享的線上文件,我把每一個 AI 模型測是生成的結果都放在上面,並作了註解:





Google Gemini Deep Research、ChatGPT GPT o1、 Gemini 2.0 flah thinking AI 推理模型如何使用:


目前具備全自動化 AI 助理功能的「 Gemini 1.5 Pro Deep Research 」,可以在 Gemini Advanced 網頁版中選取。




Google Gemini 的「 Deep Research 」是一個一般人也能使用的自動化 AI 代理人( agent )工具。就像文章一開始所說,他會自動完成下列步驟:

  • AI 先寫好一份研究計畫,徵詢我(使用者)的同意。
  • 接著自動根據計畫去蒐集資料。
  • 自動針對資料進行推理分析。
  • 最後自動把整理出的結果撰寫成研究報告。

而且 Deep Research 整合了 AI模型的進階理解能力(類似 GPT-o1:ChatGPT o1 會思考的 AI 新舊版實測比較表格:翻譯、摘要、企劃、文案與寫程式 ),以及具備 100萬字詞(token)的長脈絡分析(所以可以同時搜尋數十篇資料後進行分析)。



例如下面圖片所展示的,我只需要詢問整合 Deep Research 功能的 Gemini 一個「簡單的研究主題」,而 Gemini Deep Research 會先透過自我推理提供一個多步驟的研究計劃,這時候我可以透過「對話討論」來修改這份研究計畫。

從下圖來看,其實 Gemini Deep Research 提出的第一份研究計畫就已經頗為全面完整。




下圖是我按下「編輯計畫」後,透過簡單對話,請 Deep Research 修改研究計畫,調整上很方便。

確認計畫後,我只要按下「開始研究」按鈕,就能請 Gemini Deep Research 根據計畫展開自動化的研究報告撰寫流程。





首先,你會看到 Gemini Deep Research 會先根據計畫,大量上網搜尋相關資料,在下圖例子中他找到了 47 篇網頁文章(而這個 AI 模型有足夠的記憶容量可以處理這些大量資料)。

接著, AI 會自動繼續分析,他會閱讀這些資料,進一步推理分析,統整出資料的架構,然後開始撰寫報告,這會需要 2~3 分鐘以上的處理時間。




直到完成後, AI 會根據其主要發現生成一份報告,報告成果可直接匯出到 Google Docs。

唯一的缺點是目前 Gemini Deep Research 可以搜尋中文資料、可以分析中文主題,但生成報告時似乎會變成日文輸出,但問題不大,只要請他改成台灣慣用的繁體中文版本即可。

「  Gemini Deep Research 」是真正的 AI 自動化研究助理,這篇文章比較的幾種模型,目前(2024/12/20)只有 Gemini Deep Research 可以自動化完成所有工作步驟。




但是為了比較,我也找出兩種具體「自我推理思考能力」的 AI 模型(但還不能像前述那樣自動做研究計畫、自動搜尋大量資料、自動做資料分析整理),看看他們生成的結果和  Gemini Deep Research 有哪些差別。

其中一個也是最近推出的「 Gemini 2.0 flah thinking 實驗版」,我們可以在「免費註冊」的 Google AI Studio 中。切換到這個推理模型來使用,有免費額度可用。

這是免費帳號下,目前最能直接使用的 AI 推理思考模型,而且效果也非常好。




另外一個是已經推出一段時間的「 ChatGPT GPT-o1 」,具備自我推理思考能力的 AI 模型,不過目前只有 ChatGPT 付費版用戶才能使用。

下面,就來看看這幾個 AI 模型實際的成果比較,是否真的比較厲害?





「 Gemini 1.5 Pro Deep Research 」與幾種 AI 推理模型的成果比較:


下面的測試,我挑選了兩種不同主題:「電影影評」、「方法論教學」,測試看看目前幾種具備自我推理能力的 AI 模型,可以做到什麼樣的成果。

先來看我初步的心得總結,先說簡單版:

  • 更會找資料寫報告(或者說,目前只有這個 AI 具備自己找資料、推理、寫報告的自動化研究流程
    • Gemini 1.5 Pro Deep Research
  • 更會詮釋與論述(下面兩個模型基本上不是自動化,不會上網找資料,但會根據問題推理與思考)
    • ChatGPT GPT o1
    • Gemini 2.0 flah thinking

完整的心得總結如下:

  • Gemini 1.5 Pro Deep Research透過自動化工作流程,自動完成寫好研究計畫、上網大量搜尋資料,並進行推理分析,在豐富的參考內容下,生成出用語更貼近資料語言,更像一篇用心整理資料後的綜合報告。
    • 語言有足夠邏輯,理解有足夠深度,會做統整分析。
    • 可做結構化的資料整理與輸出。
    • 有明確的引用來源,更像是寫研究報告。
  • ChatGPT GPT o1語言更專業、深入,更像是有觀點的論述。但因為這個推理模型目前還無法上網搜尋資料,所以雖然文字論述內容已經有邏輯、夠深入,但有一些基本資料的錯誤。
  • Gemini 2.0 flah thinking 實驗版速度很快,語言專業、深入,更像是有觀點的論述。但因為這個推理模型目前還無法上網搜尋資料,所以雖然文字論述內容已經有邏輯、夠深入,但有一些基本資料的錯誤。

我把三種 AI 模型生成的成果,放在下面這份 Google 文件中,大家可以參考與比較看看,文件當中我用「註記」來說明我看到的不同點。我也快速說明一下幾個我測試出來的重點。

實測成果比較文件,根據不同的主題與 AI 模型,用 Google 文件的分頁呈現各自結果,全部都是由 AI 生成,我沒有做任何改動:


先來看看「 Gemini 1.5 Pro Deep Research 」一些處理的很棒的地方,首先,經過前面說的設計研究計畫、搜尋資料、推理分析,彙整出研究報告,最後他寫出了一篇接近 3000 字的影評,而且粗看下來論述的架構與豐富度都已經達到水準以上。




雖然免不了有一些錯誤(人寫文章也同樣會出錯),但錯誤極少,而在細節的豐富性上非常完整全面。

只是「 Gemini 1.5 Pro Deep Research 」目前真的比較像是「研究助理」,也就是他更像是非常認真做各種資料的整理、摘要與「綜合報告」的角色,而非做深入延伸論述的學者。

但光是這一點就可能已經非常好用。




就像「 Gemini 1.5 Pro Deep Research 」在撰寫時,每一段、每一句都會有引用來源,文章後面甚至附上完整的參考資料連結。




相較之下,ChatGPT GPT o1 和 Gemini 2.0 flah thinking 實驗版因為不具備上網搜尋資料的能力,所以資料正確性與細節豐富度會差一點。

可是這兩個模型更強調推理思考能力,呈現在成果上,就是 ChatGPT GPT o1 和 Gemini 2.0 flah thinking 實驗版撰寫出來的「文字論述、詮釋能力」似乎更好,或者說在用語上更有專業影評的感覺。




而如果使用不具備自我推理思考能力,也不能自動做研究計畫與大量搜尋摘要的一般 AI 模型呢?例如 ChatGPT GPT-4、 Claude 3.5 sonnet,這時候,很明顯的一般 AI 模型沒辦法展出細節豐富、論述有層次、內容長度足夠的報告文章。

下圖是 GPT-4 生成的版本,很明顯地和前面幾個模型有很大落差。




想比較完整內容成果的朋友,歡迎看看我分享的文件:

這樣看起來,無論是具備自動研究、搜索、分析、推理與撰寫的「 Gemini 1.5 Pro Deep Research 」,還是具備自我推理思考能力的 ChatGPT GPT o1 和 Gemini 2.0 flah thinking,生成的成果都達到了更好的層次,值得有需要的朋友好好利用。


有興趣的朋友可以進一步研究:




大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:


我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:Google Gemini Deep Research 實測比較:自動蒐集資料、推理分析、撰寫報告的 AI 研究助理

留言

這個網誌中的熱門文章

Google Maps 我的地圖完全教學!規劃自助旅行攻略

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

Slack 完整教學與上手心得:找到正確的團隊溝通之道

少記筆記,減少整理,高效輸出:6 原則打造任務驅動型第二大腦

Google NotebookLM 免費中文 AI 筆記實例教學,老師、學生、創作者利器

Miro 遠距工作開視覺會議的免費強大白板,專案圖解實例教學

Google 表單自動關閉回覆教學:時間人數到達就過期

Google 表單的 10 個專業問卷調查設計秘密教學

Draw.io 中文線上製作流程圖首選!專業水準完全免費