Google Gemini Deep Research 實測比較:自動蒐集資料、推理分析、撰寫報告的 AI 研究助理
如果生成式 AI 不只會針對問題直接文字接龍出答案,而是會:「先寫好一份研究計畫,接著自動根據計畫去蒐集資料,針對資料進行推理分析,最後把整理出的結果撰寫成研究報告。」甚至能夠「同時摘要數十篇參考資料,並一口氣自動完成3000字以上的文章」,那這樣是不是在人與 AI 協同合作的過程中, AI 可以幫助我們獲得品質更好、更有效的內容草稿呢?這就是這篇文章想要測試的 Google Gemini Deep Research 目前可以做到的事情。
我最近寫了一篇文章:「如何用 AI 工具提升工作效率?三個關鍵步驟讓生成結果更精準有效」,其實就是在分享我自己的 AI 協作流程中,我會把工作分成三階段:讓 AI 蒐集資料、讓 AI 分析資料並做推理,最後才能 AI 輸出成果。雖然要「自己手動」分成三個階段,但因為是 AI 協作,也不會多花太多時間,而這樣確實大多數時候生成的結果是更正確、更深入、更有用的。
不過,如果 AI 可以「像個代理人」一樣,自己「自動化」的跑完上述流程呢?我們只要丟出一個題目, AI 就會分析自己需要找哪些資料?接著自動研究分析這些資料,然後推理出有效的論述結構,最後根據資料與架構撰寫出完整報告,而這一切步驟, AI 會像是一個「研究助理」一樣自己自動跑完所有流程。
上述不是想像,而是最近 Google 推出的「 Gemini 1.5 Pro Deep Research 」 AI 模型,就可以實現這個自動化研究助理的功能,並且已經可以使用(需要擁有 Google Gemini Advanced 付費帳戶)。
所以這篇文章,來幫大家測試看看這樣的 AI 研究助理,可以做到什麼程度的成果。並且我會實際比較幾種不同的 AI 模型,來看看他們生成的效果如何。
先來看「 Gemini 1.5 Pro Deep Research 」與幾種 AI 模型可以到哪裡使用(有些免費即可使用),再來看看他們生成的成果實測比較。
如果想直接看看 AI 生成的完整內容成果的朋友,歡迎看看我分享的線上文件,我把每一個 AI 模型測是生成的結果都放在上面,並作了註解:
Google Gemini Deep Research、ChatGPT GPT o1、 Gemini 2.0 flah thinking AI 推理模型如何使用:
目前具備全自動化 AI 助理功能的「 Gemini 1.5 Pro Deep Research 」,可以在 Gemini Advanced 網頁版中選取。
Google Gemini 的「 Deep Research 」是一個一般人也能使用的自動化 AI 代理人( agent )工具。就像文章一開始所說,他會自動完成下列步驟:
- AI 先寫好一份研究計畫,徵詢我(使用者)的同意。
- 接著自動根據計畫去蒐集資料。
- 自動針對資料進行推理分析。
- 最後自動把整理出的結果撰寫成研究報告。
而且 Deep Research 整合了 AI模型的進階理解能力(類似 GPT-o1:ChatGPT o1 會思考的 AI 新舊版實測比較表格:翻譯、摘要、企劃、文案與寫程式 ),以及具備 100萬字詞(token)的長脈絡分析(所以可以同時搜尋數十篇資料後進行分析)。
例如下面圖片所展示的,我只需要詢問整合 Deep Research 功能的 Gemini 一個「簡單的研究主題」,而 Gemini Deep Research 會先透過自我推理提供一個多步驟的研究計劃,這時候我可以透過「對話討論」來修改這份研究計畫。
從下圖來看,其實 Gemini Deep Research 提出的第一份研究計畫就已經頗為全面完整。
下圖是我按下「編輯計畫」後,透過簡單對話,請 Deep Research 修改研究計畫,調整上很方便。
確認計畫後,我只要按下「開始研究」按鈕,就能請 Gemini Deep Research 根據計畫展開自動化的研究報告撰寫流程。
首先,你會看到 Gemini Deep Research 會先根據計畫,大量上網搜尋相關資料,在下圖例子中他找到了 47 篇網頁文章(而這個 AI 模型有足夠的記憶容量可以處理這些大量資料)。
接著, AI 會自動繼續分析,他會閱讀這些資料,進一步推理分析,統整出資料的架構,然後開始撰寫報告,這會需要 2~3 分鐘以上的處理時間。
直到完成後, AI 會根據其主要發現生成一份報告,報告成果可直接匯出到 Google Docs。
唯一的缺點是目前 Gemini Deep Research 可以搜尋中文資料、可以分析中文主題,但生成報告時似乎會變成日文輸出,但問題不大,只要請他改成台灣慣用的繁體中文版本即可。
「 Gemini Deep Research 」是真正的 AI 自動化研究助理,這篇文章比較的幾種模型,目前(2024/12/20)只有 Gemini Deep Research 可以自動化完成所有工作步驟。
但是為了比較,我也找出兩種具體「自我推理思考能力」的 AI 模型(但還不能像前述那樣自動做研究計畫、自動搜尋大量資料、自動做資料分析整理),看看他們生成的結果和 Gemini Deep Research 有哪些差別。
其中一個也是最近推出的「 Gemini 2.0 flah thinking 實驗版」,我們可以在「免費註冊」的 Google AI Studio 中。切換到這個推理模型來使用,有免費額度可用。
這是免費帳號下,目前最能直接使用的 AI 推理思考模型,而且效果也非常好。
另外一個是已經推出一段時間的「 ChatGPT GPT-o1 」,具備自我推理思考能力的 AI 模型,不過目前只有 ChatGPT 付費版用戶才能使用。
下面,就來看看這幾個 AI 模型實際的成果比較,是否真的比較厲害?
「 Gemini 1.5 Pro Deep Research 」與幾種 AI 推理模型的成果比較:
下面的測試,我挑選了兩種不同主題:「電影影評」、「方法論教學」,測試看看目前幾種具備自我推理能力的 AI 模型,可以做到什麼樣的成果。
先來看我初步的心得總結,先說簡單版:
- 更會找資料寫報告(或者說,目前只有這個 AI 具備自己找資料、推理、寫報告的自動化研究流程)
- Gemini 1.5 Pro Deep Research
- 更會詮釋與論述(下面兩個模型基本上不是自動化,不會上網找資料,但會根據問題推理與思考)
- ChatGPT GPT o1
- Gemini 2.0 flah thinking
完整的心得總結如下:
- Gemini 1.5 Pro Deep Research:透過自動化工作流程,自動完成寫好研究計畫、上網大量搜尋資料,並進行推理分析,在豐富的參考內容下,生成出用語更貼近資料語言,更像一篇用心整理資料後的綜合報告。
- 語言有足夠邏輯,理解有足夠深度,會做統整分析。
- 可做結構化的資料整理與輸出。
- 有明確的引用來源,更像是寫研究報告。
- ChatGPT GPT o1:語言更專業、深入,更像是有觀點的論述。但因為這個推理模型目前還無法上網搜尋資料,所以雖然文字論述內容已經有邏輯、夠深入,但有一些基本資料的錯誤。
- Gemini 2.0 flah thinking 實驗版:速度很快,語言專業、深入,更像是有觀點的論述。但因為這個推理模型目前還無法上網搜尋資料,所以雖然文字論述內容已經有邏輯、夠深入,但有一些基本資料的錯誤。
我把三種 AI 模型生成的成果,放在下面這份 Google 文件中,大家可以參考與比較看看,文件當中我用「註記」來說明我看到的不同點。我也快速說明一下幾個我測試出來的重點。
實測成果比較文件,根據不同的主題與 AI 模型,用 Google 文件的分頁呈現各自結果,全部都是由 AI 生成,我沒有做任何改動:
先來看看「 Gemini 1.5 Pro Deep Research 」一些處理的很棒的地方,首先,經過前面說的設計研究計畫、搜尋資料、推理分析,彙整出研究報告,最後他寫出了一篇接近 3000 字的影評,而且粗看下來論述的架構與豐富度都已經達到水準以上。
雖然免不了有一些錯誤(人寫文章也同樣會出錯),但錯誤極少,而在細節的豐富性上非常完整全面。
只是「 Gemini 1.5 Pro Deep Research 」目前真的比較像是「研究助理」,也就是他更像是非常認真做各種資料的整理、摘要與「綜合報告」的角色,而非做深入延伸論述的學者。
但光是這一點就可能已經非常好用。
就像「 Gemini 1.5 Pro Deep Research 」在撰寫時,每一段、每一句都會有引用來源,文章後面甚至附上完整的參考資料連結。
相較之下,ChatGPT GPT o1 和 Gemini 2.0 flah thinking 實驗版因為不具備上網搜尋資料的能力,所以資料正確性與細節豐富度會差一點。
可是這兩個模型更強調推理思考能力,呈現在成果上,就是 ChatGPT GPT o1 和 Gemini 2.0 flah thinking 實驗版撰寫出來的「文字論述、詮釋能力」似乎更好,或者說在用語上更有專業影評的感覺。
而如果使用不具備自我推理思考能力,也不能自動做研究計畫與大量搜尋摘要的一般 AI 模型呢?例如 ChatGPT GPT-4、 Claude 3.5 sonnet,這時候,很明顯的一般 AI 模型沒辦法展出細節豐富、論述有層次、內容長度足夠的報告文章。
下圖是 GPT-4 生成的版本,很明顯地和前面幾個模型有很大落差。
想比較完整內容成果的朋友,歡迎看看我分享的文件:
這樣看起來,無論是具備自動研究、搜索、分析、推理與撰寫的「 Gemini 1.5 Pro Deep Research 」,還是具備自我推理思考能力的 ChatGPT GPT o1 和 Gemini 2.0 flah thinking,生成的成果都達到了更好的層次,值得有需要的朋友好好利用。
有興趣的朋友可以進一步研究:
- ChatGPT 關鍵提示語技巧
- 2024 更新,我實驗了一年的 AI 工作流程總整理:2024 我和 ChatGPT AI 工具如何一起工作,提示語、常用案例指南
- ChatGPT 交談分類法:ChatGPT 的 PARA 聊天室分類法:增強 AI 協作威力實戰案例分享
- AI 融入工作流程的方法:如何用 AI 工具提升工作效率?三個關鍵步驟讓生成結果更精準有效
- 一般人最好上手且有效的 ChatGPT 提問法,以生成英文練習題為例
- ChatGPT 提示語說明書:通用三層結構與 9 個技巧提高 AI 生產力
- ChatGPT 五種助理教練提示語分享:目標規劃、寫作、學習到教學
- ChatGPT 特殊功能
- ChatGPT 圖文混合提問 9 種超能力:程式、教育、學習到行銷應用
- 用 ChatGPT 開啟修改 Excel、 Google 試算表教學!分析數據生成圖表
- 利用 ChatGPT App 寫語音筆記,提升輸出效率的秘密武器
- ChatGPT o1 會思考的 AI 新舊版實測比較表格:翻譯、摘要、企劃、文案與寫程式
- ChatGPT Canvas 全新 AI 寫作、程式碼編輯工具,不再只能對話!
- ChatGPT 進階語音對話純測試心得:腦力激盪、即時口譯、冥想教練,台語也能通
- ChatGPT Search 實測:用 AI 搜尋生成即時報導、摘要文章、整理改寫內容
- ChatGPT 「專案」 AI 專屬資料庫實戰案例,和 NotebookLM 比較
- ChatGPT 與 AI 工具的第二大腦與學習應用
- AI 如何與寫筆記結合?我最常利用的 6 種提升筆記效率功能與案例
- 讓 AI 成為閱讀助手, ChatGPT 摘要、翻譯與學習筆記提示語分享
- 把 Claude AI 當作免費強大的PDF 文件、論文文獻摘要研究工具
- SciSpace 論文研究 AI 助手,中文文獻問答、摘要引用與報告改寫
- 3個 ChatGPT 輸入到輸出實驗,第二大腦筆記用 AI 煉成文章報告
- ChatGPT 與 AI 工具的工作效率應用
- 讓 ChatGPT 教你如何利用 ChatGPT ,快速問對問題解決工作痛點
- ChatGPT 幫我不懂程式碼也能寫出番茄鐘待辦清單工具,實測心得
- 用 ChatGPT 快速將會議語音逐字稿轉成完美文章表格的 5 個技巧
- Gamma 用 AI 幫你設計簡報、網頁,瞬間完成戲劇化版面內容
- AI 繪圖工具應用
- 畫張圖說得更清楚! Napkin 用 AI 幫你的簡報文章手繪視覺思考圖
- ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney
- 我如何訓練 ChatGPT 撰寫 Midjourney 提示語?AI 繪圖四個階段
- Recraft 免費 AI 繪圖工具快速生成獨特 ICON 圖示與向量插圖教學
- AI 相關生產力工具
大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:
- 2024/6 最新著作上市,歡迎支持:《高效人生工作法圖解》
- 「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。
- 時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」
- 著作:《防彈筆記法》
- 訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)
- 訂閱「電腦玩物電子報」,不定期出刊。
我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。
(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:Google Gemini Deep Research 實測比較:自動蒐集資料、推理分析、撰寫報告的 AI 研究助理)
留言
張貼留言
為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。