實測 ChatGPT 4o 超實用全新 AI 圖片:生成正確中文、寫實照片、資訊圖表



OpenAI 今天推出了全新的「 AI 繪圖」功能,這次的更新讓 ChatGPT 上的 AI 圖片更加實用,兩大重點是:「可以在圖片中正確生成文字,包含中文!」以及「用正確知識繪製寫實照片,重現更真實的物理場景。」以應用來說,現在你有機會讓 AI 直接畫出一張中文宣傳海報,或是設計出一張課堂上解說科學原理的知識圖表例如本文開頭圖片,就是用 4o AI 繪圖生成的)。

目前這個功能,切換到 ChatGPT 的「 4o 」模型就能使用,預計會開放給免費版用戶、Plus 與 Pro、 Teams 用戶使用,如果你還無法生成新圖片,有可能是陸續開放中。



在功能上, 4o 的全新 AI 圖片生成引擎具備了下面特色:

  • 「相對」正確在圖片中生成大量文字:GPT-4o 能把文字符號與圖像精準結合,讓圖像生成變成一種「有語言含義」的視覺工具。
  • 可以生成資訊圖表類的內容:讓 GPT-4o 能自然連結文字知識與圖像,生成更聰明、更高效的視覺內容。
  • 可以生成更像真實世界的照片:結合對真實世界的理解,以及真實人物的重現,能創造出極具說服力的寫實圖片,或依需求轉換不同視覺風格。
  • 可以針對一張圖片持續調整,保持人物不變:可以用自然語言持續調整圖片內容。例如你正在設計一位遊戲角色,可以透過與 AI 多次對話,讓角色外觀在多個版本中保持一致性,並逐步修正。
  • 可以分析並融合上傳的圖片:在 AI 繪圖時將原始圖片細節無縫整合進生成邏輯中。

這可以說是 ChatGPT 生成圖片工具很大的一次進步,以前的 DALL-E 3 (ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney),無法做到上述新版本的功能,所以在 AI 繪圖的應用上也會有侷限。

但是現在,透過 ChatGPT 4o 的 AI 繪圖功能,我嘗試了下面這些應用都頗為成功:

  • 一張老師在白板上寫滿文字(中文)的寫實照片。
  • 簡單結合文字的海報圖。
  • 結合文字設計的社群宣傳圖。
  • 科學課程的寫實、非寫實風格資訊圖表。
  • 一張擬真生物攝影照片。
  • 把藝術作品變成一張寫實攝影照片。
  • 把一本書的圖片,融合到寫實場景中。

今天這篇文章,就跟大家分享我的實測結果,除了了解 ChatGPT 4o 的 AI 繪圖有哪些新功能,更延伸具體在工作上的應用,也會在文章最後,分享實測過程當中,目前設計指令上的一些技巧



首先,只要在 ChatGPT 上方把 AI 模型切換到「 4o 」,就能開始使用新的 AI 繪圖功能(如果你的帳戶已經開放的話)。

新的 AI 生成圖片會花更多時間,常常要一分鐘以上,生成過程會有一個霧化效果,逐步展現出完整的圖片。




我先學 OpenAI 在官方網站文章中的指令,請 AI 繪製一張有人在白板前寫字的照片。

生成一張用手機拍攝的廣角照片,畫面中是一面玻璃白板,場景位於一間可以看到台北101大樓的房間內。畫面中可見一位穿著印有大型 "電腦玩物" 標誌 T 恤的台灣男性正在白板上書寫。他的筆跡自然但略顯凌亂,白板上也能看到拍照者的倒影。
白板上的文字如下:

(左側)
「防彈筆記法:
以任務為單位建立筆記。
Pros:
- 簡單易用。
- 保持任務上的精準。
- 真正有效推動工作。
- 把生活任務化。
Cons:
- 不強調傳統知識、資料整理。
- 不強調無目的的學習。(但有時這會激發創意)

(右側)
Fixes:
- 搭配卡片盒筆記法。
- 把學習改成以輸出為目的。
在白板右下角,他畫了一個圖表:
「雜亂資料-> 任務筆記 -> 完成目標」

只是我把內容改成中文,寫上大量「防彈筆記法」的介紹文字。我還把窗戶外的場景改成台北 101 ,並告訴 AI 在白板上文字要如何布局。

而下面就是 4o AI 繪圖「一次性(沒有修正)」完成的結果。

雖然如果細看,中文字上還是有很多細節錯誤,但文字的正確率與可讀性已經提升很多。照片本身也非常寫實




而且 4o 的 AI 繪圖可以針對同一張圖片,反覆追問修改,會盡量保持原始圖片中的核心內容

例如我請 AI 改一下人物穿的衣服,也簡化一下白板文字(因為文字太多時,中文字更容易出錯),這是他第二次改出來的結果。




接著我請他接續這個結果,但是拉遠場景,呈現出一些坐在教室中聽講的學生,這是他第三次改出來的結果。

在修改過程的一致性,可以讓 AI 繪圖有更多細節調整空間,但又不會改到整張圖片。




接著,我想挑戰看看用 AI 繪製一張文字+背景圖的簡單海報。

我利用下面這樣的指令,讓 4o 繪製出來下面圖片。

設計一張垂直比例的講座宣傳海報。海報背景是一張正在被大量資料如何整理而煩惱的台灣辦公室工作者,是一張精美拍攝的照片。

海報上文字如下,請務必使用繁體中文文字:
(上方標題大字):
「防彈筆記法」
主講者:電腦玩物 esor

(下方介紹文字):
打造工作上的第二大腦 告別瑣碎資料的低效工作

這時發現 ChatGPT 的 AI 繪圖雖然可以重現中文字,但偶爾會有繁體、簡體混雜的問題。

可以在指令中透過「務必使用繁體中文文字」來減少錯誤,但無法完全避免




接著我試著讓 ChatGPT 4o 根據自己的知識庫內容,結合 AI 繪圖,設計出圖文結合的「資訊圖表」

例如我要在課堂中解釋植物生長過程,我下這樣的指令:

一張寬比例資訊圖表,用小學生能快速理解的方式,請務必使用繁體中文文字,解釋植物生長的每個階段過程。

就生成了下面圖片,大方向是很好的,小字上則有一些錯誤。




如果我想改成真實照片版本,修改一下指令,描述照片中物品的細節,然後把具體要插入的文字列出:

一張寬比例資訊解說的真實照片,解釋植物生長的每個階段。畫面中依序擺放幾個盆栽,每一盆是一個植物生長階段,盆栽前面擺放小木牌,用小學生能快速理解的方式,請務必使用繁體中文文字,寫上植物生長的每個階段過程。 牌子上的文字依序為:
種子
發芽
植株
開花

於是下面也順利地生成了相對寫實的照片版本。




那如果請 4o 來畫個連環漫畫呢?我下了這樣的指令:「用連環漫畫,呈現幽默諷刺的時間管理難題,呈現出一個人自以為掌握時間管理技巧,最後卻反其道而行陷入拖延。台詞用繁體中文呈現。」製作出了下面圖片。




很多時候製作簡報,需要搭配一張背景圖

現在 ChatGPT 4o 的 AI 繪圖可以用結合文字、更多動作細節邏輯、更寫實照片的風格,幫我繪製出需要的配圖。

例如下面這個場景,在之前的 AI 繪圖可能是無法創造出來的。

我用的指令是:

生成一張寬比例照片,在舒適現代居家環境中,有著明亮但柔和的光線,有一面牆壁上,貼了大量的各種顏色便利貼,便利貼上的有點凌亂的手寫文字如下,請務必使用繁體中文文字::

思考
筆記
大腦
資料
經驗
任務
日記
目標

一個台灣年輕男性正站在牆壁前,手拿麥克筆與一張便利貼,準備寫字後貼上牆壁。




那如果來製作一張網路社群上的宣傳圖呢?

我利用下面的指令,設計出了下面這張圖片。

生成一張可以發布在社群上的正方形圖片。主題是宣傳一本書,這張圖片具有適合網路現代讀者的視覺吸引力,有大的字體與有趣的圖示,和親切的色彩,呈現出吸引目光的排版。

圖片上的文字如下,請務必使用繁體中文,搭配海報手寫字體:

用最簡單方式
打造你的第二大腦

立即報名
Esor的防彈筆記法
免費直播活動

記住,讓你下一次變得更好!

還是有一兩個文字的錯誤,但整體來說已經非常好,而且在圖文排版上做得很正確。




除了可以結合中文、英文等文字內容外, ChatGPT 4o 的 AI 繪圖對「真實」也有很大程度的提升。

例如我用下面的指令,請 AI 畫出真實攝影照片感覺的圖片:「生成一張照片,一滴水滴到土壤上正在濺起的瞬間,旁邊有一隻正確比例的小螞蟻正要通過附近。」

可以看到在物理效果、動作、自然現象等等上, AI 透過對要繪製內容的知識細節理解,正確在繪圖中呈現出來。




ChatGPT 4o 還可以「上傳圖片」,請 AI 根據原始圖片重新繪圖。

例如,上傳一張經典的「神奈川沖浪裏」畫作圖片,請 AI:「根據這張圖片,生成真實世界場景的攝影照片。」




就這樣簡單一句話, AI 畫出了下面的版本。




最後,我做了一個比較大的挑戰,我預期應該無法完全成功,但想看看他的效果。

我把最近幫朱騏製作的《復盤寫作術》這本新書的封面照片上傳。

然後請 AI :「把這本新書,融合到一張咖啡館照片中,咖啡館近景桌子上正好擺放了這本書,並且旁邊有一位坐著喝咖啡的台灣上班族正在翻閱。」

下圖是 AI 生成的結果,書籍封面上的文字太小太複雜, AI 在重現過程有很多錯誤

但是,在把產品擺入場景、重新繪製需要的內容,並呈現出寫實感上, ChatGPT 4o 的 AI 繪圖模型確實做得不錯




ChatGPT 4o 的 AI 繪圖能力,又比上週才推出的「Google Gemini AI 修圖實測!一句話改圖、換背景、創作連環照片」更加實用,很值得試試看。

而在一連串測試過程,目前在 4o 繪圖過程下指令,有下面這些小技巧,也分享給大家:

  • 先描述要生成的圖片格式、主題類型、場景。後面才描述要生成的文字內容。
  • 可以指定字體,例如手寫還是海報體。
  • 如果要使用中文,可強調:「務必使用繁體中文」,但還是偶爾出現簡繁混雜。
  • 清楚明確的文字,寫下要在圖片中結合的文字內容。
  • 英文正確率更高,中文內容一旦很多時就相對會出現更多錯誤。
  • 如果要在文字間穿插布局與指示,但不是要生成的文字內容,可以用()來說明,讓 AI 知道這是指令,不是要放入的文字。

有需要的朋友也可以試試看。

或者進一步研究:




大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:


我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:實測 ChatGPT 4o 超實用全新 AI 圖片:生成正確中文、寫實照片、資訊圖表

留言

這個網誌中的熱門文章

Google NotebookLM 幫你書籍、錄音、影片一鍵畫出心智圖,快速記住學習地圖

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

Google NotebookLM 免費中文 AI 筆記實例教學,老師、學生、創作者利器

Raphael 目前免費無限制 AI 繪圖,不需註冊登入也能生成圖像下載

Google Gemini 免費AI 修圖實測!一句話改圖、換背景、創作連環照片

SciSpace 論文研究 AI 助手,中文文獻問答、摘要引用與報告改寫

Google Maps 我的地圖完全教學!規劃自助旅行攻略

Google 表單自動關閉回覆教學:時間人數到達就過期

用 ChatGPT 陪我讀英文原文書:5 個強化學習、筆記整理到行動轉化的 AI 技巧