現在AI如火如荼崛起,但我還是只用來聊天畫畫,我覺得要把通用AI的使用心得記錄起來,正好最近又買了SuperGrok特價,就記起來吧。
Bing Image Creator
這是微軟專門的AI繪圖網站,量大管飽,雖說也有點數限制但是用完點數也可以用,只是生成速度較慢,但最大的缺點就是圖片壓縮得太厲害,有時候出了很棒的圖但是下來的卻是渣壓縮,實在扼腕。
我是從DALL-E 3開始用的,雖然不是很聰明但還是能生成不錯的圖片,但是審查機制逐漸嚴格,一開始還能畫川普,現在哪樣哪不行。後來多了MAI-Image-2e和GPT-4o,還能改圖片比例,但依然渣畫質。
MAI-Image-2e是微軟搞出來比較適用插畫的風格,但感覺理解力還不如DALL-E 3,不過有些圖出的還是不錯,GPT-4o應該是拷ChatGPT的,對於Prompt的理解力比較高,出的圖是GPT早期那種...黃黃的那種...
現在這三個模型改名字了,但還是這三個沒錯,就是DALL-E 3似乎要被刪掉了,不知道未來Bing Image Creator前途如何。
![]() |
| DALL-E 3的好時代,除了色情百無禁忌。 |
![]() |
| 依舊是DALL-E 3,現在能改比例了。 |
![]() |
| MAI-Image-2e大致是這樣的感覺,比較有手繪風格。 |
![]() |
| GPT-4o,預設都是暖色調的樣子。 |
Copilot
微軟免費送...的吧?有Win就有,付費的重心似乎用在office上。免費似乎也沒有甚麼限制,但感覺不聰明,雖然一開始大家的AI都不聰明,但Copilot感覺原地划水,還是付費才會更聰明?
Copilot也是能畫畫,我記得一天大概十多張?出圖依舊是GPT早期那種...蠟黃系風格,這一方面微軟不太行呢。但是圖片不會被壓縮,是一個適合用的工具。
但身為微軟的AI工具不能幫助操控OS簡直無能,像是檔案搜尋之類的應該很容易解決啊,微軟在這個AI時代看起來要餓死。
![]() |
| Copilot給PNG檔。 |
Gemini
去年底特價時入手Pro,之後主力都是這款,畢竟我還能用半年。
我都是用Pro來對話(因為我付錢了),Gemini感覺對使用者很諂媚,說好聽點是在乎用戶情緒價值...Pro在周末額度似乎容易用盡,但其實...也夠啦。就是Pro反應很慢容易當機,而Gemini特別會一本正經順著使用者胡說八道幻覺十分。如果用pro回復快了多半沒有在思考,偷吃步。
Gemini畫畫的Nano Banana現在好像升級到2了,在其他的地方也能用,像是Google Whisk(沒了,據說合進Flow裡),專門搞影像的Google Flow,這做影片要用AI點數的,就是畫畫好像不扣。
Gemini也能做影片,一天3個,當機也吃額度。繪圖方面他有著我所使用過AI最大的2K解析度,實在是震撼人心!可惜他的繪圖風格走寫實度,而且還是醜的那種,動漫風插圖只能以拙劣形容。真實化的人物也以醜的為主,就算你畫個美女也是以有瑕疵為準出圖,像是粗糙的皮膚,去不掉的鬍渣,不精緻的五官...
審查也是嚴格,記得Gemini剛出時還有人畫擦邊畫乳暈,後來逐漸縮緊,到政治人物或版權物都不行,不過新模型出時又放鬆一下,不知道是不是故意的,只能說逐漸嚴格。
對於文字理解度最高,圖片的中文字也毫無問題,可說除了畫風甚麼都好,配上Google生態鏈實在讓人離不開他,難啊!
![]() |
| 要換很多的Prompt才能畫出稍微能看的人臉,不過他的文字理解能力很好,又有2K左右的解析度。有浮水印但可以在別的網站移除。 |
![]() |
| 基本上寫實人臉就是各種斑紋、汗毛、毛孔什麼的真實缺陷都會往上加,就算加了美顏之類的Prompt也沒太大用處,DEI的真實支配者。 |
![]() |
| 至於二次元插畫只能以毫無特點來形容,出再多的Prompt也是一副死樣子。 |
![]() |
| 可是其他方面真的很行,對於Prompt理解力和知識面的廣度深度是很高的,這張圖是把小說【瘋狂山脈】的示意圖提純出來。 |
![]() |
| 尤其配上高畫質,對於照片修圖真是好用,直接把單隻貓咪修成一家團圓了。 |
![]() |
| 生產怪物之類的圖很上手。 |
ChatGPT
原本也是有人情味的AI,某天改版後變得冷酷、高效、少廢話、頂嘴。好像這樣就會讓它變得更有權威感似的,其實不會,依舊不是很聰明,只是很會嗆使用者。
出圖方面這段時間進步驚艷,從原本的品項單一的美術風格變得更加有藝術感,如果不是Gemini我買了還剩半年我早投了。不過ChatGPT免費額度還是少的,我也不確定是不是真的那麼好,但是未來可期吧,可惜解析度一般般。
審查方面稍微寬鬆...吧,比前面這兩家。
![]() |
| GPT前期的風格...還不如Bing Image呢,就是準確度高,風格太簡陋。 |
![]() |
| 近期能力突飛猛進 |
![]() |
| 我用好萊塢名流吃麵的Prompt失敗了,不知道是不是隱私權的關係。GPT出圖膚質比Gemini好不少。 |
Grok
他可以色色,玩玩文字冒險比Gemini尺度大多了。說是這麼說我這次回鍋發現他對於上傳圖片修改審查更嚴格,大尺度圖檔的也是更厲害,這次的9.9鎂3個月感覺像是馬斯克在圈錢。Grok的美術風格也不怎樣,就藝術風格比Gemini好而已,在真實上有些差距...但幸好Grok的真實是朝美的那方面走,就是圖片解析度也是一般般。
雖然出圖量大速度快,但是不夠精準就出一堆廢圖,拉一拉一下額度就沒了,也不是很方便,尤其是感覺付費額度也緊縮,沒甚麼特別好處。
至於AI聰不聰明...Grok我是讓他寫故事來玩的,套路一般很快就會陷入迴圈,也不怎麼樣。
他有一個AI夥伴...但是只在蘋果上架,聽說安卓也上了但我到現在還是沒看到...年初就說有了,到年中我都沒看到。
![]() |
| 車頭燈是可以畫出來的,但是很擋尤其是更精確的色圖。能出圖也不一定能轉影片。 |
![]() |
| 其他風格大概這樣吧,有些卡通化。 |
Meta AI
他畫圖似乎是買Midjourney的技術,對於沒用過Midjourney的我來說美術風格很驚艷,但之後Meta AI改版越改越怪,現在畫圖部分的[建立圖片]退化得很厲害,感覺像是DALL-E 3加強版的水準,反而直接在[聊天室]建立的圖片有著高水準。
不過Meta AI很呆啦,不太能理解Prompt...尤其是中文的意思,出圖基本靠賽,所以說是DALL-E 3加強版,他的文字理解程度就是DALL-E 3以上吧,不及GPT,跟Grok打個對台吧,就是美術風格高...現在也不高了,如果哪天把聊天室出圖的模型砍掉的話。
但是祖克伯還在燒錢,畫圖大大的有沒有限制,至少我沒有畫滿額過,出完圖直接轉影片配音樂,Meta還真有錢這些要版稅吧。
就是常常當機服務器不是很穩,建立圖片一直比例訂在長條圖,還有現在要水印了,聊天室原本也有,現在又沒了,只是聊天室的圖不能轉影片啊。
最近Meta AI嵌進threads了,或許FB也會上呢,有機會佔得一線生機吧,不然完崩元宇宙後Meta怎麼活呢。
![]() | |
|
![]() |
| 開始的時候隨便打都很有藝術感。 |
![]() |
| 開頭怎麼畫都是傑作 |
![]() |
| 現在就是這種水準 |
![]() |
| 從聊天室出的圖還是可以保持高品質的,雖然體感比以前差了點,不知道模型是不是舊的。之前還有www.fbsbx.com 拒絕連線的問題。用聊天室的好處是出了問題可以提問,蠻方便的。 |
![]() |
| Meta AI理解的【瘋狂山脈】,從聊天室出圖來說對於文字的理解力是弱於GPT和Gemini,可能和Grok差不多?但是美術效果算是第一梯隊的,買了Midjourney的技術真的有用吧,我是很想用Midjourney,不過AI也不只是拿來畫畫,實在沒有閒錢... |

















































