OpenAI在3月25日宣布了對(duì)GPT-4o和Sora的重大更新,引入了一項(xiàng)引人注目的新功能——一個(gè)全新的文本到圖像生成模型。這一新模型不僅限于文本到圖像的轉(zhuǎn)換,還具備自定義操作、連續(xù)提問、風(fēng)格轉(zhuǎn)換以及圖像PPT制作等一系列實(shí)用功能。
在周二的一次直播活動(dòng)中,OpenAI的首席執(zhí)行官奧爾特曼正式宣布,基于GPT-4o模型的原生圖像生成功能已經(jīng)問世,這標(biāo)志著DALL-E這一獨(dú)立的文本到圖像生成模型被整合進(jìn)了ChatGPT系統(tǒng)。回顧歷史,ChatGPT在2022年底推出時(shí),僅支持文字聊天功能,大約一年后,雖然集成了DALL-E 3圖像生成模型,但兩者在系統(tǒng)層面上仍然是獨(dú)立的。此前,AI圖像生成器存在諸如“理解提示詞能力不足”和“無法準(zhǔn)確生成圖片中的文字”等問題,這些問題極大地限制了其在教育和職場(chǎng)等領(lǐng)域的應(yīng)用潛力。
然而,此次升級(jí)后的ChatGPT在圖像生成功能方面取得了顯著的進(jìn)步。它能夠更加準(zhǔn)確地根據(jù)提示詞生成圖像中的文本,特別是在生成黑板板書、印刷體以及科學(xué)常識(shí)繪圖等涉及圖像文字的場(chǎng)景中,其表現(xiàn)從幾乎不可用提升到了接近商用水平。圖像編輯功能也得到了極大的增強(qiáng),例如,可以將合照轉(zhuǎn)化為動(dòng)畫風(fēng)格,根據(jù)簡(jiǎn)單的提示詞生成相對(duì)論主題的彩色漫畫,還能根據(jù)漫畫草稿一鍵上色或更換主要角色。
在商業(yè)應(yīng)用方面,這一新模型也展現(xiàn)出了巨大的潛力。用戶可以根據(jù)上傳的照片和卡片模板自定義生成新的卡片,甚至能夠基于聊天的上下文生成一系列風(fēng)格一致的圖像。這對(duì)于游戲角色設(shè)計(jì)等領(lǐng)域來說,無疑是一個(gè)重大的突破。然而,OpenAI也坦誠(chéng)地承認(rèn),新的圖像生成器仍然存在一些局限性,特別是在處理密集文字和非拉丁語文字的圖像生成時(shí),可能會(huì)遇到問題,這在一定程度上受到了模型幻覺的影響。
盡管存在這些局限性,但OpenAI的這一升級(jí)仍然為ChatGPT的發(fā)展注入了新的活力。從周二開始,這一新功能已經(jīng)向所有免費(fèi)和付費(fèi)用戶開放,而在未來幾周內(nèi),開發(fā)者還可以通過API接口進(jìn)行調(diào)用。這一系列的更新和改進(jìn),無疑讓我們對(duì)ChatGPT在更多領(lǐng)域的應(yīng)用表現(xiàn)充滿了期待。
Copyright 2025 //www.ahlmtdl.com/ 版權(quán)所有 豫ICP備2021037741號(hào)-1 網(wǎng)站地圖