亞洲資本網(wǎng) > 資訊 > 科技頻道 > 正文
互聯(lián)網(wǎng)科技公司加碼布局AI繪畫 專家分析未來AI繪畫的發(fā)展前景
2022-05-31 08:11:12來源: 南方都市報

——"一片向日葵花海在星空下閃爍。"

本來只是在有限的想象力之內(nèi)挑了梵高的兩幅名畫加以簡單概括,結(jié)果AI吞掉這句描述后,居然就吐出了一張張極富沖擊力的圖像:

圖源:Simon_阿文 微博

沒有參考圖像,也并非簡單的兩幅圖像的拼接融合,而是真正基于文字描述,在充分的想象力下,從無到有地進行了繪畫創(chuàng)作。

而就在不到一年的時間內(nèi),這樣的AI畫手開始井噴式地出現(xiàn)——

近期在海內(nèi)外爆火的免費AI作畫工具Disco Diffusion,輸入簡單的文字描述就能在線生成圖像,其畫面之精細,想象力之超絕讓不少人直呼“AI比我都浪漫”:

圖源:開發(fā)者推特

一度登上蘋果應用商店的圖形與設計排行榜榜首的Wombo,只要下載App,上傳圖片或輸入關鍵詞,再選擇平臺給予的風格,幾秒之后就能生成圖片,其超絕的想象力被無數(shù)用戶玩出了花:

圖源:網(wǎng)絡

還有通過聊天出畫的Midjourney,用戶進入聊天軟件Discord,并被邀請到相應的小組中后,就能像是真的與畫手隔著網(wǎng)線交流一樣,說出自己的需求,而AI也會在群中實時更新的繪畫進度:

圖源:網(wǎng)絡

OpenAI上個月剛剛推出的Dall-E2,其生成結(jié)果的精準度、對人物的識別能力震驚了整個技術(shù)圈,甚至都有讀者用這一AI出了一整本畫集,整整1000張圖片:

圖源:作者個人主頁

更不用說谷歌新鮮出爐的Imagen,不管多長,多具體,多不符合現(xiàn)實邏輯的離奇描述詞,都可以精準地從文字生成真實準確的圖像:

圖源:谷歌官網(wǎng)

驚人的技術(shù)迭代速度、破圈式的熱度、震驚了繪畫圈的色彩、構(gòu)圖、想象力和創(chuàng)作力,似乎都在表示,這些AI畫手們,正在逐漸在繪畫領域中掌握”畫語權(quán)“。

對此,有人歡欣鼓舞,認為技術(shù)的革新將為藝術(shù)領域帶來全新的思考方式和改變,有人惶惶不安,擔憂來勢洶洶的AI畫手將摧毀一大批中低端繪畫崗位,甚至有人怒斥AI將藝術(shù)變?yōu)榱藛渭兊臄?shù)據(jù)游戲,使得繪畫失去了意義和靈魂......

議論連續(xù)不斷,熱度居高不下,AI繪畫這一名詞開始逐漸出圈,在谷歌的關鍵詞搜索趨勢中,AI painting的搜索熱度自去年下半旬就開始逐漸高漲,到現(xiàn)在已經(jīng)達到了一個新的高峰:

熱議之下,已經(jīng)有這樣的聲音出現(xiàn):

AI繪畫,元年已至。

···

且先不論這一發(fā)言是否正確,所謂的AI畫作,到底是嚴格按照代碼邏輯運行,風格單一的產(chǎn)物,是AI的隨機拼接游戲,抑或是真能如人類畫手一般依照主題構(gòu)想畫作?

AI們都畫了什么,它們又能畫多少?

AI畫手的第一批體驗者們,當時就抱有著這樣的疑惑。PPT設計師阿文就是其中之一。

今年4月份時,他偶然看到一個畫手朋友在微博展示了一組AI作畫的作品,效果驚人,朋友作為專業(yè)畫手也給予了很高的評價,他便也對這個叫做Disco Diffusion的工具起了興趣。

這是一款基于谷歌的技術(shù)框架開發(fā)的AI作畫工具,部署在谷歌Colab(一個可以通過瀏覽器編寫和執(zhí)行代碼的線上托管平臺)上,訓練畫作所需的算力也由谷歌免費提供,而只需要修改代碼中的一個部分的文字描述,就能生成畫作:

文字描述擁有畫種描述、內(nèi)容描述、畫家描述、參考渲染方式、顏色描述五個維度,用戶不用修改代碼,而是只要從這幾個方面進行調(diào)整和修改,就可以生成圖像。

不過,鑒于是初玩,阿文只謹慎地修改了默認文本中的兩個關鍵詞:A beautiful painting of astarry night(原singular lighthouse), shining its light across asunflower sea(原tumultuous sea)by greg rutkowski and thomas kinkade, Trending on artstation.” "yellow color scheme“,也就是將默認的”一座在驚濤駭浪中閃耀的奇異燈塔”改成了“一片在星空下閃耀的向日葵花海”。

而AI吐出的第一張圖片是這樣的:

圖源:Simon_阿文 微博

這是一張超乎了阿文想象的畫作,色彩、構(gòu)圖都擁有超絕的美感和想象力。

而Disco Diffusion本身可以根據(jù)一句描述產(chǎn)出多張不同的圖片,于是,阿文在無比期待中,迎來了掛機渲染之后的另外幾幅作品:

圖源:Simon_阿文 微博

簡單的文字描述外加一點點天賜般的運氣,誕生了數(shù)張色彩構(gòu)圖豐富大膽,如同夢境般的畫作,最終一舉出圈,在微博超過兩萬人轉(zhuǎn)發(fā),并紛紛表示震驚“給跪”。

也因此,大批用戶紛紛涌入,開啟了腦洞大開的AI花式作畫。

有將參考畫師改為吳冠中,直接得到一張水墨畫:

圖源:網(wǎng)絡

還有應用了虛幻引擎風格,生成的仿佛游戲頁面一樣的畫作:

圖源:網(wǎng)絡

當然,偶爾也會有人喂出了一些有些詭異的圖片:

圖源:推特Mike Franchina

......

在那之后,阿文也試用了另一款叫做Midjourney的工具,同樣是“星空下的向日葵海“的描述,不過這次的生成結(jié)果則恰如其分地落在了他的想象力內(nèi):

圖源:Simon_阿文 微博

“就像是一個聽話版的Disco Diffusion。”阿文笑道。

在嘗試多次后,他覺得Midjourney的想象力是比不上Disco Diffusion的,但好處是速度夠快,五分鐘就能成圖,而且不至于像Disco Diffusion那樣,有搶奪創(chuàng)作主導權(quán)的“野心”,是更適合藝術(shù)創(chuàng)作者的輔助工具。

還有更多像阿文這樣的藝術(shù)創(chuàng)作者,走上了探索AI繪畫工具的道路,并開始逐步挖掘各自的潛力。

比如主陣地是移動端的Dream,它的整體作畫風格更偏向于夢幻柔和:

圖源:網(wǎng)絡

而諸如DALL·E2、Imagen之類的畫手,則是在如何更準確地理解文字描述、更好地組合繪畫風格,最后生成更精確而言之有物的事物和人物的方向努力。

當然,除了這些從無到有的“高端創(chuàng)作者”,近幾年也火過一批更加親民的AI畫手們。

比如在去年一度火爆外網(wǎng)AnimeGAN,可以實時地將人像轉(zhuǎn)為漫畫模樣,也是在線部署,火到要排隊幾個小時才能玩到:

圖源:網(wǎng)絡

去年在日推被瘋轉(zhuǎn)的AI,簡陋的草圖一經(jīng)它手就會變成精致可愛的二次元萌妹:

圖源:高坂 推特視頻

還有可以任意推斷兩張人物圖像的子世代長相的Artbreeder,不僅幾秒就能出圖,還可以通過超多參數(shù)微調(diào)產(chǎn)出人物的長相:

圖源:網(wǎng)絡

再出圈一點,抖音、微信或QQ中的將人物照片轉(zhuǎn)變?yōu)槠渌L格的AI濾鏡,也能被算進AI作畫的范疇里。

這樣看來,AI畫手們作畫內(nèi)容的范圍覆蓋之廣,比起一些人類畫手也是不遑多讓。

其屢屢出圈的熱度,更證明了在普通觀眾眼中,AI的畫作們有著足夠的沖擊力和觀賞價值。

···

接下來,讓我們換一個角度來看AI繪畫。一張成品畫作由什么組成?在現(xiàn)實中是紙張和各種材料制成的筆墨水彩,而儲存在電子設備中的一張圖像,本質(zhì)上則是一個像素點矩陣,每個都由 RGB(Red、Green、Blue)三個顏色通道組成。

圖源:網(wǎng)絡

因此,AI繪畫也就相當于一個可以逐漸產(chǎn)生像素,進行圖像生成的計算機模型。

模型是人工智能中的一個概念,我們可以將其通俗地理解為一種從輸入到輸出的函數(shù)。

要讓這個函數(shù)輸出我們期待的像素點矩陣,首先需要賦予它很多“參數(shù)”,相當于函數(shù)中的變量,這些變量涉及繪畫中每一筆的位置、形狀、顏色,甚至是覆蓋關系、筆觸組合等多個屬性。

有了這樣一個擁有龐大“變量”的“函數(shù)”,還要再基于海量的已有圖像進行訓練,也就是找到效果最好,最合適的一組參數(shù)的過程。

而這樣一個繪畫模型所需的參數(shù)量和訓練數(shù)據(jù)集非常龐大,不僅如此,也很難讓計算機去理解“創(chuàng)作”這種比較抽象的概念。

因此,誕生之初的AI作畫,說是依照邏輯執(zhí)行任務也并無不妥。

關鍵詞: 什么是AI繪畫 AI繪畫前景 梵高名畫臨摹 AI繪畫訓練 最新繪畫應用

相關新聞
專題新聞
  • 雖說萬物皆可盤 但盤得住時光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
  • 開心麻花電影頻出
  • 男頻IP為何“武不動乾坤,斗不破蒼穹”
  • 《鐵血戰(zhàn)士》北美市場票房跳水 又玩壞一個大IP?

京ICP備2021034106號-51

Copyright © 2011-2020  資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com