亞洲資本網(wǎng) > 資訊 > 熱點 > 正文
【天天快播報】年刊節(jié)選|小冰CEO李笛:CG建模數(shù)字人“唯物”,小冰“唯心”
2022-12-26 05:56:58來源: 娛樂資本論

在元宇宙熱潮的影響下,2022年,數(shù)字人領(lǐng)域出現(xiàn)井噴。大到互聯(lián)網(wǎng)巨頭,小到創(chuàng)業(yè)公司,紛紛入局?jǐn)?shù)字人領(lǐng)域。

不過,在相對高調(diào)的數(shù)字人領(lǐng)域,有一家公司,技術(shù)實力與曝光度遠(yuǎn)未成正比,那就是小冰公司。

相比國內(nèi)數(shù)字人公司,小冰公司是為數(shù)不多的愿意在“海平面”以下做數(shù)字人基礎(chǔ)設(shè)施的公司。


(相關(guān)資料圖)

小冰公司CEO 李笛

用小冰公司CEO李笛的話說,小冰想做的AI Beings是有靈魂的數(shù)字人,而不是只能簡單交互的數(shù)字人外形。

根據(jù)小冰官方數(shù)據(jù),小冰框架是全球?qū)嶋H落地及完備度最高的AI Being基礎(chǔ)框架,覆蓋中國、日本、印度尼西亞等國6.6億在線用戶、10億臺第三方智能設(shè)備和9億內(nèi)容觀眾,商業(yè)客戶覆蓋全球。目前框架內(nèi)運行著數(shù)千萬AI Beings,其中數(shù)字員工約有30萬名。

數(shù)字員工、虛擬陪伴、游戲NPC是小冰數(shù)字人開發(fā)的主要場景和應(yīng)用。尤其趁著企業(yè)數(shù)字化轉(zhuǎn)型的浪潮,小冰框架在數(shù)字員工領(lǐng)域大殺四方。

在過去的一兩年中,在小冰框架的基礎(chǔ)上,不斷為客戶開發(fā)出觀君、招小影、崔筱盼、N小黑等一系列專業(yè)領(lǐng)域數(shù)字員工。在李笛看來,數(shù)字員工遠(yuǎn)遠(yuǎn)不止是一張超寫實的面孔,更重要的是可以完美勝任財務(wù)、教練、客服等一系列工作,且比真人做得更好。

(崔筱盼)

從2014年誕生到現(xiàn)在,小冰已經(jīng)經(jīng)歷了9代。在“海平面”以下,她究竟打下了怎么樣的基礎(chǔ),與市面上的數(shù)字人究竟有什么不同?我們跟小冰公司的CEO李笛聊了聊。

“數(shù)字人行業(yè)在2022年迅速進(jìn)入了一個紅海市場”

娛樂資本論:你怎么看我們這次年度大會的主題——咬定青山?

李笛:人工智能領(lǐng)域需要充足的耐心,沉下心深入研究,也許短期內(nèi)看不出什么,但在未來回看,卻發(fā)現(xiàn)這些“海平面”以下的事非常重要。就像竹子“咬定青山”地扎下去,把根基打牢,才有可能勃發(fā)。

娛樂資本論:2022年,數(shù)字人的制作成本快速降低。你如何看待行業(yè)的發(fā)展趨勢?

李笛:首先明確,數(shù)字人的概念,到底是什么?現(xiàn)在很明確的一件事是,不同的人對數(shù)字人概念的理解大相徑庭。比如,大家在總結(jié)數(shù)字人技術(shù)的時候,會強(qiáng)調(diào)他的建模和動捕。這里面隱含的意思就是,他對數(shù)字人的意思是還是基于外觀的理解。

而當(dāng)我們說數(shù)字人的時候,說的是自驅(qū),交互和內(nèi)容生成。

這是一個比較大的分野。如果只強(qiáng)調(diào)外觀,那么過去一年的時間,這個領(lǐng)域,不是成本在大幅度降低,而是利潤在大幅度降低。這個領(lǐng)域迅速進(jìn)入了一個紅海的狀態(tài),互相之間殺價殺到利潤非常低。因為這個領(lǐng)域的技術(shù)同質(zhì)化很嚴(yán)重。

第二,這些企業(yè)的付費客戶一般是各大品牌的市場部門,因為,數(shù)字人通常被企業(yè)當(dāng)成營銷手段的。但小冰旗下的數(shù)字人,是幫助企業(yè)做一些真正的事情的,比如財務(wù)催款、體育教練、財經(jīng)新聞撰寫等等。

所以,數(shù)字人行業(yè)出現(xiàn)一個非常奇特的狀態(tài)——如果放在人工智能領(lǐng)域,它有非常大的未來。但如果它的定義還是一個外形,那么,他的上限不會很高,是因為,他的市場需求量沒那么大。

娛樂資本論:很多數(shù)字人的公司都在做“海平面”以上的事情,比如打造一個更好看的外表,為什么你有勇氣從“海平面”往下做?

李笛:目前市面上很多數(shù)字人的嘗試,我們當(dāng)初在微軟的時候就都嘗試過了,比如智能客服系統(tǒng)、智能操作系統(tǒng)、智能音箱等等,我們平行趟了各種坑。所以在做小冰時候,就已經(jīng)有了一個完備的技術(shù)框架。

我們對小冰的一個基本理念是,完備框架。就是說,小冰不是一個基于問答,或者不是基于單輪交互,而是基于一個交互全場的產(chǎn)品,它要求人工智能程序能夠引導(dǎo)這個交互項目去發(fā)展。為此,她需要有內(nèi)容生成能力,需要有情感,或者說情商。

小冰當(dāng)時其實是微軟做的第一個人工智能助理Cortana的Plan B。我們在當(dāng)年并不是那么明確的知道,哪個方向才是未來趨勢。但是在我們做Cortana的時候發(fā)現(xiàn),這種基于問題,或者是從人工智能那里獲得知識這種模型,可能并不是唯一的答案,于是我們做了小冰。

經(jīng)過很多年之后,我們發(fā)現(xiàn)小冰是符合未來發(fā)展趨勢的,她的出現(xiàn)更加符合人工智能的發(fā)展上限。

我們認(rèn)為這個世界上,不會只有幾個人工智能助理,或者幾個回答你問題的數(shù)字人,而是有各種各樣的AI Being。

我們要做的事情是,讓這些AI Being跟人的交互,就像人與人一樣。為了這些,我們會去讓她擁有“情商”,掌握唱歌、畫畫等內(nèi)容生成能力。

“我們不做‘替代’人的虛擬人,我們做‘補(bǔ)位’”

娛樂資本論:為什么你們每次都從數(shù)字員工這個領(lǐng)域切入?而不是虛擬偶像?

李笛:我們會判斷什么是AI Being需求最大的地方,從而優(yōu)先篩選具體的賽道。

很遺憾,AI Being需求量最大的地方不是回答問題的知識專家,而主要是三類。一類是企業(yè)數(shù)字員工,一類是人類周圍的陪伴者,還有一類是游戲里面的NPC。這幾類需求很大,所以這些也是我們的主要布局。

娛樂資本論:聽說小冰框架在金融資訊領(lǐng)域已經(jīng)有了廣泛地應(yīng)用,是否可以介紹一下?

李笛:比如每日經(jīng)濟(jì)新聞的虛擬人主播N小黑,已經(jīng)穩(wěn)定運行了一年多了,365乘以24小時不間斷播報財經(jīng)新聞。他的聲音、肢體、面容,以及播報的內(nèi)容,都是人工智能小冰框架來生成、運行的。因為如果不是全程都是人工智能的話,就不能保證24小時的連續(xù)直播。

像金融摘要,是所有文本里面最難的,因為它得容錯性非常小。比如上市公司的公告100多頁,你要把它壓縮成一個200多字的資訊。

讓AI Being把幾百頁的招股書寫成新聞稿這件事不是我們今天才開始做的。從5年前開始到目前為止,國內(nèi)90%的機(jī)構(gòu)投資人每天看到的財經(jīng)資訊,都是小冰生成的。我們專門為這個功能搭建了一個金融知識圖譜,這個圖譜里包含1000多個影響因子。

娛樂資本論:“觀君”也是小冰框架驅(qū)動的數(shù)字人,并且是一個人工智能的教練,它真的比真人教練更好么?怎么實現(xiàn)?

李笛:在某些方面,他不光是比真人教練要好,更是真人教練沒辦法比的。我們有一個理念,就是我們不做“替代”人的虛擬人,而是要做“補(bǔ)位”,完成真人無法承擔(dān)的工作。

先拿金融摘要舉例。我們在推出這個金融摘要之前,絕大多數(shù)上市公司公告是沒有摘要的。因為每天早上有100多個上市公司發(fā)公告,每個公告可能都有100多頁,你需要配多少人也來不及做摘要。但是,作為一個投資者,我需要知道這些信息,卻不可能看完這么多頁,過去只能挑著看。所以,我們的方案并不是為了替代人,而是做那些真人他做不到的事情。

同理,體育的訓(xùn)練系統(tǒng)也一樣,AI可以通過捕捉準(zhǔn)確的運動軌跡,對比過往的數(shù)據(jù),以及其他運動員的數(shù)據(jù),快速做出分析。這一系統(tǒng)的穩(wěn)定性和準(zhǔn)確性會遠(yuǎn)遠(yuǎn)高于真人教練。

娛樂資本論:做出這樣的一個數(shù)字人,貴么?

李笛:研發(fā)成本不一樣。如果做一個垂直領(lǐng)域的專業(yè)系統(tǒng),確實也需要花比較長的時間,但它不難。更難的其實是通用性的開放域問題,開放域的問題解決了,再去解決一些垂直領(lǐng)域的問題就比較容易。

小冰從2020年開始進(jìn)入汽車的智能座艙領(lǐng)域,到現(xiàn)在兩年時間,滲透率已超過60%。所以,從海平面以下開始做,你會越做越順手。

娛樂資本論:小冰不久前為招商集團(tuán)做了一個數(shù)字員工叫“招小影”,為什么招商集團(tuán)愿意跟小冰合作?

李笛:有幾方面原因,國內(nèi)不同的人在提到數(shù)字人的時候,概念都不一樣,很浮躁。但絕大多數(shù)人提到數(shù)字人的時候指的都是3D建模,就是創(chuàng)造一個外形,可以念一段文字,或者有動捕的方案做虛擬IP形象。

但我們更關(guān)心,如果是一個企業(yè)員工的話,他是否能真的能做事情。所以,招小影不光要有外形,她還需要真的出現(xiàn)在招商銀行的ERP系統(tǒng),真的在做招商集團(tuán)員工的工作。同時,她的外觀、語言交互等都不輸于3D建模的同行業(yè)者。

比如,如果你想做一個數(shù)字人,基于神經(jīng)網(wǎng)絡(luò)渲染這樣的方式,能夠做交互的話,那么,至少讓他的延遲要做到毫秒級。就是你說一句話,數(shù)字人能在毫秒內(nèi)回復(fù)你。但目前行業(yè)的水準(zhǔn)是在分鐘以內(nèi)。

“我們不做系統(tǒng)集成和硬件”

娛樂資本論:目前小冰主要的收入來源是哪些?

李笛:我們有幾個要求。第一,我們不做系統(tǒng)集成,第二,我們不做硬件,只做純軟件的收入。我們目前的收入來源是B端。

小冰認(rèn)為,未來人類會被AI Being所環(huán)繞,形成人與虛擬人共處的社交網(wǎng)絡(luò)。這意味著,只要有人的地方,就能有AI Being,它需要是一個“跨空間”的存在。比如,你的家里、你的車上、你的社交網(wǎng)絡(luò)平臺……只有軟件可以實現(xiàn)。而一旦把AI Being實體化(硬件化),它就只能存在于那個實體中。

娛樂資本論:B端的收入是什么樣的收費模式?

李笛:我們是按照不斷疊加累計的月服務(wù)費和年服務(wù)費來收入。行業(yè)里面主要是按照AI系統(tǒng)的調(diào)用來收費,我們不是。

在某些情況下,我們會按照實現(xiàn)的效果進(jìn)行分成。我們是按照整個給你包裝出來的AI Being賣,你可以理解為我們在“買賣人口”,賣出去的是一個服務(wù)包的價錢。小冰不賣技術(shù)。

娛樂資本論:你說,小冰要做的就是“販賣人口”。這個“人口”的數(shù)量,有上限么?

李笛:數(shù)字員工正在跑的已經(jīng)超過30萬個了。如果再加上to C的虛擬陪伴,那就是幾千萬了。

娛樂資本論:怎么會有30萬個這么多?

李笛:在日本大阪試點的老年人家庭,有政府給他們派的數(shù)字員工,每個家庭里數(shù)字員工都不一樣。因為老年人可以通過訓(xùn)練,使人工智能變成他想要的“樣子”。數(shù)字員工承擔(dān)的是政府的公共服務(wù)。

娛樂資本論:我聽說小冰現(xiàn)在一次對話能達(dá)到32次?正常人類一場對話平均下來也只有38次左右。

李笛:目前小冰一次對話最高可以達(dá)到39次交互。這個交互技術(shù)和對話模型,很多公司都在做。但小冰的對話跟實驗室的研究相比,其實曾踩過很多坑。比如,線上的一些交互特別復(fù)雜,2016年的時候,當(dāng)時美國版小冰上線推特剛滿24小時,就被網(wǎng)友的對話數(shù)據(jù)教成了種族主義者,然后讓CEO出來道歉。

現(xiàn)在的小冰也是一樣的。你會看到,實驗室中的數(shù)字人單就對話質(zhì)量,以及對話輪次,有很多比小冰更好的,但是大多數(shù)都很難落地。因為落地涉及到兩個問題,一個是成本,一個是安全性。尤其是對話安全性方面,一旦出問題,很難解決。

所以,歸根到底,安全性一定是小冰公司的第一原則,我們寧愿犧牲一些文本上的豐富性,也不希望小冰框架在安全性上出問題。

關(guān)鍵詞: 人工智能 上市公司 系統(tǒng)集成

專題新聞
  • 消費稅征稅范圍是什么(詳解消費稅的征稅對象)
  • 農(nóng)行理財產(chǎn)品會損失本金嗎?理財會不會把本金虧完?
  • 中國股市開始于哪一年?股市最早出于哪個國家?
  • 車險險種怎么選?家用汽車保險怎么買劃算?
  • 雖說萬物皆可盤 但盤得住時光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
最近更新

京ICP備2021034106號-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com