123,123

亞洲資本網(wǎng) > 資訊 > 賽事 > 正文

ChatGPT也漲不動了

2023-06-26 03:47:32來源： 騰訊網(wǎng)

深燃（shenrancaijing）原創(chuàng)

(資料圖)

作者 | 李秋涵

編輯 | 魏佳

你還在用ChatGPT嗎？

在全球掀起AI熱潮的ChatGPT，似乎進入了瓶頸期。

首先是關于ChatGPT的使用率，有不利的數(shù)據(jù)出現(xiàn)。6月初，摩根士丹利發(fā)布的一項調查顯示，只有19%的受訪者表示他們之前使用過ChatGPT，只有4%的人表示依賴ChatGPT。調查表示，比例低的驚人。

這項調查在今年4月進行，涉及人數(shù)為2000人。不過，在全球78億人口面前，這樣的樣本量不算大，也一定程度上降低了其參考性。

還有一個基數(shù)更廣泛的數(shù)據(jù)值得關注，ChatGPT的增長已經(jīng)明顯放緩。

根據(jù)網(wǎng)站數(shù)據(jù)分析工具SimilarWeb數(shù)據(jù)，前期ChatGPT的訪問量增長率驚人，1月份的環(huán)比增長率為131.6%，2月份為62.5%，3月份為55.8%，在4月份明顯放緩，環(huán)比增長率為12.6%，到了5月，這個數(shù)字已經(jīng)變?yōu)榱?.8%。

隨著ChatGPT普及，參考基數(shù)變大，增長率放緩是正?，F(xiàn)象，不過，根據(jù)目前已有的趨勢來看，6月的環(huán)比增長率也有可能為負數(shù)。

今年年初，ChatGPT像一聲驚雷，讓全球見識到了生成式AI的威力，也讓背后的GPT（生成式預訓練Transfomer模型）大火，掀起大模型創(chuàng)業(yè)潮。它刷新了很多數(shù)字，最讓人印象深刻的，是史上用戶增長速度最快的消費級應用，在推出僅兩個月后，ChatGPT的月活用戶已經(jīng)突破了1億。

但對它未來的發(fā)展，即便是創(chuàng)造者也很難給出明確答案。此前OpenAI董事會成員海倫·托勒就曾表示，“甚至創(chuàng)造它們的人也不知道它們能做什么，不能做什么。我預計，我們真正了解GPT-4能做和不能做的所有事情，可能還需要幾年時間?！?/p>

ChatGPT現(xiàn)在的天花板，不代表就是GPT的天花板，但作為目前最厲害的大語言模型支撐的產(chǎn)品，ChatGPT的走向，也能成為觀察GPT應用的一個窗口。關于AI的狂想還在繼續(xù)，時間已經(jīng)過去了近半年，我們好奇的是，ChatGPT的使用情況到底如何？它被高估了嗎？

ChatGPT真的很多人用嗎？

對于ChatGPT的使用體驗，不同行業(yè)、不同人答案不同。有人把它當玩具，使用了一兩次后就不再登錄；有人努力把它變?yōu)楣ぞ?，在工作中以提高效率；也有人，在努力將ChatGPT變?yōu)楣ぞ叩倪^程中失敗了，因為覺得它“不夠好用”。

夏楠屬于第三種。她從事外貿行業(yè)，會用ChatGPT寫工作郵件，也會讓它解答一些生活中的煩惱，為了能更好的使用ChatGPT，她都是用英文發(fā)指令。

從2月開始使用ChatGPT，她的體驗分為了三個階段，最開始是好奇，很多問題都想拋給ChatGPT，看它怎么回答，探索它。從5月開始，她感覺ChatGPT“變笨了”，之前能做到的，現(xiàn)在做不到了?，F(xiàn)在，她對ChatGPT的評價是，“不好用”。

比如最近，他們公司接了一個炒菜機器人的ODM（原始設備制造）業(yè)務，她想讓ChatGPT提供這個市場的預測數(shù)據(jù)，在反復推拉后，ChatGPT還是沒有給她答案。而在寫工作郵件上，經(jīng)過調教，ChatGPT也只給到她一個命令式的跟進郵件，文字官方式的長篇大論，也不是她想要的，她希望“它能寫出有禮貌的，信息表達很明確的郵件”。

她覺得，ChatGPT之所以做不到，短板在于“不懂得人情世故”。得不到想要的結果，她的使用頻次也降低了，從一個星期五六次變?yōu)榱艘恢芤淮巍?/p>

當然，之所以會有這樣的體驗，背后綜合影響因素很多，和使用者是否問到了ChatGPT擅長的領域有關，也要看使用者有沒有找到與ChatGPT合適的交流方式。

正在澳大利亞生活的Lucy，從去年底ChatGPT一推出后就開始用英文使用它?，F(xiàn)在，她日常用ChatGPT來整理學術研究上的思路、學習語言，是生活里必不可少的工具。只是，準確性的問題一直讓她煩惱，文獻參考需要自己找，“如果我質疑它的回答，它就會順著我的思路回答”。

除了ChatGPT的使用體驗感受不一，從數(shù)據(jù)來看，ChatGPT的普及率，暫時也還沒有想象中的廣。

摩根士丹利相關報告截圖

除了摩根士丹利的報告，還有一些數(shù)據(jù)可以作為佐證。根據(jù)SimilarWeb數(shù)據(jù)，3月-5月，美國、日本是全球為ChatGPT貢獻流量份額最高的國家，分別位列第一、第三。不過，最近，美國的流量已經(jīng)下滑了10.28%。

ChatGPT的全球流量分布來源 / SimilarWeb數(shù)據(jù)

美國方面，在5月底，皮尤研究中心發(fā)布了一份調查，他們在今年3月中旬在1萬多名美國成年人當中展開調查，18%的人聽說過很多關于ChatGPT的事情，39%的人聽說過一點，42%的人根本沒有聽說過。

而在日本，根據(jù)日本ICT市場調查咨詢機構MM總研的最新調查報告，5月24日-31日期間，以日本及美國企業(yè)所屬的13814名員工（其中，日本13412人、美國402人）為對象，進行的網(wǎng)絡調查結果是，日本企業(yè)的ChatGPT使用率僅7%，與美國企業(yè)的51%使用率相比，兩者相差高達44個百分點。

日本企業(yè)中，近半數(shù)員工（46%）回答“不知道”ChatGPT，而即便知道ChatGPT，但回答“未使用”的比重也達42%。

這些都是最近的報告，樣本量在1萬人左右。不過ChatGPT大熱后，全球關于它的使用報告眾多，觀點不一，甚至有的得出的是相反結論。上述報告有一定參考性，但也因地域和人群的差別，不一定能完全反應真實情況。

還有更明確的值得參考的整體性數(shù)據(jù)，可以幫助我們認識ChatGPT的應用現(xiàn)狀。

根據(jù)SimilarWeb，ChatGPT增長明顯放緩，尤其到6月，截至6月20日，6月已經(jīng)過去三分之二，訪問量比5月少了38%左右，粗略推算，到6月31日如果沒有特別新的刺激，6月的環(huán)比流量或將下降。

ChatGPT近期流量變化來源 / SimilarWeb數(shù)據(jù)

同時，還可以參考的是，根據(jù)SimilarWeb，在5月，ChatGPT的跳出率是12.59%，低于谷歌、Youtube等，而在6月24日，跳出率已經(jīng)上升到37.37%。平均訪問持續(xù)時間也從8分32秒，下降到7分48秒。

另一個數(shù)據(jù)是，接入GPT大模型后Bing的市場份額變化。

來源 / Statcounter

Bing的市場占有率，在二三月份剛引入GPT時引發(fā)關注，根據(jù)網(wǎng)站通訊流量監(jiān)測機構Statcounter，2023年3月Bing的市場份額是2.86%，5月是2.77%，不僅占比沒有提高，甚至還有下降趨勢。

是什么限制了ChatGPT？

關于ChatGPT應用上的問題，已經(jīng)老生常談，不過這些問題對它應用普及上的影響，或許比想象中廣。

首先是“變笨”這件事。

6月初，“ChatGPT變笨了”的聲音引發(fā)過討論。不過OpenAI開發(fā)者推廣大使Logan Kilpatrick曾出面回應，表示自3月14日發(fā)布GPT-4以來，大模型的本體一直處于靜態(tài)，不存在大量外部數(shù)據(jù)污染模型的情況。同時他也承認，大模型本身存在不穩(wěn)定性，因此對相通的提示詞，存在回答前后不一致的情況。

一位AI從業(yè)者告訴深燃，5月就有國外從業(yè)者在OpenAI論壇里分享論證GPT變笨的文章。最近，他用GPT-4的API做了測試，讓它做簡單的計算題。從結果準確度來看，GPT-4-0314取得了滿分，GPT-4取得了80分，GPT-4-0613，勉強可以拿50分。其中，0314、0613即指3月14號、6月13號的快照（指整個系統(tǒng)在某個時間點上的狀態(tài)）。這個結果，給他一種GPT-4在被削弱的感受。

來源 / unsplash

根據(jù)監(jiān)管機構NewsGuard的專家分析，OpenAI最新版本的GPT-4，在輸出信息方面，比GPT-3.5要糟糕。在今年3月份發(fā)布的報告中，NewsGuard提到，GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述，而且比GPT-3.5回答的內容更差。

在上述AI行業(yè)從業(yè)者看來，這樣變化的結果是，用戶需要變得更為具體和主動地引導GPT-4，才能獲得與過去相當?shù)幕卮鹳|量。

這也再度影響ChatGPT的使用門檻，而這與ChatGPT的初衷有所背離。

最開始ChatGPT爆火，就有業(yè)內人士對深燃分析，它帶來的影響是將通用人工智能放在了每個用戶面前，也把人機交互的門檻，打到了最低點。

但目前來看，門檻還是存在。從ChatGPT的用戶畫像，也能看出這個產(chǎn)品的普及情況。根據(jù)SimilarWeb數(shù)據(jù)，使用者主要分布在計算機電子與技術行業(yè)，其中，編程和軟件開發(fā)占比最大。其他行業(yè)里，只有游戲行業(yè)中的視頻游戲機和配件的從業(yè)者占比較多。

在使用ChatGPT的體驗上，一位工程師給深燃的反饋最為積極，表示一直在用，“能幫我解決小的程序上的問題”。

盡管都說，“淘汰你的不是AI，是會用AI的人”，如果普通人使用起來門檻越來越高，那也一定程度上脫離了ChatGPT的初衷。

還有兩個問題，是ChatGPT從最開始就面臨的質疑，即準確率和隱私保護。

根據(jù)上述日本相關機構的報告，在被問到今后若要繼續(xù)/擴大使用ChatGPT，需要解決什么問題時，日本企業(yè)、美國企業(yè)分別有高達49%、45%的回答是“案件的精度”，其次為“個人資料等隱私(日企34%、美企35%)”，和“對問題的理解程度(日企33%、美企34%)”。

準確度方面，OpenAI的CEO山姆·奧特曼，也做出過解釋，這個程序會自信地宣稱一些東西是事實，但其實它是編造出來的，就像謊話連篇的政客一樣。他給這種現(xiàn)象起了個名字——“幻覺難題”。

總之，準確率要實現(xiàn)起來非常不容易。原因就是因為它不是靠記憶，而是憑借演繹推理能力來工作?！按笳Z言模型靠的是推理的拼字游戲，不可能像數(shù)據(jù)庫一樣完全準確，人也不能完全保證準確”，關注AI行業(yè)的工程師楊陽告訴深燃。

隱私方面，OpenAI至今還沒有給出明確的解決方案。在加拿大工作的小虹就告訴深燃，公司特地發(fā)郵件通知，讓大家謹慎使用ChatGPT。

基于這些限制，ChatGPT的應用場景也受限制。

關注產(chǎn)業(yè)的投資人陳默默告訴深燃，它其實適合“生產(chǎn)力驅動”的內容生產(chǎn)，而不是“創(chuàng)意驅動”的內容生產(chǎn)，在前者上，能替代不少有重復經(jīng)驗累積的人力。

用戶洛洛從4月開始使用ChatGPT，她開了會員，主要用于寫腳本和文案，“只要能給它正確的公式，基本可以反饋給我任意思維的腳本，只是拿到手要改”。她表示，產(chǎn)出的腳本比較基礎，沒法做成爆款，但它邏輯沒有問題，“像公司日常的一些大量的視頻輸出，是可以支持的”，她現(xiàn)在的ChatGPT使用頻率，基本上一周3次以上。

現(xiàn)在夏楠調整了策略，只問它一些流程式的問題，比如開ebay網(wǎng)店的流程。盡管這類問題也可以問谷歌、百度，但“ChatGPT的回答更好”，她舉例，最近她去德國旅行，讓ChatGPT給她安排旅游計劃，給出的答案有參考性，交通安排的也很清楚。

這些長期使用ChatGPT的用戶，不論對ChatGPT的使用體驗滿意與否，他們都提到，ChatGPT更像是一個升級了的谷歌、百度，帶來了一定助力。

ChatGPT，象征意義高過實質意義？

最近，OpenAI推出了類似于LLM版的App Store，加速生態(tài)的建設，還被曝光了一些功能上的優(yōu)化。這背后也隱藏著一個信號，GPT4暫時已經(jīng)到天花板，要加速生態(tài)建設，在GPT5出不來之前，先做一些體驗上的優(yōu)化。

早在4月，山姆·奧特曼就表示，還沒有開始研究GPT-5，也沒有立即開始的打算，還曾表示，“大型模型時代已經(jīng)到頭了。”

據(jù)OpenAI官網(wǎng)，GPT模型參數(shù)數(shù)量（可以理解為喂養(yǎng)模型的語言材料）在不斷提升。GPT-1是1.17億，GPT-2有15億，到了GPT-3，飆升至1750億，GPT-4，根據(jù)國外媒體機構Semafor的一份報告，比GPT-3大六倍左右，具有1萬億個參數(shù)。

此前楊陽也對深燃表示，或許GPT-4就成長到頭了，語料是一個原因，“人類歷史上創(chuàng)造出的優(yōu)秀資源就這些了”，模型本身的限制也是一個原因。在他看來，現(xiàn)在GPT-4被限制了，應該有能力沒有被完全開發(fā)出來。

近日，F(xiàn)acebook母公司Meta首席人工智能科學家Yann LeCun就指出，ChatGPT背后的生成式人工智能技術已進入了死胡同，擁有太多的局限性。

出于巨頭間的競爭關系，或許很難將這話作為客觀參考。但可以肯定的是，ChatGPT的確遇到了瓶頸。

要讓大語言模型有更好的應用，不少人把視線投向垂直領域的應用上。

AI行業(yè)從業(yè)者秦凱對深燃做了一個比喻，ChatGPT這類泛化型的人工智能，應用寬泛時，能力就像是高中生、大學生，和垂直場景結合時，fine-tuning（在自然語言處理中使用的技術，也叫微調）的數(shù)據(jù)足夠精確和貼合場景，能力就能變?yōu)榇T士、博士，能解決更具體的需求。

楊陽也認同這一看法。他提到，目前的模型最多只能進行一倍左右的優(yōu)化，“大家有一個基礎共識，GPT-5來了，也不會帶來顛覆性的進化”，短期內不可能達到AGI（通用人工智能）水平。

來源 / unsplash

不過，他表示，現(xiàn)在做具體垂類應用，首先是費用高，訓練模型對公司來說依舊是不小的成本；其次是數(shù)據(jù)安全、數(shù)據(jù)隔離的問題，目前采用的辦法是，“在大模型基礎上套小模型”，但帶來的問題是，現(xiàn)在的底層技術還在變化，“沒有人知道下一個模型，更優(yōu)秀的模型什么時候出現(xiàn)”，這個中間階段讓大家很迷茫，“如果三五年后才出現(xiàn)，那現(xiàn)在基于大模型做垂類的產(chǎn)品是不虧的，場景落地后有機會回收資金。但如果很快就出現(xiàn)了，那大家現(xiàn)在做的外掛型垂類產(chǎn)品，是沒有多少意義的?！?/p>

投資人陳默默表示，這是一個“先有雞還是先有蛋”的問題，他們還是愿意去看相關項目，在細分領域里切一個特定場景的應用，因為“哪怕未來的底層有變化，只要行業(yè)沒有變動，在應用層的行業(yè)理解上還是會有沉淀”。

但他們在看項目時遇到的問題是，很難有人可以明確告訴他們，產(chǎn)品能節(jié)省多少人力成本?！翱聪聛?，還是得給機器配個人”，她舉例，關注賦能研發(fā)端論文篩選歸納相關的垂類產(chǎn)品，實際使用也還是需要一個人順著機器的結果，再做進一步驗真、開發(fā)和研究，實際上很難說效率有特別好的優(yōu)化”，所以現(xiàn)在，一些投資人都會傾向于再觀望觀望。

在關注垂類領域的AI創(chuàng)業(yè)公司的產(chǎn)品時，她的感受是，“我們對技術帶來的產(chǎn)業(yè)升級機會保持謹慎樂觀，目前可能它的市場意義，高過實質意義”。

秦凱總結，人們對ChatGPT的期望過高，但有兩個瓶頸。首先，下一代大語言模型通過更大的參數(shù)規(guī)模和更強算力的收益邊際遞減，人們的期望可能無法很快滿足。其次，當前的大語言模型是泛化的，需要很長時間來解決特定、真實的問題。目前垂直領域的生成式AI，已經(jīng)變成了針對具體企業(yè)做定制化需求和私有部署的體力活，“底層模型依靠transformer方式缺乏解決非常復雜問題的能力，現(xiàn)在的應用情況與預期的水平相距甚遠”。

應用還在繼續(xù)，技術還在發(fā)展，關于ChatGPT的應用及潛力還需要再觀望。即便是這樣，ChatGPT已經(jīng)讓一些人的生產(chǎn)效率，有了一個數(shù)量級的提高，即便當下有瓶頸，“ChatGPT已經(jīng)是很偉大的產(chǎn)品，這就夠了?！睏铌柋硎?。

*題圖來源于unsplash。應受訪者要求，文中夏楠、Lucy、楊陽、小虹、洛洛為化名、

關鍵詞：