騰訊靠什么突圍“百模大戰(zhàn)”?
作 者 | 張津京
了解更多金融信息 | BT財經(jīng)數(shù)據(jù)通正文共計4371字,預計閱讀時長11分鐘
【資料圖】
大模型的“百模大戰(zhàn)”,騰訊終于下場。
從6月19日發(fā)布自己的行業(yè)大模型,到7月16日召開的世界人工智能大會,騰訊云行業(yè)大模型率先登場,越來越清晰的事實背后,凸顯著騰訊對于大模型領(lǐng)域的思考。
尤其是跟BAT其他兩家的選擇不同,騰訊上來首先端出的是行業(yè)大模型,而不是通用大模型。這意味著騰訊其實找到了在這個領(lǐng)域放大自身優(yōu)勢的方式。
因為是國內(nèi)互聯(lián)網(wǎng)企業(yè)最早點出要推動數(shù)字融合,推進產(chǎn)業(yè)互聯(lián)網(wǎng)發(fā)展的平臺,騰訊從一開始接觸到大模型,想到的就是如何與產(chǎn)業(yè)相結(jié)合。
關(guān)鍵,讓人意想不到的是,秉持這個邏輯下場,騰訊其實直奔解決大模型研發(fā)方一直糾結(jié)的一個問題:那就是大模型該如何保證長期可持續(xù)發(fā)展。
只有做到這一點,任何大模型才能談得上有未來。
1
大模型是用來解決問題的
騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生,在世界互聯(lián)網(wǎng)大會產(chǎn)業(yè)發(fā)展論壇做主題演講時表示,通用大模型有很強的能力,但并不能解決很多企業(yè)的具體問題。“企業(yè)的大模型應用需要綜合考慮行業(yè)專業(yè)性、數(shù)據(jù)安全、持續(xù)迭代和綜合成本等因素?;谛袠I(yè)大模型,構(gòu)建自己的專屬模型,也許是企業(yè)更優(yōu)的選項”。
這恰恰說出了當下大模型產(chǎn)業(yè)發(fā)展的一個現(xiàn)實。
從Open AI發(fā)布ChatGPT3.5開始,浮躁成為這個行業(yè)的外顯標簽之一。越來越多的企業(yè)開始在這個領(lǐng)域炫技。
高峰時期,美國硅谷每天會產(chǎn)生幾十個大模型相關(guān)的論文,上百個與大模型相關(guān)的創(chuàng)業(yè)產(chǎn)品DEMO視頻。“每個視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來,我們對于技術(shù)該怎么用一般都沒有答案。”大模型知名研究者,計算機工程碩士李莉認為,現(xiàn)在很多模型的研究者和應用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺化。“如果真正放到經(jīng)濟中,你會發(fā)現(xiàn)根本用不上。”
在她看來,這已成為行業(yè)通病。
同樣國內(nèi)大模型的紛至沓來,相關(guān)的事情也沒少做。例如讓大模型直接作詩或者用方言將相關(guān)的內(nèi)容讀出來,甚至做成視頻之類,頻繁出現(xiàn)在模型研發(fā)方發(fā)布會的現(xiàn)場。
這其實是一種市場推廣行為,但并不意味著大模型真正要在這個方面實現(xiàn)應用。
最近Newsweek有一個商業(yè)調(diào)查顯示,ChatGPT的用戶數(shù)量已經(jīng)比一二月份高峰時期下降了近95%。在統(tǒng)計原因中,“感覺ChatGPT對工作的促進能力沒有想象那么強”,是用戶選擇最多的一個結(jié)果。
“從技術(shù)看這個是一個特別正常的結(jié)果”,李莉表示類似ChatGPT這樣的通用大模式,其訓練數(shù)據(jù)來自互聯(lián)網(wǎng)所有能找到的相關(guān)數(shù)據(jù),無論對錯全部輸給模型學習,只在輸出的時候由人工來核實部分結(jié)果并標注結(jié)果輸出的邊界。“因此,通用大模型往往變成那種看起來像專家的答案,但真正被行業(yè)內(nèi)人士分析就發(fā)現(xiàn)似是而非。”
在她看來,未來大模型發(fā)展最快的肯定不是ChatGpt這類通用模型,“產(chǎn)業(yè)模型或者細分行業(yè)模型有很大機會,因為只有在專業(yè)領(lǐng)域由專業(yè)的人員輔助大模型學習專業(yè)知識,才能真正為行業(yè)提供需要的人工智能輔助”。
對此,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生也表示,通用大模型一般是基于廣泛的公開文獻與網(wǎng)絡(luò)信息來訓練的,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導致回答的行業(yè)針對性與精準度不夠。“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業(yè)某個場景的需求。”但用戶對企業(yè)提供的專業(yè)服務,要求高、容錯性低,企業(yè)一旦向公眾提供了錯誤信息,可能引起嚴重后果。
2
TO B才是大模型未來發(fā)展核心
其實ChatGPT也不是沒想過要進入行業(yè)應用市場,但在理想與現(xiàn)實之間有了一個巨大的鴻溝。
眾所周知,通用大模型是利用互聯(lián)網(wǎng)知識進行培訓的,即所謂通用數(shù)據(jù)。其中既要花費大量的數(shù)據(jù)和資金進行訓練,可能效果還不是很好;另一方面又要維持日常運營,相關(guān)投入也非常大,讓一般的通用大模型壓力很大。
OpenAI的創(chuàng)始人在接受硅谷媒體的訪談時,也曾就ChatGPT3.5的邏輯和思維展現(xiàn)能力進行過闡述,然而他并不清楚ChatGPT3.5是如何實現(xiàn)這一功能的。事實上,他們在訓練ChatGPT的過程中,一直在不斷地將微軟必應搜索中的結(jié)果和用戶的對話數(shù)據(jù)輸入其中。
在訪談的最后,他也承認ChatGPT的出現(xiàn)只是一個美麗的誤會,但他們所能做的就是不斷為這樣的大模型提供資源,無論是軟件還是硬件都在此列。據(jù)觀看了這場訪談的李莉了解,OpenAI在短短三年內(nèi)就已經(jīng)燒掉了180億美元,現(xiàn)在又緊急融資了100億美元。這一事實恰恰印證了這一點。
但由于他們在行業(yè)上數(shù)據(jù)搜集能力不強,造成通用模型對于行業(yè)應用適用程度較低,沒有想象的好用。
另一方面,自2018年騰訊啟動930變革以來,中美互聯(lián)網(wǎng)技術(shù)的發(fā)展出現(xiàn)了明顯的路線差異。
各家互聯(lián)網(wǎng)企業(yè)以數(shù)實融合為開發(fā)產(chǎn)品和技術(shù)的基本思路,這體現(xiàn)了中國互聯(lián)網(wǎng)企業(yè)在滿足制造業(yè)和實際生產(chǎn)需求方面更為緊密的聯(lián)系。
從這一角度來看,中國互聯(lián)網(wǎng)企業(yè)將在推動社會經(jīng)濟發(fā)展方面具有更清晰明確的角色。
有趣的是,大模型的成長和訓練需要大量數(shù)據(jù)的支持。ChatGPT和谷歌Bard等領(lǐng)先的模型都是在通用大模型領(lǐng)域進行訓練的,它們的背后都有搜索引擎帶來的龐大數(shù)據(jù)支持。然而,盡管這些數(shù)據(jù)量龐大,但在特定行業(yè)的數(shù)據(jù)量和數(shù)據(jù)活躍度上,尚未完全滿足用戶的需求。
這實際上為中國企業(yè)提供了彎道超車的機會。中國龐大的人口基數(shù)使其在各個行業(yè)擁有比美國甚至世界其他國家更豐富的數(shù)據(jù)積累。無論是醫(yī)療、法律、物流還是細分行業(yè)的生產(chǎn)。在國家數(shù)據(jù)安全法的指導下,這些數(shù)據(jù)天然地與海外大模型隔離,保證了數(shù)據(jù)安全。
因此,這些B端數(shù)據(jù)被認為是中國大模型企業(yè)的巨大優(yōu)勢。
比如,中國已榮升為全球最大的工業(yè)機器人生產(chǎn)國和消費國,全球機器人市場中的75%是由中國的企業(yè)所購買。這些購買機器人的企業(yè),通常都將其機器人應用于核心工藝和核心流程中。
這一現(xiàn)象意味著,如果這些企業(yè)希望通過引入人工智能模型以提高管理效率,它們就必須部署自己的私有人工智能模型。他們需要通過訓練自己生產(chǎn)中的數(shù)據(jù),以滿足企業(yè)的發(fā)展需求。
如果能從中國一線企業(yè)采集到絕大多數(shù)機器人使用的參數(shù)和對應的數(shù)據(jù),就能以最快的速度幫助這些企業(yè)建立和訓練屬于自己的人工智能模型。
在這一點上,中國企業(yè)具有天然的優(yōu)勢。
3
為什么是騰訊先落子
專屬行業(yè)大模型,目前國內(nèi)騰訊是首先落子的領(lǐng)軍者之一。
在所有人都開始關(guān)注行業(yè)大模型的時候,在百度、阿里、科大訊飛等國內(nèi)大模型開發(fā)方都開始轉(zhuǎn)型行業(yè)大模型的時候,為什么騰訊能最先發(fā)布自己的行業(yè)大模型呢?
這可能跟騰訊在國內(nèi)率先提出互聯(lián)網(wǎng)平臺要跟產(chǎn)業(yè)相結(jié)合有關(guān)。
一方面,這幾年騰訊利用互聯(lián)網(wǎng)技術(shù)和AI技術(shù),在實體經(jīng)濟和生產(chǎn)一線做了很多嘗試,推動了很多新模式的落地,這已經(jīng)成為中國數(shù)實融合的樣板。騰訊在其中積累了很多面對行業(yè)企業(yè)的服務經(jīng)驗和數(shù)據(jù),同時也對行業(yè)企業(yè)的需求非常清楚,這為其建立行業(yè)大模型提供了良好的基礎(chǔ)。
另一方面,騰訊專門為行業(yè)大模型打造了自己的技術(shù)平臺。
這里面首先是星脈網(wǎng)絡(luò),這是騰訊云正式發(fā)布新一代HCC高性能計算集群。該集群采用騰訊云星星海自研服務器,服務器之間采用業(yè)界最高的3.2T超高互聯(lián)帶寬,為大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延遲的集群算力。實測顯示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內(nèi)性能最強的大模型計算集群。
其次是騰訊云專門為行業(yè)大模型打造的AI 原生(AI Native)向量數(shù)據(jù)庫。該數(shù)據(jù)庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景,是國內(nèi)首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數(shù)據(jù)庫。
正是有了這樣的技術(shù)基礎(chǔ),加上騰訊這些年服務行業(yè)客戶的經(jīng)驗和獲得的數(shù)據(jù),讓騰訊有了率先推出行業(yè)大模型的底氣。
騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲在人工智能大會期間接受媒體專訪時表示,騰訊希望在每個特定場景里面100%解決客戶的問題,“而不是找100個產(chǎn)品解決70%到80%的問題”。
在他看來,騰訊會聚焦找一些特定的行業(yè)跟客戶深入打磨解決行業(yè)的問題,“比如說文旅行業(yè)跟客戶做一些深入探討,比如說OTA領(lǐng)域的客戶在業(yè)務流程里面用大模型的技術(shù),結(jié)合自身的業(yè)務場景,還有數(shù)據(jù)相關(guān)的東西對大模型進行精調(diào),解決他的問題”。
關(guān)鍵,騰訊云從產(chǎn)業(yè)客戶需求場景出發(fā),基于大模型高性能計算集群,依托騰訊云TI平臺打造模型精選商店,為客戶提供MaaS一站式服務和“量體裁衣、普惠適用”的行業(yè)模型解決方案,全面降低落地門檻,助力客戶構(gòu)建專屬大模型及智能應用。
騰訊云TI平臺行業(yè)精調(diào)解決方案,支持客戶用自己的數(shù)據(jù)一站式訓練精調(diào),構(gòu)建自己的專屬大模型。具備五大優(yōu)勢:提供高質(zhì)量的行業(yè)大模型、完善的平臺工具、成熟的流程服務、全面的配套服務、領(lǐng)先的安全能力保障。
比如騰訊云升級行業(yè)大模型應用場景,行業(yè)大模型加持的金融風控解決方案,相比之前有了10倍效率提升。騰訊云風控大模型融合了騰訊過去20多年黑灰產(chǎn)對抗經(jīng)驗,和上千個真實業(yè)務場景,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升。企業(yè)可以基于prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現(xiàn)全流程零人工參與,建模時間也從2周減少到僅需2天。
再比如過去的同傳技術(shù),往往需要大量樣本數(shù)據(jù)進行訓練,尤其涉及一些特別專業(yè)領(lǐng)域的翻譯,也需要人工加持進行調(diào)優(yōu),才能保障翻譯效果?;谛袠I(yè)大模型技術(shù),不再需要百萬級的訓練數(shù)據(jù),使用小樣本訓練便也可以獲得不錯的翻譯結(jié)果,讓每一次交互翻譯,都對下句的翻譯提升發(fā)揮實時作用……
換句話說,騰訊既準備好自己的技術(shù)基礎(chǔ),又有行業(yè)數(shù)據(jù)知道行業(yè)想要什么,還做了一整套幫助企業(yè)落地大模型在自身業(yè)務應用的產(chǎn)品,形成了一整套推動大模型行業(yè)化的能力。
當然,騰訊對行業(yè)大模型是持開放態(tài)度的,他們覺得大模型是需要多分共同努力的結(jié)果。吳運聲就表示,大模型時代開放是非常重要的一個特點,“底層的技術(shù)變化太快,技術(shù)的這些外延的能力會非常廣,這種情況下發(fā)揮最大的價值只有開放,通過開放提升讓更多人加入進來,更多行業(yè)的專家,各類的角色人員加入進來,我們才能讓這個生態(tài),整個體系更加的健康,產(chǎn)生更多的可能性”。
對此,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生也認為,伴隨著大語言模型的發(fā)展,產(chǎn)業(yè)和社會也將從數(shù)字化、網(wǎng)絡(luò)化,走向智能化。“在這個過程中,騰訊始終認為,人工智能發(fā)展的根本目標是落地于產(chǎn)業(yè),服務于人”。
因為,只有能真正解決用戶需求、距離場景和數(shù)據(jù)更近的企業(yè),才能擁有大模型的未來。
文章系作者個人觀點如有疑問及任何意見反饋可直接在評論區(qū)留言或發(fā)送郵件
原文標題 : 騰訊靠什么突圍“百模大戰(zhàn)”?
標簽:
- 1 成都大運會力求實現(xiàn)賽事碳中和目標
- 2 新華社權(quán)威快報丨我國新型液氧甲烷火箭朱雀二號發(fā)射成功
- 3 2023《迷你世界》7月12日激活碼分享
- 4 雷科防務7月12日快速反彈
- 5 冷飲文化逐漸養(yǎng)成 制冰機的東風來了嗎?
- 6 龍灣探索處罰、教育、幫扶“三書同達”模式 涉企執(zhí)法,有罰更有幫
- 7 慕尼黑啤酒節(jié)負責人:今年啤酒節(jié)免費提供飲用水
- 8 能賺錢的時候就大賺特賺,今天抓了市場1/3的20cm漲停股票!
- 9 中韓面板廠角逐第八代OLED生產(chǎn)線,三星實力突出將率先量產(chǎn)
- 10 7月11日基金凈值:金信轉(zhuǎn)型創(chuàng)新成長混合發(fā)起式最新凈值2.028,漲2.84%
- 先于SpaceX,中國制造液氧甲烷火箭成功發(fā)射入軌
- 黎平縣肇興鎮(zhèn):旅游+“四大行動” 賦能鄉(xiāng)村旅游發(fā)展
- 大連至菲律賓直航服務航線增至4條
- 北約峰會未向烏克蘭發(fā)出入約邀請
- 南京一動物園推出釣鱷魚項目引發(fā)熱議,揚子鱷的戰(zhàn)斗力真跟一只大鵝差不多?
- 法拉第未來臨時首席財務官換人,將重述 2022 年年報
- 陜西省城固縣發(fā)布雷雨大風黃色預警
- 諾思格(301333):7月11日北向資金增持2.3萬股
- 北約峰會未向烏克蘭發(fā)出入約邀請
- 7月11日基金凈值:富國中證上海環(huán)交所碳中和ETF最新凈值0.7997,漲0.48%