免费看一区二区三区,99热国产免费,欧美日韩中文

您當前的位置：首頁-AI-詳情

【全球聚看點】Google 下一款 ChatGPT 競品曝光：投入或超 GPT-4，AlphaGo 成秘密武器

2023-06-27 20:17:27來源：ZAKER科技

ChatGPT 的大火，可把 Google 急壞了。

(資料圖)

要知道 ChatGPT 中的「T」表示的是 Transformer 模型，出自于 Google 研究團隊，而現在這一技術在競爭對手 OpenAI 的手上發光發熱，這令 Google 頗感尷尬。

為應對這一挑戰，Google 迅速推出了自己的聊天機器人 Bard，并且開始整合 AI 資源，合并了兩大研究團隊 Google Brain 和 DeepMind，創建了 Google DeepMind，由 DeepMind 原 CEO Demis Hassabis 領導。

Hassabis 表示 Google 有 80% 或 90% 的 AI 創新都出自于這兩個團隊。

在上個月的 Google I/O 大會上，Google CEO Sundar Pichai 官宣了一個重磅消息：Google DeepMind 正在研究一個全新的大語言模型，代號為 Gemini（雙子座），這也是這兩只團隊合并后首次合作的項目。

近日，Demis Hassabis 在接受 Wired 的采訪了透露了更多與 Gemini 有關的消息，這可能是 Google 向 OpenAI 反擊的關鍵戰役。

正在追趕的 Google

此前大家猜測，Gemini 和 GPT 模型類似，都是有著出色文本處理能力的大語言模型，兩者的差異可能會體現在訓練參數的規模上，模型規模越大，處理能力可能就會越強。

然而 Hassabis 表示，Gemini 有很多不太一樣地方，例如 Google DeepMind 團隊正在將 AlphaGo 中使用的技術結合語言模型，以賦予更強的規劃或解決問題能力等等。這可能會成為 Gemini 的「殺手锏」技能。

抽象來看，你可以將 Gemini 看作是將 AlphaGo 型系統的一些優點與大模型的語言能力相結合。我們還有一些新的創新，這將非常有趣。

2016 年，橫空出世的 AlphaGo 擊敗了圍棋冠軍李世石，讓全世界第一次真切地感受到 AI 技術的震撼。

AlphaGo 的技術基于一種名為「強化學習」的訓練方法，通過反復試驗和反饋來學習如何解決問題，它還使用了一種稱為樹搜索的方法，探索并記住可能的走法。

Google DeepMind 團隊希望將這些技術應用到語言模型中，使它們能夠在互聯網和計算機上執行更多任務。

DeepMind 在機器學習和強化學習有著豐富的經驗，開展過多項重要的研究，包括：

AlphaGo：第一個擊敗人類世界冠軍的圍棋程序。AlphaGo 的成功標志著 AI 在處理復雜策略游戲方面的重大突破。

AlphaZero：AlphaZero 是一個通用的強化學習算法，可以在沒有任何先驗知識的情況下，僅通過自我對弈學習如何玩棋類游戲。AlphaZero 已經證明了其在國際象棋、將棋和圍棋等游戲中的超強實力。

AlphaFold：AlphaFold 是一個可以預測蛋白質結構的深度學習系統。這個系統的準確性在生物學領域引起了廣泛關注，因為它可以幫助科學家更好地理解疾病，并加速藥物的發現和開發。

WaveNet：WaveNet 是一個深度生成模型，用于生成自然 sounding 的語音。它已經被廣泛應用于語音合成和音樂生成等領域。

MuZero：MuZero 是一個無模型強化學習算法，它可以在沒有環境模型的情況下，通過預測其動作的結果來學習策略和價值函數。MuZero 已經在多個任務和游戲中表現出了超強的性能。

DeepMind 在強化學習方面的深厚經驗可能會為 Gemini 帶來超越 ChatGPT 的新能力。

Hassabis 表示，Gemini 模型仍在開發中，這個過程將需要幾個月的時間，可能花費數千萬或者上億美元。作為對比 OpenAI CEO Sam Altman 在四月份表示，創建 GPT-4 的成本超過了 1 億美元。

Gemini 不僅僅是對 ChatGPT 做出的防御之舉，還將是 Google 未來部署搜索等產品的技術基礎。

Hassabis 表示，AI 的非凡潛在益處，例如健康或氣候等領域的科學發，人類必須不停地發展這項技術。如果運用恰當的話，AI 將是對人類最有益的技術。

我們必須大膽且勇敢地去追求那些東西。

Google 不為人知的「護城河」

在 AI 研究方面，Google 還有一張蓋住的王牌——全球最大的視頻網站 YouTube。

視頻是個非常多元的內容載體，我們可以把它分解成圖像、音頻和文字記錄。Google 擁有 YouTube，也就意味著擁有最豐富的圖像、音頻訓練內容。

根據 The information 報道，有內部人士透露 OpenAI 早已經悄悄地使用 YouTube 上的內容來訓練其人工智能模型。

Google 自然不會忽視這座「金山」，The Information 繼續爆料稱 Google 的研究團隊也在利用 YouTube 訓練 Gemini 模型，并且 Google 能夠比競爭對手們獲得更完整的內容數據。

對于大語言模型來說，高質量的訓練數據比黃金還要寶貴。

由于 YouTube 很多都是真實的對話，Google 可以利用 YouTube 視頻的音頻文本或描述作為訓練 Gemini 的另一個文本來源，從而提高它的語言理解能力，并產生更加真實的對話反饋。

利用 YouTube 的視頻內容，Google 還可以開發出類似于 Runway 用文本生成視頻的多模態功能，用戶只需要輸入他們的描述就能生成出一條精美的視頻。

除了制作視頻，多模態模型還可以有更多的可能性，例如可以根據 YouTube 視頻直接總結出球賽的亮點，或者根據視頻幫助機械師診斷汽車修理問題。

OpenAI 在發布 GPT-4 模型時，曾展示過從草圖生成網站代碼的功能，這也是多模態模型的一個重要應用領域。

前 YouTube 高管 Shishir Mehrotra 表示，對 Google 來說，YouTube 視頻簡直就是一座數據金礦。

這不僅僅是因為視頻的存在，而是因為視頻存在于一個生態系統中。

YouTube 上的視頻向 AI 展現了了人類是如何進行對話，這和書面化的文本有很大的不同，可以幫助模型更好的理解人類對話的邏輯，并生成更恰當的反饋。

不僅如此，Google 還收集大量的用戶互動數據，清楚用戶對視頻的那些部分最感興趣、哪些部分容易跳出、哪些內容會吸引用戶評論等等。

據統計，YouTube 每分鐘就有 500 小時的視頻上傳到網站上，Google 可以說是坐在了一座會源源不斷生產金子的金山上，這或許會成為 Google 真正的護城河。

多模態才是未來

隨著多模態模型越來越受到重視，未來會有更多的開發人員選擇用視頻訓練語言模型。AI 教父、Meta AI 首席研究員 Yann LeCun 在近日一條推文中稱：「通過視覺學習世界如何運轉的系統，將對現實有更深刻的理解」，并稱贊了 Meta 在這一領域的研究成果。

著名風投機構 A16Z 在最近采訪了四家明星 AI 公司 AnthropicAI、Cohere、Character AI、AI21Labs 的 CEO 和創始人，探討出生成式 AI 當前最需要突破的四個方向，分別是操控、記憶、四肢（訪問瀏覽器等）和多模態。

這四項關鍵關鍵創新將主導 AI 在未來 6 個月到 12 個月的發展，這也會影響公司和開發者改變構建產品的方式。

Cohere 的 CEO Aidan Gomez（著名論文《Attention is all you need》的主要作者之一）表示，AI 系統的能力終究是有限的，因為并非所有的內容都是文本形式，因此多模態能力對于大語言模型來說是個重要的發展方向，像 GPT-4、 Character.AI 和 Meta 的 ImageBind 等模型已經在處理和生成圖像、音頻等內容。

我們現在的模型確實是字面意義上的「盲人」，這需要改變。

Aidan Gomez 在采訪中總結道。

多模態模型能夠極大地拓寬 AI 的應用場景，例如可以用在自動駕駛汽車或其他需要與物理世界實時交互的場景上。此前，Google 在 I/O 大會發布的 Med-PalM-2 模型便展示過可以分析 X 光照片的能力。

這也讓人更加期待，更強大的 Gemini 能在多模態領域給我們多大的驚喜。現在看來，暫時取得領先的 OpenAI，遠沒有到停下來休息的時刻。

點擊「在看」

是對我們最大的鼓勵

標簽：

互聯網