為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則
### 快速鏈接
⭐什麼是上下文視窗?
⭐為什麼 Gemini 1.5 的上下文視窗很重要
⭐Gemini 1.5會不負眾望嗎?
要點
谷歌人工智慧廣告平台的最新版本被稱為 Gemini 1.5,它引入了一項令人印象深刻的功能,使其在業內競爭對手中脫穎而出。具體來說,這個新版本擁有引人注目的一百萬個代幣上下文窗口,這比 Claude 和 ChatGPT 目前提供的其他平台要大得多。這項增強功能可以在透過該平台管理的廣告活動中提供更全面的分析和定位功能,最終為使用者帶來更好的效果和結果。
增加上下文視窗的大小可以提高人工智慧模型的效能,同時減少出錯的可能性。然而,值得注意的是,這並不一定能確保整體成功。
Gemini 1.5 有可能透過利用更大的上下文視窗來顯著提高其準確性水平,從而減少錯誤並提高整體理解力。
谷歌 Gemini 平台的最新版本 1.5 擁有令人印象深刻的 100 萬個代幣上下文窗口,超過了 ChatGPT、Claude 和其他各種人工智慧聊天機器人等競爭對手。
擬議的增強功能似乎代表了重大改進,這有可能使 Gemini 與競爭對手區分開來。雖然理解這一進步的幅度可能會帶來一些挑戰,但雙子座提供的顯著擴展的上下文視窗可能會帶來本質上的變革。
什麼是上下文視窗?
人工智慧模型在提供澄清概念或壓縮文字等回應時,受到生成答案時可以考慮的資料範圍的限制,這稱為「上下文視窗」。
另一個需要考慮的角度是在沒有預先建立的庫存清單的情況下訪問市場購買物資。在這種情況下,一個人的記憶邊界定義了他們的“上下文視窗”,這直接影響了成功完成預期購買的可能性。因此,增強人工智慧系統的記憶能力使其能夠保留所有必要的信息,並在遵循使用者偏好的同時增加提供最佳結果的可能性。
目前,Anthropic 的 Claude 2.1 擁有所有易於存取的 AI 模型中最廣泛的上下文窗口,測量數量為 20 萬個代幣。緊隨其後的是 GPT-4 Turbo,它的上下文視窗大小為 128k 個令牌。然而,Google Gemini 1.5 準備引入驚人的 100 萬個代幣上下文窗口,大幅超越市場上的所有現有產品。如此大的背景窗口的出現引發了對其在行業內的潛在影響和意義的重大質疑。
為什麼 Gemini 1.5 的上下文視窗很重要
簡單來說,Claude AI 擁有在 20 萬個上下文視窗內處理大約 15 萬個單字的強大能力,這是相當令人印象深刻的。另一方面,Google 的 Gemini 1.5 具有更廣泛的能力,因為它可以同時處理多達 700,000 個單字。
由於上下文視窗的限制,在 ChatGPT 或 Gemini 等人工智慧聊天機器人的範圍內整合大量資訊並不總是可行。如果不考慮這一點,可能會導致嘗試處理的數據超出系統可以有效管理的數據,從而導致交換期間出現潛在問題。
設想這樣一個場景:您需要在觀看一部完整的長片前二十分鐘後對其進行總結。這種努力的結果可能會令人不滿意,因為提供對電影情節和角色發展的全面描述將是極具挑戰性的。在這種情況下,人們完全拒絕提供任何解釋,或者編造一個虛構的敘述是合理的,因為人工智慧在基於有限輸入生成連貫響應方面存在固有的局限性。因此,由於人工智慧無法完全掌握人類溝通的複雜性,這些捏造的故事可能會產生虛幻的感知。
值得注意的是,對話的上下文不僅僅是在單一提示中提供大量文字以輸入人工智慧模型。人工智慧模型會考慮聊天會話過程中發生的整個對話,以產生適當且相關的回應。這種對上下文的更廣泛的視角有助於確保生成的輸出與用戶通訊背後的預期含義和意圖保持一致。
我們與人工智慧語言模型交流的動態性質有助於它們對上下文的理解。雖然我們可能不會向他們提供冗長的文本,但我們的互動過程和他們產生的回應逐漸豐富了上下文視窗。這些系統看似無視先前討論的主題的現象可以歸因於超出了上下文視窗的儲存容量。因此,重要的資訊被丟棄,導致記憶喪失。
當處理需要複雜理解上下文的任務時,例如壓縮冗長的文章、解決複雜的查詢或在所產生的話語中保持無縫連續性,更廣泛的上下文框架至關重要。渴望創作一部五萬字、故事情節統一的小說?正在尋找一種能夠審查和回應與一小時視訊演示相關的詢問的模型?在這兩種情況下,更廣泛的上下文視窗都變得必不可少。
從本質上講,Gemini 1.5 提供的擴展上下文範圍有可能大幅增強其人工智慧模型的功效,減少誤傳的情況,並顯著提高精確度和對指令的遵從性。
Gemini 1.5 會不負眾望嗎?
鑑於 Google 過去開發不穩定 AI 模型的經驗,謹慎行事是明智的,不要認為增加上下文視窗一定會帶來 Gemini 1.5 的卓越效能。雖然這個新版本有可能超越目前的行業標準,但我們必須保持謹慎,並考慮簡單參數調整以外的其他因素。
自從 Claude 2.1 的 200k 上下文視窗推出以來,我一直在使用它,我發現擴展的上下文視窗可以增強上下文敏感性,這一點已經變得很明顯。然而,底層模型效能的缺陷可能會導致上下文視窗的增加成為障礙而不是資產。
Google Gemini 1.5 會為我們帶來遊戲規則改變者嗎?目前,社群媒體上充斥著搶先體驗用戶對 Gemini 1.5 的熱烈評論。然而,大多數 5 星級評論都源於倉促或簡化的用例。檢查 Gemini 1.5 在野外的表現如何的好地方是 Google 的 Gemini 1.5 技術報告 [PDF]。該報告顯示,即使在「受控測試」期間,該模型也無法在其上下文視窗的大小範圍內很好地檢索文件的所有微小細節。
事實上,雖然實現一百萬個令牌上下文視窗代表了一項值得注意的技術成就,但如果無法始終如一地實現對文檔細節的可靠檢索,其實用性可能會降低。相反,此類限制可能會導致精度降低以及出現無根據的推測或猜測。