Contents

什麼是零樣本學習以及它如何改進人工智慧

要點

為了確保遇到新資訊時的精確預測,深度學習演算法有效地進行泛化至關重要。零樣本學習技術透過使人工智慧系統能夠利用其預先存在的知識並對以前未觀察到的類別產生可靠的預測而無需任何標記數據來促進這一目標。

先進的零樣本學習透過補充語義輸入來近似人類的認知過程,從而可以在先前訓練的模型的幫助下對新類別進行精確分類。類似於人類根據其定義屬性識別空心吉他的能力,這種方法可以跨一系列不同的領域進行準確識別。

零樣本學習是一種創新方法,透過增強泛化、擴展、避免過度擬合和降低成本的能力來增強人工智慧能力。這種方法可以使用更廣泛的資料集來訓練模型,促進遷移學習以獲取更多知識,提供改進的上下文理解,並減少對大量標記資訊的依賴。鑑於人工智慧發展的進步,零樣本學習對於解決不同領域的複雜問題將變得越來越重要。

深度學習的首要目標是培養能夠具有普遍適用理解的模型。這項努力的完成至關重要,因為它意味著模型已經掌握了有價值的模式,並將針對新的或以前未觀察到的資訊熟練地產生精確的推論或判斷。建造這些類型的模型通常需要大量的標記材料。然而,獲得此類資源可能需要大量費用,需要大量的手動工作,有時由於實際限制甚至可能不可行。

為了解決上述問題,引入了零樣本學習作為一種方法,即使在沒有足夠標記資訊的情況下,也可以利用人工智慧預先存在的知識庫來產生合理的推論。

什麼是零樣本學習?

零樣本學習代表了遷移學習的一個實例,它涉及利用先前訓練的模型透過與這些新類別相關的補充細節來識別不熟悉的類別。

透過利用模型對特定主題的廣泛熟悉並提供有關要關注的相關特徵的附加背景,人們可以非常精確地有效識別其預期目標。

在缺乏識別斑馬的專門模型的情況下,人們可以利用設計用於識別馬的現有模型作為代理。透過告知該模型條紋馬確實是斑馬,它可以根據斑馬和馬的視覺特徵對它們進行有效分類。當將模型應用於描述這兩個物種的圖像資料時,這種方法提高了準確識別的可能性。

零樣本學習是一種類似人類自然獲取知識的技術。人類在沒有明確指導的情況下快速掌握新概念的能力稱為「零樣本學習」。例如,如果有人要求您在音樂商店找到一把空心吉他,這可能會很有挑戰性。然而,如果他們提供額外的信息,例如兩側發現的特徵性 F 形孔,那麼找到所需的儀器將變得毫不費力。

/bc/images/viktor-forgacs-nurl2wveb6w-unsplash-muo.jpg

為了用實際實例來說明這個概念,我們將利用開源大型語言模型 (LLM) 平台 Hugging Face 提供的零樣本分類應用程序,該平台採用 Clip-ViT-Large 模型。

/bc/images/zero-shot-learning-example.jpg

所描繪的照片展示了位於購物袋內的麵包,該購物袋使用安全帶牢固地固定在高腳椅上。影像主體在訓練過程中廣泛接觸了綜合視覺資料資料庫,使其能夠準確識別和分類場景中存在的各種元素,包括但不限於麵包、雜物、座椅家具等。限制裝置。

為了使模型能夠準確地對以前未知的類別(例如“放鬆麵包”、“安全麵包”、“坐麵包”、“駕駛雜貨店”和“安全雜貨店”)的圖像進行分類,必須先對不同的類別進行訓練。包含這些新類別範例的資料集。這將使模型在出現新實例時能夠很好地泛化,並正確預測它們各自的標籤。

值得注意的是,為了說明零樣本分類的能力,我們特意選擇了不太常見和以前未遇到過的類別以及圖像來進行演示。

/bc/images/huggingface-image-classification.jpg

根據模型進行推斷,將影像分類為「安全麵包」的置信度約為 80%。可以推測,這項決定源自於模型的認知,即用於安全的椅子比用於座椅舒適、放鬆甚至駕駛的椅子更重要。

當然,我們的期望與模型的輸出一致是令人欣慰的。然而,人們可能想知道該模型得出這一結論的過程。對零樣本學習的粗略了解可以提供對其機制的一些見解。

零樣本學習的工作原理

零樣本學習使預先存在的模型能夠利用先前獲得的知識來識別新類別,而無需提供額外的註釋資訊。這個過程包括三個基本階段:

### 準備

/bc/images/data-types.jpg

零樣本學習從產生三種不同形式的資訊開始

預訓練模型提供的資訊包含在其初始訓練階段使用的關於已識別的可見類別的資料。值得注意的是,這些模型為識別某些類別提供了基礎,無需任何額外的輸入或指令。為了從零樣本學習中獲得最佳結果,強烈建議選擇一個預訓練模型,其訓練資料集包含與想要識別的特定類別非常相似的類別。

資料集包含先前未用於演算法訓練過程的資訊。為了存取和分析這些未開發的數據,使用者有責任手動識別和收集它,因為它無法直接透過機器學習模型獲得。

可以利用附加語意資訊來幫助模型識別以前未見過的類別。此類補充資料可以採用各種形式,例如單字、短語、單字嵌入,甚至類別標籤。

語意映射

/bc/images/semantic-mapping-illustration-1.jpg

為了識別未知類別的特徵,我們生成詞嵌入並創建一個語義網絡,將這些屬性與可用的附加資訊連接起來。透過利用人工智慧領域先前學習者的現有知識(稱為「人工智慧遷移學習」),我們可以顯著加速這一過程,因為先前已經建立了許多與新類別相關的特徵。

推理

/bc/images/inferencing-model-illustration.jpg

推理涉及利用預先訓練的模型根據輸入實例產生預測或輸出。零樣本視覺分類需要從提供的圖像中產生詞嵌入,並以圖形方式將它們與其他支援資訊進行比較。保證程度將取決於輸入和所提供的補充資料之間的相似性。

零樣本學習如何改善人工智慧

零樣本學習為機器學習中固有的各種障礙提供了解決方案,例如:

增強的通用性:限制對標記資料的依賴使模型能夠在更廣泛的資料集中進行訓練,從而增強其通用性並增強其可靠性。隨著模型變得越來越知識豐富、用途廣泛,可以想像,它們可能會獲得常識,而不是遵循傳統的資訊分析方法。

透過稱為遷移學習的過程,人工智慧語言模型能夠獲得額外的知識,並隨著時間的推移變得越來越熟練。這使得公司和個人研究人員能夠持續增強各自模型的能力,從而確保它們在面對新的挑戰和機會時保持可擴展性和適應性。

在模型訓練中利用零樣本學習可以降低過度擬合的風險,當使用足夠多樣化的資料訓練模型時會發生過度擬合,從而導致潛在輸入變化的不完整表示。透過採用這種方法,該模型增強了對各種主題的上下文理解,從而減少了過度擬合的可能性。

與傳統方法相比,利用預先訓練的模型並使用更少的標記數據,利用零樣本遷移學習可以開發一種高效且經濟高效的方法來建立穩健的模型。

隨著人工智慧的不斷進步,零樣本學習等方法在其應用中將變得越來越重要和重要。

零樣本學習的未來

零樣本學習已成為機器學習的關鍵組成部分,使模型能夠在沒有任何特定指令的情況下識別和分類不熟悉的類別。隨著模型架構、基於屬性的方法和多模態整合等方面的不斷取得進展,零樣本學習有望大大增強人工智慧系統在解決機器人、醫療保健等領域的複雜問題時的靈活性。和電腦視覺。