Contents

5 個最佳開源 AI 影像產生器

人工智慧的進步帶來了大量可以輕鬆定期訪問的文本到圖像生成模型。儘管透過線上平台獲取所需的圖像很簡單,但利用開源文字到圖像生成器可以在整個創建過程中提供更大的靈活性。

可以在網路上找到幾個可免費存取且開源的人工智慧文字到圖像合成器,每個合成器都專注於特定類別的視覺效果。因此,在徹底審查這些選項後,我們編制了一份目前可供用戶使用的頂級開源人工智慧文字到圖像生成器的清單。

1 Craiyon

/bc/images/craiyon-home-page.jpg

Craiyon 是最容易存取的開源 AI 映像產生器之一。它基於DALL-E Mini,雖然您可以克隆Github 存儲庫 並將模型本地安裝在您的計算機上,但Craiyon 似乎已經放棄了這種方法對其網站的青睞。

官方 Github 儲存庫自 2022 年 6 月以來一直沒有更新,但最新模型仍然可以在 Craiyon 官方網站 上免費取得。也沒有 Android 或 iOS 應用程式。

在功能方面,此人工智慧影像產生器提供了人們在輸入影像生成提示時所預期的標準功能。此外,使用者還可以透過利用放大功能來提高生成影像的解析度。共有「藝術」、「照片」、「繪畫」三種獨特的藝術風格可供選擇。或者,選擇“無”選項可以讓模型本身確定樣式。

/bc/images/craiyon-generated-image.jpg

在專家模式中,包含否定關鍵字使模型能夠避開特定實體。 ChatGPT 促進的提示預測的結合提高了使用者製作全面且詳細的提示的熟練程度。此外,人工智慧驅動的背景去除功能可以透過自動化加快消除視覺媒體中不需要的背景的過程。

Craion 是一款功能簡單的 AI 影像產生工具。雖然它可能缺乏高級功能和複雜的細節,但其簡單性使其適合尋求基本但實用的解決方案而不要求生成的圖像具有高水平真實感的用戶。

該平台提供慷慨的使用政策,允許個人無需支付任何費用即可存取其服務。但是,免費用戶存在某些限制,例如對六十秒內可以處理的圖像數量的限制。要解鎖其他功能,包括無廣告體驗、加快處理時間以及安全儲存影像輸出的能力,您可以選擇升級至支持者或專業會員方案。這些計劃可提供按月付款和按年計費選項,並根據所選套餐提供不同級別的客製化和技術支援。此外,稱為客製化計畫的客製化解決方案透過提供個人化的機器學習模型、無縫整合功能、優先客戶服務和專有伺服器資源,提供了廣泛的靈活性。

2 穩定擴散 1.5

Stable Diffusion 是一種備受推崇的開源文字到圖像生成模型,自 2022 年發布以來獲得了廣泛的歡迎。三個例子。自推出以來,這種創新的影像合成方法已經有許多成功的實施。

/bc/images/stable-diffusion-web-ui.jpg

我將不再向您介紹該模型如何工作的過多技術細節(您可以查看他們的官方 Github 存儲庫),但該模型很容易即使是完全的初學者也可以安裝,只要您有至少4GB 記憶體的專用GPU,就可以正常使用。您也可以在線訪問 Stable Diffusion,如果您想在 Mac 上運行 Stable Diffusion,我們可以為您提供幫助。

有幾個檢查點(考慮它們的版本)可用於穩定擴散。雖然我們測試了 1.5 版,但 2.1 版 也在積極開發中,並且更加精確。

/bc/images/dreamshaper-ai-generated-image.jpg 亞杜拉‧阿比迪/萬物 N/DreamShaper

運行模型也相當容易。我們使用 AUTOMATIC1111 Stable Diffusion Web 使用者介面 對其進行了測試,所有控制項和參數都運作良好。由於模型訓練所使用的 LAION-5B 資料庫,它也完全不受 NSFW 的影響(請注意,儘管它並不完美)。雖然生成時間本身會根據您的硬體而有所不同,但即使有基本的提示,您也可以期望您的圖像是詳細且真實的。

3 DreamShaper

DreamShaper 是一種新穎的影像生成模型,採用穩定擴散原理作為其基礎。這款創新工具被設計為 MidJourney 的多功能且易於使用的替代品,在製作高度逼真的照片方面擁有出色的能力,同時在透過細微調整生成動畫和藝術繪畫風格方面也表現出卓越的適應性。

該模型比穩定擴散功能更強大,允許使用者對最終輸出有更大的自由度,從閃電改進到更寬鬆的 NSFW 限制。運行模型也很容易,可以透過可下載的預訓練版本在線進行本地訪問和許多網站,包括Sinkin.aiRandomSeedMage.space(需要基本訂閱),讓您可以透過GPU 加速運行模型。

/bc/images/dreamshaper-stablediffusion-comparison.jpg

與穩定擴散相比,DreamShaper 產生的影像顯然表現出更高程度的真實感、複雜性和照明度。儘管採用相同的輸入參數,DreamShaper 在視覺保真度和整體品質方面始終優於同類產品。

穩定擴散與其他生成模型的顯著區別之一在於它們能夠創建逼真的人類主體表示,例如肖像或人物。雖然這些模型可以產生高度詳細和準確的描繪,這無疑令人印象深刻,但與依賴更多主觀解釋和創造力的傳統藝術形式相比,它們可能仍然存在不足。事實上,有人可能會說,藝術品的獨特性和價值的本質恰恰在於它的不完美和個性。因此,雖然人工智慧生成的圖像可能在技術上很熟練,但它們最終可能缺乏區分真正偉大的藝術作品和純粹模仿的情感深度和個人風格。

您不一定需要大量的計算系統來運行這個特定的模型。事實上,我的 NVIDIA GeForce GTX 1650Ti 具有 4 GB 顯存,在執行模型時表現出色。儘管生成過程花費的時間稍長,但似乎對最終輸出沒有明顯影響。然而,應該指出的是,可能需要更大的視訊記憶體才能有效管理 DreamShaper XL 的苛刻要求,DreamShaper XL 是建立在穩定擴散 XL 模型基礎上的。

4 InvokeAI

Invoke AI 是一種複雜的影像生成模型,它利用先進的穩定擴散演算法來創建具有視覺吸引力的影像。此型號擁有兩個版本-一種標準型和一種 XL 型-兩者都旨在高效地提供高品質的結果。此外,Invoke AI 還具有使用者友好的 Web 和命令列介面,無需使用者透過複雜的介面(例如其他 AI 模型中的介面)進行導航。

/bc/images/invokeai-user-interface-with-image.jpg

我們產品的核心在於使用戶能夠根據其專有知識生成視覺上引人入勝的內容,並根據個人喜好自訂流程。在這方面,我們利用了 InvokeAI 的強大功能,InvokeAI 是一種頂級開源人工智慧模型,專門用於透過與專有資產的無縫整合來培養定製影像。

它的官方Github儲存庫列出了兩種安裝方法:透過InvokeAI的安裝程式安裝或使用PyPI(如果您熟悉終端)並且Python,並且需要對隨模型安裝的套件進行更多控制。

為了利用 InvokeAI 提供的附加功能,必須滿足系統規格方面的某些先決條件。具體來說,需要至少具有 4GB 記憶體的專用 GPU,建議較大型號使用 6-8GB。 AMD 和 Nvidia 顯示卡都受到這些相同的 VRAM 限制。此外,至少需要 12GB RAM 和 12GB 可用硬碟空間來容納神經網路模型以及任何相關的依賴項和 Python 安裝檔案。

/bc/images/invoke-ai-generated-image.jpg 亞杜拉‧阿比迪/All Things N/InvokeAI

雖然由於視訊記憶體不足,文件中不建議這樣做,但我們使用 Nvidia 的 GTX 10 系列和 16 系列圖形處理單元 (GPU) 進行的測試安裝過程是成功的。但請注意,性能可能會因各個系統規格而異。此外,我們想告知運行低端 GPU 的用戶,他們在看到視覺輸出之前可能會經歷稍長的等待時間。最後,對於使用 Windows 作業系統的用戶,請注意,目前僅支援 Nvidia GPU,而 AMD GPU 仍不受支援。

InvokeAI 平台目前的實施傾向於製作藝術圖像,而不是照片級真實感圖像。但是,可以透過使用自訂資料集訓練模型來調整這一點。這種方法在產生逼真影像時會產生更好的結果,特別是在產品設計、建築和零售環境等領域。應該指出的是,雖然 InvokeAI 作為有效的圖像生成引擎,但實現最佳結果可能需要利用透過使用者介面內的內建模型管理器存取的外部模型。

5 開放之旅

Openjourney 是一種人工智慧影像生成模型,利用穩定擴散技術並作為開源平台運作。 「Openjourney」這個名稱反映了這樣一個事實:該模型已使用 Midjourney 圖像進行訓練,以在生成的圖像中複製其獨特的視覺風格。

Openjourney 背後的公司 PromptHero 讓您可以與其他模型一起測試模型,包括穩定擴散(版本 1.5 和 2)、DreamShaper 和 Realistic Vision。註冊時,您將獲得25 個免費積分(每生成一張圖像就獲得一個積分),之後您必須訂閱他們的Pro 訂閱套餐,每月費用為9 美元,每月可以使用300 個積分以及其他獨家功能。

/bc/images/openjourney-stablediffusion-comparison.jpg

但是,如果您想在本地免費運行它,您可以從 HuggingFace 下載模型檔案 並使用 Stable Diffusion Web UI 運行它。 Openjourney 也是 HuggingFace 上下載量第二高的 AI 影像生成模型,僅次於 Stable Diffusion。

Openjourney 網站上沒有明確說明離線下載和實現其 AI 模型需要哪些硬體先決條件。然而,這些必需品很可能與穩定擴散所需的必需品相當。要成功運行該模型,設備上應能夠使用配備至少 4 GB 視訊記憶體 (VRAM)、16 GB RAM 和大約 12 至 15 GB 可用儲存容量的專用圖形處理單元 (GPU)以適應模型及其相關組件。

/bc/images/openjourney-ai-generated-image.jpg 亞杜拉‧阿比迪/萬物 N/OpenJourney

Openjourney 產生的圖像在現實主義和藝術性之間取得了平衡,但提出的任何特定要求除外。對於那些尋求體現照片寫實主義和藝術特徵的多功能模型,同時避免支付訂閱費用的人來說,Openjourney 是一個非常合適的選擇。