Contents

如何在中途圖像中創建文字(並獲得良好的結果)

### 快速鏈接

⭐第 1 步:選擇生成文字的中途模型

⭐第 2 步:在中途提示中加入文本

⭐第3步:使用正確的關鍵字產生帶有文字的圖像

⭐第4步:如何在中途獲得良好的文字結果

要點

與其他模型相比,Midjourney v6 在視覺圖像中生成文字內容方面表現出卓越的能力,只需最少的額外措施或調整。

結合適當的引用和相關提示可以透過附加上下文來增強視覺內容,使其更具影響力。

探索多樣化的形容詞選項,嘗試各種措辭,透過創意修改重新解釋內容,並完善語氣以提高 Midjourney 平台內的整體寫作品質。

Midjourney 的版本 6 允許相對輕鬆地在圖像中生成文字。雖然可能會出現拼字不準確等缺陷,但這些問題可以透過使用適當的關鍵字選擇和變體來解決。本指南將逐步演示如何有效糾正在此過程中可能出現的任何錯誤。

第 1 步:選擇生成文字的中途模型

/bc/images/example-images-of-text-generation-in-midjourney-in-v4-v5-2-and-v6.jpg

我們的實驗涉及評估 Midjourney 模型的三個不同迭代,主要目標是確定它們在圖像中生成連貫文字的能力。研究結果明確表明,Midjourney 模型的版本 6 在這方面表現最佳。

Midjourney 模型的第 6 版在文字生成功能方面取得了顯著進步,因為它現在可以產生連貫且有意義的輸出,而無需依賴任何複雜的解決方法或繁瑣的流程。

要獲取有關當前正在使用的聊天機器人模型的信息,請在提供的文字欄位中輸入“/settings”,然後按鍵盤上的“Enter”。隨後,請選擇下拉式選單並選擇版本 6 或更新版本。建議您選擇最新發布的型號。

/bc/images/settings-to-change-the-model-version-in-midjourney.jpg

如果您不熟悉該平台並需要額外協助來導航其功能,我們建議您查閱我們關於「中途入門」的綜合指南。此資源提供了逐步說明和有用的提示,幫助您從旅程一開始就有效地利用該平台。

第 2 步:將文字加入到中途提示中

為了確保特定術語或短語出現在語言模型產生的圖像中,需要將它們括在引號內。此外,提供有關其位置和格式的清晰說明可以提高提示的有效性。

/bc/images/example-prompt-in-midjourney-with-some-words-in-quote-marks.jpg

以刻有「1970年代世界博覽會」的復古廣告看板為例,我們已經劃定了文字所在的位置,也就是廣告看板的表面,以及它應該呈現的方式,特別是透過油漆的應用。

/bc/images/midjourney-image-of-a-billboard-painted-with-1970-world-fair-1.jpg

步驟 3:使用正確的關鍵字產生帶有文字的圖像

有許多描繪書面表達的技術,包括繪畫、印刷、浮雕和沖壓等傳統方法,以及塗鴉、刮痕和銘文等非傳統方法。當您試圖在自己的寫作中傳達特定的細微差別或效果時,請隨意使用一系列最能表達您的意圖的描述性術語。

看看下面的例子:

盧克餐廳的草圖描繪在一張小紙上,用墨水筆畫裝飾並用書寫工具刻字

一張經過深思熟慮的便條,用書寫工具在餐巾紙上潦草寫下,標題是「盧克的晚餐」。

使用了兩個高度相似的提示,其中一個包含描述性術語“書面”,而另一個則省略了它。這種看似微不足道的差異導致所描繪的圖像發生了顯著的變化,為每個提示提供了明顯不同的結果。

/bc/images/comparison-of-two-midjourney-images-created-for-the-prompt-luke-s-diner.jpg

如果人們希望產生沒有任何特定上下文設定的文本,相關的關鍵字將是版式設計。這種技術對於製作可在各種事業中使用的標誌和設計元素特別有效。

/bc/images/midjourney-image-of-a-retro-typography-design-with-words-luke-s-diner.jpg

Prompt: Typography design of "Luke's Diner" written in retro red and white font --ar 2:1

步驟 4:如何在中途獲得良好的文字結果

重要的是不要因次優結果而氣餒,因為可以透過嘗試多種替代版本來修正這些問題。正如下面的插圖所示,多次使用變體選項有助於獲得與初始版本非常相似的圖像,但具有準確的拼字。

/bc/images/progression-of-midjourney-images-using-the-variation-button.jpg

人們可以透過選擇標記有1到4範圍內的數字的四個影像承載按鈕中的任何一個來重複上述過程,這些按鈕對應於給定集合內的視覺元素。

/bc/images/midjourney-variation-buttons-underneath-an-image.jpg

使用混音功能

人們可以透過啟動「混音」功能來增強這種方法的實用性。啟用此選項使用戶能夠在選擇變體時修改原始提示,從而更好地操縱視覺內容並促進圖像內文字的變更。

啟用混音模式非常簡單。只需在輸入欄位中輸入“/prefer remix”,然後按 Enter 兩次即可啟動它。將出現一條通知,通知您混音模式已啟用,讓您可以相應地調整您的首選項。

下次您使用“V”鍵產生迭代時,將彈出一個顯示初始指令的彈出窗口,您可以在其中根據需要自由修改內容。您還可以替換文本,如果您需要訪問最有效的關鍵字組合,可以仔細閱讀第三步以供參考。

/bc/images/remix-propmt-dialog-in-midjourney.jpg

一般來說,在與圖像搭配時,簡短而簡潔的文字是最佳效果的選擇。與不相關或無意義的標題相比,使用與照片內容直接相關的常用短語或簡短表達可以產生更好的結果。一個典型的例子是標有“蜜月汽車旅館”的酒店標誌,它比“火山口舒適酒店”更能喚起更強烈的情感和聯繫。

以下是一些更高級的方法來完成此任務,可應用於各種創造性的工作,例如生成人工智慧生成的自畫像:1。使用特定於項目的資料微調預訓練模型:透過在與您的專案特別相關的資料集(例如您自己的影像或類似肖像)上進行訓練來調整模型的參數,可以提高其產生真實輸出的效能。此方法利用遷移學習的力量,同時客製化模型以滿足特定要求。2.實施資料增強策略:在訓練期間對輸入資料應用隨機變換,例如旋轉、翻轉、縮放或顏色調整,可以增加生成樣本的多樣性並增強模型的泛化能力

/bc/images/midjourney-image-of-a-neon-honeymoon-motel-sign-by-a-motel.jpg

雖然在生成的文本中觀察到拼寫錯誤的單字和重複的短語的情況令人遺憾,但可以透過實施各種技術來快速解決問題,例如利用不同的語言組合、採用「重新混合」功能以及確保正確的關鍵字選擇。與其他領先的人工智慧產生器相比,Midjourney 的與眾不同之處在於其促進這些改進的卓越能力。

Midjourney 提供了一個使用者友善的平台,與早期模型相比,可以以最少的工作量和複雜性產生高品質的文字。該平台的無縫功能消除了通常與其他文字生成工具相關的大量解決方法的需求。