Contents

Cách tạo văn bản trong hình ảnh giữa hành trình (và nhận được kết quả tốt)

Đường dẫn nhanh

⭐Bước 1: Chọn mô hình giữa hành trình tạo ra văn bản

⭐Bước 2: Thêm văn bản vào lời nhắc giữa hành trình của bạn

⭐Bước 3: Sử dụng đúng từ khóa để tạo hình ảnh có văn bản

⭐Bước 4: Cách nhận được kết quả văn bản tốt trong nửa chặng đường

Bài học chính

Midjourney v6 thể hiện sự thành thạo đặc biệt trong việc tạo nội dung văn bản trong hình ảnh trực quan khi so sánh với các mô hình khác, đòi hỏi các biện pháp hoặc điều chỉnh bổ sung tối thiểu.

Việc kết hợp các trích dẫn được đặt đúng chỗ và các tín hiệu liên quan có thể nâng cao nội dung trực quan bằng ngữ cảnh bổ sung, khiến nội dung đó có tác động mạnh mẽ hơn.

Khám phá các tùy chọn tính từ đa dạng, thử nghiệm nhiều cụm từ khác nhau, diễn giải lại nội dung thông qua các sửa đổi sáng tạo và tinh chỉnh giọng điệu để nâng cao chất lượng tổng thể của bài viết trong nền tảng của Midjourney.

Phiên bản 6 của Midjourney cho phép tạo văn bản trong hình ảnh một cách tương đối dễ dàng. Mặc dù có thể xảy ra những điểm không hoàn hảo như cách viết không chính xác nhưng những vấn đề này có thể được giải quyết thông qua việc sử dụng các lựa chọn và biến thể từ khóa thích hợp. Hướng dẫn này sẽ trình bày từng bước về cách sửa chữa hiệu quả mọi lỗi có thể phát sinh trong quá trình này.

Bước 1: Chọn mô hình giữa hành trình tạo ra văn bản

/vi/images/example-images-of-text-generation-in-midjourney-in-v4-v5-2-and-v6.jpg

Thử nghiệm của chúng tôi liên quan đến việc đánh giá ba lần lặp riêng biệt của mô hình Midjourney, với mục tiêu chính là xác định khả năng tạo văn bản mạch lạc trong hình ảnh của chúng. Các phát hiện này chỉ ra một cách rõ ràng rằng phiên bản 6 của mô hình Midjourney nổi lên là phiên bản có hiệu suất cao nhất về mặt này.

Phiên bản 6 của mô hình Midjourney tự hào có sự tiến bộ đáng kể về khả năng tạo văn bản vì giờ đây nó có thể tạo ra đầu ra mạch lạc và có ý nghĩa mà không cần dựa vào bất kỳ cách giải quyết phức tạp hoặc quy trình rườm rà nào.

Để có được thông tin về mô hình chatbot hiện tại đang được sử dụng, vui lòng nhập “/settings” vào trường văn bản được cung cấp và sau đó nhấn “Enter” trên bàn phím của bạn. Sau đó, vui lòng chọn menu thả xuống và chọn phiên bản 6 hoặc phiên bản mới hơn. Bạn nên chọn mẫu được phát hành gần đây nhất.

/vi/images/settings-to-change-the-model-version-in-midjourney.jpg

Nếu bạn chưa quen với nền tảng này và cần hỗ trợ thêm trong việc điều hướng các tính năng của nó, chúng tôi khuyên bạn nên tham khảo hướng dẫn toàn diện của chúng tôi về “Bắt đầu với Midjourney”. Tài nguyên này cung cấp hướng dẫn từng bước và mẹo hữu ích để sử dụng hiệu quả nền tảng ngay từ đầu hành trình của bạn.

Bước 2: Thêm văn bản vào lời nhắc giữa hành trình của bạn

Để đảm bảo rằng các thuật ngữ hoặc cụm từ cụ thể xuất hiện trong hình ảnh do mô hình ngôn ngữ tạo ra, việc đặt chúng trong dấu ngoặc kép là cần thiết. Ngoài ra, việc cung cấp hướng dẫn rõ ràng về vị trí và định dạng của chúng có thể nâng cao hiệu quả của lời nhắc.

/vi/images/example-prompt-in-midjourney-with-some-words-in-quote-marks.jpg

Trong ví dụ về bảng quảng cáo cổ điển có dòng chữ “Hội chợ Thế giới những năm 1970”, chúng tôi đã phác họa vị trí đặt văn bản, cụ thể là bề mặt của bảng quảng cáo cũng như cách thức trình bày nó, đặc biệt thông qua việc áp dụng sơn.

/vi/images/midjourney-image-of-a-billboard-painted-with-1970-world-fair-1.jpg

Bước 3: Sử dụng đúng từ khóa để tạo hình ảnh có văn bản

Tồn tại vô số kỹ thuật để mô tả cách diễn đạt bằng văn bản, bao gồm cả các phương pháp truyền thống như vẽ, in, dập nổi và đóng dấu, cũng như các phương pháp độc đáo hơn bao gồm vẽ bậy, vết xước và chữ khắc. Khi tìm cách truyền tải một sắc thái hoặc hiệu ứng cụ thể trong bài viết của riêng bạn, hãy thoải mái sử dụng một loạt các thuật ngữ mô tả để nắm bắt tốt nhất ý nghĩa dự định của bạn.

Lấy các ví dụ dưới đây:

Một bản phác thảo về Bữa tối của Luke được mô tả trên một mảnh giấy nhỏ, được trang trí bằng những nét mực và được khắc bằng một dụng cụ viết

Một ghi chú được soạn thảo cẩn thận, được viết nguệch ngoạc trên khăn giấy bằng dụng cụ viết, mang tiêu đề “Bữa tối của Luke.

Việc sử dụng hai lời nhắc rất giống nhau đã được thực hiện, trong đó một lời nhắc kết hợp thuật ngữ mô tả “được viết” trong khi lời nhắc kia bỏ qua nó. Sự chênh lệch dường như không đáng kể này đã dẫn đến sự thay đổi đáng chú ý đối với hình ảnh được mô tả, tạo ra các kết quả khác biệt rõ rệt cho từng lời nhắc tương ứng.

/vi/images/comparison-of-two-midjourney-images-created-for-the-prompt-luke-s-diner.jpg

Nếu người ta mong muốn tạo ra văn bản không có bất kỳ cài đặt ngữ cảnh cụ thể nào, thì từ khóa thích hợp sẽ là thiết kế kiểu chữ. Kỹ thuật này đặc biệt hiệu quả trong việc tạo ra các biểu tượng và các yếu tố thiết kế có thể được sử dụng cho nhiều dự án khác nhau.

/vi/images/midjourney-image-of-a-retro-typography-design-with-words-luke-s-diner.jpg

Prompt: Typography design of "Luke's Diner" written in retro red and white font --ar 2:1

Bước 4: Cách nhận được kết quả văn bản tốt giữa cuộc hành trình

Điều quan trọng là không được nản lòng trước những kết quả dưới mức tối ưu, vì người ta có thể khắc phục những vấn đề đó thông qua việc thử nghiệm nhiều phiên bản thay thế. Như được minh họa trong hình minh họa tiếp theo, việc sử dụng tùy chọn biến thể nhiều lần sẽ tạo điều kiện thuận lợi cho việc có được hình ảnh gần giống với phiên bản ban đầu nhưng vẫn có chính tả chính xác.

/vi/images/progression-of-midjourney-images-using-the-variation-button.jpg

Người ta có thể sao chép quy trình nói trên bằng cách chọn bất kỳ nút nào trong số bốn nút mang hình ảnh được đánh dấu bằng các chữ số từ 1 đến 4, tương ứng với các thành phần hình ảnh trong bộ sưu tập nhất định.

/vi/images/midjourney-variation-buttons-underneath-an-image.jpg

Sử dụng tính năng Remix

Người ta có thể nâng cao tiện ích của phương pháp này bằng cách kích hoạt tính năng “phối lại”. Việc bật tùy chọn này cho phép người dùng sửa đổi lời nhắc ban đầu khi chọn một biến thể, từ đó mang lại khả năng thao tác tốt hơn với nội dung trực quan và tạo điều kiện thuận lợi cho việc thay đổi văn bản trong hình ảnh.

Việc kích hoạt Chế độ Remix rất đơn giản. Chỉ cần nhập “/prefer remix” vào trường nhập và nhấn Enter hai lần để kích hoạt. Một thông báo sẽ xuất hiện cho bạn biết rằng Chế độ Remix đã được bật, cho phép bạn điều chỉnh tùy chọn của mình cho phù hợp.

Lần tiếp theo khi bạn sử dụng phím “V” để tạo các lần lặp sẽ xuất hiện một cửa sổ bật lên hiển thị hướng dẫn ban đầu, trong đó bạn có quyền tự do sửa đổi nội dung theo ý muốn. Bạn cũng có thể thay thế văn bản và nếu bạn cần quyền truy cập vào tổ hợp từ khóa hiệu quả nhất, bạn có thể xem qua bước ba để tham khảo.

/vi/images/remix-propmt-dialog-in-midjourney.jpg

Nói chung, văn bản ngắn gọn và súc tích được ưu tiên để có tác động tối ưu khi kết hợp với hình ảnh. Việc sử dụng các cụm từ phổ biến hoặc cách diễn đạt ngắn liên quan trực tiếp đến nội dung bức ảnh có thể mang lại kết quả tốt hơn so với những chú thích không liên quan hoặc vô nghĩa. Một trường hợp điển hình là biển hiệu khách sạn có nhãn “Nhà nghỉ trăng mật”, có thể gợi lên những cảm xúc và sự kết nối mạnh mẽ hơn “Crater Comforts.

Dưới đây là một số cách nâng cao hơn để tiếp cận nhiệm vụ này, có thể áp dụng cho nhiều nỗ lực sáng tạo khác nhau, chẳng hạn như tạo chân dung tự họa do AI tạo:1. Tinh chỉnh các mô hình được đào tạo trước bằng dữ liệu dành riêng cho dự án: Việc điều chỉnh các tham số của mô hình bằng cách huấn luyện mô hình trên một tập dữ liệu đặc biệt phù hợp với dự án của bạn, như hình ảnh của chính bạn hoặc các bức chân dung tương tự, có thể cải thiện hiệu suất của mô hình trong việc tạo ra kết quả đầu ra thực tế. Phương pháp này khai thác sức mạnh của việc học chuyển giao trong khi điều chỉnh mô hình để đáp ứng các yêu cầu cụ thể.2. Triển khai các chiến lược tăng cường dữ liệu: Áp dụng các phép biến đổi ngẫu nhiên, chẳng hạn như xoay, lật, chia tỷ lệ hoặc điều chỉnh màu sắc cho dữ liệu đầu vào trong quá trình đào tạo có thể làm tăng tính đa dạng của các mẫu được tạo và nâng cao khả năng khái quát hóa của mô hình.

/vi/images/midjourney-image-of-a-neon-honeymoon-motel-sign-by-a-motel.jpg

Mặc dù thật đáng tiếc khi quan sát thấy các trường hợp từ sai chính tả và cụm từ trùng lặp trong văn bản được tạo, nhưng có thể đạt được giải pháp nhanh chóng thông qua việc triển khai nhiều kỹ thuật khác nhau như sử dụng các kết hợp ngôn ngữ khác nhau, sử dụng tính năng “phối lại” và đảm bảo lựa chọn từ khóa thích hợp. Khi so sánh với các công cụ tạo trí tuệ nhân tạo hàng đầu khác, điều khiến Midjourney trở nên khác biệt là khả năng đặc biệt của nó trong việc tạo điều kiện thuận lợi cho những sàng lọc này.

Midjourney cung cấp nền tảng thân thiện với người dùng, cho phép tạo văn bản chất lượng cao với nỗ lực và độ phức tạp tối thiểu so với các mô hình trước đó. Chức năng liền mạch của nền tảng giúp loại bỏ nhu cầu về các giải pháp mở rộng thường được kết hợp với các công cụ tạo văn bản khác.