เครื่องสร้างภาพ AI โอเพ่นซอร์สที่ดีที่สุด 5 อันดับ

Maya Patel included in Technology Explained Artificial Intelligence Image Chatgpt

2024-04-24 452 words 3 minutes

Contents

ความก้าวหน้าในด้านปัญญาประดิษฐ์ได้นำไปสู่โมเดลการสร้างข้อความเป็นรูปภาพมากมายที่สามารถเข้าถึงได้อย่างง่ายดายเป็นประจำ แม้ว่าการรับภาพที่ต้องการผ่านแพลตฟอร์มออนไลน์จะเป็นเรื่องง่าย แต่การใช้โปรแกรมสร้างข้อความเป็นภาพแบบโอเพ่นซอร์สจะให้ความยืดหยุ่นมากขึ้นตลอดกระบวนการสร้าง

ซินธิไซเซอร์แปลงข้อความเป็นรูปภาพที่ขับเคลื่อนด้วย AI แบบโอเพ่นซอร์สที่เข้าถึงได้ฟรีหลายตัวสามารถค้นพบได้ทางออนไลน์ โดยแต่ละตัวจะเน้นไปที่หมวดหมู่ของภาพโดยเฉพาะ ดังนั้น หลังจากตรวจสอบตัวเลือกเหล่านี้อย่างละเอียดแล้ว เราได้รวบรวมรายชื่อเครื่องมือสร้างข้อความเป็นรูปภาพ AI แบบโอเพ่นซอร์สชั้นนำที่ผู้ใช้สามารถใช้งานได้ในปัจจุบัน

1 ไครยอน

Craiyon เป็นหนึ่งในโปรแกรมสร้างภาพ AI แบบโอเพ่นซอร์สที่เข้าถึงได้ง่ายที่สุด มันใช้ DALL-E Mini และในขณะที่คุณสามารถโคลน Github repository และติดตั้งโมเดลในเครื่องคอมพิวเตอร์ของคุณได้ แต่ดูเหมือนว่า Craiyon จะทิ้งแนวทางนี้ไปใน ความโปรดปรานของเว็บไซต์

พื้นที่เก็บข้อมูล Github อย่างเป็นทางการไม่ได้รับการอัปเดตตั้งแต่เดือนมิถุนายน 2022 แต่รุ่นล่าสุดยังคงให้บริการฟรีบน เว็บไซต์อย่างเป็นทางการของ Craiyon ไม่มีแอป Android หรือ iOS เช่นกัน

ในแง่ของฟังก์ชันการทำงาน เครื่องสร้างภาพ AI นี้มีคุณสมบัติมาตรฐานที่ใครๆ ก็คาดหวังได้เมื่อป้อนข้อความแจ้งเตือนสำหรับการสร้างภาพ นอกจากนี้ ผู้ใช้ยังมีความสามารถในการปรับปรุงความละเอียดของภาพที่สร้างขึ้นโดยใช้ฟังก์ชันการเพิ่มขนาด มีสามสไตล์ศิลปะที่โดดเด่นให้เลือก ได้แก่’ศิลปะ’,‘ภาพถ่าย’และ’การวาดภาพ’อีกทางหนึ่ง การเลือกตัวเลือก"ไม่มี"จะทำให้ตัวแบบสามารถกำหนดสไตล์ได้

ในโหมดผู้เชี่ยวชาญ การรวมคำสำคัญเชิงลบจะทำให้โมเดลสามารถหลีกเลี่ยงเอนทิตีเฉพาะได้ การรวมการคาดการณ์พร้อมท์ที่อำนวยความสะดวกโดย ChatGPT ช่วยเพิ่มความเชี่ยวชาญของผู้ใช้ในการสร้างพร้อมท์ที่ครอบคลุมและซับซ้อน นอกจากนี้ คุณสมบัติการลบพื้นหลังที่ขับเคลื่อนด้วย AI ยังเร่งกระบวนการกำจัดฉากหลังที่ไม่ต้องการออกจากสื่อภาพผ่านระบบอัตโนมัติ

Craion คือเครื่องมือสร้างภาพ AI ที่มีฟังก์ชันการทำงานที่ไม่ซับซ้อน แม้ว่าอาจขาดคุณสมบัติขั้นสูงและรายละเอียดที่ซับซ้อน แต่ความเรียบง่ายทำให้เหมาะสำหรับผู้ใช้ที่กำลังมองหาโซลูชันพื้นฐานแต่ใช้งานได้ดี โดยไม่ต้องเรียกร้องความสมจริงในระดับสูงในรูปภาพที่สร้างขึ้น

แพลตฟอร์มดังกล่าวนำเสนอนโยบายการใช้งานที่กว้างขวาง ช่วยให้บุคคลทั่วไปสามารถเข้าถึงบริการของตนได้โดยไม่มีค่าใช้จ่ายใดๆ อย่างไรก็ตาม มีข้อจำกัดบางประการสำหรับผู้ใช้ฟรี เช่น การจำกัดจำนวนภาพที่สามารถประมวลผลได้ในช่วงเวลาหกสิบวินาที เพื่อปลดล็อกคุณสมบัติเพิ่มเติม รวมถึงประสบการณ์แบบไม่มีโฆษณา เวลาประมวลผลที่รวดเร็ว และความสามารถในการจัดเก็บเอาต์พุตภาพอย่างปลอดภัย เราสามารถเลือกอัปเกรดเป็นแผนสมาชิก Supporter หรือ Professional ได้ แผนเหล่านี้มีให้สำหรับการชำระเงินรายเดือนพร้อมตัวเลือกการเรียกเก็บเงินรายปี และให้ระดับการปรับแต่งและการสนับสนุนทางเทคนิคที่แตกต่างกันขึ้นอยู่กับแพ็คเกจที่เลือก นอกจากนี้ โซลูชันที่ได้รับการปรับแต่งซึ่งเรียกว่าแผนแบบกำหนดเองยังให้ความยืดหยุ่นอย่างกว้างขวางโดยนำเสนอโมเดลการเรียนรู้ของเครื่องส่วนบุคคล ความสามารถในการบูรณาการที่ราบรื่น การบริการลูกค้าตามลำดับความสำคัญ และทรัพยากรเซิร์ฟเวอร์พิเศษ

2 การแพร่กระจายที่เสถียร 1.5

Stable Diffusion คือโมเดลการสร้างข้อความเป็นรูปภาพโอเพ่นซอร์สที่ได้รับการยอมรับอย่างสูง ซึ่งได้รับความนิยมอย่างมากนับตั้งแต่เปิดตัวในปี 2022 นอกเหนือจากการเป็นโมเดลอิสระแล้ว โมเดลนี้ยังทำหน้าที่เป็นรากฐานสำหรับโมเดลการสร้างรูปภาพอื่นๆ อีกหลายโมเดล เช่น สามตัวอย่างข้างต้น นับตั้งแต่เปิดตัว มีการนำแนวทางนวัตกรรมนี้ไปใช้ในการสังเคราะห์ภาพอย่างประสบความสำเร็จมากมาย

ฉันจะแจ้งรายละเอียดทางเทคนิคมากเกินไปเกี่ยวกับวิธีการทำงานของโมเดล (ซึ่งคุณสามารถตรวจสอบ พื้นที่เก็บข้อมูล Github อย่างเป็นทางการ ) แต่โมเดลนั้นง่ายต่อการ ติดตั้งได้แม้สำหรับผู้เริ่มต้นที่สมบูรณ์และทำงานได้ดีตราบใดที่คุณมี GPU เฉพาะที่มีหน่วยความจำอย่างน้อย 4GB คุณยังสามารถเข้าถึง Stable Diffusion ทางออนไลน์ และเราพร้อมให้ความช่วยเหลือหากคุณต้องการใช้งาน Stable Diffusion บน Mac

มีจุดตรวจสอบหลายจุด (พิจารณาเป็นเวอร์ชันต่างๆ) ที่พร้อมใช้งานสำหรับ Stable Diffusion แม้ว่าเราจะทดสอบเวอร์ชัน 1.5 แล้ว เวอร์ชัน 2.1 ก็อยู่ในการพัฒนาที่กระตือรือร้นและมีความแม่นยำมากขึ้นเช่นกัน

ยาดุลลาห์ อบีดี/ทุกสิ่งไม่มี/DreamShaper

การรันโมเดลนั้นค่อนข้างง่ายเช่นกัน เราทดสอบด้วย AUTOMATIC1111 Stable Diffusion web user interface และการควบคุมและพารามิเตอร์ทั้งหมดทำงานได้ดี นอกจากนี้ยังได้รับความอนุเคราะห์จากฐานข้อมูล LAION-5B ที่ได้รับการพิสูจน์โดย NSFW อีกด้วย (ถึงแม้จะไม่สมบูรณ์แบบก็ตาม) แม้ว่าเวลาในการสร้างจะแตกต่างกันไปขึ้นอยู่กับฮาร์ดแวร์ของคุณ แต่คุณก็สามารถคาดหวังให้ภาพของคุณมีรายละเอียดและสมจริงได้แม้จะมีข้อความแจ้งพื้นฐานก็ตาม

3 ดรีมเชปเปอร์

DreamShaper เป็นโมเดลการสร้างภาพแบบใหม่ที่ใช้หลักการ Stable Diffusion เป็นรากฐาน ได้รับการออกแบบให้เป็นทางเลือกที่หลากหลายและเข้าถึงได้สำหรับ MidJourney เครื่องมือที่เป็นนวัตกรรมใหม่นี้มีความสามารถพิเศษในการผลิตภาพถ่ายที่สมจริงอย่างมาก ขณะเดียวกันก็แสดงให้เห็นถึงความสามารถในการปรับตัวที่น่าทึ่งในการสร้างสไตล์อะนิเมะและภาพวาดเชิงศิลปะผ่านการปรับเปลี่ยนเล็กน้อย

โมเดลนี้มีความสามารถมากกว่า Stable Diffusion ทำให้ผู้ใช้สามารถมีอิสระมากขึ้นในเอาท์พุตสุดท้าย ตั้งแต่การปรับปรุงฟ้าผ่าไปจนถึงข้อจำกัด NSFW ที่ผ่อนคลายลง การรันโมเดลยังทำได้ง่าย โดยมี เวอร์ชันที่ดาวน์โหลดและฝึกล่วงหน้าได้ ออนไลน์สำหรับการเข้าถึงในท้องถิ่นและโฮสต์ของเว็บไซต์ รวมถึง Sinkin.ai , RandomSeed และ Mage.space (ต้องสมัครสมาชิกขั้นพื้นฐาน) ที่ให้คุณรันโมเดลด้วยการเร่งความเร็ว GPU

เมื่อเปรียบเทียบกับ Stable Diffusion จะเห็นได้ชัดว่าภาพที่ผลิตโดย DreamShaper มีความสมจริง ความสลับซับซ้อน และการส่องสว่างในระดับที่สูงกว่า แม้ว่าจะใช้พารามิเตอร์อินพุตที่เหมือนกัน แต่ DreamShaper ก็มีประสิทธิภาพเหนือกว่าคู่แข่งอย่างต่อเนื่องในแง่ของความคมชัดของภาพและคุณภาพโดยรวม

ความแตกต่างที่สำคัญประการหนึ่งระหว่าง Stable Diffusion และโมเดลกำเนิดอื่นๆ อยู่ที่ความสามารถในการสร้างการนำเสนอวัตถุที่เป็นมนุษย์เหมือนจริง เช่น ภาพบุคคลหรือตัวละคร แม้ว่าโมเดลเหล่านี้จะน่าประทับใจอย่างปฏิเสธไม่ได้ที่โมเดลเหล่านี้สามารถถ่ายทอดภาพที่มีรายละเอียดสูงและแม่นยำได้ แต่โมเดลเหล่านี้ก็ยังอาจยังด้อยอยู่เมื่อเทียบกับรูปแบบศิลปะแบบดั้งเดิมที่ต้องอาศัยการตีความตามอัตวิสัยและความคิดสร้างสรรค์มากกว่า ในความเป็นจริง อาจมีคนแย้งว่าแก่นแท้ของสิ่งที่ทำให้งานศิลปะชิ้นหนึ่งมีเอกลักษณ์และมีคุณค่าก็คือความไม่สมบูรณ์และความเป็นเอกลักษณ์ของงานศิลปะนั่นเอง ดังนั้น แม้ว่ารูปภาพที่สร้างโดย AI อาจมีความเชี่ยวชาญทางเทคนิค แต่ท้ายที่สุดแล้วรูปภาพเหล่านั้นอาจขาดความลึกทางอารมณ์และสัมผัสส่วนบุคคล ที่ทำให้งานศิลปะที่ยอดเยี่ยมอย่างแท้จริงแตกต่างจากของลอกเลียนแบบ

คุณไม่จำเป็นต้องมีระบบคอมพิวเตอร์ที่กว้างขวางในการรันโมเดลนี้ อันที่จริง NVIDIA GeForce GTX 1650Ti ของฉันที่มีหน่วยความจำวิดีโอ 4 GB ทำหน้าที่ได้อย่างน่าชื่นชมในการดำเนินการกับโมเดลนี้ แม้ว่ากระบวนการสร้างจะใช้เวลานานกว่าเล็กน้อย แต่ดูเหมือนว่าจะไม่มีผลกระทบที่มองเห็นได้ต่อผลลัพธ์ที่ได้ อย่างไรก็ตาม ควรสังเกตว่าหน่วยความจำวิดีโอจำนวนมากอาจจำเป็นต่อการจัดการข้อกำหนดที่ต้องการของ DreamShaper XL ได้อย่างมีประสิทธิภาพ ซึ่งสร้างขึ้นจากรากฐานของรุ่น Stable Diffusion XL

4 เรียกใช้ AI

Intake AI เป็นโมเดลการสร้างภาพที่ซับซ้อนซึ่งใช้อัลกอริธึม Stable Diffusion ขั้นสูงเพื่อสร้างภาพที่ดึงดูดสายตา รุ่นนี้มีสองเวอร์ชัน-หนึ่งเวอร์ชันมาตรฐานและหนึ่ง XL-ทั้งสองเวอร์ชันได้รับการออกแบบมาเพื่อให้ได้ผลลัพธ์คุณภาพสูงอย่างมีประสิทธิภาพ นอกจากนี้ Intake AI ยังมีเว็บและอินเทอร์เฟซบรรทัดคำสั่งที่ใช้งานง่าย ทำให้ผู้ใช้ไม่จำเป็นต้องนำทางผ่านอินเทอร์เฟซที่ซับซ้อน เช่น ที่พบในโมเดล AI อื่นๆ

หัวใจสำคัญของข้อเสนอของเราอยู่ที่การให้อำนาจแก่ผู้ใช้ในการสร้างเนื้อหาที่ดึงดูดสายตาซึ่งมาจากความรู้ที่เป็นกรรมสิทธิ์ของพวกเขา โดยปรับแต่งกระบวนการตามความต้องการส่วนบุคคล ในเรื่องนี้ เราใช้ประโยชน์จากความสามารถอันทรงพลังของ InvolveAI ซึ่งเป็นโมเดล AI แบบโอเพ่นซอร์สระดับสูงสุดที่ออกแบบมาโดยเฉพาะสำหรับการปลูกฝังรูปภาพตามความต้องการ ผ่านการบูรณาการอย่างราบรื่นกับสินทรัพย์ที่เป็นกรรมสิทธิ์

พื้นที่เก็บข้อมูล Github อย่างเป็นทางการ แสดงรายการวิธีการติดตั้งสองวิธี: การติดตั้งผ่านโปรแกรมติดตั้งของ InvokeAI หรือใช้ PyPI หากคุณพอใจกับเทอร์มินัลและ Python และต้องการการควบคุมแพ็คเกจที่ติดตั้งกับโมเดลมากขึ้น

เพื่อที่จะใช้ฟังก์ชันเพิ่มเติมที่ InvoidAI มอบให้ จะต้องเป็นไปตามข้อกำหนดเบื้องต้นบางประการในแง่ของข้อกำหนดเฉพาะของระบบ โดยเฉพาะอย่างยิ่ง จำเป็นต้องมี GPU เฉพาะที่มีหน่วยความจำขั้นต่ำ 4GB โดยแนะนำให้ใช้ 6-8GB สำหรับรุ่นที่ใหญ่กว่า กราฟิกการ์ดทั้ง AMD และ Nvidia อยู่ภายใต้ข้อจำกัด VRAM เดียวกันนี้ นอกจากนี้ RAM ขั้นต่ำ 12GB และพื้นที่ว่างฮาร์ดไดรฟ์ 12GB จำเป็นเพื่อรองรับโมเดลโครงข่ายประสาทเทียม เช่นเดียวกับการขึ้นต่อกันที่เกี่ยวข้องและไฟล์การติดตั้ง Python

ยาดุลลอฮ์ อาบีดี/ทุกสิ่งไม่มี/วิงวอน

แม้ว่าจะไม่แนะนำในเอกสารประกอบเนื่องจากหน่วยความจำวิดีโอไม่เพียงพอ แต่กระบวนการติดตั้งที่ได้รับการทดสอบของเรากับหน่วยประมวลผลกราฟิก (GPU) GTX 10 Series และ 16 Series ของ Nvidia ก็ประสบความสำเร็จ อย่างไรก็ตาม โปรดทราบว่าประสิทธิภาพอาจแตกต่างกันไปขึ้นอยู่กับข้อกำหนดเฉพาะของระบบแต่ละเครื่อง นอกจากนี้ เราต้องการแจ้งให้ผู้ใช้ที่ใช้ GPU ระดับล่างทราบว่าอาจต้องรอนานขึ้นเล็กน้อยก่อนที่จะเห็นผลลัพธ์ที่เป็นภาพ สุดท้ายนี้ สำหรับผู้ที่ใช้ระบบปฏิบัติการ Windows โปรดทราบว่าขณะนี้รองรับเฉพาะ GPU Nvidia เท่านั้น ในขณะที่ GPU ของ AMD ยังคงไม่รองรับ

การใช้งานแพลตฟอร์ม InvolveAI ในปัจจุบันมุ่งเน้นไปที่การผลิตงานศิลปะมากกว่าการสร้างภาพเสมือนจริง อย่างไรก็ตาม สามารถปรับได้โดยการฝึกโมเดลโดยใช้ชุดข้อมูลที่กำหนดเอง วิธีการนี้จะให้ผลลัพธ์ที่ดีกว่าเมื่อสร้างภาพที่สมจริง โดยเฉพาะอย่างยิ่งในด้านต่างๆ เช่น การออกแบบผลิตภัณฑ์ สถาปัตยกรรม และสภาพแวดล้อมการค้าปลีก ควรสังเกตว่าแม้ว่า InvolveAI จะทำหน้าที่เป็นกลไกสร้างภาพที่มีประสิทธิภาพ แต่การบรรลุผลลัพธ์ที่ดีที่สุดอาจต้องใช้โมเดลภายนอกที่เข้าถึงได้ผ่าน Model Manager ในตัวภายในอินเทอร์เฟซผู้ใช้

5 Openjourney

Openjourney คือโมเดลการสร้างภาพ AI ที่ใช้เทคโนโลยี Stable Diffusion และทำงานเป็นแพลตฟอร์มโอเพ่นซอร์ส ชื่อ “Openjourney” สะท้อนถึงความจริงที่ว่าโมเดลดังกล่าวได้รับการฝึกอบรมโดยใช้ภาพ Midjourney เพื่อจำลองสไตล์ภาพที่โดดเด่นในภาพที่สร้างขึ้น

PromptHero บริษัทที่อยู่เบื้องหลัง Openjourney ให้คุณทดสอบโมเดลนี้ควบคู่ไปกับโมเดลอื่นๆ รวมถึง Stable Diffusion (เวอร์ชัน 1.5 และ 2), DreamShaper และ Reality Vision เมื่อสมัคร คุณจะได้รับ 25 เครดิตฟรี (หนึ่งเครดิตสำหรับแต่ละภาพที่สร้างขึ้น) หลังจากนั้นคุณจะต้องสมัครสมาชิกระดับ Pro ซึ่งมีค่าใช้จ่าย $9 ต่อเดือน และให้คุณเข้าถึง 300 เครดิตในแต่ละเดือนพร้อมคุณสมบัติพิเศษอื่น ๆ

อย่างไรก็ตาม หากคุณต้องการเรียกใช้งานในพื้นที่และไม่มีค่าใช้จ่าย คุณสามารถ ดาวน์โหลดไฟล์โมเดลจาก HuggingFace และเรียกใช้งานโดยใช้ Stable Diffusion web UI Openjourney ยังเป็นโมเดลการสร้างภาพ AI ที่มีการดาวน์โหลดมากเป็นอันดับสองบน HuggingFace ตามหลัง Stable Diffusion

ไม่ได้ระบุไว้อย่างชัดเจนบนเว็บไซต์ Openjourney ว่าข้อกำหนดเบื้องต้นของฮาร์ดแวร์ใดบ้างที่จำเป็นสำหรับการดาวน์โหลดและใช้งานโมเดล AI แบบออฟไลน์ อย่างไรก็ตาม มีความเป็นไปได้ที่ความจำเป็นเหล่านี้จะเทียบเคียงได้กับความจำเป็นของ Stable Diffusion เพื่อให้รันโมเดลได้สำเร็จ เราควรมีสิทธิ์เข้าถึงหน่วยประมวลผลกราฟิก (GPU) เฉพาะที่มีหน่วยความจำวิดีโอ (VRAM) อย่างน้อย 4 กิกะไบต์), RAM ขนาด 16 GB และความจุพื้นที่เก็บข้อมูลประมาณ 12 ถึง 15 กิกะไบต์บนอุปกรณ์ของตน เพื่อรองรับโมเดลและส่วนประกอบที่เกี่ยวข้อง

Yadullah Abidi/ทุกสิ่ง N/OpenJourney

Openjourney สร้างภาพที่สมดุลระหว่างความสมจริงและศิลปะ ยกเว้นคำขอเฉพาะใดๆ ที่เกิดขึ้น สำหรับผู้ที่กำลังมองหาโมเดลอเนกประสงค์ที่รวบรวมคุณลักษณะของทั้งความสมจริงของภาพถ่ายและงานศิลปะ ในขณะที่ไม่ต้องเสียค่าสมัครสมาชิก Openjourney นำเสนอตัวเองว่าเป็นตัวเลือกที่เหมาะสมอย่างยิ่ง