De 5 beste open-source AI-afbeeldingsgeneratoren

Alicia Brunner included in Technology Explained Artificial Intelligence Image Chatgpt

2024-04-24 1804 words 9 minutes

Contents

Vooruitgang in kunstmatige intelligentie heeft geleid tot een overvloed aan tekst-naar-beeld generatormodellen die regelmatig gemakkelijk toegankelijk zijn. Hoewel het verkrijgen van gewenste afbeeldingen via online platforms eenvoudig is, biedt het gebruik van open-source tekst-naar-afbeelding generatoren meer flexibiliteit tijdens het hele creatieproces.

Verschillende vrij toegankelijke en open-source AI-gestuurde tekst-naar-beeld synthesizers zijn online te vinden, elk gericht op een bepaalde categorie visuals. Na een grondige beoordeling van deze opties hebben we een lijst samengesteld van de beste open-source AI tekst-naar-beeld generatoren die momenteel door gebruikers kunnen worden gebruikt.

1 Craiyon

Craiyon is een van de gemakkelijkst toegankelijke open-source AI beeldgeneratoren. Het is gebaseerd op DALL-E Mini en hoewel je de Github repository kunt klonen en het model lokaal op je computer kunt installeren, lijkt Craiyon deze aanpak te hebben laten vallen ten gunste van zijn website.

De officiële Github repository is sinds juni 2022 niet meer bijgewerkt, maar het nieuwste model is nog steeds gratis beschikbaar op de officiële Craiyon site . Er zijn ook geen Android- of iOS-apps.

Qua functionaliteit biedt deze AI-afbeeldingsgenerator de standaardfuncties die je zou verwachten bij het invoeren van een vraag om een afbeelding te genereren. Daarnaast hebben gebruikers de mogelijkheid om de resolutie van hun gegenereerde afbeeldingen te verhogen door gebruik te maken van de up-scaling functie. Er zijn drie verschillende artistieke stijlen beschikbaar in de vorm van ‘Art’, ‘Photo’ en ‘Drawing’. Als alternatief kun je kiezen voor ‘Geen’, waarbij het model zelf de stijl bepaalt.

In de expertmodus kan het model met behulp van negatieve trefwoorden bepaalde entiteiten vermijden. De integratie van promptvoorspellingen door ChatGPT vergroot de vaardigheid van de gebruiker in het maken van uitgebreide prompts. Bovendien versnelt de AI-gestuurde achtergrondverwijderingsfunctie het proces van het automatisch verwijderen van ongewenste achtergronden van visuele media.

Craion is een AI-tool voor het genereren van afbeeldingen met een eenvoudige functionaliteit. Hoewel het misschien geavanceerde functies en ingewikkelde details mist, is het door zijn eenvoud geschikt voor gebruikers die op zoek zijn naar een eenvoudige maar functionele oplossing zonder hoge eisen te stellen aan het realisme van hun gegenereerde afbeeldingen.

Het platform biedt een genereus gebruiksbeleid, waardoor particulieren zonder kosten gebruik kunnen maken van de diensten.Er gelden echter bepaalde beperkingen voor gratis gebruikers, zoals een beperking op het aantal afbeeldingen dat verwerkt kan worden in een periode van zestig seconden. Om extra functies te ontgrendelen, waaronder een reclamevrije ervaring, snellere verwerkingstijden en de mogelijkheid om beelduitvoer veilig op te slaan, kan men ervoor kiezen om te upgraden naar de abonnementen Supporter of Professional. Deze plannen zijn beschikbaar voor maandelijkse betalingen met jaarlijkse factureringsopties en bieden verschillende niveaus van aanpassingen en technische ondersteuning, afhankelijk van het gekozen pakket. Bovendien biedt een op maat gemaakte oplossing die bekend staat als het Custom-plan uitgebreide flexibiliteit door gepersonaliseerde modellen voor machinaal leren, naadloze integratiemogelijkheden, klantenservice met prioriteit en exclusieve serverbronnen aan te bieden.

2 Stable Diffusion 1.5

Stable Diffusion is een hoog aangeschreven open-source tekst-naar-beeld generatiemodel dat aanzienlijk aan populariteit heeft gewonnen sinds de release in 2022. Naast het feit dat het een onafhankelijk model is, dient het als basis voor verschillende andere modellen voor het genereren van afbeeldingen, zoals de drie eerder genoemde voorbeelden. Sinds de introductie zijn er talloze succesvolle implementaties geweest van deze innovatieve benadering van beeldsynthese.

Ik zal je de al te technische details besparen over hoe het model werkt (daarvoor kun je terecht op hun officiële Github repository ), maar het model is eenvoudig te installeren, zelfs voor complete beginners, en werkt goed zolang je een toegewijde GPU hebt met ten minste 4GB geheugen. Je kunt Stable Diffusion ook online openen, en we hebben voor je gezorgd als je Stable Diffusion op een Mac wilt uitvoeren.

Er zijn verschillende checkpoints (beschouw ze als versies) beschikbaar om te gebruiken voor Stable Diffusion. Wij hebben versie 1.5 getest, maar versie 2.1 is ook in actieve ontwikkeling en is nauwkeuriger.

Yadullah Abidi/All Things N/DreamShaper

Het uitvoeren van het model is ook vrij eenvoudig. We hebben het getest met de AUTOMATIC1111 Stable Diffusion web user interface , en alle regelaars en parameters werken goed. Het is ook behoorlijk NSFW-proof dankzij de LAION-5B database waarop het model getraind is (hoewel het niet perfect is, let wel). Hoewel de generatietijd zelf varieert op basis van je hardware, kun je verwachten dat je afbeeldingen gedetailleerd en realistisch zijn, zelfs met basisaanwijzingen.

3 DreamShaper

DreamShaper is een nieuw model voor het genereren van afbeeldingen dat is gebaseerd op de principes van Stable Diffusion.Deze innovatieve tool is ontworpen als een veelzijdig en toegankelijk alternatief voor MidJourney en heeft een uitzonderlijke vaardigheid in het produceren van zeer realistische foto’s, terwijl het ook een opmerkelijk aanpassingsvermogen laat zien in het genereren van anime en artistieke schilderstijlen door middel van kleine aanpassingen.

Het model is capabeler dan Stable Diffusion, waardoor gebruikers meer vrijheid hebben over de uiteindelijke uitvoer, variërend van bliksemverbeteringen tot lossere NSFW-beperkingen. Het uitvoeren van het model is ook eenvoudig, met een downloadbare, voorgetrainde versie die online beschikbaar is voor lokale toegang en een groot aantal websites, waaronder Sinkin.ai , RandomSeed en Mage.space (basisabonnement vereist) waarmee je het model kunt uitvoeren met GPU-versnelling.

In vergelijking met Stable Diffusion is het duidelijk dat de afbeeldingen die door DreamShaper worden geproduceerd een hogere mate van realisme, complexiteit en belichting vertonen. Ondanks het gebruik van identieke invoerparameters presteert DreamShaper consequent beter dan zijn tegenhanger in termen van visuele natuurgetrouwheid en algemene kwaliteit.

Een van de significante verschillen tussen Stable Diffusion en andere generatieve modellen ligt in hun vermogen om levensechte representaties te maken van menselijke onderwerpen, zoals portretten of personages. Hoewel het ontegenzeggelijk indrukwekkend is dat deze modellen zeer gedetailleerde en accurate afbeeldingen kunnen produceren, schieten ze nog steeds tekort in vergelijking met traditionele kunstvormen die vertrouwen op meer subjectieve interpretaties en creativiteit. Je zou zelfs kunnen stellen dat de essentie van wat een kunstwerk uniek en waardevol maakt, juist de imperfecties en individualiteit zijn. Daarom kunnen AI-gegenereerde beelden, hoewel ze technisch vaardig zijn, uiteindelijk de emotionele diepte en persoonlijke touch missen die echt grote kunstwerken onderscheidt van louter imitaties.

Je hebt niet per se een uitgebreid computersysteem nodig om dit specifieke model te draaien. Mijn NVIDIA GeForce GTX 1650Ti met 4 GB videogeheugen voerde het model uitstekend uit. Hoewel het generatieproces iets langer duurde, leek er geen waarneembaar effect te zijn op de resulterende uitvoer. Er moet echter worden opgemerkt dat grotere hoeveelheden videogeheugen nodig kunnen zijn om effectief om te gaan met de veeleisende vereisten van DreamShaper XL, dat is gebouwd op de basis van het Stable Diffusion XL-model.

4 InvokeAI

Invoke AI is een geavanceerd model voor het genereren van beelden dat gebruikmaakt van het geavanceerde Stable Diffusion-algoritme voor het creëren van visueel aantrekkelijke beelden.Het model heeft twee versies - een standaard en een XL - die beide zijn ontworpen om efficiënt resultaten van hoge kwaliteit te leveren. Daarnaast heeft Invoke AI een gebruiksvriendelijke web- en opdrachtregelinterface, waardoor gebruikers niet meer door complexe interfaces hoeven te navigeren zoals bij andere AI-modellen.

De kern van ons aanbod ligt in het in staat stellen van gebruikers om visueel boeiende content te genereren op basis van hun eigen kennis, waarbij het proces wordt aangepast aan individuele voorkeuren. In dit opzicht maken we gebruik van de krachtige mogelijkheden van InvokeAI, een topklasse open-source AI-model dat speciaal is ontworpen voor het cultiveren van op maat gemaakte beelden door middel van naadloze integratie met eigen middelen.

De officiële Github repository geeft twee installatiemethoden: installeren via InvokeAI’s installatieprogramma of via PyPI als je vertrouwd bent met een terminal en Python en meer controle wilt over de pakketten die met het model worden geïnstalleerd.

Om gebruik te kunnen maken van de extra functionaliteit die InvokeAI biedt, moet aan bepaalde voorwaarden worden voldaan qua systeemspecificaties. Meer specifiek is een speciale GPU met minimaal 4GB geheugen vereist, waarbij 6-8GB wordt aanbevolen voor de grotere variant. Voor zowel AMD als Nvidia grafische kaarten gelden dezelfde VRAM beperkingen. Verder is er minimaal 12 GB RAM en 12 GB beschikbare ruimte op de harde schijf nodig om het neurale netwerkmodel en alle bijbehorende afhankelijkheden en Python-installatiebestanden op te slaan.

Yadullah Abidi/All Things N/InvokeAI

Hoewel het niet wordt aanbevolen in de documentatie vanwege onvoldoende videogeheugen, was ons geteste installatieproces met Nvidia’s GTX 10 Series en 16 Series grafische verwerkingseenheden (GPU’s) succesvol. Houd er echter rekening mee dat de prestaties kunnen variëren, afhankelijk van de individuele systeemspecificaties. Daarnaast willen we gebruikers met minder goede GPU’s informeren dat ze iets langere wachttijden kunnen ervaren voordat ze visuele uitvoer zien. Gebruikers van Windows-besturingssystemen moeten weten dat op dit moment alleen Nvidia GPU’s worden ondersteund en AMD GPU’s niet.

De huidige implementatie van het InvokeAI platform neigt meer naar het produceren van artistieke dan fotorealistische beelden. Dit kan echter worden aangepast door het model te trainen met een aangepaste dataset. Deze aanpak zal betere resultaten opleveren bij het genereren van realistische beelden, met name op gebieden zoals productontwerp, architectuur en winkelomgevingen.Hoewel InvokeAI dient als een effectieve engine voor het genereren van afbeeldingen, kan het voor optimale resultaten nodig zijn om externe modellen te gebruiken die toegankelijk zijn via de ingebouwde Model Manager in de gebruikersinterface.

5 Openjourney

Openjourney is een AI-beeldgeneratiemodel dat gebruikmaakt van Stable Diffusion-technologie en opereert als een open-source platform. De naam “Openjourney” weerspiegelt het feit dat het model is getraind met behulp van Midjourney-beeldmateriaal om de kenmerkende visuele stijl te repliceren in de gegenereerde afbeeldingen.

PromptHero , het bedrijf achter Openjourney, laat je het model testen naast andere modellen, waaronder Stable Diffusion (versies 1.5 en 2), DreamShaper en Realistic Vision. Als je je aanmeldt, krijg je 25 gratis credits (één credit voor elke gegenereerde afbeelding). Daarna moet je je abonneren op hun Pro-abonnement, dat $9 per maand kost en je elke maand toegang geeft tot 300 credits en andere exclusieve functies.

Als u het echter lokaal en gratis wilt uitvoeren, kunt u het modelbestand downloaden van HuggingFace en het uitvoeren met behulp van de Stable Diffusion web UI. Openjourney is ook het op één na meest gedownloade AI beeldgeneratie model op HuggingFace, vlak achter Stable Diffusion.

Het is niet expliciet vermeld op de Openjourney website welke hardware vereisten nodig zijn voor het downloaden en offline implementeren van hun AI model. Het is echter waarschijnlijk dat deze vereisten vergelijkbaar zijn met die van Stable Diffusion. Om het model met succes uit te voeren, moet men toegang hebben tot een speciale grafische verwerkingseenheid (GPU) uitgerust met ten minste 4 gigabyte videogeheugen (VRAM), 16 GB RAM en ongeveer 12 tot 15 gigabyte beschikbare opslagcapaciteit op hun apparaat om het model en de bijbehorende componenten te huisvesten.

Yadullah Abidi/All Things N/OpenJourney

Openjourney genereert beelden die een balans vinden tussen realisme en artisticiteit, met uitzondering van specifieke verzoeken. Voor diegenen die op zoek zijn naar een veelzijdig model dat de kenmerken van zowel fotorealisme als kunst belichaamt en tegelijkertijd betaling voor een abonnement vermijden, presenteert Openjourney zich als een zeer geschikte optie.