V tomto článku se krok za krokem naučíme, jak vytvářet fotorealistické obrázky pomocí umělé inteligence. Fotorealistické obrázky generované umělou inteligencí mají oproti obrázkům z fotobanky obrovskou výhodu – jsou vždy unikátní a umožňují vytvořit přesně takovou scénu, jakou potřebujete.
Navíc si představíme novinku nástroje Midjourney – generování osob, které vypadají konzistentně napříč různými scénami. Díky tomu můžete vytvořit své virtuální „já“ a používat ho pro vaše produkty nebo služby.
Návod je vhodný i pro začátečníky bez zkušeností s umělou inteligencí.
Naučíme se:
- Jak vytvářet fotorealistické obrázky na základě vlastního scénáře
- Jak ovládat nástroje pro vytváření obrázků
- Jakým způsobem v obrázcích používat osoby, které jsou inspirované jinou osobou, třeba i vámi samotnými
Nástroje, které k tomu budeme potřebovat
- ChatGPT – budeme potřebovat placenou verzi za $20 / měsíc
- Discord – zdarma
- Midjourney – budeme potřebovat placenou verzi za $10 / měsíc
Jdeme na to
Pro vytváření obrázků budeme kombinovat všechny nástroje uvedené výše. V ChatGPT budeme vytvářet požadavky (tzv. prompty), které budeme následně používat v Midjourney pro generování obrázků.
Vytvoření promptu pro vygenerování obrázku
Abychom při generování obrázku dosáhli co nejlepšího výsledku, je nutné co nejpřesněji popsat, co se má na obrázku vyskytovat. Je to poměrně velká dřina a často i alchymie. Proto si usnadníme práci pomocí ChatGPT, který tu nejsložitější práci udělá za nás.
Po přihlášení do ChatGPT klikneme v levém menu na odkaz Explore GPTs a vyhledáme Midjourney MJ Prompt Generator (V6), zvolíme jej a následně klikneme na Start chat.
Do textového editoru napíšeme vlastními slovy co chceme na obrázku vidět a ChatGPT vygeneruje několik promptů přeložených do angličtiny, které použijeme pro vygenerování obrázku. Prompt zkopírujeme pomocí tlačítka Copy code:
Jak ovládat Midjourney
Generování obrázků na základě promptů vygenerovaných ChatGPT budeme provádět pomocí nástroje Midjourney. Pojďme se nyní podívat, jak tento nástroj používat.
Midjourney se ovládá pomocí aplikace Discord a je to trochu specifické oproti ostatním nástrojům. Midjourney využilo Discord jako platformu pro ovládání generátoru obrázků, čímž ušetřilo velké finanční prostředky a čas, protože nemuseli vyvíjet vlastní platformu. Na druhou stranu to ale může působit trochu zmateně, protože uživatel na první pohled neví, co má dělat.
Po zaplacení předplatného se Midjourney propojí s vaším účtem na Discordu. Pokud účet ještě nemáte, Midjourney vás při platbě vyzve k jeho založení.
Midjourney se ovládá tím, že se posílají zprávy (Direct messages) uživateli Midjourney Bot.
Po odeslání promptu na vygenerování obrázku se zobrazí 4 varianty obrázků.
Kliknutím na písmo „V“ se vytvoří další 4 variace fotky. Číslo odpovídá pořadí obrázku.
Kliknutím na písmeno „U“ vytvoříte samostatnou fotku určenou ke stažení. Po vygenerování fotky stačí kliknout na fotku a následně na odkaz „Open in Browser“.
Použití promptu v Midjourney
Prompt, který jsme vygenerovali a zkopírovali do schránky v ChatGPT odešleme Midjourney botovi. Vzhledem k tomu, že ChatGPT ví, jak vytvořit co nejreálnější obrázek, tak už do požadavku sám přidal doplňující parametry, tak aby generátor obrázků „donutil“ vytvořit opravdu fotorealistický obrázek – např. jakým foťákem a s jakým osvětlením má být scéna focená.
Často se může stát, že se to nepodaří na první pokus 🙂
Vytváření promptů je v dnešní době prakticky běžné řemeslo a vyžaduje chvíli cviku, určitě to nevzdávejte po pár nezdarech.
Výhoda vytváření požadavků pomocí ChatGPT je ta, že pokud se nám nelíbí výsledek, tak mu to prostě jen řekneme a ChatGPT vytvoří nový prompt. Náš textový požadavek musí být ideálně co nejpřesnější:
Na židli seděl pes. Psa chci pouze na monitoru a nikde jinde. Na židli musí sedět znuděný muž ve středním věku, rukou si bude podpírat hlavu a bude skoro usínat. Musí se ale pořád dívat do monitoru.
To už je o něco lepší.
Inspirace jinou osobou
V generování fotorealistických obrázků je Midjourney jeden z nejlepších nástrojů. Ty pravé kouzla se ale dají provádět díky novému parametru „cref“, který Midjourney nedávno přidal. Ve vašich projektech díky tomu můžete vytvářet obrázky s osobami, které budou mít vždy stejný obličej.
Nejprve vybereme fotku, která poslouží jako základ pro generování osob. Pro náš příklad jsme zvolili osobu vygenerovanou pomocí umělé inteligence, ale můžete použít jakoukoliv fotku, třeba svou vlastní.
Pro co nejlepší výsledky je vhodné použít fotku s detailním záběrem na obličej.
K fotce je nutné vygenerovat odkaz tak, aby byla veřejně dostupná z internetu. Můžeme k tomu použít např. https://imgbb.com/ – odkaz je nutné po nahrání obrázku uložit kliknutím pravým tlačítkem myši na obrázek a následně kliknout na Zkopírovat adresu obrázku.
Použití obrázku
Nejprve vygenerujeme prompt pro vytvoření obrázku, stejně jako v předchozích případech. Před odesláním botovi ale doplníme do promptu na konec --cref odkaz („odkaz“ nahradíme za URL obrázku)
A jak to může vypadat?
Tip
Někdy se může stát, že potřebujete vytvořit sérii obrázků, na kterých bude stejná osoba, ale potřebujete aby byla velmi odlišná např. stylem oblečení a výrazem od těch původních. Můžete si proto nechat nejprve vygenerovat osobu, která bude odpovídat vašim představám a až z této osoby následně generovat finální obrázky. Nebudete tak muset pokaždé do promptu zahrnovat informace o tom jak má vypadat finální scéna současně s tím, jak má vypadat osoba ve scéně.
Proč je vygenerovaná postava jiná než ta, kterou jsem nahrál?
Midjourney generuje konzistentní obrázky, respektive každý ze čtyřech vygenerovaných obrázků je více či méně podobný původní osobě. Z bezpečnostních důvodů, kvůli zneužití, se ale nikdy nevygeneruje osoba, která by byla uplně stejná jako osoba z referenčního obrázku.
Dle dokumentace Midjourney se nejlepší shody vygenerovaného obrázku s referenčním obrázkem dosahuje v případě, že je referenční obrázek vygenerovaný také pomocí Midjourney.
A jak to vypadá se skutečnou osobou?
Teď se podíváme jak to vypadá, když jako předlohu nepoužijeme vygenerovaný obrázek, ale skutečnou osobu. Jako předlohu použijeme našeho kolegu Filipa, kterého zachytíme v různých situacích.