AI Vlogs oznámila aktualizáciu Stable Diffusion XL 0.9

Spoločnosť AI Vlogs nedávno oznámila novú aktualizáciu svojho Stable Diffusion XL 0.9, ktorú nazvala verzia 0.9. Táto aktualizácia má niekoľko pôsobivých funkcií, ktoré by mali priniesť možnosť generovať hyperrealistické výtvory pre filmy a pokrok v dizajne a priemyselnom využití. Jej priama platená konkurencia MidJourney.

Oznámenie spoločnosti Stability AI

Spoločnosť Stability AI sa zamerala na priame produkty, čo jej pomohlo vyostriť prístup k bezpečnosti a generovať nové modely. Nová verzia Stable Diffusion XL 0.9 je k dispozícii od dnešného dňa v klipovej forme. Veľmi intenzívne ju presadzujú a čoskoro sa objaví rozhranie API.

Vylepšenia zahrnuté v aktualizácii

V aktualizácii Stable Diffusion XL 0.9 je zahrnutých niekoľko významných vylepšení, ktoré stoja za zmienku:

  • Vylepšenia hĺbky ostrosti, farebného gamutu a toho, koľko farieb je model schopný vyjadriť v danej generácii
  • Uvedomenie si kontextu tvárí a organických tvarov, ako sú ruky
  • Výrazne vylepšené vykresľovanie textu
  • Vylepšenia funkcií podnetov medzi obrazmi, maľovania a odmaľovania

Okrem toho má Stable Diffusion XL 0.9 jeden z najväčších počtov parametrov spomedzi všetkých obrazových modelov s otvoreným zdrojovým kódom, s 3,5 miliardy parametrov v základnom modeli a 6,6 miliardy parametrov v The Ensemble Pipeline. Konečný výstup je vytvorený spustením dvoch modelov a agregáciou výsledkov.

Jednou z kľúčových funkcií SDXL 0.9 sú možnosti spracovania prirodzeného jazyka, ktoré umožňujú používateľom zadávať podnety pomocou bežného jazyka. Dokáže napríklad vygenerovať obrázok “svietiacich medúz plávajúcich v hmlistom lese za súmraku” alebo “Mrazivého zámku vyrobeného výlučne zo zmrzliny v krajine cukrovej vaty, oblakov a stromov s lízankami” len pomocou podnetov v prirodzenom jazyku. To je obrovské zlepšenie oproti staršej verzii (1.5), ktorá vyžaduje jednoslovné alebo dvojslovné podnety oddelené čiarkami, a dokonca aj modelové váhy na generovanie umenia umelej inteligencie.

Ohromujúca kompozícia napriek základnému modelu

Napriek tomu, že SDXL 0.9 je len základným modelom, stále dokáže vytvárať ohromujúce kompozície. Aj keď vernosť obrazu ešte nie je dokonalá, kvalita obrázkov je pôsobivá. Vygeneroval napríklad obrázok žltého vlaku so surrealistickými prvkami, ženu Jedi bojujúcu s Darth Vaderom a ženu jediacu zmrzlinu. Hoci sa vyskytli drobné problémy s nadbytočnými končatinami alebo nedokonalými rukami, výsledné obrázky sú stále pôsobivé, najmä ak vezmeme do úvahy, že boli vytvorené len pomocou podnetov v prirodzenom jazyku.

Kompatibilita

Stable Diffusion XL 0.9 je kompatibilná s používateľmi systému Linux s kompatibilnými kartami AMD, ktoré majú 16 GB VRAM. Stále sa však odporúčajú grafické procesory NVIDIA a model bude fungovať na moderných spotrebiteľských grafických procesoroch. SDXL 0.9 je najpokročilejším vývojom v balíku modelov stabilnej difúzie textu na obraz, ktorý sa môže pochváliť najväčším počtom parametrov zo všetkých doterajších modelov obrazu s otvoreným zdrojovým kódom. Používa základný model s 3,5 miliardy parametrov a modelový súbor s 6,6 miliardy parametrov, ktorý agreguje výsledky dvoch paralelne bežiacich modelov.

Dostupnosť

Spoločnosť Clip Drop sprístupnila tento produkt a vydanie s otvoreným zdrojovým kódom sa očakáva v polovici júla. Rozhranie Stability AI veľmi uľahčilo vývojárom poskytovať nízkonákladové alebo bezplatné aktualizácie svojej používateľskej základni. Spoločnosť Stability AI sa zaviazala skúmať, ako môže umelá inteligencia prospievať interakciám s ľuďmi, a nie ich nahrádzať. V súvislosti s týmto modelom vznikajú obavy z cenzúry, keďže predchádzajúce modely, ako napríklad Stable Diffusion 2.0, boli cenzurované a považovali sa za menej kvalitné kvôli ich anatomickým deformáciám. Dúfame, že SDXL 0.9 zostane bez cenzúry, pretože komunita je pripravená začať na ňom pracovať hneď, ako sa dostane do verejnej verzie.

Celkovo má aktualizácia Stable Diffusion XL 0.9 niekoľko pôsobivých funkcií, ktoré stoja za zmienku. Vývojári a používatelia môžu očakávať vylepšenia v oblasti hĺbky ostrosti, farebného gamutu a mnohých ďalších. Stable Diffusion XL 0.9 má byť v popredí reálnych aplikácií pre snímky s umelou inteligenciou a my sa tešíme, čo prinesie budúcnosť tohto výkonného modelu. Hoci vernosť obrazu ešte nie je dokonalá, stále je to pôsobivý úspech pre základný model. Keďže komunita open-source sa pripravuje na prácu na vlastných modeloch, budúcnosť umenia SDXL vyzerá jasne.

Related posts

Generovanie Obrazkov AI, hrozba alebo nový nástroj?

Dokonalá príručka prompt -mi Stable Diffusion XL

Stable Diffusion XL Model ktorý Vás ohúry realitou