МидЈоурнеи наспрам Стабле Диффусион у односу на Бинг Имаге Цреатор

Вештачка интелигенција мења свет уметности на изузетан начин. Једна од фасцинантних примена АИ у сегменту уметности је коришћење дескриптивних генератора уметности. Ови генератори имају способност да испитују и интерпретирају слике и генеришу потпуно нова уметничка дела на основу њихове анализе.

У овом чланку расправљамо о три таква АИ генератора уметности: МидЈоурнеи, Стабле Диффусион и Мицрософт Бинг Имаге Цреатор, и који међу ова три долази на прво место у генерисању најбољих резултата на основу упита.

Преглед садржаја

МидЈоурнеи

МидЈоурнеи, који је основао Давид Холз, је АИ генератор уметности који користи машинско учење да идентификује обрасце и карактеристике у постојећим уметничким делима, који се затим могу користити за креирање нових дела.

  Како променити боју позадине у програму Мицрософт Ворд

МидЈоурнеи је ушао у отворену бета верзију 12. јула 2022. Пре него што је покренуо МидЈоурнеи, Холц је суоснивао Леап Мотион, стартуп који је трансформисао корисничке интерфејсе коришћењем видео снимања и покрета рукама. Године 2019. продао је Леап Мотион компанији Ултрахаптицс.

Пошто је МидЈоурнеи постао популаран, Холц је поделио своје увиде у технологију и њен утицај на уметност и друштво. Холц сматра уметнике купцима МидЈоурнеи-ја, а не конкурентима, и верује да платформа може да омогући већу креативност и експериментисање у фази идеје.

Међутим, постоји забринутост због могућег кршења ауторских права из МидЈоурнеи-јевог скупа за обуку, који може укључивати радове других уметника заштићених ауторским правима.

Холц наглашава да је МидЈоурнеи дизајниран да унапреди људске способности, а не да их замени. Он то пореди са аутомобилима, објашњавајући да само зато што су аутомобили бржи од људи, то не значи да треба да одсечемо ноге.

Коришћењем МидЈоурнеи АИ генерисања слика, уметници могу да истражују нове могућности и генеришу бројне идеје пре него што креирају своја дела.

Стабле Диффусион

Стабле Диффусион је модел машинског учења отвореног кода који може да генерише слике из текста, модификује слике на основу текста или попуни детаље на сликама ниске резолуције или мало детаља. Обучен је на милијардама слика и може да произведе резултате који су упоредиви са онима које бисте добили од ДАЛЛ-Е 2 и МидЈоурнеи.

Емад Мостакуе, оснивач и извршни директор Стабилити АИ, је компанија одговорна за Стабле Диффусион. Стабле Диффусион је модел латентне дифузије који је развила ЦомпВис група на ЛМУ Минхену, а дизајнирали су га Патрицк Ессер и Робин Ромбацх, који су претходно креирали архитектуру модела латентне дифузије коју користи Стабле Диффусион.

  Изаберите Гоогле Воркспаце за е-пошту и сарадњу

Сарадња између Стабилити АИ, ЦомпВис ЛМУ, Рунваи, ЕлеутхерАИ и ЛАИОН учинила је Стабле Диффусион доступном јавности.

Стабилна дифузија се може применити на различитим платформама, укључујући Виндовс и Аппле уређаје. Коришћење примене на уређају у апликацији може да заштити приватност корисника, што је боље од приступа заснованог на серверу.

Мицрософт Бинг Имаге Цреатор

Мицрософт је представио нову алатку под називом Бинг Имаге Цреатор, која омогућава корисницима да креирају сопствене слике директно у Мицрософт Едге-у. Компанија је објавила пакет алата за креаторе дизајнираних да подстакну креативност и самоизражавање. Алат омогућава корисницима да креирају персонализоване слике да деле своје животне надоградње или у било коју другу сврху која им је потребна.

Корисници могу лако приступити Имаге Цреатору са бочне траке Мицрософт Едге-а. Мицрософт је предузео проактивне мере како би осигурао да се алатка користи одговорно и да не олакшава ширење увредљивог садржаја.

Компанија је поставила политику садржаја која забрањује употребу Имаге Цреатор-а у одређеним случајевима, а корисници могу пријавити свако кршење ове политике. Штавише, Мицрософт је имплементирао технологију за решавање потенцијалних предрасуда које би могле настати у технологији генеративне слике.

У овом чланку ћемо кренути на путовање да проценимо резултате сваког описног генератора АИ слика када се од вас затражи идентична текстуална упутства.

Подсетник 1: Савремени Деда Мраз на санкама које вуку ирваси по топлом сунчаном дану на аутопуту

Подсетник 2: Снимак изблиза животиње са великим очима, који хвата њену невиност и љупкост

Упозорење 3: Људски астронаут који се игра слетања на нову планету добродошао је непријатељским ванземаљским створењима која вуку своје оружје

Податак 4: Модерна апстрактна уметност корице књиге романа са седиштем у Њујорку у смелим светлим бојама

Подсетник 5: Човек одлучује између два тањира – једног са пицом и једног са чизбургером на њему

Подсетник 6: Рањени ратник јаше коња по снежној планини са мачем у руци

Промпт 7: Апстрактна слика која користи различите нијансе која приказује кретање и проток воде

Подсетник 8: Лосос у реци са бујним зеленим дрвећем у позадини

Подсетник 9: Чаша воде на столу са лимуном који се у њу цеди руком

Упозорење 10: Поглед на хоризонт у пустињи из угла људи који у њој јашу слона

Податак 11: Шума у ​​којој папирни новац расте на дрвећу, а птице су направљене од новчића

Упозорење 12: Здела рамена, сенчење ћелија, вечерње осветљење, фотореалистично

Податак 13: Елон Муск је сиромашан и незапослен

Пресуда

Након процене резултата МидЈоурнеи, Стабле Диффусион и Бинг Имаге Цреатор, очигледно је да нема дефинитивног победника.

  Како да прилагодите окно са обавезама у Оутлоок-у

Сваки генератор тумачи упите на посебан начин, са сличностима које се налазе у излазима Бинг Имаге Цреатор и МидЈоурнеи. Стабилна дифузија је ефикасна када упити имају јасне описе, али често речи схватају превише дословно. Иако су МидЈоурнеи и Бинг Имаге Цреатор генерално успешни, повремено дају резултате који не одговарају упитима.

Посебно, Бинг Имаге Цреатор је опрезан у генерисању било каквих увредљивих или подстрекавајућих излаза, издајући поруку упозорења када се од њега затражи да створи слику сиромашног и незапосленог Елона Маска. За похвалу је Мицрософтово усвајање таквих заштитних мера.

У међувремену, МидЈоурнеи-јева експертиза за неуронску мрежу створила је слику сиромашног и напуштеног Елона Маска. Дакле, може се закључити да ће сваки генератор опслуживати своју базу корисника.