Поглед на нову Ал Генеративе Арт

Ал Генеративе Арт је врста уметности, најчешће визуелне, која се заснива на сарадњи човека и аутономног система. „Аутономни систем“ се дефинише као Вештачка интелигенција софтвер, алгоритам или модел способан за обављање сложених операција без потребе за интервенцијом програмера.

Од бизарних јукстапозиција слика које ствара Далл-Е Мини до NFT на тржишту, слике које генеришу АИ алгоритми све више улазе у главну машту. У ствари, два важна пројекта на ову тему која заслужују да буду анализирани су: Мидјоурнеи ДАЛЛ-Е2.

Наравно, вест је стигла и до Твитера. То, између осталих, коментарише Чарлс Хоскинсон, који је написао:

Ал Генеративна уметност: рани експерименти и карактеристике

Пошто смо схватили шта је генеративна уметност, важно је нагласити један од њених темељних принципа: случајност. Што је фундаментално својство генеративне уметности.

У ствари, у зависности од типа софтвера, аутономни систем је у стању да обради резултате који су увек различити и јединствени сваки пут када се изврши команда генериса, или може да врати променљив број резултата као одговор на унос корисника.

Први експерименти у генеративној уметности датирају из 1960-их са експериментима Харолд Цохен и његов ААРОН програм. Коен је први пут користио самостални софтвер за генерисање апстрактних уметничких дела инспирисаних поп арт ситотиском. Коенова дела су сада изложена у галерији Тејт у Лондону.

Још један атрибут генеративне уметности, али онај који је све мање и мање прерогатив, је понављање образаца или апстрактних елемената које обезбеђује програмер и имплементира се у софтверском коду.

Поред тога, развој све сложенијих неуронских мрежа које раде на асоцијацији текст-слика омогућио је развој генеративних модела способних за стварање све реалистичније и тачније слике. Најпознатији пример ове категорије генеративне уметности је Далл-Е.

Далл-Е је мултимодална неуронска мрежа заснована на РУЦЕНТЕР-КСНУМКС модел дубоког учења из ОпенАИ, иста компанија која се такође недавно развила ЦхатГПТ, цхатбот је покренут у новембру 2022. и оптимизован са “надгледан” и технике учења поткрепљења.

Враћајући се на Далл-Е, видимо да је овај систем способан да генерише слике из текстуалног описа, названог "брзак", на основу скупа података парова текст-слика.

Прва верзија Далл-Е, која је јавности представљена у јануару 2021. године и остала је прерогатив малог броја професионалаца у овој области, представљала је праву револуцију у погледу ове врсте генеративног модела, превазилазећи иновације ГПТ-а. 3 сама.

Такође је значајна чињеница да се тачност резултата које обрађује Далл-Е показала као савршен опсег за још једно ОпенАИ решење: ЦЛИП (Претходна обука за контрастни језик-слика).

Неуронска мрежа за класификацију и рангирање слика обучена на основу асоцијација текст-слика, као што су натписи пронађени на Интернету. Захваљујући ЦЛИП-овој интервенцији, која смањује број резултата предложених кориснику по упиту на 32, утврђено је да Далл-Е у већини случајева даје задовољавајуће слике.

Мидјоурнеи: дизајн, људска инфраструктура и вештачка интелигенција

Kao što se očekivalo, Мидјоурнеи је важан пројекат који је део новонасталог концепта Ал Генеративе Арт. Конкретно, Мидјоурнеи је независна истраживачка лабораторија која истражује нова средства мишљења и проширује имагинативне моћи људске врсте.

Коришћење је једноставно: прво се мора креирати налог Дискорд, платформа која угошћује различите заједнице, где је Мидјоурнеи једна од њих. У оквиру апликације налазе се различите собе за ћаскање у којима се може активно или не учествовати у дискусијама.

Важно је истаћи да да бисте први пут покушали да користите вештачку интелигенцију, морате ићи на "Новајлије" канали, где 25 бесплатних рендера су доступни.

Један рендер одговара генерисању четири различите варијанте генерисане из истог текстуалног уноса.

Дакле, 25 рендера се односи на 25 послова обраде које обавља Мидјоурнеи бот. Сходно томе, генерисање слике захтева интеракцију са Мидјоурнеи ботом путем текстуалне поруке која се зове „промпт“, у којој ће бити кључне речи које описују слику коју корисник има на уму.

Можете додати онолико детаља колико желите, важно је да кључне речи поделите зарезом. Када се рендеровање заврши, рачунар враћа четири различите слике на основу описа које можете изабрати.

Поред тога, када програм заврши са рендеровањем, можете да саопштите своје преференције на основу слика и, ако желите, поново генеришете још четири верзије.

ДАЛЛ-Е 2: нови АИ систем за уметничка дела

Поред Мидјоурнеи-а, ДАЛЛ-Е 2 је такође нови систем вештачке интелигенције који може да креира реалистичне слике и уметничка дела из описа природног језика. И не само то, ДАЛЛ-Е 2 такође може комбиновати концепте, атрибуте и стилове.

Снага новог АИ система такође лежи у могућности да прошири слике изван онога што је на оригиналном платну, стварајући нове експанзивне композиције. Поред тога, може да прави реалистичне промене у постојећим сликама са натписа на природном језику и може да додаје и уклања елементе узимајући у обзир сенке, рефлексије и текстуре.

Могућности ДАЛЛ-Е 2 такође укључују снимање слике и стварање неколико њених варијација инспирисаних оригиналом. ДАЛЛ-Е 2 је научио однос између слика и текста који се користи да их опише.

Користи процес тзв "дифузија", који почиње са узорком насумичних тачака и постепено мења тај образац према слици када препозна специфичне аспекте те слике.

Дакле, након што је ОпенАИ представио ДАЛЛ-Е у јануару 2021. године, сада најновији систем, ДАЛЛ-Е 2, генерише реалистичније и прецизније слике са четири пута већом резолуцијом.

ДАЛЛ-Е 2 је започео као истраживачки пројекат и сада је доступан као Бета верзија. Безбедносна ублажавања која је систем развио и наставља да се побољшава укључују: ограничавање способности система да генерише насилне слике, слике мржње или слике одраслих, и фазно примену засновано на учењу.

Извор: хттпс://ен.цриптономист.цх/2023/02/02/аи-генеративе-арт/