Генеративне адверсаријске мреже (ГАН): Увод

Генеративне адверсаријске мреже (ГАН) су једна од модерних технологија које нуде много потенцијала у многим случајевима употребе, од креирања ваших старих слика и повећања вашег гласа до пружања различитих апликација у медицинској и другим индустријама.

Ова напредна технологија може вам помоћи да обликујете своје производе и услуге. Такође се може користити за побољшање квалитета слике ради очувања успомена.

Док су ГАН-ови благодат за многе, неки то сматрају забрињавајућим.

Али шта је тачно ова технологија?

У овом чланку ћу разговарати о томе шта је ГАН, како функционише и његове примене.

Дакле, хајде да заронимо одмах!

Шта је генеративна супарничка мрежа?

Генеративна контрадикторна мрежа (ГАН) је оквир за машинско учење који се састоји од две неуронске мреже које се такмиче у стварању прецизнијих предвиђања као што су слике, јединствена музика, цртежи и тако даље.

ГАНс је 2014. године дизајнирао компјутерски научник и инжењер Иан Гоодфеллов и неке од његових колега. Оне су јединствене дубоке неуронске мреже способне да генеришу нове податке сличне онима на којима се обучавају. Они се такмиче у игри са нултом сумом која доводи до тога да један агент губи игру док је други добија.

Првобитно, ГАН је предложен као генеративни модел за машинско учење, углавном учење без надзора. Али ГАН-ови су такође корисни за учење под пуним надзором, полу-надгледано учење и учење са појачањем.

Два блока у конкуренцији у ГАН-у су:

Генератор: То је конволуциона неуронска мрежа која вештачки производи излазе сличне стварним подацима.

Дискриминатор: То је деконволуциона неуронска мрежа која може да идентификује оне излазе који су вештачки створени.

Кључни концепти

Да бисмо боље разумели концепт ГАН-а, хајде да брзо разумемо неке важне повезане концепте.

Машинско учење (МЛ)

Машинско учење је део вештачке интелигенције (АИ) који укључује учење и изградњу модела који користе податке за побољшање перформанси и тачности током обављања задатака или доношења одлука или предвиђања.

МЛ алгоритми креирају моделе засноване на подацима о обуци, побољшавајући се уз континуирано учење. Користе се у више поља, укључујући компјутерски вид, аутоматизовано доношење одлука, филтрирање е-поште, медицину, банкарство, квалитет података, сајбер безбедност, препознавање говора, системе за препоруке и још много тога.

Дисцриминатинг Модел

У дубоком учењу и машинском учењу, дискриминишући модел ради као класификатор да разликује скуп нивоа или две класе.

На пример, разликовање између различитих воћа или животиња.

Генеративни модел

У генеративним моделима сматра се да случајни узорци стварају нове реалистичне слике. Учи из стварних слика неких објеката или живих бића како би створио сопствене реалистичне, али имитиране идеје. Ови модели су два типа:

Варијацијски аутоенкодери: Користе енкодере и декодере који су одвојене неуронске мреже. Ово функционише зато што дата реалистична слика пролази кроз енкодер да би ове слике представила као векторе у латентном простору.

Затим, декодер се користи за узимање ових интерпретација да би се произвеле неке реалистичне копије ових слика. У почетку, његов квалитет слике може бити низак, али ће се побољшати када декодер постане потпуно функционалан, а можете занемарити кодер.

Генеративне адверсаријске мреже (ГАН): Као што је горе објашњено, ГАН је дубока неуронска мрежа способна да генерише нове, сличне податке из улазних података који су јој обезбеђени. Спада под ненадгледано машинско учење, што је један од типова машинског учења о којима се говори у наставку.

Учење под надзором

У обуци под надзором, машина се обучава користећи добро означене податке. То значи да ће неки подаци већ бити означени тачним одговором. Овде су машини дати неки подаци или примери како би се омогућило надгледаном алгоритму учења да анализира податке о обуци и произведе тачан резултат из ових означених података.

Пронађите свој телефон помоћу ових 10 апликација за праћење

Учење без надзора

Учење без надзора подразумева обуку машине уз помоћ података који нису ни означени ни класификовани. Омогућава алгоритму машинског учења да ради на тим подацима без упутства. У овој врсти учења, задатак машине је да категорише несортиране податке на основу образаца, сличности и разлика без претходне обуке о подацима.

Дакле, ГАН-ови су повезани са извођењем ненадгледаног учења у МЛ. Има два модела који могу аутоматски открити и научити обрасце из улазних података. Ова два модела су генератор и дискриминатор.

Хајде да их разумемо мало више.

Делови ГАН-а

Термин „адверсариал“ је укључен у ГАН јер има два дела – генератор и именилац који се такмиче. Ово се ради да би се ухватиле, испитале и реплицирале варијације података у скупу података. Хајде да боље разумемо ова два дела ГАН-а.

Генератор

Генератор је неуронска мрежа способна да учи и генерише лажне тачке података као што су слике и аудио који изгледају реално. Користи се у обуци и постаје све бољи уз континуирано учење.

Подаци које генерише генератор користе се као негативан пример за други део – именилац који ћемо видети следеће. Генератор узима насумични вектор фиксне дужине као улаз да би произвео излазни узорак. Има за циљ да представи излаз пред дискриминатором како би могао да класификује да ли је стваран или лажан.

Генератор је обучен са овим компонентама:

Улазни вектори са шумом
Мрежа генератора за трансформацију случајног улаза у инстанцу података
Дискриминаторска мрежа за класификацију генерисаних података
Губитак генератора за кажњавање генератора јер не успева да превари дискриминатора

Генератор ради као лопов да би реплицирао и створио реалистичне податке како би преварио дискриминатора. Има за циљ да заобиђе неколико извршених провера. Иако може страшно да пропадне у почетним фазама, наставља да се побољшава све док не генерише више реалних, висококвалитетних података и избегне тестове. Након што се ова способност постигне, можете користити само генератор без потребе за посебним дискриминатором.

Дисцриминатор

Дискриминатор је такође неуронска мрежа која може да разликује лажну и стварну слику или друге типове података. Као генератор, игра виталну улогу током фазе тренинга.

Понаша се као полиција да ухвати лопова (лажни подаци генератора). Има за циљ откривање лажних слика и абнормалности у инстанци података.

Као што је већ поменуто, генератор учи и наставља да се побољшава да би достигао тачку у којој постаје самопоуздан да производи слике високог квалитета које не захтевају дискриминатор. Када се висококвалитетни подаци из генератора прођу кроз дискриминатор, он више не може да разликује праву слику од лажне. Дакле, добро је да идете само са генератором.

Како функционише ГАН?

У генеративној адверсариал мрежи (ГАН), три ствари укључују:

Генеративни модел који описује начин на који се подаци генеришу.
Конкурентно окружење где се модел обучава.
Дубоке неуронске мреже као АИ алгоритми за обуку.

ГАН-ове две неуронске мреже – генератор и дискриминатор – користе се за играње супротстављене игре. Генератор узима улазне податке, као што су аудио датотеке, слике, итд., да генерише сличну инстанцу података, док дискриминатор потврђује аутентичност те инстанце података. Ово последње ће одредити да ли је инстанца података коју је прегледао стварна или не.

На пример, желите да проверите да ли је дата слика стварна или лажна. Можете користити ручно генерисане уносе података за напајање генератора. Он ће креирати нове, реплициране слике као излаз.

Док то ради, генератор има за циљ да се све слике које генерише буду сматране аутентичним, упркос томе што су лажне. Жели да створи прихватљиве исходе да лаже и да избегне да буде ухваћен.

25 најбољих алата за тестирање АПИ-ја

Затим, овај излаз ће ићи у дискриминатор заједно са скупом слика из стварних података да би се открило да ли су ове слике аутентичне или не. Делује негативно на генератор без обзира колико се трудио да опонаша; дискриминатор ће помоћи да се разликују чињенични подаци од лажних.

Дискриминатор ће узети и лажне и стварне податке да би вратио вероватноћу од 0 или 1. Овде, 1 представља аутентичност, док 0 представља лажну.

Постоје две повратне петље у овом процесу:

Генератор спаја повратну петљу са дискриминатором
Дискриминатор придружује још једну повратну петљу са скупом стварних слика

ГАН обука функционише јер су и генератор и дискриминатор у обуци. Генератор континуирано учи пропуштањем лажних улаза, док ће дискриминатор научити да побољша детекцију. Овде су обоје динамични.

Дискриминатор је конволуциона мрежа способна да категоризује слике које му се достављају. Ради као биномни класификатор за означавање слика као лажних или стварних.

С друге стране, генератор је као инверзна конволуциона мрежа која узима случајне узорке података да би произвела слике. Али дискриминатор верификује податке уз помоћ техника смањења узорковања, као што је максимално обједињавање.

Обе мреже покушавају да оптимизују супротстављену и различиту функцију губитка или циља у супарничкој игри. Њихови губици им омогућавају да се још јаче гурају једни против других.

Врсте ГАН-ова

Генеративне адверсарне мреже су различитих типова заснованих на имплементацији. Ево главних типова ГАН-а који се активно користе:

Условни ГАН (ЦГАН): То је техника дубоког учења која укључује специфичне условне параметре који помажу у разликовању стварних и лажних података. Такође укључује додатни параметар – „и” у фази генератора за производњу одговарајућих података. Такође, налепнице се додају овом улазу и шаљу дискриминатору да би му омогућиле да провери да ли су подаци аутентични или лажни.
Ванила ГАН: То је једноставан ГАН тип где су дискриминатор и генератор једноставнији и вишеслојни перцептрони. Његови алгоритми су једноставни, оптимизују математичку једначину уз помоћ стохастичког градијента.
Дубоки конволуциони ГАН (ДЦГАН): Популаран је и сматра се најуспешнијом ГАН имплементацијом. ДЦГАН се састоји од ЦонвНет-а, а не од вишеслојних перцептрона. Ове ЦонвНетс се примењују без употребе техника као што је максимално груписање или потпуно повезивање слојева.
ГАН са супер резолуцијом (СРГАН): То је ГАН имплементација која користи дубоку неуронску мрежу заједно са непријатељском мрежом како би помогла у стварању слика високог квалитета. СРГАН је посебно користан за ефикасно увећање оригиналних слика ниске резолуције тако да су њихови детаљи побољшани, а грешке сведене на минимум.
Лапласова пирамида ГАН (ЛАПГАН): То је инверзибилна и линеарна репрезентација која укључује вишеструке пропусне слике које су постављене на осам размака са нискофреквентним остацима. ЛАПГАН користи неколико дискриминаторских и генераторских мрежа и више нивоа Лапласове пирамиде.

ЛАПГАН се широко користи јер даје врхунски квалитет слике. Ове слике се прво смањују на сваком слоју пирамиде, а затим се повећавају на сваком слоју, где се идејама даје мало буке док не добију оригиналну величину.

Примене ГАН-ова

Генеративне супарничке мреже се користе у различитим областима, као што су:

Наука

ГАН могу да обезбеде тачан и бржи начин за моделирање формирања високоенергетског млаза и извођење физичких експеримената. Ове мреже такође могу бити обучене да процене уска грла у извођењу симулација за физику честица које троше велике ресурсе.

ГАН могу убрзати симулацију и побољшати верност симулације. Поред тога, ГАН-ови могу помоћи у проучавању тамне материје симулацијом гравитационог сочива и побољшањем астрономских слика.

Видео игрице

Свет видео игара је такође искористио ГАН да унапреди 2-димензионалне податке ниске резолуције који се користе у старијим видео играма. Помоћи ће вам да поново креирате такве податке у 4к или чак већим резолуцијама кроз обуку слика. Затим можете смањити узорковање података или слика како бисте их учинили погодним за стварну резолуцију видео игре.

Како променити Нетфлик регион и гледати било коју Нетфлик земљу (сваки уређај)

Обезбедите одговарајућу обуку својим ГАН моделима. Они могу да понуде оштрије и јасније 2Д слике импресивног квалитета у поређењу са изворним подацима док задржавају детаље стварне слике, као што су боје.

Видео игре које су искористиле ГАН укључују Ресидент Евил Ремаке, Финал Фантаси ВИИИ и ИКС и још много тога.

Уметност и мода

Можете користити ГАН-ове за генерисање уметности, као што је креирање слика појединаца који никада нису постојали, сликање фотографија, прављење слика нестварних модних модела и још много тога. Такође се користи у цртежима који генеришу виртуелне сенке и скице.

Оглашавање

Коришћење ГАН-ова за креирање и производњу ваших огласа уштедеће време и ресурсе. Као што се види изнад, ако желите да продате свој накит, можете креирати замишљени модел који изгледа као прави човек уз помоћ ГАН-а.

На овај начин можете натерати модел да носи ваш накит и да га покаже својим купцима. То ће вас спасити од ангажовања модела и плаћања за њега. Можете чак и да елиминишете додатне трошкове као што су плаћање превоза, изнајмљивање студија, уређење фотографа, шминкера итд.

Ово ће значајно помоћи ако сте бизнис који расте и не можете себи да приуштите да унајмите модел или имате инфраструктуру за снимање огласа.

Аудио Синтхесис

Можете креирати аудио датотеке из скупа аудио клипова уз помоћ ГАН-ова. Ово је такође познато као генеративни звук. Немојте ово бркати са Амазон Алека, Аппле Сири или другим АИ гласовима где су гласовни фрагменти добро спојени и произведени на захтев.

Уместо тога, генеративни аудио користи неуронске мреже за проучавање статистичких својстава аудио извора. Затим, директно репродукује та својства у датом контексту. Овде моделирање представља начин на који се говор мења након сваке милисекунде.

Трансфер Леарнинг

Напредне студије трансферног учења користе ГАН-ове у усклађивању најновијих простора функција као што је учење са дубоким појачањем. За ово, изворна уградња и циљни задатак се достављају дискриминатору да одреди контекст. Затим, резултат се назад пропагира преко енкодера. На овај начин, модел наставља да учи.

Остале примене ГАН-а укључују:

Дијагноза потпуног или делимичног губитка вида детекцијом глаукоматозних слика
Визуелизујте индустријски дизајн, дизајн ентеријера, одевне предмете, ципеле, торбе и још много тога
реконструисати форензичке црте лица оболеле особе
креирајте 3Д моделе предмета од слике, стварајте нове објекте као 3Д облак тачака, моделирајте обрасце кретања у видео снимку
Покажите изглед особе са променљивим годинама
Повећање података као што је побољшање ДНН класификатора
Уцртајте обележје које недостаје на мапи, побољшајте приказе улица, пренесите стилове мапирања и још много тога
Направите слике, замените систем за претрагу слика итд.
Генеришите контролне улазе за нелинеарни динамички систем коришћењем ГАН варијације
Анализирајте ефекте климатских промена на кућу
Направите лице особе узимајући њен глас као улаз
Креирајте нове молекуле за неколико мета протеина код рака, фиброзе и упале
Анимирајте гифове са обичне слике

Постоји много више примена ГАН-а у различитим областима, а њихова употреба се шири. Међутим, постоји више случајева његове злоупотребе. Људске слике засноване на ГАН-у коришћене су за злокобне случајеве употребе као што је производња лажних видео снимака и слика.

ГАН-ови се такође могу користити за креирање реалистичних фотографија и профила људи на друштвеним медијима који никада нису постојали на земљи. Друге које се тичу злоупотребе ГНА-а су стварање лажне порнографије без пристанка истакнутих појединаца, дистрибуција фалсификованих видео снимака политичких кандидата и тако даље.

Иако ГНА могу бити благодат у многим областима, њихова злоупотреба такође може бити катастрофална. Стога се морају применити одговарајуће смернице за његову употребу.

Закључак

ГАН су један изузетан пример модерне технологије. Пружа јединствен и бољи начин генерисања података и помагања у функцијама као што су визуелна дијагноза, синтеза слике, истраживање, повећање података, уметност и наука и још много тога.

Можда ћете бити заинтересовани и за платформе за машинско учење са ниским кодом и без кода за прављење иновативних апликација.