13 популарних АИ модела за прављење генеративних АИ апликација

Желите да направите сопствене генеративне АИ апликације? Ево листе АИ модела који ће вам помоћи да почнете.

АИ модели су архитектуре неуронских мрежа које изузетно добро раде на специфичним задацима. То укључује архитектуре конволуционих неуронских мрежа за класификацију и сегментацију слика, генеративне унапред обучене велике језичке моделе, моделе дифузије за задатке генерисања слика и

Недавно су АИ модели за генеративне АИ апликације — за слике, говор, текст и још много тога — постали супер популарни. Што је и због напретка у истраживању и приступа рачунарству високих перформанси.

Ево кратког резимеа популарних АИ модела о којима ћу расправљати у наставку.

МоделКеи могућностиГПТ-4Велики језички модел отвореног кода може се користити за прављење ЛЛМ апликацијаЛЛаМАРазноврсне НЛП апликације, од цхатботова до асистената за кодирањеФалцонВелики језички модел отвореног кода може се користити за прављење ЛЛМ апликацијаСтабле ДиффусионПретварање текста у слику, уцртавање слике, пресликавање и повећање величинеДАЛЛ-Е 2Генерисање текста у сликуШапатПрепознавање говора, превод језика и детекција језикаСтаблеЛМЛагани велики језички модел отвореног кодаЦЛИПРазличити НЛП задаци, као што су одговарање на питања, сумирање и генерисање текстаИнтернЛМВелики језички модел отвореног кода; може се користити за прављење ЛЛМ апликацијаМодел било чега сегментаЗеро-схот генерализација за различите задатке сегментације сликеВавеГАНАудио генерацијаЦицлеГАН и пик2пикПревод слике у сликуБиоГПТГенерисање и рударење биомедицинског текста

Од АИ уметности до израде персонализованог асистента за кодирање, можете да направите низ генеративних АИ апликација на основу ваших интересовања. Овде наводимо неке занимљиве моделе вештачке интелигенције које можете да истражите – заједно са њиховим кључним могућностима.

Хајде да почнемо!

ГПТ-4

Од генерисања плана пута за ваше предстојеће планове путовања до израде пропратних писама која одговарају опису посла, ЦхатГПТ је постао део наших свакодневних задатака. ГПТ-4његов наследник, је још моћнији модел великог језика.

То је ОпенАИ-јев најмоћнији АИ систем са бољим могућностима закључивања и перформансама од ЦхатГПТ-а.

Ево техничког разговора о томе како ГПТ-4 функционише и како можете да правите апликације са њим.

Можете приступити ЦхатГПТ интерфејсу помоћу а бесплатни ОпенАИ налог. Међутим, да бисте приступили ГПТ-4, требало би да имате ЦхатГПТ Плус претплату.

  Како омогућити ћаскање уживо 👋 на вашој веб локацији?

Ево неколико апликација које можете да направите са овим великим језичким моделима:

  • Прилагођени цхат ботови
  • Побољшање ЦРМ платформи
  • Питање-одговарање на прилагођеном корпусу
  • Остали задаци као што су сумирање и генерисање текста

Затим ћемо прећи преко неких великих језичких модела отвореног кода.

ЛЛаМА

Мета АИ објављен ЛЛаМА, основни модел великог језика са 65Б параметара, у фебруару 2023. Након тога, ЛЛама 2 је објављен са значајним побољшањима у односу на претходно издање. Можете приступити следећем:

  • Ллама Цхат: Фино подешена Ллама 2
  • Цоде Ллама: Изграђен на Ллама 2; обучени за преко 500Б токена кода; подржава генерисање кода у свим најпопуларнијим програмским језицима

Можете преузети и користити Ллама моделе до тражећи приступ. Погледајте овај водич да научите како да користите ЛЛама 2 у својим Питхон апликацијама:

Фалцон

Фалцон је још један језик отвореног кода Института за технолошке иновације (УАЕ). Сви модели у Фалцон ЛЛМ пакету су отвореног кода и доступни су за отворени приступ. Тако да их можете користити за прављење ЛЛМ апликација.

Тренутно постоје четири величине модела: 1.3Б, 7.5Б, 40Б и 180Б. да би био бољи него на неколико бенчмарка, модел 180Б је обучен на скупу података од 3,5Т токена. Фалцон ЛЛМ ради на нивоу других водећих ЛЛМ-ова отвореног кода.

Фалцон 180Б опен-соурце ЛЛМ постиже перформансе блиске ГПТ-4. Погледајте овај водич који покрива Фалцон 180Б, како можете да га користите, хардверске захтеве и како да упоредите са ГПТ-4:

Стабле Диффусион

Стабле Диффусион модел текста у слику за генерисање слика и друге креативне АИ апликације. Такође се може користити за повећање слике и сликање.

Стабле Диффусион КСЛобјављен у јулу 2023. године, нуди неколико побољшања, укључујући:

  • генерисање описних слика из много краћих упита
  • могућност генерисања текста подршке унутар слика
  • задаци осликавања и надсликавања слике
  • интеракција са изворном сликом за генерисање варијанти

Ако желите да научите како функционишу модели дифузије – метод иза магије – погледајте Како функционишу модели дифузијебесплатни курс ДеепЛеарнинг.АИ.

ДАЛЛ-Е 2

ДАЛЛ-Е 2 из Опен АИ је још један популаран модел генерисања текста у слику. Можете га користити за генерисање реалистичних слика и уметности из текста — описа природног језика.

Може се користити за следеће задатке:

  • генерисање слике из текстуалних упита
  • сликање и надсликавање слике
  • генерисање варијација слике

Можете приступити ДАЛЛ-Е 2 преко ОпенАИ АПИ-ја или Веб интерфејс ОпенАИ лабораторија.

  Како да прегледате као гост у Цхроме-у и на Цхромебоок-у

Шапат

Отворите АИ Шапат је модел препознавања говора који се може користити за мноштво апликација, укључујући:

  • језичка идентификација
  • задатке препознавања говора као што је транскрипција аудио датотека
  • превод говора

Ево упутства о томе како да конвертујете говор у текст користећи ОпенАИ Вхиспер АПИ:

Да бисте испробали модел, можете инсталирати шапат (опенаи-вхиспер) користећи пип и приступити АПИ-ју из Питхон скрипте за транскрипцију аудио датотека. Даље, можете користити друге велике језичке моделе да резимирате транскрипт и направите аудио датотеку → резиме.

СтаблеЛМ

СтаблеЛМ је ЛЛМ пакет отвореног кода компаније Стабилити АИ. Тренутно су доступни параметри 3Б и 7Б. Наредна издања ће укључивати веће моделе са 15Б – 65Б параметрима.

Дакле, ако желите да експериментишете са лаганим ЛЛМ-овима отвореног кода у својим апликацијама, можете испробати СтаблеЛМ.

ЦЛИП

ЦЛИП скраћеница од Контрастивна језичка слика пре-тренинг. То је неуронска мрежа, мултимодални модел, обучен на великом скупу података (текст, слика) парова. Модел користи податке природног језика, покушава да научи — из описа природног језика — семантику слика. ЦЛИП модел је способан да предвиди најрелевантнији текст датој слици.

Помоћу ЦЛИП-а можете да извршите класификацију слика без снимка—без скупе претходне обуке и финог подешавања. Даље, можете искористити могућности ЦЛИП и векторских база података да бисте направили занимљиве апликације у:

  • претрага текста у слику и слике у слику
  • обрнуто претраживање слике

Модел било чега сегмента

Сегментација слике је задатак идентификације пиксела који припадају одређеном објекту унутар слике. Мета АИ објављен Модел било чега сегмента (САМ) који се може користити за сегментирање било које слике и изрезивање објеката из њих.

Извор слике: СегментАнитхинг

Можете користити упите да одредите шта да сегментирате на слици. САМ тренутно подржава следеће упите: граничне оквире, маске и тачке у првом плану и позадини. Модел такође има одличне перформансе генерализације нула снимака на претходно невидљивим сликама. Дакле, није потребна експлицитна обука.

Испробајте САМ модел у вашем претраживачу!

ИнтернЛМ

ИнтернЛМ је језик отвореног кода. Можете испробати основни модел 7Б и модел ћаскања отвореног кода. Модел подржава контекстни прозор од 8К. Поред тога, ИнтернЛМ подржава интерпретатор кода и могућности позивања функција.

ИнтернЛМ је такође доступан у библиотеци трансформатора ХуггингФаце. Можете искористити лагани оквир пре тренинга. Такође подржава прављење и примену апликација помоћу ЛМДеплои. Дакле, можете да направите генеративне НЛП апликације од краја до краја са ИнтернЛМ-ом.

  Како да користите Стеамов Стораге Манагер да брзо управљате својим играма

ВавеГАН

ВавеГАН је модел за аудио генерисање. Помаже у синтези сировог звука из узорака стварних аудио података.

Можете тренирати ВавеГАН на скупу података произвољних аудио датотека и синтетизовати звук без опсежне претходне обраде.

ЦицлеГАН и Пик2Пик

До сада смо покривали моделе говора у текст, текста у слику и друге моделе за различите задатке обраде природног језика. Али шта ако желите да извршите превод слике у слику? Овде можете користити ЦицлеГАН да научите мапирање са изворног домена на циљни домен да бисте извршили превод слике у слику.

На пример, с обзиром на слику обале језера током зиме, можда ћете желети да преведете исту слику када је лето. На слици коња, можда ћете желети да замените коња зебром, а да притом задржите исту позадину. ЦицлеГАН је веома погодан за такве задатке.

Модел пик2пик се може користити за превођење слике у слику; кључне могућности модела укључују:

  • реконструисање објеката са ивичних карата и
  • бојење слика

Можете пронаћи ПиТорцх имплементације ЦицлеГАН-а и пик2пик-а на ГитХуб-у.

БиоГПТ

БиоГПТ од Мицрософт-а је модел трансформатора који можете да користите за рударење биомедицинских података и апликације за генерисање текста. Користи имплементације модела од секвенце до секвенце које обезбеђује фаирсек.

Фаирсек из Фацебоок истраживања (сада Мета АИ) је комплет алата који обезбеђује имплементацију модела секвенце до секвенце за задатке као што су:

  • језичко моделовање
  • превод
  • сажимање

Оба унапред обучени модели а на располагању су фино подешене контролне тачке модела. Модел можете преузети или са УРЛ-а или са ХуггингФаце чворишта.

БиоГПТ модели су такође део библиотеке трансформатора ХуггингФаце. Дакле, ако радите у биомедицинском простору, можете користити БиоГПТ за прављење апликација специфичних за домен.

Окончање

Надам се да сте пронашли неколико корисних модела са којима можете да правите генеративне АИ апликације. Иако ова листа није потпуна, покрили смо неке од најпопуларнијих модела које можете користити за прављење апликација за генерисање текста и звука, транскрипцију говора у текст, претрагу слика и још много тога.

Када правите апликације користећи велике језичке моделе, требало би да будете свесни уобичајених замки, као што су фактички нетачне информације и халуцинације. Можда ћете се суочити са ограничењима када фино подешавате моделе јер процес финог подешавања често захтева интензиван ресурс.

Дакле, ако сте програмер, време је да се придружите АИ револуцији и почнете да правите занимљиве АИ апликације! Можете да испробате ове моделе у Гоогле Цолаб-у или другим бележницама за науку о подацима за сарадњу.