Преглед садржаја
Кључне Такеаваис
- Генерализација је неопходна у дубоком учењу како би се обезбедила тачна предвиђања са новим подацима. Зеро-схот учење помаже да се то постигне тако што дозвољава АИ да користи постојеће знање да направи тачна предвиђања о новим или невидљивим класама без означених података.
- Зеро-схот учење опонаша како људи уче и обрађују податке. Пружајући додатне семантичке информације, унапред обучени модел може тачно да идентификује нове класе, баш као што човек може да научи да идентификује гитару са шупљим телом разумевањем њених карактеристика.
- Зеро-схот учење побољшава вештачку интелигенцију побољшањем генерализације, скалабилности, смањењем преоптерећења и економичношћу. Омогућава да се модели обуче на већим скуповима података, стекну више знања кроз трансфер учења, имају боље контекстуално разумевање и смањују потребу за обимним означеним подацима. Како вештачка интелигенција буде напредовала, учење нулте тачке ће постати још важније у решавању сложених изазова у различитим областима.
Један од највећих циљева дубоког учења је обука модела који су стекли уопштено знање. Генерализација је од суштинског значаја јер осигурава да је модел научио смислене обрасце и да може да донесе тачна предвиђања или одлуке када се суочи са новим или невидљивим подацима. Обука таквих модела често захтева знатну количину означених података. Међутим, такви подаци могу бити скупи, радно интензивни, а понекад и немогући.
Зеро-схот учење је имплементирано како би се премостио овај јаз, омогућавајући АИ да користи своје постојеће знање да направи прилично тачна предвиђања упркос недостатку означених података.
Шта је Зеро-Схот учење?
Зеро-схот учење је специфичан тип технике трансферног учења. Фокусира се на коришћење унапред обученог модела за идентификацију нових или никада раније виђених класа једноставним пружањем додатних информација које описују појединости нове класе.
Користећи опште знање модела о одређеним темама и дајући му додатну семантику о томе шта да тражи, требало би да буде у стању да прилично прецизно одреди који предмет има задатак да идентификује.
Рецимо да треба да идентификујемо зебру. Међутим, ми немамо модел који може да идентификује такве животиње. Дакле, добијамо већ постојећи модел обучен да идентификује коње и каже моделу да су коњи са црно-белим пругама зебре. Када почнемо да закључујемо о моделу пружајући слике зебри и коња, постоје добре шансе да ће модел тачно идентификовати сваку животињу.
Као и многе друге технике дубоког учења, учење нулте тачке опонаша како људи уче и обрађују податке. Познато је да су људи природни ученици који уче. Ако сте добили задатак да пронађете гитару са шупљим телом у музичкој радњи, можда ћете имати проблема да је пронађете. Али када вам кажем да је шупље тело у основи гитара са рупом у облику слова ф на једној или обе стране, вероватно ћете је одмах пронаћи.
За пример из стварног света, хајде да користимо апликацију за класификацију нулте тачке од стране опен соурце ЛЛМ хостинг сајта Хуггинг Фаце користећи модел цлип-вит-ларге.
Ова фотографија приказује слику хлеба у торби за намирнице причвршћену за високу столицу. Пошто је модел обучен на великом скупу слика, модел вероватно може да идентификује сваку ставку на фотографији, као што су хлеб, намирнице, столице и сигурносни појасеви.
Сада желимо да модел класификује слику користећи претходно невидљиве класе. У овом случају, нови или невиђени часови би били „Опуштени хлеб“, „Безбедан хлеб“, „Седећи хлеб“, „Вожња намирницама“ и „Сигурне намирнице“.
Имајте на уму да смо намерно користили необичне невидљиве класе и слике да бисмо демонстрирали ефикасност нулте класификације на слици.
Након што је закључио модел, успео је да класификује са око 80% сигурности да је најприкладнија класификација за слику „Безбедан хлеб“. Ово је вероватно зато што модел мисли да је висока столица више за сигурност него за седење, опуштање или вожњу.
Сјајно! Ја бих се лично сложио са излазом модела. Али како је тачно модел дошао до таквог излаза? Ево општег погледа на то како функционише учење са нулте тачке.
Како функционише Зеро-Схот учење
Зеро-схот учење може помоћи унапред обученом моделу да идентификује нове класе без пружања означених података. У свом најједноставнијем облику, учење нулте тачке се обавља у три корака:
1. Припрема
Зеро-схот учење почиње припремом три врсте података
- Сеен Цласс: Подаци који се користе у обуци унапред обученог модела. Модел већ пружа виђене часове. Најбољи модели за нулто учење су модели обучени на часовима који су уско повезани са новом класом коју желите да модел идентификује.
- Невиђена/Нова класа: Подаци који никада нису коришћени током обуке модела. Мораћете сами да уредите ове податке јер их не можете добити од модела.
- Семантички/помоћни подаци: Додатни битови података који могу помоћи моделу да идентификује нову класу. Ово може бити у речима, фразама, уграђивањима речи или називима класа.
2. Семантичко пресликавање
Следећи корак је мапирање карактеристика невидљиве класе. Ово се ради стварањем уградње речи и прављењем семантичке мапе која повезује атрибуте или карактеристике невидљиве класе са датим помоћним подацима. Учење АИ трансфера чини процес много бржим, јер су многи атрибути који се односе на невидљиву класу већ мапирани.
3. Закључивање
Извођење закључака је употреба модела за генерисање предвиђања или излаза. У класификацији слика нула снимака, уграђивање речи се генерише на датом улазу слике, а затим се црта и пореди са помоћним подацима. Ниво сигурности зависиће од сличности између улазних и достављених помоћних података.
Како Зеро-Схот учење побољшава АИ
Зеро-схот учење побољшава АИ моделе решавањем неколико изазова у машинском учењу, укључујући:
- Побољшана генерализација: Смањење зависности од означених података омогућава да модели буду обучени у већим скуповима података, побољшавајући генерализацију и чинећи модел робуснијим и поузданијим. Како модели постају искуснији и генерализованији, можда ће чак бити могуће да модели науче здрав разум, а не типичан начин анализе информација.
- Скалабилност: Модели се могу континуирано обучавати и стећи више знања кроз трансфер учења. Компаније и независни истраживачи могу стално да побољшавају своје моделе како би били способнији у будућности.
- Смањена шанса за прекомерно уклапање: Претеривање се може десити због тога што је модел обучен на малом скупу података који не садржи довољно разноликости да би представио све могуће улазне податке. Обука модела кроз учење нулте тачке смањује шансе за преоптерећење обучавањем модела да боље контекстуално разуме предмете.
- Исплативо: Обезбеђивање велике количине означених података може захтевати време и ресурсе. Користећи учење преноса нулте тачке, обука робусног модела може да се уради са много мање времена и означених података.
Како вештачка интелигенција буде напредовала, технике као што је нулто учење постаће још важније.
Будућност учења од нуле
Зеро-схот учење је постало суштински део машинског учења. Омогућава моделима да препознају и класификују нове класе без експлицитне обуке. Са сталним напретком у архитектури модела, приступима заснованим на атрибутима и мултимодалној интеграцији, нулто учење може значајно помоћи да модели буду много прилагодљивији у решавању сложених изазова у роботици, здравству и компјутерском виду.