Да ли је Тјурингов тест застарео? 5 Алтернативе Тјуринговог теста

Преглед садржаја

Пре више од седам деценија, када су почели да се обликују први концепти вештачке интелигенције, Алан Тјуринг је објавио студију у којој је описао метод за њену идентификацију. Тај метод је касније постао познат као Тјурингов тест и деценијама је коришћен као стандард за разликовање људске интелигенције од вештачке.

Ипак, са појавом напредних АИ четботова као што су ChatGPT и Google Bard, све је теже разликовати да ли комуницирате са вештачком интелигенцијом или човеком. Ово отвара питање: да ли је Тјурингов тест постао застарео? И, ако јесте, које су алтернативе доступне?

Да ли је Тјурингов тест изгубио свој значај?

Кредит за слику: Хесус Санз/ Shutterstock

Да бисмо утврдили да ли је Тјурингов тест и даље релевантан, потребно је разумети његов принцип рада. Да би вештачка интелигенција прошла Тјурингов тест, мора да убеди испитивача да је у питању човек. Кључна ствар је да се АИ процењује упоредо са човеком, а комуникација се одвија искључиво путем писаног текста.

Размотрите овај сценарио: ви сте испитивач и постављате питања двојици учесника путем текста, а један од њих је АИ модел. Да ли бисте, на основу петоминутног разговора, могли да их разликујете? Важно је напоменути да циљ Тјуринговог теста није да идентификује АИ модел на основу тачних одговора, већ да процени да ли вештачка интелигенција може да размишља и понаша се на начин сличан човеку.

Главни недостатак Тјуринговог теста је што се фокусира искључиво на сличност одговора са људским, занемарујући друге важне факторе. На пример, не узима се у обзир ниво интелигенције АИ модела нити знање самог испитивача. Поред тога, тест је ограничен на текстуалну комуникацију, што отежава идентификацију вештачке интелигенције која може да генерише људски глас или креира видео снимке који веродостојно имитирају људско понашање.

Међутим, тренутни АИ модели као што су ChatGPT-4 и Google Bard још увек не достижу ниво на којем могу доследно проћи Тјурингов тест. У пракси, ако имате основно разумевање АИ, можете препознати текст који је генерисала вештачка интелигенција.

Пет најбољих алтернатива Тјуринговом тесту

Вероватно је да би будуће генерације АИ модела, као што је ChatGPT-5, могле савладати Тјурингов тест. У том случају, биће нам неопходни различити тестови, у комбинацији са Тјуринговим тестом, како бисмо могли да утврдимо да ли комуницирамо са вештачком интелигенцијом или са човеком. У наставку је листа најбољих алтернатива Тјуринговом тесту:

1. Маркусов тест

Гери Маркус, познати когнитивни научник и стручњак за вештачку интелигенцију, предложио је алтернативни приступ Тјуринговом тесту, објављен у часопису The New Yorker, који има за циљ да процени когнитивне способности вештачке интелигенције. Тест је једноставан: АИ модел се процењује на основу способности да гледа и разуме YouTube видео снимке и ТВ програме без титлова или пратећег текста. Да би вештачка интелигенција прошла Маркусов тест, мора да разуме нијансе као што су сарказам, хумор, иронија, и да може да преприча садржај видео снимака као што би то урадио човек.

Иако GPT-4 може да описује слике, тренутно не постоји АИ модел који може да разуме видео записе на начин на који то чини човек. Самовозећа возила се приближавају том циљу, али још нису потпуно аутономна и ослањају се на сензоре, јер немају могућност потпуног разумевања свог окружења.

2. Визуелни Тјурингов тест

Према истраживању објављеном у часопису PNAS, визуелни Тјурингов тест може се користити за утврђивање да ли разговарате са човеком или вештачком интелигенцијом, кроз примену упитника заснованог на сликама. Тест функционише слично као Тјурингов тест, али уместо да одговарају на питања текстом, учесницима се приказују слике и од њих се очекује да одговоре на једноставна питања, размишљајући као људи. Разлика у односу на CAPTCHA је у томе што су сви одговори тачни, али да би АИ прошао тест, мора да обрађује слике на начин сличан човеку.

Поред тога, када би се АИ и човеку показало више слика једна поред друге и затражило да идентификују реалне слике, човек би, захваљујући когнитивним способностима, могао да прође тест. Разлог за то је што АИ модели имају потешкоћа у разликовању слика које не изгледају као да су настале у стварном свету. Управо због тога можете идентификовати слике које је генерисала вештачка интелигенција, захваљујући аномалијама које немају смисла.

3. Тест Лавлeјс 2.0

Ада Лавлejс је прва концептуализовала теорију да компјутер не може да ствара оригиналне идеје изван оквира његовог програмирања, пре Тјуринговог теста. Међутим, Алан Тјуринг се није сложио са том идејом, тврдећи да АИ може изненадити људе. Смернице за Лавлejс тест развијене су тек 2001. године како би се вештачка интелигенција разликовала од човека, а према наводима сајта thekurzweillibrary, правила су ревидирана 2014. године.

Да би вештачка интелигенција прошла Лавлejс тест, мора да покаже способност генерисања оригиналних идеја које надмашују њено програмско окружење. Тренутни АИ модели, попут GPT-4, нису у стању да смисле нове проналаске изван постојећег људског знања. Међутим, вештачка општа интелигенција би могла постићи ту способност и проћи Лавлejс тест.

4. Обрнути Тјурингов тест

Шта кажете на идеју да Тјурингов тест ради у обрнутом смеру? Уместо да покушавате да утврдите да ли разговарате са човеком, циљ обрнутог Тјуринговог теста је да наведете АИ да поверује да сте ви вештачка интелигенција. За овај тест вам је потребан још један АИ модел који ће одговарати на иста питања користећи текст.

На пример, ако је ChatGPT-4 испитивач, можете да укључите Google Bard и човека као учеснике. Ако АИ модел успе да правилно идентификује људског учесника на основу одговора, он је прошао тест.

Недостатак обрнутог Тјуринговог теста је његова непоузданост, поготово имајући у виду да вештачка интелигенција понекад не може да разликује садржај који је генерисала вештачка интелигенција од садржаја који су написали људи.

5. Оквир за класификацију АИ

Према оквиру за класификацију вештачке интелигенције који је развио Крис Сад, Тјурингов тест је само један од начина процене да ли комуницирате са вештачком интелигенцијом. Укратко, оквир за класификацију АИ заснован је на теорији вишеструке интелигенције, која захтева да људска интелигенција задовољава најмање осам различитих критеријума, укључујући: музички ритам, логичко-математичку интелигенцију, визуелну идентификацију, емоционалну интелигенцију, саморефлексивну интелигенцију, способност егзистенцијалног мишљења и телесну кинестетику.

С обзиром да се вештачка интелигенција оцењује на основу осам различитих параметара, мало је вероватно да ће бити класификована као човек, чак и ако надмаши просек у одређеним областима. На пример, ChatGPT може да решава математичке задатке, описује слике и разговара на природном језику попут човека, али не би постигао успех у осталим категоријама дефинисаним у оквиру за класификацију АИ.

Тјурингов тест није коначно решење

Тјурингов тест је првобитно замишљен као мисаони експеримент, а не као коначан метод за разликовање људи од вештачке интелигенције. Када је први пут предложен, представљао је кључни стандард за мерење интелигенције машина.

Међутим, са недавним напретком у развоју АИ модела са говорним, визуелним и слушним интерактивним могућностима, Тјурингов тест је недовољан, због своје ограничене примене на текстуалне разговоре. Најефикасније решење би било увођење алтернатива Тјуринговом тесту, како би се додатно направила разлика између АИ модела и људи.