Да ли је Тјурингов тест застарео? 5 Алтернативе Тјуринговог теста

Пре више од 70 година, када је вештачка интелигенција концептуализована, Алан Тјуринг је објавио рад који је описао како да је идентификује. Касније је био познат као Тјурингов тест и користио се деценијама за разликовање човека од вештачке интелигенције.

Међутим, са увођењем напредних АИ цхатбота као што су ЦхатГПТ и Гоогле Бард, постаје све теже рећи да ли разговарате са АИ. Поставља питање; да ли је Тјурингов тест застарео? А ако јесте, које су алтернативе?

Да ли је Тјурингов тест застарео?

Кредит за слику: Јесус Санз/Схуттерстоцк

Да бисте утврдили да ли је Тјурингов тест застарео, прво морате разумети како функционише. Да би вештачка интелигенција прошла Тјурингов тест, мора да убеди иследника да је човек. Али постоји квака – АИ се процењује заједно са човеком и мора да одговори помоћу текста.

Размислите о томе овако; ако сте испитивач и постављате питања двојици учесника на мрежи користећи текст, али један од њих је АИ модел — да ли бисте их раздвојили након пет минута? Имајте на уму да циљ Тјуринговог теста није да идентификује модел вештачке интелигенције на основу тачних одговора, већ да процени да ли АИ може да размишља или да се понаша као човек.

Проблем са приступом Тјуринговог теста који се односи само на идентификацију одговора сличних људима је тај што не узима у обзир друге факторе. На пример, интелигенција АИ модела или знање испитивача. Осим тога, Тјурингов тест је ограничен само на текст и постаје све теже идентификовати вештачку интелигенцију која генерише људски глас или дубоке видео снимке који имитирају људско понашање.

Међутим, тренутни АИ модели као што су ЦхатГПТ-4 и Гоогле Бард још увек нису напредовали до тачке да могу доследно да прођу Тјурингов тест. У ствари, ако сте упознати са АИ, можете уочити текст који је генерисао АИ.

5 најбољих алтернатива Тјуринговог теста

Могуће је да би будући модели вештачке интелигенције попут ЦхатГПТ-5 могли да прођу Тјурингов тест. Ако се то догоди, биће нам потребни различити тестови у комбинацији са Тјуринговим тестом да бисмо утврдили да ли разговарамо са вештачком интелигенцијом или са човеком. Ево најбољих алтернатива Тјуринговог теста:

1. Маркусов тест

Гери Маркус, познати когнитивни научник и истраживач вештачке интелигенције, предложио је алтернативу Тјуринговом тесту који је објављен у Нев Иоркер да идентификује когнитивне способности АИ. Тест је једноставан – ви процењујете АИ модел на основу његове способности да гледа и разуме ИоуТубе видео снимке и ТВ емисије без титлова или текста. Да би вештачка интелигенција прошла Маркусов тест, требало би да разуме сарказам, хумор, иронију и причу када гледа видео снимке и да то објасни као човек.

У овом тренутку, ГПТ-4 може да опише слике, али до сада, тренутно не постоји АИ модел који може да разуме видео записе као човек. Самовозећа возила се приближавају, али нису потпуно аутономна и захтевају сензоре јер не могу да разумеју све у свом окружењу.

2. Визуелни Тјурингов тест

Према истраживачком раду објављеном на ПНАС, визуелни Тјурингов тест се може користити за идентификацију да ли разговарате са човеком или вештачком интелигенцијом помоћу упитника за слике. Ради као Тјурингов тест, али уместо да одговарају на питања користећи текстове, учесницима се приказују слике и очекује се да одговоре на једноставна питања док размишљају као људи. Међутим, визуелни Тјурингов тест се разликује од ЦАПТЦХА јер су сви одговори тачни – али да би прошао тест, АИ мора да обрађује слике слично као и човек.

Осим тога, ако се АИ и човеку покаже више слика једна поред друге и замоли се да идентификују реалистичне слике, човек би имао когнитивну способност да прође тест. То је зато што је АИ моделима тешко разликовати слике које не изгледају као да су снимљене у стварном свету. У ствари, то је разлог зашто можете идентификовати слике генерисане вештачком интелигенцијом користећи аномалије које немају смисла.

3. Тест Ловелаце 2.0

Теорију да компјутер не може да створи оригиналне идеје изван онога за шта је програмиран први пут је концептуализовала Ада Ловелаце пре Тјуринговог теста. Међутим, Алан Туринг се успротивио тој теорији тврдећи да АИ и даље може изненадити људе. Тек 2001. године развијене су смернице за Ловелаце тест како би се разликовала АИ од човека — и, према тхекурзвеиллибрари правила су касније ревидирана 2014.

Да би вештачка интелигенција прошла Ловелаце тест, мора да покаже да може да генерише оригиналне идеје које превазилазе њену обуку. Тренутни АИ модели као што је ГПТ-4 немају способност да смисле нове проналаске изван нашег постојећег знања. Међутим, вештачка општа интелигенција може постићи ту способност и проћи Ловелаце тест.

4. Обрнути Тјурингов тест

Шта кажете на Тјурингов тест, али урађен обрнуто? Уместо да покушавате да сазнате да ли разговарате са човеком, циљ је обрнути Тјурингов тест је преварити АИ да поверује да сте АИ. Међутим, потребан вам је и други АИ модел да бисте одговорили на иста питања користећи текст.

На пример, ако је ЦхатГПТ-4 испитивач, можете да упишете Гоогле Бард и још једног човека као учеснике. Ако АИ модел може исправно да идентификује људског учесника на основу одговора, он је прошао тест.

Лоша страна обрнутог Тјуринговог теста је та што је непоуздан, посебно имајући у виду да понекад вештачка интелигенција не може да разликује садржај генерисан од вештачке интелигенције и садржај који је написао људи.

5. Оквир класификације АИ

Према класификационом оквиру АИ који је развио Цхрис Саад, Тјурингов тест је само један од метода евалуације да бисте сазнали да ли разговарате са АИ. Сажетије речено, оквир класификације АИ заснован је на теорији вишеструке интелигенције, која захтева да људска интелигенција задовољи најмање осам различитих критеријума, који укључују: музички ритам, логичко-математичку интелигенцију, визуелну идентификацију, емоционалну интелигенцију, саморефлексивну интелигенцију , способност егзистенцијалног мишљења и кретање тела.

Пошто се АИ процењује на основу осам различитих параметара, мало је вероватно да ће проћи за човека чак и ако ради боље од просека у одређеним мерилима. На пример, ЦхатГПТ може да решава математичке проблеме, описује слике и разговара на природном језику попут човека, али не би успео у другим категоријама дефинисаним у оквиру класификације АИ.

Тјурингов тест није коначан

Тјурингов тест је требало да буде више мисаони експеримент него коначан тест за разликовање људи од вештачке интелигенције. Када је првобитно предложен, био је кључно мерило за мерење интелигенције машина.

Међутим, са недавним развојем АИ модела са говорним, визуелним и слушним интерактивним могућностима, Тјурингов тест је недовољан јер је ограничен на текстуални разговор. Најефикасније решење би било да се уведу алтернативе Тјуринговог теста које додатно разликују АИ моделе од људи.