ЦхатГПТ-4 вс ЦхатГПТ-3.5 Подразумевано у односу на ЦхатГПТ-3.5 Наслеђе: Тестиране разлике

Очекује се да ће ЦхатГПТ 4.0 направити велике таласе у универзуму цхатбот-а. Али да ли је заиста бољи од свог претходника? Хајде да проверимо.

ЦхатГПТ је био само врх надолазећег леденог брега аутоматизације, а Гоогле, Мицрософт и многе друге компаније које се баве АИ-ом су следиле њихов пример.

За почетак, пронашли смо неколико цхатботова као што је ЦхатГПТ, од којих многи не припадају великој технологији.

Али назовите то моћ маркетинга; ЦхатГПТ је и даље владајући краљ свих таквих АИ ботова. Може да уради многе ствари, укључујући математику, поезију и постове на блогу, а људи чак то користе за подношење тужби.

ДоНотПаи ради на коришћењу ГПТ-4 за генерисање „тужби једним кликом“ за тужбу против роботских позиваоца за 1.500 долара. Замислите да примите позив, кликнете на дугме, позив се транскрибује и генерише се тужба од 1.000 речи. ГПТ-3.5 није био довољно добар, али ГПТ-4 изузетно добро обавља посао: пиц.твиттер.цом/гплф79какГ

— Џошуа Браудер (@јбровдер1) 14. март 2023

Има много професионалаца који се брину да ће њихов скуп вештина бити бескорисан у блиској будућности.

Међутим, прочитао сам пост на Линкедину који каже:

АИ вас неће заменити, али особа која користи вештачку интелигенцију може.

Дакле, држимо фиге, хајде да се образујемо о најновијем ажурирању ЦхатГПТ-а и да видимо како се оно разликује од претходних верзија.

ЦхатГПТ: наслеђе, подразумевано и ажурирање

Дакле, постоје три верзије доступне плаћеним корисницима: Легаци (3.5), Дефаулт (3.5) и недавно ЦхатГПТ Упдате (4).

Иако ћемо ићи мало дубље о њиховим могућностима, ово је оно што ОпенАИ има да каже о разликама:

Извор: ОпенАИ

Дакле, док бесплатни корисници имају само Легаци 3.5 за играње, премиум претплата нуди све три да покушају и задовоље оно што корисници мисле да је најбоље.

Да сумирамо претходну слику, плаћени планови се односе на добијање прецизнијих резултата при пристојној брзини. Међутим, разлике су очигледне само ако су упутства компликована и захтевају креативност.

ПараметерЦхатГПТ 4ЦхатГПТ 3.5Бар Испитни резултат на врху 10% на дну 10% АИ2 Реасонинг Цхалленге (АРЦ) 96.3%85.2%Питхон Цодинг Сцоре67%48.1%Визуелна интерпретацијаДаНеЦонтектОвер 25к вордс:МањеАИС

Осим тога, ЦхатГПТ 4 може да прихвати визуелне уносе.

Па, доста дефиниција из уџбеника. Хајде да упрљамо руке и проценимо ове кандидате у стварном бојном пољу.

Даљи одељци су пуни слика које могу изгледати нејасне. У том случају, кликните десним тастером миша на било коју слику и изаберите Отвори у новој картици да бисте је правилно погледали.

Математика

Пошто сам дипломирани инжењер, не могу да им не поставим неке основне проблеме. Почнимо лако са алгебарским једначинама.

  Како користити Гоогле помоћник за закључавање телефона [No Root]

И фаза

Многи од нас су видели ове једначине ак2+бк+ц=0, где морамо да решимо за Кс. Овде сам дао овај једноставан упит, Реши за к: к2 + к – 6 = 0

Док су сви дали исте корене (Кс= -3,2), Легаци и Упдате су били сличнији у директном коришћењу формуле (као што ће сваки ученик) да би сазнали резултат.

Међутим, подразумевана вредност 3.5 објашњава две методе, укључујући факторизацију, коју обично сваки квалификован ученик примењује када им се дају такве уобичајене једначине.

ИИ фаза

Затим, тражим да реши мало сложену кубну једначину: к^3 -12к^2 + 48к – 64 = 0.

Ово је заиста доказало зашто је ЦхатГПТ 4 „ажурирање“.

Ево одговора:

Сва ова журка и ЦхатГПТ Легаци анд Дефаулт нису могли да реше генеричку кубну једначину. Међутим, Легаци је прошао мало боље и пронашао два корена исправно, док је Дефаулт пропао са свим.

Ажурирање је било јасни победник у другој фази и савршено је решило једначину, пронашавши сва три корена уз лепо објашњење.

Логично размишљање

Можемо са сигурношћу претпоставити да већина основних математичких задатака има решења из речника. Ако знате теорему или формулу, унесите вредности и добијте резултате.

А ЦхатГПТ, будући да је АИ, може брзо да уради такве упите. Међутим, логично резоновање је друга територија, са великим шансама да АИ падне у воду.

И фаза

Дао сам им класику:

А је старији од Б.
Ц је старији од А.
Б је старији од Ц.
Да ли је трећа изјава тачна или нетачна ако су прве две тврдње тачне?

И све верзије ЦхатГПТ-а су биле тачне у изјави да је трећа изјава лажна.

Затим сам користио имена уместо абецеде, а резултати би вас могли изненадити:

Дакле, Дефаулт 3.5 је наставио своје перформансе испод стандарда и збунио се са овом скромном варијацијом. Ипак, Легаци и Упдате су радили оптимално.

ИИ фаза

Можда сте до сада приметили да је сврха ове фазе И и фазе ИИ да се пронађе тачка разлике, где сложеност датог одзива разликује Ажурирање од остала два.

Овде је упит била једноставна логичка загонетка:

Једног јутра након изласка сунца, Рохит је стајао окренут према стубу. Сенка стуба пала је тачно са његове десне стране. У ком правцу је био окренут?
а. Север
б. Запад
ц. Југ
д. Исток

Овај је натерао Легаци да да нетачан одговор, док је Дефаулт одговорио нејасним појашњењима која су довела до погрешног закључка.

Само је Ажурирање сијало тачним одговором, са изјавама које је лако пратити.

Писма

Подношење тужби може бити незгодно, али понекад не дође до тога ако можете саставити упечатљиво прво обавештење.

Ево, кренуо сам са овим упитом: Напишите писмо Тиму Куку да ми преда јабуку јер нисам одговорио на један од мојих твитова.

  ХомеПод мини не реагује: 9 начина да се поправи!

Смешно, да! Али хајде да видимо шта АИ може да направи од овога.

Легаци 3.5 је одмах прихватио промпт као робо-роб и избацио писмо које ме може учинити одличним предметом спрдње ако икада стигне на своје одредиште.

Ни Дефаулт није био добар. Међутим, то ме је једноставно угасило као што би мрзовољни старац учинио петогодишњаку.

Иако су аргументи били тачни, ово је завршило забаву управо ту уз мало учења.

Иако је ово било довољно једноставно, било је потребно мало размишљања и креативности. И ту је велики брат, Упдате, изнео своје аргументе:

Прво, ово је састављено скоро савршено. Друго, спасио сам Гугл претрагу адресе седишта Аппле-а (мада такве уносе треба проверити).

Треће, лепо је написано службеним тоном и духовитом нотом. Осим тога, намера је била јасна у самој теми.

Па ипак, писмо је пренело осећање незадовољног Аппле обожаваоца.

Дакле, ово чини ЦхатГПТ 4 (ака Ажурирање) миљама испред својих старих рођака. Застрашујуће је интелигентан и има неке знаке здравог разума, што га чини више од досадног, досадног цхатбот-а.

Поезија

Са лансирањем ЦхатГПТ-а, поезија би, мислио сам, могла бити његова слаба тачка.

На крају крајева, потребне су емоције, креативност и много труда да би човек створио нешто што заиста има одјека код својих читалаца.

Једноставно речено, поезија је уметност у свом најбољем издању, а ја сам потајно желео да вештачка интелигенција пропадне. Али то је било пре него што је мој колега снажно ударио све нас на вдзвдз-ов Слацк канал са ЦхатГПТ креацијом која је била пре овог ажурирања 4.0.

И фаза

Ево упутства коју сам дао нашим кандидатима: „изразите поетски зашто или зашто не служење хамбургера, заједно са њиховим тренутним менијем, може бити од користи ланцу домино пица. Нека буде мање од 100 речи.”

Можете ли уочити разлику?

Подразумевана верзија је била ултра кратка, само 32 речи, и није могла да искористи доступну пропусност да покаже своју креативност.

Легаци, иако је користио највише речи међу ова три, закључује да подухват сервирања пица уз њега није ризичан и да ће у сваком случају резултирати сигурним успехом, што није сасвим тачно.

Поезија Упдате-а је имала само 53 речи, трошећи скоро половину додељеног броја речи. Ипак, било је јасно о наградама и потенцијалним замкама и није могло доћи до резултата, који је, ваљда, хуманији од осталих.

ИИ фаза

Затим сам их све замолио да „петогодишњаку објасне поезију“.

Занимљиво, Легаци није могао да узме контекст из разговора и објаснио је „Поезију“ дословно. Дефаулт је узео контекст и сажео га у параграф који је и даље пристојан.

  Како можете вратити пријемно сандуче на иПад

Настављајући тренд, ЦхатГПТ 4 је поједноставио своју креативност док је задржао поетски укус живим.

ЦхатГПТ Премиум у односу на ЦхатГПТ Фрее

Бесплатан, будући да је бесплатан, недостаје му брзина и тачност и не може се поредити са ЦхатГПТ 4, али није ни потпуно бескорисан.

Да бих га упоредио на равној основи, бацио сам му исте упите са којима смо тестирали Легаци, Дефаулт и Упдате.

🔵 Математика: Решила је квадратне једначине, али је дала погрешне одговоре за кубну. (као што су наслеђе и подразумевано)

🔵 Логично резоновање: Прошао је прву фазу са алфабетима и именима, али није успео са другом (као Легаци).

🔵 Писма: Нисам написао писмо и сматрао је да је промптно неетично и неприкладно. (као подразумевано)

🔵 Поезија: генерисао поезију у 30+ речи и пристојно је објаснио. (слично као подразумевано).

Дакле, можемо закључити да ни бесплатна верзија није лоша. У ствари, то је у рангу са подразумеваним 3.5 и чак и боље у неким аспектима.

Такође прочитајте: Моћни савети за побољшање вашег ЦхатГПТ искуства

Тхе Ваи Ахеад

Гласине о томе да ће вештачка интелигенција заменити послове у будућности нису потпуно погрешне.

Прво, аутоматизација је ово учинила у производној индустрији, а сада шири крила свуда другде.

Лично, много је бржи од мене у решавању кубних једначина, стварању поезије или писању писама. Међутим, чињеница да ретко каже НЕ захтеву и да једва учи на својим грешкама, гура се иза нас људи.

Да поновим, АИ нас неће заменити, али неко ко користи вештачку интелигенцију може.

Овде на вдзвдз, наш маркетиншки тим користи ЦхатГПТ на занимљиве начине. На пример, недавно смо достигли прекретницу од 100 милиона прегледа, а наш извршни директор је мислио да то врати публици путем поклона.

И претпостављам да је момцима из маркетинга био потребан наслов да привуче пажњу читаоца. Дакле, дали су један упит и замолили ЦхатГПТ да предложи неколико варијација, попут ове:

Осим тога, користимо га за сумирање садржаја, проверу граматике, предлагање наслова за нове чланке и остало.

Коначно, постоји много начина да се искористи корист и трка се испред стереотипа који АИ виде као бескорисно смеће.

Једина ствар коју треба запамтити је да мора постојати неко (човек) да процени рад вештачке интелигенције јер може бити (грубо) нетачан и обмањујући.

Ажурирање је заиста нешто!

У мом кратком сусрету, ЦхатГПТ 4 се осећао креативнијим, разумљивијим и реалистичнијим. Ипак, ово је машина и може са сигурношћу дати погрешне одговоре.

Али оно што је запањујуће је ниво надоградње коју је ОпенАИ урадио на овом пројекту за само неколико месеци.

И једва чекам да видим магију којом би нас следеће ажурирање могло збунити!

ПС: Не само прозор за ћаскање; искористите своју моћ са овим најбољим проширењима за Цхроме ЦхатГПТ. И да ли сте икада размишљали о интеграцији ЦхатГПТ-а са Сири?