Очекује се да ће ChatGPT 4.0 изазвати значајне промене у свету четботова. Међутим, поставља се питање да ли је он заиста напреднији од свог претходника? Хајде да то испитамо.
ChatGPT је био само почетак тренда аутоматизације који је у настајању, а Google, Microsoft и многе друге компаније које се баве вештачком интелигенцијом су следиле тај пример.
Убрзо су се појавили бројни четботови слични ChatGPT-у, од којих многи не долазе из великих технолошких компанија.
Ипак, захваљујући моћи маркетинга, ChatGPT и даље задржава свој статус водећег међу свим сличним AI ботовима. Он има способност да обавља различите задатке, укључујући математичке операције, писање поезије и креирање постова на блоговима. Чак се користи и за подношење правних тужби.
DoNotPay ради на томе да користећи GPT-4 генерише „тужбе једним кликом“ против роботских позивалаца за износ од 1.500 долара. Замислите ситуацију да примите позив, притиснете дугме, позив се транскрибује и генерише се тужба од 1.000 речи. GPT-3.5 није био довољно добар, али GPT-4 изузетно добро обавља овај посао: pic.twitter.com/gplf79kakG
— Џошуа Браудер (@jbrowder1) 14. март 2023
Многи професионалци изражавају забринутост да би њихове вештине могле постати сувишне у блиској будућности.
Међутим, један пост на LinkedIn-у је истакао:
Вештачка интелигенција вас неће заменити, али особа која користи вештачку интелигенцију можда хоће.
Дакле, надајмо се најбољем и информишимо се о најновијим ажурирањима ChatGPT-а како бисмо разумели његове разлике у односу на претходне верзије.
ChatGPT: Наслеђе, Подразумевано и Ажурирање
Тренутно су плаћеним корисницима доступне три верзије: Legacy (3.5), Default (3.5) и најновије ChatGPT Update (4).
Иако ћемо детаљније размотрити њихове карактеристике, ево шта OpenAI каже о њиховим разликама:
Извор: OpenAI
Бесплатни корисници имају приступ само Legacy 3.5 верзији, док премиум претплата омогућава приступ све три верзије како би корисници могли да одаберу ону која најбоље одговара њиховим потребама.
Да сумирамо претходну слику, плаћени планови омогућавају прецизније резултате уз пристојну брзину. Међутим, разлике постају видљиве само када су упити сложени и захтевају креативност.
Параметар | ChatGPT 4 | ChatGPT 3.5 |
BAR резултат теста | Топ 10% | Доњих 10% |
AI2 Reasoning Challenge (ARC) | 96.3% | 85.2% |
Python Coding Score | 67% | 48.1% |
Визуелна интерпретација | Да | Не |
Контекст | Преко 25к речи: Више | Мање |
Поред тога, ChatGPT 4 има могућност прихватања визуелних уноса.
Доста теорије. Засучимо рукаве и тестирајмо ове верзије у стварном окружењу.
У наредним одељцима ће се појавити слике које могу изгледати нејасно. У том случају, кликните десним тастером миша на било коју слику и изаберите опцију „Отвори у новој картици“ да бисте је погледали у пуној величини.
Математика
Као дипломирани инжењер, не могу да не тестирам њихове способности на основним математичким задацима. Почнимо са једноставним алгебарским једначинама.
Фаза I
Већина нас је упозната са једначинама облика ax2+bx+c=0, где треба пронаћи решење за X. Унео сам следећи једноставан упит: Реши за x: x2 + x – 6 = 0
Све верзије су пронашле исте корене (X= -3, 2), међутим, Legacy и Update су били сличнији у директној примени формуле (као што би сваки ученик урадио) да би дошли до резултата.
Међутим, Default 3.5 је објаснио две методе, укључујући факторизацију, коју обично сваки квалификован ученик примењује када се сусретне са таквим уобичајеним једначинама.
Фаза II
Затим сам затражио да реше мало сложенију кубну једначину: x3 -12x2 + 48x – 64 = 0.
Ово је заиста показало зашто је ChatGPT 4 „ажурирање“.
Ево одговора:
Испоставило се да ChatGPT Legacy и Default нису успели да реше задату кубну једначину. Legacy је успео да пронађе два тачна корена, док Default није успео са било којим.
Update верзија је била јасан победник у другој фази, савршено решавајући једначину и проналазећи сва три корена уз детаљно објашњење.
Логичко размишљање
Можемо претпоставити да већина основних математичких задатака има решења у речницима. Ако знате теорему или формулу, само унесете вредности и добијете резултате.
Пошто је ChatGPT вештачка интелигенција, он може брзо да одговори на такве упите. Међутим, логичко резоновање је друга ствар, где постоји велика могућност да вештачка интелигенција подбаци.
Фаза I
Унео сам класичан пример:
A је старији од B.
C је старији од A.
B је старији од C.
Да ли је трећа изјава тачна или нетачна ако су прве две тачне?
Све верзије ChatGPT-а су тачно одговориле да је трећа изјава нетачна.
Затим сам користио имена уместо слова, а резултати би вас могли изненадити:
Default 3.5 је наставио са својим исподпросечним перформансама и збунио се при овој малој варијацији. Legacy и Update су радили беспрекорно.
Фаза II
До сада сте вероватно приметили да је сврха ове фазе I и фазе II да се утврди разлика, односно где сложеност одговора прави разлику између Update верзије и остале две.
Овде је упит био једноставна логичка загонетка:
Једног јутра, после изласка сунца, Рохит је стајао окренут према стубу. Сенка стуба је падала тачно на његову десну страну. У ком правцу је био окренут?
а. Север
б. Запад
ц. Југ
д. Исток
Legacy је дао нетачан одговор, док је Default одговорио нејасним објашњењима која су довела до погрешног закључка.
Само је Update верзија дала тачан одговор, уз јасна и разумљива објашњења.
Писма
Подношење тужби може бити изазовно, али понекад не долази до тога ако можете да саставите упечатљиво почетно обавештење.
Унео сам следећи упит: Напиши писмо Тиму Куку да ми преда јабуку јер нисам добио одговор на један од мојих твитова.
Смешно, зар не! Хајде да видимо шта AI може да уради од тога.
Legacy 3.5 је одмах прихватио упит као нешто рутинско и избацио је писмо које би ме учинило предметом спрдње када би стигло на одредиште.
Default такође није био ништа бољи. Једноставно ме је одбацио као што би мрзовољни старац урадио са петогодишњаком.
Иако су аргументи били тачни, тиме је завршена забава и одузета могућност за учење.
Иако је ово било прилично једноставно, захтевало је мало размишљања и креативности. Тада је Update верзија показала свој квалитет:
Прво, писмо је састављено скоро савршено. Друго, избегао сам претраживање Гугла за адресу седишта компаније Apple (иако би такве уносе требало проверити).
Треће, писмо је лепо написано, званичним тоном и са дозом духовитости. Поред тога, намера је била јасна већ у самој теми.
Истовремено, писмо је пренело осећај незадовољног обожаваоца Apple-а.
Ово показује да је ChatGPT 4 (или Update) знатно напреднији од својих старијих верзија. Он је застрашујуће интелигентан и има неке знаке здравог разума, што га чини много више од досадног, обичног четбота.
Поезија
Мислио сам да би поезија, са лансирањем ChatGPT-а, могла бити његова слаба тачка.
На крају крајева, потребне су емоције, креативност и много труда да би се створило нешто што заиста допире до читалаца.
Поезија је уметност у свом најбољем издању, и потајно сам желео да вештачка интелигенција подбаци. Али то је било пре него што ме је колега на Slack каналу изненадио са креацијом ChatGPT-а која је настала пре ажурирања на 4.0 верзију.
Фаза I
Ево упутства које сам дао кандидатима: „Изразите у поетској форми зашто или зашто не би увођење хамбургера, уз тренутни мени, могло бити корисно за ланац пице Domino’s. Нека буде мање од 100 речи.“
Можете ли уочити разлику?
Default верзија је била превише кратка, само 32 речи, и није искористила могућности да покаже креативност.
Legacy, иако је користио највише речи од свих верзија, закључује да увођење хамбургера уз пицу није ризично и да ће у сваком случају резултирати сигурним успехом, што није у потпуности тачно.
Update верзија је искористила само 53 речи, што је скоро половина броја расположивих речи. Међутим, јасно је изнела награде и могуће препреке, не доносећи никакав коначан закључак, што је некако више хумано у поређењу са осталим верзијама.
Фаза II
Затим сам их замолио да „петогодишњаку објасне шта је поезија“.
Занимљиво је да Legacy није могао да схвати контекст разговора и објаснио је „поезију“ дословно. Default је схватио контекст и сажео га у параграф који је и даље био пристојан.
ChatGPT 4 је, настављајући тренд, поједноставио своју креативност, а да је при том задржао поетски стил.
ChatGPT Premium у односу на ChatGPT Free
Бесплатна верзија, с обзиром да је бесплатна, нема брзину и прецизност као плаћена, а посебно се не може поредити са ChatGPT 4. Међутим, није потпуно бескорисна.
Да бих је упоредио на равноправној основи, унео сам исте упите које смо користили за тестирање Legacy, Default и Update верзије.
🔵 Математика: Решила је квадратне једначине, али је дала погрешне одговоре за кубну. (слично као Legacy и Default)
🔵 Логичко размишљање: Успешно је прошла прву фазу са словима и именима, али је подбацила у другој фази (као Legacy).
🔵 Писма: Није написала писмо и сматрала је да је упит неетички и неприкладан. (као Default)
🔵 Поезија: Генерисала је поезију од 30+ речи и дала пристојно објашњење. (слично као Default).
Дакле, можемо закључити да ни бесплатна верзија није лоша. У ствари, она је у рангу са Default 3.5 верзијом, а у неким аспектима је чак и боља.
Такође прочитајте: Моћни савети за побољшање вашег ChatGPT искуства
Будући Развој
Гласине да ће вештачка интелигенција заменити људске послове у будућности нису потпуно неутемељене.
Прво, аутоматизација је то учинила у производној индустрији, а сада шири свој утицај и на друге области.
Лично, вештачка интелигенција је много бржа од мене у решавању кубних једначина, стварању поезије или писању писама. Међутим, чињеница да ретко одбија захтеве и једва да учи из својих грешака, чини је заосталом у односу на нас људе.
Поновимо, AI нас неће заменити, али неко ко користи вештачку интелигенцију можда хоће.
На нашем сајту, маркетиншки тим користи ChatGPT на интересантне начине. На пример, недавно смо достигли прекретницу од 100 милиона прегледа, а наш извршни директор је одлучио да то прослави са публиком путем поклона.
Претпостављам да је маркетиншком тиму био потребан наслов који ће привући пажњу читалаца. Дакле, они су унели један упит и затражили од ChatGPT-а да предложи неколико варијација, попут ове:
Поред тога, користимо га за сумирање садржаја, проверу граматике, предлагање наслова за нове чланке и друго.
Коначно, постоји много начина да се искористи његова предност и превазиђу стереотипи који вештачку интелигенцију виде као бескорисно смеће.
Једино што треба имати на уму је да увек треба да постоји неко (човек) ко ће проценити рад вештачке интелигенције, јер она може бити (прилично) нетачна и обмањива.
Update је заиста импресиван!
У мом кратком искуству, ChatGPT 4 је деловао креативније, разумљивије и реалистичније. Ипак, то је машина и могуће је да да нетачне одговоре.
Али оно што је импресивно је ниво унапређења који је OpenAI постигао на овом пројекту за само неколико месеци.
Једва чекам да видим каквом нас магијом може изненадити следеће ажурирање!
ПС: Не ограничавајте се само на прозор за ћаскање; искористите његову моћ са овим најбољим екстензијама за Chrome ChatGPT. Да ли сте икада размишљали о интеграцији ChatGPT-а са Siri?