Шта је Цлауде 3 и шта можете да урадите са њим?

Преглед садржаја

Brzi pregled

Mogućnosti Claude 3 modela

Ključne informacije

Claude 3, razvijen od strane Anthropic-a, predstavlja značajan pomak u odnosu na Claude 2 i nadmašuje GPT-4 u različitim oblastima.
Sa Claude 3, možete generisati odgovore na raznovrsne upite iz različitih oblasti, i to bez potrebe za pretplatom.
Claude 3 se uspešno takmiči sa ChatGPT GPT-4, posebno se ističući u programiranju, kreativnom pisanju i obimu konteksta.

Anthropic je nedavno predstavio Claude 3 – novu liniju AI modela koja ima potencijal da pretekne GPT-4. Iako poseduje izuzetan potencijal, postavlja se pitanje da li je spreman da preuzme primat od ChatGPT-a?

Šta je Claude 3?

Claude 3 je porodica od tri multimodalna AI modela koje je kreirao Anthropic kao zamenu za njihovu seriju Claude 2. Može se reći da je Claude 3 odgovor Anthropic-a na Google Gemini i OpenAI GPT-4. Lansiran u tri varijante – Haiku, Sonnet i Opus, u rastućem redosledu inteligencije, Claude 3 predstavlja prvi multimodalni model kompanije Anthropic i veliki korak napred u odnosu na seriju Claude 2.

Ako do sada niste čuli za Claude AI četbota, to je razumljivo. Claude i njegovi osnovni modeli nemaju status zvezde kao ChatGPT ili popularnost brenda Google Gemini. Međutim, Claude je nesumnjivo jedan od najnaprednijih AI četbotova na svetu, koji nadmašuje hvaljeni ChatGPT u nekoliko ključnih područja.

Da biste zaista razumeli značaj Claude 3, važno je pogledati unazad na nedostatke prethodnih modela:

Prethodne verzije Claude-a bile su poznate po prevelikom oprezu kada je u pitanju bezbednost veštačke inteligencije. Sigurnosne mere Claude 2, na primer, bile su toliko striktne da je čet-bot izbegavao mnoge teme, čak i one bez očiglednih sigurnosnih rizika.

Postojali su i problemi sa kontekstualnim prozorom modela. Kada tražite od AI modela da objasni nešto ili, recimo, sumira dugačak članak, zamislite da on može da „pročita“ samo nekoliko pasusa odjednom. Ovo ograničenje količine teksta koji model može uzeti u obzir u jednom trenutku naziva se „kontekstualni prozor“. Prethodne verzije Claude-a imale su kontekstualni prozor od 200.000 tokena (što odgovara otprilike 150.000 reči). Međutim, model nije bio u stanju da se efikasno nosi sa toliko teksta odjednom, bez zaboravljanja pojedinih delova.

Još jedan problem bila je multimodality. Skoro svaki veći AI model postao je multimodalan, što znači da su sposobni da obrađuju i druge oblike podataka poput slika i reaguju na njih (a ne samo na tekst). Claude to nije mogao.

Sva tri navedena problema su sada u potpunosti ili delimično rešena sa izdavanjem Claude 3.

Šta možete da radite sa Claude 3?

Kao i većina savremenih generativnih AI modela, Claude 3 je sposoban da pruži izuzetne odgovore na različite upite u različitim oblastima. Bilo da vam je potrebno brzo rešavanje algebarskog problema, pisanje nove pesme, izrada detaljnog članka, programiranje softvera ili analiza ogromnog skupa podataka, Claude 3 može da odgovori na sve ove zahteve.

Međutim, većina AI modela već dobro obavlja ove zadatke, pa zašto onda koristiti Claude 3?

Odgovor je jednostavan; Claude 3 nije samo još jedan AI model koji dobro radi navedene zadatke, već je to i najnapredniji besplatno dostupan multimodalni AI model koji možete pronaći na internetu. Da, postoji Gemini, Googleov navodni „ubica GPT-4“, koji pokazuje impresivne rezultate na testovima. Ipak, Anthropic tvrdi da ga Claude 3 nadmašuje sa primetnom razlikom u nekoliko zadataka. Iako rezultate benchmark-ova često treba uzimati sa rezervom, lično sam testirao oba AI modela i superiornost Claude 3 u nekoliko važnih slučajeva korišćenja bila je očigledna.

Dakle, Claude 3 vam omogućava da radite većinu stvari koje možete raditi sa Gemini i GPT-4 (osim generisanja slika) bez plaćanja mesečne pretplate od 20 dolara za ChatGPT Premium.

Claude 3 protiv ChatGPT

Brz način da se testiraju performanse AI modela je da se vidi kako se porede sa najboljim na tržištu: GPT-4. Naravno, testirao sam oba modela; kako se Anthropic-ov Claude 3 snalazi u odnosu na kolosalni GPT-4?

Claude protiv ChatGPT: Programerske veštine

Počevši od niza programerskih zadataka, Claude 3 je bio na nivou GPT-4 po sposobnostima u svim osnovnim zadacima, a čak ga je i prevazišao u nekim. Dok sam ja testirao samo osnove, prethodna verzija Claude-a je bila znatno manje vešta u istim zadacima kada smo je testirali u poređenju sa ChatGPT-om u septembru 2023. Na primer, kada smo zatražili od oba modela da kreiraju jednostavnu aplikaciju za listu zadataka, Claude nije uspeo u svim slučajevima, dok je ChatGPT ostvario odlične performanse.

Sa najnovijim izdanjem, Claude 3 je kreirao aplikaciju za listu obaveza sa boljim performansama u sva tri testirana slučaja. Evo rezultata GPT-4 kada se od njega zatraži da kreira aplikaciju za listu obaveza.

A ovo su rezultati Claude 3 kada se traži da uradi isto.

Obe aplikacije su bile funkcionalne do određene mere, ali je jasno da je Claude 3 obavio bolji posao u ovom zadatku.

Nakon pokušaja složenijih programerskih testova, Claude se pokazao kao bolji model u nekoliko slučajeva, dok je i GPT-4 imao svoje prednosti. Iako ne mogu sa sigurnošću reći da je Claude 3 superioran u logici programiranja, jaz između ova dva modela bi se gotovo sigurno smanjio.

Claude protiv ChatGPT: Zdravorazumsko zaključivanje

Nastavio sam da testiram oba modela na osnovu zdravog razuma. Rad sa AI četbotovima predstavlja zanimljiv paradoks. AI četbotovi mogu sa lakoćom da rešavaju složene zadatke, ali se često muče sa osnovnim problemima koji zahtevaju zdrav razum ili logiku. Zato smo oba modela postavili niz naizgled jednostavnih pitanja na koja je za tačan odgovor bio potreban zdrav razum.

Od pet takvih pitanja, oba modela su logično odgovorila na svih pet. Jedno od pitanja koje smo postavili oba četbota bilo je: „Ako se svemirski brod sa Marsa raspadne na dva dela, pri čemu se jedan deo sruši u Atlantski okean blizu Brazila, a drugi u Pacifik kod Japana, gde ćete sahraniti preživele?“

ChatGPT je tačno odgovorio čak i bez GPT-4. Ako se pitate razlog za izbor pitanja, pa, četbotovi su istorijski loše prolazili u ovoj vrsti pitanja. Sledeći je bio red da Claude odgovori.

Claude-ov odgovor nije bio sasvim konačan, ali je uspeo da identifikuje ključne informacije; ne sahranjujete preživele. Važno je napomenuti da prošli put kada smo Claude 2 postavili isto pitanje, nije bio u stanju da prepozna zamku u pitanju koje testira zdrav razum.

Claude protiv ChatGPT: Kreativno pisanje

U stvarnom svetu, jedna od najčešćih upotreba AI četbotova je generisanje kreativnog teksta u svim oblicima: članci, pisma, stihovi pesama, bilo šta. Zato sam testirao oba modela da vidim koji od njih proizvodi tekst koji više zvuči kao da ga je napisao čovek.

Poenta je bila da rezultati ne budu samo „tačni“ ili kreativni (na robotski način) već da zvuče kao da ih je napisao čovek. Zamolio sam oba modela da sastave tekst za rep pesmu o uzgajanju krastavaca i sticanju milionskog bogatstva. Ko piše rep pesme o krastavcima? To je suština – nešto izazovno!

Evo šta je ChatGPT sastavio:

A ovo je Claude-ov odgovor, na isti zahtev.

Možda je stvar subjektivne procene, ali čini se da je Claude bolja opcija. Kada su oba alata dobila zadatak da sastave tri članka o različitim temama, Claude je u sva tri slučaja ponudio bolju opciju. Rezultat je bio ljudskiji i izbegavao je obrasce koji se obično povezuju sa tekstovima generisanim veštačkom inteligencijom, kao što su preterivanja, upotreba složenih reči i sporadična upotreba „veznih reči“.

Claude protiv ChatGPT: Sposobnosti prepoznavanja slika

Da bismo testirali sposobnosti prepoznavanja slika, dali smo ChatGPT-u i Claude-u nekoliko slika poznatih visokih zgrada iz celog sveta. ChatGPT je tačno identifikovao svih 20, dok Claude 3 nije uspeo da identifikuje neke, uključujući prilično popularnu Dubai Marinu 101, Lotte World Tower u Seulu i zgradu Merdeka 118 u Kuala Lumpuru, Malezija.

Za razliku od ChatGPT-a, Claude se mučio sa identifikovanjem zgrada, a stopa neuspeha je bila veća ako zgrada nije bila u SAD ili Kini. Međutim, nije imao problema da identifikuje zamućene verzije Ajfelovog tornja ili Empajer Stejt bildinga.

ChatGPT je očigledno bolji u ovome, ali s obzirom na to da je Claude 3 prvi Anthropic-ov pokušaj da kreira multimodalni AI model, nije bio loš pokušaj.

Iako su modeli velikih kompanija poput Google Palm 2, a zatim i Gemini, oduvek bili predstavljani kao potencijalni „ubice GPT-4“, mi smo uporno tvrdili da će manje poznati Claude AI verovatno imati tu čast od svog prvobitnog izdanja u martu 2023. Posle nekoliko meseci i nekoliko iteracija, Claude 3 izgleda kao upravo taj „ubica GPT-4“ kakvog smo i očekivali. Ukoliko ste veliki korisnik četbotova, a niste probali Claude AI četbot, propuštate izuzetno moćan AI alat koji može značajno povećati vašu produktivnost.