Гоогле Гемини АИ је ту, али да ли је бољи од ЦхатГПТ-а?

Кључне Такеаваис

  • Гоогле-ов АИ модел Гемини има три варијанте, Ултра, Про и Нано, фокусиране на различите задатке и нивое сложености.
  • Гемини Ултра показује обећавајуће резултате на кључним АИ бенцхмарковима, али од децембра 2023. није доступан за јавну употребу. Гоогле каже да би требало да буде доступан у јануару 2024.
  • Гемини Про је доступан и иако ради прилично добро, тренутно не успева да свргне ГПТ-4.

Гоогле је доследно обећавао да ће његов Гемини АИ модел бити бољи од ОпенАИ ГПТ-4, модела који покреће ЦхатГПТ Плус. Сада када је Гоогле Гемини лансиран, коначно можемо да га ставимо на тест и видимо како се Гемини пореди са ГПТ-4.

Када је Гоогле лансирао Бард у марту 2023. године, било је много разлога за узбуђење. Коначно, ОпенАИ-јев ЦхатГПТ монопол би био разбијен, а ми бисмо добили достојну конкуренцију.

Али Бард никада није био АИ титан коме су се људи надали, а ГПТ-4 остаје доминантна генеративна АИ платформа за ћаскање. Сада је Гоогле Гемини ту—али да ли је дуго очекивани АИ модел бољи од ЦхатГПТ-а?

Шта је Гоогле Гемини АИ модел?

Гемини је Гоогле-ов најспособнији генеративни АИ модел, способан да разуме и ради са различитим форматима података, укључујући текст, аудио, слике и видео. То је Гоогле-ов покушај да створи обједињене могућности АИ модела за цртање из својих најспособнијих АИ технологија. Гемини ће бити доступни у три варијанте:

  Апликација Калкулатор заснована на покретима која чува резултате [Paid]
  • Гемини Ултра: Највећа и најспособнија варијанта дизајнирана за обављање веома сложених задатака.
  • Гемини Про: Најбољи модел за скалирање и испоруку високих перформанси у широком спектру задатака, али мање способан од Ултра.
  • Гемини Нано: најефикаснији модел дизајниран за примену задатака на уређају. На пример, програмери могу да користе Гемини Нано за прављење мобилних апликација или интегрисаних система, доносећи моћну вештачку интелигенцију у мобилни простор.
  • На свом званичном блогу, Кључна реч, Гоогле каже да Гемини Ултра надмашује најсавременије у неколико мерила. Гоогле тврди да Гемини Ултра побеђује водећи ГПТ-4 у индустрији у неколико кључних мерила.

    Са невиђеним резултатом од 90,0% на ригорозном ММЛУ мерилу, Гоогле каже да је Гемини Ултра први модел који је надмашио перформансе на нивоу човека на овом вишеструком тесту који обухвата 57 субјеката.

    Гоогле

    Гемини Ултра такође може да разуме, објасни и генерише висококвалитетан код на неким од најпопуларнијих светских програмских језика, укључујући Го, ЈаваСцрипт, Питхон, Јава и Ц++. На папиру, све су то одлични резултати. Али ово су све мерила, а мерила не говоре увек целу причу. Дакле, колико добро Близанци обављају задатке у стварном свету?

    Како користити Гоогле Гемини АИ

    Од три варијанте Гемини АИ модела, Гемини Про можете почети да користите одмах. Гемини Про је тренутно доступан на Гоогле-овом Бард цхатботу. Да бисте користили Гемини Про са Бардом, идите на бард.гоогле.цом и пријавите се са својим Гоогле налогом.

    Гоогле каже да ће Гемини Ултра бити представљен у јануару 2024. године, тако да смо за сада морали да се задовољимо тестирањем Гемини Про-а против ЦхатГПТ-а.

      12 најбољих софтвера за плаћене карте за предузећа у 2023

    Како се Близанци у поређењу са ГПТ-3.5 и ГПТ-4

    Када се лансира било који нови АИ модел, он се тестира у односу на ОпенАИ ГПТ АИ моделе, који су генерално прихваћени као најсавременији модел против којег други модели треба да се супротставе. Дакле, користећи Бард и ЦхатГПТ, тестирали смо Геминијеву способност у математици, креативном писању, генерисању кода и прецизној обради уноса слика.

    Почевши од најлакшег математичког питања којег смо могли да смислимо, замолили смо оба цхат бота да реше: -1 к -1 к -1.

    Бард је ишао први. Поновили смо питање два пута, а сви смо се вратили са погрешним одговорима. Добили смо одговор из трећег покушаја, али то се не рачуна.

    Пробали смо ЦхатГПТ који ради на ГПТ-3.5. Прво суђење је исправно.

    Да бисмо тестирали Близанчеве способности тумачења слика, задужили смо га да тумачи неке популарне меме. Одбио је, рекавши да не може да тумачи слике са људима у њему. ЦхатГПТ, који користи ГПТ-4В, био је вољан и способан да то учини беспрекорно.

    Покушали смо још један покушај да га натерамо да тумачи слику док тестирамо њену способност решавања проблема и кодирања. Дали смо Барду, који користи Гемини Про, снимак екрана и замолили га да протумачи и напише ХТМЛ и ЦСС код како би реплицирао снимак екрана.

    Ево изворног снимка екрана.

    Испод је покушај Гемини Про-а да протумачи и реплицира снимак екрана користећи ХТМЛ и ЦСС.

    А ево и покушаја ГПТ-4 да реплицира снимак екрана. Резултат није изненађујући, с обзиром на то да је ГПТ-4 историјски био јак у кодирању. Раније смо демонстрирали коришћење ГПТ-4 за прављење веб апликације од нуле.

      Како можете знати да ли вам је Инстаграм избрисао налог

    Замолили смо Гемини Про да направи песму о Тесли (бренд аутомобила на електрични погон). Показао је незнатна побољшања у односу на претходне тестове које смо радили у прошлости. Ево резултата:

    У овом тренутку, сматрали смо да би упоређивање резултата са ГПТ-3.5 уместо са ГПТ-4 са компресором било прикладније. Зато смо замолили ЦхатГПТ који користи ГПТ-3.5 да направи сличну песму.

    Можда је то лични избор, али Гемини Про ово схвата боље. Али пустићемо вас да будете судија.

    Да ли је Гемини бољи од ЦхатГПТ-а?

    Пре него што је Гоогле покренуо Бард, мислили смо да ће то бити такмичење у ЦхатГПТ-у које смо чекали – није. Сада, Гемини је ту, и за сада, Гемини Про не изгледа као модел који ће ЦхатГПТ-у дати нокаут ударац.

    Гоогле каже да ће Гемини Ултра бити много бољи. Искрено се надамо да јесте, и да испуњава или превазилази тврдње изнете у најави Гемини Ултра. Али док не видимо и тестирамо најбољу верзију Гоогле-овог генеративног АИ алата, нећемо знати да ли може да избаци друге конкуренте АИ модела. Како сада стоји, ГПТ-4 остаје неприкосновени шампион АИ модела.