Анализа варијансе (АНОВА) објашњена за мање од 5 минута

Анализа варијансе је једна од метода која се користи у тестирању хипотеза. Метода је кључна за доношење одлука заснованих на подацима у пословању.

Међутим, као и већина концепата у математици, често је обавијен жаргоном и математичким записима који у почетку могу изгледати застрашујуће. Овај чланак има за циљ да вам објасни анализу варијансе. Дакле, хајде да почнемо.

Увод у анализу варијансе (АНОВА)

Пре него што почнемо да расправљамо о АНОВА-и, важно је дефинисати и објаснити неколико појмова да бисмо успоставили неки речник. Дакле, почнимо са неким веома кључним појмовима: популација, узорак, варијанса и хипотеза.

Популација

У статистици, популација је читав скуп из којег се могу вршити запажања. На пример, ако бисмо желели да израчунамо просечну величину листа одређене врсте дрвета, популација би обухватила све листове дрвећа те врсте. Међутим, то би било скупо ако не и немогуће. Дакле, уместо тога користимо узорак.

Узорак

Узорак је подскуп популације који је репрезентативан за популацију. Стога, узорак мора бити насумично одабран из различитих делова популације. Узорак је прикладнији од популације јер ће се обавити мање запажања.

Променљив

Варијанца мери колико су распоређене вредности у скупу података од средње вредности. Мала варијанса значи да су вредности близу средње вредности, док висока значи да су широко распрострањене од средње вредности.

Хипотеза

Хипотеза је изјава дата да би се нешто објаснило. Не постављају се никакве претпоставке о томе да ли је то тачно или не. Уместо тога, експерименти су осмишљени да докажу да није познато да је лажна.

У АНОВА-и се бавимо две врсте хипотеза – нултом и алтернативном. Нул хипотеза изражава да нема разлике између група, док алтернатива каже да постоји. Након теста, једно од ових ћемо прихватити као истинито.

Анализа варијансе (АНОВА) је статистичка метода која се користи за проверу да ли је промена независне варијабле резултирала променом зависне варијабле. Речју, он одређује да ли постоје значајне разлике између резултата различитих независних група.

На пример, АНОВА тест може да утврди да ли су различите одредишне странице учиниле да посетиоци веба проводе више времена читајући вашу веб локацију. У овом случају, приказали бисте различите дизајне одредишне странице различитим корисницима ваше веб странице.

За сваку сесију бележите време које корисник проведе. На крају, извршићете АНОВА тест да бисте видели да ли се резултати сваког узорка значајно разликују од осталих.

АНОВА је једна од више метода које се користе у тестирању хипотеза. Друге популарне методе укључују т-тестове, з-тестове и хи-квадрат тестове. Главна разлика између ових тестова је где и када се користе.

Врсте Анова

Постоје различите врсте АНОВА тестова. Постоји једносмерни и двосмерни АНОВА тест.

  • Једносмерни тест – У једносмерном тесту постоји само једна независна варијабла и ми покушавамо да утврдимо да ли су промене те варијабле довеле до промена у зависној променљивој које су статистички значајне.
  • Двосмерни тест – У двосмерном тесту постоји више независних варијабли. Овај тест се често назива МАНОВА, где М означава вишеструки.

У следећем одељку објаснићу формулу АНОВА теста.

Формула АНОВА теста

АНОВА тест утврђује да ли постоје значајне разлике између вредности из различитих група или узорака. Као и сви тестови хипотеза, прво морамо успоставити нулте и алтернативне хипотезе.

За АНОВА тест, нулта хипотеза за овај тест би била да нема значајних разлика између различитих група вредности.

Алтернативна хипотеза би била да постоје значајне разлике између најмање једног пара група у скупу података.

Формула АНОВА израчунава ф-вредност. Ова вредност је однос средњег збира квадрата због третмана (МСТ) и средњег збира квадрата због грешке (МСЕ).

Ф=МСТ/МСЕ

У суштини, МСТ представља варијансу између средњих вредности узорка. То је разлика између група. МСЕ представља варијансу унутар узорака. То је варијација унутар група.

Да бих ово одржао као увод на обичан енглески, нећу даље улазити у формулу. Ово је такође непотребно јер постоји софтвер који ће израчунати АНОВА за вас.

Коначно, ако је резултат ове Ф вредности близу 1, онда не постоји значајна разлика; стога ће нулта хипотеза бити прихваћена. У супротном, нулта хипотеза ће бити одбачена.

АНОВА у односу на друге тестове

Као што је раније поменуто, АНОВА је једна метода која се користи у тестирању хипотеза. Постоје и друге методе, као што су т-тестови и з-тестови. Избор теста који ће се користити у датом сценарију зависи од ситуације.

  • Т-тест упоређује средњу вредност узорка са познатом средњом популацијом када је стандардна девијација непозната.
  • З-тест је као т-тест по томе што упоређује средњу вредност узорка са познатом средњом популацијом. Међутим, у з-тесту је позната стандардна девијација.
  • Хи-квадрат тест се користи за одређивање независности између две независне варијабле.

Затим ћемо разговарати о важности анализе варијанси.

Важност анализе варијација

АНОВА нам омогућава да упоредимо средње вредности за више група или услова, што омогућава да се утврди да ли су уочене разлике статистички значајне или су једноставно последица случајног случаја. Ово је кључно у многим областима, као што су статистика, истраживање и експериментални дизајн, јер нам помаже да разумемо изворе варијација унутар скупова података.

Анализа варијанси помаже вам да утврдите узрочност између различитих фактора. Ово је важно за доношење одлука заснованих на подацима, као и за мерење напретка. АНОВА вам помаже да направите поређења у више група.

Декомпоновањем укупне варијансе на различите компоненте које се могу приписати различитим факторима, АНОВА нам омогућава да идентификујемо који фактори значајно утичу на уочене разлике.

Неки од најчешћих случајева употребе АНОВА су наведени у следећем одељку.

Случајеви употребе АНОВА

Анализа варијансе је невероватно корисна у пословању. Помаже вам да доносите боље и информисаније одлуке. Неки од уобичајених случајева употребе АНОВА укључују:

❇ Тестирање различитих верзија производа да би се видело која верзија се купцима више свиђа и која је већа вероватноћа да ће купити.

❇ Проналажење најефикаснијег огласа за ваше рекламне кампање који ће довести до највиших стопа конверзије.

❇ Када спроводите истраживање тржишта, покушавате да утврдите који фактори највише утичу на понашање купаца.

❇ Испробавање различитих стратегија задржавања купаца како би се утврдило која води до најниже стопе одлива.

❇ Утврђивање фактора који доприносе и изазивају кретање цена на берзи.

Завршне речи

Овај чланак је послужио као кратак увод у АНОВА-у. Појаснили смо шта је то, његову важност и случајеве у којима би тест био користан.

Затим погледајте аналитичке и истраживачке алате за научнике података.