Уводни водич за податке временских серија

Време је суштински елемент када се говори о прикупљању и анализи података. У контексту анализе временских низова, временски аспект је кључна компонента самих података.

Шта представљају подаци временских низова?

Подаци временских низова састоје се од низа података који су поређани хронолошки. Овај поредак уводи зависност између појединачних мерења. У данашњем свету, који је вођен подацима, временски низови су свеприсутни. С обзиром на то да сваки догађај тече у временској димензији, константно смо у контакту са различитим врстама података временских низова.

Уобичајено је да се претпостави да се временски низови стварају у правилним временским интервалима, и тада их називамо регуларним временским низовима. Међутим, подаци у оквиру неког временског низа не морају нужно бити прикупљени у једнаким интервалима. У тим случајевима имамо неправилне временске низове, где подаци следе одређену временску фазу, што значи да мерења можда неће бити вршена у једнаким размацима. Ипак, подаци се могу генерисати у дискретним временским интервалима или у налетима. Пример неправилних временских низова су исплате на банкоматима или депозити на банковним рачунима.

Технички посматрано, временски низ представља једну или више променљивих које се мењају током одређеног временског периода. Када се само једна променљива мења током времена, говоримо о једноваријантном временском низу. На пример, сензор који сваке секунде мери температуру у просторији. У овом случају, генерише се само једна димензија – вредност температуре. Са друге стране, мултиваријантни временски низ настаје када се више од једне променљиве мења током времена. Пример би могла бити анализа економије неке банке. У таквим ситуацијама, користимо мултиваријантне временске низове да бисмо разумели како промена политике једне променљиве, попут репо стопе, може утицати на друге променљиве, као што су исплате кредита комерцијалним банкама.

Подаци временских низова се примењују у различитим дисциплинама, од финансија, геологије, метеорологије, производње, до рачунарства, Интернета ствари, природних и друштвених наука. Користе се за праћење временских промена, стопе наталитета и морталитета, тржишних колебања, перформанси мреже и других апликација. Најчешће се користе за праћење, предвиђање и откривање аномалија. На пример, предвиђање временских низова игра кључну улогу у процени популарности система за управљање базама података. На слици испод приказан је раст популарности DBMС-а током година (2019-2021) на графикону временских низова.

хттпс://ввв.инфлукдата.цом/тиме-сериес-датабасе/

Кључне компоненте временског низа

Фактори који утичу на вредности посматрања у временском низу се сматрају његовим кључним компонентама. Три главне категорије компоненти укључују:

  • Тренд или дугорочна кретања
  • Краткорочна кретања
  • Сезонске варијације
  • Цикличне варијације
  • Случајни или неправилни покрети

Тренд

Тенденција података да расту или опадају током дужег временског периода се назива тренд или дугорочна компонента. Међутим, важно је напоменути да кретање нагоре или надоле не мора нужно бити у истом смеру током датог временског периода.

Трендови могу расти, опадати или остати стабилни у различитим временским периодима. Међутим, укупан тренд увек мора одражавати општи образац – узлазни, силазни или стабилан. Такви трендови се могу видети у примерима као што су пољопривредна производња, стопа морталитета, број произведених уређаја или број фабрика.

Линеарни и нелинеарни тренд

Приказивање вредности временских низова у односу на време на графикону открива тип тренда на основу распореда података. Ако се подаци групишу око праве линије, тада се тренд назива линеарним. У супротном, распоред података указује на нелинеарни тренд, јер однос између промена две променљиве није стабилан или константан. Стога се такви трендови називају и криволинијским корелацијама.

Краткорочна кретања

У временском низу, ове компоненте имају тенденцију да се понављају током одређеног временског периода. Оне се јављају у неправилним кратким налетима и утичу на променљиве које се посматрају. Две подгрупе краткорочних кретања укључују:

Сезонске варијације

Ове варијације се редовно и периодично дешавају у периоду краћем од годину дана. Оне обично имају сличан или скоро исти образац током 12 месеци. Такве варијације постају део временског низа ако се подаци бележе редовно, нпр. по сату, дневно, недељно, месечно или квартално.

Сезонске варијације могу бити вештачке или природне. Различита годишња доба или климатски услови играју кључну улогу у таквим варијацијама. На пример, пољопривредна производња у потпуности зависи од годишњих доба. Слично томе, потражња за кишобранима или кабаницама расте током кишне сезоне, док је продаја расхладних уређаја и клима уређаја највећа током летњих месеци.

Вештачке сезонске варијације укључују празнике, прославе и догађаје попут свадби. Ови краткорочни догађаји се понављају из године у годину.

Цикличне варијације

Варијације временских низова које се одвијају у периоду дужем од годину дана називају се цикличним варијацијама. У пословању, један комплетан период се сматра „пословним циклусом“. Пораст или пад пословних перформанси зависи од различитих фактора као што су економска структура, управљање пословањем и друге интеракцијске силе. Ове цикличне пословне варијације могу бити редовне, али нису периодичне. Уобичајено је да предузећа пролазе кроз четворофазни циклични процес који обухвата просперитет, рецесију, депресију и опоравак.

Такве цикличне варијације су саставни део обрасца временског низа, будући да се развој пословања у великој мери ослања на генерисане „узастопне тачке података“.

Случајни или неправилни покрети

Случајне компоненте узрокују значајне варијације у променљивој која се посматра. Ово су искључиво неправилне флуктуације без утврђеног обрасца. Ове силе су непредвиђене, непредвидиве и нестабилне природе – на пример, земљотреси, поплаве, глад и друге катастрофе.

Наведени случајни догађаји се анализирају помоћу изворних података временских низова како би се боље разумели и реаговало на такве реалне сценарије који се могу десити у будућности.

Врсте временских низова

Подаци временских низова могу се поделити у четири типа: детерминистички, недетерминистички, стационарни и нестационарни. Хајде да детаљније размотримо сваки од ових типова.

#1. Детерминистички временски низови

Детерминистички временски низ може се описати аналитичким изразом. Он не укључује случајне или вероватносне елементе. Математички, може се тачно изразити за све временске интервале у облику Тејлоровог низа. Ово је могуће ако су сви његови изводи познати у неком произвољном тренутку. Ови изводи експлицитно дефинишу његову прошлост и будућност у том тренутку. Ако су сви услови испуњени, могуће је тачно предвидети његово будуће понашање и анализирати како се понашао у прошлости.

#2. Недетерминистички временски низови

Недетерминистички временски низ има случајни аспект који спречава његов експлицитни опис. Аналитички изрази нису довољно прикладни за описивање таквих временских низова. Временски низ може бити недетерминистички из следећих разлога:

  • Информације потребне за његов опис нису у потпуности доступне. Иако подаци могу бити присутни у принципу, они се не могу експлицитно третирати као квантитативни.
  • Процес генерисања података је случајан по природи.

Због случајног фактора, недетерминистички временски низ се повинује законима вероватноће. Стога се подаци третирају у статистичким терминима – подразумевани подаци се дефинишу дистрибуцијама вероватноће и просецима различитих облика. Ово укључује средства и мере дисперзије, односно варијансе.

#3. Стационарни временски низови

У стационарном временском низу, статистичка својства као што су средња вредност, варијанса и друга, не зависе од временског аспекта. Стационарни временски низ је лакше предвидети јер се може са сигурношћу тврдити да ће његова статистичка својства остати иста као што су била у прошлости. Стога се различите методе статистичког предвиђања заснивају на претпоставци да је временски низ скоро стационаран. То имплицира да се временски низови могу посматрати као стационарни у апроксимацији, применом једноставних математичких трансформација.

#4. Нестационарни временски низови

У нестационарном низу, статистичка својства варирају током времена. Дакле, временски низови са трендовима или сезонским варијацијама спадају у нестационарну категорију, јер тренд и сезонске варијације могу утицати на вредност временског низа у различитим временским интервалима. Нестационарни временски низови описују непредвидиве податке, што онемогућава њихово моделирање или предвиђање.

https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

Анализа и предвиђање временских низова

Анализа и предвиђање временских низова су корисни алати за посматрање, анализу и проучавање развоја и динамике важних процеса и објеката различитих врста. Хајде да погледамо сваки детаљније.

Анализа временских низова

Анализа временских низова је дефинисана као процес анализе података прикупљених током одређеног временског периода. У овом процесу, аналитичари података бележе податке у константним интервалима током фиксног временског периода. Стопа посматрања података, односно временски интервал, може варирати од секунди до година.

Подаци временских низова описују променљиве које се испитују, пружајући детаљну анализу флуктуација током одређеног временског периода. Параметри потребни за анализу могу да се разликују у зависности од области и дисциплина. Неки од примера могу бити:

  • Научни инструменти – Подаци забележени по дану
  • Комерцијални веб-сајт – Посете купаца по дану
  • Берза – Вредности акција недељно
  • Сезона – Кишни дани у години

Да би се обезбедила доследност и поузданост, анализа временских низова се заснива на великим количинама тачака података. Адекватан узорак је кључан за представљање аутентичности уоченог тренда или обрасца.

Поред тога, анализа временских низова је погодна и за предвиђање будућих догађаја на основу прошлих забележених података.

Предвиђање временских низова

Анализа временских низова омогућава организацијама да идентификују узроке флуктуација трендова током времена. Са расположивим подацима, компаније могу даље проучавати и истраживати како би боље разумеле како да се носе са непознатим трендовима и предвиде предстојеће догађаје. Компаније често користе технике визуелизације података да би утврдиле такве аномалије у подацима.

Предвиђање временских низова се фокусира на два кључна фактора:

  • Предвиђање будућих догађаја на основу понашања података из прошлости.
  • Претпоставку да ће предстојећи трендови бити слични прошлим обрасцима података.

У процесу предвиђања, примарни циљ је да се предвиди како ће тачке података остати исте или се мењати у будућности. Следећи примери из различитих индустријских сектора помажу бољем разумевању нијанси анализе и предвиђања временских низова:

  • Берза – предвиђање цене акција на затварању сваког дана.
  • Продаја – предвиђање продаје производа за продавницу сваког дана.
  • Цене – предвиђање просечне цене горива сваког дана.

Неке од уобичајених статистичких техника које се користе за предвиђање временских низова укључују једноставни покретни просек (SMA), експоненцијално изглађивање (SES), ауторегресивни интегрисани покретни просек (ARIMA) и неуронску мрежу (NN).

Подаци временских низова у облаку

Да би се искористила вредност података временских низова, предузећа морају бити у могућности да брзо складиште и претражују податке. Компаније на тржишту капитала се ослањају на велике количине историјских и стриминг података како би користиле аналитику података у реалном времену и доносиле утицајне пословне одлуке. Ово може укључивати предвиђање рањивости цена акција, одређивање нето капиталних захтева или предвиђање девизних курсева. За обезбеђивање флексибилности и једноставне обраде података, многе компаније се одлучују за премештање својих база података временских низова у облак.

Премештањем база података временских низова у облак, организације могу добити приступ неограниченим ресурсима на захтев. Ово омогућава компанијама да користе стотине језгара како би извршиле своје задатке, максимизирајући проток мреже без проблема са кашњењем.

Базе података временских низова у инфраструктури облака су погодне за радно оптерећење које захтева интензивно рачунање. Ово укључује извођење прорачуна ризика као одговор на тржишне трендове у реалном времену. Финансијске компаније могу да смање трошкове центара података и користе те ресурсе за побољшање продуктивности свог радног оптерећења.

Провајдери услуга у облаку, као што је AWS, нуде Amazon Timestream, услугу базе података временских низова која олакшава учитавање, складиштење и анализу скупова података временских низова. Они нуде складиште за управљање радним оптерећењима која захтевају много трансакција, алате за анализу у реалном времену и функционалност стримовања података како би приказали догађаје у тренутку када се десе.

Дакле, инфраструктура облака појачава и проширује предности података временских низова.

Примене временских низова

Модели временских низова служе за две сврхе:

  • Разумевање основних фактора који су произвели одређени образац података.
  • На основу анализе, прилагођавање модела за предвиђање и праћење.

Хајде да погледамо неке од примена података временских низова у апликацијама.

#1. Временски низови у финансијском и пословном домену

Све финансијске, пословне и инвестиционе одлуке се доносе на основу тренутних тржишних трендова и предвиђања потражње. Подаци временских низова се користе за објашњење, корелацију и предвиђање динамичног финансијског тржишта. Финансијски стручњаци могу да испитају финансијске податке како би дали прогнозе за апликације које помажу у ублажавању ризика, стабилизацији цена и трговању.

Анализа временских низова игра кључну улогу у финансијској анализи. Користи се у предвиђању каматних стопа, предвиђању волатилности на берзама и другим областима. Пословни актери и креатори политике могу доносити информисане одлуке о производњи, куповини, расподели ресурса и оптимизовати своје пословне операције.

Ова анализа се ефикасно користи у инвестиционом сектору за праћење вредности хартија од вредности и њихових флуктуација током времена. Вредност хартија од вредности се може посматрати краткорочно (нпр. снимање података по сату или дану) или дугорочно (нпр. посматрање које се протеже на месеце или године). Анализа временских низова је користан алат за праћење учинка хартија од вредности, имовине или економске променљиве током дужег временског периода.

#2. Временски низови у медицинској области

Здравство се брзо развија као област заснована на подацима. Поред финансијске и пословне анализе, медицинска област у великој мери користи анализу временских низова.

Размотрите ситуацију која захтева синергију временских низова података, медицинских процедура и техника рударења података током лечења пацијената са раком. Такав хибридни приступ може се користити за експлоатацију карактеристика из прикупљених података временских низова (нпр. рендгенски снимци пацијента) како би се пратио напредак пацијента и одговор на третмане које пружа медицинско особље.

У сектору здравства, извођење закључака из података временских низова који се стално мењају је од критичне вредности. Поред тога, савремена медицинска пракса захтева повезивање евиденције пацијената током времена ради бољег увида у здравствено стање пацијената. Такође, здравствени параметри пацијената морају се прецизно бележити у редовним интервалима, како би се имала јаснија слика о здравственом стању пацијента.

Са напредним медицинским инструментима који се све више користе, анализа временских низова се етаблирала у домену здравствене заштите. Размотрите следеће примере:

  • ЕКГ уређаји: уређаји дизајнирани за праћење срчаних стања снимањем електричних импулса срца.
  • ЕЕГ уређаји: уређаји који се користе за квантификацију електричне активности у мозгу.

Ови уређаји су омогућили лекарима да спроводе анализу временских низова ради брже, ефикасније и тачније медицинске дијагнозе.

Поред тога, са порастом употребе IoT уређаја, као што су носиви сензори и преносиви здравствени уређаји, људи сада могу редовно да мере своје здравствене параметре током времена, уз минималне интервенције. Ово доводи до доследног прикупљања временски зависних медицинских података и за болесне и за здраве особе.

#3. Временски низови у астрономији

Астрономија и астрофизика су две модерне дисциплине у којима се подаци временских низова значајно користе.

У суштини, астрономија подразумева цртање путања космичких објеката и небеских тела, као и извођење тачних мерења, како би се боље разумео универзум изван Земљине атмосфере. Због овог захтева, астрономски стручњаци су вешти у коришћењу података временских низова приликом калибрације и конфигурисања сложених инструмената, као и у проучавању астрономских објеката од интереса.

Подаци временских низова су дуго повезани са облашћу астрономије. Већ 800. године пре нове ере, подаци о временским низовима сунчевих пега су прикупљани у редовним интервалима. Од тада се користи анализа временских низова за:

  • Откривање удаљених звезда на основу звезданих удаљености,
  • Посматрање космичких догађаја, као што су супернове, како би се боље разумело порекло нашег универзума.

У овом случају, подаци временских низова се односе на таласне дужине и интензитет светлости коју емитују звезде, небеска тела или објекти. Астрономи стално прате такве податке уживо како би открили космичке догађаје у реалном времену, када се они догађају.

У новије време су се појавиле истраживачке области као што су астроинформатика и астростатистика, које спајају различите дисциплине, као што су рударење података, машинско учење, рачунарска интелигенција и статистика. У овим новим истраживачким областима, улога података временских низова је да брзо и ефикасно открију и класификују астрономске објекте.

#4. Временски низови у прогнози времена

Аристотел је опсежно проучавао временске обрасце како би боље разумео узроке и последице промена времена у античко доба. Касније, научници су почели да бележе податке везане за временске прилике помоћу инструмената као што је барометар, за израчунавање атмосферских променљивих. Подаци су прикупљани у редовним интервалима и чувани на различитим локацијама.

Временом су се временске прогнозе почеле појављивати у новинама. Данас, свеприсутне метеоролошке станице су инсталиране у различитим географским областима широм света како би прикупиле тачне временске променљиве.

Такве станице имају напредне функционалне уређаје који су међусобно повезани за прикупљање и корелацију временских података са различитих локација. Корелисани подаци се користе за предвиђање временских услова у сваком тренутку, у зависности од захтева.

#5. Временски низови у пословном развоју

Подаци временских низова омогућавају предузећима да доносе информисане пословне одлуке. Ово се постиже када се анализирају претходни подаци како би се предвидели будући догађаји и откриле потенцијалне могућности. Образац претходних података се користи за извођење следећих параметара:

  • Пословни раст: за процену укупних финансијских и пословних перформанси и мерење раста, подаци временских низова су најпогоднији и најпоузданији алат.
  • Процена тренда: за процену трендова у настајању могу се користити различите методе временских низова. На пример, ове методе анализирају посматрања података током одређеног временског периода како би се приказало повећање или смањење продаје одређеног електронског уређаја.
  • Откривање сезонских образаца: забележени подаци могу открити флуктуације и сезонске обрасце који би могли да помогну у предвиђању података. Добијени подаци играју кључну улогу на тржиштима на којима цене производа варирају сезонски. Такви подаци могу помоћи предузећима у бољем планирању и развоју производа.

Закључак

Укратко, подаци временских низова се могу посматрати као карактеристике сложених тачака података прикупљених током константног временског периода. Анализа временских низова, моделирање и предвиђање су постали саставни део нашег свакодневног живота, са порастом употребе IoT уређаја, паметних кућних апарата и преносивих уређаја. Поред тога, подаци временских низова налазе своју примену у различитим областима, укључујући здравство, астрофизику, економију, инжењеринг, пословање и друге.