Знајте о главној шеми: Звезда против пахуљице

Вишедимензионална шема је дизајнирана да изгради модел система складишта података.

Главна сврха ових шема је да одговоре на потребе већих база података направљених за аналитичке сврхе (ОЛАП).

Овај метод се користи за наручивање података у бази података са добрим распоредом садржаја у бази података. Шема омогућава клијентима да постављају питања повезана са пословним или тржишним трендовима.

Штавише, мултидимензионална шема представља податке у облику коцки података које омогућавају преглед и моделирање података из различитих перспектива и димензија.

Има три врсте, али многи бркају звезду и пахуљицу. Због тога им постаје тешко да изаберу пожељнији модел.

Ако сте један од њих, хајде да разговарамо о разликама између шеме звезде и пахуље, почевши од дефиниције и разумевања њихових предности, изазова, дијаграма и карактеристика.

Шта је мултидимензионална шема?

Шема се односи на логички опис комплетне базе података и база података. Укључује називе записа и њихове описе, укључујући агрегате и повезане ставке података.

База података генерално користи релациони модел за описивање, док систем складишта података користи модел шеме.

Вишедимензионална шема се може дефинисати помоћу језика упита за рударење података (ДМКЛ).

Да би дефинисао витрине и складишта података, користи се два примитива – дефиниција димензије и дефиниција коцке.

Вишедимензионална шема користи различите типове модела шема. Су:

  • Звездана шема
  • Шема пахуљица
  • Галактичка шема

Хајде да разговарамо о томе шта су шеме звезда и пахуљица.

Звезда против Пахуљице: Шта су они?

Шта је звезда шема?

Шема звезда је модел архитектонског складишта података и пословне интелигенције који захтева једну табелу чињеница за складиштење измерених и трансакцијских података. Такође користи различите табеле мањих димензија за држање атрибута о пословним подацима.

Именован је према својој структури. Попут звезде, табела чињеница заузима своје место у центру дијаграма, а мале димензионалне табеле седе као гране на централном столу и формирају структуру налик звезди.

Свака звездана шема се састоји од једне табеле чињеница али више табела малих димензија. Табеле са чињеницама укључују специфичне, мерљиве податке које треба анализирати, као што су евидентирани учинак, финансијски подаци или евиденција продаје. То може бити снимак историјских података у једном тренутку или трансакција.

Штавише, Стар шема је најједноставнија и најосновнија међу складиштима података и шемама тржишта података. Ефикасан је у руковању основним упитима. Звездана шема генерално подржава пословну интелигенцију, ад хоц упите, аналитичку апликацију и коцке за аналитичку обраду на мрежи.

Шема звезда такође подржава број, просек, збир и друге агрегације многих записа. Корисници могу лако да филтрирају и групишу агрегације по димензијама. На пример, корисници генеришу упите попут „пронађи све податке о продаји у јуну“ или „анализирај укупан приход од канцеларије КСИЗ у 2022.“.

  Шта је Гоогле Цхроме-ов софтверски Репортер алат и како то зауставити?

Шта је шема пахуљица?

Шема снежне пахуље је вишедимензионални модел података који такође може бити познат као проширење шеме звезда. То је зато што се табеле димензија у шеми пахуљице разлажу на поддимензије.

Шема је пахуља ако се једна или више табела димензија не повезују директно са табелом чињеница, већ се повезују преко других табела димензија.

Пахуља је феномен који нормализује табеле димензија у шеми звезда. Када нормализујете све табеле димензија, резултујућа структура подсећа на пахуљицу која садржи табелу чињеница у средини структуре.

Једноставним речима, шема пахуљица се састоји од једне табеле чињеница у средини модела, која је повезана са табелама димензија, које су поново повезане са другим табелама димензија. Ова шема се користи за побољшање перформанси упита.

Модел је креиран за брзо, флексибилно постављање упита преко сложених односа и димензија. Корисно је за односе један према много и много према много међу различитим нивоима димензија.

Због строжег придржавања стандарда нормализације, добићете већу ефикасност складиштења. Али, редундантност података је занемарљива, а перформансе су ниске у поређењу са денормализованим моделима података као што је звезда шема.

Звезда против пахуљице: Како раде?

Како функционише звездаста шема?

Табела чињеница у средини модела звезда чува две врсте информација – нумеричке вредности и вредности атрибута димензије. Хајде да их разумемо на примеру базе података о продаји.

  • Нумеричке вредности су јединствене за сваки ред и тачку података. Ово није у корелацији нити се односи на податке ускладиштене у другом реду. То су чињенице о датој трансакцији, као што су укупан износ, количина поруџбине, тачно време, нето профит, ИД налога итд.
  • Вредности димензионалних атрибута не складиште никакве податке директно, већ чувају вредности страног кључа за ред у димензионој табели. Различити редови у централној табели ће референцирати ове информације, као што су вредност података, ИД запосленог у продаји, ИД филијале, ИД производа итд.

Табеле димензија увек чувају пратеће информације из табеле чињеница. Свака димензиона табела се односи на колону табеле чињеница заједно са димензионалном вредношћу и чува додатне податке о тој вредности.

Пример: Табела димензија запослених користи ИД запосленог као кључну вредност и такође садржи информације, као што су име, пол, адреса и број телефона. Слично, табела димензија производа чува информације, укључујући назив производа, боју, први датум на тржишту, трошкове производње итд.

Како функционише шема пахуљица?

Замислите дизајн пахуљице са средишњом кутијом и различитим везама кроз ту кутију до различитих тачака. За одржавање продајних места и складишта података, дизајн шеме пахуљице долази у обзир.

Слична је шеми звезда, али са ситним променама. За разлику од шеме звезда, шема пахуља проширује своје табеле поддимензија, које су повезане са табелама димензија.

Примарна сврха овог модела је да нормализује денормализоване информације модела звезде. На овај начин може да реши уобичајене проблеме повезане са шемом звезда.

У сржи шеме, наћи ћете табелу чињеница која се повезује са информацијама садржаним у табелама димензија. Ове табеле поново зраче напоље у табеле поддимензија које имају детаљне информације које описују информације табеле димензија.

  Како добити бесплатно пробно чланство за Цоурсе Херо

Пример: Шема пахуља садржи табелу са чињеницама о продаји и табеле са локацијом продавнице, линијом, породицом, производом и временском димензијом. Тржишне димензије се састоје од две табеле димензија, при чему је продавница примарна табела димензија и локација продавнице као табела поддимензије. Димензија производа има три табеле поддимензија у којима се помињу табела поддимензија производа, линије и породице.

Звезда против пахуљице: карактеристике

Карактеристике звезда шеме

  • Звездаста шема може да филтрира податке из нормализованих података да би задовољила потребе складиштења података. Јединствени кључ се генерише из повезаних информација за сваку табелу чињеница да би се идентификовао сваки ред.
  • Обезбеђује брзе прорачуне и агрегације, као што су приходи од оствареног прихода и укупне ставке продате на крају сваког месеца. Ови детаљи се могу филтрирати према потребама уоквирујући одговарајуће упите.
  • То је мерење догађаја које укључује вредности коначних бројева које се састоје од страног кључа. Ови кључеви су повезани са табелама димензија. Постоје различите врсте табела чињеница које су уоквирене вредностима на атомском нивоу.
  • Табела чињеница трансакција садржи податке о одређеним догађајима, као што су распродаје и празници.
  • Чињенице за евидентирање укључују дате периоде као што су информације о рачуну на крају године или сваког квартала.
  • Табела димензија даје детаљне податке о атрибутима или записима који се налазе у централној табели.
  • Корисник је у могућности да сам дизајнира сто према потребама.
  • Можете да користите шему звезда да акумулирате табеле снимака.

Карактеристике шеме пахуљица

  • Шеми пахуљице је потребан мали простор на диску.
  • Овај модел је једноставан за имплементацију захваљујући одвојеним и главним табелама димензија.
  • Табеле димензија садрже најмање два атрибута за дефинисање информација са више зрна.
  • Због више табела, перформансе су ниске у поређењу са шемом звезда.
  • Пахуља шема има највиши ниво интегритета података и ниску редунданцију због нормализације.

Звезда против пахуљице: Предности

Предности Стар Шеме

  • Шема звезда је најједноставнији начин међу шемама тржишта података.
  • Има једноставну логику извештавања. Ова логика се подразумева динамички.
  • Дизајниран је коришћењем коцки за храњење примењених кроз Онлине Трансацтион Процесс како би коцке функционисале ефикасно и ефективно.
  • Шема звезда је формирана једноставном логиком и упитима које је лако издвојити из процеса трансакције.
  • Нуди побољшане перформансе за апликације за извештавање.
  • Користи се за контролу брзог опоравка података.
  • Филтриране и одабране информације могу се лако применити у различитим случајевима.

Предности шеме пахуљица

  • Звездаста шема се користи за развој перформанси упита због мање захтева за складиштење на диску.
  • Нуди већу скалабилност у односима између компоненти и нивоа димензија.
  • Лакше је одржавати.
  • Звездаста шема нуди брзо проналажење података.
  • То је уобичајена и једноставна шема података за складиштење података.
  • Помаже у побољшању квалитета података.
  • Структурирани подаци смањују питање интегритета података.

Звезда против Пахуљице: Ограничења

Ограничења Звездане шеме

Има високо денормализовано стање и стање интегритета. Цео процес ће се срушити ако корисник не успе да ажурира податке. Безбедност и заштита су такође ограничени. Поред тога, шема звезда није тако флексибилна као аналитички модел. Не нуди ефикасну подршку различитим односима.

  10 најбољих Нетфлик оригиналних станд-уп комедија (јун 2020.)

Ограничења шеме пахуљица

Главно ограничење које ћете наћи код Сновфлаке-а су додатни напори за одржавање због све већег броја таблица малих димензија. Многи сложени упити отежавају проналажење потребних података. Поред тога, време имплементације питања је велико због виших табела. Овај модел је такође крут и захтева веће трошкове одржавања.

Звезда против Пахуљице: Разлике

Звезда и пахуља су типови вишедимензионалних шема, али имају различите структуре и својства. Први је попут звезде, а други подсећа на пахуљицу, дефинишући њихова имена.

У шеми звезда, само једно спајање гради однос између централне табеле чињеница и табела бочних димензија. С друге стране, у шеми пахуљице, потребно је више спојева за повезивање са табелама димензија.

Шема звезда се генерално користи када имате мањи број редова у табели димензија, док се шема пахуља користи када је табела димензија релативно велика.

Дијаграм испод разликује два модела и начин на који су табеле димензија и табела чињеница повезане у различитим шемама.

ПараметерсСтар СцхемаСновфлаке СцхемаДиск спацеСтар шема користи више простора на диску.Сновфлаке шема користи мање простора на диску.Редунданса податакаИма високу редундансу података.Има ниску редундантност података.НормализацијаТабеле димензија су денормализоване, што значи да се понављају исте вредности унутар табеле. потпуно нормализован. Перформансе упита Потребно је минимално време за извршавање упита, што резултира бољим перформансама. Потребно је више времена од шеме звезда за извршење упита, што га чини мање ефикасним од шеме звезда. Сложеност упита Сложеност упита је ниска. Сложеност упита је већи од шеме у облику звезде. Одржавање Због велике редундансе података, одржавање шеме звезда је мало тешко. Због мале редундансе података, лако је одржавати и мењати шему пахуљица. Интегритет података Интегритет података је висок јер се подаци чувају редундантно тамо где је више копије постоје у табелама димензија. Интегритет података је низак јер потпуно нормализује табеле димензија. Хијерархије Хијерархије за табеле димензија у шеми звезда се чувају у табели димензија. Хијерархије су подељене у засебне табеле димензија. Дизајн ДБ Има једноставан ДБ дизајн. Има веома сложен ДБ дизајн. Табела чињеница Више табела димензија окружује табелу чињеница. Табела чињеница је окружена табелама димензија које су такође окружене табелама поддимензија. Шема Сет упСтар је једноставна за дизајн и постављање јер их представљају директни односи. С друге стране, шема пахуљица је мало сложена за постављање. Обрада коцке Обрада коцке је бржа. Због сложеног спајања, обрада коцке је мало спора. Страни кључеви Има минималан број страних кључева. Има максималан број страних кључева.

Закључак

И шеме звезда и пахуља су корисне у различитим секторима. Дакле, одлучивање о томе који је бољи међу њима заснива се на њиховим захтевима.

Шема пахуља је проширење звезда шеме, где нормализује табеле димензија у шеми звезда.

Шема звезда је једноставног дизајна, брже покреће упите, а подешавање је једноставно. С друге стране, шема пахуља је лакша за одржавање, заузима мање простора на диску и мање је склона проблемима са интегритетом података.

Дакле, шема звезда би могла бити боља опција ако вам је потребан једноставан дизајн, мање страних кључева и бржа обрада коцке. Али, ако вам треба мање простора на диску, низак интегритет података и ниско одржавање, шема пахуљице може бити прикладнија.

Такође можете истражити нека најбоља решења базе података графова.