Rozdiel medzi schémou hviezd a snehových vločiek

Skladovanie údajov je systém určený na ukladanie a organizovanie údajov v centrálnych úložiskách vrátane údajov z iných zdrojov. Je to základný koncept podnikovej inteligencie v relačných databázových modeloch, ktorý využíva analytické techniky na integráciu podnikových údajov do centrálnej databázy.

Pri ukladaní údajov sa používajú dva bežné architektonické modely:

  • Schéma hviezd
  • Schéma snehových vločiek

Obidva modely sú spoločné viacrozmerné databázové modely používané na riešenie potrieb veľkých databáz na analytické účely v reálnych skladoch údajov.

Predstavujeme objektívne porovnanie medzi týmito dvoma, aby sme lepšie pochopili, ktorý z nich je lepší ako druhý.

Čo je Star Schema?

Je to najbežnejší a všeobecne akceptovaný architektonický model používaný na vývoj dátových skladov a dátových máp, v ktorých sú údaje usporiadané do faktov a rozmerov. Je to najjednoduchší architektonický model, v ktorom sa jedna faktická tabuľka používa na označenie viacerých rozmerových tabuliek, napodobňujúcich hviezdny vzor.

Ako už názov napovedá, schéma pripomína hviezdu so skutočnou tabuľkou v strede a viacrozmernými tabuľkami vyžarujúcimi z nej, čím sa vytvára vzor podobný hviezdam.

Je tiež známa ako Schéma zapojenia sa do hviezdy a ukladá všetky atribúty dimenzie do jednej denormalizovanej tabuľky faktúr, aby rýchlo prechádzala veľkými mnohorozmernými súbormi údajov, ktoré zodpovedajú za rýchle časy odozvy na otázky..

Čo je schéma snehových vločiek?

Je to rozšírenie hviezdovej schémy s pridanými funkciami. Na rozdiel od schémy hviezd sa tabuľky rozmerov v schéme snehových vločiek normalizujú do viacerých súvisiacich tabuliek.

Architektonický model predstavuje logické usporiadanie tabuliek v hierarchii vzťahov medzi viacerými, kde sú viacrozmerné tabuľky normalizované na podrozmerné tabuľky, ktoré sa podobajú vzoru podobnému snehovej vločke, odtiaľ názov.

Je to zložitejšia verzia schémy hviezd s väčším počtom spojení medzi tabuľkami dimenzií, čo spôsobuje pomalý čas spracovania na načítanie údajov, čo znamená pomalé časy odozvy na otázky. Minimalizuje redundanciu údajov, čo zase zlepšuje výkon dotazov.

Rozdiel medzi schémou hviezd a snehových vločiek

Architektúra schémy hviezd a snehových vločiek

V relačných databázach je hviezdová schéma najjednoduchším architektonickým modelom používaným na vývoj dátových skladov a multidimenzionálnych dátových máp. Ako už názov napovedá, model pripomína hviezdu s bodmi vyžarujúcimi zo stredu, čo znamená, že tabuľka faktov je stredom a body sú rozmerovými tabuľkami. Rovnako ako iné dimenzionálne modely pozostáva z údajov vo forme faktov a dimenzií. Schéma snehových vločiek je naopak zložitejším architektonickým modelom, ktorý odkazuje na viacrozmernú databázu s logickým usporiadaním tabuliek vo forme snehových vločiek..

Tabuľka rozmerov

Schéma snehových vločiek je dosť podobná schéme hviezd s tým rozdielom, že môže mať viac ako jednu rozmerovú tabuľku, ktorá sa ďalej normalizuje do viacerých súvisiacich tabuliek označovaných ako poddimenzionálne tabuľky. Predstavuje viac úrovní vzťahov, ktoré sa rozvetvujú do snehových vločiek. Schéma hviezd však ukladá všetky súvisiace atribúty dimenzie do jednej denormalizovanej tabuľky dimenzií, ktorá uľahčuje pochopenie a spracovanie jednoduchších dopytov..

Obchodný model schémy hviezd a snehových vločiek

Tabuľka dimenzií nemôže obsahovať duplicitné riadky v relačných databázových modeloch pre jednoduchú skutočnosť, že by mohla spôsobiť nejasnosti pri vyhľadávaní. Každá tabuľka by mala mať stĺpec alebo kombináciu stĺpcov nazývaných primárny kľúč, ktorý jednoznačne identifikuje všetky záznamy tabuľky. Cudzí kľúč je stĺpec alebo skupina stĺpcov, ktoré poskytujú spojenie medzi dvoma tabuľkami. V schéme hviezd má každá tabuľka dimenzií primárny kľúč, ktorý súvisí s cudzím kľúčom v tabuľke faktov. Hierarchia podnikania v schéme snehových vločiek je reprezentovaná vzťahom primárnych kľúčov a cudzích kľúčov medzi tabuľkami dimenzií.

Integrita dát v schéme hviezd a snehová vločka

Kľúčovým rozdielom medzi týmito dvoma relačnými databázovými modelmi je normalizácia. Tabuľky dimenzií v schéme hviezd nie sú normalizované, čo znamená, že obchodný model použije relatívne viac miesta na uloženie tabuliek dimenzií a viac priestoru znamená viac redundantných záznamov, ktoré by nakoniec spôsobili nekonzistentnosť. Schéma snehových vločiek na druhej strane minimalizuje redundanciu údajov, pretože tabuľky rozmerov sú normalizované, čo predstavuje oveľa menej redundantné záznamy. Hierarchia podnikania a jej dimenzie sa zachovávajú prostredníctvom referenčnej integrity, čo znamená, že vzťahy môžu byť nezávisle aktualizované v dátových skladoch.

Výkon dotazu

Hviezdová schéma má menej spojení medzi tabuľkou rozmerov a tabuľkou faktov v porovnaní so schémou snehových vločiek, ktorá má viac spojení, čo spôsobuje menšiu zložitosť dotazov. Pretože dimenzie v schéme hviezd sú prepojené prostredníctvom centrálnej tabuľky faktov, má jasné spojovacie cesty, ktoré znamenajú rýchle časy odozvy na dotaz a rýchla doba odozvy znamená lepší výkon. Schéma Snowflake má vyšší počet pripojení, takže dlhšie časy odozvy na dotazy, čo vedie k zložitejším dotazom, ktoré nakoniec znižujú výkon.

Schéma hviezd vs. schéma snehových vločiek: porovnávacia tabuľka


Zhrnutie Schéma snehových vločiek hviezd

Obidva najbežnejšie a najbežnejšie prijímané architektonické modely používané na vývoj databázových skladov a dátových máp. Každý obchodný model má však svoj spravodlivý podiel na výhodách a nevýhodách. Zatiaľ čo hviezdová schéma je najjednoduchším multidimenzionálnym modelom, ktorý sa používa na usporiadanie údajov do faktov a dimenzií, je ideálna pre vývoj dátových schém, ktoré zahŕňajú menej komplexné vzťahy. Schéma snehových vločiek je logické znázornenie tabuliek v multidimenzionálnej databáze, v ktorej sú rozmery uložené v subdimenzionálnych tabuľkách. Hlavný rozdiel medzi nimi je normalizácia. Tabuľky rozmerov v schéme snehových vločiek sú úplne normalizované do viacerých vyhľadávacích tabuliek, zatiaľ čo v schémach hviezd sú tabuľky rozmerov denormalizované do jednej centrálnej tabuľky faktov..