Схема звезда и снежинка в хранилището с данни с примери

Съдържание:

Anonim

Какво е многомерна схема?

Многомерната схема е специално проектирана за моделиране на системи за съхранение на данни. Схемите са предназначени да отговорят на уникалните нужди на много големи бази данни, предназначени за аналитична цел (OLAP).

Видове схема за съхранение на данни:

Следват 3 основни типа многомерни схеми, всяка от които има своите уникални предимства.

  • Схема на звездите
  • Схема на снежинка
  • Схема на галактиката

В този урок ще научите повече за-

  • Какво е звездна схема?
  • Какво е схема на снежинка?
  • Схема на звезди срещу Снежинка: Основни разлики
  • Какво е схема на Galaxy?
  • Какво представлява схемата на звездните клъстери?

Какво е звездна схема?

Схема на звезда в хранилище за данни, в която центърът на звездата може да има една таблица с факти и множество свързани таблици с измерения. Известна е като звездна схема, тъй като структурата й наподобява звезда. Моделът на данни на Star Schema е най-простият тип схема на Data Warehouse. Известна е също като Star Join Schema и е оптимизирана за заявки за големи масиви от данни.

В следващия пример на Star Schema таблицата с факти е в центъра, която съдържа ключове към всяка таблица с измерения като Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID и други атрибути като Продадени единици и приходи.

Пример за диаграма на звездната схема

Характеристики на звездната схема:

  • Всяко измерение в звездна схема е представено с единствената едномерна таблица.
  • Таблицата с измерения трябва да съдържа набора от атрибути.
  • Таблицата с измерения се присъединява към таблицата с факти с помощта на външен ключ
  • Таблицата с размери не е свързана една с друга
  • Фактическата таблица ще съдържа ключ и мярка
  • Схемата Star е лесна за разбиране и осигурява оптимално използване на диска.
  • Таблиците с измерения не са нормализирани. Например в горната фигура Country_ID няма таблица за търсене на страна, както би имал OLTP дизайн.
  • Схемата се поддържа широко от BI Tools

Какво е схема на снежинка?

Схемата на снежинката в хранилището на данни е логично подреждане на таблици в многомерна база данни, така че диаграмата ER прилича на форма на снежинка. Схемата на снежинката е продължение на звездна схема и добавя допълнителни размери. Таблиците с измерения са нормализирани, което разделя данните в допълнителни таблици.

В следващия пример за схема на снежинка, страната допълнително се нормализира в отделна таблица.

Пример за схема на снежинка

Характеристики на схемата за снежинка:

  • Основното предимство на схемата за снежинка използва по-малко дисково пространство.
  • По-лесното изпълнение на измерение се добавя към схемата
  • Поради многобройните таблици ефективността на заявката е намалена
  • Основното предизвикателство, с което ще се сблъскате, докато използвате схемата на снежинката, е, че трябва да извършите повече усилия за поддръжка поради повече таблици за търсене.

Схема на звезди срещу Снежинка: Основни разлики

Следва ключова разлика между звездната схема и схемата на снежинката:

Схема на звездите Схема на снежинка
Йерархиите за размерите се съхраняват в таблицата с размери. Йерархиите са разделени на отделни таблици.
Той съдържа таблица с факти, заобиколена от таблици с размери. Една таблица с факти, заобиколена от таблица с размери, които от своя страна са заобиколени от таблица с размери
В звездна схема само едно съединение създава връзката между таблицата с факти и всякакви таблици с измерения. Схема на снежинка изисква много съединения за извличане на данните.
Прост дизайн на DB. Много сложен DB дизайн.
Денормализираната структура на данните и заявката също се изпълняват по-бързо. Нормализирана структура на данните.
Високо ниво на излишък на данни Излишък на данни от много ниско ниво
Таблицата с едно измерение съдържа обобщени данни. Данните се разделят на различни таблици с размери.
Обработката на куб е по-бърза. Обработката на куба може да е бавна поради сложното съединение.
Предлага заявки с по-висока ефективност, използвайки оптимизация за заявки на Star Join Масите могат да бъдат свързани с множество измерения. Схемата на Снежинката е представена от централизирана таблица с факти, която е малко вероятно да е свързана с множество измерения.

Какво е схема на галактика?

А Galaxy Schema съдържа две факт таблица, която дял размери маси между тях. Нарича се още схема на съзвездията на фактите. Схемата се разглежда като колекция от звезди, откъдето идва и името Galaxy Schema.

Пример за схема на галактика

Както можете да видите в горния пример, има две таблици с факти

  1. Приходи
  2. Продукт.

В схемите на Galaxy споделянията размерите се наричат ​​Съобразени размери.

Характеристики на схемата на галактиката:

  • Размерите в тази схема са разделени на отделни измерения въз основа на различните нива на йерархия.
  • Например, ако географията има четири нива на йерархия като регион, държава, държава и град, тогава схемата на Galaxy трябва да има четири измерения.
  • Освен това е възможно да се изгради този тип схема чрез разделяне на схемата с една звезда на повече схеми на Star.
  • Размерите са големи в тази схема, която е необходима за изграждане въз основа на нивата на йерархията.
  • Тази схема е полезна за обобщаване на таблици с факти за по-добро разбиране.

Какво представлява схемата на звездните клъстери?

Схемата на снежинката съдържа напълно разширени йерархии. Това обаче може да добави сложност към схемата и изисква допълнителни съединения. От друга страна, звездната схема съдържа напълно свити йерархии, което може да доведе до излишък. Така че, най-доброто решение може да бъде балансът между тези две схеми, което е дизайнът на Star Cluster Schema.

Пример за схема на звездни клъстери

Припокриващите се размери могат да бъдат намерени като разклонения в йерархии. Вилица се случва, когато даден обект действа като родител в две различни измерни йерархии. След това виличните обекти се идентифицират като класификация с връзки един към много.

Резюме:

  • Многомерната схема е специално проектирана за моделиране на системи за съхранение на данни
  • Схемата звезда е най-простият тип схема на хранилището на данни. Известна е като звездна схема, тъй като структурата й наподобява звезда.
  • Схемата на снежинката е продължение на звездна схема и добавя допълнителни размери. Нарича се снежинка, защото диаграмата й наподобява снежинка.
  • В звездна схема само единично присъединяване определя връзката между таблицата на фактите и всякакви таблици с измерения.
  • Схемата Star съдържа таблица с факти, заобиколена от таблици с размери.
  • Схемата на снежинката е заобиколена от таблица с размери, които от своя страна са заобиколени от таблица с размери
  • Схема на снежинка изисква много съединения за извличане на данните.
  • Схема на Galaxy съдържа две таблици с факти, които споделят таблици с измерения. Нарича се още схема на съзвездията на фактите.
  • Схемата на звездния клъстер съдържа атрибути на схемата на звездата и снежинката.