Архитектура на SAP HANA, LandScape, оразмеряване: пълен урок

Базата данни на SAP HANA е платформа за управление на данни, ориентирана към основната памет. Базата данни на SAP HANA работи на SUSE Linux Enterprises Server и се основава на C ++ Language.

Базата данни на SAP HANA може да се разпространява на множество машини.

Предимствата на SAP HANA са посочени по-долу -

SAP HANA е полезна, тъй като е много бърза поради всички данни, заредени в паметта и няма нужда да зареждате данни от диск.
SAP HANA може да се използва за целите на OLAP (On-line analytic) и OLTP (On-Line Transaction) в една база данни.

Базата данни на SAP HANA се състои от набор от механизми за обработка в паметта. Двигателят за изчисления е основният механизъм за обработка в паметта в SAP HANA. Работи с друг механизъм за обработка като Релационен двигател на база данни (двигател на редове и колони), OLAP Engine и др.

Таблицата на релационната база данни се намира в хранилище на колони или редове.

Има два типа съхранение за таблицата на SAP HANA.

Съхранение от ред (за таблица с редове).
Съхранение от тип колона (за таблица с колони).

Текстовите данни и графичните данни се намират съответно в Text Engine и Graph Engine. Има още някои двигатели в базата данни на SAP HANA. Данните могат да се съхраняват в тези двигатели, стига да има достатъчно място.

В този урок ще научите -

Архитектура на SAP HANA
SAP HANA Пейзаж
Оразмеряване на SAP HANA

Архитектура на SAP HANA

Данните се компресират от различни техники за компресиране (напр. Кодиране на речника, кодиране с дължина на изпълнението, рядко кодиране, клъстерно кодиране, непряко кодиране) в SAP HANA Column store.

Когато в SAP HANA се достигне ограничението на основната памет, обектите на цялата база данни (таблица, изглед и т.н.), които не се използват, ще бъдат разтоварени от основната памет и записани в диска.

Тези имена на обекти се дефинират от семантично приложение и се презареждат в основната памет от диска, когато се изисква отново. При нормални обстоятелства базата данни SAP HANA управлява автоматично разтоварване и зареждане на данни.

Потребителят обаче може да зарежда и разтоварва данни от отделна таблица ръчно, като избира таблица в SAP HANA studio в съответната Схема- като щраква с десния бутон и избира опцията „Разтоварване / Зареждане“.

Сървърът на SAP HANA се състои от

Индекс сървър
Предпроцесорен сървър
Сървър за имена
Статистически сървър
Двигател XS

Индекс сървър на SAP HANA
Основният сървър на базата данни на SAP HANA са индекс сървър. Подробностите за всеки сървър са както по-долу

Това е основният компонент на базата данни на SAP HANA
Той съдържа действителни хранилища за данни и механизъм за обработка на данните.
Index Server обработва входящ SQL или MDX израз.

По-долу е представена архитектурата на Index Server.

Преглед на индексния сървър на SAP HANA

Мениджър на сесии и транзакции: Компонентът на сесията управлява сесии и връзки за базата данни на SAP HANA. Transaction Manager координира и контролира транзакциите.

SQL и MDX процесор: Компонентът на SQL Processor заявки за данни и ги изпраща в механизма за обработка на заявки, т.е. SQL / SQL Script / R / Calc Engine. MDX процесор задава и манипулира многоизмерни данни (напр. Аналитичен изглед в SAP HANA).

SQL / SQL Script / R / Calc Engine: Този компонент изпълнява SQL / SQL скрипт и преобразуване на данните за изчисление в модела за изчисление.

Хранилище: Хранилището поддържа версирането на обект на метаданни SAP HANA, напр. (Изглед на атрибути, Аналитичен изглед, Съхранена процедура).

Устойчивост: Този слой използва вградената функция „Възстановяване след бедствие“ на базата данни на SAP HANA. Архивът се записва в него като точки за запис в обема на данните.

Предпроцесорен сървър

Този сървър се използва при анализ на текст и извлича данни от текст, когато се използва функцията за търсене.

Сървър за имена

Този сървър съдържа цялата информация за системния пейзаж. В разпределения сървър сървърът на имена съдържа информация за всеки работещ компонент и местоположение на данните на сървъра. Този сървър съдържа информация за сървъра, на който съществуват данни.

Статистически сървър

Статистическият сървър е отговорен за събирането на данни, свързани със състоянието, разпределението / потреблението на ресурси и производителността на системата SAP HANA.

XS сървър

XS сървърът съдържа XS Engine. Той позволява на външни приложения и разработчици да използват базата данни SAP HANA чрез клиента XS Engine. Външното клиентско приложение може да използва HTTP за предаване на данни чрез XS механизъм за HTTP сървър.

SAP HANA Пейзаж

„HANA“ означава високоефективен аналитичен уред е комбинация от хардуер и софтуерна платформа.

Поради промяна в компютърната архитектура, по-мощният компютър се предлага по отношение на процесора, RAM и твърдия диск.
SAP HANA е решението за ограничаване на производителността, при което всички данни се съхраняват в основната памет и не е необходимо често да прехвърляте данни от дискови I / O в основната памет.

По-долу са иновациите на SAP HANA в областта на хардуера / софтуера.

В SAP HANA има два типа хранилища за релационни данни: Магазин за редове и Магазин за колони.

Магазин за редове

Същата е като традиционната база данни, например (Oracle, SQL Server). Единствената разлика е, че всички данни се съхраняват в областта за съхранение на редове в паметта на SAP HANA, за разлика от традиционната база данни, където данните се съхраняват на твърд диск.

Магазин за колони

Съхранението на колони е част от базата данни на SAP HANA и управлява данните по колонен начин в паметта на SAP HANA. Таблиците с колони се съхраняват в зоната за съхранение на колони. Магазинът Column осигурява добра производителност за операции по запис и в същото време оптимизира операцията за четене.

Ефективността на операцията за четене и запис е оптимизирана с по-ниска структура от данни.

Основно хранилище

Основното хранилище съдържа основната част от данните. В основното хранилище се прилага подходящ метод за компресиране на данни (кодиране на речник, кодиране на клъстери, рядко кодиране, кодиране на дължина на изпълнение и др.) За компресиране на данни с цел спестяване на памет и ускоряване на търсенията.

В главното хранилище операциите за запис на компресирани данни ще бъдат скъпи, така че операцията за запис не променя директно компресираните данни в основното хранилище. Вместо това всички промени се записват в отделна област в хранилището на колона, известна като „Delta Storage“.
Delta съхранението е оптимизирано за операция на запис и използва нормално компресиране. Операциите за запис не са разрешени в основното хранилище, но са разрешени в делта хранилището. Операциите за четене са разрешени и в двете хранилища.

Можем ръчно да зареждаме данни в основната памет чрез опция „Зареждане в паметта“ и да разтоварваме данни от основната памет чрез опцията „Разтоварване от паметта“, както е показано по-долу.

Delta Storage

Делта съхранението се използва за операция по запис и използва основно компресиране. Всички необвързани модификации в данните от таблицата на колони, съхранявани в делта съхранение.

Когато искаме да преместим тези промени в Основно хранилище, използвайте "операция за делта обединяване" от студиото на SAP HANA, както е показано по-долу -

Целта на операцията за делта обединяване е да премести промените, които се събират в делта хранилището в основното хранилище.
След извършване на операция Delta Merge върху таблица на колона sap, съдържанието на основното хранилище се записва на диск и компресията се преизчислява.

Процес на преместване на данни от делта в основното хранилище по време на делта обединяване

Има буферно хранилище (L1-Delta), което е съхранение на редове. Така че в SAP HANA таблицата на колоните действа като съхранение на редове поради L1-делта.

Потребителят изпълнява заявка за актуализиране / вмъкване в таблицата (Физическият оператор е SQL изрази.).
Данните първо отиват на L1. Когато L1 премества данните допълнително (L1- Неангажирани данни)
След това данните отиват в L2-делта буфер, който е ориентиран към колона. (L2 - Ангажирани данни)
Когато процесът L2-делта приключи, данните отиват в основното хранилище.

И така, съхранението на колона е оптимизирано както за запис, така и за четене, съответно поради L1-Delta и основното хранилище. L1-Delta съдържа всички необвързани данни. Ангажираните данни се преместват в Основния магазин чрез L2-Delta. Данните от основното хранилище преминават към слоя за постоянство (стрелката, посочена тук, е физически оператор, който изпраща SQL изявление в Column Store). След обработка на SQL изявление в Column store данните отиват на слоя за постоянство.

Например по-долу е таблица, базирана на редове

Данните от таблицата се съхраняват на диск в линеен формат, така че по-долу е даден форматът как се съхраняват данните на диска за таблица с редове и колони

В паметта на SAP HANA тази таблица се съхранява в Row Store на диск като формат -

Адрес на паметта

И в колона данните се съхраняват на диск като -

Адрес на паметта

Данните се съхраняват в колона в линеен формат на диска. Данните могат да бъдат компресирани чрез техника на компресиране.

Така че, Column store има предимството да спестява памет.

Оразмеряване на SAP HANA

Оразмеряването е термин, който се използва за определяне на хардуерни изисквания за системата SAP HANA, като RAM, твърд диск и процесор и т.н.

Основният важен компонент за оразмеряване е паметта, а вторият важен компонент за оразмеряване е процесорът. Третият основен компонент е диск, но оразмеряването зависи изцяло от паметта и процесора.

При внедряването на SAP HANA една от критичните задачи е да се определи точния размер на сървър според бизнес изискванията.

DB на SAP HANA се различават по размер с нормална СУБД по отношение на -

Основно изискване за памет за SAP HANA (Оразмеряването на паметта се определя от метаданни и данни за транзакции в SAP HANA)
Изискване на процесора за SAP HANA (прогнозният CPU се изчислява неточно).
Изискване на дисково пространство за SAP HANA (Изчислява се за постоянство на данните и за регистриране на данни)

CPU на сървъра на приложения и паметта на сървъра на приложения остават непроменени.

За изчисляване на размера SAP е предоставил различни насоки и метод за изчисляване на правилния размер.

Можем да използваме метода по-долу