SAP DS (услуги за данни) в HANA

Anonim

Какво представлява услугата за данни на SAP?

SAP Data Services е инструмент за ETL, който дава решение на ниво предприятие за интеграция на данни, трансформация, качество на данните, профилиране на данни и обработка на текстови данни от хетерогенния източник в целева база данни или склад за данни.

Можем да създадем приложения (работа), в които картографирането и трансформирането на данни могат да се извършват с помощта на конструктора. (Най-новата версия на SAP BODS е 4.2).

Характеристики на услугите за данни

  • Той осигурява паралелни трансформации с висока производителност.
  • Той разполага с изчерпателни административни инструменти и инструмент за отчитане.
  • Той поддържа много потребители.
  • SAP BODS е много гъвкав с приложение, базирано на уеб услуги.
  • Той позволява скриптов език с богат набор от функции.
  • Услугите за данни могат да се интегрират със SAP LT Replication Server (SLT), с

    Задействана технология. SLT добавя делта-възможности към всяка изходна таблица на SAP или не на SAP

    Което позволява използването на данни за улавяне за промяна и прехвърляне на делта данните на

    таблицата Източник.

  • Проверка на данните с табла за управление и одит на процеса.
  • Инструмент за администриране с възможности за планиране и мониторинг / табла.
  • Отстраняване на грешки и вградено профилиране и преглед на данни.
  • SAP BODS поддържа широк източник и цел.
    • Всички приложения (напр. SAP).
    • Всички бази данни с групово зареждане и промяна на събирането на данни
    • Файлове: фиксирана ширина, разделени със запетая, COBOL, XML, Excel.

Компонент на услуги за данни

Услугите на SAP DATA имат компонент по-долу -

  1. Дизайнер - Това е инструмент за разработка, чрез който можем да създадем, тестваме и изпълним задача, която попълва хранилище за данни.

    Той позволява на разработчика да създава обекти и да ги конфигурира, като избира икона в диаграмата на потока от източник до цел.

    Той може да се използва за създаване на приложение чрез посочване на работни потоци и потоци от данни.

    За да отворите конструктора на услуги за данни, отидете в менюто "Старт" -> Всички програми -> SAP услуги за данни (4.2 тук) -> Data Service Designer.

  1. Job Server - Това е приложение, което стартира механизма за обработка на услуги за данни и служи като интерфейс към двигателя и Data Services Suite.
  2. Engine - Data Service engine изпълнява отделни задачи, които са дефинирани в приложението.
  3. Хранилище - Хранилището е база данни, която съхранява предварително дефинирани дизайнерски обекти и дефинирани от потребителя обекти (източници и целеви метаданни, правила за трансформация).

    Хранилището е два вида -

  • Локално хранилище (използва се от Designer и Job Server).
  • Централно хранилище (използва се за споделяне на обекти и контрол на версиите)
  1. Access Server - Сървърът за достъп предава съобщения между уеб приложения, сървър за работа на услуги за данни и двигатели.
  2. Администратор - Уеб администраторът осигурява базирано на браузъра администриране на ресурсите за услуги за данни, както е показано по-долу -
  • Конфигуриране, стартиране и спиране на услуги в реално време.
  • Планиране, наблюдение и изпълнение на партидни задачи.
  • Конфигуриране на Job Server, Access Server и Repository.
  • Управление на потребителите.
  • Публикуване на партидни задачи и услуги в реално време чрез уеб услуги
  • Конфигуриране и управление на адаптери.

Архитектура на услуги за данни -

Архитектурата на услугите за данни има следния компонент -

  • Централно хранилище - използва се за конфигурации на хранилища към сървъри за задания, управление на сигурността, контрол на версиите и споделяне на обекти
  • Дизайнер - Използва се за създаване на проект, работа, работен поток, поток на данни и изпълнение.
  • Локално хранилище (тук можете да създавате промени и да стартирате работни места, работен поток, поток от данни).
  • Job server & engine - Той управлява задачите.
  • Access Server - Използва се за изпълнение на задания в реално време, създадени от разработчиците в хранилищата.

На изображението по-долу са показани връзките за услуги за данни и там компонент.

Архитектура на SAP BODS

Подробности за прозореца на дизайнера: Първо разглеждаме първия компонент на услугата за данни на SAP - дизайнер

Подробностите за всеки раздел на дизайнера на услуги за данни са както по-долу -

  1. Лента с инструменти (Използва се за Отваряне, Запазване, Назад, Проверка, Изпълнение и др.).
  2. Област на проекта (Съдържа текущия проект, който включва работа, работен поток и поток от данни. В услугите за данни всички обекти са обекти.
  3. Работно пространство (Областта на прозореца на приложението, в която дефинираме, показваме и модифицираме обекти).
  4. Локална библиотека на обекти (Тя съдържа обекти на локално хранилище, като трансформации, работа, работен поток, поток от данни и т.н.).
  5. Палитра с инструменти (Бутоните на палитрата с инструменти ви позволяват да добавяте нови обекти към работното пространство).

Йерархия на обектите

Диаграмата по-долу показва йерархични връзки за ключовите типове обекти в Data Services.

>

Забележка:

Работните процеси и условните * не са задължителни

Обектите, използвани в подробностите за услугите за данни на SAP, са както по-долу -

Обекти Описание
Проект Проектът е обект от най-високо ниво в прозореца на дизайнера. Проектите ви осигуряват начин да организирате останалите обекти, които създавате в Data Services. Само един проект е отворен в даден момент (където „отворен“ означава „видим в проекционната област“).
Работа „Работа“ е най-малката единица работа, която можете да планирате независимо за изпълнение.
Скриптове Подмножество редове в процедура.
Работния процес "Работен поток" е включването на няколко потока от данни в последователен поток от работа за цяла работа. Работният процес не е задължителен. Работният процес е процедура.
  • Потоци от данни за обажданията
  • Обадете се на друг работен поток
  • Определете реда на стъпките, които трябва да бъдат изпълнени във вашата работа
  • Предавайте параметри към и от потоци от данни.
  • Посочете как да се справяте с грешки, които възникват по време на изпълнение.
  • Определете условията за изпълнение на раздели на проекта.
Поток от данни "Поток от данни" е процесът, при който данните-източници се трансформират в целеви данни. Потокът от данни е обект за многократна употреба. Винаги се извиква от работен поток или работа.
  • Определете изходните данни, които искате да прочетете.
  • Дефинирайте трансформациите, които искате да извършите върху данните.
  • Определете целевата таблица, към която искате да заредите данни.
Хранилище за данни Логически канал, който свързва услугите за данни към източниците и целевите бази данни на Datastore.
  • Трябва да се посочи за всяка база данни източник и цел.
  • Използват се за импортиране на метаданни за източници и целеви бази данни в хранилището
  • Използват се от Data Services за четене на данни от изходни таблици и зареждане на данни към целеви таблици
Цел Таблица или файл, в който Data Services зарежда данни от източника.

Пример за услуги за данни чрез зареждане на данни от SAP Source Table

Всичко в услугите за данни е обект. Трябва да отделим хранилище за данни за всяка база данни източник и цел.

Стъпки за зареждане на данни от таблицата на източника на SAP - SAP BODS имат много стъпки, в които трябва да създадем хранилище за данни за източник и цел и да ги картографираме.

  • Създайте хранилище за данни между източника и BODS
  • Импортирайте метаданните (Структури) в BODS.
  • Конфигурирайте сървъра за импортиране
  • Импортирайте метаданните в системата HANA.
  • Създайте хранилище за данни между BODS към HANA.
  • Създаване на проект.
  • Създаване на работа (партида / в реално време)
  • Създайте работен поток
  • Създаване на поток от данни
  • Добавяне на обект в потока от данни
  • Изпълнете работата
  • Проверете визуализацията на данните в HANA

Стъпка 1) Създайте хранилище за данни между SAP Source и BODS

  1. За да заредим данни от SAP Source в SAP HANA чрез SAP BODS, ни е необходимо хранилище за данни. Така че първо създаваме хранилище за данни, както е показано по-долу -

    Проект -> Ново -> Съхранение на данни

  2. Ще се появи изскачащ прозорец за Създаване на ново хранилище за данни, въведете подробности, както по-долу -
    1. Въведете името на хранилището за данни "ds_ecc".
    2. Изберете името на типа хранилище за данни като „SAP приложения“.
    3. Въведете име на сървъра на база данни
    4. Потребителско име и парола.
    5. Кликнете върху бутона "Прилагане".
    6. Щракнете върху бутона "OK".

  3. Съхранението на данни ще бъде създадено и ще прегледа създаденото хранилище за данни, както по-долу -
  1. Отидете в библиотеката на локални обекти
  2. Изберете раздела DataStore.
  3. Ще се покаже хранилището на данни "ds_ecc".

Стъпка 2) Импортиране на метаданни (структура) в BODS сървър.

Създадохме хранилище за данни за ECC към BODS; сега импортираме метаданни от ECC в BODS. За да импортирате, следвайте стъпките по-долу -

  1. Изберете Магазин за данни "ds_ecc" и щракнете с десния бутон.
  2. Изберете опция Импортиране по име.

    Ще се покаже изскачащ прозорец за Импортиране по име. Въведете подробности както по-долу -

    1. Изберете Тип като таблица.
    2. Въведете Име на таблица, която искаме да импортираме. Тук импортираме таблица KNA1.
    3. Щракнете върху бутона "Импортиране". Таблицата KNA1 ще се появи под възела на таблицата на източника на данни "ds_ecc".

Табличните метаданни ще бъдат импортирани, в хранилището на данни ds_ecc, както по-долу -

Стъпка 3) Конфигурирайте сървъра за импортиране

Досега сме импортирали таблица в данни, съхранявани "ds_ecc", създадени за ECC към SAP BODS Connection. За да импортираме данни в SAP HANA, трябва да конфигурираме сървър за импортиране,

  1. За целта отидете на Бърз преглед-> Конфигуриране на сървъра за импортиране, както е показано по-долу -

  2. Ще се появи изскачащ прозорец за Избор на система, Изберете SAP HANA (HDB тук) Система, както по-долу-

  1. Щракнете върху бутона "Напред". Ще се появи друг изскачащ прозорец за идентификационни данни за услуга за данни, въведете следните подробности
  1. Адрес на сървъра на SAP BODS (тук BODS: 6400)
  2. Въведете име на хранилището на SAP BODS (Име на хранилището на HANAUSER)
  3. Въведете ODBC източник на данни (ZTDS_DS).
  4. Въведете порт по подразбиране за SAP BODS сървър (8080).

Щракнете върху бутона "Finish".

Стъпка 4) Импортирайте метаданните в системата HANA

1. Досега имаме конфигуриран сървър за импортиране, сега ще импортираме метаданни от сървъра на SAP BODS.

  1. Щракнете върху опцията за импортиране в бърз изглед.
  2. Ще се покаже изскачащ прозорец за опция за импортиране. Изберете опцията „Селективен импорт на метаданни“.

Щракнете върху бутона "Напред".

2. Ще се покаже изскачащ прозорец за „Селективен импорт на метаданни“, в който избираме целевата система.

  1. Изберете SAP HANA System (HDB тук).

Щракнете върху бутона "Напред".

Стъпка 5) Създайте хранилище за данни между BODS и HANA

Както знаем, в BODS трябва да създадем отделно хранилище за данни за източник и цел. Вече създадохме хранилище за данни за източника, сега трябва да създадем хранилище за целта (между BODS и HANA). И така, ние създаваме ново хранилище за данни с име "DS_BODS_HANA".

  1. Отидете на Project -> New -> Datastore.

  1. Ще се появи екран за Създаване на ново хранилище на данни, както по-долу.
    1. Въведете име на хранилището за данни (DS_BODS_HANA).
    2. Въведете тип хранилище на данни като база данни.
    3. Въведете тип база данни като SAP HANA.
    4. Изберете Версия на базата данни.
    5. Въведете име на сървъра на базата данни на SAP HANA.
    6. Въведете име на порт за базата данни SAP HANA.
    7. Въведете потребителско име и парола.
    8. Отметнете „Активиране на автоматичен трансфер на данни“.

Кликнете върху „Прилагане“ и след това върху бутона „OK“.

Съхранението на данни "DS_BODS_HANA" ще се покаже в раздела за съхранение на данни на локалната библиотека на обекти като

По-долу-

  1. Сега импортираме таблица в хранилището за данни "DS_BODS_HANA".
    1. Изберете хранилище за данни "DS_BODS_HANA" и щракнете с десния бутон.
    2. Изберете Импортиране по име.

  1. Ще се появи изскачащ прозорец за Импортиране по име, както е по-долу -
    1. Изберете Тип като таблица.
    2. Въведете Име като KNA1.
    3. Собственикът ще бъде показан като Hanauser.
    4. Щракнете върху бутона за импортиране.

Таблицата ще бъде импортирана в хранилището за данни "DS_BOD_HANA", за да видите данните в таблицата, следвайте стъпките по-долу -

  1. Кликнете върху таблица "KNA1" в хранилището за данни "DS_BODS_HANA".
  2. Данните ще се показват В ТАБЛИЧЕН формат.

Стъпка 6) Дефиниране на проект: Проектна група и организиране на свързани обекти. Проектът може да съдържа произволен брой работни места, работен поток и поток от данни.

  1. Отидете в менюто на дизайнерския проект.
  2. Изберете нова опция.
  3. Изберете опция Проект.

Изскачащ прозорец за създаване на нов проект се появява, както е показано по-долу. Въведете име на проекта и щракнете върху бутона Създаване. Той ще създаде папка за проект в нашия случай BODS_DHK.

Стъпка 7) Определяне на работа: Работата е обект за многократна употреба. Той съдържа работни потоци и поток от данни. Работите могат да се изпълняват ръчно или като график. За да изпълним BODS процес, трябва да дефинираме работата.

Създаваме работа като JOB_Customer.

  1. Изберете проект (BODS_DHK), създаден в стъпка 1, щракнете с десния бутон и изберете „New Batch Job“.

  2. Преименувайте го на "JOB_Customer".

Стъпка 8) Определете работния поток:

  1. Изберете работа "JOB_Customer" в областта на проекта,
  2. Щракнете върху бутона на работния поток в палитрата с инструменти. Щракнете върху областта Черно работно пространство. В работното пространство ще се появи икона на работен поток.
  3. Променете името на работния процес като "WF_Customer".

Щракнете върху името на работния поток, в работното пространство се появява празен изглед за работния поток.

Стъпка 9) Определете потока от данни:

  1. Щракнете върху Работен поток "WF_Customer".
  2. Щракнете върху бутона Dataflow в палитрата с инструменти. Щракнете върху областта Черно работно пространство. В работното пространство ще се появи икона за поток от данни.
  3. Променете името на потока от данни като "DF_Customer".
  4. Потокът данни се появява и в областта на проекта вляво под името на заданието.

Стъпка 10) Добавяне на обект в потока от данни:

Вътре в потока от данни можем да предоставим инструкции за трансформиране на изходни данни в желаната форма за целевата таблица.

Ще видим по-долу обект -

  • Обект за източника.
  • Обект за целевата таблица.
  • Обект за трансформация на заявка. (Заявката преобразува карти на колоните от източник към цел.)

    Кликнете върху потока от данни DF_Customer. По-долу ще се появи празно работно пространство -

  1. Посочете обект от Източник - Отидете в хранилището за данни "ds_ecc" и изберете таблица KNA1 и плъзнете и пуснете към празния екран на потока от данни, както е показано на екрана по-долу
  2. Посочете обект за Target- Select Data store "DS_BODS_HANA" от хранилището и изберете таблица KNA1.
  3. Плъзнете и пуснете в работното пространство и изберете опцията „Направяне на цел“. Ще има две таблици за източник и цел. Тук ще определим таблицата като източник и цел.

  1. Трансформация на заявки - Това е инструмент, използван за извличане на данни въз основа на входна схема за специфично за потребителя състояние и за транспортни данни от източника до целта.
    1. Изберете иконата за трансформиране на заявки от палитрата с инструменти и го плъзнете и пуснете между източника и целевия обект в работното пространство, както по-долу -
    2. Свързване на обект на заявка към източник.
    3. Свързване на обект на заявка към целевата таблица.

    1. Щракнете двукратно върху иконата на заявката. По този начин ние картографираме колона от входна схема към изходна схема.

Когато щракнем върху иконата на заявка, ще се появи следващ прозорец за картографиране, в който правим следните стъпки -

  1. Избрана е таблица на източника KNA1.
  2. Изберете всички колони от изходната таблица и щракнете с десния бутон и изберете карта за извеждане.
  3. Целевият изход, избран като заявка, и колоната ще бъдат картографирани.

5. Запазване и потвърждаване на проекта.

1. Щракнете върху икона за потвърждаване.

2. Появява се изскачащ прозорец за успешен валидиране.

Стъпка 11) Изпълнение на задача - За да изпълните задача, следвайте пътя по-долу

  1. Изберете икона на Project Area, за да отворите Project, и изберете създаден проект.
  2. Изберете Job и щракнете с десния бутон.
  3. Изберете Опция за изпълнение, за да изпълните задача.

    1. След изпълнение на задание се показва прозорец на журнал на заданията, в който ще се покажат всички съобщения относно заданието.
    2. Последното съобщение ще бъде Job <> завършено успешно.

    Стъпка 12) - Проверка / проверка на данни в базата данни на SAP HANA.

    1. Влезте в базата данни на SAP HANA чрез SAP HANA Studio и изберете схема HANAUSER.
    2. Изберете таблица KNA1 в възел на таблица.
    3. Щракнете с десния бутон върху таблица KNA1 и изберете Open Data Preview.
    4. Таблица (KNA1) Данните, заредени от BODS процеси, както е посочено по-горе, ще бъдат показани на екрана за визуализация на данни.