Топ 50 въпроси за интервю за Teradata & Отговори

Anonim

Изтеглете PDF

1) Как определяте Teradata? Дайте някои от основните характеристики на същите.

Teradata е основно RDMS, който се използва за управление на Datamart, Datawarehouse, OLAP, OLTP, както и DSS Appliances на компанията. Някои от основните характеристики на Teradata са дадени по-долу.

  • Може да работи както на единични възли, така и на множество възли.
  • Паралелизмът е вграден в системата.
  • Много съвместим със стандартите на ANSI.
  • Склонен е да действа по същия начин като сървъра.
  • Това е отворена система, която основно изпълнява за UNIX MR-RAS, Suse Linux ETC, WIN2K и т.н.

2) Какви са новоразработените характеристики на Teradata?

Някои от новоразработените характеристики на Teradata са: -

  • Автоматизирана времева аналитика
  • Разширение на възможностите за компресиране, което позволява гъвкаво компресиране на данни около 20 пъти повече данни от предишната версия.
  • Свързани с клиентите иновации като гледна точка на тетраданите.

3) Откройте няколко важни компонента на Teradata.

Някои от важните компоненти на Teradata са: -

  • Байнет
  • Процесор за модул за достъп (AMP)
  • Двигател за анализиране (PE)
  • Виртуален диск (vDisk)
  • Виртуална система за съхранение (VSS)

4) Споменете процедурата, чрез която можем да стартираме задания на Teradata в UNIX среда.

Всичко, което трябва да направите, е да изпълните изпълнение в UNIX по начина, посочен по-долу.

$ Sh> BTEQ <[Път на скрипта]> [Път на регистрационния файл]

или

$ Sh> BTEQ <[Път на скрипта] TEE [Път на регистрационния файл]

5) В Teradata, как да генерираме последователност?

В Teradata генерираме последователност, като използваме колона за идентичност

6) По време на времето за показване, как се генерира последователността от Teradata?

Всичко, което трябва да направите, е да използвате CSUM.

7) На масата се налага определено натоварване и това също на всеки час. Трафикът сутрин е относително нисък, а този през нощта е много голям. Според тази ситуация коя е най-препоръчителната помощна програма и как трябва да бъде заредена тази помощна програма?

Най-предполагаемата помощна програма тук трябва да бъде Tpump. Използвайки намаляващ или увеличаващ се размер на пакета, трафикът може лесно да бъде обработен.

8) Ако скриптът за бързо зареждане се провали и ви се предоставят само таблиците с грешки, тогава как ще рестартирате?

В този случай има два начина за рестартиране.

  • Осъществяване на стария файл за стартиране - Уверете се, че не изпускате напълно таблиците с грешки. Вместо това опитайте да поправите грешките, които присъстват в скрипта или файла и след това изпълнете отново.
  • Стартиране на нов файл - В този процес скриптът се изпълнява просто с помощта на оператори за крайно зареждане и начало. Това ще помогне за премахването на заключването, поставено на целевата таблица, и може също да премахне дадения запис от таблицата за бърз дневник. След като направите това, можете да стартирате отново целия скрипт.

9) Споменете няколко от инструментите за ETL, които попадат под Teradata.

Някои от ETL инструментите, които често се използват в Teradata, са DataStage, Informatica, SSIS и др.

10) Откройте няколко от предимствата, които ETL инструментите имат пред TD.

Някои от предимствата, които ETL инструментите имат пред TD, са:

  • Могат да се управляват множество хетерогенни дестинации, както и източници.
  • Процесът на отстраняване на грешки е много по-лесен с помощта на ETL инструменти благодарение на пълноценната поддръжка на GUI.
  • Компонентите на ETL инструментите могат лесно да се използват повторно и в резултат на това, ако има актуализация на основния сървър, тогава всички съответни приложения, свързани към сървъра, се актуализират автоматично.
  • Де-пивотирането и пивотирането може лесно да се направи с помощта на ETL инструменти.

11) Какво е значението на кеширането в Teradata?

Кеширането се счита за допълнително предимство при използването на Teradata, тъй като работи предимно с източника, който остава в същия ред, т.е. не се променя често. Понякога кешът обикновено се споделя между приложения.

12) Как можем да проверим версията на Teradata, която използваме в момента?

Просто дайте командата .SHOW VERSION.

13) Дайте обоснована причина защо Multi-load поддържа NUSI вместо USI.

Редът на подтаблицата на индекса се намира на същия усилвател по същия начин като реда с данни в NUSI. По този начин, всеки усилвател се управлява отделно и паралелно.

14) Как се рестартира клиентската система MLOAD след изпълнение?

Скриптът трябва да бъде изпратен ръчно, за да може лесно да зареди данните от последния контролен пункт.

15) Как се рестартира MLOAD Teradata Server след изпълнение?

Процесът се извършва основно от последната известна контролна точка и след като данните са извършени след изпълнение на MLOAD скрипт, сървърът се рестартира.

16) Какво се разбира под възел?

Възел в основата си се нарича асортимент от компоненти на хардуера и софтуера. Обикновено сървърът се нарича възел.

17) Да кажем, че има файл, който се състои от 100 записа, от които трябва да пропуснем първия и последните 20 записа. Какво ще съдържа фрагментът на кода?

Трябва да използваме помощната програма BTEQ, за да изпълним тази задача. Skip 20, както и Repeat 60 ще бъдат използвани в скрипта.

18) Обяснете PDE.

PDE основно означава Parallel Data Extension. PDE всъщност се явява интерфейсен слой от софтуер, присъстващ над операционната система и дава възможност на базата данни да работи в паралелна среда.

19) Какво е TPD?

TPD основно означава Trusted Parallel Database и всъщност работи под PDE. Teradata е случайно база данни, която работи предимно под PDE. Това е причината, поради която Teradata обикновено се нарича Trusted Parallel или Pure Parallel база данни.

20) Какво се разбира под драйвер за канал?

Драйверът на канала е софтуер, който действа като средство за комуникация между PE и всички приложения, които се изпълняват по канали, които са прикрепени към клиентите.

21) Какво се разбира под Teradata Gateway?

Подобно на драйвер за канал, Teradata Gateway действа като средство за комуникация между Parse Engine и приложения, които са свързани към мрежови клиенти. На един възел е зададен само един шлюз.

22) Какво се разбира под виртуален диск?

Виртуалният диск е основно компилация от цял ​​набор от цилиндри, които са физически дискове. Понякога се нарича дисков масив.

23) Обяснете значението на усилвателя?

Amp по същество означава Access Module Processor и се явява процесор, работещ виртуално и основно се използва за управление на една част от базата данни. Тази конкретна част от базата данни не може да бъде споделена от друг усилвател. По този начин тази форма на архитектура обикновено се нарича архитектура със споделено нищо.

24) Какво съдържа Amp и какви са всички операции, които извършва?

Amp основно се състои от подсистема на мениджър на база данни и е в състояние да изпълнява операциите, споменати по-долу.

  • Извършване на DML
  • Извършване на DDL
  • Прилагане на агрегиране и присъединяване.
  • Освобождаване и поставяне на ключалки и др.

25) Какво се разбира под парсинг двигател?

PE случайно е вид Vproc. Неговата основна функция е да приема SQL заявки и да предоставя отговори в SQL. Състои се от широк набор от софтуерни компоненти, които се използват за разбиване на SQL на различни стъпки и след това изпращане на тези стъпки до AMP.

26) Какво имаш предвид под анализ?

Анализът е процес, свързан с анализ на символи на низ, които са или на компютърен език, или на естествен език.

27) Какви са функциите на анализатора?

Анализатор: -

  • Проверява грешки в семантиката
  • Проверява синтактичните грешки
  • Проверява съществуването на обект

28) Какво се разбира под диспечер?

Диспечерът взема цяла колекция от заявки и след това ги съхранява на опашка. По време на процеса се съхранява една и съща опашка, за да се доставят множество набори отговори.

29) Колко сесии на MAX може PE да обработи в определен момент?

PE може да обработи общо 120 сесии в определен момент от времето.

30) Обяснете BYNET.

По същество BYNET служи като средство за комуникация между компонентите. Той е отговорен предимно за изпращане на съобщения и също така за извършване на обединяване, както и операции за сортиране.

31) Какво се разбира под Clique?

Известно е, че Clique е асортимент от възли, който се споделя между често срещаните дискови устройства. Присъствието на Clique е изключително важно, тъй като помага за избягване на повреди на възли.

32) Какво се случва, когато възел претърпи падане?

Всеки път, когато има спад в нивото на производителност на възел, всички съответни Vprocs незабавно мигрират към нов възел от неуспешния възел, за да получат всички данни обратно от общите устройства.

33) Избройте всички форми на ЗАКЛЮЧВАНИЯ, които се предлагат в Teradata.

По принцип има четири типа ЗАКЛЮЧВАНИЯ, които попадат под Teradata. Това са: -

  • Прочетете Lock
  • Заключване на достъпа
  • Изключително заключване
  • Запишете Lock

34) Кое е определеното определено ниво, на което LOCK може да бъде приложен в Teradata?

  • Ниво на таблицата - Всички редове, които присъстват в таблицата, със сигурност ще бъдат заключени.
  • Заключване на ниво база данни - Всички обекти, които се намират в базата данни, ще бъдат заключени.
  • Lock Hash Level Lock - Заключват се само онези редове, които съответстват на конкретния ред.

35) В първичния индекс какъв е резултатът от AMP, които участват активно?

Само един AMP участва активно в първичен индекс.

36) В Teradata какво е значението на командата UPSERT?

UPSERT по същество означава Update Else Insert. Тази опция е налична само в Teradata.

37) Подчертайте предимствата на PPI (Partition Primary Index).

PPI се използва основно за съхранение на данни, базирани на обхват или базирани на категории. Що се отнася до заявките за обхват, няма нужда от използване на сканиране на пълна таблица, тъй като веднага се премества в последващия дял, като по този начин пропуска всички останали дялове.

38) Посочете размерите на SMALLINT, BYTEINT и INTEGER.

SMALLINT - 2 байта - 16 хапки -> -32768 до 32767

BYTEINT - 1 байт - 8 бита -> -128 до 127

INTEGER - 4 байта - 32 бита -> -2,147,483,648 до 2,147,483,647

39) Какво се разбира под план за най-малко разходи?

Планът с най-ниски разходи основно се изпълнява за по-малко време по най-краткия път.

40) Подчертайте разликите между базата данни и потребителя в Teradata.

  • Базата данни е основно пасивна, докато потребителят е активен.
  • Базата данни съхранява предимно всички обекти на базата данни, докато потребителят може да съхранява всеки обект, независимо дали това е макрос, таблица, изглед и т.н.
  • Базата данни няма парола, докато потребителят трябва да въведе парола.

41) Маркирайте разликите между първичен ключ и първичен индекс.

  • Първичният индекс е доста задължителен, докато Първичният ключ е по избор.
  • Първичният индекс има ограничение от 64 таблици / колони, докато Първичният ключ няма никакво ограничение.
  • Първичният индекс позволява дублирания и нули, докато първичният ключ не.
  • Първичният индекс е физически механизъм, докато Първичният ключ е чисто логичен механизъм.

42) Обяснете как се използва пространството на макарата.

Пространството на макарата в Teradata се използва основно за изпълнение на заявки. От общото пространство, което се предлага в Teradata, 20% от пространството е основно разпределено за макара.

43) Подчертайте необходимостта от настройка на производителността.

Настройката на производителността в Teradata се извършва основно, за да се идентифицират всички тесни места и след това да се разрешат.

44) Коментирайте дали затруднението е грешка или не.

Технически, тесните места не са форма на грешка, но със сигурност причиняват известно забавяне в системата.

45) Как могат да бъдат идентифицирани тесните места?

По принцип има четири начина за идентифициране на пречка. Това са: -

  • Визуално обяснение на Teradata
  • Обяснете модификатора на заявката
  • Teradata Manager
  • Монитор на производителността

46) Какво се разбира под план с най-високи разходи?

Според плана за най-високи разходи времето, необходимо за изпълнение на процеса, е повече и отнема най-дългия възможен път.

47) Маркирайте всички режими, които присъстват под Ниво на доверие.

Ниско, Не, Високо и Присъединяване са четирите режима, които се намират под Нивото на доверие.

48) Назовете петте фази, които попадат в помощната програма MultiLoad.

Предварителна фаза, DML фаза, фаза на събиране на данни, фаза на приложение и крайна фаза.

49) Подчертайте ограниченията на помощната програма TPUMP.

Следват ограниченията на полезността TPUMP: -

  • Не можем да използваме оператор SELECT.
  • Файловете с данни не могат да бъдат обединени.
  • Не се поддържат агрегирани и експоненциални оператори.
  • Аритметичните функции не могат да се поддържат.

50) В BTEQ как се задават параметрите на сесиен режим?

.set сесия транзакция BTET -> Режим на транзакция Teradata

.set сесия транзакция ANSI -> режим ANSI

Тези команди ще работят само когато са въведени преди влизане в сесията.