Изтеглете PDF
Следват често задавани въпроси в интервюта за по-пресни, както и опитен разработчик на HBase.
1) Обяснете какво е Hbase?
Hbase е ориентирана към колони система за управление на база данни, която работи върху HDFS (Hadoop Distribute File System). Hbase не е релационно хранилище на данни и не поддържа език за структурирани заявки като SQL.
В Hbase главен възел регулира сървърите на клъстера и региона, за да съхранява части от таблиците и управлява работата по данните.
2) Обяснете защо да използвам Hbase?
- Система за съхранение с голям капацитет
- Разпределен дизайн за обслужване на големи маси
- Магазини, ориентирани към колони
- Хоризонтално мащабируемо
- Висока производителност и наличност
- Основната цел на Hbase е милиони колони, хиляди версии и милиарди редове
- За разлика от HDFS (Hadoop Distribute File System), той поддържа CRUD операции в реално време в случаен режим
3) Споменете кои са ключовите компоненти на Hbase?
- Zookeeper: Той извършва координационната работа между клиента и Hbase Maser
- Hbase Master: Hbase Master наблюдава регионалния сървър
- RegionServer: RegionServer наблюдава региона
- Регион: Той съдържа в хранилището за данни (MemStore) и Hfile.
- Каталожни таблици: Каталожните таблици се състоят от ROOT и META
4) Обяснете от какво се състои Hbase?
- Hbase се състои от набор от таблици
- И всяка таблица съдържа редове и колони като традиционната база данни
- Всяка таблица трябва да съдържа елемент, дефиниран като първичен ключ
- Колоната Hbase означава атрибут на обект
5) Споменете колко оперативни команди в Hbase?
Оперативната команда в Hbases е около пет вида
- Вземете
- Слагам
- Изтрий
- Сканиране
- Прирастване
6) Обяснете какво е WAL и Hlog в Hbase?
WAL (Write Ahead Log) е подобен на MySQL BIN дневник; той записва всички промени, настъпили в данните. Това е стандартен пореден файл от Hadoop и той съхранява HLogkey. Тези ключове се състоят от последователен номер, както и от действителни данни и се използват за повторно възпроизвеждане на все още несъхранявани данни след срив на сървъра. Така че, в брой при неуспех на сървъра, WAL работи като спасителна линия и извлича загубените данни.
7) Кога трябва да използвате Hbase?
- Размерът на данните е огромен: Когато имате тонове и милиони записи, за да работите
- Пълно редизайн: Когато премествате RDBMS в Hbase, вие го смятате за цялостен редизайн, след което просто променяте портовете
- Команди без SQL: Имате няколко функции като транзакции; вътрешни съединения, набрани колони и др.
- Инвестиции в инфраструктура: Трябва да имате достатъчно клъстер, за да бъде Hbase наистина полезен
8) В Hbase какво е семейство колони?
Семействата колони включват основната единица физическо съхранение в Hbase, към която се прилагат функции като компресии.
9) Обяснете какво е ключът на реда?
Ред ключът се дефинира от приложението. Тъй като комбинираният ключ е предварително фиксиран от rowkey, той позволява на приложението да дефинира желания ред на сортиране. Той също така позволява логическо групиране на клетки и се уверете, че всички клетки с един и същи ключ са разположени съвместно на един и същ сървър.
10) Обяснете изтриването в Hbase? Споменете кои са трите типа надгробни маркери в Hbase?
Когато изтриете клетката в Hbase, данните всъщност не се изтриват, а се поставя маркер за надгробен камък, което прави изтритите клетки невидими. Изтритите Hbase всъщност се премахват по време на уплътняването.
Има три вида надгробни камъни:
- Маркер за изтриване на версия: За изтриване той маркира една версия на колона
- Маркер за изтриване на колона: За изтриване той маркира всички версии на колона
- Маркер за семейно изтриване: За изтриване той маркира всички колони за семейство колони
11) Обяснете как всъщност Hbase изтрива ред?
В Hbase, каквото и да пишете, ще се съхранява от RAM на диск, тези записи на дискове са неизменни уплътнения на забраните. По време на процеса на изтриване в Hbase, основният процес на уплътняване изтрива маркера, докато малките уплътнения не. При нормални изтривания това води до изтриване на надгробен паметник - тези данни за изтриване, които представляват, се премахват по време на уплътняването.
Също така, ако изтриете данни и добавите повече данни, но с по-ранен времеви отпечатък от времевия печат на надгробния камък, допълнителните Gets могат да бъдат маскирани от маркера за изтриване / надгробен камък и следователно ще получите вмъкнатата стойност едва след основното уплътняване.
12) Обяснете какво се случва, ако промените размера на блока на семейство колони във вече заета база данни?
Когато промените размера на блока на семейството колони, новите данни заемат новия размер на блока, докато старите данни остават в рамките на стария размер на блока. По време на уплътняването на данните старите данни ще вземат новия размер на блока. Новите файлове при изчистването им имат нов размер на блока, докато съществуващите данни ще продължат да се четат правилно. Всички данни трябва да се трансформират в новия размер на блока след следващото голямо уплътняване.
13) Споменете разликата между Hbase и релационната база данни?
Hbase | Релационна база данни |
|
|
14) Какво е HBaseFsck клас?
Има име на инструмент, наречено обратно, е налично в HBase, което е внедрено от класа HBaseFsck. Той предлага няколко превключватели на командния ред, които влияят на поведението му.
15) Кои са основните ключови структури на HBase?
Ключът на реда и ключът на колоната са двете най-важни ключови структури, използвани в HBase
16) Обсъдете как можете да използвате филтри в Apache HBase
Филтри в черупката на HBase. Той е въведен в Apache HBase 0.92, който ви помага да провеждате филтриране от страна на сървъра за достъп до HBase през HBase черупка или пестеливост.
17) Синтаксисна структура за поддръжка на HBase като SQL да или не?
Не, за съжаление, в момента не се предлага поддръжка на SQL за HBase. Въпреки това, използвайки Apache Phoenix, можем да извлечем данни от HBase чрез SQL заявки.
18) Какво е значението на уплътняването в HBase?
По време на интензивни входящи записи е невъзможно да се постигне оптимална производителност чрез наличието на един файл на магазин. HBase ви помага да комбинирате всички тези HFiles, за да намалите броя на дисковите семена за всяко четене. Този процес е известен като уплътняване в HBase.
19) Как ще внедрите присъединявания в HBase?
HBase, не поддържа директно присъединяване, но използва MapReduce задания заявки за присъединяване могат да бъдат реализирани чрез извличане на данни с помощта на различни HBase таблици.
20) Обяснете JMX относно HBSE
Разширенията за управление на Java или JMX е експортно състояние на Java приложенията е стандарт за тях.
21) Каква е ползата от MasterServer?
Master sever ви помага да присвоите регион и на регионалния сървър. Също така ви помага да се справите с балансирането на товара, който използваме MasterServer.
22) Определете термина пестеливост
Apache Thrift е написан на C ++. Той осигурява компилатори на схеми за различни езици за програмиране като C ++, Perl, PHP, Python, Ruby и др.
23) Защо да използвам клас HColumnDescriptor?
Подробностите относно семейството колони, като например настройките за компресиране, Брой версии, се съхраняват .in HColumnDescriptor.
24) Какво представлява клетката в HBase?
Клетка в HBase е най-малката единица от Hbase таблица. Помага ви да съхранявате част от данните под формата на кортеж {ред, колона, версия}
25) Какво е филтър Bloom?
HBase поддържа Bloom Filter ви помага да подобрите общата производителност на клъстера. HBase Bloom Filter е космически ефективен механизъм за тестване дали HFile включва определен ред или ред-col клетка.
26) Разкажете ми за видовете операции с HBase?
Отговор. Два вида HBase операции са:
- Прочетете Операция
- Пишете операция
27) Каква е ползата от HBase HMaster?
Основните отговорности на капитана са:
- Координиране на регионалните сървъри
- Администраторски функции
28) Коя техника можете да използвате в HBase за директен достъп до HFile без помощта на HBase?
За директен достъп до HFile, без да използваме HBase, използваме метода HFile.main ().
29) Може ли регионалният сървър да бъде разположен на всички DataNodes?
Да, регионалните сървъри се изпълняват на същите сървъри като DataNodes
30) Назовете филтъра, който приема размера на страницата като параметър в HBase
Филтър с име PageFilter приема размера на страницата като параметър.
Този документ е съставен с инструментите за незабавен конвертор на HTML.
- Следващия