В този урок можете да наблюдавате операции с таблици като създаване, промяна и пускане на таблици в Hive.
В скрийншота по-долу създаваме таблица с колони и променяме името на таблицата.
1. Създаване на таблица guru_sample с две имена на колони като "empid" и "empname"
2. Показване на таблици, присъстващи в базата данни guru99
3. Показване на Guru_sample под таблици
4. Промяна на таблица "guru_sample" като "guru_sampleNew"
5. Отново, когато изпълните командата "show", тя ще покаже новото име Guru_sampleNew
Dropping table guru_sampleNew:
Видове таблици и тяхното използване:
Достигането до таблици е точно като начина, по който създаваме в традиционните релационни бази данни. Функциите като филтриране, обединения могат да се извършват на таблиците.
Hive се занимава с два типа структури на таблици като Вътрешни и Външни таблици в зависимост от зареждането и дизайна на схемата в Hive.
Вътрешни маси
- Вътрешната таблица е тясно свързана по природа. В този тип таблици първо трябва да създадем таблица и да заредим данните.
- Можем да го наречем като данни на схема .
- Чрез отпадане на тази таблица и данните, и схемата ще бъдат премахнати.
- Съхраненото местоположение на тази таблица ще бъде в / user / hive / warehouse.
Кога да изберете вътрешна таблица:
- Ако данните за обработка са налични в локалната файлова система
- Ако искаме Hive да управлява пълния жизнен цикъл на данните, включително изтриването
Примерен кодов фрагмент за вътрешна таблица
1. За да създадете вътрешната таблица
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Заредете данните във вътрешна таблица
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Покажете съдържанието на таблицата
Hive>select * from guruhive_internaltable;
4. За да изпуснете вътрешната таблица
Hive>DROP TABLE guruhive_internaltable;
Ако сте изпуснали guruhive_internaltable, включително неговите метаданни и данните му ще бъдат изтрити от Hive.
От следващата екранна снимка можем да наблюдаваме изхода
В горния код и от снимката на екрана правим следните неща,
- Създайте вътрешната таблица
- Заредете данните във вътрешна таблица
- Покажете съдържанието на таблицата
- За да изпуснете вътрешната таблица
Външни маси
- Външната маса е слабо свързана по природа. Данните ще бъдат налични в HDFS. Таблицата ще се създава върху HDFS данни.
- По друг начин можем да кажем като създаването на схема за данни .
- По време на отпадане на таблицата тя изпуска само схема, данните ще продължат да бъдат налични в HDFS, както преди.
- Външните таблици предоставят опция за създаване на множество схеми за данните, съхранявани в HDFS, вместо да изтриват данните всеки път, когато схемата се актуализира
Кога да изберем външна маса:
- Ако са налице данни за обработка в HDFS
- Полезно, когато файловете се използват извън Hive
Примерен кодов фрагмент за външна таблица
1. Създайте външна таблица
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Ако не посочваме местоположението по време на създаването на таблицата, можем да заредим данните ръчно
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Покажете съдържанието на таблицата
Hive>select * from guruhive_external;
4. За да изпуснете вътрешната таблица
Hive>DROP TABLE guruhive_external;
От следващата снимка на екрана можем да наблюдаваме изхода
В горния код правим следните неща
- Създайте външната таблица
- Заредете данните във Външна таблица
- Покажете съдържанието на таблицата
- Отпадане на външна маса
Разлика между вътрешните Vs външни таблици
Особеност | Вътрешен | Външен |
---|---|---|
Схема | Данни за схема | Схема за данни |
Място за съхранение | / usr / кошер / склад | Местоположение на HDFS |
Наличност на данни | В локалната файлова система | В рамките на HDFS |