Hive Create, Alter & Пуснете таблица

Съдържание:

Anonim

В този урок можете да наблюдавате операции с таблици като създаване, промяна и пускане на таблици в Hive.

В скрийншота по-долу създаваме таблица с колони и променяме името на таблицата.

1. Създаване на таблица guru_sample с две имена на колони като "empid" и "empname"

2. Показване на таблици, присъстващи в базата данни guru99

3. Показване на Guru_sample под таблици

4. Промяна на таблица "guru_sample" като "guru_sampleNew"

5. Отново, когато изпълните командата "show", тя ще покаже новото име Guru_sampleNew

Dropping table guru_sampleNew:

Видове таблици и тяхното използване:

Достигането до таблици е точно като начина, по който създаваме в традиционните релационни бази данни. Функциите като филтриране, обединения могат да се извършват на таблиците.

Hive се занимава с два типа структури на таблици като Вътрешни и Външни таблици в зависимост от зареждането и дизайна на схемата в Hive.

Вътрешни маси

  • Вътрешната таблица е тясно свързана по природа. В този тип таблици първо трябва да създадем таблица и да заредим данните.
  • Можем да го наречем като данни на схема .
  • Чрез отпадане на тази таблица и данните, и схемата ще бъдат премахнати.
  • Съхраненото местоположение на тази таблица ще бъде в / user / hive / warehouse.

Кога да изберете вътрешна таблица:

  • Ако данните за обработка са налични в локалната файлова система
  • Ако искаме Hive да управлява пълния жизнен цикъл на данните, включително изтриването

Примерен кодов фрагмент за вътрешна таблица

1. За да създадете вътрешната таблица

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Заредете данните във вътрешна таблица

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Покажете съдържанието на таблицата

 Hive>select * from guruhive_internaltable;

4. За да изпуснете вътрешната таблица

 Hive>DROP TABLE guruhive_internaltable;

Ако сте изпуснали guruhive_internaltable, включително неговите метаданни и данните му ще бъдат изтрити от Hive.

От следващата екранна снимка можем да наблюдаваме изхода

В горния код и от снимката на екрана правим следните неща,

  • Създайте вътрешната таблица
  • Заредете данните във вътрешна таблица
  • Покажете съдържанието на таблицата
  • За да изпуснете вътрешната таблица

Външни маси

  • Външната маса е слабо свързана по природа. Данните ще бъдат налични в HDFS. Таблицата ще се създава върху HDFS данни.
  • По друг начин можем да кажем като създаването на схема за данни .
  • По време на отпадане на таблицата тя изпуска само схема, данните ще продължат да бъдат налични в HDFS, както преди.
  • Външните таблици предоставят опция за създаване на множество схеми за данните, съхранявани в HDFS, вместо да изтриват данните всеки път, когато схемата се актуализира

Кога да изберем външна маса:

  • Ако са налице данни за обработка в HDFS
  • Полезно, когато файловете се използват извън Hive

Примерен кодов фрагмент за външна таблица

1. Създайте външна таблица

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Ако не посочваме местоположението по време на създаването на таблицата, можем да заредим данните ръчно

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Покажете съдържанието на таблицата

 Hive>select * from guruhive_external;

4. За да изпуснете вътрешната таблица

 Hive>DROP TABLE guruhive_external;

От следващата снимка на екрана можем да наблюдаваме изхода

В горния код правим следните неща

  • Създайте външната таблица
  • Заредете данните във Външна таблица
  • Покажете съдържанието на таблицата
  • Отпадане на външна маса

Разлика между вътрешните Vs външни таблици

Особеност Вътрешен Външен
Схема Данни за схема Схема за данни
Място за съхранение / usr / кошер / склад Местоположение на HDFS
Наличност на данни В локалната файлова система В рамките на HDFS