Топ 50 въпроси за интервю за машинно обучение & Отговори

Anonim

Изтеглете PDF

1) Какво е машинно обучение?

Машинното обучение е клон на компютърните науки, който се занимава със системно програмиране, за да се учи автоматично и да се усъвършенства с опит. Например: Роботите са програмирани така, че да могат да изпълняват задачата въз основа на данните, които събират от сензори. Той автоматично учи програми от данни.

2) Споменете разликата между извличането на данни и машинното обучение?

Машинното обучение е свързано с изучаването, проектирането и разработването на алгоритмите, които дават на компютрите способността да учат, без да са изрично програмирани. Докато извличането на данни може да се определи като процес, при който неструктурираните данни се опитват да извлекат знания или неизвестни интересни модели. По време на тази машина на процеса се използват алгоритми за обучение.

3) Какво е „пренастройване“ в машинното обучение?

В машинното обучение, когато статистическият модел описва случайна грешка или шум, вместо да възникне „свръхсглобяване“ на основната връзка. Когато даден модел е прекалено сложен, обикновено се наблюдава пренастройване поради твърде много параметри по отношение на броя на типовете данни за обучение. Моделът демонстрира лошо представяне, което е прекалено добре.

4) Защо се случва свръх оборудване?

Възможността за свръхсглобяване съществува, тъй като критериите, използвани за обучение на модела, не са същите като критериите, използвани за преценка на ефикасността на модела.

5) Как можете да избегнете свръхмонтажа?

Чрез използването на много данни може да се избегне пренастройването на данни, пренастройването се случва относително, тъй като имате малък набор от данни и се опитвате да се поучите от него. Но ако имате малка база данни и сте принудени да дойдете с модел, базиран на това. В такава ситуация можете да използвате техника, известна като кръстосана проверка . При този метод наборът от данни се разделя на два раздела, набори от данни за тестване и обучение, наборът от данни за тестване ще тества само модела, докато в набора от данни за обучение точките с данни ще излязат с модела.

При тази техника на модела обикновено се дава набор от данни от известни данни, върху които се провежда обучение (набор от данни за обучение) и набор от неизвестни данни, спрямо които се тества моделът. Идеята на кръстосаното валидиране е да се определи набор от данни, който да „тества“ модела във фазата на обучение.

6) Какво е индуктивно машинно обучение?

Индуктивното машинно обучение включва процеса на учене чрез примери, когато система от набор от наблюдавани случаи се опитва да предизвика общо правило.

7) Кои са петте популярни алгоритми за машинно обучение?

  • Дървета за вземане на решения
  • Невронни мрежи (обратно разпространение)
  • Вероятностни мрежи
  • Най-близкият съсед
  • Поддържат векторни машини

8) Кои са различните техники за алгоритъм в машинното обучение?

Различните видове техники в машинното обучение са

  • Контролирано обучение
  • Учене без надзор
  • Полууправлявано обучение
  • Подсилващо обучение
  • Трансдукция
  • Да се ​​научим да учим

9) Кои са трите етапа за изграждане на хипотезите или модела в машинното обучение?

  • Изграждане на макет
  • Тестване на модел
  • Прилагане на модела

10) Какъв е стандартният подход към ученето под наблюдение?

Стандартният подход към ученето под наблюдение е да се раздели примера на набора за обучение и теста.

11) Какво е „Комплект за обучение“ и „Тестов комплект“?

В различни области на информационните науки, като машинно обучение, набор от данни се използва за откриване на потенциално предсказуемата връзка, известна като „Набор за обучение“. Комплектът за обучение е примери, дадени на учащия, докато Тестовият набор се използва за проверка на точността на хипотезите, генерирани от обучаемия, и това е наборът от примери, задържан от обучаемия. Комплектът за обучение се различава от тестовия комплект.

12) Избройте различни подходи за машинно обучение?

Различните подходи в машинното обучение са

  • Концепция Vs Класификация Обучение
  • Символично и статистическо обучение
  • Индуктивно Vs аналитично обучение

13) Какво не е машинно обучение?

  • Изкуствен интелект
  • Извод, основан на правило

14) Обяснете каква е функцията на „Ненаблюдавано обучение“?

  • Намерете клъстери от данни
  • Намерете нискоразмерни изображения на данните
  • Намерете интересни упътвания в данните
  • Интересни координати и корелации
  • Намерете нови наблюдения / почистване на база данни

15) Обяснете каква е функцията на „контролирано обучение“?

  • Класификации
  • Гласово разпознаване
  • Регресия
  • Предскажете времеви редове
  • Анотиране на низове

16) Какво е машинно обучение, независимо от алгоритъма?

Машинно обучение в случаите, когато математическите основи са независими от някакъв конкретен класификатор или алгоритъмът за обучение се нарича машинно обучение, независимо от алгоритъма?

17) Каква е разликата между изкуственото обучение и машинното обучение?

Проектирането и разработването на алгоритми според поведението въз основа на емпирични данни са известни като машинно обучение. Докато изкуственият интелект освен машинното обучение, той обхваща и други аспекти като представяне на знания, обработка на естествен език, планиране, роботика и др.

18) Какво е класификатор в машинното обучение?

Класификаторът в машинното обучение е система, която въвежда вектор от дискретни или непрекъснати стойности на характеристиките и извежда една дискретна стойност, клас.

19) Какви са предимствата на Naive Bayes?

В наивния класификатор Байес ще се сближи по-бързо от дискриминационните модели като логистична регресия, така че имате нужда от по-малко данни за обучение. Основното предимство е, че не може да научи взаимодействия между функции.

20) В кои области се използва разпознаване на образци?

Разпознаването на образци може да се използва в

  • Компютърно зрение
  • Гласово разпознаване
  • Извличане на данни
  • Статистика
  • Неформално извличане
  • Биоинформатика

21) Какво е генетично програмиране?

Генетичното програмиране е една от двете техники, използвани в машинното обучение. Моделът се основава на тестването и избора на най-добрия избор сред набор от резултати.

22) Какво представлява индуктивното логическо програмиране в машинното обучение?

Индуктивното логическо програмиране (ILP) е подполе на машинното обучение, което използва логическо програмиране, представящо базови знания и примери.

23) Какво представлява изборът на модели в машинното обучение?

Процесът на избор на модели между различни математически модели, които се използват за описване на един и същ набор от данни, е известен като Избор на модели. Изборът на модел се прилага към областите на статистиката, машинното обучение и извличането на данни.

24) Какви са двата метода, използвани за калибриране в контролирано обучение?

Двата метода, използвани за предсказване на добри вероятности в контролираното обучение са

  • Калибриране на Platt
  • Изотонична регресия

Тези методи са предназначени за двоична класификация и не са тривиални.

25) Кой метод често се използва за предотвратяване на пренапрегване?

Когато има достатъчно данни, се използва „изотонична регресия“, за да се предотврати проблем с прекаленото оборудване.

26) Каква е разликата между евристика за учене на правила и евристика за дървета на решенията?

Разликата е, че евристиката за дърветата за вземане на решения оценява средното качество на редица несвързани множества, докато учащите в правилата оценяват само качеството на множеството случаи, които са обхванати от правилото кандидат.

27) Какво представлява Perceptron в машинното обучение?

В машинното обучение Perceptron е алгоритъм за контролирана класификация на входа в един от няколкото възможни небинарни изхода.

28) Обяснете двата компонента на байесовата логическа програма?

Байесовата логическа програма се състои от два компонента. Първият компонент е логичен; той се състои от набор от Байесови клаузи, който улавя качествената структура на домейна. Вторият компонент е количествен, той кодира количествената информация за домейна.

29) Какво представляват Байесовите мрежи (BN)?

Байесовата мрежа се използва за представяне на графичния модел за вероятностна връзка между набор от променливи.

30) Защо базиран на екземпляр алгоритъм за обучение понякога се нарича алгоритъм за мързеливо обучение?

Базиран на инстанция алгоритъм също се нарича алгоритъм за мързеливо учене, тъй като те забавят процеса на индукция или обобщаване, докато се извърши класификация.

31) Кои са двата метода за класификация, с които SVM (Support Vector Machine) може да се справи?

  • Комбиниране на двоични класификатори
  • Модифициране на двоичен файл с цел включване на многокласово обучение

32) Какво е ансамбно обучение?

За да се реши конкретна изчислителна програма, стратегически се генерират и комбинират множество модели като класификатори или експерти. Този процес е известен като ансамбъл обучение.

33) Защо се използва ансамбълното обучение?

Ансамбълното обучение се използва за подобряване на класификацията, прогнозирането, сближаването на функциите и т.н. на модела.

34) Кога да се използва ансамбъл обучение?

Ансамбълното обучение се използва, когато изграждате класификатори на компоненти, които са по-точни и независими един от друг.

35) Кои са двете парадигми на ансамбълните методи?

Двете парадигми на ансамбълните методи са

  • Последователни ансамблови методи
  • Паралелни ансамблови методи

36) Какъв е основният принцип на ансамблов метод и какво представлява пакетирането и усилването на ансамблов метод?

Общият принцип на ансамблов метод е да комбинира прогнозите на няколко модела, изградени с даден учебен алгоритъм, за да се подобри устойчивостта на един модел. Багажът е метод в ансамбъл за подобряване на нестабилни схеми за оценка или класификация. Докато усилващите методи се използват последователно, за да се намали пристрастието на комбинирания модел. Повишаването и прихващането и двете могат да намалят грешките чрез намаляване на вариацията.

37) Какво е декомпозиция на отклонение-дисперсия на класификационната грешка в ансамблов метод?

Очакваната грешка на учебния алгоритъм може да бъде разложена на пристрастия и дисперсии. Терминът за пристрастие измерва колко точно средният класификатор, създаден от алгоритъма за обучение, съответства на целевата функция. Терминът на отклонението измерва до каква степен варира прогнозирането на учебния алгоритъм за различни обучителни комплекти.

38) Какво представлява алгоритъмът за допълнително обучение в ансамбъл?

Методът на допълнителното обучение е способността на алгоритъма да се учи от нови данни, които може да са налични, след като класификаторът вече е генериран от вече наличен набор от данни.

39) За какво се използват PCA, KPCA и ICA?

PCA (анализ на основните компоненти), KPCA (основен анализ на основни компоненти) и ICA (независим анализ на компонентите) са важни техники за извличане на характеристики, използвани за намаляване на размерите.

40) Какво е намаляване на измеренията в машинното обучение?

В машинното обучение и статистиката намаляването на измеренията е процесът на намаляване на броя на случайните променливи и може да бъде разделен на избор на функция и извличане на характеристика.

41) Какво представляват машините с вектор за поддръжка?

Поддържащите векторни машини са контролирани учебни алгоритми, използвани за класификация и регресионен анализ.

42) Какви са компонентите на техниките за релационна оценка?

Важните компоненти на техниките за релационна оценка са

  • Събиране на данни
  • Придобиване на истината на земята
  • Техника за кръстосано валидиране
  • Тип заявка
  • Точкуване на метрика
  • Тест за значимост

43) Какви са различните методи за последователно контролирано обучение?

Различните методи за решаване на проблеми с последователно контролирано обучение са

  • Методи с плъзгащи се прозорци
  • Повтарящи се плъзгащи се прозорци
  • Скрити модели на Маркоу
  • Максимална ентропия на модели на Markow
  • Условни случайни полета
  • Графични трансформаторни мрежи

44) Какви са областите в роботиката и обработката на информация, където възниква проблемът с последователното прогнозиране?

Областите в роботиката и обработката на информация, където възниква проблемът с последователното прогнозиране, са

  • Имитация на обучение
  • Структурирано прогнозиране
  • Учебно укрепване на базата на модел

45) Какво е пакетно статистическо обучение?

Статистическите техники за обучение позволяват изучаването на функция или предиктор от набор от наблюдавани данни, които могат да правят прогнози за невидими или бъдещи данни. Тези техники осигуряват гаранции за ефективността на научения предиктор за бъдещи невидими данни въз основа на статистическо предположение за процеса на генериране на данни.

46) Какво е PAC обучение?

PAC (вероятно приблизително правилно) обучение е рамка за обучение, която е въведена за анализ на алгоритмите за обучение и тяхната статистическа ефективност.

47) Кои са различните категории, които можете да категоризирате процеса на обучение на последователността?

  • Предсказване на последователността
  • Генериране на последователност
  • Разпознаване на последователността
  • Последователно решение

48) Какво е учене на последователност?

Последователното обучение е метод за преподаване и учене по логичен начин.

49) Кои са двете техники на машинно обучение?

Двете техники на машинното обучение са

  • Генетично програмиране
  • Индуктивно обучение
50) Дайте популярно приложение на машинното обучение, което виждате всеки ден?

Механизмът за препоръки, реализиран от големи уебсайтове за електронна търговия, използва машинно обучение.