Разлика между дълбокото обучение и машинното обучение срещу AI

Съдържание:

Anonim

Какво е AI?

AI (Изкуствен интелект) е клон на компютърните науки, в който машините се програмират и им се дава когнитивна способност да мислят и имитират действия като хора и животни. Бенчмаркът за ИИ е човешката интелигентност по отношение на разсъждения, реч, учене, виждане и решаване на проблеми, което е далеч в бъдещето.

AI има три различни нива:

  1. Тесен AI : Казва се, че изкуственият интелект е тесен, когато машината може да изпълнява определена задача по-добре от човек. Настоящите изследвания на AI са тук сега
  2. Общи AI : Изкуственият интелект достига общото състояние, когато може да изпълнява всяка интелектуална задача със същото ниво на точност, както би го направил човек
  3. Активен ИИ : ИИ е активен, когато може да победи хората в много задачи

Ранните системи с ИИ са използвали съвпадение на шаблони и експертни системи.

Преглед на системата за изкуствен интелект

В този урок ще научите -

  • Какво е AI?
  • Какво е ML?
  • Какво е дълбоко обучение?
  • Процес на машинно обучение
  • Процес на дълбоко обучение
  • Автоматизирайте извличането на функции с помощта на DL
  • Разлика между машинно обучение и дълбоко обучение
  • Кога да използвам ML или DL?

Какво е ML?

ML (Machine Learning) е вид ИИ, при който компютърът е обучен да автоматизира задачи, които са изчерпателни или невъзможни за хората. Това е най-добрият инструмент за анализ, разбиране и идентифициране на модели в данните въз основа на изучаването на компютърни алгоритми. Машинното обучение може да взема решения с минимална човешка намеса.

Сравнявайки изкуствения интелект с машинното обучение, машинното обучение използва данни за захранване на алгоритъм, който може да разбере връзката между входа и изхода. Когато машината завърши обучението, тя може да предскаже стойността или класа на нова точка от данни.

Какво е дълбоко обучение?

Дълбокото обучение е компютърен софтуер, който имитира мрежата от неврони в мозъка. Това е подмножество на машинното обучение и се нарича дълбоко обучение, защото използва дълбоки невронни мрежи. Машината използва различни слоеве, за да се учи от данните. Дълбочината на модела се представя от броя на слоевете в модела. Дълбокото обучение е новото състояние на техниката по отношение на AI. При дълбокото обучение фазата на обучение се извършва чрез невронна мрежа. Невронната мрежа е архитектура, при която слоевете са подредени един върху друг

Процес на машинно обучение

Представете си, че имате за цел да изградите програма, която разпознава обекти. За да обучите модела, ще използвате класификатор . Класификаторът използва характеристиките на обект, за да опита да идентифицира класа, към който принадлежи.

В примера класификаторът ще бъде обучен да открива дали изображението е:

  • Велосипед
  • Лодка
  • Кола
  • Самолет

Четирите обекта по-горе са класът, който класификаторът трябва да разпознае. За да създадете класификатор, трябва да имате някои данни като вход и да му присвоите етикет. Алгоритъмът ще вземе тези данни, ще намери модел и след това ще ги класифицира в съответния клас.

Тази задача се нарича контролирано обучение. При контролирано обучение данните за обучение, които подавате към алгоритъма, включват етикет.

Обучението на алгоритъм изисква да се следват няколко стандартни стъпки:

  • Съберете данните
  • Обучете класификатора
  • Правете прогнози

Първата стъпка е необходима, изборът на правилните данни ще направи алгоритъма успешен или неуспешен. Данните, които сте избрали за обучение на модела, се наричат функция. В обектния пример характеристиките са пикселите на изображенията.

Всяко изображение е ред в данните, докато всеки пиксел е колона. Ако вашето изображение е с размер 28x28, наборът от данни съдържа 784 колони (28x28). На снимката по-долу всяка снимка е трансформирана във векторен елемент. Етикетът казва на компютъра какъв обект е в изображението.

Процес на машинно обучение

Целта е да се използват тези данни за обучение, за да се класифицира вида на обекта. Първата стъпка се състои от създаване на колони с характеристики. След това втората стъпка включва избор на алгоритъм за обучение на модела. Когато обучението е завършено, моделът ще предскаже каква картина съответства на какъв обект.

След това е лесно да се използва моделът за предсказване на нови изображения. За всяко ново изображение, подавано в модела, машината ще предскаже класа, към който принадлежи. Например изцяло ново изображение без етикет преминава през модела. За човек е тривиално визуализирането на образа като кола. Машината използва предишните си познания, за да предскаже, както и изображението е кола.

Процес на дълбоко обучение

При дълбокото обучение фазата на обучение се извършва чрез невронна мрежа. Невронната мрежа е архитектура, при която слоевете са подредени един върху друг.

Помислете за същия пример за изображение по-горе. Комплектът за обучение ще бъде подаден към невронна мрежа

Всеки вход влиза в неврон и се умножава по тежест. Резултатът от умножението преминава към следващия слой и се превръща във вход. Този процес се повтаря за всеки слой от мрежата. Крайният слой се нарича изходен слой; тя предоставя действителна стойност за задачата за регресия и вероятност за всеки клас за задачата за класификация. Невронната мрежа използва математически алгоритъм за актуализиране на теглата на всички неврони. Невронната мрежа е напълно обучена, когато стойността на теглата дава резултат, близък до реалността. Например, добре обучена невронна мрежа може да разпознае обекта на снимка с по-висока точност от традиционната невронна мрежа.

Процес на дълбоко обучение

Автоматизирайте извличането на функции с помощта на DL

Наборът от данни може да съдържа десетина до стотици функции. Системата ще се учи от значението на тези функции. Не всички функции обаче имат значение за алгоритъма. Важна част от машинното обучение е да се намери подходящ набор от функции, които да накарат системата да научи нещо.

Един от начините за изпълнение на тази част в машинното обучение е да се използва извличане на функции. Извличането на характеристики комбинира съществуващи функции, за да създаде по-подходящ набор от функции. Това може да се направи с PCA, T-SNE или други алгоритми за намаляване на размерите.

Например при обработка на изображение, практикуващият трябва да извлече характеристиката ръчно в изображението, като очите, носа, устните и т.н. Тези извлечени характеристики се подават към класификационния модел.

Дълбокото учене решава този проблем, особено за една конволюционна невронна мрежа. Първият слой на невронната мрежа ще научи малки детайли от картината; следващите слоеве ще комбинират предишните знания, за да направят по-сложна информация. В конволюционната невронна мрежа извличането на характеристиките се извършва с помощта на филтъра. Мрежата прилага филтър към картината, за да види дали има съвпадение, т.е. формата на елемента е идентична с част от изображението. Ако има съвпадение, мрежата ще използва този филтър. Следователно процесът на извличане на функции се извършва автоматично.

Традиционно машинно обучение срещу дълбоко обучение

Разлика между машинно обучение и дълбоко обучение

По-долу е дадена ключова разлика между дълбокото обучение и машинното обучение

Машинно обучение

Дълбоко обучение

Зависимости от данни

Отлични изпълнения на малък / среден набор от данни

Отлично представяне на голям набор от данни

Хардуерни зависимости

Работете на машина от нисък клас.

Изисква мощна машина, за предпочитане с GPU: DL извършва значително количество умножение на матрица

Техническа характеристика

Трябва да разберете характеристиките, които представляват данните

Няма нужда да разбирате най-добрата характеристика, която представя данните

Време за изпълнение

От няколко минути до часове

До седмици. Невронната мрежа трябва да изчисли значителен брой тегла

Интерпретативност

Някои алгоритми са лесни за интерпретация (логистика, дърво за вземане на решения), други са почти невъзможни (SVM, XGBoost)

Трудно до невъзможно

Кога да използвам ML или DL?

В таблицата по-долу обобщаваме разликата между машинното обучение и дълбокото обучение с примери.

Машинно обучение Дълбоко обучение
Набор от данни за обучение Малък Голям
Изберете функции Да Не
Брой алгоритми Много Малцина
Време за тренировка Къс Дълго

При машинното обучение ви трябват по-малко данни за обучение на алгоритъма, отколкото дълбокото обучение. Дълбокото обучение изисква обширен и разнообразен набор от данни, за да се идентифицира основната структура. Освен това машинното обучение осигурява по-бързо обучен модел. Най-модерната архитектура за дълбоко обучение може да отнеме дни до седмица за обучение. Предимството на дълбокото обучение пред машинното е, че то е много точно. Не е нужно да разбирате кои характеристики са най-доброто представяне на данните; невронната мрежа се научи как да избира критични характеристики. В машинното обучение трябва да изберете сами какви функции да включите в модела.

Обобщение

Изкуственият интелект придава когнитивна способност на машината. Сравнявайки изкуствения интелект с машинното обучение, ранните системи за изкуствен интелект използваха съвпадение на модели и експертни системи

Идеята на машинното обучение е, че машината може да учи без човешка намеса. Машината трябва да намери начин да се научи как да реши задача, като се имат предвид данните.

Дълбокото обучение е пробивът в областта на изкуствения интелект. Когато има достатъчно данни за обучение, дълбокото обучение постига впечатляващи резултати, особено за разпознаване на изображения и превод на текст. Основната причина е, че извличането на характеристиките се извършва автоматично в различните слоеве на мрежата.