Какво е контролирано машинно обучение?
В контролираното обучение вие обучавате машината, като използвате данни, които са добре „етикетирани “. Това означава, че някои данни вече са маркирани с верния отговор. Може да се сравни с обучението, което се извършва в присъствието на ръководител или учител.
Наблюдаваният алгоритъм на обучение се учи от обозначени данни за обучение, помага ви да предскажете резултатите за непредвидени данни. Успешното изграждане, мащабиране и внедряване на точно контролирано машинно обучение Моделът на науката за данни отнема време и технически опит от екип от висококвалифицирани специалисти по данни. Освен това ученият за данни трябва да възстанови моделите, за да се увери, че дадената информация остава вярна, докато данните му не се променят.
В този урок ще научите
- Какво е контролирано машинно обучение?
- Какво представлява ученето без надзор?
- Защо контролирано обучение?
- Защо обучение без надзор?
- Как работи контролираното обучение?
- Как работи Неуправляваното обучение?
- Видове контролирани техники за машинно обучение
- Видове техники за машинно обучение без надзор
- Контролирано срещу Неконтролирано обучение
Какво представлява ученето без надзор?
Неуправляваното обучение е техника за машинно обучение, при която не е необходимо да контролирате модела. Вместо това трябва да позволите на модела да работи самостоятелно, за да открива информация. Основно се занимава с немаркирани данни.
Неуправляваните алгоритми на обучение ви позволяват да изпълнявате по-сложни задачи за обработка в сравнение с контролираното обучение. Въпреки това, ученето без надзор може да бъде по-непредсказуемо в сравнение с други методи за дълбоко учене и засилване на ученето.
Защо контролирано обучение?
- Контролираното обучение ви позволява да събирате данни или да създавате изходни данни от предишния опит.
- Помага ви да оптимизирате критериите за ефективност, използвайки опит
- Контролираното машинно обучение ви помага да решавате различни видове реални компютърни проблеми.
Защо обучение без надзор?
Ето основните причини за използването на обучение без надзор:
- Ненаблюдаваното машинно обучение открива всички видове неизвестни модели в данните.
- Методите без надзор ви помагат да намерите функции, които могат да бъдат полезни за категоризиране.
- Провежда се в реално време, така че всички входни данни да бъдат анализирани и етикетирани в присъствието на обучаеми.
- По-лесно е да получите немаркирани данни от компютър, отколкото етикетирани данни, които се нуждаят от ръчна намеса.
Как работи контролираното обучение?
Например искате да обучите машина, която да ви помогне да предскажете колко време ще ви отнеме да се приберете от работното си място. Тук започвате със създаването на набор от етикетирани данни. Тези данни включват
- Метеорологични условия
- Час на деня
- Почивни дни
Всички тези подробности са вашите данни. Резултатът е времето, необходимо за пътуване до дома в конкретния ден.
Вие инстинктивно знаете, че ако навън вали, тогава ще ви отнеме повече време да се приберете вкъщи. Но машината се нуждае от данни и статистика.
Нека да видим сега как можете да разработите контролиран модел на обучение от този пример, който помага на потребителя да определи времето за пътуване до работното място. Първото нещо, което трябва да създадете, е набор от данни за обучение. Този тренировъчен комплект ще съдържа общото време за пътуване до работното място и съответните фактори като времето, времето и т.н. Въз основа на този тренировъчен комплект, вашата машина може да види, че има пряка връзка между количеството дъжд и времето, което ще отделите за вкъщи.
Така той установява, че колкото повече вали, толкова по-дълго ще карате, за да се върнете в дома си. Той може също така да вижда връзката между времето, когато напускате работа, и времето, когато ще бъдете на път.
Колкото по-близо сте до 18 часа, толкова по-дълго време ви е необходимо да се приберете вкъщи. Вашето устройство може да намери някои от връзките с вашите етикетирани данни.
Това е началото на вашия модел на данни. Започва да влияе как дъждът влияе върху начина, по който хората шофират. Също така започва да се вижда, че повече хора пътуват през определен период от деня.
Как работи Неуправляваното обучение?
Нека вземем случая с бебе и семейното й куче.
Тя познава и идентифицира това куче. Няколко седмици по-късно семеен приятел води куче и се опитва да играе с бебето.
Бебе не е виждало това куче по-рано. Но той разпознава много характеристики (2 уши, очи, ходене на 4 крака) са като нейното домашно куче. Тя идентифицира ново животно като куче. Това е учене без надзор, където не ви учат, но се учите от данните (в случая данни за куче.) Ако това беше контролирано обучение, семейният приятел би казал на бебето, че това е куче.
Видове контролирани техники за машинно обучение
Регресия:
Техниката на регресия предсказва единична изходна стойност, използвайки данни за обучение.
Пример: Можете да използвате регресия, за да предскажете цената на къщата от данните за обучение. Входните променливи ще бъдат местоположение, размер на къща и т.н.
Класификация:
Класификация означава групиране на изхода в клас. Ако алгоритъмът се опитва да обозначи въвеждането в два различни класа, това се нарича двоична класификация. Изборът между повече от два класа се нарича многокласова класификация.
Пример : Определяне дали някой ще бъде неизпълнител на кредита или не.
Силни страни : Резултатите винаги имат вероятностна интерпретация и алгоритъмът може да бъде регулиран, за да се избегне прекалено подходящо.
Слабости : Логистичната регресия може да се окаже недостатъчна, когато има множество или нелинейни граници на решения. Този метод не е гъвкав, така че не улавя по-сложни взаимоотношения.
Видове техники за машинно обучение без надзор
Проблеми с ученето без надзор, допълнително групирани в проблеми с клъстериране и асоцииране.
Групиране
Клъстерирането е важна концепция, когато става въпрос за учене без надзор. Основно се занимава с намирането на структура или модел в колекция от некатегоризирани данни. Алгоритмите за клъстериране ще обработят вашите данни и ще намерят естествени клъстери (групи), ако те съществуват в данните. Можете също така да промените колко клъстери трябва да идентифицират вашите алгоритми. Тя ви позволява да регулирате детайлността на тези групи.
Асоциация
Правилата за асоцииране ви позволяват да установявате асоциации между обекти от данни в големи бази данни. Тази техника без надзор е за откриване на вълнуващи връзки между променливи в големи бази данни. Например хората, които купуват нов дом, най-вероятно ще купят нови мебели.
Други примери:
- Подгрупа от пациенти с рак, групирани по техните измервания на генната експресия
- Групи купувачи въз основа на тяхната история на сърфиране и покупки
- Филмова група по рейтинг, даден от зрителите на филми
Контролирано срещу Неконтролирано обучение
Параметри | Техника на машинно обучение под наблюдение | Техника на машинно обучение без надзор |
Процес | В контролиран модел на обучение ще бъдат дадени входни и изходни променливи. | В модела за учене без надзор ще бъдат дадени само входни данни |
Входни данни | Алгоритмите се обучават с помощта на етикетирани данни. | Алгоритмите се използват срещу данни, които не са етикетирани |
Използвани алгоритми | Поддържайте векторна машина, невронна мрежа, линейна и логистична регресия, случайни гори и класификационни дървета. | Неуправляваните алгоритми могат да бъдат разделени на различни категории: като клъстерни алгоритми, K-средства, йерархично групиране и т.н. |
Изчислителна сложност | Ученото под наблюдение е по-прост метод. | Ученето без надзор е изчислително сложно |
Използване на данни | Моделът на контролирано обучение използва данни за обучение, за да научи връзка между входа и резултатите. | Ученето без надзор не използва изходни данни. |
Точност на резултатите | Изключително точен и надежден метод. | По-малко точен и надежден метод. |
Учене в реално време | Методът на обучение се извършва офлайн. | Методът на обучение се осъществява в реално време. |
Брой класове | Броят на класовете е известен. | Броят на класовете не е известен. |
Основен недостатък | Класифицирането на големи данни може да бъде истинско предизвикателство в обучението под наблюдение. | Не можете да получите точна информация относно сортирането на данните и изходът като данни, използвани при обучение без надзор, е етикетиран и неизвестен. |
Обобщение
- При контролирано обучение вие обучавате машината, като използвате данни, които са добре „етикетирани“.
- Неуправляваното обучение е техника за машинно обучение, при която не е необходимо да контролирате модела.
- Контролираното обучение ви позволява да събирате данни или да създавате изходни данни от предишния опит.
- Неуправляваното машинно обучение ви помага да намерите всички видове неизвестни модели в данните.
- Например, вие ще можете да определите времето, необходимо за връщане обратно, на базата на метеорологичните условия, времето на деня и празника.
- Например, Бебе може да идентифицира други кучета въз основа на миналото контролирано обучение.
- Регресията и класификацията са два вида контролирани техники за машинно обучение.
- Клъстерирането и асоциирането са два вида учене без надзор.
- В контролиран модел на обучение ще бъдат дадени входни и изходни променливи, докато при модел на учене без надзор ще бъдат дадени само входни данни