Какво е контролирано машинно обучение?
В контролираното обучение вие обучавате машината, като използвате данни, които са добре „етикетирани “. Това означава, че някои данни вече са маркирани с верния отговор. Може да се сравни с обучението, което се извършва в присъствието на ръководител или учител.
Наблюдаваният алгоритъм на обучение се учи от обозначени данни за обучение, помага ви да предскажете резултатите за непредвидени данни.
Успешното изграждане, мащабиране и внедряване на точни контролирани модели за машинно обучение отнема време и технически опит от екип от висококвалифицирани специалисти по данни. Освен това ученият за данни трябва да възстанови моделите, за да се увери, че дадената информация остава вярна, докато данните му не се променят.
В този урок ще научите:
- Какво е контролирано машинно обучение?
- Как работи контролираното обучение
- Видове контролирани алгоритми за машинно обучение
- Техники на машинно обучение, контролирани срещу ненаблюдавани
- Предизвикателства в контролираното машинно обучение
- Предимства на контролираното обучение:
- Недостатъци на контролираното обучение
- Най-добри практики за контролирано обучение
Как работи контролираното обучение
Например искате да обучите машина, която да ви помогне да предскажете колко време ще ви отнеме да се приберете от работното си място. Тук започвате със създаването на набор от етикетирани данни. Тези данни включват
- Метеорологични условия
- Час на деня
- Почивни дни
Всички тези подробности са вашите данни. Резултатът е времето, необходимо за пътуване до дома в конкретния ден.
Вие инстинктивно знаете, че ако навън вали, тогава ще ви отнеме повече време да се приберете вкъщи. Но машината се нуждае от данни и статистика.
Нека да видим сега как можете да разработите контролиран модел на обучение от този пример, който помага на потребителя да определи времето за пътуване до работното място. Първото нещо, което трябва да създадете, е комплект за обучение. Този тренировъчен комплект ще съдържа общото време за пътуване до работното място и съответните фактори като времето, времето и т.н. Въз основа на този тренировъчен комплект, вашата машина може да види, че има пряка връзка между количеството дъжд и времето, което ще отделите за вкъщи.
Така той установява, че колкото повече вали, толкова по-дълго ще карате, за да се върнете в дома си. Той може също така да вижда връзката между времето, когато напускате работа, и времето, когато ще бъдете на път.
Колкото по-близо сте до 18 часа, толкова по-дълго е необходимо да се приберете вкъщи. Вашето устройство може да намери някои от връзките с вашите етикетирани данни.
Това е началото на вашия модел на данни. Започва да влияе как дъждът влияе върху начина, по който хората шофират. Също така започва да се вижда, че повече хора пътуват през определен период от деня.
Видове контролирани алгоритми за машинно обучение
Регресия:
Техниката на регресия предсказва единична изходна стойност, използвайки данни за обучение.
Пример : Можете да използвате регресия, за да предскажете цената на къщата от данните за обучение. Входните променливи ще бъдат местоположение, размер на къща и т.н.
Силни страни : Резултатите винаги имат вероятностна интерпретация и алгоритъмът може да бъде регулиран, за да се избегне прекалено подходящо.
Слабости : Логистичната регресия може да се окаже недостатъчна, когато има множество или нелинейни граници на решения. Този метод не е гъвкав, така че не улавя по-сложни взаимоотношения.
Логистична регресия:
Метод на логистична регресия, използван за оценка на дискретни стойности въз основа на даден набор от независими променливи. Той ви помага да предскажете вероятността за настъпване на събитие чрез приспособяване на данни към логит функция. Следователно тя е известна и като логистична регресия. Тъй като прогнозира вероятността, изходната му стойност е между 0 и 1.
Ето няколко вида алгоритми за регресия
Класификация:
Класификация означава групиране на изхода в клас. Ако алгоритъмът се опитва да обозначи въвеждането в два различни класа, това се нарича двоична класификация. Изборът между повече от два класа се нарича многокласова класификация.
Пример : Определяне дали някой ще бъде неизпълнител на кредита или не.
Силни страни : Класификационното дърво се представя много добре на практика
Слабости : Неограничени, отделни дървета са склонни към пренастройване.
Ето няколко типа алгоритми за класификация
Класификатори на наивния Байес
Наивният байесов модел (NBN) е лесен за изграждане и много полезен за големи масиви от данни. Този метод е съставен от директни ациклични графики с един родител и няколко деца. Той предполага независимост между дъщерни възли, отделени от родителя си.
Дървета за вземане на решения
Дърветата за решения класифицират екземпляра, като ги сортират въз основа на стойността на характеристиката. При този метод всеки режим е характеристиката на екземпляр. Тя трябва да бъде класифицирана и всеки клон представлява стойност, която възелът може да приеме. Това е широко използвана техника за класификация. При този метод класификацията е дърво, което е известно като дърво за вземане на решения.
Помага ви да изчислите реалните стойности (разходи за закупуване на автомобил, брой обаждания, общи месечни продажби и т.н.).
Поддръжка на векторна машина
Поддържаща векторна машина (SVM) е вид учебен алгоритъм, разработен през 1990 г. Този метод се основава на резултати от статистическата теория на обучението, въведена от Vap Nik.
SVM машините също са тясно свързани с функциите на ядрото, което е централна концепция за повечето учебни задачи. Рамката на ядрото и SVM се използват в различни области. Той включва извличане на мултимедийна информация, биоинформатика и разпознаване на образци.
Техники на машинно обучение, контролирани срещу ненаблюдавани
Базиран на | Техника на машинно обучение под наблюдение | Техника на машинно обучение без надзор |
Входни данни | Алгоритмите се обучават с помощта на етикетирани данни. | Алгоритмите се използват срещу данни, които не са етикетирани |
Изчислителна сложност | Ученото под наблюдение е по-прост метод. | Ученето без надзор е изчислително сложно |
Точност | Изключително точен и надежден метод. | По-малко точен и надежден метод. |
Предизвикателства в контролираното машинно обучение
Ето предизвикателствата, пред които е изправено машинното обучение под наблюдение:
- Неподходящата функция за въвеждане на настоящите данни за обучение може да даде неточни резултати
- Подготовката и предварителната обработка на данни винаги е предизвикателство.
- Точността страда, когато е невъзможно, малко вероятно и като данни за обучение са въведени непълни стойности
- Ако съответният експерт не е на разположение, тогава другият подход е „груба сила“. Това означава, че трябва да мислите, че правилните характеристики (входни променливи), за да тренирате машината. Може да е неточно.
Предимства на контролираното обучение:
- Контролираното обучение ви позволява да събирате данни или да създавате изходни данни от предишния опит
- Помага ви да оптимизирате критериите за ефективност, използвайки опит
- Контролираното машинно обучение ви помага да решавате различни видове реални компютърни проблеми.
Недостатъци на контролираното обучение
- Границата на решенията може да бъде претренирана, ако вашият набор за обучение, който няма примери, които искате да имате в клас
- Трябва да изберете много добри примери от всеки клас, докато обучавате класификатора.
- Класифицирането на големи данни може да бъде истинско предизвикателство.
- Обучението за контролирано обучение се нуждае от много изчислително време.
Най-добри практики за контролирано обучение
- Преди да направите каквото и да било друго, трябва да решите какъв вид данни да бъдат използвани като комплект за обучение
- Трябва да решите структурата на научената функция и алгоритъма за обучение.
- Съберете съответните резултати или от човешки експерти, или от измервания
Обобщение
- При контролирано обучение вие обучавате машината, като използвате данни, които са добре „етикетирани“.
- Искате да обучите машина, която ви помага да предскажете колко време ще ви отнеме да се приберете от работното си място е пример за контролирано обучение
- Регресията и класификацията са два вида контролирани техники за машинно обучение.
- Обучението под наблюдение е по-прост метод, докато ученето без надзор е сложен метод.
- Най-голямото предизвикателство в контролираното обучение е, че несъответстващата функция за въвеждане на настоящите данни за обучение може да даде неточни резултати.
- Основното предимство на контролираното обучение е, че ви позволява да събирате данни или да създавате изходни данни от предишния опит.
- Недостатъкът на този модел е, че границата на вземане на решения може да бъде пренапрегната, ако вашият набор за обучение няма примери, които искате да имате в клас.
- Като най-добра практика за наблюдение на обучението, първо трябва да решите какъв вид данни да се използват като набор от обучения.