Разделяне на хиперравнини за класификация

ТЕОРИЯ ЗА МАШИННОТО ОБУЧЕНИЕ

Разделяне на хиперравнини за класификация

Произходът на Deep Learning и Support Vector Machines

Процедурата за разделяне на хиперравнини изгражда линейни граници на решения, които изрично се опитват да разделят данните в различни класове възможно най-добре. С тях ще дефинираме класификатора на опорния вектор.

Понякога LDA и логистичната регресия, обяснена в предишната публикация, правят грешки, които могат да бъдат избегнати, това може да бъде разрешено чрез следните методи.

Перцептронът на Розенблат

Този алгоритъм е предшественик на съвременния напредък в дълбокото обучение, той се опитва да намери разделяща хиперравнина чрез минимизиране на разстоянието на грешно класифицираните точки до границата на решението. Целта е да се сведе до минимум следната функция:

където Mиндексира набора от неправилно класифицирани точки. Количеството е неотрицателно и пропорционално на разстоянието между грешно класифицираните точки до границата на решение, дефинирана от β^T x + β0 = 0.Ако приемем, че M е фиксиран, градиентът се дава от:

Алгоритъмът използва стохастичен градиентен низход, за да минимизира частично линейния критерий. Това означава, че изчисляваме една стъпка в посоката на отрицателния градиент след всяка входна стойност, вместо да я изчисляваме след обработката на всички данни. Следователно стойностите на грешно класифицираните данни се посещават в определена последователност и βсе актуализират като:

където p е скоростта на обучение, която трябва да бъде избрана в зависимост от данните. Ако има отделимо решение за хиперравнина, този алгоритъм се сближава с него, но има някои проблеми:

Когато данните са разделими, има много решения и това, което е намерено, зависи от началната стойност.
Крайният брой стъпки за намиране на решението може да бъде огромен. Колкото по-малка е разликата между класовете, толкова по-дълго е времето за намирането му.
Когато данните не могат да се разделят, алгоритъмът няма да се сближи и ще започне да преминава през възможни оптимуми.

Чрез създаване на базови функции и увеличаване на оригиналното пространство можем да решим втората точка и чрез добавяне на ограничения към данните можем да решим първата точка.

Оптимални разделящи хиперравнини, поддържащи векторни класификатори

Оптималната разделителна хиперравнина разделя двата класа и максимизира разстоянията до затварящата точка от всеки клас. С тях можем да постигнем уникално решение чрез максимизиране на разликата между двата класа.

Проблемът с оптимизацията е:

С условията гарантираме, че всички точки са поне на разстояние M от границата на решението. Можем да се отървем от ограничението ||β||=1използвайки като условие:

Тъй като за всяко βи β0задоволяване на тези неравенства, всяко положително мащабирано кратно също ги удовлетворява, така че можем задайте ||β||= 1/M.

След това използваме функцията LaGrange, за да решим проблема с минимизирането:

Задаване на производните на 0:

Като ги извадим от Lp, получаваме дуала на Улф:

Чрез максимизиране на L_D ние намираме решението и трябва да удовлетворим условията на Karush-Khun-Tucker.

Сега можем да кажем това

Векторът на решението се дефинира, като се използват само стойностите, които са в лабораторията за вземане на решения, които се дефинират като опорни точки.

Заключение

Използвайки само стойностите на лабораторията за вземане на решения, решението е по-стабилно за грешна спецификация на модела. Сравнете с предишните обяснени модели, по-добре е, когато данните не са гаусови. Ако е Гаус, LDA ще бъде по-бърз и ще работи по-добре.

Когато данните не могат да се разделят, няма осъществим модел, можете да опитате да увеличите пространството, като използвате базови трансформации, но това може да доведе до проблеми с пренастройването.

Това е тридесет и осмата публикация от моя конкретен #100daysofML, ще публикувам напредъка на това предизвикателство в GitHub, Twitter и Medium (Adrià Serra).

https://twitter.com/CrunchyML

Вижте също:

Нови материали

Записване на грешки — Как да записвате грешки във вашето приложение, за да ги отстраните по-късно

Записването на грешки е важна част от „обработването на грешки“. Накратко, когато възникнат определени грешки в програмите, вие искате да знаете за това. Това е особено важно при грешки. Ти..

Кратко въведение в теорията на графите

Кратко въведение в теорията на графите Втора част: внедряване на python на пълни графики В моята предишна статия въведох три основни концепции за графите: върхове, ръбове и тегла. В тази..

Днес ще пиша за машинно обучение. Смятам се за ентусиаст, а не за експерт, така че имайте това предвид. С това казано, искам...

Днес ще пиша за машинно обучение. Смятам се за ентусиаст, а не за експерт, така че имайте това предвид. С това казано искам да обясня защо машинното обучение има значение. За да бъда съвсем..

Какво е структурно типизиране и как Typescript го използва в своя полза?

Всички знаят тези дни, че „Typescript е строго синтактично надмножество на JavaScript и добавя незадължително статично въвеждане към езика.“. Но какво всъщност означава? Защо миграцията от..

3 начина за премахване на дубликати от масив в Javascript

Вие сте уеб разработчик? Програмист ли си? Тогава ще сте запознати с JavaScript и различните му вградени функции, методи и т.н. за различни реализации, проблеми и цели. Един от тези широко..

Архитектура и обучение на конволюционни невронни мрежи (7 точки):

Тази публикация предоставя подробности за архитектурата на Конволюционната невронна мрежа (CNN), функциите и обучението на всеки слой, завършвайки с резюме на обучението на CNN...

Създайте разширение за Chrome с помощта на Angular

Този урок е базиран на манифеста на разширението на chrome версия 3 (MV3), а също и на Angular версия 2+ (2, 3 и...). Ако не сте използвали манифест версия 3, можете да следвате този урок ,..

Етикети

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Coding Python Deep Learning AI React Java Software Engineering Computer Science Algorithms Typescript Nodejs Data Development Programming Languages Computer Vision Productivity Learning To Code Neural Networks Reactjs Front End Development NLP Tech Angular ChatGPT Business Mathematics API Tutorial Javascript Tips CSS Statistics Big Data