стуб Учење под надзором у односу на учење без надзора - Уните.АИ
Повежите се са нама
АИ Мастерцласс:

АИ 101

Учење под надзором у односу на учење без надзора

mm
Ажурирано on

У машинском учењу, већина задатака се лако може категорисати у једну од две различите класе: проблеми учења под надзором или проблеми учења без надзора. У контролисаном учењу, подаци имају ознаке или класе које су им придодате, док у случају учења без надзора подаци нису означени. Хајде да пажљиво погледамо зашто је ова разлика важна и погледајмо неке од алгоритама повезаних са сваким типом учења.

Учење под надзором у односу на учење без надзора

Већина задатака машинског учења је у домену учење под надзором. У алгоритмима за учење под надзором, појединачне инстанце/тачке података у скупу података имају класу или ознаку која им је додељена. То значи да модел машинског учења може да научи да разликује које су карактеристике у корелацији са датом класом и да инжењер машинског учења може да провери перформансе модела тако што ће видети колико је инстанци правилно класификовано. Алгоритми класификације се могу користити за разазнавање многих сложених образаца, све док су подаци означени одговарајућим класама. На пример, алгоритам машинског учења може научити да разликује различите животиње једне од других на основу карактеристика као што су „бркови“, „реп“, „канџе“ итд.

За разлику од учења под надзором, учење без надзора укључује креирање модела који је у стању да издвоји обрасце из неозначених података. Другим речима, рачунар анализира улазне карактеристике и сам одређује које су најважније карактеристике и обрасци. Учење без надзора покушава да пронађе инхерентне сличности између различитих инстанци. Ако алгоритам за учење под надзором има за циљ да постави тачке података у познате класе, алгоритми за учење без надзора ће испитати карактеристике заједничке инстанцама објекта и сместити их у групе на основу ових карактеристика, стварајући у суштини сопствене класе.

Примери алгоритама за надгледано учење су линеарна регресија, логистичка регресија, К-најближи суседи, стабла одлучивања и машине вектора подршке.

У међувремену, неки примери алгоритама за учење без надзора су анализа главних компоненти и груписање К-средстава.

Алгоритам за надгледано учење

линеарна регресија је алгоритам који узима две карактеристике и исцртава однос између њих. Линеарна регресија се користи за предвиђање нумеричких вредности у односу на друге нумеричке варијабле. Линеарна регресија има једначину И = а +бКс, где је б нагиб линије, а а где и прелази Кс-осу.

Логистичка регресија је бинарни класификациони алгоритам. Алгоритам испитује однос између нумеричких карактеристика и проналази вероватноћу да се инстанца може класификовати у једну од две различите класе. Вредности вероватноће су „стиснуте“ према 0 или 1. Другим речима, јаке вероватноће ће се приближити 0.99, док ће се слабе вероватноће приближити 0.

К-најближи суседи додељује класу новим тачкама података на основу додељених класа неког изабраног броја суседа у скупу за обуку. Број суседа које алгоритам разматра је важан, а премало или превише суседа може погрешно класификовати тачке.

Стабла одлучивања су врста класификационог и регресијског алгоритма. Стабло одлучивања функционише тако што се скуп података дели на све мање и мање делове док се подскупови не могу даље делити и оно што резултира је стабло са чворовима и листовима. Чворови су места где се одлуке о тачкама података доносе коришћењем различитих критеријума филтрирања, док су листови инстанце којима је додељена нека ознака (тачка података која је класификована). Алгоритми стабла одлучивања су способни да рукују и нумеричким и категоричким подацима. У стаблу се праве поделе на одређене променљиве/карактеристике.

Подршка векторских машина су класификациони алгоритам који ради цртањем хиперравни, или линија раздвајања, између тачака података. Тачке података су подељене у класе на основу тога на којој се страни хиперравне налазе. Више хиперравнина се може нацртати преко равни, разлажући скуп података у више класа. Класификатор ће покушати да максимизира растојање између хиперравне роњења и тачака са обе стране равни, а што је већа удаљеност између линије и тачака, то је класификатор сигурнији.

Алгоритми за учење без надзора

Главни анализа компоненти је техника која се користи за смањење димензионалности, што значи да се димензионалност или сложеност података представља на једноставнији начин. Алгоритам анализе главних компоненти проналази нове димензије за податке који су ортогонални. Док је димензионалност података смањена, варијансу између података треба сачувати што је више могуће. Оно што ово значи у практичном смислу је да узима карактеристике у скупу података и разводи их на мање карактеристика које представљају већину података.

Груписање К-средстава је алгоритам који аутоматски групише тачке података у кластере на основу сличних карактеристика. Обрасци унутар скупа података се анализирају и тачке података се деле у групе на основу ових образаца. У суштини, К-меанс креира сопствене класе од неозначених података. К-Меанс алгоритам функционише тако што додељује центре кластерима, или центроидима, и помера центре док се не пронађе оптимална позиција за центре. Оптимална позиција ће бити она где је растојање између центара и околних тачака података унутар класе минимизирано. „К“ у груписању К-средстава односи се на то колико је центара изабрано.

резиме

За крај, хајде да брзо пређемо на кључне разлике између надгледано и ненадгледано учење.

Као што смо раније расправљали, у задацима учења под надзором улазни подаци су означени и број часова је познат. У међувремену, улазни подаци су неозначени, а број часова није познат у случајевима учења без надзора. Учење без надзора има тенденцију да буде рачунарски мање сложено, док надгледано учење има тенденцију да буде рачунарски сложеније. Док су резултати учења под надзором обично веома прецизни, резултати учења без надзора имају тенденцију да буду мање тачни/умерено тачни.

Блогер и програмер са специјалностима у Машинско учење Дееп Леарнинг теме. Данијел се нада да ће помоћи другима да искористе моћ вештачке интелигенције за друштвено добро.