стуб Шта је машинско учење? - Уните.АИ
Повежите се са нама
АИ Мастерцласс:

АИ 101

Шта је машинско учење?

mm
Ажурирано on

Машинско учење је једно од најбрже растућих технолошких области, али упркос томе колико се често користе речи „машинско учење“, може бити тешко разумети шта је тачно машинско учење.

Машинско учење не односи се само на једну ствар, то је кровни термин који се може применити на много различитих концепата и техника. Разумевање машинског учења значи познавање различитих облика анализе модела, варијабли и алгоритама. Хајде да пажљиво погледамо машинско учење да бисмо боље разумели шта оно обухвата.

Шта је машинско учење?

Иако се термин машинско учење може применити на много различитих ствари, генерално, термин се односи на омогућавање рачунару да извршава задатке без добијања експлицитних инструкција ред по ред да то уради. Специјалиста за машинско учење не мора да напише све кораке неопходне за решавање проблема јер је рачунар способан да „учи“ анализирајући обрасце унутар података и генерализујући те обрасце на нове податке.

Системи машинског учења имају три основна дела:

  • Улази
  • Алгоритми
  • Излази

Улази су подаци који се уносе у систем машинског учења, а улазни подаци се могу поделити на ознаке и карактеристике. Карактеристике су релевантне варијабле, варијабле које ће бити анализиране да би се научили обрасци и извукли закључци. У међувремену, ознаке су класе/описи дати појединачним инстанцама података.

Карактеристике и ознаке се могу користити у два различита типа проблема машинског учења: учење под надзором и учење без надзора.

Учење без надзора наспрам надгледаног учења

In учење под надзором, улазне податке прати основна истина. Проблеми са надгледаним учењем имају исправне излазне вредности као део скупа података, тако да су очекиване класе познате унапред. Ово омогућава научнику за податке да провери перформансе алгоритма тако што ће тестирати податке на скупу података теста и видети који проценат ставки је исправно класификован.

У супротности, учење без надзора проблеми немају основне ознаке истине за њих. Алгоритам за машинско учење обучен за обављање задатака учења без надзора мора бити у стању да за себе закључи релевантне обрасце у подацима.

Алгоритми за надгледано учење се обично користе за проблеме класификације, где постоји велики скуп података попуњен инстанцама које се морају сортирати у једну од многих различитих класа. Други тип надгледаног учења је задатак регресије, где је вредност коју алгоритам даје континуирано уместо категоричке.

У међувремену, алгоритми учења без надзора се користе за задатке као што су процена густине, груписање и учење репрезентације. Ова три задатка захтевају модел машинског учења да би закључили структуру података, нема унапред дефинисаних класа датих моделу.

Хајде да укратко погледамо неке од најчешћих алгоритама који се користе и у учењу без надзора и у учењу под надзором.

Врсте учења под надзором

Уобичајени алгоритми учења под надзором укључују:

  • Наивни Баиес
  • Подршка векторских машина
  • Логистичка регресија
  • Случајне шуме
  • Вештачке неуронске мреже

Подршка векторских машина су алгоритми који деле скуп података у различите класе. Тачке података су груписане у кластере цртањем линија које раздвајају класе једна од друге. Тачке које се налазе на једној страни праве припадаће једној класи, док су тачке на другој страни праве другој класи. Машине вектора подршке имају за циљ да максимизирају растојање између праве и тачака које се налазе на обе стране праве, а што је већа раздаљина, то је класификатор сигурнији да тачка припада једној, а не другој класи.

Логистичка регресија је алгоритам који се користи у задацима бинарне класификације када тачке података треба класификовати као да припадају једној од две класе. Логистичка регресија функционише тако што означава тачку података са 1 или са 0. Ако је перципирана вредност тачке података 0.49 или нижа, она се класификује као 0, док ако је 0.5 или више класификује се као 1.

Алгоритми стабла одлучивања функционишу тако што деле скупове података на све мање и мање фрагменте. Тачан критеријум који се користи за поделу података зависи од инжењера машинског учења, али циљ је да се подаци на крају поделе на појединачне тачке података, које ће затим бити класификоване помоћу кључа.

Алгоритам случајне шуме је у суштини много појединачних класификатора стабла одлука повезаних заједно у моћнији класификатор.

Наивни Бајесов класификатор израчунава вероватноћу да се дата тачка догодила на основу вероватноће да се догоди претходни догађај. Заснован је на Бајесовој теореми и ставља тачке података у класе на основу њихове израчунате вероватноће. Приликом имплементације наивног Бајесовог класификатора, претпоставља се да сви предиктори имају исти утицај на исход класе.

An Вештачка неуронска мрежа, или вишеслојни перцептрон, су алгоритми за машинско учење инспирисани структуром и функцијом људског мозга. Вештачке неуронске мреже су добиле име по чињеници да су направљене од много чворова/неурона повезаних заједно. Сваки неурон манипулише подацима помоћу математичке функције. У вештачким неуронским мрежама постоје улазни слојеви, скривени слојеви и излазни слојеви.

Скривени слој неуронске мреже је место где се подаци заправо тумаче и анализирају за обрасце. Другим речима, то је место где алгоритам учи. Више неурона спојених заједно чини сложеније мреже способне да уче сложеније обрасце.

Врсте учења без надзора

Алгоритми за учење без надзора укључују:

  • К-значи груписање
  • Аутоенцодерс
  • Главни анализа компоненти

К-значи груписање је техника класификације без надзора и функционише тако што раздваја тачке података у кластере или групе на основу њихових карактеристика. Груписање К-средстава анализира карактеристике које се налазе у тачкама података и разликује обрасце у њима који чине тачке података пронађене у датој класи кластера сличнијима једна другој него што су кластерима који садрже друге тачке података. Ово се постиже постављањем могућих центара за кластер, или тежишта, у граф података и додељивањем положаја тезге док се не пронађе позиција која минимизира растојање између тежишта и тачака које припадају класи те центре. Истраживач може одредити жељени број кластера.

Главни анализа компоненти је техника која смањује велики број карактеристика/променљивих на мањи простор обележја/мање обележја. „Главне компоненте“ тачака података се бирају за очување, док су остале карактеристике стиснуте у мањи приказ. Однос између оригиналних напитака података је очуван, али пошто је сложеност тачака података једноставнија, податке је лакше квантификовати и описати.

Аутоенцодерс су верзије неуронских мрежа које се могу применити на задатке учења без надзора. Аутоматски кодери су способни да узму неозначене податке слободног облика и трансформишу их у податке које неуронска мрежа може да користи, у основи креирајући сопствене означене податке за обуку. Циљ аутоенкодера је да конвертује улазне податке и поново их изгради што је прецизније могуће, тако да је у подстицају мреже да одреди које су карактеристике најважније и издвоји их.

Блогер и програмер са специјалностима у Машинско учење Дееп Леарнинг теме. Данијел се нада да ће помоћи другима да искористе моћ вештачке интелигенције за друштвено добро.