никулец Што се невронски мрежи? - Обединете се.АИ
Поврзете се со нас
Мастеркласа за вештачка интелигенција:

АИ 101 година

Што се невронски мрежи?

mm
Ажурирани on

Што се вештачки невронски мрежи (АНН)?

Многу од најголемите достигнувања во вештачката интелигенција се управувано од вештачки невронски мрежи. Вештачките невронски мрежи (АНН) се поврзување на математички функции споени заедно во формат инспириран од невронските мрежи пронајдени во човечкиот мозок. Овие ANN се способни да извлекуваат сложени обрасци од податоци, применувајќи ги овие шеми на невидени податоци за да ги класифицираат/препознаваат податоците. На овој начин, машината „учи“. Тоа е брз преглед на невронските мрежи, но ајде да ги разгледаме подетално невронските мрежи за подобро да разбереме што се тие и како функционираат.

Објаснет повеќеслоен перцептрон

Пред да погледнеме во посложени невронски мрежи, ќе одвоиме малку време да погледнеме едноставна верзија на ANN, повеќеслоен перцептрон (MLP).

Замислете лента за склопување во фабрика. На оваа склопувачка линија, еден работник добива ставка, прави некои прилагодувања на него и потоа го предава на следниот работник во линијата кој го прави истото. Овој процес продолжува се додека последниот работник во редот не ги стави завршните работи на артиклот и го стави на појас што ќе го извади од фабриката. Во оваа аналогија, има повеќе „слоеви“ до склопната линија, а производите се движат помеѓу слоевите додека се движат од работник до работник. Склопната линија има и влезна и излезна точка.

Повеќеслојниот перцептрон може да се замисли како многу едноставна производна линија, направена од вкупно три слоја: влезен слој, скриен слој и излезен слој. Влезниот слој е местото каде што податоците се внесуваат во MLP, а во скриениот слој одреден број „работници“ се справуваат со податоците пред да ги пренесат на излезниот слој кој го дава производот на надворешниот свет. Во примерот на MLP, овие работници се нарекуваат „неврони“ (или понекогаш јазли) и кога ракуваат со податоците тие манипулираат со нив преку серија математички функции.

Во рамките на мрежата, постојат структури кои поврзуваат јазол со јазол наречени „тежини“. Тежините се претпоставка за тоа како точките на податоци се поврзани додека се движат низ мрежата. Поинаку кажано, тежините го одразуваат нивото на влијание што еден неврон го има врз друг неврон. Тежините минуваат низ „функција за активирање“ додека го напуштаат тековниот јазол, што е тип на математичка функција што ги трансформира податоците. Тие ги трансформираат линеарните податоци во нелинеарни претстави, што и овозможува на мрежата да анализира сложени обрасци.

Аналогијата со човечкиот мозок што ја подразбира „вештачката невронска мрежа“ доаѓа од фактот дека невроните што го сочинуваат човечкиот мозок се споени заедно на сличен начин како што се поврзани јазлите во ANN.

Додека повеќеслојните перцептрони постојат од 1940-тите, постоеја голем број ограничувања што ги спречија да бидат особено корисни. Меѓутоа, во текот на изминатите неколку децении, техника наречена „назад размножување“ беше создаден што им овозможи на мрежите да ги приспособат тежините на невроните и со тоа да учат многу поефикасно. Задното ширење ги менува тежините во невронската мрежа, овозможувајќи ѝ на мрежата подобро да ги доловува вистинските обрасци во податоците.

Длабоки нервни мрежи

Длабоките невронски мрежи ја земаат основната форма на MLP и ја прават поголема со додавање на повеќе скриени слоеви во средината на моделот. Така, наместо да има влезен слој, скриен слој и излезен слој, има многу скриени слоеви во средината и излезите од еден скриен слој стануваат влезови за следниот скриен слој додека податоците не стигнат до крај. преку мрежата и се вратени.

Повеќекратните скриени слоеви на длабоката невронска мрежа се способни да интерпретираат посложени обрасци од традиционалниот повеќеслоен перцепрон. Различни слоеви на длабоката невронска мрежа ги учат моделите на различни делови од податоците. На пример, ако влезните податоци се состојат од слики, првиот дел од мрежата може да ја интерпретира осветленоста или темнината на пикселите, додека подоцнежните слоеви ќе одберат облици и рабови што може да се користат за препознавање на објекти на сликата.

Различни типови на невронски мрежи

Постојат различни типови на невронски мрежи и секој од различните типови на невронски мрежи има свои предности и недостатоци (а со тоа и свои случаи на употреба). Типот на длабока невронска мрежа опишан погоре е најчестиот тип на невронска мрежа и честопати се нарекува невронска мрежа со повратна информација.

Една варијација на невронските мрежи е Рекурентната невронска мрежа (RNN). Во случај на повторливи невронски мрежи, механизмите за вртење се користат за задржување на информации од претходните состојби на анализа, што значи дека тие можат да интерпретираат податоци каде што е важен редоследот. RNN се корисни за изведување шеми од секвенцијални/хронолошки податоци. Рекурентните невронски мрежи можат да бидат или еднонасочни или двонасочни. Во случај на двонасочна невронска мрежа, мрежата може да земе информации од подоцна во низата, како и од претходните делови од низата. Бидејќи двонасочниот RNN зема повеќе информации предвид, подобро е да се извлечат вистинските обрасци од податоците.

Конволутивната невронска мрежа е посебен тип на невронска мрежа која е вешти во интерпретирање на обрасците пронајдени во сликите. CNN работи со поминување на филтер преку пикселите на сликата и постигнување нумеричка репрезентација на пикселите во сликата, кои потоа може да ги анализира за шеми. Ен-Ен е структуриран така што конволуционите слоеви кои ги извлекуваат пикселите од сликата доаѓаат прво, а потоа доаѓаат густо поврзаните слоеви за повлекување напред, оние кои всушност ќе научат да препознаваат објекти, доаѓаат по ова.

Блогер и програмер со специјалитети во Машинско учење Длабоко учење теми. Даниел се надева дека ќе им помогне на другите да ја искористат моќта на вештачката интелигенција за општествено добро.