Root NationНаписиТехнологииШто се невронски мрежи и како функционираат?

Што се невронски мрежи и како функционираат?

-

Денес ќе се обидеме да откриеме што се невронски мрежи, како функционираат и која е нивната улога во создавањето вештачка интелигенција.

Невронски мрежи. Оваа фраза ја слушаме речиси насекаде. Доаѓа до точка што ќе најдете невронски мрежи дури и во фрижидери (ова не е шега). Невралните мрежи се широко користени од алгоритми за машинско учење, кои денес можат да се најдат не само во компјутерите и паметните телефони, туку и во многу други електронски уреди, на пример, во апарати за домаќинство. И дали некогаш сте се запрашале што се овие невронски мрежи?

Не грижете се, ова нема да биде академско предавање. Има многу публикации, вклучително и на украински јазик, кои многу професионално и веродостојно го објаснуваат ова прашање во областа на точните науки. Ваквите публикации се стари повеќе од десетина години. Како е можно овие стари публикации да се сè уште релевантни? Факт е дека основите на невронските мрежи не се променети, а самиот концепт - математички модел на вештачки неврон - беше создаден за време на Втората светска војна.

Што се невронски мрежи и како функционираат?

Истото со интернетот, денешниот интернет е неспоредливо понапреден отколку кога беше испратен првиот мејл. Основите на Интернетот, основните протоколи, постоеја од самиот почеток на неговото создавање. Секој комплексен концепт е изграден врз основа на стари структури. Истото е и со нашиот мозок, најмладиот церебрален кортекс не може да функционира без најстариот еволутивен елемент: мозочното стебло, кое е во нашите глави многу постаро од постоењето на нашиот вид на оваа планета.

Дали те збунив малку? Значи, ајде да разбереме подетално.

Исто така интересно: ChatGPT: Едноставни упатства за употреба

Што се невронски мрежи?

Мрежата е збир на одредени елементи. Ова е наједноставниот пристап во математиката, физиката или технологијата. Ако компјутерската мрежа е збир на меѓусебно поврзани компјутери, тогаш невронската мрежа е очигледно збир на неврони.

невронска мрежа

Сепак, овие елементи не се ни оддалеку споредливи по сложеност со нервните клетки на нашиот мозок и нервен систем, но на одредено ниво на апстракција, некои карактеристики на вештачки неврон и биолошки неврон се вообичаени. Но, неопходно е да се запамети дека вештачкиот неврон е многу поедноставен концепт од неговиот биолошки колега, за кој сè уште не знаеме сè.

- Реклама -

Прочитајте исто така: 7 најкул употреби на ChatGPT

Прво имаше вештачки неврон

Првиот математички модел на вештачки неврон беше развиен во 1943 година (да, тоа не е грешка, за време на Втората светска војна) од двајца американски научници, Ворен МекКалок и Волтер Питс. Тие успеаја да го направат тоа врз основа на интердисциплинарен пристап, комбинирајќи основни знаења за физиологијата на мозокот (сетете се на времето кога беше создаден овој модел), математиката и тогаш младиот ИТ пристап (тие ја користеа, меѓу другото, теоријата за пресметливост на Алан Туринг ). Моделот на вештачки неврон McCulloch-Pitts е многу едноставен модел, има многу влезови, каде што влезните информации минуваат низ тежини (параметри), чии вредности го одредуваат однесувањето на невронот. Резултирачкиот резултат се испраќа до еден излез (види дијаграм на невронот МекКалох-Питс).

невронска мрежа
Шема на вештачки неврон 1. Неврони чии излезни сигнали се влезни во влезот на даден неврон 2. Собирач на влезни сигнали 3. Калкулатор за преносна функција 4. Неврони на чии влезови се применува сигналот на даден неврон 5. ωi — тежини на влезните сигнали

Таквата структура слична на дрво е поврзана со биолошки неврон, бидејќи кога размислуваме за цртежи кои прикажуваат биолошки нервни клетки, на ум ни паѓа карактеристичната структура на дендритите слична на дрво. Сепак, не треба да се подлегнува на илузијата дека вештачкиот неврон е барем малку блиску до вистинска нервна клетка. Овие двајца истражувачи, авторите на првиот вештачки неврон, успеаја да покажат дека секоја пресметлива функција може да се пресмета со помош на мрежа од меѓусебно поврзани неврони. Сепак, да потсетиме дека овие први концепти беа создадени само како идеи кои постоеја само „на хартија“ и немаа вистинска интерпретација во форма на опрема за работа.

Прочитајте исто така: За квантните компјутери со едноставни зборови

Од модел до иновативни имплементации

Мекалок и Питс развија теоретски модел, но создавањето на првата вистинска невронска мрежа мораше да почека повеќе од десет години. Неговиот креатор се смета за уште еден пионер на истражувањето на вештачката интелигенција, Френк Розенблат, кој во 1957 година ја создаде мрежата Mark I Perceptron, а вие самите покажавте дека благодарение на оваа структура, машината стекнала способност претходно својствена само за животните и луѓето: може да научи. Меѓутоа, сега знаеме дека всушност имало и други научници кои дошле до идеја дека машината може да учи, вклучително и пред Розенблат.

Mark I Перцептрон

Многу истражувачи и пионери на компјутерската наука во 1950-тите дојдоа до идеја како да направат машина да го прави она што не може да го направи сама. На пример, Артур Семјуел разви програма која играше дама со човек, Ален Њуел и Херберт Сајмон создадоа програма која може самостојно да докажува математички теореми. Уште пред создавањето на првата невронска мрежа на Розенблат, двајца други пионери на истражување во областа на вештачката интелигенција, Марвин Мински и Дин Едмондс, во 1952 година, односно дури и пред појавата на перцептронот на Розенблат, изградија машина наречена SNARC (Stochastic Neural Калкулатор за аналогно засилување) - стохастичко засилување на нервниот аналоген калкулатор, кој според многумина е првиот компјутер со стохастичка невронска мрежа. Треба да се напомене дека SNARC немаше никаква врска со современите компјутери.

SNARC

Моќната машина, користејќи повеќе од 3000 електронски цевки и резервен механизам за автопилот од бомбардер Б-24, успеа да симулира работа на 40 неврони, што се покажа како доволно за математички симулирање на потрагата на стаорец за излез од лавиринтот. . Се разбира, немаше стаорец, тоа беше само процес на дедукција и наоѓање на оптимално решение. Овој автомобил беше дел од докторатот на Марвин Мински.

адалинска мрежа

Друг интересен проект во областа на невронските мрежи беше мрежата ADALINE, развиена во 1960 година од Бернард Витроу. Така, може да се постави прашањето: бидејќи пред повеќе од половина век истражувачите ги знаеја теоретските основи на невронските мрежи, па дури и ги создадоа првите работни имплементации на такви пресметковни рамки, зошто беше потребно толку долго време, до 21 век, да се креирајте вистински решенија базирани на невронски мрежи? Одговорот е еден: недоволна компјутерска моќ, но тоа не беше единствената пречка.

невронска мрежа

Иако во 1950-тите и 1960-тите, многу пионери на вештачката интелигенција беа фасцинирани од можностите на невронските мрежи, а некои од нив предвидуваа дека машински еквивалент на човечкиот мозок е оддалечен само десет години. Ова е дури и смешно да се чита денес, бидејќи сè уште не сме ни приближиле да создадеме машински еквивалент на човечкиот мозок, а сè уште сме далеку од решавање на оваа задача. Брзо стана јасно дека логиката на првите невронски мрежи е и фасцинантна и ограничена. Првите имплементации на вештачката интелигенција користејќи вештачки неврони и алгоритми за машинско учење беа во можност да решат одреден тесен опсег на задачи.

Меѓутоа, кога станува збор за пошироки простори и решавање на нешто навистина сериозно, како што се препознавање шаблони и слики, симултан превод, препознавање говор и ракопис итн., односно работи што компјутерите и вештачката интелигенција веќе можат да ги прават денес, се покажа дека првите имплементации на невронски мрежи едноставно не беа во можност да го сторат тоа. Зошто е ова така? Одговорот го даде истражувањето на Марвин Мински (да, истото од SNARC) и Сејмур Пејперт, кои во 1969 година ги докажаа ограничувањата на логиката на перцептронот и покажаа дека зголемувањето на можностите на едноставните невронски мрежи исклучиво поради скалирање не функционира. Имаше уште една, но многу важна бариера - компјутерската моќ што беше достапна во тоа време беше премногу мала за невронските мрежи да се користат како што беше наменето.

Исто така интересно:

- Реклама -

Ренесанса на невронски мрежи

Во 1970-тите и 1980-тите, невронските мрежи беа практично заборавени. Дури на крајот на минатиот век достапната компјутерска моќ стана толку голема што луѓето почнаа да се враќаат на неа и да ги развиваат своите способности на ова поле. Тогаш се појавија нови функции и алгоритми, способни да ги надминат ограничувањата на првите наједноставни невронски мрежи. Тогаш се појави идејата за длабоко машинско учење на повеќеслојни невронски мрежи. Што всушност се случува со овие слоеви? Денес, речиси сите корисни невронски мрежи кои работат во нашата средина се повеќеслојни. Имаме влезен слој чија задача е да прима влезни податоци и параметри (тежини). Бројот на овие параметри варира во зависност од сложеноста на пресметковниот проблем што треба да го реши мрежата.

невронска мрежа

Покрај тоа, имаме и таканаречени „скриени слоеви“ - тука се случува целата „магија“ поврзана со длабокото машинско учење. Токму скриените слоеви се одговорни за способноста на оваа невронска мрежа да ги научи и да ги изврши потребните пресметки. Конечно, последниот елемент е излезниот слој, односно слојот на невронската мрежа што го дава посакуваниот резултат, во овој случај: препознаен ракопис, лице, глас, формирана слика врз основа на текстуалниот опис, резултат од томографска анализа на дијагностичката слика и многу повеќе.

Прочитајте исто така: Го тестирав и интервјуирав четботот на Бинг

Како учат невронските мрежи?

Како што веќе знаеме, поединечните неврони во невронските мрежи обработуваат информации со помош на параметри (тежини), на кои им се доделуваат индивидуални вредности и врски. Овие тежини се менуваат во текот на процесот на учење, што ви овозможува да ја прилагодите структурата на оваа мрежа на таков начин што ќе го генерира посакуваниот резултат. Како точно учи мрежата? Очигледно е, мора постојано да се тренира. Немојте да бидете изненадени од оваа изрека. И ние учиме, а овој процес не е хаотичен, туку уреден, да речеме. Ние го нарекуваме образование. Во секој случај, може да се обучуваат и невронски мрежи, а тоа обично се прави со користење на соодветно избрано збир на влезови, што на некој начин ја подготвува мрежата за задачите што ќе ги извршува во иднина. И сето тоа се повторува чекор по чекор, понекогаш процесот на учење до одреден степен наликува на самиот процес на обука.

На пример, ако задачата на оваа невронска мрежа е да препознава лица, таа е претходно обучена на голем број слики што содржат лица. Во процесот на учење се менуваат тежините и параметрите на скриените слоеви. Експертите овде ја користат фразата „минимизирање на функцијата на трошоците“. Функција на трошоци е количина која ни кажува колку одредена невронска мрежа прави грешки. Колку повеќе можеме да ја минимизираме функцијата на трошоците како резултат на обуката, толку подобро ќе функционира оваа невронска мрежа во реалниот свет. Најважната карактеристика што ја разликува секоја невронска мрежа од задача програмирана со користење на класичен алгоритам е тоа што, во случајот со класичните алгоритми, програмерот мора чекор по чекор да дизајнира какви дејства ќе изврши програмата. Во случај на невронски мрежи, самата мрежа е способна сама да научи правилно да ги извршува задачите. И никој не знае точно како сложена невронска мрежа ги извршува своите пресметки.

невронска мрежа

Денес, невронските мрежи се користат нашироко и, можеби изненадувачки, многу често без да се разбере како всушност функционира пресметковниот процес во дадена мрежа. Нема потреба за ова. Програмерите користат готови невронски мрежи научени од машина, кои се подготвени за влезни податоци од одреден тип, ги обработуваат на начин познат само за нив и го даваат посакуваниот резултат. Програмерот не треба да знае како функционира процесот на заклучување во невронската мрежа. Односно, едно лице останува настрана од голем обем на пресметки, метод за добивање информации и нивна обработка со невронски мрежи. Од каде произлегуваат одредени стравови на човештвото во однос на моделите на вештачка интелигенција. Едноставно се плашиме дека еден ден невронската мрежа ќе си постави одредена задача и самостојно, без помош од човек, ќе најде начини да ја реши. Ова го загрижува човештвото, предизвикува страв и недоверба во користењето на алгоритмите за машинско учење.

разговор gpt

Овој утилитарен пристап е вообичаен денес. Така е и кај нас: знаеме да обучиме некого за одредена активност и знаеме дека процесот на обука ќе биде ефективен ако се работи правилно. Едно лице ќе ги стекне саканите вештини. Но, дали разбираме точно како се одвива процесот на дедукција во неговиот мозок, што го предизвика овој ефект? Немаме поим.

Задачата на научниците е да ги проучуваат овие проблеми што е можно повеќе, за тие да ни служат и да ни помогнат таму каде што е потребно, и што е најважно, да не станат закана. Како луѓе, се плашиме од она што не го знаеме.

Исто така интересно: 

Yuri Svitlyk
Yuri Svitlyk
Син на Карпатите, непризнаен гениј на математиката, „адвокат“Microsoft, практичен алтруист, лево-десно
- Реклама -
Пријавете се
Известете за
гостин

0 коментари
Вградени критики
Прикажи ги сите коментари
Претплатете се за ажурирања