От 10 години насам изкуственият интелект постоянно присъства в живота ни, като се почне от смартфоните с речево разпознаване и автоматичните преводи на гугъл и се свърши с чат-ботовете по разните сайтове за електронна търговия. Вездесъщността на изкуствения интелект създава усещането, че всички са наясно с анатомията му, но дали наистина е така? Дали всички са наясно с връзката между понятията „изкуствен интелект”, „невронни мрежи” и „дълбочинно обучение”, които често срещаме заедно?
Трите понятия могат да бъдат обединени в едно изречение ето така: дълбочинното обучение е новото име на един не чак толкова нов подход към изкуствения интелект, познат като невронни мрежи.
Ако все още звучи мъгляво, ето малко история: за пръв път за невронни мрежи става дума в далечната 1944 г. Заслугата е на Уорън Макълоу и Уолтър Питс от Чикагския университет, които впоследствие (през 1952) се преместват в Масачузетския технологичен институт, за да основат първия в света отдел за когнитивни науки. Макълоу и Питс се заемат да докажат, че човешкият мозък може да се възприеме като изчислително устройство и че човешките невронни мрежи де факто вършат същата изчислителна работа, която вършат и кибернетичните машини. Тоест, в началото става дума повече за невронаука, за изследване дейността на мозъка и неговите функции посредством емулиране на тази дейност от машини, отколкото обратното – за компютърна наука, която се развива въз основа на познанията в друга област – невронауката.
Така, чрез наблюдения на човешката невроанатомия, на трасетата и правилата за регулиране и обработка на информация от мозъка, както и чрез опити за машинно възпроизвеждане на човешките характеристики, през 1957 г. се стига до първата демонстрация на невронна мрежа от психолога на Корнелския университет Франк Розенблат, наречена Perceptron.
Вече е ставало дума как чрез невронните мрежи компютърът се обучава да изпълнява някаква задача и че това обучение се състои в анализиране на примери, подбрани и етикирани ръчно. Благодарение на хиляди изображения на коли, например, етикирани като „коли”, машината успява да си създаде представа за това що е то „кола” и да я разпознае.
В Perceptron това се случва по елементарен начин – в един слой възли, разположен между два други слоя – един входен слой, през който постъпват данните, и един – за изходния резултат. Данните се движат само в една посока, но тъй като отделен възел от невронния слой може да бъде свързан с няколко точки от слоя над него, броят комбинации е значителен. Този брой входящи връзки на даден възел се обозначава с число, наречено „тегло“. Когато мрежата е активна, всеки един възел получава от всяка от връзките различни данни с различни стойности, които биват умножени по съответното тегло. След това получените стойности се събират и се получава една стойност, която, ако е под някакъв предварително зададен праг, възелът не предава данни нататък. Perceptron е първата невронна мрежа, ползваща стойностите за „тежест” и „праг”, но поради нейната елементарност е и доста неефективна; факт е обаче, че през 1969 г. се появява междинна област, обединяваща компютърната наука и невронауката в обща дисциплина, а заслугата за това е на математиците от Масачузетския институт Марвин Мински и Сиймор Папърт, които създават първата Лаборатория за изкуствен интелект.
И все пак, кое предизвика бума в развитието на невронните мрежи през последното десетилетие? Предизвика го нуждата на игровата индустрия от по-мощен хардуер. Появиха се графичните процесори (graphics processing unit – GPU). Това е един-единствен чип, който побира хиляди относително прости изчислителни ядра, чиято архитектура твърде напомня тази на невронните мрежи. Така, ако през 60-те един графичен процесор би съдържал един слой невронна мрежа, а през 80-те два или три слоя, то днес говорим за десетки слоеве мрежи и това е, което определя и дълбочината на обучението всъщност.
И ако тепърва не предстои еуфорията от превръщането на смартфоните ни в „интелигентни телефони“, остават актуални и някои тревоги, свързани с непрозрачността на невронните мрежи, заложени в интелигентността им, както и опасението, че изкуственият интелект, ако и да не е в състояние да измести човека от всички сфери на дейност, съвсем в състояние е да се освободи от неговия контрол.