През последните тридесет години на изкуствения интелект бе посветено разработването на цял спектър от методи, опиращи се и на математиката, и на новата компютърна архитектура. Тези методи бяха вдъхновени от процесите в зрителния кортекс на мозъка и от технологичния прогрес (свързан с огромни бази данни, бързо увеличаване на извършваните операции).
Днес непрекъснато увеличаващите се нови методи и важността на резултатите са толкова впечатляващи (по отношение на зрението, разпознаването на речта, поставянето на медицинска диагноза, извършването на автоматичен превод…), че някои изследователи смятат за основателно да говорят за нова наука (или по-скоро, технонаука), за машинно обучение. Въпреки това, все още с неохота се говори за използването на изкуствения интелект най-вече заради ограничените възможности резултатите да бъдат разтълкувани, обяснени, интерпретирани. Нашето изследване има за цел да се обсъдят етичните и политическите въпроси, повдигани от този непознат технонаучен пробив в науката.
Жан-Мишел Кантор
През пролетта на 1946 г. Джон фон Нойман, един от ученитe на ХХ век, направил невероятен брой открития в различни сфери, като математиката, квантовата физика, теорията на множествата и др., е попитан от свой приятел:
– Каква е целта на изследванията ти? Предполагам, че вече нямаш интерес към математика. Подочух, че освен за бомби, за друго вече не мислиш…
– Дълбоко грешиш, приятелю. Мисля за нещо по-важно от бомбите. Мисля за компютри.
И наистина – предизвиканите от изкуствения интелект (ИИ) развития през последните двадесет години, дълбоките промени в организацията на обществото, в средствата за масова информация, в индустрията и технологиите – потвърждават, ако това изобщо е необходимо, колко прав е бил Джон фон Нойман в пророческото си убеждение.
Днес това е повече от мода, повече от свръхинтересна тема за медиите – „хайп“, както казват англосаксонците. Това е истинска, сериозна трансформация в нашите общества.
Изкуствен интелект; deep learning – „дълбоко обучение“[1]; machine learning, „машинно обучение“. Тези словосъчетания се появяват в най-разнообразни ситуации, оправдават създаването на произведения на изкуството, обхващат действия като политически маркетингови операции, включително и най-невероятни проекти, достойни за трансхуманистични научнофантастични сценарии.
Въпросът е можем ли да развием критичен поглед, без да се съобразяваме с това колко големи са безспорните успехи на изкуствения интелект в сферата на науката, техниката, индустрията?
Нека първо да ви представим основните „действащи лица“: реалните числа и цифровите технологии, после гигантските информационни обеми (представени с числа), big data („големите данни“), а не на последно място – агентите на изкуствения интелект: ИТ инструментите.
За да разберем по-добре значението им, трябва да се запознаем с историята на изкуствения интелект през последните тридесет години, с неочакваното нахлуване на употребата на невронни мрежи.
Гръцките философи са мислили числото като принцип на вселената – нагласа, която накратко може да се обобщи с възклицанието на Питагор „Всичко е число!“. По-късно Евклидовото разделение между число и геометрия е сравнявано с разделението на функциите на двете мозъчни полукълба (трудовете на Пол Брока от 1870 г.). Въпреки че днес се оспорва, това сближаване продължава да играе роля в изследванията върху интелекта, независимо дали той е изкуствен или не.
А изкуственият интелект?
Официалната история на Изкуствения интелект започва с конгреса в Дартмут през 1956 г., на който около двадесетина специалисти се обединяват около фигури, като известния американски информатик и изследовател Джон Маккарти и когнитивния учен Марвин Мински (от Масачузетския технологичен институт). Те дават името на новото поле, като се конкурират с кибернетиката на Норберт Винер, който е американски математик и логик.
Във връзка с прочутите дебати между Ноам Чомски и Жан Пиаже за усвояването на езика – обсъждания, водени през 1975 г., младият френски учен и информатик Ян Лекун научава за машина, способна да учи. Това е Perceptron – машина, изобретена през 1957 г. от психолога от Корнелския университет Франк Розенблат.
Това е стартовият сигнал, който дава началото на Изкуствения интелект, въпреки критичното проучване от 1969 г. на Марвин Мински и Сеймор Пейпърт, което води до временно изоставяне на изследванията в тази сфера. След период на застой, настъпва период на много бързо развитие от началото на 80-те години и на мястото на Perceptron се появяват изследвания за скритите слоеве неврони.
От този момент нататък множество фактори стимулират изключително големия напредък: и това са увеличаването на мощността на машините като обемен капацитет и изчислителна мощност, а освен това въвеждането на прости нелинейни оператори в нови системни архитектури; многослойните изкуствени неврони; елементарните структури за пресмятане, които бяха подредени в последователни слоеве, черпейки вдъхновение от изследванията върху най-добре познатата част от мозъка; структурата на йерархичния слой на невроните, намиращи се в зрителния кортекс в мозъка на човека – откритие на британския невролог Дейвид Мар, доразвивано от още няколко изследователи през 80-те години на ХХ век и след това.
Другият съществен напредък, познат още през 70-те години, се състои в последователно подобряване на ефективността на невронната мрежа чрез коригиране на теглото на връзките между невроните в зависимост от всяка грешка. Това се прави благодарение на една идея, вдъхновена от математиката, от един алгоритъм за обратно разпространение на грешката.
Можем да проведем следния експеримент: deep learning – така нареченото „дълбоко обучение“, дава възможност да се разпознават лица. Ние взимаме лице, което е женско, но системата погрешно го определя като мъжко. Тази грешка води до преконфигуриране на мрежата според известния вече алгоритъм за обратно разпространение на грешката, който коригира определени връзки с цел подобряване на резултатите.
След като направим хиляди повторения на операциите с вече заявените снимки, стигаме до момент, в който системата разпознава женски и мъжки лица също толкова добре, колкото би го направило и едно човешко същество.
Именно този процес се състои в подобряване на параметрите на невронната мрежа чрез множество последователни тестове, извършени от машина, без този процес да може да се контролира от човек (като при същностния принцип на „черната кутия“). Той е наречен машинно обучение. Твърди се, че този процес може да бъде контролиран, когато човек знае първоначалните данни, или засилван, когато се предпочитат изборите, които машината прави, когато дава правилните отговори.
При този напредък има два приноса, които играят важна роля:
– Компютърните методи, вдъхновени от теоремата на Томас Бейс – математическа теория, разработена от британския математик Томас Бейс (1701-1761), която определя какви са правдоподобните разсъждения при наличие на несигурност.
Нека илюстрираме тези нови инструменти с един пример от играта Го[2].
Играта Го дълго време се изплъзва от методите на изкуствения интелект, защото изглежда невъзможно да се създаде компютърен модел, който да може да победи най-добрите играчи. За отбелязване е, че през март 2016 г. машината Alpha-Go победи световния шампион в играта Го!
Няколко месеца по-късно една нова машина – AlphaGoZero, съчетаваща в себе си методи на учене, с включен контрол и подкрепа, и смесваща усъвършенствана версия на алгоритмите Монте Карло[3], печели надмощие над останалите програми за игри, като побеждава европейския шампион с пет на нула. Най-изненадващото е, че машината AlphaGoZero само в началото има интегрирани в базата си данни правилата на играта Го, а после в процеса на играта се доусъвършенства.
Днес шампионите, играещи Го, разучават партиите, играни от машината AlphaGoZero и откриват с ужас, че тя понякога прави ходове, непознати дори за най-добрите играчи, като дори не се разбира как тя е спряла избора си именно на тях. Това говори за невъзможността процесът да бъде проследен.
Изправени пред предизвикателството да овладяваме тези техники, мистериозни по своята същност, ние имаме нужда от по-голяма яснота и на първо място – от по-разбираем речник.
Езикови „ексцесии”
Експлозивният успех на изкуствения интелект доведе до появата на мистериозни изрази, твърде сложни метафори, извършващи насилие спрямо езика, злоупотребяващи с него. Вземете например словосъчетанията: изкуствен интелект, машинно обучение, невронни мрежи…
Тези думи „бръмчат” в медиите и функционират като магически формули, произвеждащи консенсус по отношение на много скали на ценностите, обхващащи математика, информатика, а и както ще видим по-нататък – и морални, и политически ценности. Не трябва да забравяме, че сред това непрестанно „бръмчене”, медиите могат да скриват неистините, представяйки ги като открития.
Всеки един от тези термини, в известна степен загадъчни, изисква семантична деконструкция, която да разкрива какво реално се крие зад завесата от метафори.
Не за първи път „научното говорене” се явява в прекия смисъл на думата експлоататор на езика. Френският математик Рене Том приписва на своя британски колега Кристофър Зиймън заслугата за част от медийния успех на теорията му на катастрофите (именно Зиймън въвежда това название на теорията). При deep learning („дълбокото обучение”) успехът му се дължи на многобройните му приложения в медицината и индустрията, но трябва да се признае, че Ян Лекун много сполучливо е избрал понятието, тъй като метафората за дълбочина препраща както към няколкото невронни слоя, така и към идеята за сериозно, задълбочено учене.
Въпросът за наименованията е важен. Той е в основата на Платоновия диалог „Кратил“, застъпен е както в романа на Умберто Еко „Името на розата“, така и във великолепните страници, в които математикът Александър Гротендик описва дългото съзряване, през което трябва да се премине, преди да се даде наименование на все още неясната математическа концепция.
За да обясни колко важен е изборът на име от политическа гледна точка, италианският писател Роберто Каласо разказва историята за мъдрия Конфуций, когото един ученик попитал какво би направил най-първо, ако му поверят да управлява определена територия.
Конфуций отговорил: „Ще нанеса корекции в наименованията”. Но дали не е прекалено късно да се правят подобни корекции при изкуствения интелект?
Какво смятате за deep learning („дълбокото обучение”)?
Тази нова архитектура на компютърните машини предлага невероятни възможности, които, както изглежда, не са свързани само с „опаковката им”, но и с интелекта, който се приближава до този на човека. В същото време, тази архитектура отговаря само на една конкретна задача, която е поставена предварително, и поради тази причина е само част от решението на проблема – част, която нито е проверима, нито е проследима.
Научната общност няма единна позиция по отношение на последните развития в сферата на машинното обучение.
На Международния математически конгрес в Рио де Жанейро (през юли 2018 г.) голям брой лекции бяха посветени на „дълбокото обучение”, включително една, изнесена от индийския професор Санджив Арора, член на изследователската програма по компютърни науки и дискретна математика към Института за съвременни изследвания в Принстън. За Санджив Арора това е нова наука, която той сравнява с момента на раждането на съвременната физика: Нютон постави основния въпрос: защо ябълките падат?
Тук въпросът може да бъде: какво се научава?
Разбира се, изразът „дълбоко обучение” и „машинно обучение” са единствено някаква форма на злоупотреба с езика. И изследванията в сферата на изкуствения интелект показват, че по никакъв начин не може да се говори за стремеж към обща теория на ученето и обучението (човешко или друго).
Санджив Арора и сътрудниците му подчертават степента на затрудненията и си обясняват това с факта, че техниките за машинно обучение все още не се възприемат от гледна точка на тяхната ефективност, а от гледна точка на тяхната стабилност (надеждност). Тези въпроси изискват теоретично задълбочаване и нови направления на изследвания. Това са предизвикателства, над които работи и Майкъл И. Джордан, професор в университета в Бъркли. Наред с други учени, той се опитва да сближи научните и техническите въпроси, както и ролята на новите инструменти в областта на хуманитарните науки.
Според Майкъл И. Джордан изкуственият интелект е все още на етап инженерен техничен проект и истинската революция при него ще настъпи едва след като се стигне до компютърно базирани процедури, при които във взаимоотношенията с машините се използва естествен език.
Сред някои от основните трудности, които могат да бъдат изброени, е и следното обстоятелство: ефективността на програмата изисква „обяснимост” – нов термин, предназначен да сигнализира за сложността на софтуера, работещ в мрежа от неврони, където във всеки един момент полученият ефект зависи от твърде много на брой параметри и по този начин прави невъзможен контрола върху произхода на промяната. Този въпрос е обект на изследвания и на френския математик Стефан Мала от Колеж дьо Франс. Стабилността (надеждността) и ефективността са от съществено значение при големи проекти, какъвто е например този за самостоятелно движещия си автомобил.
Френски съпротиви
Наред с ентусиазма от страна на индустриалните кръгове, с увеличаващото се значение на частното финансиране, с интереса на медиите и на научноизследователските институти, работещи в сферата на компютрите, срещу изкуствения интелект се появяват и критични реакции – изразяващи тревога, а понякога и реагиращи враждебно.
По какъв начин да си обясним коментарите на двама изтъкнати математици, носители на медала „Фийлдс“[4] и професори в Колеж дьо Франс, изпълнени със силно критичен скептицизъм? Техните аргументи са морални и политически.
Други критици – често слабо запознати какво всъщност представлява изкуственият интелект и до какви резултати е достигнал – смесват по объркан начин вече постигнатото; извършваните в момента проучвания; неясните проекти в графата „силната програма на изкуствения интелект“ и дори трансхуманистичните блянове.
Тъкмо във Франция забелязваме желание за отказ както от емпиризма, така и от практическата роля на математиката – желание, насърчавано от френския философ Огюст Конт, който смята математиката за кралицата на науките, „царуваща“ с големи преимущества над останалите по-изолирани предмети.
Тук има една френска специфика, която често пренебрегваме. Може да си припомним, че статистиката и дори теорията на вероятностите, чийто математически характер е безспорен, доскоро бяха изключвани от учебните програми (най-голямата лаборатория по приложна математика във Франция, например, отхвърли теорията на вероятностите и не я прилага в своите изследвания).
Въпреки това, статистиката и теорията на вероятностите в значителна степен демонстрираха своята важност и играят решаваща роля в развитието на изкуствения интелект. Именно принципите от Теоремата на Бейс, засягащи статистическите изводи и заключения, са в основата на „дълбокото обучение“ и работят много ефективно в психологията, в теорията за развитието на езика и в когнитивните науки.
Силната съпротива срещу промените има дълбоки корени в идеите на Рене Декарт. В тези симптоми можем да видим ефекта от една твърде рационална култура, от образование, при което езикът има абсолютна перформативна сила и изисква с него да се работи по съвършено строги правила.
Фигурата на Декарт има доминираща роля, да бъдеш наречен „картезианец“ е върховен комплимент. Това господство на разума над интуицията и над въображението принуждава един изтънчен познавач на френската култура да оплаче „победата на Декарт над Монтен“, макар че по-скоро обвиненията трябва да са насочени към картезианството, а не към самия Декарт.
Но трябва да отчетем, че има ключови предизвикателства като сигурността и надеждността: не е достатъчно да разполагаме с машини с невероятни резултати, но трябва да гарантираме тяхната максимална надеждност и сигурност. Други допълнителни трудности могат да възникнат заради отклонения в една или друга посока и заради дефекти в статистическите данни, които са непознати до този момент и изкривяват резултатите.
Друга голяма сфера, която за първи път е проучена през шейсетте години, засяга естествените езици и тя е предмет на изследователски интерес на Дейвид Мамфорд. Този човек е световноизвестен математик, която още от 80-те години на миналия век работи върху зрението.
През последните години Мамфорд разработи опитни схеми за подпомагане на структурното обучение (за присъствието на граматиката в когнитивните явления), като целта му е да интегрира последните постижения в областта на изследванията на зрението, езика, познанието и др. в сферата на обучението и различните приложения в теорията на игрите и в социалните науки. Друга цел в работата му е да изгради познавателна архитектура на комуникацията човек-машина.
Някои текущи изследвания доведоха до проучвания, в които се смесват научни, технически и етични въпроси. Няколко скорошни събития също доведоха до това, че на новите компютърни технологии с охота се приписват сериозни промени в сферата на етичните и политическите въпроси: проучвания в сферата на автомобилостроенето, например, поставят въпроси за „автомобилния морал“ в случая, когато се търси „по-малката вреда“ за автомобила.
ИТ инструментите повече от двадесет години допринасят за усъвършенстване на маркетинга, а следователно и на този, развиван в сферата на политическите действия. Рисковете от манипулации обаче, като предполагаемата намеса в американските избори от страна на един офис за обработка на статистически данни в британската анализаторска компания „Кеймбридж Аналитика“, допринесоха за това катастрофичната представа за влиянието на deep learning („дълбокото обучение”) да става все по-популярна.
Центърът за изкуствен интелект, съвместим с човека (Center for Human-Compatible Artificial Intelligence – CHAIR) в Калифорния (Бъркли) събира на едно място тъкмо онези изследователи, които са притеснени заради споменатите по-горе обществено-политически последици и заради рисковете пред сигурността и спазването на човешките права. Човек може да си представи до какви катаклизми би се стигнало, ако с компютрите има възможност да се води диалог на естествен език, а всеки пътник, без особени рискове, може да използва мрежа от автономни автомобили без водач.
Както често се случва, развиващата се в момента нова технонаука, какъвто е този езоповски език, носи и най-доброто (например, ускорява поставянето на медицински диагнози), но и най-лошото (умножава възможностите на Китай да упражнява строг социален контрол над милиони хора). Тези две страни на монетата ни напомнят за пророческата визия на Джон фон Нойман, опираща се на опита с подобни големи открития в сферата на атомната физика. Но има и нещо повече – днес сякаш цялата вселена е сведена до безброй числа. Френският математик Рене Том вече ни предупреди: „Според технологичната хипотеза, персонализирането на Вселената е наложено под въздействието на техническата мисъл, а по-специално заради алгоритмичното мислене“.
Необходимо е развитието на технологиите да се контролира; техните употреби трябва да са предмет на политически и морални дебати. Но можем да бъдем сигурни, че big data няма да убият интуицията, мечтите, поезията, въображението. Така наречените „големи данни“ не могат да заемат мястото и ролята на въображението в главите на учените. Още по-малко на тяхната „дива мисъл“.
Жан-Мишел Кантор
Commentaire, №166, лято 2019
Превод от френски Иван Николов
[1] „Дълбокото обучение“ е специфичен вид „машинно обучение“, при което подходът е йерархичен. Това е набор от алгоритми, които помагат при решаването на определени типове изчисления, при които по-трудно се достига до отговор, ако се следва традиционното програмиране. Името му идва от изкуствените невронни мрежи, на чиято основа работи. Това са компютърни системи, структурирани по начин, наподобяващ човешкия мозък – с множество взаимосвързани неврони, които предават сигнали един на друг. За „дълбокото обучение“са необходими огромни ресурси – като например по-мощни графични процесори.
[2] Го – логическа игра, измислена преди 4300 години, водеща началото си от Древен Китай. Спомената в речите на Конфуций.
[3]Монте Карло са изчислителни алгоритми, при които, за да се постигне числов резултат, се повтарят случайни извадки.
[4] Медалът „Фийлдс“ се присъжда на всеки четири години от Международния математически съюз. Носителите му трябва да са до 40-годишна възраст.