Миналата седмица стана дума за това как изкуственият интелект и невронните мрежи в частност са много добри в търсенето на модели, правенето на прогнози и взимането на решения, но основният им недостатък е тяхната непрозрачност. И докато при работа с визуални данни резултатите са относително ясни, то при текстообработка невронните мрежи се държат като черни кутии. Същото е и при обработката на медицински и банкови данни, а в тези случаи цената на погрешното решение би могла да е много висока.
Да припомня: невронните мрежи имитират структурата на човешката нервна тъкан, а модификациите, на които данните са подложени в отделните възли на тези мрежи, са микроскопични и гранулирани до такава степен, че за учените е практически невъзможно да се сдобият с представа за тях, да не говорим за неспециалистите, на които се налага да общуват с тези сложни модели, за които не знаят почти нищо!
Може ли да се направи така, че учените и изобщо потребителите да подобрят комуникацията си с автоматизираните системи за машинно обучение, за да се намали стресът и да се повиши качеството на вземаните решения?
За нови начини за обучение и комуникация с невронните мрежи се говори сериозно от Конференцията на Асоциацията за компютърна лингвистика за емпирични методи в обработката на естествените езици в Остин, Тексас, през ноември 2016 г., но истинското отваряне на черната кутия на автоматизираните системи за машинно обучение се случва едва напоследък. В доклад, представен на Конференцията на Асоциацията по изчислителна техника „Човешкият фактор в изчислителните системи”, изследователи от MIT, Хонконгския университет за наука и технологии и Университета в Жейджанг описват интерактивен инструмент, който за пръв път позволява да се види как такава система работи и който поставя анализите и контрола на методите на автоматично машинно обучение в ръцете на потребителите.
Новият инструмент, наречен ATMSeer (АТМ идва от Auto-Tuned Models – „самонастроени модели”, а seer е „пророк”), ползва на входа набор от данни, както и известна информация за задачата на потребителя. А процесът на търсене се онагледява чрез удобен интерфейс, който дава задълбочена представа за работата на модела и облекчава трудоемкия иначе процес на ръчно избиране на алгоритми за машинно обучение и настройка на хиперпараметрите[1].
Сърцевината е ATM системата, разработена през 2017 г., която, за разлика от обикновените системи за машинно обучение, напълно каталогизира всички търсения, като се опитва да напасне моделите към данните. АТМ приема като входен всеки набор от данни и кодирана задача за прогнозиране и произволно избира метода на машинно самообучение – невронни мрежи, дървета на решенията, случайна гора или логистична регресия – и хиперпараметрите на модела, например, размера на дървото на решенията или броя пластове на невронните мрежи. След това системата изпълнява модела спрямо набора от данни, настройва хиперпараметрите и измерва производителността. Това, което е научила за изпълнението на един модел, системата използва, за да избере друг модел и т.н., докато изведе най-ефективния за дадена задача.
Трикът в случая е, че всеки модел по същество се разглежда като една контролна точка от данни с няколко променливи: алгоритъм, хиперпараметри и производителност. Основавайки се на това, изследователите са проектирали система, която онагледява данните и променливите в графики и карти, а оттам – и отделна техника, която позволява преконфигурирането на тези онагледени данни в реално време. Или, както казват хората от екипа, разработил ATM: „всичко, което можете да онагледите, можете и да промените“.
Обикновено подобни инструменти за визуализация са пригодени за анализиране само на един специфичен модел за машинно обучение и приложението им е доста ограничено, но с ATMSeer това вече е възможно и за модели, генерирани с различни алгоритми.
Може би това, което предстои оттук нататък, наистина е не само подобряване на работата на изкуствения интелект, но и изобщо повишаването на доверието на хората в машините.
–-
[1] При машинното обучение хиперпараметърът е този, чиято стойност се задава преди започването на учебния процес. Обратно, стойностите на други параметри се получават чрез обучение.