Робот на ім’я AlphaZero зумів навчитися грати в шахи протягом 4 годин. Після цього він обіграв гросмейстера, використовуючи ходи, які ніколи не розроблялися за 1500-річну історію гри. І це викликає захват і тривогу одночасно.
Роботи одного разу знищать нас? Це питання, яке усе частіше зачіпає уми багатьох наших найблискучіших вчених і технічних підприємців.
Цього року провідний науковий співробітник Оксфорда, професор Майкл Воулдрідж, попередив депутатів палати лордів Великобританії про те, що штучний інтелект може бути “ізгоєм”. А також машини можуть стати настільки складними, що інженери, які їх створюють, більше не зрозуміють їх або не зможуть передбачити, як вони функціонують.
Так, це проблема, але «історична» нова розробка робить непередбачувані рішення машинами ШІ найменш небезпечними. Й усе почалося зі гри в шахи.
Нейромережа AlphaZero
Проект AlphaZero народився в Лондоні і є дітищем британської компанії DeepMind, що розробляє комп’ютерні програми, які навчають самих себе. Пізніше, у 2014 році, компанія DeepMind була куплена корпорацією Google за 400 мільйонів фунтів стерлінгів.
Складний фрагмент програмування, який створив AlphaZero, можна більш просто описати, як алгоритм – набір математичних інструкцій або правил, які можуть виробити відповіді на проблеми.
Іншим терміном для даного процесу є інструмент “глибокого машинного навчання”. Чим більше даних про ШІ, таких як процеси AlphaZero, тим більше він вчиться, перепрограмуємо себе новими знаннями.
Таким чином, його здатності вирішувати проблеми усе сильніше посилюються, множачи свій інтелект далеко за межі можливостей людського мозку. У результаті це не обмежено межами людського мислення, як довів його успіх у шахах.
AlphaZero – геніальний шахіст
AlphaZero, комп’ютерна програма ШІ, у цьому місяці зарекомендувала себе, як найбільший чемпіон світу з шахів, перемігши попереднього володаря титулу, іншу систему ШІ під назвою Stockfish 8, у марафоні зі 100 ігор. У серії 100 ігор проти Stockfish, AlphaZero виграв 25 ігор, граючи білими, і три гри, граючи чорними. Решта партій завершилася внічию, перемог у Stockfish не було.
Але найцікавіше в AlphaZero те, що він навчив себе шахів усього за чотири години. Просто були дані правила, і у вирішальній партії йому доручено було навчитися перемагати, граючи проти самого себе.
При цьому він асимілював сотні років знань і тактики шахів, але потім перевершив усі попередні людські винаходи у грі.
Протягом цих 240 хвилин практики програма не тільки навчилася грати, але і розробила тактику, яка була неперевершеною новинкою. Деякі з виграшних ходів ніколи не реєструвалися протягом 1500 років.
“Я завжди задавався питанням, як це було б, якби більш розвинені види висадилися на Землі і показали нам, як вони грають у шахи. Тепер я це побачив”, – сказав гросмейстер Пітер Хайне Нільсен, коментуючи результати AlphaZero.
Зокрема, розробники відзначають, що у грі робот часто використовував короля для атаки. Таке в шаховій практиці не застосовує ніхто. Звідки така тактика, залишається загадкою.
Симон Вільямс, англійськаий гросмейстер, якого і переміг робот, жартома навіть сказав: “6 грудня 2017 року AlphaZero зайняв трон у шаховому світі. Але в кінцевому рахунку, перемігши у вирішальній грі, може поневолити людство, перетворивши нас на домашніх тварин”.
Штучний інтелект друг чи ворог?
Це питання мучить багатьох вчених і дослідників. З одного боку машини дуже швидко навчаються, інтегруються в різні людські процеси, але з іншого боку їх самонавчання іноді стає безконтрольним.
Так, розробки відомої компанії DeepMind, яка належить Google, використовуються для сканування пацієнтів із раковими захворюваннями голови та шиї, які вражають більше 11 000 чоловік на рік у Великобританії.
Експерти Google говорять, що ШІ здатний навчити себе читати ці скани усе швидше і точніше, ніж будь-яка людина. Завдяки цьому випромінювання може бути більш точно націлене на пухлини, одночасно мінімізуючи пошкодження здорових тканин мозку та шиї. Те, що на даний час цей процес у лікарів і рентгенологів займає до чотирьох годин, програма виконає менш ніж за годину.
Так, DeepMind проаналізує 3000 або близько того високотехнологічних очних сканувань, що проводяться щотижня. У даний час тільки декілька експертів можуть інтерпретувати результати, що може викликати затримки в лікуванні. Вважається, що ШІ зможе набагато швидше справлятися з поставленим перед ним завданням.
Те, як ми майже не контролюємо процес глибокого навчання машин, які скоро будуть використовуватися в усіх сферах нашого життя, викликає певну тривогу. Вже зараз провідні ІТ-фахівці попереджають, що алгоритми глибокого навчання можуть запускатися безладно з-під контролю, тому що ми не знаємо, чому вони вчать самих себе. ШІ дуже швидко вчиться, часом навіть занадто.
Чи не випускаємо ми власноруч джина із пляшки? Створюючи ШІ, розробники повинні розуміти над чим вони працюють, контролювати процес самонавчання машин, бути, перш за все, відповідальними за своє дітище. В іншому випадку нас чекає останній матч, але він вже явно буде не на шахівниці. Це буде битва не за пішака або короля, а битва за існування усього людства.