Новости

Робот AlphaZero научился за 4 часа играть в шахматы и обыграл гроссмейстера

Робот по имени AlphaZero сумел научиться играть в шахматы в течение 4 часов. После этого он обыграл гроссмейстера, используя ходы, которые никогда не разрабатывались за 1500-летнюю историю игры. И это вызывает восторг и тревогу одновременно.

Роботы однажды уничтожат нас? Это вопрос, который все чаще затрагивает умы многих наших самых блестящих ученых и технических предпринимателей.

В этом году ведущий научный сотрудник Оксфорда, профессор Майкл Воулдридж, предупредил депутатов палаты лордов Великобритании о том, что искусственный интеллект может быть «изгоем». А также машины могут стать настолько сложными, что инженеры, которые их создают, больше не поймут их или не смогут предсказать, как они функционируют.

Да, это проблема, но «историческая» новая разработка делает непредсказуемые решения машинами ИИ наименее опасными. И все началось с игры в шахматы.

Нейросеть AlphaZero 

Проект AlphaZero родился в Лондоне и является детищем британской компании DeepMind, разрабатывающей компьютерные программы, которые обучают самих себя. Позже, в 2014 году, компания DeepMind была куплена корпорацией Google за 400 миллионов фунтов стерлингов.

Сложный фрагмент программирования, который создал AlphaZero, можно более просто описать, как алгоритм — набор математических инструкций или правил, которые могут выработать ответы на проблемы.

Другим термином для данного процесса является инструмент «глубокого машинного обучения». Чем больше данных об ИИ, таких как процессы AlphaZero, тем больше он учится, перепрограммируя себя новыми знаниями.

Таким образом, его способности решать проблемы все сильнее усиливаются, умножая свой интеллект далеко за пределы возможностей человеческого мозга. В результате это не ограничено пределами человеческого мышления, как доказал его успех в шахматах.

AlphaZero — гениальный шахматист

AlphaZero, компьютерная программа ИИ, в этом месяце зарекомендовала себя, как величайший чемпион мира по шахматам, победив предыдущего обладателя титула, другую систему ИИ под названием Stockfish 8, в марафоне из 100 игр. В серии 100 игр против Stockfish, AlphaZero выиграл 25 игр, играя белыми, и три игры, играя черными. Остальные партии завершились вничью, побед у Stockfish не было.

Но самое интересное в AlphaZero то, что он обучил себя шахматам всего за четыре часа. Просто были даны правила, и в решающей партии ему поручено было научиться побеждать, играя против самого себя.

При этом он ассимилировал сотни лет знаний и тактики шахмат, но затем превзошел все предыдущие человеческие изобретения в игре.

В течение этих 240 минут практики программа не только научилась играть, но и разработала тактику, которая была непревзойденной новинкой. Некоторые из выигрышных ходов никогда не регистрировались в течение 1500 лет.

«Я всегда задавался вопросом, как это было бы, если бы более развитые виды высадились на Земле и показали нам, как они играют в шахматы. Теперь я это увидел», — сказал гроссмейстер Питер Хайне Нильсен, комментируя результаты AlphaZero.

В частности, разработчики отмечают, что в игре робот часто использовал короля для атаки. Такое в шахматной практике не применяет никто. Откуда такая тактика, остается загадкой.

Симон Уильямс, английский гроссмейстер, которого и победил робот, в шутку даже сказал: «6 декабря 2017 года AlphaZero занял трон в шахматном мире. Но в конечном счете, победив в решающей игре, может поработить человечество, превратив нас в домашних животных».

Искусственный интеллект друг или враг?

Этот вопрос мучает многих ученых и исследователей. С одной стороны машины очень быстро обучаются, интегрируются в разные человеческие процессы, но с другой стороны их самообучение иногда становится бесконтрольным.

Так, разработки известной компании DeepMind, которая принадлежит Google, используются для сканирования пациентов с раковыми заболеваниями головы и шеи, которые поражают более 11 000 человек в год в Великобритании.

Эксперты Google говорят, что ИИ способен научить себя читать эти сканы все быстрее и точнее, чем любой человек. Благодаря этому излучение может быть более точно нацелено на опухоли, одновременно минимизируя повреждение здоровых тканей мозга и шеи. То, что в настоящее время этот процесс у врачей и рентгенологов занимает до четырех часов, программа выполнит  менее чем за час.

Так, DeepMind  проанализирует 3000 или около того высокотехнологичных глазных сканирований, проводимых каждую неделю. В настоящее время только несколько экспертов могут интерпретировать результаты, что может вызвать задержки в лечении. Считается, что ИИ сможет намного быстрее справляться с поставленной перед ним задачей.

То, как мы почти не контролируем процесс глубокого обучения машин, которые скоро будут использоваться во всех областях нашей жизни, вызывает определенную тревогу. Уже сейчас ведущие ИТ-специалисты предупреждают, что алгоритмы глубокого обучения могут запускаться беспорядочно из-под контроля, потому что мы не знаем, чему они учат самих себя. ИИ очень быстро учится, порой даже чересчур.

Не выпускаем ли мы собственноручно джина из бутылки? Создавая ИИ, разработчики должны понимать над чем они работают, контролировать процесс самообучения машин, быть, прежде всего, ответственными за свое детище. В противном случае нас ждет последний матч, но он уже явно будет не на шахматной доске. Это будет битва не за пешку или короля, а битва за существование всего человечества.

Рейтинг статьи: 0.0
5 0 1

Оставить комментарий

Ваш email не будет опубликован