Искусственный интеллект научился блефовать и стал непобедимым игроком в Stratego

Искусственный интеллект DeepNash от компании DeepMind освоил игру Stratego и вошел в круг победителей, подвинув многих чемпионов-людей. Однако вычислительные способности ИИ в данном случае не используются по прямому назначению — напротив, сильной стороной DeepNash стало умение блефовать, что оказалось неожиданностью даже для его разработчиков.

Stratego является игрой с «неполной информацией», так как противники не знают расположения 40 игровых фишек друг друга. Значение фишки достоверно можно выяснить только при прямой атаке на нее, но его можно также попробовать угадать, анализируя действия противника. Проблема в том, что если в такой сложной игре, как го, насчитывается 10 в 360 степени возможных ситуаций на игровом поле, то в Stratego их целых 10 в 535 степени.

Учитывать все варианты развития событий нереально, поэтому игроки учатся обманывать друг друга, и в этом деле ИИ неожиданно оказался очень хорош. Он самостоятельно, без обучения на сложных моделях, вывел выигрышные принципы и выстроил на их основе стратегию, которая позволяет обхитрить противников. В частности, DeepNash выдает свои низкоуровневые фишки за фишки высокого уровня, создавая эффективные приманки для оппонента. На данный момент ИИ уже входит в тройку лучших игроков в Stratego в мире.

Похожие записи

Чатбот GPT-4 сдал почти все существующие в США экзамены — правда, с некоторыми ошибками

500 лет спустя инженеры все же построили легендарный мост да Винчи

Новый ИИ способен воссоздать человеческий портрет из набора пикселей

Добавить комментарий Отменить ответ