«Цифровые кентавры» играют в Го

11 мая 1997 года шахматный суперкомпьютер Deep Blue обыграл Гарри Каспарова, а уже в следующем году чемпион мира провел первое соревнование «Шахматы Кентавров», где друг против друга выступили не просто живые люди, а пары человек+компьютер. Именно тогда и появился термин «цифровой кентавр» - им называют систему из людей и машин, которая за счет правильно организованного взаимодействия работает эффективнее, чем самые сильные люди и лучшие компьютерные решения.

Второй год проект «Практики будущего» Кружкового движения НТИ развивает R&D программу «Цифровой кентавр» - школьники, студенты и молодые ученые из разных регионов исследуют, при каких условиях и в каких сферах человек и ИИ могут совместно обучаться и работать эффективнее, чем по отдельности. Хорошей платформой для отработки новых принципов взаимодействия человека и ИИ выступает игра в Го, в которой до недавнего времени человек превосходил машину. В 2021 году состоялся хакатон «Игры разумов», на котором команды студентов и школьников разрабатывали решения для синхронизации человека и ИИ во время игры в Го. Созданные программы по запросу выдают игроку различные подсказки, повышая, тем самым, шансы на победу в этой логической игре с глубоким стратегическим содержанием.

Наука и жизнь // Иллюстрации
Коидзуми Кэн играет с кентавром.
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации

Разработки привезли на Чемпионат мира по Го, состоявшийся во Владивостоке - впервые в истории за пределами Китая, Кореи и Японии. В рамках соревнований прошел и первый «матч кентавров Го», во время которого игроки разного уровня, пользуясь разработанными сервисами с ИИ, играли друг против друга. Там же были сыграны матчи профессиональных игроков Го, которые, вооружившись подсказками от программы, выиграли у искусственного интеллекта Leela Zero на доске 13 на 13 пунктов. Как развивалась эта история, читайте в нашем материале.

Искусственный интеллект и игра в Го

К настоящему моменту компьютер победил человека практически во всех логических настольных играх. Игры с небольшим числом комбинаций компьютер мог просчитать легко (крестики-нолики, шашки, нарды), в то время как в шахматах и Го из-за ограниченности вычислительных мощностей преимущество долго оставалось за человеком. Считалось, что только человек может обладать такими свойствами как интуиция, чутьё и жизненный опыт, поэтому игры с огромным количеством возможных вариантов были компьютеру неподвластны. Человек, обладая незначительным объёмом информации о противнике, его прошлых играх, а иногда исключительно из вербальных и невербальных символов мог просчитать свои предстоящие ходы и возможные ответы противника, поставить «ловушки», разработать победную стратегию.

Количество комбинаций в шашках - 10 в 20 степени. Число возможных позиций на шахматной доске составляет 10 в 46 степени. В игре Го количество возможных комбинаций составляет 10 в 171 (это больше, чем атомов во вселенной - их 10 в 80 степени). Поэтому полным перебором в Го машине справляться сложно, в то время как у человека за выбор перспективного хода в большей степени отвечает интуиция и образное представление.

В 1997 году шахматный суперкомпьютер Deep Blue обыграл действующего чемпиона мира по шахматам Гарри Каспарова. Долгое время игроки в Го гордились тем, что компьютер им не ровня. Параллельно с этим многие компании вкладывали большие деньги, чтобы научить алгоритмы побеждать человека. В итоге в 2015 году Google DeepMindвыпустили AlphaGo – искусственный интеллект, который выиграл 499 из 500 матчей у других игроков-программ. После этого Google решили закрепить результат и устроить матчи AlphaGo с реальными игроками. Так ИИ выиграл сначала трёхкратного чемпиона Европы Фань Хуэя, а затем – в 2016 году – и Ли Седоля, считавшегося во всем мире лучшим игроком десятилетия.

У программы от Google DeepMind были принципиально другие алгоритмы, чем у шахматного суперкомпьютера Deep Blue. АlphaGo работала на самообучающихся нейронных сетях, которые способны на основе огромной статистики партий постепенно понимать, какие позиции на доске выгодны, а какие нет.

Google DeepMind не опубликовали исходный код AlphaGo, и с мая 2017 года она больше не играла. Но другие компании начали черпать данные из опубликованных партий, сыгранных этим искусственным интеллектом, и создавать на их основе свои. 25 октября 2017 года бельгийский программист Джан-Карло Паскутто представил Leela Zero – бесплатную программу для игры в Го с открытым исходным кодом.

В 2019 году Кружковое движение НТИ предложило Михаилу Емельянову, исполнительному директору «Центра развития и популяризации игры Го и стратегии» и члену президиума Российской федерации Го, разработать компьютерные системы для синхронизации человека и ИИ во время игры в Го. Такие пары, где человек и ИИ взаимодействуют вместе для решения сложных задач, напомним, принято называть «цифровыми кентаврами». Михаил Емельянов обратился к специалистам по ИИ - Александр Горбань, директор Центра искусственного интеллекта Университета Лестера (Великобритания), предложил несколько идей для «кентавров», которые в итоге были реализованы при поддержке Кружкового движения НТИ.

– Тогда нам и пришла в голову идея провести на полях готовящегося Чемпионата мира по Го во Владивостоке «матч кентавров», подготовленных к этой игре, – говорит Дмитрий Земцов, лидер рабочей группы НТИ «Кружковое движение». – Мы хотели проверить на одной из частных задач гипотезу о том, что человеческий интеллект в составе «цифрового кентавра» не будет обузой, сможет добавить что-то к машинной логике: интуицию, стратегическое чутье, фоновые знания. Но кроме турнира кентавров мы решили провести еще и матч «кентавр vs ИИ», замахнуться на поиск предельного ответа.

Создание «цифровых кентавров» и хакатон «Игры разумов»

В 2020 году началась длительная подготовка хакатона «Игры разумов», организованного проектом «Практики будущего» Кружкового движения НТИ. Организаторы много времени потратили на формирование концепции, к этому процессу подключились представители разных сфер: эксперты игры Го, методологи Кружкового движения, технические специалисты с реальным практическим опытом.

Огромную работу провели и в технической части. Над проектом трудились две команды разработчиков: https://vova.pro/Vova.pro и https://soft.ambersoft.llc/AmberCore, которые развернули многопользовательский сервер, позволяющий проводить игру в Го в нескольких режимах: со случайным соперником, с ИИ, с конкретным игроком. При этом сервер давал возможность во время игры получать подсказки непосредственно от искусственного интеллекта Leela Zero.

Для предстоящего «матча кентавров» программисты доработали Leela Zero, написали собственные реализации подсказок, изменили формат вывода данных. Leela Zero обычно играет на доске 19 на 19 пунктов, но разработчики обучили платформу играть на доске 13 на 13 пунктов и адаптировали систему под такие условия. Это было сделано для упрощения процесса, ведь даже на такой доске программа играет на недостижимом для любителя уровне и представляет очень серьезного противника для профессионала.

После масштабной подготовки «Практики будущего» запустили хакатон для участников в возрасте 16-24 лет. Командам необходимо было разработать интерфейс, с помощью которого игрок в Го может взаимодействовать с ИИ Leela Zero в ходе матча. Участники должны были придумать способ эффективного донесения информации до пользователя с целью победы с максимумом набранных очков. Они сами решали, как и какая информация будет сообщаться пользователю и придумывали дополнительные функции и механики, которые можно реализовать, используя аналитику от Leela Zero. По итогам их программа должна был помочь игроку выиграть, используя наименьшее количество подсказок (за каждый запрос на подсказку игрока штрафовала система биллинга), при этом итоговый выбор хода, в любом случае, должен был оставаться за человеком.

- Для команд это была очень сложная междисциплинарная задача, - говорит Владислав Плотников, руководитель разработки платформы для хакатона и руководитель разработки машинного обучения ЕЭТП «Росэлторг». - Мне кажется, что успешное решение подобных задач состоит в правильном продуктовом видении, умении придумывать и реализовывать пользовательские механики, тестировать большое количество гипотез. В самом начале мы выдали участникам большой объем технической информации, помимо этого, им нужно было понять продуктовые требования и требования со стороны экспертов Го. Мне кажется, у команд ушло некоторое количество времени, чтобы вообще осознать, какие объекты есть и как с ними взаимодействовать. Такие условия очень чётко отражают промышленную разработку, когда есть несколько заинтересованных сторон, и необходимо удовлетворить требования сразу всех.

В финале хакатона приняли участие 20 команд школьников и студентов из разных регионов. По мнению экспертов, прототипы программ всех команд-финалистов были достойные, в итоге для презентации на Чемпионате мира выбрали лучшие решения - их разработчики представляли Москву и Московскую область, Санкт-Петербург, Новосибирск, Ханты-Мансийск, Самару и Томск. В течение следующего месяца командам предстояло доработать и протестировать системы непосредственно на мировых соревнованиях.

Матчи «кентавров» друг с другом и против ИИ

В июне во Владивостоке состоялся Чемпионат мира по игре в Го. Параллельно с основными соревнованиями на площадке Дальневосточного федерального университета был организован первый «матч кентавров Го», в которых использовались решения команд-финалистов хакатона «Игры разумов». Роль «цифровых кентавров» на себя примерили начинающие игроки и любители из числа студентов ДВФУ, участники Чемпионата мира разных возрастов, а также бизнесмены и политики.

«Цифровые кентавры» играли друг против друга, используя разные компьютерные системы, разработанные участниками хакатона. Игрокам на выбор предлагалось восемь систем, которые позволяют игроку Го взаимодействовать с ИИ так, чтобы повысить свою эффективность и вероятность победы. Обращаясь к искусственному интеллекту Leela Zero с помощью специальных программ, игрок мог воспользоваться одной из подсказок, заложенных в систему: например, рекомендовать часть поля для следующего хода, выбрать лучший ход из предложенных игроком, оценить шансы на победу и др. При этом за каждую использованную подсказку у «кентавра» снимали игровые очки.

- Программа, которой я пользовался в «матче кентавров», отлично сделана с точки зрения интерфейса, интуитивно очень понятна. Я наслышан об идее «цифровых кентавров», и меня не отпускал вопрос: как человек в такой системе может сохранять независимость от ИИ? Как раз во время игры я понял, что уже есть решения, которые, помогая человеку в слабых местах, позволяют оставаться автономным и самому принимать итоговое решение, - поделился участник «матча кентавров Го», глава филиала ООО «МИЦУИ ЭНД КО. МОСКОУ» во Владивостоке Коидзуми Кэн. - Мне понравилось быть «цифровым кентавром» - если команды сделают приложение для смартфона, я готов им пользоваться регулярно. Мне кажется, «цифровой кентавр» может стать эффективной системой для обучения игре в Го, совершенствования моих навыков».

Всего во Владивостоке было сыграно 70 матчей «цифровых кентавров», что позволило наработать большой объем данных для дальнейшего изучения и развития концепции. В команде «Практик будущего» отметили, что по итогам игр предстоит проанализировать много информации, но одно уже ясно точно: работает как сложнейшая архитектура, позволяющая создавать «кентавров», так и сама концепция «ИИ+человек».

Также на полях чемпионата состоялось две игры «цифровых кентавров» против ИИ с участием профессиональных игроков - Ильи Шикшина и Александра Динерштейна. Они оба - одни из сильнейших игроков России (у Ильи - 7 дан EGF и 4 профессиональный дан, у Александра - 7 и 3 соответственно). По сути, состоялись игры «человек+Leela Zero против Leela Zero» на доске 13 на 13 пунктов (стандартная доска – 19 на 19). Игроки использовали компьютерный интерфейс, разработанный командой «Черное и белое», в которую вошли первокурсники МГТУ имени Баумана. ИИ мог подсказать наиболее удачные зоны для игры, лучшие ходы, определить, у какой стороны выше шансы на победу в данный момент. Справедливости ради, стоит заметить, что подсказками искусственного интеллекта воспользовался только Александр Динерштейн - он просил компьютер рассчитать шансы на победу в заданный момент, что позволило ему выбирать верную стратегию. В итоге его «цифровой кентавр» обыграл Leela Zero на доске 13 на 13 пунктов.

По словам одного из организаторов Чемпионата мира во Владивостоке, гроссмейстера России по игре Го Олега Межова, искусственный интеллект Leela Zero даже на доске 13 на 13 пунктов является очень сильным и практически не оставляет шансов на победу человеку.

- Сейчас обыграть искусственный интеллект в Го почти невозможно, поэтому на чемпионате мира произошло интересное событие. Пара человека и искусственного интеллекта, играющая за одну сторону – «цифровой кентавр» - впервые выступила против искусственного интеллекта и обыграла его. Мы увидели, что человек с его интуицией и искусственный интеллект – машина с ее невероятными мощностями – вместе потенциально могут быть сильнее, чем в одиночку, – заметил Олег Межов.___

________

Всех, кто заинтересовался темой «цифровых кентавров», Кружковое движение НТИ приглашает к сотрудничеству. Для этого достаточно написать на эл. почту проекта  «Практики будущего»: pf@kruzhok.org или в сообщество ВКонтакте: https://vk.com/practicing_futures

Текст: Владислав Плотников, Маргарита Москвина, Анна Леонтьева


Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее