Семейное положение можно предсказать по соцсетям
Психологический портрет человека, составленный на основе его активности в соцсетях, позволяет угадать некоторые факты его биографии.
Даже если человек не слишком склонен делиться в интернете своей личной информацией, мы все равно можем многое узнать о нем, если проанализируем его профиль в какой-нибудь соцсети, а ещё лучше – в нескольких. А ещё лучше, если таким анализом займётся программа.
Вот программисты из Университета ИТМО в Санкт-Петербурге вместе с коллегами из Национального Университета Сингапура и создали такую программу, с помощью которой можно уточнить индивидуальные черты пользователя по данным из социальных сетей. Точность предсказаний достигает 86%, что на 17% больше, чем если бы алгоритм использовал только одну социальную сеть. В частности, исследователи сконцентрировались на такой характеристике, как семейное положение, и, объединив данные из соцсетей, научили алгоритм предсказывать это самое положение с точностью до 86%, что на 17% точнее, чем по одной из соцсетей.
Исследователи сконцентрировались не на личности вообще, а пока только на одном параметре – на семейном положении. Активность пользователей преобразовали в наборы (или векторы) данных, состоящих из таких параметров, как средний размер твита, наиболее частые объекты на фото, распределение чекинов и т. д. Затем к таким векторам программисты применили базовые модели машинного обучения.
По словам магистрантки кафедры компьютерных технологий и научного сотрудника Международной лаборатории «Компьютерные технологии» Ксении Бурой, одного из авторов работы «Согласно многим научным источникам, психотип человека тесно связан с его семейным положением. Поэтому мы решили проверить, насколько точно сможем предсказать этот параметр, чтобы в будущем использовать его для определения психотипа». Авторы работы использовали шкалу психотипов MBTI (Myers-Briggs Type Indicator), основанную на тезисах Юнга – шкала характеризует человека с точки зрения того, как он взаимодействует с миром, что, в свою очередь, проще всего узнать из соцсетей.
Профилирование пользователя востребовано в широком спектре областей. Например, рекрутеры с помощью подобных программ могли бы узнавать больше о людях, которые устраиваются на работу. Кроме того, характеристика личности по активности в соцсетях могла бы помочь вычислять людей с криминальными наклонностями; или тех, кто склонен к депрессии или самоубийству, чтобы успеть вовремя им помочь.
Результаты работы, опубликованные в Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence, попали в финал студенческой секции ежегодной международной конференции искусственному интеллекту AAAI-17, которую организует Ассоциация по продвижению искусственного интеллекта (Association for the Advancement of Artificial Intelligence – AAAI). Ассоциация основана в 1979 году и представляет собой международное некоммерческое научное общество, занимающееся продвижением исследований в области машинного обучения, популяризацией в обществе научных идей, связанных с искусственным интеллектом (ИИ) и улучшением качества подготовки специалистов по ИИ. Конференция AAAI проводится уже несколько десятилетий, и за это время мероприятие собрало вокруг себя пул выдающихся ученых и IT-компаний, занимающихся как прикладными, так и теоретическими исследованиями в области создания и обучения искусственного интеллекта.
В нынешнем году с 4 по 9 февраля в отель Хилтон в Сан-Франциско, Калифорния, США, съедутся представители бизнеса, разработчики, ученые и студенты. На конференции выступят спикеры от компаний-лидеров отрасли – таких, как IBM Research, Baidu, Amazon, Tencent и Microsoft. Свой доклад на AAAI-17 Ксения Бурая и ее соавторы расценивают как своего рода задел для дальнейших исследований, поэтому в их планах продолжить работу, чтобы добиться публикации в рецензируемом международном журнале.