science_power (science_power) wrote,
science_power
science_power

Categories:

Автоматизированное определение российских ботов в Твиттере




Источник

Довольно любопытно. Для классификации твитов (для последующей тренировки автоматической распознавалки) использовали добровольцев из студентов Высшей Школы Экономики. Некоторые боты было легко определить - аккаунт был создан недавно, без фото и связи с другими соц сетями, все посты почти - заголовки из прессы без ссылок на оригинал. Но нашлись и достаточно интересные гибридные случаи - когда бот подключали к аккаунту реального человека или человек время от времени контролировал аккаунт бота. Но в целом боты имели активность, отличающуюся от человеческой - по количеству твитов и ретвитов и по временному распределению.



Интересно, что количество ботов в русскоязычном Твиттере в период большой политической активности (Крым, например), превышало 80%! До начала 2014 года ботов было примерно 10%, после марта 2014 - 40%, дальше еще выше - до 87% аккаунтов были боты и 77% твитов были от ботов.



Боты можно также определить по типу API, которое использовалось. Боты использовали Twitter Web API. Боты практически никогда не указывают свое географическое положение. Люди указывают и чаще пользуются мобильными устройствами. Боты, естественно, смартфонов не имеют. Хотя, судя по всему, планшеты на Андроиде боты таки уважают. Боты также значительно больше интересуются политикой.

Параметры модели

Tags: боты, выборы
Subscribe

Recent Posts from This Journal

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 0 comments