Внезапно мне захотелось проверить количество живых пользователей в подписчиках у популярных блоггеров, для этого я написал небольшой скриптик. Взял тех, кого смог найти за 10 минут, если кто-то не попал в этот список, то извиняйте, или наоборот радуйтесь :). Современные боты очень умны и так просто их не найти, поэтому нашёл только самых примитивных ботов и странных людей.
Конечно моя система далека от идеала. Изначально цель была определить тех, кто тупо купил подписчиков, но это мне не удалось :(. Цифры на удивление оказались примерно одинаковыми. Алгоритм определения ботов пока что такой:
- Коэффициент фолловингов и фолловеров меньше 1:7. Это означает, что человек, например, читает 700 пользователей, а в ответ его меньше 100.
- Меньше 25 фолловеров при 1 000 твитах.
- 16 постов из последних 20 содержат ссылки
- 16 постов из последних 20 содержат хэштег
- 16 постов из последних 20 ретвиты
Хэштег #Followback в описании профиля- Больше 150 твитов и стандартная аватарка
- Количество твитов равное 0 и больше 150 фолловеров или фолловингов