Основные параметры учетных записей, которые используются Facebook
Сегодня поговорим о том, каким параметрам учеток в Facebook следует уделить максимум внимания, чтобы работа на площадке была успешной.
Итак, для успешной арбитражной деятельности на «Фейсбук» необходимо учесть:
- Возраст учетной записи. Принято считать, что «молодые» учетки чаще грешат злоупотреблениями.
- Локация. Аккаунты, которые зарегистрированы в ряде регионов, нарушают правила площадки чаще других.
- Количество друзей. Обычно у ботов их подозрительно много.
- Поведение в соцсети, к примеру, как часто публикуются посты, делаются репосты, пишутся комментарии и пр.
- Анализ взаимодействия. Площадка оценивает, с кем учетная запись взаимодействует, чтобы определить необычные, возможно, даже подозрительные связи.
- ОС устройства, с которого была зарегистрирована учетная запись.
- Информация об IP, с которого аккаунт регистрировался.
- Участие в сообществах. Практика показывает, что учетки, состоящие в определенных группах, склонны к злоупотреблению больше, чем другие.
- Анализ общей активности – времени, проведенного на сайте, страниц, входящих в круг интересов пользователя, и пр.
- Общий анализ учетной записи позволяет определить паттерны, свидетельствующие о повышенном риске злоупотреблений со стороны аккаунта.
Содержание:
А теперь детальнее…
Анализ аккаунтов в Facebook является необходимой мерой, продиктованной частыми случаями нарушения правил площадки. Есть люди, которые намеренно ведут на «Фейсбук» противоправную деятельность для получения личной выгоды. Речь идет о пользователях, распространяющих спам и вредоносный софт, об учетных записях, которые призывают к терроризму, занимаются эксплуатацией детей и совершают прочие серьезные преступления. В подавляющем большинстве случаев все это делается с фейковых аккаунтов, и задача площадки – их обнаружить.
Поразительные масштабы проблемы
Согласно отчетам экспертов, в период с января по апрель 2019 года на Facebook было удалено 2,2 млрд. учетных записей, которые признали фейковыми. Но несмотря на активную борьбу с фейками, их количество на площадке до сих пор является слишком высоким. Аналитики подсчитали, что не менее 5 процентов учеток, регистрируемых на протяжении месяца, являются фейками. Происходящее напоминает игру в кошки-мышки, когда место удаленных площадкой аккаунтов тут же занимают новые.
Пути решения
Для развертывания более эффективной борьбы с фейковыми аккаунтами Facebook публикует советы рядовым пользователям, позволяющие распознать потенциально опасную учетную запись. Признаки фейковых акков мы привели в самом начале нашего материала.
Проанализировав характер проблемы, эксперты пришли к выводу, что существенную помощь в борьбе с ней способна оказать технология машинного обучения. Так, на начальном этапе было бы неплохо составить перечень признаков, затем соединить их меткой о вредоносности учетной записи. Дальше можно брать данные обучения и передать их на вход модели, к примеру, нейронной сети либо градиентному бустингу деревьев решений. Выход модели позволил бы точно определить факт вредоносности аккаунта.
Несмотря на все плюсы машинного обучения, положиться лишь на него невозможно из-за множества проблем. Объясним все на простом примере:
- В ходе исследования замечена закономерность: чем моложе акк, тем выше риски его злонамеренности.
- Создан признак «Возраст учетной записи».
- Признак направлен в классификатор.
- Классификатор внедрен и начинает работать.
Спустя время злоумышленники поймут причину блокировки аккаунтов и тут же отреагируют – они будут покупать старые учетки, чтобы использовать их для ведения запрещенной площадкой деятельности.
В решении этой проблемы поможет Deck, который позволит не только обозначить прямые признаки подозрительного аккаунта, но и проанализировать учетные записи, с которыми этот аккаунт взаимодействует. Как результат – моделирование поведения аккаунта в соцсети для определения его подлинности.
Процесс извлечения признаков
Чтобы обозначить признаки для каждого конкретного аккаунта, необходимо проанализировать его возраст, локацию и парочку учеток из списка друзей. Нужно изучить, с кем взаимодействует учетная запись, в каких группах и сообществах она состоит, с какого устройства проводилась регистрация. Все полученные признаки агрегатируются, затем они сравниваются с признаками других учеток, чтобы в конечном счете можно было создать шаблоны и распознать фейки.
Примеры аккаунтов
Для большей наглядности проиллюстрируем анализ конкретными примерами. Специалисты подготовили перечень прямых признаков для каждого типа аккаунтов. Если это пользователь, будем анализировать его пол и возраст, если электронный девайс, анализу подвергнется ОС, если сообщество – время существования и число участников.
В случае с пользователем можно изучить страницы, администратором которых он является, или комментарии, которые он оставляет под постами. Если речь идет об IP, следует изучить аккаунты, которые регистрировались через него на площадке. Полученные сведения, именуемые признаками агрегации, применяются к другим учеткам, чтобы составить шаблон для обнаружения фейковых аккаунтов.
Уже сейчас Facebook работает с несколькими признаками агрегации, в частности:
- Числовая. Учитывается общее количество, минимум и максимум, а также среднее арифметическое. К примеру, у аккаунта 6 друзей. У одного друга – 3 сообщества, у другого – 5, а третий вообще не состоит ни в каких сообществах. Полученные сведения позволяют получить такой агрегатируемый признак, как количество сообществ на каждого друга.
- Категориальный. Имеется в виду процент наиболее распространенных категорий либо количество тех категорий, которые рознятся. Например, двое друзей анализируемого аккаунта зарегистрированы в Соединенных Штатах, а один – в Германии. Получается, что наиболее распространенной страной в примере будут Штаты. Дальше перемещаемся на второй уровень и применяем эту агрегацию по отношению к пользователям, с которыми взаимодействует каждый из упомянутых аккаунтов.
Применив все существующие агрегации, можно получить не менее 20 тыс. признаков для каждой учетной записи. Это подробная характеристика, обеспечивающая возможность захвата всего социального графа учетки и снижающая вероятность адаптации к ней злоумышленников.
Источник: traffnews.com