Идентификация браузеров
Отпечаток браузера / Browser fingerprint
Лыкошин Александр
2023-24
#### Browser fingerprinting - технология идентификации пользователей (браузеров) в интернете - Для чего используется - *Таргетированная реклама*, улучшение пользовательского опыта, более точное предоставление услуги - Антифрод, детектирование ботов Негативные варианты использования: нарушение приватности пользователей, возможность злоупотребления информацией Юридические моменты: необходимо ли согласие пользователя?
### Технологии: (1) сбор отпечатка - На стороне браузера: - Базовые характеристики браузера, версия, языки, временн*а*я зона установленные шрифты, плагины, уникальные для устройства особенности рендеринга изображений - На стороне сервера: - IP-адрес, гео-IP, характеристики TCP-соединения (p0f), характеристики TLS шифрования (JA3), заголовки HTTP
### Технологии: (2) формирование идентификатора - Сочетание набора характеристик уникально для конкретного браузера => уникальный идентификатор браузера - Static ID для браузера - Наиболее простой вариант - вычисление хеша по всем характеристикам - Многие характеристики изменяются со временем (версия браузера, плагины,...) - Использование нечетких хешей или машинного обучения
### Методы противодействия: - VPN и прокси - скрытие IP адреса - Механизмы, встраиваемые в браузеры (Tor, Brave, Firefox), и дополнительные плагины - Блокировка известных трекеров (загрузка скриптов и отправка данных) - Скрытие фактических характеристик (язык, версия, плагины...) - Добавление шума при рендеринге изображению - Изменение порядка следования данных SSL для TLS фингерпринтинга - ...
### Продвинутые методы Трехмерная графика WebGL ![./img1.jpg](./img1.png) ![./img2.jpg](./img2.png) ![./img3.jpg](./img3.jpg) - Демо методов: - https://wrtc.ru/device-fingerprint-stand/ - https://webcc.ru/device-fingerprint-stand/ - Демо прототипа: https://wrtc.ru/
### Текущий статус: Подготовка к пилотному проекту - Задачи пилота: сбор данных на ограниченном числе реальных пользователей (~10 тыс) и их анализ: - выбор наиболее качественных характеристик и методов их получения - выбор и реализация алгоритма формирования идентификатора
### Ожидаемый эффект - Текущий процент кроссдоменной идентификации пользователей ~70%, потенциал инициативы - 80% - Прогноз увеличения выручки - 100..200 млн.руб. в год - Основан на консервативной оценке в 2..3% от годовой выручки
## Спасибо за внимание #### Вопросы..?