Деанонимизация криптовалюты
Деанонимизация криптовалюты
Мы уже неоднократно писали, что криптовалютам присуща псевдоанонимность в связи с тем, что пользователь может постоянно создавать новые адреса для совершения каждой операции, а установление связи этого нового адреса с конкретным лицом практически невозможно. При этом, даже если пользователь использует для совершения операций один и тот же адрес криптовалюты, идентифицировать его тоже далеко не простая задача. Естественно, все это справедливо до тех пор, пока пользователи не прибегают к услугам централизованных криптобирж, которые проводят идентификацию и верификацию своих клиентов.
Действительно, при выводе средств с «холодных» криптовалютных адресов на биржи или обменные сервисы, проводящие процедуры KYC, данные пользователей становятся доступными по решению суда или по запросу правоохранительных органов. Однако, как быть исследователям, которые решают задачу поиска похищенных средств или проверяют хронологию операций в криптовалюте своих партнеров, при том, что биржи по закону не предоставляют им информацию о своих пользователях? В таких случаях исследователям и приходится решать задачу по деанонимизации.
Само это понятие применительно к криптовалютным адресам можно рассматривать в узком и широком смыслах. В узком – это установление принадлежности конкретного адреса физическому лицу, сервису, компании. В широком смысле – это установление свойств адреса по закономерностям в операциях, в которых он участвует, и по которым можно понять, к какой сущности данный адрес относится.
Существуют различные подходы к классификации методов данонимизации. Выделяют активные и пассивные методы (по методам воздействия), on chain и off chain (в зависимости от того, где получены данные).
В нашем обзоре коснемся эвристических методов анализа криптовалют, как наиболее доступных в арсенале частного исследователя.
Эвристические методы в самом общем смысле представляют собой набор эмпирических правил, используемых для принятия решений в условиях неопределенности.
Для анализа криптовалют эвристики представляют собой правила взаимосвязей криптовалютных адресов и их транзакций, подчиненных принципам функционирования сети блокчейн, позволяющие сделать обоснованное предположение об их принадлежности одному владельцу или одной сущности, либо сделать вывод о направлении движения средств.
В нашем материале Типы криптовалютных адресов и их транзакций в сети биткоин мы уже рассматривали типы транзакций по формату адреса, типу владельца и числу адресов в транзакции (общая трата, сдача, пакетная транзакция, транзакция с округлением, транзакция платежа). Такой анализ также позволяет выделить ряд закономерностей, используя которые, а также ряд других, о которых мы поговорим ниже, можно решать задачу деанонимизации.
Исследователи используют несколько основных эвристических методов, а также их комбинации. Рассмотрим самые распространённые.
Эвристика наибольшей суммы вывода
Более 50% транзакций в сети биткоин соответствуют типовой транзакции расходования (один вход – два выхода), когда с одного адреса совершается платеж на другой адрес и при этом часть неизрасходованных средств передается на адрес сдачи.
Принцип анализа основывается на том, что при совершении такой транзакции сдача равна сумме, отправленной адресом отправителем за вычетом суммы, отправленной на основной адрес, и вычетом комиссии:
Сдача = сумма, входящая в транзакцию - сумма, которую получил больший выход – комиссия майнерам за операцию.
Как видно на изображении, перемещаемая с первого адреса сумма через цепочку адресов уменьшилась на сумму 3-х сдач и 3-х комиссий, но именно по большей сумме мы ориентируемся для определения направления вывода средств.
Эвристика по круглой сумме платежа
При инициации криптовалютного платежа пользователь вводит в своем программном кошельке адрес получателя, сумму платежа и размер комиссии за транзакцию. Кошелек выберет адреса входов транзакции и сгенерирует выход для сдачи, если необходимо.
Сумма сдачи при простом расходовании рассчитывается следующим образом: «Сумма входа - сумма платежа - размер транзакции (в vБайт) * ставка комиссии сети (в сат./vБайт)»
Специально сгенерировать выход со сдачей на круглую сумму пользователю затруднительно. Поэтому эта эвристика заключается в том, что в простой расходной транзакции выход с круглой суммой, вероятно, является платежом, а значит, оставшийся выход предназначен для получения сдачи.
Эвристика общей траты
Она исходит из того, что поскольку разные адреса отправляют средства в одной транзакции и имеют доступ к приватным ключам друг друга, можно предположить, что все они принадлежат одному владельцу или управляются одним сервисом.
Однако существуют механизмы CoinJoin, позволяющие объединять входы от разных отправителей в одну транзакцию для ее анонимизации. Более подробно об этом читайте в нашем материале Криптовалютные миксеры. Чтобы не перепутать такую транзакцию и применить эвристику общей траты, исследователи используют дополнительную эвристику общей сдачи.
Эвристика общей сдачи
Каждый раз, когда в сети биткойн происходит транзакция, узел упаковывает транзакцию и записывает ее в блокчейн-регистр. После осуществления перевода и снятия комиссии за транзакцию оставшиеся средства чаще всего сохраняются на новом адресе (адресе сдачи). Эвристика общей сдачи исходит из того, что адрес отправителя и адрес сдачи принадлежат одному владельцу.
Большинство программных биткойн-кошельков для получения сдачи автоматически генерируют новые адреса. Однако существует такое понятие как повторное использование адресов: программный биткоин-кошелек можно настроить так, чтобы направить сдачу на тот же адрес, откуда эта транзакция вышла. Такое поведение обычно указывает на централизованный сервис либо старые версии кошелька Bitcoin Core. Примером такой транзакции может быть: 859878cbe79f7cd4a2be5d4c5e2f80bbe5230a1e33ed3b0318b75288acbf721f.
Значительная часть традиционного блокчейн-анализа основывается на определении выхода со сдачей. Если выход со сдачей можно успешно определить, это дает возможность отследить активность этого пользователя в серии транзакций, увеличивая степень агрегации между несколькими различными адресами.
Эвристический алгоритм, основанный на анализе транзакций Coinbase
Транзакции Coinbase — это особый тип транзакции, который не требует ранее существующих выходов. Такие транзакции с вознаграждением специально выделяются майнеру за его работу.
Когда был запущен Биткойн, майнинг можно было разделить на два типа: промышленный и индивидуальный. С развитием технологий эффективных вычислений самостоятельный майнинг постепенно исчезает, и тенденция майнинга развивается в сторону появления крупных майнинговых пулов. Более подробно об этом можно почитать в нашем материале Что такое майнинг пулы.
Эвристика, основанная на анализе Coinbase транзакций, заключается в том, что поскольку отдельные майнеры в большинстве случаев работают через майнинг пулы, то если несколько адресов отправляют средства на один или несколько адресов, принадлежащих такому пулу, то и адреса – отправители скорее всего будут принадлежать ему же.
Эвристика кластеризации адресов нескольких майнинг пулов
Усовершенствованный вариант предыдущей эвристики. Правило эвристической кластеризации заключается в том, что если в транзакции более ста исходящих адресов, и известно, что один из них принадлежит определенному майнинг пулу, то мы можем отнести все такие исходящие адреса к нему.
Эвристика распознавания смешанных транзакций
Сервисы микширования позволяют пользователям смешивать свои средства со средствами других пользователей, тем самым усложняя возможности по отслеживанию средств для достижения целей анонимности. В блокчейне миксеры выглядят как смешанные транзакции, состоящие из нескольких входов и нескольких выходов. Обычно для миксеров характерно наличие более 4-х входящих и исходящих транзакций, также им присущи одинаковые суммы в транзакции при проведении операций.
Эвристика заключается в нахождении правил по которым работает алгоритм миксера и определении соответствий между входным адресом и выходным адресом.
Эвристики демиксинга используются аналитическими сервисами и профессиональными исследователями, однако всегда можно посмотреть, куда средства ушли после миксера, сопоставив по цепочкам суммы направленных в миксер средств за вычетом комиссии миксера.
Существуют и другие более сложные эвристики, основанные на математическом анализе, которые позволяют решить задачу деанонимизации.
Необходимо отметить, что по отдельности каждая из этих эвристик может давать неточные результаты. Так, например, с появлением техники clusterfuck есть случаи, когда нельзя однозначно определить, какой из адресов является сдачей. Но в сочетании с дополнительными закономерностями в транзакциях или с внешними данными, такими как маркированные кластеры кошельков, эффективность эвристик для отслеживания значительно повышается.
Кроме того, на основе эвристик аналитические системы группируют (объединяют) адреса в кластеры по принципу обладания рядом общих свойств.
При этом, установив связь между несколькими адресами и объединив их в один кластер, без дополнительной информации идентифицировать владельца вряд ли получится. Но эту информацию можно использовать при исследовании связей с уже известными сущностями. Также, если при использовании дополнительных источников данных станет ясно, что один из адресов в кластере принадлежит какой-то сущности, то эту информацию можно распространить на весь кластер. Таким образом, кластеризация позволяет существенно увеличить количество деанонимизированных адресов.
Заключение
Применение различных эвристик и кластеризация сможет повысить эффективность работы по исследованию взаимосвязей между криптовалютными адресами и позволит определить принадлежность различных адресов одному владельцу, определенной категории сущностей, либо понять направление движения средств.
Для решения задач деанонимизации, помимо рассмотренных аналитических методов, активно применяется анализ графа транзакций, сбор информации в сети интернет (в том числе методами web-scrapping и OSINT), а также иные методы. Наиболее эффективно использование всего арсенала имеющихся методов для проведения качественного анализа криптовалютных адресов, а также использование инструмента аналитики ШАРД.
Более подробно о других методах деанонимизации криптовалютных адресов мы расскажем в наших ближайших публикациях.
Обо всех случаях, связанных с конкретными адресами криптовалюты и рассматриваемыми рисками, Вы можете сообщить на сайте в разделе «Сообщить о подозрительном адресе», чтобы уберечь других пользователей от рисков взаимодействия с такими адресами и их владельцами.