CAPTCHA отстой! Так почему бы не обойти это!?

CAPTCHA отстой! Так почему бы не обойти это!?

17 февраля 2022 г.

Вы знаете, что CAPTCHA отстой!


Это означает «Полностью автоматизированный общедоступный тест Тьюринга, позволяющий отличить компьютеры от людей». Существуют различные типы, такие как текстовые или графические вопросы или даже быстрые головоломки.


Идея состоит в том, чтобы задать вопрос, на который машина не может ответить правильно, чтобы убедиться, что форму пытается отправить человек, а не спам-робот.


Вот базовая CAPTCHA:



CAPTCHA устарела


Это огромная боль для пользователей и ужасно для доступности, но, по крайней мере, раньше было эффективно предотвращать автоматическое заполнение форм программами. Я говорю «было», потому что это уже не так.


С появлением машинного обучения и компьютерного зрения спамерам относительно легко успешно пройти такие тесты.


Довольно простым, но все же мощным подходом было бы загрузить сотни примеров изображений, используемых в CAPTCHA, решить их вручную и обучить модель с результатами, чтобы машина научилась это делать.


Существует множество бесплатных библиотек с открытым исходным кодом, которые могут генерировать CAPTCHA, поэтому получение материала не является самой сложной задачей. Кроме того, сам код довольно прост.


Конечно, некоторые CAPTCHA намного сложнее, чем другие, но если мы рассмотрим наиболее широко используемые, то это часто буквы или сочетание цифр и букв, поэтому их еще проще воспроизвести. Вам нужен только алфавит "ABCDEFGHIJKLMNOPQRSTUVWXYZ" и целые числа "0123456789".


Затем вы можете генерировать тысячи изображений со случайными комбинациями.


Это практическое упражнение, которое вы можете попробовать, если хотите погрузиться в глубокое обучение, но, допустим, вы ленивы или у вас нет на это времени. На GitHub буквально сотни [решателей CAPTCHA с открытым исходным кодом] (https://github.com/topics/captcha-solver?l=python).


Обратите внимание, что это не ограничивается нашим базовым примером с буквами и цифрами. Модели могут отображать сложные изображения и более сложные проблемы.


Вероятность успеха не 100%, но довольно высока (~80% в среднем), включая ReCAPTCHA. Даже службы решения CAPTCHA, такие как [Anti-Captcha] (https://anti-captcha.com/apidoc) и расширения для браузера, могут быть использованы для устранения хлопот.


Зачем обманывать CAPTCHA и почему иногда вы должны ошибаться


Вы можете задаться вопросом, какого черта нам нужно обходить такую ​​защиту, но это не всегда незаконно. Хотя спамеры и массовые рассылки любят такие методы, могут быть законные причины для использования решателя капчи, например:


  • вы не спамер и ненавидите CAPTCHA

  • у вас нет времени на плохо реализованную CAPTCHA, которая два раза из трех не проходит без причины

  • вы маскируете свой реальный IP-адрес с помощью VPN, и многие онлайн-сервисы, такие как Google Search, систематически блокируют эти IP-адреса

Поскольку решения CAPTCHA имеют слишком много ограничений, таких как культурные сдвиги и другие существенные различия от одной страны к другой, тесты должны быть кросс-культурными и кросс-языковыми, что сложно реализовать.


Кроме того, дело не в том, что роботы настолько уникальны, а в том, что люди больше разбираются в разгадывании CAPTCHA.


Большие компании, такие как Amazon, Google или Facebook, усугубляют ситуацию, ИМХО, потому что CAPTCHA становится все более и более изощренной до такой степени, что иногда ее невозможно решить специально, как обратный способ определить, человек ты или нет.


Ведь такие CAPTCHA должны решать только роботы 😈.


Также опубликовано [Здесь] (https://blog.julien-maury.dev/en/snippets/fool-captcha-ml/)



Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE