Перейти к содержимому

Google recaptcha что это такое

  • автор:

Recaptcha: что это такое, как отключить рекапчу и зачем она нужна?

Lorem ipsum dolor

С ReCaptcha сталкивались все пользователи интернета, но не каждый понимает , что это на самом деле. На первый взгляд , это защита от роботов. Но при более глубоком изучении начинаешь понимать, что ReCaptcha несет в себе и другие функции.

В этой статье будем разбираться с вопросом : «ReCaptcha — что это?», а также с видами рекапчи и для чего она нужна на самом деле.

ReCaptcha — что это

ReCaptcha — это производная от Captcha. Капча — это искаженный набор чисел, букв и их комбинаций, который легко различает человек, но практически не различает робот. Поэтому главная идея Captcha и ReCaptcha — это защитить ресурс, где они расположены, от нашествия роботов. Поэтому можно смело сказать, что данные меры защиты помогают достичь улучшенных показателей безопасности сайта.

История и виды капчи

  1. Графическая. Как правило , это некое изображение с определенной последовательностью сильно искаженных символов. В качестве символов выступают буквы, цифры и специальные знаки.
  2. Логическая. В этот вид включают капчи, в которых просят выбрать из нескольких различных картинок одинаковые по смыслу или подходящие к конкретной тематик е . Все хоть раз проходили такую капчу и отмечали картинки, где изображен автобус, собака, автомобиль, светофор и др. Также к этому виду относят капчи, где нужно решить небольшие математические задачки.
  3. Поведенческая. Ставили хоть раз в жизни галочку «Я не робот» — вот это та самая поведенческая капча. Также сюда относят такой вид капчи, когда нужно повернуть изображение до нормального состояния.
  4. Звуковая. Как правило, любая из вышеперечисленных капч может быть звуковой. Если присмотреться, то во многих проходимых капчах есть значок «наушники». Если его нажать, то вам будет представлена звуковая капча, которую нужно будет ввести.

Что такое ReCaptcha

ReCaptcha — это отдельная технология, которую разрабатывает и поддерживает компания Google. Она выполняет все ту же функцию, что и другие виды капч, то есть защищает веб-сайты от роботов, но при этом компания Гугл внедрила еще одну «хитрую» функцию — она оцифровывает старые печатные издания (книги, журналы, газеты) руками, а точнее , глазами обычных пользователей и, заметьте, совершенно бесплатно.

Все мы сталкивались с таким видом ReCaptcha, когда нас просят ввести 2 слова, чтобы ее пройти. Как правило, эти слова не самого лучшего качества и довольно плохо различаемые, именно поэтому их предлагают вам.

Как это происходит с технической стороны

С технической стороны происходит так. Допустим , оцифровывается какой-либо старый письменный документ. Для оцифровки применяется искусственный интеллект. Если документ не лучшего качества, то в нем после ИИ останутся слова, которые он не смог разобрать.

Эти слова сканируют и отправляют в ReCaptcha, чтобы их распознали обычные люди. Естественно, обычные люди распознают их лучше , чем искусственный интеллект. После такого распознавания собираются ответы пользователей , и тот вариант, который набрал большинство ответов , считается правильным. Эта информация возвращается искусственному интеллекту в качестве новой порции для обучения. Русское секс видео, русское порно , русский секс.

У вас может возникнуть вопрос : «Если в ReCaptcha 2 слова, а процесс «распознавания» предполагает, что ответ может быть внесен неверно, тогда получается, что можно 2 слова ввести неверно и пройти ReCaptcha? ». Дело в том, что одно из двух слов в ReCaptcha уже известно и доказано, а второе вы распознаете. Поэтому, если вы внесете ошибку в 2-х словах, вы ReCaptcha не пройдете. А самое главное — вам не сообщают, какое из слов уже известно, поэтому вы вынуждены оба слова вводить верно.

Google в ReCaptcha не остановились только на распознавании текстов. Они таким же образом распознают и обучают искусственный интеллект распознавать объекты на картинках и даже карты. Встречали ReCaptcha, где вас просят найти автобус, машину или какое-либо животное на картинках? Решая такие ReCaptcha, вы не только проходите проверку на « роботность » , но и вносите свою лепту в обучение искусственного интеллекта.

ReCaptcha: волшебство

А волш е бство заключается вот в чем. Обычные пользователи говорят, что ничего страшного, если , разгадывая ReCaptcha, мы обучаем искусственный интеллект. А необычные пользователи говорят, что с этической стороны это неправильный подход. Потому что обучение ИИ стоит денег. И многие компании платят Гуглу за то , что эта компания помогает их искусственному интеллекту обучаться. Вот и получается, что , проходя ReCaptcha, вы не просто получаете доступ к желанному ресурсу и помогаете обучать ИИ — вы еще и помогаете компании Google заработать на этом денег. То есть, по сути , присутствует бесплатный труд миллионов пользователей, которые сталкиваются с ReCaptcha каждый день.

Но ирония заключается в том, что есть сервисы, которые предлагают заработать денег на решении ReCaptcha от Google. Получаются, что все, кто там работает и зарабатывает копейки, работают не только на сервис, но и на Гугл.

Заключение

Несмотря на бесплатный труд, ReCaptcha — это то, что способно защитить ваш ресурс от роботов. Самое главное, что если вас смущает этическая сторона вопроса, то вас никто не заставляет устанавливать ее на свой веб-ресурс. Для этого можно воспользоваться другими вариантами Captcha, благо их в сети очень много и есть из чего выбирать.

Мы будем очень благодарны

если под понравившемся материалом Вы нажмёте одну из кнопок социальных сетей и поделитесь с друзьями.

Как работает reCAPTCHA?

В обсуждении моего недавнего перевода замечательнейшей статьи про CAPTCHA несколько раз появлялись вопросы насчет reCAPTCHA, а именно как же эта система работает. Под катом я в общих чертах объясню суть reCAPTCHA, наглядно покажу как она работает и каким же образом она цифрует книжки.

Расскажу я все достаточно кратко, но зато понятно. Приведенные иллюстрации были взяты с официального сайта reCAPTCHA

Stop spam

По своей сущности, reCAPTCHA выполняет ту же функцию, которую выполняют другие капчи. Суть проста, вводим предложенный текст и тем самым доказываем, что мы не робот. Главным отличием от других систем является то, что reCAPTCHA не только защищает сайт от спамеров, но еще и выполняет другую, достаточно интересную функцию.

Read books

Как вы наверняка заметили, reCAPTCHA предлагает ввести два слова, что практически не встречается у других капч. Суть в том, что пользователь при вводе этих слов не только доказывает, что он человек, но еще и помогает распознавать старые книги и газеты.

Принцип работы прост:
Допустим, есть энная книга, которая сохранилась в малом количестве экземпляров, при этом все они в плохом состоянии. Один экземпляр в отсканированном виде попал в руки Google (владелец reCAPTCHA). Что с ним делать? Правильно, цифровать (и дело тут не только в сохранении наследия, но об этом позже). Как цифровать? Цифровать, используя системы распознавания символов (OCR). Но, как многим известно, эти системы очень часто грешат многочисленными ошибками в выданном результате. Вручную перебирать весь текст на предмет ошибок — слишком дорогое удовольствие. И вот, на помощь приходит reCAPTCHA. Одно слово в изображении распозналось системой OCR правильно, а вот второе никак нет. Второе слово — за пользователем, именно то, что он введет будет использовано в качестве замены ошибочному варианту, предложенным OCR. Наверняка сейчас некоторые усмехнутся, да, я знаю про то, что фактически вместо второго слова можно ввести что угодно. Но каждое непонятное для OCR слово reCAPTCHA показывает пользователям сотни, а то и тысячи раз (при цифре в 200 миллионов генераций в день это очень мало), и в конечном итоге правильным считается тот вариант, который пользователи вводили чаще всего.

От скучного текста перейдем к иллюстрациям:

Вот так выглядит отсканированный текст. Качество, можно сказать, на высоте, но давайте же взглянем на результат работы OCR:

Красным выделены ошибки. Не правда ли их слишком много? А теперь посмотрим, что же будет результатом работы reCAPTCHA:

Не надо быть семи пядей во лбу, что бы увидеть разницу между OCR и дуэтом OCR + reCAPTCHA. Оцифровка получилась 100% безошибочной.

Разумеется, это что-то вроде идеальной ситуации, где все складывается так, как задумывалось создателями reCAPTCHA. Но наверняка многие из вас сталкивались с абсолютно нечитаемыми словами, предлагаемыми для ввода. Проблема в том, что некоторые книги \ газеты сохранились настолько плохо, что порой и вручную они распознаются отвратительно. Вот пример:

Изображение отвратительного качества. Посмотрим, что тут сможет сделать OCR…

… а ничего. Ошибки не подсвечены потому, что все это — одна большая ошибка.

Зато силами reCAPTCHA результат становится вполне себе читаемым, хоть и не безошибочным.

Именно таким образом пользователи помогают оцифровывать книжки средствами reCAPTCHA. По-моему, это прекрасно.

Я ничего не понял!

Вкратце: изображение, генерируемое reCAPTCHA, состоит из двух отсканированных слов. Одно уже заведомо известно системе, насчет второго же есть сомнения. Именно это второе слово и есть объект для распознавания силами пользователей. Грубо говоря, интерфейс reCAPTCHA мог бы выглядеть и вот так:

Скрипты для распознавания

Бытует ошибочное мнение, что reCAPTCHA невозможно взломать (речь идет об автоматическом распознавании приведенного текста, без участия человека). Однако, судя по тенденциям, это не так. С течением времени reCAPTCHA понаделала различных подводных камней для систем распознавания. Среди них искривление текста, пересечение его полосами, так же недавно была введена фича, благодаря которой проверочное (известное системе) слово выглядит сдвоенным. Все это указывает на то, что reCAPTCHA все таки испытывает некоторые трудности с защитой.

Никто и не подозревал

Есть люди, которые критикуют reCAPTCHA, и с этической точки зрения, критикуют они не зря. Дело в том, что за распознанный текст Google так или иначе получает деньги. А сами тексты добываются вполне себе бесплатно, силами пользователей. То есть, тут имеет место бесплатный труд. Лично меня это не волнует, к тому же, никто не заставляет пользователей вводить reCAPTCHA, и более того, никто не заставляет веб-мастеров устанавливать ее на свои сайты 🙂

Ирония

Наверняка некоторые из вас, прочитав предыдущий абзац, поняли, что тут что-то не так. Все знают о сервисах по ручному распознаванию капчи, где миллионы азиатов вводят капчу за гроши. Итак, если принять во внимание предыдущий абзац, то получается, что эти азиаты работают не только на сервис по распознаванию, они работают и на Google. Бесплатно.

reCAPTCHA v3

В июле 2019 года мы стали получать от клиентов жалобы на приходящий спам, несмотря на то, что с 2015 года на всех наших сайтах установлен механизм защиты reCAPTCHA 2.0 от Google. До определенного времени этот метод работал идеально. Но на сегодняшний момент он даёт сбои — злоумышленники научились использовать искусственный интеллект для взлома капчи с целью отправки нежелательного спама.

Выход есть!

В мае 2019 года компания Google выпустила новую версию своей капчи — reCAPTCHA 3.0.

Мы сразу сделали интеграцию с новым сервисом. И теперь в тестовом режиме запускаем его на своих сайтах.

Немного истории

2000 г.

2000-ые

2011 г.

2014 г.

2019 г.

Как работает reCAPTCHA 3.0, и в чем ее отличие от существующих методов защиты

Третья версия reCAPTCHA использует искусственный интеллект для определения вашего статуса (человек или бот?). Во время нахождения пользователя на сайте система в фоновом режиме постоянно проводит анализ поведения и действий пользователя. Грубо говоря, программа «смотрит» на движения мышкой, следит за нажатиями на клавиатуру, движениями пальцем по экрану смартфона. Затем она сравнивает это поведение с другими пользователями, со стандартными человеческими шаблонами поведения и делает вывод по поводу того, кто пытается отправить форму: человек или же бот, эмулирующий действия человека. Каждому посетителю сайта система выставляет «балл» в процентном отношении. И этот процент определяет степень вероятности того, что пользователь — человек, по следующему принципу: 0% — точно бот, 100% — точно человек.

А администратор сайта самостоятельно может настраивать порог фильтрации. Например, если это просто форма обратной связи, то лучше выставить порог в 90%. Очень маловероятно, что бот пройдет через капчу. Если же это интернет-магазин, и потеря даже одного заказа существенна, то лучше выставить порог в 30%, тогда вероятность, что человек не сможет пройти капчу, снижается, и вы точно не потеряете заказ.

А есть ли минусы в новой капче?

Минусы новой капчи

Основное достоинство новой капчи — это то что она работает полностью в фоновом режиме, и пользователь никак с ней не взаимодействует. Отсюда и вытекает единственный недостаток: в случае, если система посчитала вас ботом, у вас не будет возможности доказать обратное — вы получите предупреждение и не сможете отправить свою заявку/вопрос. Но такое в основном встречается только на новых сайтах, где алгоритмы пока еще «не научились» на ваших пользователях.

Что делать:

  • Набраться терпения и ждать. Как уверяет компания Google, и как показали результаты наших собственных тестов, обучение капчи на новом сайте происходит достаточно быстро, буквально за считанные дни при посещаемости от 100 человек в сутки. После обучения достоверность срабатывания алгоритма превышает 99,5%.
  • Снизить порог фильтрации. Многим хочется сразу выставить 100% и быть уверенным, что спам точно не пройдет, но в реальности разумнее для начала ставить цифру в пределах 30-70%.
  • Настроить двухфакторную авторизацию на сайте. Если система считает вас ботом, можно перейти ко второму шагу — подтверждению вашего статуса по коду смс.

В чем опасность бездействия?

Вы можете получить подобное сообщение

Возможные последствия:

  • попадание домена сайта в спам-базы почтовых сервисов;
  • большое количество лишних писем в почтовике, проблемы с поиском действительно нужной информации;
  • возросшая нагрузка на сервер сайта из-за обхода капчи может привести как к его подвисанию, так и к временной блокировке.

Установка reCAPTCHA 3.0 специалистами «Линкол»

Установка новой капчи займет не более одного рабочего дня!

Как работает ReCAPTCHA от Google: Самообман и раздвоение личности

Основатель Silktide, Оливер Эмбертон рассказал о том, насколько сложен и опасен для ботов маленький флажок «Я не робот» от Google. Действительно ли всё так серьёзно?

Мы в Бот-факторе порассуждали на эту тему, учитывая то, что недавно было объявлено о создании бота, который проходит первый уровень капчи за несколько секунд, и не только.

Для того, чтобы установить значок «Я не робот» — Google в свое время создал виртуальный имитированный компьютер, использующий собственный язык двух-фазового шифрования. Вся штука в том, что в периоде от первой до второй фазы — машина изменяет: во-первых, сам язык; во-вторых, сам ключ. Наглядно, это выражается в том, что в пазл-конструкторе, у вас всегда появляется новый светофор.

А количество новых светофоров, будет зависеть напрямую от истории вашего IP и браузера:

reCAPTCHA это ключ, который в момент вашего визита — определяет, безопасно ли данное посещение для сайта, с точки зрения, ранее просмотренных вами страниц, логики ваших интересов, соответствия «бюджета» сайта вашим расходам.

Иными словами, чистый браузер с новым аккаунтом пройдёт проверку на любом сайте гораздо быстрее. В сфере web-мошенничества, такие аккаунты стоят дешевле всего, тем не менее — лучше всего, reCAPTCHA работает именно для них. (Кстати, новый пазл в сборнике светофоров — это совершенно новый ключ, другая капча).

Последние технологии Google, отслеживают самые «микроскопические» изменения в «отпечатках пальцев» вашей Google-личности: часовой пояс и время вашего компьютера; IP-адрес и приблизительное местоположение; размер экрана и разрешение; браузер, который вы используете; плагины, которые вы используете; сколько времени потребовалось для отображения страницы; сколько нажатий клавиш, щелчков мышью и нажатий / прокрутки было сделано; процент «странного поведения», количество ваших характеров (типов личности, вашего раздвоения личности), списка настроений, и многое другое.

Оливер Эмбертон, Основатель Silktide

После нажатия флажка «Я не робот», CAPTCHA предлагает вашему браузеру отправить в Google невидимое изображение, которое содержит бессмысленный шрифт по результату вашей «истории» (соответственно, в Google — шрифт должен преобразиться в системный и стать понятным). Известно, что современные боты стараются подделывать, в частности, данный мессендж (от того, процветают «левые» сайты, где после ввода капчи, уже не происходит ничего интересного или выдаётся ошибка — тем временем, ваши данные украдены).

Почти каждый в Интернете использует что-то, принадлежащее Google — поиск, почту, рекламу, карты, видео. Google наблюдает за поведением миллиардов людей, но есть одна большая проблема: люди не повторяются в своем поведении никогда. По этой причине, чаще всего, ботоводы занимаются поставкой реального, но вчерашнего поведения ботов-имитаторов на сайты.

Поведению ботов на сайте задаются убедительные задержки, спотыкания при наборе букв, ошибки в словах.

Оливер Эмбертон убежден, что reCAPTCHA от Google слишком занята собственным самообманом, для того чтобы запутать ботов; а ботоделы заняты обманом Google; и эта гонка перевооружения прекратится лишь когда мировой прогресс ИИ достигнет наиболее качественного превосходства в своей сфере.

Действительно ли reCAPTCHA кому-то из нас помогала? Есть ли в ней хоть что-то полезное, кроме отправки своих данных в Google, для их последующей интеграции в основу рекламных продуктов?

Используете ли вы CAPTCHA на своих сайтах?
Да, и сайт ощущал эффективность
Да, но не знаю для чего
Нет, некогда было
Нет, это бесполезно
Показать результаты
Переголосовать
Проголосовать
29K открытий
35 комментариев
Написать комментарий.

Отвратительный перевод. Читать невозможно, нихера не понятно

Развернуть ветку
Развернуть ветку

Рад, что вы перешли со Spark на Vc, учтите что здесь выше конкуренция, и больше брызжущих желчью завистников-хейтеров. Один дурак подумал, что это перевод и ляпнул, что его мозгам это непонятно, другие поддержали)) тем не менее 1,7к чтений. возвращайтесь кстати к политической повестке, было круто;)

Развернуть ветку

Если это не перевод, то автор — робот, пишущий тексты.

Развернуть ветку

Какие-то обрывки мыслей. Что хотел сказать автор? Зачем эта статья на VC.ru? Интересная тема, из который вырезали саму суть.

Развернуть ветку

Статью наш ИИ писал. Вполне сносно для первого раза.
Кроме болтунов на VC ещё есть думающие люди —
как вариант, есть две категории смыслового посыла:
— либо читателю доставляется факт, это когда тема хороша изучена;
— либо читателю оставляется пространство для идей и творчества,
когда есть немного информации+немного исследования+немного опыта.

Проблема поколения в том, что все перебирают день вчерашний,
и лишь немногие — ставят эксперименты и двигают прогресс.

Развернуть ветку

Ну ИИ стоит научить хотя бы классике жанра: завязка, развитие, описание проблемы, решение, вывод. А то по строчке из какой-то, не сомневаюсь, полезной статьи достали и как-то скомкано изложили непонятно что хотя сказать.

Развернуть ветку

А также задан риторический вопрос, подумайте наконец, нужна ли вам капча или устанавливаете ее по закону жанра, до кучи? Почему например нет капчи у vc, икеи, рибок, да вообще провести бы анализ, кто её ставит? В этом смысле хотелось бы больше эмпирического от автора.

Развернуть ветку

Ненавижу эту капчу! Просит знак, клацаешь на знак — неправильно, потом по новой тыкаешь его и опять мимо, один раз пришлось жену просить пройти этот квест!

Развернуть ветку

Одного киборга нашли, товарищ майор

Развернуть ветку

тогда уж товарищ старший уорент-офицер 4 класса

Развернуть ветку

Это разве не способ обучения ультраглобальной нейросети для дальнейшего ее использования в беспилотных автомобилях?

Развернуть ветку

Для пользователя плюсов от рекапчи нет, а для владельцев сайтов очень даже.

Развернуть ветку

Перевод для тех, кто не понял сути: капча от гугла не просто картинка или защита от бота. Капча собирает наши данные, и пытается их всячески маскировать, чтоб не стырили. Но при такой-то защите, их всё равно тырят.

Развернуть ветку
Развернуть ветку

43 человека никогда не устанавливали на сайт капчу: половина из них считает её бесполезной, половине было некогда установить;
23 человека пользуются капчой, и считают её эффективной для сайта;
7 человек установили её просто так;

В статье о том, что такое современная капча от google

Развернуть ветку

Tech PR, который мы заслужили

Развернуть ветку

Да, это не попса в стиле «Цените какой я успешный» или «Миллион уникальных советов в новой интерпретации», и конечно не новость о том, как Греф чихнул в офисе и его тут же медиа облизали, выплюнув инфо.повод 🙂

Развернуть ветку

Вы в шаге от того, что в 2019 году называют «токсичностью», на вашем месте попридержал бы коней.

Развернуть ветку

Не раскроете данное определение?

Развернуть ветку

Источаете желчь без повода — мало кому это будет нравиться.

Развернуть ветку

На мой взгляд, это ответ иронией (смайл же стоит) на иронию.
Я не преследую цели, упрекнуть вас в обслуживании Сбербанка, например.
И тем более, мне не завидно, что я не Греф. Серьёзно, это просто бизнес.
Спасибо.

Развернуть ветку

Да я не про себя, в целом — в дальнейшем такой стиль общения будет вам сильно мешать.

Развернуть ветку

Думается, что в данном случае — токсичность исходит от вас.
Разберем ситуацию:
1. Очевидно, юзеру, не понравился материал, либо его не вдохновили комментарии. На что, он иронично (на мой взгляд — иронично, т.е. без злобы, без адресной критики) подметил:
«Tech PR, который мы заслужили».
2. Автору материала, понравился данный комментарий, и он также, с абсолютной иронией добавил:
[Да] — (читай между строк — «соглашусь с вами»), это [не попса в стиле. выплюнув инфо.повод] — (определяй, как саркастическая оценка раздела «Популярное» на VC) > Но, данный сарказм адресован не в сторону юзера, участвующего в диалоге. Как говорят, в драматургии, «арка не закрыта». Соответственно, каждый вправе судить так, как ему понятно — я же, вправе это называть скорее «самоиронией»:
3. Затем к диалогу подключается Главред VC, очевидно, принимая моё рассуждение на свой счёт, оценивает качество моего общения, и даёт совет, подводя заключение, что мое ревью — есть «желчь без повода».

Вот в чем вы не разобрались:
— Я не имею ничего против политики VC, и контекста популярных материалов;
— Я тоже, очень сильно хочу, и люблю писать «попсу».
— Я стараюсь это делать, и подмечаю: «Да, [к сожалению] пока что, это не так [это ещё не попса]».

Развернуть ветку

Я про все ваши комментарии в целом, а не про этот. Аналитический аппарат у вас немного сбоит ��И на свой счёт я ничего не принимал, если честно, не знаю, с чего вы это взяли.

Развернуть ветку

А по мне, так ваши аналитические волны не достают до моих 🙂

Развернуть ветку

Ну вот это как раз то, о чём я говорил. Ладно, просто будьте аккуратнее, пожалуйста.

Развернуть ветку

Вы мнительны. Избавляйтесь от этого — от души. Я тоже был мнительным. В школе, в универе, на первых двух работах — впрочем всегда, когда меня окружало большое количество людей, от которых зависело моё комфортное существование в конкретной, но не подходящей для меня, социальной ячейке общества.

Развернуть ветку

Снисходительный тон — это именно то, к чему нужно прибегать, когда вас просто просят не хамить другим людям на площадке, да.

Развернуть ветку

Если вы так считаете, то почему же вы адресовали ваши советы, мне — а не тем, кто действительно хамит? То есть, условно тому — кто защищается, а не тем — кто нападает? Ведь наши комментарии с пользователями, как минимум, чуть меньше, чем равны — хотя бы по тону ответа, я уже не говорю о посылах комментариев.

Или вы имеете в виду себя, мою оценку вашей мнительности?

Развернуть ветку

Ну, на каждого заведена своя папочка, не волнуйтесь!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *