¿Porqué se han vuelto tan complicados los CAPTCHA?

¿

En algún momento del año pasado, las solicitudes de Google para demostrar que soy humano se han vuelto cada vez más intensas y complicadas. Todo comenzó con el simple y ligeramente dulce botón «No soy un robot», después, tuvimos que demostrar que somos humanos seleccionando todos los semáforos, pasos de peatones y escaparates o colinas y montañas. Ahora, los semáforos se hunden en entre el bosque, los pasos de peatones giran y los escaparates se oscurecen y se escriben en coreano. Hay algo absolutamente aterrador en pedir que identifiques una boca de incendios y trates de encontrarla.

Estas pruebas se conocen como CAPTCHA, abreviatura de Completely Automated Public Turing test to tell Computers and Humans Apart (Prueba de Turing Pública Completamente Automatizada), que tienen como objetivo distinguir los bots de los humanos y han alcanzado este nivel incomprensible. A principios de la década de 2000, las imágenes de texto simples eran suficientes para confundir a la mayoría de los robots de spam. Pero una década más tarde, después de que Google adquiriera el programa de los investigadores de Carnegie Mellon y lo usara para digitalizar Google Books, los textos tuvieron que distorsionarse y ocultarse cada vez más para adelantarse a los programas OCR mejorados.

Debido a que CAPTCHA es una herramienta elegante para aprender Inteligencia Artificial (IA), cada prueba solo puede ser temporal y sus desarrolladores lo han sabido desde el principio. Con todos los investigadores, estafadores y gente común resolviendo miles de millones de acertijos por encima del umbral de las capacidades de la IA, en algún momento las máquinas nos superarán. En 2014, Google comparó uno de sus algoritmos de Machine Learning con humanos para resolver los CAPTCHA de texto más engañosos: los bots pasaron con éxito la prueba el 99,8 % de las veces, mientras que los humanos solo lograron el 33%.

Viendo estos resultados, Google cambió a NoCaptcha ReCaptcha, una herramienta de análisis de datos y comportamiento del usuario que permite que algunas personas hagan clic en el botón «No soy un robot» y les da a otras etiquetas visuales que vemos hoy. Pero las máquinas se están poniendo al día de nuevo.

Jason Polakis, profesor de ciencias de la computación en la Universidad de Illinois en Chicago, asume la responsabilidad personal por el reciente aumento en la dificultad de CAPTCHA. En 2016, publicó un artículo que utilizó herramientas estándar de reconocimiento de imágenes, incluida la búsqueda inversa de imágenes de Google, para resolver el problema de CAPTCHA de imágenes de Google con un 70 % de precisión. Otros investigadores han superado las dificultades del CAPTCHA de audio de Google utilizando los propios programas de reconocimiento de audio de Google.

Según Polakis, el aprendizaje automático ahora es tan bueno en tareas básicas de reconocimiento de texto, imagen y voz como los humanos. De hecho, los algoritmos probablemente sean mejores en esto:

Estamos en un punto en el que dificultar el software termina haciéndolo demasiado difícil para muchas personas. Necesitamos alguna alternativa, pero aún no hay un plan concreto.

La documentación de CAPTCHA está plagada de intentos extraños de encontrar algo más que reconocimiento de texto o imagen en el que los humanos son buenos pero las máquinas tengan problemas. Los investigadores intentaron pedir a los usuarios que clasificaran las imágenes de personas por expresión facial, género y etnia (puedes imaginar lo bien que funciona que un humano haga esta tarea).

Ya hay sugerencias de cuestionarios CAPTCHA basados ​​en rimas populares entre los niños de la región donde se dice que creció el usuario. Dichos CAPTCHA culturales están dirigidos no solo a los bots, sino también a las personas que trabajan en granjas de CAPTCHA extranjeras que resuelven acertijos por una fracción de centavo. La gente ha tratado de interferir con el reconocimiento de imágenes pidiendo a los usuarios una identificación, como un cerdo. Los científicos intentaron pedir a los usuarios que identificaran objetos en lugares similares al Ojo Mágico. Curiosamente, en 2010, los científicos propusieron usar CAPTCHA para indexar petroglifos antiguos porque las computadoras no son muy buenas para leer los gestos de los ciervos, garabatos en la pared de la cueva.

Se han realizado esfuerzos recientes para desarrollar pruebas similares a CAPTCHA que requieren que el usuario gire objetos en un cierto ángulo o mueva las piezas del rompecabezas en su lugar, con instrucciones dadas que no deben estar escritas sino que son simbólicas o implícitas en el contexto del patio de recreo. Con suerte, todos entenderán la lógica del rompecabezas, pero el bot sin instrucciones claras estará en un callejón sin salida. Otros investigadores han intentado capitalizar el hecho de que los humanos tienen cuerpos mediante el uso de cámaras de dispositivos o realidad aumentada para interactuar y probar la humanidad.

El problema con muchas de estas pruebas no es que los bots sean tan inteligentes, sino que los humanos no pueden hacerlo bien. Y no es que la gente sea tonta; son personas extremadamente diversas en idiomas, culturas y experiencias. Cuando guardas todo para tomar una prueba que cualquiera puede pasar sin preparación ni previsión, te quedas con tareas brutales como el procesamiento de imágenes, eso es exactamente lo que hace la IA personalizada.

El experimento está limitado por las capacidades humanas. No se trata solo de nuestras habilidades físicas, necesitas algo [que pueda] cruzar diferentes culturas, diferentes idiomas. Necesitas algún tipo de desafío que se adapte a alguien de Grecia, alguien de Chicago, alguien de Sudáfrica, Irán y Australia al mismo tiempo. Y sucederá independientemente de la complejidad y las diferencias culturales. Necesita algo que sea fácil para la persona promedio, que no necesariamente involucre a un pequeño grupo de personas en particular, pero que sea difícil para una computadora. Esto limita mucho lo que puedes hacer. Y tiene que ser algo que los humanos puedan hacer rápidamente y sin demasiado alboroto.

Descubrir cómo superar estos acertijos de imágenes borrosas te sumergirá rápidamente en un territorio filosófico: ¿qué rasgos puede exhibir una máquina en común que ninguna otra máquina puede imitar? ¿Qué significa ser humano?

Pero quizás lo que somos no se mide por lo bien que hacemos una tarea, sino por cómo nos movemos por el mundo, o en este caso, por Internet. Shuman Gosemajumder, que anteriormente trabajó en Google para abordar el fraude de clics antes de convertirse en director de tecnología de la empresa de detección de bots Shape Security, en lugar de realizar pruebas, prefiere lo que se denomina «autenticación continua», que consiste esencialmente en observar el comportamiento del usuario y buscar signos de automatización.

La gente real no tiene un buen control sobre sus propias funciones motoras, por lo que no pueden mover el mouse de la misma manera una y otra vez en múltiples interacciones, incluso si se esfuerzan mucho

Dijo Gosemayumder. Si bien el bot interactuará con la página sin mover el mouse o mover el mouse con mucha precisión, la acción humana tiene una «entropía» que es difícil de falsificar, dijo Gosemayumder.

El propio equipo de CAPTCHA de Google está pensando de manera similar. La última versión, reCaptcha v3, utiliza un «análisis de riesgo adaptativo» para calificar el tráfico de acuerdo con lo sospechoso que parece; Los propietarios de sitios web pueden optar por presentar a los usuarios incompletos un desafío, como una solicitud de contraseña o autenticación de dos factores. Google no dijo qué factores intervienen en ese puntaje, aparte de que Google observa cómo se ve un montón de «buen tráfico» en un sitio, según Cy Khormaee, gerente de producto en el equipo de CAPTCHA, y usa eso para detectar » tráfico malo.» Los investigadores de seguridad dicen que es probable que sea una combinación de cookies, atributos del navegador, patrones de tráfico y otros factores. Una desventaja del nuevo modelo de detección de bots es que puede hacer que navegar por la web y minimizar la vigilancia sea una experiencia molesta, ya que cosas como las VPN y las extensiones anti-seguimiento pueden marcarlo como sospechoso y cuestionarlo.

Aaron Malenfant, ingeniero principal del equipo de CAPTCHA de Google, dijo que abandonar la prueba de Turing era vencer a un oponente en el que todos seguían fallando.

A medida que las personas invierten cada vez más en el aprendizaje automático, este tipo de tareas se volverán cada vez más difíciles para los humanos, por lo que lanzamos CAPTCHA V3 para mantenernos a la vanguardia del campo.

Malenfant dice que de cinco a diez años, es poco probable que los desafíos de CAPTCHA generen ganancias. En cambio, la mayor parte de Internet tendrá una prueba de Turing secreta, ejecutándose permanentemente en segundo plano.

En su libro The Greatest Man, Brian Christian presenta el Test de Turing como la base de la humanidad y se esfuerza por demostrar su humanidad en la conversación. Por otro lado, los creadores de bots son muy fáciles de engañar, no porque sean los interlocutores más claros o inteligentes, sino porque evitan bromas sin sentido, errores tipográficos o, en el caso de los bots, ganaron la competencia de Turing 2014, que dice ser un niño ucraniano de 13 años, no habla muy bien inglés. Después de todo, es la naturaleza humana estar equivocado. El mismo futuro puede estar en CAPTCHA, la prueba de Turing más utilizada en el mundo: una nueva carrera armamentista, no para construir bots que superen a los humanos en el etiquetado de imágenes y análisis de texto, sino para cometer errores, perder botones, perder el enfoque. y cambiar de pestaña. Gosemajumder dijo: “Creo que la gente entiende que existe una aplicación para imitar a una persona común… o una persona estúpida.

Las pruebas de CAPTCHA también se pueden guardar en este mundo. En 2017, Amazon recibió una patente para un sistema que contiene ilusiones ópticas y acertijos lógicos que son difíciles de resolver para los humanos. Llamada prueba de falla de Turing, la única forma de pasarla es obtener una respuesta incorrecta.

Sobre el autor

Carlos

Me definiría como persona entusiasta que le encanta aprender cosas nuevas, tener retos nuevos y vivir nuevas aventuras constantemente. Además, soy de los que opinan que hay disfrutar y aprovechar al máximo cada momento. Me dedico al Marketing Online, aunque me apasiona la ciencia, las motos y los deportes como el remo, la natación y el MMA.

Añadir comentario