Aquí hay un problema mejor
HogarHogar > Blog > Aquí hay un problema mejor

Aquí hay un problema mejor

Aug 14, 2023

El contenido generado por IA está empezando a contaminar Internet, las empresas y las escuelas a una escala sin precedentes. En algunos casos, puede ser más fácil detectar texto humano que marcar contenido generativo de IA. Como mínimo, podrían complementarse entre sí.

El rápido crecimiento del contenido generado por IA está impulsando el debate sobre cómo los proveedores de IA pueden mejorar las herramientas para detectar contenido generado por IA. Esta es una aspiración importante, pero este tipo de enfoques ya no alcanzan el texto. Y no sólo para los 'sombreros negros' que intentan violar la seguridad de la IA o desestabilizar las democracias. Los estudiantes perezosos, los empleados sobrecargados, los comercializadores de productos sin escrúpulos y los talleres clandestinos de etiquetado de datos violarán fácilmente la mayoría de las salvaguardias con una edición ligera. Un enfoque mucho mejor puede ser detectar humanos utilizando alguna combinación de metadatos paralingüísticos y criptografía de clave pública.

Y están surgiendo herramientas que pueden ayudar a establecer una cadena de procedencia para ello. Como escribí anteriormente en diginomica, los detectores de contenido de IA para video, audio e imágenes podrían aprovechar una larga historia de herramientas de marcas de agua digitales y protección de propiedad intelectual. Sin embargo, las herramientas para detectar automáticamente texto generado por IA son un problema mucho más difícil de resolver. Las marcas de agua digitales son mucho más difíciles de insertar en texto sin formato. Se están logrando algunos avances interesantes en la incorporación de patrones estadísticos, usos gramaticales extraños e incluso convenciones de puntuación en el texto. Un ejemplo fue el esfuerzo de Genius por incorporar un patrón extraño en las letras de sus canciones para demostrar que Google había estado copiando directamente su contenido. Ese caso, sin embargo, no logró ganar el caso judicial.

A los sistemas escolares de todo el mundo les preocupa que los recientes avances en la IA generativa impulsada por el modelo de lenguaje grande (LLM, por sus siglas en inglés) impulsen los esfuerzos de los estudiantes por hacer trampa. A largo plazo, el éxito en este esfuerzo puede generar una gran cosecha de trabajadores incompetentes incapaces de dirigir eficazmente empresas, gobiernos y, bueno, enseñar. Pero éste no es sólo un problema académico. Los gobiernos están comenzando a promulgar leyes sobre prácticas inescrupulosas de revisión de productos y servicios. Actualmente, el Reino Unido está trabajando en una propuesta de ley de mercados digitales, competencia y consumidores que prohíbe el intercambio de dinero o productos gratuitos por escribir reseñas de productos. Es sólo cuestión de tiempo antes de que una legislación similar se extienda a enfoques más automatizados, como los vendedores sin escrúpulos que inventan una multitud de humanos falsos para ensalzar las maravillas de sus productos o hablar mal de las ofertas competitivas.

Y las empresas de etiquetado de datos están empezando a lidiar con una red dispersa de humanos a los que se les paga para aplicar etiquetas al contenido para entrenar a la próxima generación de IA. Estos son esenciales para garantizar que las futuras herramientas de IA puedan mejorar la identificación de objetos en imágenes, examinar contenido tóxico o mejorar el rendimiento de una nueva generación de aplicaciones empresariales de IA. Una preocupación es que los etiquetadores de datos con exceso de trabajo puedan recurrir a ChatGPT y otros LLM. Si bien esto puede ser excelente para la productividad de los datos y algunas tareas de etiquetado de datos. Una desventaja es que capacitar a los LLM en contenido generado por IA podría llevar al colapso del modelo de IA en el que los nuevos modelos no funcionen tan bien.

Hace unos años, la industria bancaria luchaba contra el creciente fraude impulsado por los nuevos servicios en línea. Mientras tanto, una creciente economía de suscripción luchaba con el intercambio de contraseñas, en el que las personas compartían sus contraseñas de servicios de información de gran valor con amigos y familiares. Se observó que hay mucha información incorporada no sólo en el texto de la contraseña sino también en los metadatos sobre cómo se escribe la contraseña. Debido a los diversos estilos, cadencias y ritmos de escritura, las personas tienden a escribir las letras reales de maneras muy diferentes. Varios equipos llaman a esto biometría del comportamiento, dinámica de pulsaciones de teclas o metadatos paralingüísticos. Diferentes variantes de estas técnicas también pueden extender el concepto a técnicas de uso del mouse y entrada de voz.

En el ámbito académico, tendría sentido incorporar medidas de estas métricas de comportamiento en una nueva generación de procesadores de texto. Puede que tampoco sea necesario desarrollar aplicaciones completamente nuevas. Simplemente podrían incorporarse a una biblioteca de código abierto que podrían consumir los procesadores de texto, aplicaciones web y otras herramientas existentes.

También sería importante establecer una cadena de procedencia para reducir el riesgo de que estos metadatos sean manipulados después del hecho. Herramientas más antiguas, como el enfoque de PGP para la criptografía de clave pública, podrían firmar criptográficamente la combinación de texto y metadatos paralingüísticos asociados. Si modifica uno u otro, todo el texto no certificará que usted lo escribió.

Para que esto funcione en el largo plazo, sería necesario abordar varios desafíos obvios. Las preocupaciones sobre la privacidad son grandes. Puede ser útil para las instituciones académicas discernir si un artículo fue escrito por usted o por sus padres demasiado serviciales o si fue cortado y pegado de ChatGPT. Sin embargo, tendría que equilibrarlos con las preocupaciones sobre la privacidad. En algunos escenarios de pruebas supervisadas digitalmente, los estudiantes pueden estar dispuestos a sufrir bajo la atenta mirada de un servicio que bloquea completamente todos sus complementos y garantiza que no haya nadie más ni teléfonos en la sala. Esto no es práctico para el ajetreo y el bullicio de la vida diaria.

Un problema relacionado es que los defensores de la privacidad y los fabricantes de navegadores ya se están manifestando contra las técnicas de toma de huellas digitales de los navegadores. Estos capturan información sobre las combinaciones únicas de complementos, versiones, ubicaciones y otros tipos de metadatos para, a veces, identificar de forma única a las personas en ausencia de cookies. Los enfoques de seguimiento de la procedencia humana necesitarían equilibrar cautelosamente el aumento de la detección de seres humanos con las preocupaciones sobre la privacidad.

También es importante señalar que, si bien algunas técnicas humanas interesantes pueden funcionar desde el primer día, los estudiantes creativamente perezosos, los hackers curiosos y los "sombrero negro" comenzarán a encontrar soluciones para las primeras implementaciones. Como todo lo relacionado con la seguridad, un sistema perfectamente seguro sólo lo es el primer día de su implementación.

En el ámbito relacionado de los detectores de imágenes de IA, la última generación de herramientas busca artefactos biométricos de humanos reales. Por ejemplo, hace unos años, el MIT desarrolló un par de algoritmos interesantes que podían capturar cambios sutiles de color y vibraciones físicas para detectar su frecuencia cardíaca. He jugado con algunas versiones de esto a lo largo de los años y funciona si te quedas muy quieto. Proveedores como Intel están empezando a adoptar principios similares para ver si su vídeo al menos tiene pulso, aunque no es que calibre perfectamente qué tan rápido late con fines médicos.

Sin embargo, el desafío es que muchos generadores de personas falsas utilizan redes generativas de confrontación, lo que enfrenta un algoritmo en entrenamiento con un algoritmo separado utilizado para detectar falsificaciones. Tradicionalmente, estos detectan cosas que parecen falsas para los humanos, y el pulso no ha sido un problema porque la mayoría de nosotros no suele ver los sutiles cambios de color con precisión. Una vez que los nuevos algoritmos de detección de falsos salgan a la luz, simplemente se agregarán a las GAN para engañar con éxito también a los detectores de falsos.

Construir detectores humanos no será fácil por las razones que acabamos de observar. Sin embargo, puede ser más fácil a largo plazo y proporcionar una herramienta complementaria a los enfoques de detección de falsificaciones de IA. Los enfoques de código abierto facilitarán que una comunidad más amplia de expertos en seguridad, investigadores de privacidad, instituciones académicas y empresas solucionen errores utilizando bibliotecas modulares intercambiables. Será necesario desarrollar nuevas actualizaciones cada vez que los estudiantes creativos comiencen a publicar sus trucos inteligentes, de manera muy similar a como los Kia Boys popularizaron un flagrante agujero de seguridad en los autos Kia en TikTok, provocando una ola de crímenes.

Además, estas herramientas no solo necesitan centrarse en descubrir a las personas que hacen pasar el trabajo de IA como humano. Hace unos años, renové mi interés por mis deficiencias al escribir después de haber roto mi tecla 'P' en dos teclados separados. Una observación cuidadosa de mi técnica de mecanografía reveló una extraña costumbre de estirar la mano sobre el teclado para golpearlo con el dedo anular en lugar del dedo meñique, que está en la posición más apropiada. Eso y golpeé todas las teclas con bastante fuerza a pesar de que mis dedos y manos protestaban después de un largo día de esta tortura. Pasar un poco de tiempo explorando una forma más relajada y ergonómica usando la aplicación Keyboard Hero me ayudó a mitigar algunos de mis hábitos más atroces. Las herramientas mejoradas para analizar los diversos aspectos de la forma del teclado, incluidos los retrasos, los niveles de sonido y el flujo, podrían contribuir en gran medida a lograr una experiencia de trabajo más relajada y fluida.

Hace poco estuve charlando con un amigo que había observado a dos adoquines escuchando música clásica. Dijo que cuando trabajaban, era como ver una danza suave y fluida de humanos y equipos mientras coordinaban sus movimientos al ritmo lento y rítmico de la música. Planeaba contratarlos la próxima vez que hiciera su camino de entrada. ¿No sería fantástico si todos pudiéramos trabajar así?

Crédito de la imagen: Pixabay