Google ha puesto a disposición su tecnología SynthID Text, que se puede usar determinar si el texto ha sido creado por sus propios modelos de IA, lo que la hace significativa para los desarrolladores.
Según un comunicado de prensa de la compañía, “Google ha puesto a disposición general su tecnología de marca de agua para texto generado por IA, llamada SynthID Text, a través de su actualizado Responsible Generative AI Toolkit y Hugging Face, un recurso de redes neurales artificiales de código abierto”. Esta es solo una nueva herramienta dentro de la lucha continua de la empresa para hacer que la IA sea más segura y regulada.
Los desarrolladores pueden ahora utilizar SynthID Text para determinar si el texto procede de sus propios modelos lingüísticos de gran tamaño, con el objetivo de facilitar la creación responsable de IA, ha declarado Pushmeet Kohli, vicepresidente de investigación de Google DeepMind.
SynthID Text detecta el texto IA observando una serie de palabras. Los LLM procesan los datos usando tokens para saber cuál aparecerá a continuación, con la ayuda de tokens únicos como caracteres, palabras o frases. Estos modelos también pueden predecir qué token sigue a otro, solo de uno en uno. Cuando el texto finalmente se distribuye, la salida del texto posee una puntuación basada en la probabilidad de obtener la respuesta a las preguntas.
Además, SynthID Text también “incorporará marcas de agua imperceptibles” directamente en el texto durante la generación del token. Luego, al verificar la salida, SynthID compara el patrón de clasificación esperado para el texto creado y no creado por IA, lo que finalmente determina si el texto, o lo que sea, de IA fue generado o proviene de otra fuente.
La IA está en continua evolución por lo que la herramienta de detección de texto de Google ha llegado al mercado en buen momento dado que el mundo está experimentando un aumento tanto de desinformación generada por IA como de detecciones de falsos positivos. Aproximadamente dos tercios de los profesores utilizan herramientas de detección de IA para las tareas y redacciones de los alumnos; por otro lado, alrededor de cuatro quintos de los estudiantes que utilizan el inglés como segunda lengua han sufrido falsas detecciones.