Los Modelos de Lenguaje de Gran tamaño o Large Language Model, también conocidos como LLM, son la tecnología que impulsa gran parte de la tecnología GenAI avanzada que veremos en computadoras portátiles, teléfonos y otras tecnologías en 2024, pero ¿qué es un LLM y qué hace exactamente?
En esencia, los LLM son un tipo de inteligencia artificial entrenada en gigabytes (si no terabytes o petabytes) de datos para interpretar el lenguaje humano y generar resultados en forma de texto, audio, imágenes y más, pero hay mucho más que eso.
Aquí explicamos todo lo que necesitas saber sobre los modelos de lenguaje de gran tamaño y cómo impulsan los chatbots populares como ChatGPT y Google Gemini.
¿Qué es un Modelo de Lenguaje de Gran tamaño o Large Language Model?
En su forma más simple, un modelo de lenguaje de gran tamaño (también conocido como LLM) es un tipo de inteligencia artificial que puede reconocer y generar texto, aunque los LLM también pueden especializarse en elementos como generación de fotografías, generación de videos, creación de música y mucho más. Esta es esencialmente la tecnología subyacente que impulsa las herramientas de IA generativa como ChatGPT, Google Gemini y Microsoft Copilot.
Para lograr la tarea, los LLM están capacitados en conjuntos de datos masivos (de ahí el nombre) y utilizan el aprendizaje automático para comprender lo que se les pide y generar algo nuevo basado en eso.
A modo de contexto, la mayoría de los LLMs se basan en datos que se encuentran en Internet, posiblemente millones de gigabytes de texto de todos los rincones de la web, para obtener la mayor cantidad de información posible.
Sin embargo, la calidad de las muestras afectará la calidad del desempeño de sus funciones por parte del LLM, por lo que los LLM especializados pueden utilizar un conjunto de datos más seleccionados. Por ejemplo, un LLM capacitado exclusivamente con datos en francés no podría generar una historia en inglés y viceversa.
¿Para qué se pueden utilizar los modelos de lenguaje de gran tamaño?
Como se señaló anteriormente, los LLM son la columna vertebral de los asistentes de IA generativa que hemos visto aparecer en los últimos años, desde ChatGPT hasta Google Gemini y prácticamente cualquier otra herramienta GenAI que se pueda imaginar.
Si bien los usos potenciales de GenAI y, por lo tanto, de los LLM se expanden continuamente, la iteración actual parece centrarse en varias áreas clave.
El más obvio es la redacción publicitaria; Los chatbots con tecnología LLM como ChatGPT pueden escribir una copia completamente original basada en la descripción que tú proporciones. Puede ser cualquier cosa, desde un breve libro infantil hasta una guía paso a paso para cocinar el bistec perfecto, dependiendo de lo que le pidas que haga.
De manera similar, los LLM también son excelentes para responder consultas sobre un producto específico, lo que se conoce como respuesta a la base de conocimientos.
Básicamente, esto ocurre cuando una empresa capacita a un LLM exclusivamente en su producto o servicio, que luego los consumidores pueden utilizar para responder preguntas básicas (y complejas) sin tener que buscar en la web o hablar con una persona real. Es útil no solo para obtener más información sobre un producto antes de comprarlo, sino que también puede ser útil para solucionar problemas de dicho producto una vez comprado.
Los LLM también han sido un salvavidas para los programadores, ya que generan código en una variedad de lenguajes de codificación basados en las descripciones de los desarrolladores. No podrás crear una nueva aplicación o juego utilizando ChatGPT sin al menos un conocimiento aceptable de codificación, pero puede suponer un gran ahorro de tiempo.
Luego está el grande; generación de imágenes. Este es probablemente el uso más controvertido de los servicios GenAI impulsados por LLM en este momento, ya que puedes hacer que la IA cree lo que describas.
Eso está muy bien hasta que te adentras en las aguas turbias de la desinformación y en la facilidad con la que puedes crear noticias falsas virales simplemente usando generadores de imágenes impulsados por inteligencia artificial. Las herramientas más populares basadas en imágenes tienen limitaciones en cuanto al tipo de imágenes que pueden generar, pero las personas especialmente dedicadas a menudo pueden encontrar una manera de sortear estas limitaciones.
¿Cuáles son algunas de las limitaciones de los Large Language Models?
Los modelos de lenguaje de gran tamaño o large language models pueden hacer mucho bien, pero vale la pena señalar que existen algunas limitaciones para la tecnología tal como está.
El mayor problema con los chatbots impulsados por LLM en este momento son las alucinaciones. Es un término relativamente nuevo en el mundo de la inteligencia artificial, pero en esencia significa que los LLM crean información falsa cuando no pueden producir una respuesta precisa. Esto podría deberse a que el LLM no fue capacitado en ese conjunto de datos específico, pero a veces puede suceder en conversaciones habituales de chatbot.
Por eso es importante tener al menos un conocimiento superficial de qué es lo que los LLM como ChatGPT deben describir o crear. Un codificador experimentado, por ejemplo, podría detectar alucinaciones en el código generado, mientras que un novato lo tomaría al pie de la letra y lo pegaría directamente en su proyecto, mientras que alguien interesado en teléfonos notaría una especificación inexacta si le preguntara a un LLM sobre una nueva versión.
También está la cuestión de la privacidad; Algunos usuarios pueden cargar documentación confidencial o incluir información confidencial en sus consultas, y los LLM utilizan los aportes que reciben para capacitación adicional. Esto significa que la información confidencial puede quedar expuesta en respuesta a preguntas y consultas de otros usuarios.