Skip to main content

Entender los conceptos básicos de la Inteligencia Artificial Generativa (IAG) y el alcance real de herramientas como los LLM es una tarea que no podemos dejar para mañana. Mercadólogos, periodistas y creadores de contenido deben hacer suyo un nuevo lenguaje. Para incursionar en ese universo, hay que empezar por lo más sencillo…

Sabemos contestar con soltura a preguntas como: ¿Qué es un LLM? ¿Qué significan las siglas IAG o GML? ¿Cuál es el principio básico de los Grandes Modelos Lingüisticos? ¿Qué significan las siglas GPT que acompañan a la estrella del momento: el ChatGPT? ¿Los LLM cambiarán la forma como hoy buscamos información en internet? ¿Es cierto que los LLM pueden “alucinar”? Aquí ahondamos en 8 conceptos básicos de Inteligencia Artificial.

Empecemos por el principio… con preguntas simples y respuestas sencillas.

1. ¿Qué significan las siglas GML o LLM?

GML hace referencia a los Grandes Modelos de Lenguaje o Large Language Models (LLM). Para hablar más claro, ChatGPT es un LLM.

2. Dicho de una manera simple, ¿cuál es la tecnología detrás de Grandes Modelos Lingüísticos (GML) como ChatGPT?

ChatGPT comenzó a desarrollarse en 2020 con la introducción de GPT-3. Impulsado por IAG –Inteligencia Artificial Generativa–. Aquella tercera iteración de un modelo desarrollado por Open-AI daría nacimiento al LLM estrella de 2023.

Centrada en la creación de contenido a partir de la generación de datos e información existentes, la herramienta echa mano de avanzados algoritmos y redes neuronales. Los LLM “aprenden” –utilizando técnicas de aprendizaje profundo (deep learning)– de textos e imágenes en la red.

3. ¿Qué diablos significa GPT?

Desarrollado por OpenAI –laboratorio de investigación de Inteligencia Artificial–, las siglas GPT que acompañan al chat más popular hasta ahora significan Generative Pre-trained Transformer. En español, algo así como Transformador Generativo Pre-entrenado. Estos términos hacen referencia a su capacidad de aprender y generar texto autónomamente, después de ser entrenado con una enorme cantidad de datos.

4. ¿Cómo entender la “acción” de herramientas como ChatGPT?

La “inteligencia” de herramientas como ChatGPT se construye, como refiere Emily Bender*, a través del acto elemental de predecir la siguiente palabra. Para que quede claro, los Grandes Modelos de Lenguaje se basan en probabilidades de palabras.

Esa capacidad predictiva no es nueva. Algo semejante ocurre en Google cuando buscamos información, por ejemplo, sobre redes neuronales. En el momento en que tecleamos la palabra “redes”, el buscador “adivinará” para donde vamos, poniendo opciones como: redes sociales, neuronales, de computadora…

Lo mismo ocurre cuando estamos enviando un mail o un whats app: si ponemos “Buenos”, el whats sugerirá o “adivinará” la palabra “días”, evitándonos tener que teclearla letra a letra.

* Resista la Tentación de Dejarse Impresionar, New York Times, Emily Bender, profesora de Lingüística, Universidad de Washington/ Directora de la facultad, Programa Profesional de Maestría en Lingüística Computacional (CLMS) facultad.washington.edu/ebender

Conceptos básicos de Inteligencia Artificial

5. Otro término fancy: “verdad básica”, que por cierto es básica para determinar la calidad de cualquier LLM.

La capacidad efectiva de los LLM para aportar valor se basa en la calidad de la “verdad básica” utilizada para su entrenamiento y validación. Al aprender, la IAG –Inteligencia Artificial Generativa– exige una fuente de verdad que refleje con precisión el conocimiento de la materia en el mundo real.

En síntesis, y dependiendo de su naturaleza, las herramientas de IAG deben ser alimentadas con datos reales de alta calidad. También deben acercarse lo más posible al estándar ideal para garantizar resultados de calidad.

La adopción de una herramienta de IA con datos inadecuados, sesgos o prejuicios plantea riesgos significativos. Por ejemplo: si un auxiliar de diagnóstico ha sido alimentado por datos insuficientes o poco precisos, será de poca ayuda para definir un tratamiento efectivo. En cambio, aquellas entrenadas en datos que respondan al estándar ideal serán más confiables para la toma de decisiones para el diagnóstico y tratamiento del paciente.

De la misma manera, los Grandes Modelos de Lenguaje son entrenados en el idioma y fueron pensados –en principio– en inglés. Por ello, tal vez, se dice que cuando se “dialoga” con ChatGPT en inglés suelen obtenerse respuestas menos simples que las que el LLM arroja, por ejemplo, en español. Igualmente, cuando un LLM es alimentado con prejuicios o sesgos ideológicos, ambos contaminarán la construcción de contenidos.

6. ¿Podemos darnos el lujo de ignorar a los LLM y seguir adelante con nuestras viejas costumbres?

La respuesta es NO, definitivamente NO.

Los LLM llegaron para quedarse y constituyen una herramienta de trabajo fundamental para cualquier creador de contenido. Aprender a “dialogar” con ellos acelera la producción de contenidos y proporciona al profesional  el asistente con el que quizá ha soñado toda la vida.

Así como adoptamos las máquinas eléctricas y abandonamos las mecánicas, o las computadoras para guardar en el closet las máquinas eléctricas, los LLM son la herramienta de hoy.

Por eso, como refiere Ikhlaq Sidhu, decano de la Escuela de Ciencia y Tecnología de IE University: cuando nos negamos a utilizar una nueva herramienta, “no perdemos frente a la tecnología, sino ante otras personas dispuestas a aprender cómo usarla”.

7. ¿Los LLM están cambiando la forma en que buscamos y encontramos información en la red?

Los LLM son ya una alternativa cuando buscamos información en Internet. Para muestra, un botón…

ChatGPT no solo representa una evolución técnica en el procesamiento del lenguaje, también es un protagonista de primera fila en la experiencia de búsqueda en internet. De hecho, está permitiendo interacciones “más conversacionales”, lo que por cierto exige que aprendamos a “conversar” con este tipo de herramientas para obtener mejores resultados.

8. ¡Aguas! los LLM alucinan

Si, definitivamente lo hacen. Las alucinaciones o respuestas sin sentido que el Chat ofrece en ocasiones son un hecho. Por eso exigen siempre un editor humano experimentado.

Como señala Fernando Polo, de Rebel Intel, “no debemos cometer la imprudencia de adoptar semejantes artilugios sin establecer pautas de uso y ser conscientes de los riesgos por mal funcionamiento”.

Es ya famosa la imagen que motivó el retiro momentáneo del generador de imágenes de Gemini, que fue incapaz de crear el retrato de un soldado nazi y arrojó un resultado más que “curioso”.

Sobre la autora: Dolores Carbonell

Licenciada en Ciencias de la Comunicación de la Ibero con un Diplomado en Calidad Total del ITAM, se ha pasado la vida pluma en mano. Primero, aprendiendo los lenguajes corporativos y periodísticos como directora de la revista Expansión y colaborando con una docena de revistas en México; luego, investigando para lograr el dominio de nuevos lenguajes que hoy tejen contenidos empresariales y mercadotécnicos. Egresada del curso del Knight Center for Journalism sobre Chat GPT e IA en la generación de contenidos, es ganadora del Premio Nacional de Periodismo Cultural de Bellas Artes (1985), y autora de novelas de hadas y “squonks”, y de cuentos de brujas.

Sobre ICO: Inteligencia Creativa

ICO: Inteligencia Creativa es una agencia de generación de contenidos, marketing y comunicación digital apoyada por herramientas de Inteligencia Artificial. Entre sus clientes se encuentran AstraZeneca y Lecturio. Para conocer más, visita nuestro sitio.

Facebook Comments

Dolores Carbonell

Author Dolores Carbonell

More posts by Dolores Carbonell