El peligro de las citas inventadas: cuando los LLM fabrican fuentes en medicina y derecho

¿Por qué los modelos de lenguaje inventan fuentes que no existen?

Los modelos de lenguaje de gran tamaño (LLM) han demostrado capacidades impresionantes en tareas como resumen, traducción y generación de texto técnico. Sin embargo, presentan un problema crítico en dominios que requieren precisión absoluta: la fabricación de referencias bibliográficas. Este fenómeno, conocido como "alucinación de citas", ocurre cuando un modelo genera referencias con formato correcto pero que apuntan a artículos, revistas o estudios inexistentes.

El origen de este comportamiento es estructural. Los LLM funcionan prediciendo la secuencia de tokens más probable según patrones aprendidos durante el entrenamiento, no consultando una base de datos verificable. Cuando se les solicita fundamentar una afirmación con referencias, el modelo sintetiza citas plausibles combinando elementos reales (nombres de revistas conocidas, años coherentes, formatos estándar) sin verificar su existencia. En sectores como la medicina o el derecho, donde las decisiones pueden afectar la salud de pacientes o la libertad de personas, esta limitación representa un riesgo sistémico.

El caso documentado: GPT-3 y la generación de referencias falsas

Investigadores de la Universidad de Stanford y otras instituciones han analizado este fenómeno en modelos ampliamente desplegados. En pruebas controladas, GPT-3 y versiones posteriores generaron citas con apariencia legítima que, tras verificación manual, resultaron inexistentes. Un ejemplo característico:

"Según un estudio publicado en Journal of Clinical AI en 2018 (referencia DOI: 10.1234/jcai.2018.04567), la aplicación de algoritmos de aprendizaje profundo en diagnóstico oncológico mostró una precisión del 94%..."

Al rastrear el DOI, no existe tal artículo. La revista mencionada puede ser real, pero la referencia específica es fabricada. Este patrón se repite con frecuencia suficiente como para cuestionar el uso de LLM sin supervisión en contextos de alta responsabilidad.

Anthropic documenta este comportamiento en su modelo de alucinaciones y recomienda implementar sistemas de verificación externa cuando se trabaja con información factual crítica. OpenAI, por su parte, advierte en su documentación oficial sobre la necesidad de validar cualquier output que requiera exactitud.

¿Cómo afecta esto a la práctica médica y la investigación clínica?

En medicina, las decisiones terapéuticas se fundamentan en evidencia empírica publicada en revistas con revisión por pares. Si un clínico utiliza un asistente basado en LLM para revisar literatura reciente sobre un tratamiento, y el modelo sugiere estudios inexistentes que respaldan una intervención, el riesgo es directo: podría adoptarse una conducta clínica sin base real.

Organizaciones como la FDA y la European Medicines Agency han comenzado a emitir guías sobre el uso de IA en dispositivos médicos, subrayando la necesidad de trazabilidad y verificación humana. El problema no es solo técnico, sino regulatorio: ¿quién asume responsabilidad si una decisión clínica se basó en una referencia fabricada por un modelo?

Además, la contaminación de literatura secundaria es otra consecuencia. Si revisiones sistemáticas o meta-análisis futuros incorporan citas generadas por IA sin verificar, el error se amplifica exponencialmente a través de la cadena de conocimiento.

Implicaciones en el ámbito jurídico y la toma de decisiones legales

El sector legal enfrenta un desafío similar. Los sistemas de IA ya se emplean para búsqueda de jurisprudencia, redacción de escritos y análisis de precedentes. Si un modelo cita sentencias inexistentes o malinterpreta doctrina, puede inducir errores en argumentaciones legales que afecten el resultado de un caso.

En 2023, un abogado en Estados Unidos enfrentó sanciones tras presentar un escrito que incluía referencias jurisprudenciales generadas por ChatGPT que resultaron ser ficticias (caso documentado en tribunales federales). Este incidente puso de manifiesto la urgencia de protocolos de verificación en bufetes y despachos que adopten herramientas de IA.

El derecho exige trazabilidad y fundamentación rigurosa. La fabricación de citas no solo compromete la calidad de la defensa o acusación, sino que puede interpretarse como mala fe procesal, con consecuencias disciplinarias para los profesionales implicados.

Estrategias prácticas para mitigar el riesgo de citas fabricadas

Aunque el problema es inherente a la arquitectura de los LLM actuales, existen medidas que reducen significativamente el riesgo:

Verificación sistemática de fuentes: Toda cita generada por IA debe contrastarse en bases de datos verificables (PubMed, Google Scholar, repositorios institucionales). Herramientas como Semantic Scholar facilitan esta tarea.
Uso de modelos con acceso a bases de datos externas: Sistemas como RAG (Retrieval-Augmented Generation) combinan LLM con búsquedas en corpora verificables, reduciendo la alucinación al anclar el output en documentos reales.
Auditoría humana obligatoria: En contextos críticos, establecer flujos de trabajo donde un experto revise toda referencia antes de su uso clínico o legal.
Formación en limitaciones de la IA: Profesionales de medicina y derecho deben comprender que los LLM son herramientas de asistencia, no oráculos. La responsabilidad final de verificación es siempre humana.
Desarrollo de estándares sectoriales: Colegios profesionales y organismos reguladores deben emitir guías claras sobre el uso aceptable de IA generativa en estos dominios.

Conclusión: rigor científico en la era de la IA generativa

La capacidad de los modelos de lenguaje para fabricar citas plantea un dilema entre productividad y fiabilidad. En sectores donde la exactitud es irrenunciable, el uso de estas herramientas sin supervisión constituye una negligencia. La comunidad científica, legal y tecnológica debe colaborar en el desarrollo de protocolos de verificación, arquitecturas más robustas (como RAG o modelos con capacidad de citar fuentes verificables en tiempo real) y marcos regulatorios que delimiten responsabilidades.

La IA no debe convertirse en una amenaza para el rigor que sustenta la medicina basada en evidencia o el Estado de Derecho. Su integración requiere cautela, transparencia y un compromiso constante con la verificación independiente de toda información crítica.