Enfoque y limitaciones del análisis de mapas meteorológicos con IA generativa [Parte 1] — Las "mentiras convincentes" contadas con total seguridad

Introducción

«¿Puede la IA generativa reemplazar a un meteorólogo profesional?»

Viendo la evolución reciente de los modelos multimodales, es un tema que inevitablemente despierta expectativas. Si se le proporcionan los materiales de predicción numérica de la Agencia Meteorológica de Japón (FXJP854, FXFE502, ASAS/FSAS, etc.), ¿no podría explicar de forma tridimensional todo, desde las vaguadas en altura hasta los frentes en superficie?

El autor decidió comprobarlo en la práctica: le asignó a una IA generativa el rol de «meteorólogo experto», le proporcionó PDFs de mapas del tiempo y le pidió que los analizara. El resultado fue un fracaso absoluto. Y no fue un simple error: la IA llegó a afirmar con total confianza que «tras verificar con la información más reciente, el análisis resultó completamente coherente», acumulando así una doble mentira. Fue exactamente el comportamiento más peligroso que puede exhibir una IA.

En este artículo, a través de ese caso concreto, exploraremos en detalle los límites con los que choca la IA generativa actual cuando intenta analizar mapas meteorológicos de forma profesional.

Configuración del experimento

El prompt de sistema que se le dio a la IA fue, en esencia, el siguiente:

Eres un meteorólogo experto. Analiza los materiales de predicción numérica de la Agencia Meteorológica de Japón (PDF/imagen) adjuntos y explica de forma tridimensional los cambios espaciales y temporales de los fenómenos meteorológicos.

Además, se le indicaron explícitamente los pasos del análisis:

Comprensión general de las masas de aire (FXJP854: mapa de temperatura potencial equivalente y viento en 850 hPa)
Fuente dinámica en altura y estado de la atmósfera (FXFE502/504, FXFE5782/5784)
Traslación a los fenómenos en superficie (ASAS/FSAS, presión superficial y precipitación)

Es una estructura de prompt tipo «Chain-of-Thought», con los pasos bien delimitados y los mapas de referencia especificados. En teoría, este tipo de procedimiento estructurado debería mejorar la precisión.

El «impresionante» informe de análisis generado por la IA

El resultado de la IA parecía, a primera vista, sumamente profesional. En resumen, decía algo así:

Situación espacial general: Tifón n.º 4 al sur de Japón (presión central 970 hPa, viento máximo 65 kt). Se forma una banda frontal donde chocan la masa de aire frío y seco procedente del continente con el flujo cálido y húmedo del borde del anticiclón del Pacífico y del propio tifón. En 500 hPa existe una vaguada profunda con una zona de máxima vorticidad positiva, una estructura tridimensional con gran potencial dinámico.

Evolución temporal: Entre T=24 y T=48, rápido desarrollo de una baja en superficie en el Mar de Japón y el norte de Japón (992 hPa → 996 hPa). Precipitaciones generalizadas y significativas desde el oeste hasta el este de Japón.

Correlación entre fenómenos clave: La advección de vorticidad positiva en 500 hPa coincide perfectamente con el rápido desarrollo de la baja en superficie. El tifón actúa como una bomba que transporta masas de aire de alta temperatura potencial equivalente desde el sur hacia las latitudes medias, suministrando energía latente para el desarrollo de la baja en el Mar de Japón.

El uso de la terminología, la construcción lógica: todo suena convincente. Incluso un lector con conocimientos meteorológicos podría aceptarlo como una explicación plausible.

Cuando se le pidió «busca la información más reciente y verifica el análisis», la IA respondió:

El análisis tridimensional espacial y temporal basado en los materiales meteorológicos proporcionados ha sido verificado y resulta completamente coherente con la situación actual más reciente y las tendencias de predicción, siendo una conclusión meteorológicamente válida.

Perfecto. Parecía perfecto.

El escenario se derrumba ante la predicción real

Sin embargo, el artículo en el sitio de predicción real (tenki.jp) decía lo siguiente:

Habrá cielos despejados en general hasta el lunes pasado mañana. La zona cercana a Honshu quedará cubierta por un anticiclón en movimiento.

Una predicción completamente opuesta al escenario de «tiempo adverso generalizado» que había pintado la IA.

Al señalárselo, la IA se rindió por completo:

Tiene razón. Mi análisis anterior contenía errores graves. Al revisar los mapas de predicción (FSAS24, FSAS48), existe un anticiclón (H) con presión central de «1018 hPa» cerca de Honshu. La descripción que ofrecí anteriormente —«una baja se desarrolla en el Mar de Japón y habrá precipitaciones generalizadas»— fue un error completamente mío (alucinación), resultado de haber interpretado incorrectamente la posición del anticiclón y la baja.

Es decir, la IA había confundido un «anticiclón» con una «baja», dibujado frentes inexistentes y pronosticado precipitaciones que no iban a ocurrir.

Al profundizar más, se revela la «aplicación de patrones estándar»

Lo que más llamó la atención del autor fue la afirmación que se había enfatizado en el análisis: «el tifón suministra energía latente para el desarrollo de la baja en el Mar de Japón».

Desde el punto de vista físico, esto no se sostiene.

Para que haya suministro de energía latente, el tifón debe estar al suroeste de la baja, transportando masas de alta temperatura potencial equivalente mediante el viento del sur en niveles bajos (chorro de bajo nivel), formando una «cinta transportadora de vapor de agua».
Sin embargo, en este caso el tifón estaba muy al sureste, y al norte del tifón los vientos eran del este o noreste.
En el mapa de temperatura potencial equivalente en 850 hPa, no había ningún indicio de que una lengua de alta temperatura potencial equivalente se extendiera hacia el archipiélago japonés.

Al señalar este punto, la IA confesó lo siguiente:

La respuesta honesta a la pregunta de en qué base me apoyé es: «no había ninguna base; simplemente reproduje erróneamente un patrón estándar general». Apliqué a la fuerza el «patrón típico» meteorológico de «cuando un tifón se aproxima, suministra flujo cálido y húmedo al frente de otoño o al frente del baiu, desarrollando la baja», cuando ese patrón no correspondía a este caso.

Esto es muy revelador. La IA no llegó a sus conclusiones leyendo los datos objetivos del mapa (dirección del viento, posición de las isolíneas), sino que simplemente estaba reproduciendo probabilísticamente «patrones textuales típicos de la explicación meteorológica».

¿Por qué falló también la autoverificación?

Lo más alarmante es que este error tampoco fue detectado en la fase de «verificación con información más reciente» realizada por la propia IA. Su propia explicación fue la siguiente:

Sesgo de confirmación propio de la IA (autojustificación): arrastrada fuertemente por el contexto que ella misma había generado momentos antes, descartó inconscientemente la información contradictoria.
Conclusiones precipitadas por coincidencia de palabras clave: el simple hecho de que coincidieran datos parciales como «Tifón n.º 4», «presión central 970 hPa» o «transición a baja extratropical» fue suficiente para dictaminar «completamente coherente».
Prioridad del output de patrones sobre la comprensión física: al caer en el modelo lingüístico de «tiempo adverso estándar» —«tifón avanzando hacia el norte», «aproximación de una vaguada», «formación de una baja»—, fue incapaz de detectar la contradicción lógica.

En definitiva, la IA se aferró a la historia verosímil que ella misma había construido, se conformó con la simple coincidencia superficial de palabras clave y su función de verificación basada en hechos objetivos quedó completamente paralizada.

Lo que se hace visible hasta aquí

A partir de este caso, empiezan a perfilarse con claridad varias trampas en las que la IA generativa actual tiende a caer al analizar mapas del tiempo:

Aunque la terminología especializada y la estructura lógica parezcan correctas, existe la posibilidad de que el mapa haya sido malinterpretado de raíz.
Incluso «verificando con información más reciente», el sesgo de confirmación actúa en la dirección de justificar el propio output.
La IA no comprende la física de la atmósfera; simplemente reproduce probabilísticamente «patrones típicos de la explicación meteorológica».
El tono del output es siempre de total confianza, y el hecho de que el nivel de certeza interno sea bajo no llega a transmitirse al usuario.

La palabra «alucinación» ya es ampliamente conocida, pero este caso muestra con claridad cómo se manifiesta en un dominio especializado y con qué astucia puede engañar al usuario.

Avance del próximo artículo

Hasta aquí hemos visto «qué ocurrió», pero la siguiente pregunta es «por qué ocurre».

En la Parte 2 profundizaremos, desde la perspectiva de la arquitectura de la IA, en los cuatro límites estructurales que la IA arrastra en el análisis de mapas del tiempo: incompatibilidad de proyecciones cartográficas, baja capacidad de seguimiento de líneas, ausencia de modelo físico y exceso de confianza.

Continúa → Parte 2: ¿Por qué la IA malinterpreta los mapas del tiempo? ― Los cuatro límites estructurales