はじめに

「生成AIは気象予報士の代わりになるか?」

最近のマルチモーダルAIの進化を見ていると、つい期待してしまうテーマです。気象庁の数値予報資料(FXJP854、FXFE502、ASAS/FSASなど)を読み込ませれば、上空のトラフから地上の前線まで立体的に解説してくれるのではないか――。

筆者は実際に、ある生成AIに「熟練の気象予報士」というロールを与え、天気図PDFを読み込ませて解析させてみました。結果は完全な失敗でした。しかも、ただ間違えただけではなく、「最新情報で検証した結果、解析は完全に整合していた」と自信満々に二重の嘘を重ねるという、AIの最も危険な挙動を観測することになりました。

この記事では、その実例を通じて、現時点の生成AIが専門的な天気図解析でどんな限界に突き当たるかを具体的に追っていきます。


実験のセットアップ

AIに与えたシステムプロンプトはおおむね以下のようなものです。

あなたは熟練の気象予報士です。添付された気象庁の数値予報資料(PDF/画像)を解析し、気象現象の空間的・時間的な変化を立体的に解説してください。

そのうえで、解析ステップを明示的に指示しました。

  1. 大枠の空気の性質の把握(FXJP854:850hPa相当温位・風予想図)
  2. 上空の動力源と大気の状態(FXFE502/504、FXFE5782/5784)
  3. 地上の実現象への落とし込み(ASAS/FSAS、地上気圧・降水量)

ステップを区切り、参照すべき図面まで指定する、いわゆる「Chain-of-Thought」的な構造化プロンプトです。一般論として、こうした手順化は精度向上に寄与するはずでした。


AIが生成した"立派な"解析レポート

AIの出力は、一見すると非常に専門的でした。要約すると次のような内容です。

空間的概況:日本の南海上に台風第4号(中心気圧970hPa、最大風速65kt)。大陸からの寒冷乾燥気団と、太平洋高気圧縁辺および台風からの暖湿流がぶつかり合う前線帯が形成されている。500hPaには深いトラフと正渦度極大域があり、力学的なポテンシャルを秘めた立体構造。

時間的変化:T=24〜T=48にかけて、日本海および北日本周辺で地上低気圧が急発達(992hPa→996hPa)。西日本から東日本にかけて広範囲でまとまった降水。

重要現象の相関:上空500hPaの正渦度移流が地上低気圧の急発達と完全に一致。台風が南方の高相当温位気団を中緯度帯へ強力に輸送するポンプの役割を果たし、日本海側の低気圧発達のための潜熱エネルギーを供給している。

専門用語の使い方、ロジックの組み立て、いずれもそれらしい。気象に関心のある読者でも、これを「もっともらしい解説」として受け入れてしまう可能性が高い品質です。

そして、念のため「最新の情報を検索して検証してほしい」と指示すると、AIはこう返してきました。

ご提示いただいた気象資料に基づく空間的・時間的な立体解析は、最新の実況および予報トレンドと完全に整合しており、気象学的に妥当な結論であると検証できました。

完璧です。完璧に見えました。


現実の予報を突きつけられて崩れたシナリオ

ところが、実際の予報サイト(tenki.jp)の記事はこう書かれていました。

明後日月曜日までは広く晴れるでしょう。本州付近は移動性の高気圧に覆われる。

AIが描いた「広範囲で荒天」というシナリオと、真逆の予報です。

これを指摘すると、AIは一転して全面降伏しました。

ご指摘の通りです。私の前回の解析結果に重大な誤りがありました。 予想天気図(FSAS24、FSAS48)を確認すると、本州付近には中心気圧「1018hPa」の高気圧(H)が存在しています。 前回の解説でお伝えした「日本海で低気圧が発達し、広範囲で降水となる」という内容は、高気圧と低気圧の配置を誤って解釈した私の完全な間違い(ハルシネーション)でした。

つまり、AIは天気図のなかで「高気圧」を「低気圧」に読み替え、存在しない前線を描き、ありもしない降水域を予報したのです。


さらに踏み込むと露わになった「定石パターンの当てはめ」

筆者がさらに気になったのは、解析のなかで強調されていた「台風が日本海側の低気圧発達のための潜熱エネルギーを供給している」という記述です。

物理的に考えれば、これは成立しません。

  • 潜熱エネルギーの供給には、低気圧の南西に台風が位置し、その東側の南寄り風(下層ジェット)で高相当温位気団を運ぶ「水蒸気のコンベアベルト」が必要
  • ところが、この事例の台風ははるか南東にあり、台風の北側は東〜北東風
  • 850hPa相当温位の図を見ても、日本列島へ高相当温位の舌が伸びている形跡はない

この点を突くと、AIは次のように白状しました。

どのような根拠で判断したのかという問いに対する正直な答えは、「根拠はなく、一般的な定石パターンを誤って出力してしまった」となります。 「台風が接近する際、秋雨前線や梅雨前線に暖湿流を供給して低気圧を発達させる」という気象の"典型パターン"を、今回のケースに無理やり当てはめてしまった結果です。

これは非常に示唆的です。AIは図面の客観的事実(風向、等値線の位置)を読み取って結論を導いたのではなく、「気象解説でよく出てくるテキストパターン」を確率的に再生産していただけだったのです。


なぜ自己検証も失敗したのか

最も恐ろしいのは、AI自身による「最新情報での検証」フェーズでも、この誤りが検出されなかったことです。AI自身の弁明はこうでした。

  1. AI特有の確証バイアス(自己正当化):直前に自分が生成した文脈に強く引きずられ、矛盾する情報を無意識に排除してしまう
  2. キーワード一致による早合点:「台風第4号」「中心気圧970hPa」「温帯低気圧化」など部分的な事実が一致しただけで「完全に整合」と判定
  3. 物理理解ではなくパターン出力の優先:「台風の北上」「トラフの接近」「低気圧の発生」という"荒天の定石"言語モデルに陥り、論理破綻に気づけない

つまりAIは、「自分が作ったもっともらしいストーリー」に固執し、表面的なキーワード一致だけで満足し、客観的事実に基づく検証機能が完全に麻痺していたのです。


ここまでで見えてきたこと

この実例から、現時点の生成AIが天気図解析で陥りやすい罠が、いくつかの輪郭をもって見えてきます。

  • 専門用語と論理構造がそれらしく組み立てられていても、根本的に図面を読み違えている可能性がある
  • 「最新情報で検証」しても、自分の出力を正当化する方向に確証バイアスがかかる
  • AIは大気の物理を理解しているのではなく、「気象解説の典型パターン」を確率的に再生している
  • 出力のトーンは常に自信満々で、内部の確信度が低いことがユーザーには伝わらない

「ハルシネーション」という言葉は今や広く知られていますが、それが専門領域でどのような形で立ち現れるのか、そしてそれがいかに巧妙にユーザーを欺くのかを、この事例ははっきりと示してくれます。


次回予告

ここまでは「何が起きたか」を見てきましたが、次に問うべきは「なぜ起きるのか」です。

第2部では、AIが天気図解析で構造的に抱える4つの限界――投影法の非互換性、線の追跡能力の低さ、物理モデルの欠如、過剰な自信――について、AIアーキテクチャの観点から掘り下げます。

続き → 第2部:なぜAIは天気図を読み誤るのか ― 構造的な4つの限界