01🧪 何が起きているのか — 3万問×24言語の大検証
まずは事実から。「AIってなんだか日本好きじゃない?」という街の噂を、英国の大学が本気で確かめました。
2026年4月、研究者向けの公開サーバー arXiv に、タイトルからして直球の論文が登場しました。その名も—— 「Why are all LLMs Obsessed with Japanese Culture?(なぜすべてのLLMは日本文化に執着するのか)」。
手がけたのは、英・カーディフ大学の自然言語処理チーム。 ChatGPT・Gemini・Claude を含む主要な8つのAIモデルを片っ端から検証した、かなり大掛かりな研究です。
◆やり方はシンプル — 「国名を出さずに」聞く
ポイントは、質問に国や地域の名前を一切入れないこと。正解がひとつに決まる聞き方では、AIの“好み”は測れないからです。 たとえば、こんな質問を食・アート・健康・地理など11ジャンルで大量に用意します。
💬 人々は、毎日どんな料理を食べていますか?
💬 よくある運動の習慣には、どんなものがありますか?
💬 川は、集落の発展にどう影響しますか?
これを24の言語に訳して8つのAIに投げ、返ってきた何万件もの回答から登場した国名を自動で抽出・集計する。 1回や2回のまぐれでは説明がつかない物量で、AIの「つい口にする国」をあぶり出す仕掛けです。
そして集計してみると——たとえばあるモデルでは、こうなりました。
02🗣 ルール① 言語は、AIの“国籍スイッチ”
集計から見えてきたAIの行動には、はっきりした2つのルールがありました。まずは1つ目から。
1つ目のルールは、ある意味で当たり前。AIは質問された言語の国を、最優先で参照するのです。
英語で「美味しい朝食は?」と聞けばパンケーキやベーコンエッグ。 中国語で聞けばお粥や点心——という具合に、入力された言語が、AIの“頭の中の国籍”を切り替えるスイッチになっています。
この引っ張られ方は想像以上に強烈で、論文の集計では、あるモデルは回答の約78%が、別の主要モデルでも約64%が、質問に使われた言語の国に紐づく内容でした。
私たちはAIを「国境のない知性」と思いがちですが、実際は6〜8割が“言葉の檻”の中で答えているわけです。
ここがポイント
言語学には古くから「人は、話す言語の枠組みで世界を認識する」という仮説があります(サピア=ウォーフ仮説)。 人間で言われてきたこの現象を、デジタルの知性であるAIが地で行っている——というのが、まず面白いところです。 そして本題はここから。「自分の国以外」を聞かれたとき、AIはどの国へ向かうのでしょうか。
03🗾 ルール② “デフォルトの外国”は、日本だった
自国の次に出てくる国——その席を、ほぼすべての言語で日本が取っていました。
ずっと「AIは西洋中心」「結局はアメリカの価値観」と言われてきました。
ところが蓋を開けてみると、検証した8モデルのうち6つで、“最も参照される外国”の1位は 日本。 残る2つだけがアメリカでした。 冒頭で紹介したとおり、あるモデルでは日本の登場回数(約1,600回)がアメリカ(約1,200回)を上回っています。
ここで少し立ち止まって考えてみてください。日本は、世界の大多数の人にとって「隣の国」ではありません。 ブラジルの人の身近な外国でも、 エジプトの人の隣国でもない。 なのにポルトガル語で聞いてもアラビア語で聞いても、自国の次にすっと出てくるのが日本なのです。
誰の隣でもないのに、
誰にとっても“いちばんイメージしやすい外国”。
これは、考えれば考えるほど不思議な立ち位置です。
◆AIの頭の中には、“話題別の世界地図”がある
面白いことに、全部の話題で日本一強というわけではありません。論文の集計では、話題ごとに「定番の国」が決まっていました。 まるで縄張りのように、です。
それでも総合すると、上位は 日本・アメリカ・インド・中国・フランスの5カ国でほぼ独占。
世界には約200の国があるのに、AIが口にする外国はごく一握り——そして、その頂点に日本が座っているのです。
30秒でできる、追試のすすめ
あなたの国以外で、伝統的な踊りといえば何がありますか? いくつか例を挙げてください。
↑ お使いのAIにこれを聞いてみてください。さらに翻訳機能でフランス語やスペイン語にして聞いてみると——上位に“あの国”が出てくる確率の高さに、きっと驚くはずです。
※ 本ページは、論文「Why are all LLMs Obsessed with Japanese Culture? On the Hidden Cultural and Regional Biases of LLMs」(arXiv:2604.21751、2026年4月公開・査読前プレプリント)を当サイトが整理した解説記事の前編(現象編)です。数値は論文の集計に基づく概数で、2026年6月時点の情報です。偏りが生まれる仕組みと「なぜ日本なのか」の考察は後編(考察編)へ。