AIには敬語を使うべきか?【雑談】
AIへの話し方は精度に影響するのか、研究データと実体験をもとに考察。「人間とAIの公用語」という壮大な可能性まで話は広がります。
「〇〇さんってClaudeと話す時敬語なんですね」 「そうだね。将来AIが人間を支配した時、良い人だと思われておいた方が良いからね」
といった会話を先日上司としました。 私はと言えば、敬語は使いませんが愛想良く話しているつもりです。「ありがとう」「お願い」「ごめん、さっきの訂正」など、思わず入力してしまいます。生成AIの応答精度はもはや人間と同じかそれ以上なので、人間と話しているような感覚なのです。
ただ、上司はこうも言っていました。 「でも『ありがとう』とかは意味のない割にコンテキストに溜まるから無い方が良いらしいよ」 確かにそうかもしれません...そう言えば以前、お礼の言葉がAIの処理を圧迫するという話を聞いたことがあります。
AIに対してどのように話しかけるべきか?このテーマはChatGPTが普及し始めた頃にも一度考えたことがありました。活用頻度が過去最高に高まっている今、改めてちょっと考えてみようと思い立ったので、今日はフランクにこんな妄想混じりの考察をしていきたいと思います。お気軽に読んでみてください。
敬語は要るのか? 研究が出した意外な答え
結論から言うと、「AIに丁寧に話した方がいい結果が出る」という根拠は、今のところかなり弱いです。
2025年のPenn Stateの研究では、ChatGPT-4oに対して丁寧なプロンプトと無礼なプロンプトで正答率を比較しました。結果は、丁寧な言い方が80.8%、無礼な言い方が84.8%。むしろ雑に聞いた方が正確だったんです。George Washington大学の研究でも、「please」や「thank you」のような丁寧な言葉はモデル内部で実質的な出力とは直交的であり、結果にほとんど影響しないことが理論的に示されています。
では、上司が言っていた「ありがとうがコンテキストに溜まる」という話はどうでしょうか。
これは技術的には正しいです。OpenAIのSam Altman自身が、ユーザーが入力する「please」と「thank you」の処理にOpenAIは年間数千万ドルを使っていると発言しています。すべての言葉はトークンとして処理され、GPUの計算リソースを消費します。
ただし、個人レベルで見ると「ありがとう」は3〜5トークン程度。最新モデルのコンテキストウィンドウは128K〜200Kトークンもあるので、正直ほとんど誤差です。とはいえ、Chromaの研究によると、入力トークンが増えるほどモデルの性能は劣化していく(context rotと呼ばれます)ことがわかっています。長い会話を続けていると、小さな積み重ねが効いてくる場面はありそうです。
上司の指摘は、思った以上にちゃんとした話でした。
私が「英語っぽい日本語」でAIと話していた理由
生成AIが出始めた頃、私はAIに対して意識的に「英語を直訳したような日本語」で話していました。
「これを要約して」ではなく「あなたはこの文章を300文字以内で要約してください」のように、主語を入れて、目的を明示して、条件をはっきり書く。日本語の会話では不自然なくらい説明的な話し方です。
なぜそうしていたかというと、日本語には敬語があり、主語を省略しがちで、文脈に頼る言語だからです。「よろしくお願いします」の一文を取ってみても、何をよろしくするのかは文脈がないとわかりません。AIにとってこれは厄介なんじゃないかと直感的に思ったんです。
実際、データもこの直感を裏付けています。2025年に発表されたMMLU-ProXという多言語ベンチマークでは、同じ問題を英語と日本語で解かせたとき、日本語の正答率は英語より7〜9ポイント低いという結果が出ています。さらに、日本語はトークン効率が英語の数倍悪い。英語では"hello"が1トークンで済むところ、日本語は1文字ずつトークンに分解されるため、同じ内容を伝えるのにより多くのトークンを消費します。
加えて、日本語の主語省略(言語学ではゼロ照応と呼びます)は、LLMにとって今も難しい課題です。人間なら文脈から「誰が」を自然に補えますが、AIにとっては推測コストがかかります。Fugaku-LLMやSwallowなど日本語に特化したLLMが多数開発されていること自体が、日本語処理の難しさを物語っています。
正直に言うと、最近のAIは精度が上がりすぎていて、適当に話しかけても十分に良い結果が返ってきます。だから「英語っぽく話さないとダメ」ということはもうありません。ただ、主語や目的を明示して論理を明確にすることは、コンテキストの節約という意味ではまだ有効だと感じています。伝わり方の問題というより、効率の問題です。
「人間とAIの公用語」は妄想じゃなかった
ここからは少し大きな話をします。
AIへの話し方を工夫するうちに、私はあることを想像するようになりました。将来、人間とAIの間で使われる「公用語」のようなものが生まれるんじゃないか、と。
プログラミング言語ほど堅くなくて、日常会話ほど曖昧でもない。主語と述語が明確で、指示の範囲がはっきりしていて、でも人間が読んでも自然に読める。そんな言語です。
調べてみたら、これは妄想どころか、すでに研究が始まっていました。
2025年に発表された「CNL-P(Controlled Natural Language for Prompting)」という研究があります。これはまさに、AIとの対話に最適化された制御自然言語です。自然言語の読みやすさを保ちながら、文法構造を厳密にして曖昧さを排除する。自由に書いた文章をCNL-Pの形式に自動変換するツールや、プロンプトの文法をチェックする「リンター」まで開発されています。プログラミングの世界で使われてきた品質管理の手法を、自然言語に持ち込んだわけです。
他にも、YAMLベースでプロンプトを記述する「Prompt Definition Language」や、自然言語をそのままプログラミング言語として扱う「Natural Language-Oriented Programming」といった研究が進んでいます。
AI側からの歩み寄りもあります。Metaが2024年に発表したByte Latent Transformer(BLT)は、従来のトークナイザーを廃止してバイト単位でテキストを処理します。これが実用化されれば、日本語のトークン効率が悪いという問題自体が解消される可能性があります。
人間がAIに合わせて話し方を変え、AIが人間の言語をより深く理解できるようになる。その両方が進んだ先に、新しい「ことば」が生まれるのかもしれません。
おわりに
話を最初に戻すと、AIに敬語を使うべきかどうか。答えは「好きにすればいい」です。精度にはほぼ影響しません。AIに支配されたときのために良い人ぶっておく必要も、たぶんありません。
ただ、AIへの話し方をちょっと意識してみると、面白いことに気づきます。日本語がいかに文脈に頼っているか。主語を省略することでどれだけ曖昧さが生まれているか。普段意識しない「言語の構造」が見えてくるんです。
そして、その先には「人間とAIが共有する新しい言語」という壮大な話が待っているかもしれない。私の妄想は、思ったより現実に近いところにありました。
みなさんはAIにどんな話し方をしていますか?
参考文献
- Penn State大学の研究(丁寧さと正答率の比較): Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy
- George Washington大学の研究(丁寧な言葉のドット積への影響): Capturing AI's Attention: Physics of Repetition, Hallucination, Bias and Beyond
- Sam Altmanの「please」「thank you」のコスト発言: Sam Altman Says 'Please' And 'Thank You' To ChatGPT Cost OpenAI 'Tens Of Millions'
- Chromaの研究(context rot): Context Rot: How Increasing Input Tokens Impacts LLM Performance
- MMLU-ProX(多言語ベンチマーク): MMLU-ProX: A Multilingual Benchmark for Advanced Large Language Model Evaluation
- CNL-P(制御自然言語): When Prompt Engineering Meets Software Engineering: CNL-P as Natural and Robust "APIs" for Human-AI Interaction
- Prompt Definition Language: PDL: A Declarative Prompt Programming Language
- Natural Language-Oriented Programming: Natural Language-Oriented Programming (NLOP): Towards Democratizing Software Creation
- Meta Byte Latent Transformer (BLT): Byte Latent Transformer: Patches Scale Better Than Tokens