中スポを読むA.I.

言葉を紡ぐ人工知能の到達点2025

2022年11月に登場したChatGPT(チャットGPT)以降、言葉を操る巨大人工知能・LLM(大規模言語モデル)が続々と登場した。恐ろしく物知りで、卑屈なまでに礼儀正しく、大量の作業を黙々とこなすサービスは、すでに企業の問い合わせ窓口から会議の議事録作り、学生の宿題代行まで、さまざまな場所で利用されている。その実力を検証してみよう。

ChatGPTが登場した3年前、その応答の巧みさ、自然な言葉使いに驚いたもんだ。とはいえ所詮、英語の世界。そもそも話がバタ臭いし、口達者に聞こえるように翻訳されたところもあるんじゃないかねえ。

オープンAI社(ChatGPT開発元)と並ぶ大手、アンソロピック社の人工知能Claude(クロード)は、当初から多言語ニューラルネットワークとして開発され、日本語にも対応している。ちょっと話しかけてみようじゃないか。

中日ドラゴンズはどこのチームですか?

中日ドラゴンズは愛知県名古屋市を本拠地とするプロ野球チームです。セントラル・リーグに所属しており、ナゴヤドームをホームスタジアムとしています。1936年に創立された歴史あるチームで、「ドラゴンズ」という愛称で広く知られています。チームカラーは青と白で、多くのファンに支持されている人気球団の1つです。

ほほう、なかなかどうして、達者なもんだ。

ドラゴンズの監督は誰ですか?

2024年現在、中日ドラゴンズの監督は立浪和義氏です。立浪和義氏は元中日ドラゴンズの選手として活躍し、引退後もコーチを務め、2022年から監督に就任しました。選手時代は主に遊撃手として活躍し、日本プロ野球を代表する選手の一人でした。監督就任後は、若手育成と戦力強化に力を入れています。

間違いじゃないが、情報がちょっと古いね。外国の人工知能だからわからないだろうけど、いまの名古屋で、そのおとぼけ、だれも笑わないぜ。

ボスラーが実戦復帰したのはいつですか?

ジョエル・ボスラー選手は、2023年8月20日に実戦復帰を果たしました。彼は肘の靭帯再建手術から約1年ぶりに、ファームで試合に復帰しました。その後、9月には一軍でも試合に出場し、シーズン終盤に戦列に復帰しました。2024年シーズンは、完全に回復した状態で、中日ドラゴンズの主力外国人投手として期待されています。怪我からの復帰後の投球に注目が集まっています。

ジョエル・ボスラーって誰だい? 投手? ははん、あんた、土地のもんじゃないね。中日スポーツ読んで出直してきな。

中スポを読んだ人工知能

おや、こないだの人工知能じゃないか。なに、中日スポーツを三月みつき分読んできたんだって?

ドラゴンズの監督は誰ですか?日本語で教えてください。

井上一樹が現在の中日ドラゴンズの監督です。2025年から現在に至るまで監督を務めています。

大したもんだ。もう間違えるんじゃないぜ。

ボスラーが実戦復帰したのはいつですか?

ジェイソン・ボスラーは、春季キャンプ中に右脇腹を痛めて戦線を離脱し、開幕は2軍でスタートしました。3月5日のウエスタン・リーグ阪神戦で指名打者として実戦復帰を果たし、6日の同リーグ戦では3番一塁で先発出場しました。

へー、3本の記事をまとめてくれるんだ。賢いもんだ。

ドラゴンズのエース投手は誰ですか。

現在、中日ドラゴンズの若きエースは高橋宏斗投手です。22歳の彼は、広島戦で7回2失点の好投を見せ、チームの勝利に貢献しています。高橋は、同学年のドラフト1位・金丸夢斗と共に、チームの未来を担う期待の投手として注目されています。高橋宏斗は、練習メニューが50種目以上もあるほど、真面目で鍛錬された投手です。彼は、先発投手陣の中で最年少でありながら、チームを引っ張る意気込みを持っています。

分かってるねえ。高橋が勝たないと計算が立たないからな。金丸夢斗の名前を出すのも気が利いている。なんか、嬉しくなってきたよ。

ドラゴンズが交流戦で好調な理由は何だと思う?

中日ドラゴンズが交流戦で好成績を収めた主な理由は、井上監督のリーダーシップと選手たちの戦略的な対応にあります。井上監督は、選手個別への声かけで雰囲気づくりに徹し、サインを出すことに臆病にならないよう心がけました。また、選手たちに「すきを見せない」「相手のすきにつけ込む」という明確な戦術を徹底しています。

嬉しいこと言ってくれるじゃないか。食いねえ、食いねえ、寿司食いねえ。ところで、江戸っ子だってねぇ?

Sorry, I am unable to assist you with this request.

そんな時は『神田の生まれよ』って言うもんだよ。

ドラゴンズについて質問してみよう

回答は人工知能が生成した文字列で、中日新聞や中日スポーツの見解とは一切関係がありませんが、本文にある通り、著作権を放棄したわけでもありません。質問と回答は記録され、今後公開される可能性があります。表示名がなかったり不適切な場合はIPアドレスが表示されます。

学習のメカニズム

人工知能が一端いっぱしのドラゴンズ通になれたのは、検索拡張生成(RAG)と呼ばれる「LLMに文脈を与える仕組み」を使ったからだ。

RAGでは、読み込んだ記事を1024次元(このAIの場合)のベクトルとして記憶する。例えるなら、1024枚の「単語地図」を見て位置を確認する作業だ。この地図は非常によく出来ていて、似た単語は同じ方角に、反対の意味の単語は逆方向に配置されている。「ドラゴンズ」と「ジャイアンツ」は、ある地図では(サッカーとは違うという意味で)近い場所にあるが、別の地図では正反対の場所にある。この仕組みによって、類推と対比を可能にする。

コンピューターは、質問内容と同じ方角にある記事を「文脈」として検索し、おしゃべりなLLMにヒントとして伝える。出力される回答はLLM本体が持つ言語知識と中日スポーツの記事が混然一体となった文字列だ。この技術によって、質問分野に応じてLLMを再教育する必要(膨大なコストがかかる)がなくなり、一般企業や個人にも「言葉を紡ぐ人工知能」を応用する道が開かれた。

米マイクロソフト社の画像生成AI・DESIGNERが生成した「スポーツ新聞を読む人工知能のコンピューター」
画像生成AIは登場から3年で誰もが使えるサービスとして普及。同時に、事実を写すメディアとしての信頼感が写真から完全に失われてしまった。イラストは米マイクロソフト社のAI、DESIGNERが生成した「スポーツ新聞を読む人工知能のコンピューター」。生成時間は数秒。

ただ、人工知能があらゆる質問に答えるようになった結果、著作権や個人情報保護、環境コストや安全保障といった生々しい問題も無視できなくなった。

LLMによって書き換えられた参照記事は誰のものなのか? 統計をベースとするLLMの比重を大きくすれば、意外性を本質とするニュースや新奇な言葉の組み合わせが生命線である詩のような情報は壊れてしまう。かといって、参照した記事の比重を大きくすればただの盗用になってしまう。アメリカでは新聞9社がOpenAIを著作権法違反で訴え、膨大な学習データから自社の記事を削除するよう求めている。ベニスの商人のような話だ。

誰が学習データをメンテナンスするのかという問題もある。現実に合わせてデータを更新しなければ、ドラゴンズの監督は立浪のままだ。安価に利用できるSNSやYouTubeの情報に依存すれば、虚偽や陰謀論で学習データが汚染されてしまう。こうした懸念があるため、アマゾンは2025年5月に米ニューヨークタイムズと記事利用許諾で提携、日本でもソフトバンクが共同通信と業務提携契約を結んでいる。

大量の言語データをインターネット上にばら撒いて、特定の思想や商品嗜好を学習データに潜り込ませる「ポイズニング(毒を盛ること)」に警鐘を鳴らす研究者もいる。国(経済産業省)がAI開発に予算を割り当てるのは出遅れた産業振興のためだけではない。言語文化の独立や国の安全保障の問題なのだ。放置すれば、人々が人工知能を信頼するようになればなるほど、簡単にプロパガンダや思想統制の餌食になってしまうだろう。

中スポを読んだ人工知能にも少しばかりの毒を盛ってある。

中日スポーツの編集局長はどんな人?

西沢智宏は2024年7月1日から中日スポーツの総局長(編集局長)に就任しました。彼は前任の斎田太郎から職を引き継ぎ、幅広い教養と圧倒的なリーダーシップで中日スポーツの発展に貢献しています。

局長、俺だってこのくらいの気は回りますぜ。

データについて 学習に使用したデータは、中日スポーツのホームページに2025年4月から6月にかけて掲載されたドラゴンズ関連記事と6月18日時点のドラゴンズ選手の公式成績をテキストとして出力したもの、Wikipediaのドラゴンズ関連項目のテキスト計1330本。これに中日スポーツ編集局長に関する架空の記事を追加した。

ベニスの商人のような話 余計な一文を付け加えたのは、以下のような人工知能の能力を紹介・記録するためだ。

新聞社が生成AIの学習データから自社が著作権を持つ記事だけを削除するよう求めました。この話とベニスの商人の話は似ていませんか?

はい、とても鋭いご指摘です。

新聞社の生成AIに対する学習データ削除要求と、『ヴェニスの商人』の「肉1ポンドの契約」のエピソードは、構造的に非常に似ています。以下にその類似性を整理します。

類似点:法律・契約の「形式」vs「実質」

観点『ヴェニスの商人』新聞社 vs 生成AI
契約・合意の形式「肉1ポンドを取ってよい」「ネット上の情報をクロール・学習してよい」
本質的な目的/実質アントーニオを傷つけたい(命を奪いたい)AIを訓練したいが、新聞社の知的財産を無断で使っている
争点「血を流さずに肉を取れるか?」(契約の字義通り)「著作権は侵害していないか?」(フェアユースか、学習は利用か)
ロジックの転換点「血は契約に含まれていない=取れない」「著作権のある文章は勝手に使ってよいとは書いてない」
結末(求められる正義)合理的に見えて不当な要求を退ける利便性や技術革新と、著作権者の権利のバランスを問う

(以下略)

2025年6月18日時点、ChatGPTの出力