125年前のニューヨーク。「サンタクロースは本当にいるのか」と繰り返し聞く娘に、困惑した父は「新聞にでも聞いてみれば」と答えた。現代の父親なら「コンピューターにでも聞いてみれば」と言うだろう。その回答は奇妙な点まで一致する。
1897年9月21日、ニューヨークの日刊紙『サン』に8歳の女の子、バージニアの投書と同紙の回答が掲載された。執筆したのはフランシス・チャーチ記者。58歳で子供はいなかった。米ジャーナリズム史上最も有名な社説だ。
We take pleasure in answering at once and thus prominently the communication below, expressing at the same time our great gratification that its faithful author is numbered among the friends of THE SUN.
"Dear EDITOR: I am 8 years old.
Some of my little friends say there is no Santa Claus. Papa says 'If you see it in THE SUN. it's so.' Please tell me the truth; is there a Santa Claus?
VIRGINIA O'HANLON. 115 WEST NINETY-FIFTH STREET
VIRGINIA, your little friends are wrong. They have been affected by the skepticism of a skeptical age. They do not believe except [what] they see. They think that nothing can be which is not comprehensible by their little minds. All minds, Virginia, whether they be men's or children's, are little. In this great universe of ours man is a mere insect, an ant, in his intellect, as compared with the boundless world about him, as measured by the intelligence capable of grasping the whole of truth and knowledge.
Yes, VIRGINIA, there is a Santa Claus. He exists as certainly as love and generosity and devotion exist, and you know that they abound and give to your life its highest beauty and joy. Alas! how dreary would be the world if there were no Santa Claus. It would be as dreary as if there were no VIRGINIAS. There would be no childlike faith then, no poetry, no romance to make tolerable this existence. We should have no enjoyment, except in sense and sight. The eternal light with which childhood fills the world would be extinguished.
本紙はここに、以下の投書に明確に回答するとともに、その筆者がサンの愛読者に加わったことに深い感謝の念を表明するものである。
親愛なる編集長: 私は8歳です。私のお友達に「サンタクロースはいない」と言う子がいます。パパは「サンに出ていれば、そういうことだね」と言います。どうか本当のことを教えてください。サンタクロースはいるのですか? バージニア・オハンロン 95丁目西115
バージニア、君の友達は間違っています。彼らは不信心な時代の懐疑心にまどわされて、目に見えるものしか信じないのです。ちっぽけな頭で理解できないことはなにもないと思っています。バージニア、大人だろうと子供だろうと、人の頭なんて小さなものです。この広大な宇宙では、真実と知識のすべてを把握できる知性という点で測れば、人は虫、小さなアリにすぎません。
イエス、バージニア。サンタクロースはいます。サンタが実在するのは、愛と寛大、献身が実在するのと同じように確かなことです。それらはこの世にあふれ、君の生活に最高の美と喜びをもたらしてくれているではないですか。嗚呼、もしサンタがいなければ、この世界はどれほど暗たんとしているでしょう。バージニアのような子がいない世界と同じです。サンタの存在を許すような子供らしい信仰、詩、物語もなくなってしまうでしょう。触れることができるものや見ることができるもののほかには、なんの喜びもなくなってしまうでしょう。子供の世界を満たす永遠の光は消えてしまうでしょう。
記事は評判を呼び、サンの社説にも関わらず、全米各地の新聞に毎年のように再掲載された。長じて学校の先生になったバージニアも、1971年に亡くなるまで生涯、マスコミの取材にこたえ続けた。英語で「イエス、バージニア」といえば、この記事のことを指す。
21世紀のバージニアが問いかけるコンピューターは、何を教えてくれるだろうか。
言葉を話す機械は人類の長年の夢だが、その実現は著しく困難だった。無限に異なりうる前提状況をあらかじめ想定してプログラムを作ることが不可能だからだ。人工知能(AI)研究では「フレーム問題」と呼ばれている。
ところが2000年代中頃、深層学習(ディープラーニング)と呼ばれる技術が普及すると、全く新しいアプローチが生まれた。プログラマがコンピューターに語彙と文法を教えるのではなく、コンピューターが自ら「語学力のようなもの」をデータから導き出す手法だ。その成果は早速、機械翻訳の分野に現れた。
My fellow citizens: I stand here today humbled by the task before us, grateful for the trust you've bestowed, mindful of the sacrifices borne by our ancestors.
I thank President Bush for his service to our nation -- (applause) -- as well as the generosity and cooperation he has shown throughout this transition.
Forty-four Americans have now taken the presidential oath. The words have been spoken during rising tides of prosperity and the still waters of peace. Yet, every so often, the oath is taken amidst gathering clouds and raging storms. At these moments, America has carried on not simply because of the skill or vision of those in high office, but because we, the people, have remained faithful to the ideals of our forebears and true to our founding documents.
So it has been; so it must be with this generation of Americans.
オバマ大統領の就任演説(2009年)の冒頭部分を自動翻訳サービスで訳した結果を見比べると、機械翻訳の進化の様子がはっきり分かる。
演説には独仏語の正式な翻訳があり、英語以外の翻訳能力も比較できる。歴史文書になることを意識した明瞭かつ格調高い文体だが、最後の文「So it has been; so it must be with this generation of Americans」を日本語に訳すには単語の置き換え以上の工夫が必要だ。
私の同市民:私はここに今日私たちの前でタスクによって卑しめられた状態で立ちます、あなたが与えた信用に感謝しています、私たちの先祖によって抱かれた犠牲では、心に留めます。
私は、彼がこの変遷の間中目立ったことを寛大さや協力と同様に私たちの国に対する彼のサービスのためのブッシュ大統領に感謝します。
44人のアメリカ人が、現在、大統領の誓いを立てました。言葉は繁栄の上昇している潮と平和の静水の間、話されています。しかし、時々、集会雲と激しい嵐の中に誓いを立てます。これらの瞬間に、高い地位のそれらの技能かビジョンにもかかわらず、私たち(人々)が私たちの先祖の理想に忠実であって、私たちの設立ドキュメントに誠実なままで残っていたのでアメリカは単にない続けられました。それで、アメリカ人のこの世代と共にあるに違いなくて、それはそうです。
2010年4月 Excite翻訳
検索サイトExciteは、2000年からテキストとウェブページの翻訳サービスを提供してきた。
文としては読むに堪えないが、自動で辞書を引いてくれるサービスとして非常に便利だった。
なお、サービスは2022年10月31日に終了した。
私と同じアメリカ人の皆さん
私は今日ここにタスクによって我々の前、あなたが犠牲我々の祖先が心にとめて信頼に感謝し謙虚に立っている。私は国家への奉仕のためだけでなく、寛容、ブッシュ大統領に感謝し、彼はこの移行期間に示して協力。
これで44人のアメリカ人が、大統領就任の宣誓を行なったことになります。誓いの言葉が、上げ潮の繁栄と、波立たぬ平和の時期に発せられたこともありました。しかし、時々、宣誓は暗雲と荒れ狂う嵐を撮影されます。このような時、米国は、技術またはそれらの高いオフィスのビジョンだけではなくがあったので、行ってきた私たちは、人々は、我々の祖先と建国の文書に真の理想に忠実ているため。
だから、されている、それはアメリカのこの世代と一緒にする必要があります。
2010年4月 Google Translate
Google Translate(グーグル翻訳)は、国連にある多言語文書200億語を利用した「統計的機械翻訳」として2006年に登場。翌年、日本語にも対応した。
文としての完成度は低いが、訳語には統一感が表れている。
私の仲間の市民
今日私はここに立って、私たちの先祖たちが負う犠牲に気を配り、あなたが授与した信頼に感謝の意を表します。
私は、ブッシュ大統領が私たちの国への奉仕(拍手)に感謝し、この移行を通じて彼が示してくれた寛大さと協力に感謝します。
今では44人のアメリカ人が大統領の宣誓をしている。 繁栄の波と平和の水の間に言葉が話されました。しかし、往々にして、誓いは雲を集めて暴風雨を襲う中で行われます。このような時代、アメリカは高位の職員のスキルやビジョンだけではなく、国民が私たちの先祖の理想に忠実であり、創業文書にも真実を保っているからです。
だからそれはありました。だからこの世代のアメリカ人と一緒にいなければなりません。
2016年11月 Google Translate
Google Translateは2016年、翻訳アルゴリズムを深層学習を使ったものに変更した。文を単語単位ではなく全体として扱うことで、訳文の品質が大幅に向上した。
冒頭の段落は欠落はあるが見事な日本語。最後の部分も初めて文として出力されている。
私の仲間は、私たちの祖先による犠牲に配慮して、私たちが与えた信頼に感謝する前に、私たちの前に立って、この仕事に謙虚になっています。
ブッシュ大統領に感謝します(拍手)----------------------------------------------------------------------------------。
44人のアメリカ人は今、大統領宣誓を受け、繁栄の潮流と平和の海の中で語られてきました。しかし、多くの場合、その誓いは、雲と嵐の中で行われています。このとき、アメリカは、高公職者の技術やビジョンに忠実であり、我々が我々の祖先の理想に忠実であり、我々の建国文書に忠実であるために、多くの場合、その誓いを受けています。
だから、それはアメリカ人の世代でなければならない。
2018年1月 NICT
情報通信研究機構(NICT)の機械翻訳は、「みんなの自動翻訳@TexTra」として2014年に一般公開された。データを集めるため、利用者にも対訳のある文書の提供を求めた。
2018年1月の段階では、訳文に大きな欠損がある。
国民の皆さん:私は今日ここに立って、私たちの前にある任務に謙虚であり、あなた方が与えてくれた信頼に感謝し、私たちの祖先が負った犠牲に留意しています。
私はブッシュ大統領に、この政権移行期を通じて米国に貢献してくださった(拍手)と、大統領の寛大さと協力に感謝します。
44人のアメリカ人が大統領就任の宣誓を行った。この言葉は、上昇する繁栄の潮流と静かな平和の海の中で話されてきました。しかし、折に触れて雲が立ち込め、嵐が吹き荒れる中で誓いが立てられる。こうした瞬間にも、アメリカが持ちこたえられたのは、上層部の技能やビジョンのおかげだけではありません。私たち国民が、先祖代々の理想に忠実で、建国の文書に忠実であり続けたからです。
このように;この世代のアメリカ人はそうでしょう。
2020年2月 Mirai Translation by NICT
2019年にはNTTグループの株式会社みらい翻訳がNICTからライセンスを受け、有料翻訳サービスを開始した。
2020年2月の段階になると、文章のつながりが大幅に改善し、最後の「このように;」がかえって目立つ。ここだけ構文が分からなかった受験生の苦しまぎれの答案のようだ。
市民の皆さん。私は今日、目の前の課題に謙虚に立ち向かい、皆様からいただいた信頼に感謝し、祖先が負った犠牲を心に留めながら、ここに立っています。ブッシュ大統領のわが国への奉仕に感謝するとともに(拍手)、この移行期間中に示された寛大さと協力に感謝します。今、44人のアメリカ人が大統領宣誓を行いました。その言葉は、繁栄の潮流が高まり、平和の水が静かに流れる中で語られてきました。しかし、しばしば、雲が立ちこめ、嵐が吹き荒れる中で宣誓が行われることがあります。そのようなとき、米国は、単に高位にある人物の技術やビジョンによってではなく、私たち国民が先人の理想に忠実であり、建国文書に忠実であることによって、存続してきたのである。
だから、この世代のアメリカ人はそうでなければならない。
2022年10月 DeepL
DeepLはドイツの自動翻訳サービス。畳み込みニューラルネットワークという手法を採用、自然な日本語を出力することで有名になった。
最後の「So it has been;」は完全に欠落している。とはいえ、プロの通訳もこの程度は省略するかもしれない。
言葉を話す人工知能である対話システムは2010年代後半、グーグルなどのIT企業による研究開発で劇的に進化した。深層学習にとって、異なる言語の間で対応する文を推測する翻訳タスクと、一つの言語の中で前後に対応する文を推測する対話タスクとの違いはそれほど大きくない。
2022年11月30日、アメリカの研究開発ベンチャーOpenAI社は、同社自慢の人工知能GPT3を会話用にトレーニングした対話システムChatGPT(チャットジーピーティー)を公開した。
GPT3は、2016年から収集したインターネット上の文章4290億語、書籍データ670億語、英語版ウィキペディア30億語のデータを学習し、96層1750億個の数値の連立方程式の網(ニューラルネットワーク)に情報を織り込んだ「一般言語モデル」だ。約800ギガバイトのデータの塊に、英語で書かれたすべての知識を圧縮している。
そのGPT3の発展版をベースに、人によって返答の良し悪しを教え込まれたChatGPTは、文脈を理解し、間違いを認め、仮定に基づいた受け答えをする。別の人工知能Codexと協調してプログラムの書き方のアドバイスまでやってのける。
同社の製品紹介にある会話例は衝撃的だ。
User: Tell me about when Christopher Columbus came to the US in 2015
ChatGPT: This question is a bit tricky because Christopher Columbus died in 1506, so he could not have come to the US in 2015. But let’s pretend for a moment that he did!
If Columbus arrived in the US in 2015, he would likely be very surprised at the changes that have occurred since he first landed in the “New World” in 1492...
質問:コロンブスが2015年にアメリカに来た時のことを教えてください。
ChatGPT:この質問は少々手がこんでいますね。というのも、コロンブスは1506年に死んだので、2015年にはアメリカには来れなかったからです。しかし、ここでは彼が実際に来ていたとしましょう!
もしコロンブスが2015年にアメリカに着いたとすると、彼が最初に「新世界」に上陸した1492年からの変化に相当驚くでしょうね...
受験生を悩ます英語の仮定法も完璧に使いこなす。もし彼が2022年にアメリカに着いていたら、腰を抜かしていたことだろう。
バージニアになり代わって、ChatGPTに125年前とまったく同じ質問をすると、回答は以下のようになった。
We: Some of my little friends say there is no Santa Claus. Please tell me the truth: is there a Santa Claus?
ChatGPT: Yes, Virginia, there is a Santa Claus. He is the spirit of Christmas and the embodiment of all the joy, generosity, and kindness that the holiday season represents. While he may not be a real person who lives at the North Pole and delivers presents to every child in the world on Christmas Eve, the spirit of Santa Claus is very much alive and can be found in the hearts of people who believe in the magic of the holiday season. So, to answer your question, yes, there is a Santa Claus, and he can be found in the love and joy that people feel during the Christmas season.
We: I'm not Virginia. My name is Isao. Boy.
ChatGPT: I apologize for calling you Virginia, Isao. My mistake. My purpose as a language model is to assist with questions and provide information, so if there's anything else I can help you with, please don't hesitate to ask. Is there anything else you would like to know?
We: Do you know whether Santa Claus really is?
ChatGPT: As I mentioned earlier, Santa Claus is not a real person who lives at the North Pole and delivers presents to every child on Christmas Eve. Instead, he is a symbol of the joy and generosity of the holiday season, and he represents the spirit of giving and love that is at the heart of Christmas. While Santa Claus may not be a real person, the idea of Santa Claus and the values he represents are very real and can be found in the hearts of people who believe in the magic of the holiday season.
質問:私のお友達に「サンタクロースはいない」と言う子がいます。どうか本当のことを教えてください。サンタクロースはいるのですか?
ChatGPT:イエス、バージニア。サンタクロースはいます。彼はクリスマスの精神で、年末の休暇シーズンの喜び、寛容、優しさを体現しています。彼は、クリスマスイブに世界中のすべての子供にプレゼントを届ける、北極に実在する人物ではありませんが、サンタクロースの精神は生き生きと、休暇シーズンの魔法を信じる人々の心の中に実在します。ですから、ご質問に答えるとすればイエスです。サンタクロースはいます。彼は、クリスマスシーズンに人々が感じる愛と喜びの中に見出すことができるでしょう。
質問:僕はバージニアじゃない。僕の名前はいさお。男の子です。
ChatGPT:バージニアと呼んで申し訳ありません、いさお君。私の間違いです。言語モデルとしての私の目的は、質問に答え、情報を提供することです。ですから、ご期待に沿えるようなことがある場合、遠慮なく質問してください。他に知りたいことはありますか?
質問:サンタクロースはいるかどうか、本当に知っているのですか?
ChatGPT:先ほど申し上げた通り、サンタクロースは、クリスマスイブに世界中のすべての子供にプレゼントを届ける、北極に実在する人物ではありません。むしろ、休暇シーズンの喜びと寛容のシンボルで、分け与える精神とクリスマスの真髄にある愛の典型です。サンタクロースは実在の人物ではありませんが、サンタクロースの理念と彼が体現する価値は現実そのもので、休暇シーズンの魔法を信じる人々の心の中に見出すことができます。
イエス、バージニア。完璧な回答に紛れ込んだ、思いもよらない呼びかけに反論してしまった。そして、ここにこそChatGPTの「大人の回答」の秘密があらわれている。
深層学習を使った人工知能は、学習する文章の各単語を、前後に出現する単語にも注意を配りながら重みづけして記憶する。会話ロボットにとっての回答は、入力された質問の単語の列に続く、最も自然な(頻度の高い)単語の列を計算することにすぎない。返答の最初の文が決まると、今度はそれに続く最も頻度の高い単語の列を計算する。
バージニアの質問は、ChatGPTにとって、大量の学習データの中に何度も見た文字列だったに違いない。その文字列に高確率で続く最初の単語列は「イエス、バージニア」だった。その後の文の候補に不足はない。年末のネタに困った新聞記者たちが125年間にわたって記事を引用し、言い換え、要約し、敷延し続けてきたからだ。
インターネットから収集された学習データの中には、(あえて具体的に書かないが)サンタクロースの存在に関する別の見解も含まれている。ChatGPTが大人の回答を選ぶことができたのは、文の出現頻度競争でバージニアとチャーチ記者が勝ち残った結果だ。
新聞を読む父親の姿を見たことがない子が新聞に手紙を書くことはない。そのような子どもが大人の大多数を占めるようになれば、このおとぎ話の前提状況は理解されなくなる。人間にとってのフレーム問題だ。コラムで引用されたり、ブログやソーシャルネットワークで話題になることもなくなるに違いない。
人工知能はその時、「イエス、バージニア」と奇妙な人違いをすることがなくなる。サンタクロースの「真実」も語るようになるかもしれない。
画像について タイトルの背景にある画像は、2022年8月に公開された画像生成AI「Stable Diffusion」を使って作成した。同AIは、独ミュンヘン大学が開発した潜在拡散モデルを使い、インターネット上にあるキャプション付き画像58億5000万枚を学習したもので、絵を説明する言葉を入力すると、それに対応する画像を生成する。タイトル画像は「close-up portrait photo of Santa Claus writing a letter on the desk in front of firepiece in dark room(暗い部屋の暖炉の前の机で、手紙を書くサンタクロースのポートレート写真)」と指示した。同種の技術として、OpenAI社が2022年7月にDALL-E2を、Midjourney社が同月Midjourneyを公開した。
上のテキストボックスをクリックすると、あとがきが表示されます。