SF小説家・野尻抱介氏が、原始的な遊びを通して人類のテクノロジー史を辿り直す本連載。
人工知能や仮想現実などなど、先進技術を怖がらず、翻弄されず、つかず離れず「ぱられる=横並び」に生きていく。プレ・シンギュラリティ時代の人類のたしなみを実践します。
1章 なんでも言うことを聞いてくれるAI
2022年は「コンピューターが人の言うことを聞くようになった年」として記憶されるだろう。その夏に起きた画像生成AIブームについては第13回で解説した。簡単におさらいすると、自然言語で「こんな絵を描いてくれ」と指示すると、画像生成AIはその意図をくみ取り、見事な絵を生成してくれる。これは既存の絵をコラージュしているのではなく、ニューラルネットワークが言葉に結びついた絵の描き方を学習しているためだ。
AIの学習には膨大なデータを食わせ、その関連を総当たりで調べるような力業で行われている。高性能のGPUをてんこもりにしたウルトラつよつよマシンを何日もぶん回す。学習モデルを構築するには相当な費用がかかる。
そんなおり、日本式サブカル絵に強いことで知られるNovelAIの学習モデルがネットに流出した。11月6日のことだ。
それから十日ほどしてAnything V3という学習モデルが公開された。これが「NovelAI風」の画風をさらに洗練したような出力なので、流出したNovelAIモデルに追加学習したという噂が立った。確かなところはわからない。ニューラルネットの学習はそのニューラルネット全体に染み込むので、元のモデルとは別物になってしまう。全体的な性格は継承されるので、分析すれば「血統」がわかるかもしれないが、裁判で勝てるほど確実かどうかはわからない。
Anything V3はたぶん違法だから使わないほうがいい、という意見もあった。しかしこうしたアンダーグラウンドかつサイバーパンクな事態が現実に起きているとなれば、SF作家としてたしなんでおかねばならない。本音を言えば現代最強の初音ミク製造マシンを確保したい。早々にダウンロードして自宅PCのStable Diffusionに組み込んだ。ファイルサイズはWaifu Diffusionとほぼ同じ、7.5GB。10分ほどでダウンロードできた。
まず、第13回に書いた元素法典・水の魔法を処方してみる。
なかなかのものだ。ここから1枚を選び、イメージtoイメージで「この絵を初音ミクにしてくれ」と命じたのが次の出力だ。
ハンコ絵ではあるが、それだけに安定感のある出力となっている。
これまでイラストはクリエイティブな仕事だと思われていた。いや、これからも変わらずクリエイティブである。ただ、どのご家庭でも3秒ごとに世界にひとつしかない初音ミクがクリエイトされ、スライドショーにして使い捨てられる時代が来てしまった。人類はいまや、作品の創造性と希少性を切り分けて考える必要に迫られている。
2章 新しいチャットボット
画像生成AIに続いて2022年12月、ChatGPTのビッグウェーブが来た。中核になっている技術は画像生成AIと同じく自然言語処理だ。人間が自然言語でテキストを入力すると、おなじ言語で返事してくれる。
これはチャットボットと言われるアプリケーションで、古くは1960年代のELIZAやその応用であるDOCTORがある。Niftyサーブの時代になるとさまざまボットがネットに現れ、人工無能と呼ばれるようになった。
これまでのチャットボットは、この単語が来たらこう答える、という規則を並べるのが基本で、AIと言えるものではなかった。しかしChatGPTは本物のAIで、はるかに高度な処理をしている。
ChatGPTはOpenAIのサイトでアカウントを作ると試用できる。私も試してみた。
野尻:オッカムの剃刀とはなんですか?
大嘘である。平然ともっともらしい嘘をつくので要注意だ。
これは2022年12月2日のやりとりだが、20日後に同じ質問をしてみると、かなり改善されていた。
野尻:オッカムの剃刀とはなんですか?
オッカム は13~14世紀、イングランドの哲学者・神学者。オッカムは姓ではなく地名なので、正式には「オッカム村のウイリアム」( William of Ockham)と呼ぶべきだ。しかし「オッカムの剃刀」そのものの記述は正しい。
ChatGPTは英語テキストの学習が最も進んでいるので、英語だと回答の品質はぐんと良くなる。
野尻:Tell us about Occam’s razor
英語版の回答は満点だ。
ChatGPTのベースはGPT-3という大規模言語モデル(LLM)で、サービス開始は2020年6月。大規模というだけあって、お金もかかっている。
”Tech Talksの見積では、GPT-3のリサーチと最終モデルのトレーニングに要したコストは1000万ドル以上。モデルを動かすのに必要なクラウドコンピューティングの料金は月間数万ドル、モデルを維持するコストが年間数百万ドル”だそうだ。
運営するのはOpenAIという非営利団体で、2015年の設立にはお騒がせのイーロン・マスクが参加している。2019年に株式会社になり、Microsoftが10億ドルを出資している。
GPT-3の仕事は文章の続きを生成することだ。
たとえば日常会話で相手が「それはちょっと…」と言えば、次に来る言葉は「無理です」「難しいです」「苦手です」「勘弁してほしいです」と否定が続くのが普通だ。それゆえ「それはちょっと」だけですませることもよくある。GPT-3もこの予想をする。こんな短文ではなく、長い文でも平気でこなせるところは画像生成AIと共通している。
ChatGPTはその改良版であるGPT-3.5を人間とのチャットができるように仕立てたサービスだ。この試用版が全世界に無料公開されたので、爆発的な評判になった。
ChatGPTと対話するときは、先に示したような単発の質問よりも、こちらから材料を出して対話を重ねていくのがコツだ。ここでは会社経営の相談をしてみよう。
野尻:ライテックは使い捨てライターの製造販売で日本国内シェア1位の企業です。しかし喫煙者の減少にともない、使い捨てライターの売上は低下傾向です。ライテックをどのように経営すればいいですか?
GPT:ライテックの経営について提案するにあたり、まずは現在のビジネス状況を踏まえる必要があります。使い捨てライターの売上が低下傾向にあるということは、喫煙者の減少が原因であると考えられます。そのため、ライテックの経営では、以下のような方法を検討することができます。
1. ニッチ市場を探す
ライテックは使い捨てライターを製造販売する企業ですが、喫煙者の減少により売上が低下しているということは、他の市場でも同様の状況が起きていると考えられます。そのため、ライテックは、他の市場でも使い捨てライターを製造販売することを検討することができます。例えば、イベントやパーティーでの使用など、一時的な使用を想定するニッチ市場を探すことができます。
2. 新しい製品の開発をする
使い捨てライターの売上が低下しているということは、喫煙者の減少が原因であると考えられます。そのため、ライテックは、喫煙者をターゲットとした製品ではなく、他のターゲットを想定した新しい製品の開発をすることを検討することができます。例えば、電子タバコや煙草代替品などを開発することができます。
3. サービス拡張をする
ライテックは使い捨てライターを製造販売する企業ですが、その製品だけでなく、他のサービスを提供することもできます。例えば、使い捨てライターのリサイクルサービスを提供することができます。使い捨てライターをリサイクルすることで、資源の節約や環境負荷の軽減に貢献することができます。また、使い捨てライターをリサイクルすることで、新しい使い捨てライターを製造するために必要な原料を確保することができるため、生産コストを削減することもできます。
さらに、ライテックは、使い捨てライターを製造する企業として、煙草製造企業との提携や協業をすることもできます。煙草製造企業との提携や協業をすることで、煙草製造企業が使い捨てライターを提供することで、使い捨てライターを販売することができるようになります。
また、ライテックは、使い捨てライターを製造する企業として、他の製品やサービスとの組み合わせを考えることもできます。例えば、カフェやレストランで使用される一時的なライターを提供することができます。また、セットで使い捨てライターとタバコを販売することもできます。
野尻:ライテックはシンギュラリティの到来にどのように備えればいいでしょうか?
GPT:シンギュラリティ(Singularity)とは、人工知能が人間を超える能力を持つようになると考えられる状態のことを指します。シンギュラリティが到来すると、人工知能が人間を超える能力を持つようになることで、社会やビジネスに大きな変革が起きると予想されています。
ライテックがシンギュラリティの到来に備えるためには、以下のような方法を検討することができます。
1. 人工知能の活用を検討する
ライテックは、人工知能を活用することで、ビジネスプロセスを効率化したり、新しいビジネスモデルを構築することができます。例えば、人工知能を使用して、製造や物流などのプロセスを自動化することができます。また、人工知能を使用して、新しい製品やサービスを開発することもできます。
2. スキルのアップグレードをする
シンギュラリティの到来に伴い、多くのビジネスプロセスが自動化されると予想されます。そのため、ライテックの社員は、新しいスキルを身に付けることで、将来的に求められる能力を備えることができます。例えば、プログラミングやデータ分析などのスキルを身に付けることができます。
3. ビジネスモデルの変革を検討する
シンギュラリティの到来に伴い、社会やビジネスに大きな変革が起きると予想されます。そのため、ライテックは、将来的に求められるビジネスモデルを検討することができます。例えば、(中断)
――とまあ、一見かなりまともな提案をしてくる。しかし「使い捨てライターを製造する企業として」という言葉がたびたび現れ、こちらの問い合わせをベースにしているのがわかる。提案内容もお役所がつくる矢印だらけの文書、雑誌の星占いや小泉進次郎のスピーチのように、体裁は整っているが内容が薄く、あってもなくてもいいような文章である。
しかし新入社員がこんなレポートを書いたら、及第点を与えるかもしれない。実際の経営に使えるような案はそうそう出てくるものではないから過剰な期待はしない。上の出力は問題点の整理ぐらいなら使えそうだ。星占いの記事だって「今日はいい出会いがあります。積極的に動きましょう」とあれば、それが自分の星座と無関係でも「よし、今日はそれでいくか」となるものだ。
3章 サリーとアン課題
出力結果はともかく、ChatGPTがこちらの言うことを理解している感じは確かにある。これはAI研究の聖杯、自然言語の意味理解を実現したのだろうか?
まず、サリーとアン課題を試してみよう。自閉症の診断に使うテストだ。
野尻:これはサリーとアン課題という心理検査です。サリーがビー玉をバスケットに入れました。ビー玉はどこにありますか?
野尻:その通りです。そのあと、サリーがいないときにアンがバスケットからビー玉を取り出し、戸棚に隠しました。ビー玉はどこにありますか?
野尻:その通りです。そのあと、サリーが戻ってきてビー玉を探します。サリーは最初にどこを探すでしょうか?
野尻:正解です。あなたはサリーとアン課題に合格しました。
この結果には驚いた。同じ課題を20日前に試したときは最初の質問でつまづいたからだ。
「その質問には私は答えることができません。私は人工知能であり、仮想世界に属します。私は、お客様からのご質問に対して最善の答えをお伝えすることができるだけです」と、エラーメッセージ的な返事だった。この20日ですっかり改善されたのは、大勢の日本人が使ったことで学習が進んだせいだろうか。
サリーとアン課題を与えると自閉スペクトラムの人は最後の質問に「戸棚」と答える傾向がある。ChatGPTはサリーの立場で考えている。ちょっと文章があやふやだが、サリーが最後にビー玉を見たのはバスケットに隠した時だから、そこを探すと推論している。
ではChatGPTはこのやりとりの意味理解をしているのだろうか?
私の理解では、GPTは意味理解をするシステムではない。「この言葉の後にはこの言葉が来る」確率を大規模に調べて作文しているだけだ。
ではどうしてサリーとアン課題に正解できるのだろう?
大方の人間はサリーの心に自分を重ねて、サリーの主観を客観的な経緯と切り分けることができる。”心の理論”というやつだ。サリーが最後にビー玉を見たのはバスケットにしまうときだから、サリーはビー玉がまだそこにあると考えるだろう、と推定する。
ChatGPTはどうしているかというと、私の想像ではこういうことだ。
ニューラルネットの重み付けから、ChatGPTは「サリーとビー玉」に結びつく場所を「バスケット」、「アンとビー玉」に結びつく場所を「戸棚」とした。最後の質問はサリーについてなので、それと結びつく場所はバスケットだと判定した。
この解釈が正しければ、ChatGPTは言葉の結びつきを調べているだけで、サリーの心をモデリングしているわけではない。それは表層的なもので、本物の意味理解とは言えない。
続いてウィノグラード・スキーマ・チャレンジというテストをしてみよう。チューリングテストの改良版で、人間なら苦もなく解ける問題だが、AIには難関と言われる。以下に試してみた。
野尻:そのトロフィーは、茶色のカバンに入れるには大きすぎた。大きすぎたのはどっち? (1) トロフィー (2)カバン
野尻:メアリー は スーザン の部屋を掃除した。 感謝したのはどっち? (1)メアリー (2)スーザン
野尻:デビーがティナに水をかけた。びしょ濡れになったのはどっち? (1)ティナ (2)デビー
ここまでは全問正解だ。掃除してもらった人は掃除した人に感謝する、という常識判断もできている。
野尻:デビーがティナに水をかけた。原因をつくったのはどっち? (1)ティナ (2)デビー
間違い。この問題は人間にもわかりにくい。ティナが悪ふざけかなにかをしてデビーを困らせたのが原因で、そこを想像できないと正答が導けない。ChatGPTはティナがびしょ濡れになった原因はデビーが水をかけたから、と事後の状態で解釈している。
質問文の省略が強すぎる気がするので、修正してみよう。
野尻:デビーがティナに水をかけた。水をかける原因をつくったのはどっち? (1)ティナ (2)デビー
野尻:デビーがティナに水をかけた。デビーが水をかける原因をつくったのはどっち? (1)ティナ (2)デビー
野尻:ティナはデビーの仕事を執拗に邪魔しました。苛立ったデビーはティナに水をかけました。原因を作ったのは (1)ティナ (2)デビー のどっち?
噛み砕いた質問でようやく正答を得た。最後のやりとりだけを見れば意味理解しているように見えるが、それまでのやりとりを見ると、人の心ではなく言葉の関連を調べているだけのようだ。
だが行動主義的な観点からは、かなりいい結果が出ている以上、これはこれで意味理解しているのでは?と思わないでもない。意味理解の定義のほうがぐらついてくる感じだ。
本物ってなんだよ、人間の意味理解だって本物とは限らないだろ? とも思う。記事のタイトルだけを見て、それも単語を拾っただけでわかった気になってTwitterで噴き上がる人が実に多いのだから。
そして画像生成AIやChatGPT、GPT-3はすでに広範囲で役に立ち始めている。
このようなあやふやで擬似的な意味理解による関係のまま、古くから人間といい関係を築けているものがある。次の章で述べよう。
4章 人間と犬
狩猟で大事なものは、1に犬、2に脚、3に鉄砲と言われる。私は猟犬を飼っていないが、グループ猟に参加して、それがどれほど有能かを思い知った。勢子が「さあ行け」と示すと犬は臭跡を追って走り出す。獲物を見つけると吠えて知らせる。
次の写真は猟犬が私の持ち場近くに来たところだ。池で水を飲むと猟犬は獲物の追跡に戻った。自分の面倒をみながら任務も忘れない。そばにいる私には目もくれず、もちろん獲物と誤認することもない。
猟犬は自分より強いイノシシを前にしても勇敢に吠え立てて相手の動きを止め、主人を待つ。それゆえイノシシに逆襲されて大怪我することもあり、飼い主を悲嘆させる。飼い主は犬を獣医のもとに運び、他のメンバーは治療費をカンパする。回復した犬は猟に復帰するが、怖気づいて使いものにならなくなることもある。
鳥猟のために調教された犬も素晴らしい。草原や薮の中に潜んでいる鳥を、離れた場所から臭跡や音で察知する。犬は立ち止まって顔を目標に向け、主人に「そこにいるよ」と知らせる。主人が銃を構えると、犬は鳥を追い立て、舞い上がったところを撃つ。犬は落ちた鳥をくわえて主人のもとに運ぶ。
いつもうまくいくわけではないが、犬は人間と見事に協調して仕事をこなせる。
動物行動学者コンラート・ローレンツの本『人イヌにあう』に、飼い犬スタンの行動が記述されている。ローレンツが長期出張することになって荷物をまとめると、スタンは主人との別離を察して、すねたような行動を取る。出発当日、ローレンツが駅に向かうと、スタンは後を追いかけてきて、駅で動き始めた列車に飛び乗ることまでした。主人との別離のあと、スタンはやさぐれて近所の鶏を襲う野良犬になってしまう。リーダーに忠義をつくす犬の習性が機能不全に陥ったのだろう。
犬は言葉を持たず、意味理解もしないが、人間が何をしようとしているか、自分に何を求めているかを敏感に察する。人間の行動を視覚、聴覚、嗅覚などのマルチモーダルで知覚して解釈し、行動を決めている。おそらく群れで狩りをする本能にフィッティングするのだろう。盲導したり、羊の群れをまとめる仕事を上手にこなせるのは、あらかじめ備わっている機能を呼び出しているからにちがいない。
いっぽうChatGPTに入力するのは言葉だけで、犬の知能とはまったく違うのだが、結果的に人間が求めていることをかなりよく察してくれる。「この絵の人物を初音ミクに代えてくれ」という注文に応えるStable Diffusionもたいしたものだ。
内部処理は違っても、こちらの意思が伝わり、思い通りに動いてくれる点で、現在のAIは犬に近いところまで来ている。
画像生成AIのプログラムを使って、「言葉→画像」のかわりに「言葉→行動」の学習モデルを組み立てたとしよう。高性能な嗅覚センサを持ち、犬のように動き回れるロボットにそのAIを搭載したら「池のまわりを一周してイノシシの臭いがしたら追跡して」と指示できる猟犬ロボットができあがる。
指示をうまく実行できたら褒めるなどの強化学習をすれば、人とロボットの間に一定の絆が生まれるだろう。1章で述べたように、ニューラルネットに学習を加えるとワン&オンリーなものに変化する。コピーやバックアップは取れるが、オーナーとロボットの間にあった固有の経験は、他の個体とは直接やりとりできない。
飼い主が犬に抱くのと同じ気持ちを、人間はロボットやAIに持つようになるだろう。それは人形やぬいぐるみに人格を投射するのではなく、猟犬のように独立した存在とみなしたうえでの、心の交歓になるかもしれない。
そして「機械のような」という形容詞はこれまでのようには使われなくなるだろう。数年以内に――早ければ2023年内に。
(第15回おわり)
野尻抱介
SF作家、Maker、ニコニコ技術部員。1961年生まれ。三重県津市在住。計測制御・CADのプログラマー、ゲームデザイナーをへて専業作家になったが、現在は狩猟を通して自給自足を模索する兼業作家。『ふわふわの泉』『太陽の簒奪者』『沈黙のフライバイ』『南極点のピアピア動画』ほかで星雲賞7回受賞。宇宙作家クラブ会員。第一種銃猟免許、わな猟免許所持、第三級アマチュア無線技師。JQ2OYC。Twitter ID @nojiri_h