ChatGPT事始め

 数日前に、〈大学生、AI丸写ししリポート提出も・・・教授「試験のあり方自体変えなければ〉という見出しのついた読売新聞のネット記事を見かけた。おおむね以下のような内容である。
 全国大学生協連の調査によると、チャットGPTなどの生成AI(人工知能)について、大学生の2人に1人が使った経験を持ち、利用経験はないが、今後使ってみたいという学生は回答した約1万人の3割近くに上る。〔利用経験はないと回答したのが1万人ということか? そうでないと辻褄が合わない。引用者〕
 ある大学教授は「AIが作成したリポートには、授業で触れたデータや視点が盛り込まれておらず、すぐにそれとわかる。にもかかわらず、平気でAIの回答を丸写ししたリポートを提出する学生があとを絶たない。対策として、授業で学んだことを踏まえて書くことといった条件を課しているが、AIの登場で、試験のあり方自体を変えなければいけない」と話している。
 生成AI登場後、AIにリポートを書かせないよう注意喚起する大学が相次いでおり、文部科学省も昨年7月、AIにリポートを書かせる行為は「学びを深めることにならない」「ひょう窃に当たる可能性がある」として、各大学にルールを整備するよう促している。だが学生に、AIに潜むこうした危険性が十分には浸透していない。
 リポート作成に生成AIを使っているというある学生は、AIが作った文章の順番を入れ替えたり、堅苦しい表現を平易な言葉に置き換えたりして仕上げているが、「ネット検索と同じ感覚。罪悪感を持つこともない。この便利さに慣れると、もう後戻りできない」と明かす。一方、別の学生は、AIの安易な利用が独創性や著作権を軽視する風潮につながりかねないことを心配する。「法律やモラルが追いついていないのに技術ばかりが進化していく状況は危険だ」と感じているという。
 金子元久・筑波大特命教授(高等教育論)は「AIの回答だけでは対応できない問いを示すなど、教員側の工夫が一層、重要になる。出力された文章には虚偽の情報が含まれるなど、AIの危険性を教える必要もある」と指摘している。
 以上が記事の要点。これを読んで私がまず思ったのは、そもそもリポート試験というやり方が不正を誘発する性質を持っており、それは昔も今も変わらないという点である。今、問題になっているのは、AIの文章をコピー&ペーストし、少しぐらいは整形するかもしれないが基本的には自分で書いたのではないものを自分が書いたものとして提出する行為である。しかし、誰かに書いてもらった文章を書き写して自分のリポートとして提出することはAIの生まれるずっと以前から可能だったのであり、今始まったことではない。そんな不正がどれくらい実行されていたのか分からないが、少なくとも可能性としてはあり得たし、現在もあり得る。あるいはそこまでしなくとも参考文献の文章を写し取り、引用と示さずに利用することぐらいは丸々全部でなくとも部分的になら多くの学生がやっていたのではないか。なかったとは言い切れないだろう。そしてAIの登場によって、自分が書いたのではない文章を気軽に自分のものとする可能性が従来とは比較にならないほどに広がり、それゆえ大きな問題となっているというのが現在の状況。
 疑問もわいてくる。AIの作文を丸写しするとか、あるいは文体を手直ししたり文章の順序を入れ替えたりするだけでほんとうにリポートなるものができあがるのものなのか。人間に匹敵する文章作成能力が人工知能にはそなわっているのか。大規模言語モデルとかいわれても私にはピンとこないが、とてつもなくでっかい計算量とデータ量とパラメーター数(?)を取り込むことによって人間の言語に近い言語能力を得ることができるらしい。気になる存在ではある。ほんとうに信頼していいのだろうか。私もこれまでも検索エンジンにはお世話になってきたけれど、生成AIとか、対話型AIとか、チャットボットとか呼ばれるもの(これらの区別は私にはつかない)は必要もないので未経験であった。今回CharGPTを試しに使ってみた。といっても、あくまで遊びだけれど。
 ChatGPTを取り上げていたNHKの科学番組「サイエンスZERO」(2023.6.11)ではこのシステムが数学に弱いことが指摘されていた。4X-3Y=-9と3X-7Y=17からXとYを求める連立方程式が解けない。あるいは、ジャグラーが投げ上げるボールは16個でその半数がゴルフボールであり、さらにその半数が青い色である。青い色のボールは何個かという問題に8個と答える。同種の問題を多数解かせたら正答率は17%程度であったという。ちょっと驚いてしまう。こいつひょっとしてアホなのか。ただしこのボールの問題では質問の仕方を変えて、ゆっくり考えなさいなどとアドバイスめいた文言を付け加えると正答率は一挙に70%を超えるということも紹介されていた。言葉には敏感に反応するらしい。人間的であるともいえるし、大規模言語モデルの面目躍如ということなのかもしれない。それでもとにかく数学は苦手なのである(小学生並み?!)。ではとびきり言語的な問題なら得意であるはずと考えられるがどうだろう。次に紹介するのは私の実験。ChatGPTに「萩原朔太郎のような詩を作ってください」と依頼してみた。それに応えてくれたのが以下の3行5連の詩。

秋風に舞う紅葉の舞い落ちて  
満月の下、寂寥の庭に  
哀しみの調べがそっと響く

静かなる夜の青空の下  
星々が瞬く闇の中で  
一つ一つが物語を紡ぐ

やがて時の流れも忘れ去られ  
ただ、自然の声だけが聞こえる  
心の奥底で響くその調べ

遥かなる大地が語る物語  
人々の行く先を照らす光  
そこに在るは、永遠の営み

萩原の心の中に宿る  
自然の詩の魂よ  
永遠に響くその調べよ

ん、これが朔太郎か! 「萩原の心の中に宿る」なんてやればいいと、とんでもない誤解をしているのか。では、中原中也のような詩を作ってと注文したらどうなったか?

夜の闇に溶け込む影  
星屑のような寂寥の中  
遠い鐘の音が響く

ひとりきりの海辺に立ち  
波の音に耳を傾ける  
時の流れを感じながら

夢見るような世界が広がり  
心の奥深く響く声  
その音色は無限の哀しみ

瞬く星々の輝きの中で
自らの在り方を問う  
ただ、虚空に問いかけるばかり

中原の心の中に響く  
孤独の詩の魂よ  
永遠に続くその旅路を

 あまり変わらないではないか。そして、またしても「中原の心の中に響く」である。続いて宮沢賢治三好達治草野心平などとやってみたが全部この調子。「朝焼け」「夕焼け」「古い街並み」「遠い夢」「人々の影」「過ぎ去った日々」「美しき記憶」「かすかな風」「あの日の静けさ」などを並べたら詩ができると考えているらしい。どういうことか。中原や宮沢などの詩は私たちこそ読み慣れているが、インターネット上のデータとしては多くはないだろう。つまり学習材料に乏しいわけで、AIとしても困っているのだろう。苦しまぎれの感が否めない。もしかしたら実在しない詩人の詩も作ってくれるかもしれない。ということで、岸田文雄のような詩を作ってとリクエストしてみると「岸田文雄風の詩」として次の8行が出てきた。

風が吹く 木々のそよぎ ぼくの心にも
時の流れを感じつつ 歩みを進める

未来の輝きを求め 夢を追う旅
その先にある景色は いつも輝かしい

悩みや苦しみも やがては遠く
希望の光が射し込む 暗闇を照らす

岸田文雄のように 心豊かに生きよう
愛と勇気を持って 世界を照らそう

 思わず拍手👏👏👏。羽目をはずすのはこの程度にして、次は趣旨を変え、純粋に日本語の問題として解ける課題を出してみた。先日の本ブログ(2024.1.23)に載せたクイズをそのまま利用。下の詩の○○○に入る適切なひらがな3文字は何か。これを解くのに作者工藤直子についての知識はまったく必要でないはずである。日本語のセンスだけが問われる。

  ○○○ぜ
       かまきりりゅうじ

もちろん おれは
のはらの たいしょうだぜ
そうとも おれは
くさむらの えいゆうだぜ

しかしなあ
おれだって
あまったれたいときも
あるんだぜ
そんなときはなあ
おんぶしてほしそうな
かっこになっちまってなあ
  ・・・・・・
○○○ぜ  

 ChatGPTの答は「びみょうぜ」。「びみょう」は4文字だが3音節ではある。3文字という条件はクリアしていると認めることにしよう。さらに大目に見て「びみょうだぜ」と訂正したうえで語感的にはどうかを考えてみよう。「たいしょう」「えいゆう」を自任するかまきりも、その格好を見ると「あまったれたい」「おんぶしてほしい」と思っているように見えるところがおもしろい。そのアンビバレントな感情を「びみょう」と形容しても間違いではない。なるほど「甘ったれで、おんぶしてほしい英雄」なんて微妙ではある。しかしそれは、「たいしょう」「えいゆう」という語を「あまったれたい」「おんぶしてほしい」という語と対比させ、概念としての矛盾から引き出された、いわば辞書的な解釈なのである。かまきりが自分の矛盾した感情を言い表す最後の一言、しかもユーモアの仕上げとなるべき最後の一言としては「びみょうだぜ」は的を外しているといわざるを得ない。間違いであると断言してもよい。ここはやはり「てれるぜ」しかないだろう。
 ChatGPTが数学を苦手とする理由は、数式を対象とすることが元々考えられていない、すなわちコンセプトが違うからだろうと推測できるが、言語に強いはずの大規模言語モデルがなぜ詩をうまく扱えないのか。これも私が勝手に推測するには、詩は言語の常識的な使い方(辞書に載っている使い方)を逸脱するところに生れるものであって、その詩的言語を生成AIはあまり学習していないのではなかろうか。言語を学習すればするほど詩的言語に疎くなるという逆説さえ成立しうる。さらには日本語の詩の場合、インターネット上のデータとしては極めて微量にしか存在しないという事情も追い打ちをかけているのではないか。つまり、詩的言語と日本語という二重の制約が影響しているのではなかろうか。
 そのように数学も詩も不得意なChatGPTではあるが、常識的な言語使用なら得意で、したがってレポートを書く手伝いならおおいにしてくれることが期待できるのではないか、と思われる。どんなレポートができあがるのか興味がわいてくるが、今回はここまで。ChatGPTに依存したレポート作成については改めて書きたい。