[雑感057] 『AI vs. 教科書が読めない子どもたち』を大人たちはどう読めているか
- 新井 紀子 (2018).『AI vs. 教科書が読めない子どもたち』東洋経済新報社. [Kindle]
について。TwitterやFacebookで見てる範囲では肯定的な感想が多い。教育(学)関係者からはもう少し厳しい感想が出てくると思って読んだのだが。
今のところ「真の意味でのAI」は存在せず、現状のAI技術の原理から言って「シンギュラリティ」は到来しない、という話の部分は明快だし、読む価値がある。ここ数年、定年まで自分の職が安泰であることを疑ったこともないような立場の人が、耳かじりの「みなさんが大人になる頃には今ある仕事の半分はAIに取って代わられて…」みたいな話をするのを聞くとヘドが出そうになるので、そういう人には特に第1章と第2章で理解を深めて欲しいが、本書もその点については脅し煽るような書きっぷりなので読んでもあまり変わらないかもしれない。
私が教育(学)関係者からの厳しい感想を期待していたのはそこではなく、第3章以降の「全国読解力調査」の部分だ。まず、このテストで測ったものは絶対で、読者はみなこの結果に慄然とすべき、という書きっぷりがどうも好きになれない。好きになれないというのは私個人の感想だが、そこに、実証研究の報告としても粗雑であることが表れているように思われる。結果は事実かもしれないが、それが学生・生徒の論理的思考力や推論能力そのものを果たして表しているかどうかの解釈にはもう少し慎重であるべきではないかという記述が多い。
指摘したい問題は大きく2つある。
一つは、テストの結果を解釈する前に、人が言葉を、あるいは書き言葉の文(章)を理解する際の認知的メカニズムについて本書では何らの説明(理論的仮定)も示されていないということだ。「言葉には明らかに記号の羅列以上の『意味』があり」、それは「観測不能」で、現状のAI技術では処理が難しいことは述べられているが、逆に人間がその「記号の羅列以上の『意味』」を「理解」する際にどういうことが起きているのか、「発話には意図があり、それに応じるところには意味の理解がある」と言うが、では各個人の語彙や背景知識、前後の文脈、聞き手・読み手と話し手・書き手との関係性はそこで一体どういう役割を果たしているのか(No. 1762)。
本書の「読解力」は、「『太郎は花子が好きだ」という文は、まさにその通りの意味で、何か他のものに還元することはできません」(No. 1777)などといった記述をみると、ごく素朴な命題的意味の論理的関係の把握を意味していることが窺える。しかし、ある状況でこの文を読んだ時に、「太郎」や「花子」、「好きだ」について各個人が一義的に同じ表象を持つという保証はどこにもない。例えば、東ロボくんでも正解できた「Alexandraの愛称」問題に中学生(n = 235)の38%しか正解できなかった件について、「おそらく『愛称』という言葉を知らないからだ」という分析がある(No. 2515)。しかしそれ以前に、もしこの問題が、
「ゆうちゃん」は男性にも女性にも使われるあだ名で、女性のユウカさんの愛称の場合もあれば、男性のユウキさんの愛称の場合もある。
→ユウカさんのあだ名は( )である。
①ゆうちゃん、②ユウキ、③男性、④女性
といった文で与えられたなら、正解する中高生はもう少し増えることが予想される。それは、少なくとも日本語によるテストである以上、”Alexandra”よりも「ゆうちゃん」のほうが日本語話者に馴染みのある語彙であることが予想され、「愛称」よりも「あだ名」のほうが経験的にその関係性を理解しやすいことが予想されるからだ。Robertの愛称がBobだという知識を持っていたり、実際にRobertという名を持つ人を何人も知っていて、目の前で、あるいは映画やドラマでその人がBobとかBobbyと呼ばれるのを聞いた経験を持つ私と、そうした知識・経験を一切持たない中高生のRobertやBobの表象は同じではない。つまり、そうしたことが正答率に影響すると考えられるにもかかわらず、そういった要因については一切の言及がなく、与えられた文についてみんながみんな同じイメージを浮かべるはずだし、そうであるべき、という調子なのだ。
言語使用がそんな単純なわけないじゃん!となぜ多くの言語教育(学)関係者がツッこまないのか、不思議だ。そして、ここでの「不思議だ」は100%皮肉を意図したものであって、決してその謎にドキドキワクワクしているわけではない。というような複雑性を持った人間の言葉とその認知の仕組みについて、もう少しよく考えて結果を解釈してほしいものだ。
もう一つの問題は、個体還元主義的能力観に溢れていること、逆に言うと関係的能力観的発想が全く欠如していることである。
例えば、大学生数学基本調査の「偶数と奇数とを足すと…」の証明について、「2n+(2n+1)=4n+1なので奇数」という解答を「典型的な誤答」として、「理工系では致命的」と断罪しているが、もともと本人が明らかにしたいと抱いた疑問でもないのだし、「それで、偶数+奇数の全ての場合が説明できるかな?例外はない?」とやり取りして、考える時間を取ればかなりのところ改善する話ではないだろうか。証明が証明として満たすべきことを理解していない者や、教科書や新聞を独力で正しく読めていないものが何をか言わんやというのは一つの姿勢としてあっても構わないが、人間に得意なのが柔軟に応用を利かせることだとすれば、必要に応じて他者とやり取りして確認して解決すればいいだけではないのか。現に、著者自身が東ロボくんの開発において自分ひとりではなく、多くの専門家の協力を仰いでいる。なぜ(基礎)読解力についてはそれではダメなのか。
著者は「教科書」を金科玉条のように扱い、それを各個人が「読める」ようにすることが全てといった調子だが、独力で読んで学んでいけるというのは、「教科書」が果たし得る機能の一つではあっても、教科の授業で用いることを意図したものである以上、全てでもなければ主要機能でもない。そもそも生徒の側から見れば、その執筆に関わったことがある者としてこんなことを言うのもなんだが、教科書など多くの者にとって一人で読みたいと思うものでもなく、読めなかったからといってどうってこともない存在だろう。「読めないままでいい」と言うつもりは勿論ないが、著者のように「読めて当然なのに」という感じになれる理由が私にはさっぱりわからない。これまで授業研究や実践報告で無数に報告されてきた通り、全く「当然」ではない。最近の子どもたちが読めていないのではなくて、著者の測っている脱文脈的で、解答者との意味的な関わりを問わない文(章)の「基礎読解力」の意味なら、今も昔も、老いも若きもそうだろう。
教科書が、授業の中で生徒それぞれが解釈をし、それについて意見を交わし、必要があれば解説や補足があって、各自の理解を深めていくためにこそあるとすれば、著者の調査が明らかにしたことはむしろ、もっともっとそういう関係性を充実させるべき部分があちこちにあるということだ。「教科書を読めない」子どもたちが「読めていない」ことを自覚できていないことよりも、「教科書を読めている」大人たちが「読めている」と自覚できていると思っていて、集団の中で読めるようになっていく過程や、各個人がその能力を発揮できる関係をすっ飛ばして、全ての子どもたちが「読めてない」のはおかしいし残念だし正されるべきだと考えることの方が私にとっては大きな問題である。個人で受験するテストで何でも測れてそれに沿った画一的な教育が行われるべきだと考えているような人、あるいは産業化時代の教育観でしかモノを考えられない人は、できれば教育の議論にドヤ顔で首をつっ込んできてほしくない。
ひとつ意地悪な、しかし重要だと思われる批判をしておくと、「基礎的読解力は人生を左右する」(No. 2702)という、これまた煽り方の激しい節で提示されている「RSTを受験した高校の平均能力値と『家庭教師のトライ』と『偏差値net』が公表しているその高校の偏差値との相関」は随分危うい議論に思える(RSTは著者たちが作成したリーディング・スキル・テストの略)。
「全国2万5千人の基礎的読解力を調査」とあるが、「埼玉県戸田市の全中学校と小学校6年生、福島県や北海道の教育委員会、私が講演に伺ったことのある高等学校を中心として10校、一部上場企業などで、2万人を調査しました」(No. 2379)という記述から、調査した高校は10校だということが分かる(ちなみに、戸田市のWebページによれば、現在、中学校は全部で6校、小学校は全部で12校)。これに「2019年度から始まる予定の『高校生のための学びの基礎診断』の試行調査の一環として5000人を調査してい」るという高校が加わるのかどうかは定かではないが、直前の節の表3-9にについて「高校は、1、2年生が受験した高校基礎テストの協力校約5000人分のデータを掲載しています」(No. 2659)とあるから、もしかしたらこちらのデータのみが使われているのかもしれない(一般向け書籍だからと強弁されればそれまでだが、こうしたデータの提示の仕方についても不誠実さを感じてしまう)。人数的にこちらも10校程度だろう。両方合わせると、無作為抽出かどうかわからない(前者については確実にそうではない)高校が20校程度。そうすると、10〜20程度のサンプルで相関を計算していることになる。それで「RSTのほとんどの分野で0.75から0.8の相関があります」と騒ぎ立てているのだが、信頼区間は随分広いことになっているのではなかろうか。つまり、たまたま左下の偏差値の低い高校と右上の高い高校で強めの相関が出ていて、ここにいくつか別の高校のデータが加われば結構数値が動いてしまうような結果ではないのだろうか。
それ以上に、著者が本書で直接・間接に述べ立てているように、(基礎)読解力が個々人がきちんと所有すべき能力なのだとすれば、なぜ個人を捨象した「高校の平均能力値」と(業者が示した)高校の「偏差値」(母集団がどの範囲かはわからないが、その中での相対的位置を示す指標。しかし何を示すもの?)の相関で議論をするのか。そして、なぜそこから「もっとも正しい解釈は『基礎読解力が低いと、偏差値の高い高校には入れない』でしょう」(No. 2702)という個人についての解釈が引き出せるのか。各高校の分散が分からないのでなんとも言えないが、著者が数学的に問題のある解釈を提示するとは思えないので、偏差値も読解力も高くない私にも読めるようにもう少し丁寧に書いてほしいところだ。
さて、最後の一文で私が言わんとしているのは( )である。
①皮肉、②本音、③解釈は読み手次第だということ、④何かしらオチをつけないと記事を締め括れないということ
Alexandraとゆうちゃんのくだり
この問題をゆうちゃんに書き換えたら、読解力のテストとして支障が生じます
わかっていてごまかしているのか?
わかっていないのか?
どちらでしょうか?
コメントありがとうございます。「わかっていてごまかしているのか?わかっていないのか?どちらでしょうか?」というのが、私に向けられた質問・批判なのか、本の著者に向けられた疑問・コメントなのか分からないのですが、前者だとして、逆に、Alexandraであれば読解力のテストとして支障が生じないのでしょうか*。
私がここで指摘しているのは、Alexを使うのはダメで、ゆうちゃんなら良いということではなく、文(章)の読解には様々な要因がかかわっており、「読解力」を議論するのであれば(これまでの研究に基づいて)考慮・検討すべきことが書かれていないということです。
* 補足しておけば、この問題に関して、私はAlexandraの愛称がAlexであることを知っていたので、前半の文章を全く読まなくても答えられました。その意味で、多くの人にとっての「ユウカさんのあだ名は( )である」と同じです(RobertとBobの記述部分はそういうことを言わんとしています)。そうした知識を持たず、与えられた命題の論理的関係のみでAlexandraの愛称がAlexだと「読解」して回答とした人も多数いると思いますが、重要なのは、同じ問題に対して私とその人たちでは用いた知識が異なるということです。もちろん日本で生活する日本語話者であれば、「ユウカ=ゆうちゃん」という個別的事実を知っている人のほうが、「Alexandra = Alex」を知っている人より多いと予想されますから、「この問題をゆうちゃんに書き換え」るほうが、命題の論理的関係を理解できるかどうかを問うテストの問題としては妥当性が下がり、「Alexandra = Alex」を問うほうがまだマシだと考えるのは間違っていないと思います。ただそれも程度問題であり、どの問題であれ「読解」には、命題の論理的関係だけでなく、背景知識や経験等、様々な要因が大なり小なりかかわるのであって、その影響を考慮したモデルの下で結果を解釈すべきという、ここでの議論の趣旨を変えるものではありません。
「現在ある職業の約50%がAI技術で代替可能なこれからの社会で、これからの子供たちに必要な力は読解力である」という認識は間違いなのでしょうか?
読解力テストのくだりですが・・・そもそも真面目に読んで答える中高生が少ないのではないかと思います。私がこのテストを普通に答えたら正解をなんなく出せまずが、どうでもよいテストであれば、何も考えず3を選んで終了させます。
眠いし、特に評価にも関係のないテストを受けさせられている学生の心理を理解していないサンプルテストを、あたかもすべてであると断じる精神に、恐れを感じます。頭が良い人は、調査結果だけを信じるおバカさんのような気がしてなりません。
概ね同意です。とは言え、学校で先生たちに要求されたテストとなれば真面目に読んで答える生徒もいるでしょうし、テストであるからには間違いたくないという心理も働くでしょうから、十分なサンプルサイズが確保されていれば偏りは相殺されるという前提なのでしょうが。
大変興味深く読まさせて頂きました。読み手に解釈を迫らない文章を書くというのは、難しいものですね。
ところで新井先生の専門の一つである数理論理学は、定義や公理から推論を経て命題を得る一連のプロセスを研究する学問です。当然、読み手に解釈の余地があってはお話にならない世界です。亘理先生は、その厳密な世界を自然言語に適用しようとする思想に、疑問を感じているのではないでしょうか。であれば「できれば教育の議論にドヤ顔で首をつっ込んできてほしくない。」とする限り、溝は埋まらないだろうなあ、と思いました。
この記事を書いたときの心持ちは既におぼろげですが、仰る通りかもしれません。数理論理学の枠組みで教育を語ってはいけないとは全く思わないのですが、あまりにも「領空侵犯」が多いと感じているのだと思います。
アミラーゼという酵素は...。でセルロースは()と違うで誤答しました、答えはデンプン。
そこで違和感を覚え、このページに来ました。なんだか言わんとするところが理解できてスッキリです。
ありがとうございました。