教育ICTリサーチ ブログ

学校/教育をFuture Readyにするお手伝いをするために、授業(授業者+学習者)を価値の中心に置いた情報発信をしていきます。

ひとり読書会:『新しい教育評価入門 人を育てる評価のために [増補版]』 No.3 「第2章 教育評価の機能 何のために評価情報を用いるのか」

 西岡加名恵 先生・石井英真 先生・田中耕治 先生 編『新しい教育評価入門 人を育てる評価のために [増補版]』を読みました。
 今回は、「第2章 教育評価の機能 何のために評価情報を用いるのか」の読書メモを共有したいと思います。第2章は本当にたくさん赤線を引きながら読んだので、真っ赤っ赤になっているページもあります。何度も読み返す章になりそうです。

第2章 教育評価の機能 何のために評価情報を用いるのか

 第2章では、教育評価の機能としてこれまでの章で紹介されてきた、診断的評価、形成的評価、総括的評価をさらに詳しく書かれていました。

教育評価機能の分化

 教育評価活動の機能は、最初は「形成的評価」と「総括的評価」だったのが、ブルームによってカリキュラムや教授、学習改善のための評価として発展され、「診断的評価」が加わって3種の機能に大別されるようになった、と書かれていました。ブルームの著作『教育評価法ハンドブック』でされている整理をまとめました。

3種の評価機能を論じた『教育評価法ハンドブック』のなかでブルームは、それらを区別する規準として次のような3点を挙げている。(p.55-56)

  1. 目的
    • 診断的評価
      • 「授業の開始時に生徒を適切に位置づけることと、授業の展開にあたって、生徒の学習上の難点の原因を発見すること」=学習の出発点における学習適性やレディネスを把握することを目的とする。
    • 形成的評価
      • 「カリキュラム作成、教授、学習の3つの過程の、あらゆる改善のために用いられる組織的な評価」=子どもの学習や教師の授業方法、あるいはカリキュラムなど、教育過程において行われている活動の改善を目的とする。
    • 総括的評価
      • 「1つの学期やコースのプログラムの終わりに、成績づけや認定、進歩の評価、カリキュラムや教育計画の有効性の検討などを目的として用いられる評価の型」=教育活動の効果や有効性を測ることを目的としている。
  2. 時期
    • 診断的評価
      • 学習が開始される前に行われる
    • 形成的評価
      • 学習の途上に行われる
    • 総括的評価
      • 単元や学期末、年度末など、ある一定の期間をおいて行われる
  3. 学力観
    • 診断的評価
      • 評価対象は、興味、パーソナリティ、環境、適性、技能というように、開始される学習への適性あるいはレディネス。
    • 形成的評価
      • 評価対象は、学習によって獲得される学力。高次の学力を構成する基礎的な学力。
    • 総括的評価
      • 評価対象は、学習によって獲得される学力。応用や総合、分析など学力の発展性と呼ばれる高次の学力。

 「診断的評価」と「形成的評価」と「総括的評価」の違い、しっかり整理していきたいと思いました。評価の話をするときに、この3つのあり方を混ぜて話してはいけないなと思っています。特に、目的は明確にしておくべきだなと感じます。

 定期考査の存在もあって中学校、高校と学年が上がるにつれて、評価は「どれだけできるようになったのか」を見るという性格が強く見える気がするけれど、それだけではなく「教師の指導改善」と結びつけることも大事な役割、というのが書かれていました。

評価を学習指導の終着点とするのではなく、評価を教師の指導改善と結びつけることで、評価と指導の関係を相互往還的なものと捉える見方は、「指導と評価の一体化」と呼ばれ、日本の教育評価実践のなかに根づき、発展していった。(p.57)

 ここで出てくるのですね、よく聞く「指導と評価の一体化」という表現は、この流れのなかで出てくるのですね。

 この後で、ブルームの評価論に学んだ、日本の教育評価研究の成果が、3つのポイントでまとめられていました(p.57-60)。

  1. 診断的評価の対象の捉え直し
    • 「まず診断的評価については、評価対象の変化が挙げられる。ブルームが診断的評価の対象としたのは、発達上のレディネスや学習の適性であった。それらは、個々の子どもたちの素質やパーソナリティというように、個々人に備わっている不変の性質を表すものであり、それゆえ、学習の可能性を表すというよりも、学習の制約や限界を示すものであった。
      これに対して、このブルームの考え方を継承しつつも、それを日本の教育のなかで発展させてきた到達度評価研究が、診断的評価によって明らかにしようとしたのは、授業に入る前の子どもの学力実態や生活経験であった。(略)
      レディネスや学習適性と異なり、授業前に子どもたちがもっている学力や生活経験は、授業実践によって変えられ、豊かにすることが可能である。発達上のレディネスや学習適性ではなく、子どもたちの学力実態や生活経験の有無を把握する方向へと変化することで、診断的評価は、子どもたちの学習可能性を拓く扉となったのである。」(p.57-58)
  2. 形成的評価の理念の広がり――「指導と評価の一体化」
    • 「ブルームが形成的テストの実施を提唱したこともあり、日本においても単元、あるいは1時限の授業のなかで小テストを繰り返し、頻繁に理解度をチェックするような形成的評価実践が生まれた。しかしながら、そうした実践事例は、「指導と評価の一体化」という形成的評価の理念を十分に理解したものではなかった。形成的評価の理念とは、指導と評価を結びつけ、評価を指導に活かすことにあり、指導過程においてテストを行うことと狭く限定する必要はない。(略)
      形成的評価の理念は、教師の優れた評価眼や評価技能に学び、それを共有財産としていくことのなかに継承されてきたといえる。(略)
      特に、斎藤喜博の「○○ちゃん式まちがい」に代表される、子どもたちのつまずきを共有化する実践は、日本の形成的評価実践の大切な遺産である。」(p.58-59)
    • 「指導過程で実施する小テストについてはも、日本において次のようにブルームの主張が確認され、発展させられてきたことは重要である。第一に、形成的な小テストは、指導の改善のために行われるものであり、評定など成績評価の素材に使われるべきではないということが改めて確認された。第二に、小テストを実施するのは、その単元のポイントになるところ、子どもたちがつまずきやすいところであり、「評価を大切にすること」と「評価を多用すること」とは区別するべきだとされた。第三に、そうした小テストの作成にあたっては、事前に単元の指導目標を明確にし、目標相互の関連性を構造的に把握したうえで、指導目標と一致した評価基準を設定することが主張されたことである。「指導と評価の一体化」という理念を実現するためには、目標準拠型のテストを実施する必要があり、そうしたテストによってのみ、子どもたちの学習到達度を指導目標と照らし合わせて評価でき、指導の改善に活かすことができると考えられたのである。」(p.59-60)
  3. 総括的評価の展開
    • 「形成的評価の理念の広がりとともに、たとえば形成的評価を積み上げることで総括的評価は達成されるという考え方に代表されるように、総括的評価の役割を軽視あるいは否定する論調も現れたが、総括的評価についても学習成果を判定するだけでなく、その情報を指導の改善に活かす道が探られてきた。」(p.60)

 めちゃくちゃ情報量の多い4ページでしたが、いろんなヒントがここにあるな、と思ってメモしました。僕は「形成的評価」にすごく価値を感じているけれど、自分が授業を担当するときには、あまり意識してやれていないな、と思いました。

形成的評価と総括的評価の新たな展開

 ここまでいろいろと見てきた「形成的評価」と「総括的評価」については、欧米では1990年前後から捉え直す議論が進んでいるそうです。

日本では、現在でも、ブルームが示した3点(①目的、②時期、③学力観)に従って、教育評価の機能を「診断的評価」「形成的評価」「総括的評価」と捉えることが多い。しかしながら、欧米では、1990年前後から今日にかけて、ブルームが示した3種の評価機能、特に「形成的評価」と「総括的評価」の機能を捉え直す議論が進行してきている。(p.61)

 目的とそれに応じた機能によっての捉え直しであるということが続けて説明されます。

教育評価の機能は、学習や指導改善を支援するために行われる評価活動であるのか、それとも学習や指導改善を主たる目的とせず、資格や選抜、あるいはアカウンタビリティのための評価活動であるのかによって大別されることになる。そして、前者の機能を形成的評価、後者の機能を総括的評価と捉え、ブルームによって提唱された診断的評価という機能は形成的評価のなかに含まれるものと考えられるようになってきている。こうした論調のなかで、近年では、形成的評価と総括的評価に代わり、欧米では「学習のための評価」と「学習の評価」という用語も頻繁に使われるようになっている。(p.62)

 「「学習のための評価」と特徴づけられる形成的評価と、「学習の評価」としての総括的評価の違い」を、ハーレン(Harlen, W.)が説明した内容をまとめます(p.62-64)

形成的評価と総括的評価の違い:

  1. 目的に関わるものであり、本質的な違い
    • 形成的評価の目的は、学習支援や改善。そのため、評価活動のプロセスで、あらゆる場面において子どもの学習と関連づけられ、進められなければならない。形成的評価の活動プロセスで中心的な役割を果たすのは、学習者である子どもたち。学習支援や改善につながらない教師の評価行為は、形成的評価とは呼べない。
    • 総括的評価の目的は、学習や教育の成果を客観的に評価して、提示すること。
  2. レポートやテストの解答といった子どもたちの学習成果物を解釈し、到達度合いを判断する際の基準の違い
    • 形成的評価では、学習改善という目的を達成するためには、目標に準拠した判断だけでは不十分となる。学習や指導を改善する手がかりを得なければならない。
    • 総括的評価では、選抜や資格付与などが目的なので、公正性や客観性が重視される。そこで行われる解釈や判断は、共通の基準でなされる必要がある。

 「学習のための評価」と「学習の評価」という言葉を使って、評価を考えるときに目的を考えやすくなるように思いました。

「学習のための評価」としての形成的アセスメント

 さらに「学習のための評価」については話が続きます。最初に、これまでの「形成的評価」の理念の変化をおさらいしてくれていました。

評価を学習指導の終着点とし、子どもたちの学習成果をねぶみすることではなく、評価を教師の指導改善と結びつけることで、評価と指導の関係を相互往還的なものと捉える見方は、「指導と評価の一体化」と呼ばれ、形成的評価の理念として、日本において広く受け入れられている。しかしながら、欧米では、形成的評価と総括的評価の機能を問い直す議論が進行した1990年代頃から、「指導と評価の一体化」という形成的評価の考え方を再考し、新たな理論的発展を希求する動きが出現している。(略)新たな形成的評価の展望として示すのは、教師の指導改善だけではなく、子ども自身による学習改善の支援をめざす形成的評価である。ARG(Assessment Reform Group)は、それを「学習のための評価」という言葉で表現している。(p.68-69)

 「形成的評価」について、もっと学習の主体である学習者を中心に考えて、学習を見ることが大事だと書かれます。「先生の指導の改善」のためにではなく、「学習者の学習改善」のためのものとして「形成的評価」を見るということだと思います。

新しい形成的評価では、教師からの学習改善の要求に対して子どもたちを受動的な存在とみなすのは誤りであると考えられるようになっているのである。構成主義の学習論が示すように、学習の主体は学習者であり、それゆえ、子ども自身が学習をふりかえり、改善できる力こそが学習の成功にとっては鍵となる。つまり、教師の指導改善は、学習者である子どもたち自身による学習改善の手助けにつながることで、はじめて形成的な役割を果たすことができるのである。(p.69-70)

 「学習のための評価」の提唱から、「形成的アセスメント」という新た強い言葉が出てきます。似た意味の言葉が続いてきて混乱してきました…。

ARG(Assessment Reform Group)による「学習のための評価」の提唱は、従来の形成的評価がもつ「指導改善=学習改善」という構図を問い直し、「指導改善≠学習改善」という前提から形成的評価を再構築しようとするものなのである。
(略)
こうした形成的評価の新たな展開を、日本では「形式的アセスメント(formative assessment)」と呼び、従来の「形成的評価(formative evaluation)」と区別する動きも生まれている。(p.70)

 ここで書かれている「形式的アセスメント」のところ、「formative」を「形式的」と訳してあるのだけど、「形成的」じゃないのかな…。なぜ訳し分けているのかな…、といろいろ調べたけどわからなかったのでそのままで。

 「学習のための評価」として重視すべきは、フィードバックと書かれています。ただ数値情報が出るだけでは、学習改善に結びつかない、と書かれています。
 このあたり、一人1台情報端末が整備されて、いろいろなデジタルドリルや教育ダッシュボードの活用が始まった学校現場で考えていかなければいけない課題だと思います。

「学習のための評価」としてフィードバックを機能させるために重視すべきは、「学習者にとっての利用しやすさ」(accessibbility)という質である。(略)しかし、テストの点数や評定といった数値情報は、学習改善のための手がかりを何ら子どもたちにもたらさない。それゆえ、到達度合いのみを示す情報のフィードバックは、学習改善に結びつかないのである。(p.71)

 この章の最後に、「学習のための評価」=形成的アセスメントが示す展望が書かれています。ここ、ぎっしりとページ外にもメモを書き込みながら読みました。

「学習のための評価」と特徴づけられる形成的アセスメントが示す展望(p.70-75)

  1. フィードバックに関して
    • 従来の形成的評価は、教師自身による指導のふりかえりとして、フィードバックが用いられていた。「学習のための評価」=形成的アセスメントでは、評価結果や情報を学習者である子どもたちに提供することをフィードバックと捉える。
    • 「学習のための評価」としてのフィードバックを機能させるために重視すべきは、「学習者にとっての利用しやすさ」(accessibility)という質。
    • テストの点数や評定といった数値情報は、学習改善のための手がかりを何ら子どもたちにもたらさない(何なら、点数に強く惹きつけられ過ぎる)。そのため、到達度合いのみを示す情報のフィードバックは、学習改善に結びつかない。
    • 子どもたちへのフィードバックが、子どもたちに理解できて、次の学習を進める足場を子ども自身が見出せるように提供されているかが問題。
  2. 子ども自身のメタ認知能力の育成に関して
    • 子どもたちは、自らの学習状態を把握・調整しながら学習を進めていくメタ認知能力を持っているのか?
    • 子どもたちが、自らの学習をふりかえり、それを評価することは難しい。そのため、相互評価や教師との対話によって評価基準を共有する、ということがされてきた。ルーブリックを学習材として利用することもしてきた。
    • メタ認知能力を育成するためには、学習の場として「評価活動」を位置づけ、そこに子どもたちを主体的に参加させていく必要があることになる。この捉え方は、「学習としての評価」として注目されている。

 「子ども自身のメタ認知能力の育成」に関するところでは、具体的な手立てもいろいろと紹介されていました。
 隣の人とペアになってお互いのテストの採点をし合うことで評価基準の理解を促したり(これ、『ドラゴン桜』にもあった)、評価基準を満たしている作品と満たしていない作品を見せてから始めたり(最近僕がやっているプレゼンの授業はこのやり方だ)。
 このあたり、「指導と評価の一体化」→「学習のための評価」→「学習としての評価」という形成的評価の捉え方の変化に合わせていろんな手立てを知っておきたいと思います。
 この流れのなかで、「指導と評価の一体化」の意義が薄れたということではない、ということも最後に書かれています。

「学習のための評価」としての形成的アセスメントが示す展望は、学習者の主体性を何より重視する学習論によって切り拓かれてきたといえる。学習者の主体性やメタ認知能力が強調されると、教師の評価から子ども自身の評価へ、「外的な評価」から「内的な評価」へというように、あたかも子ども自身の自己評価で評価論が完結するような印象を与えるかもしれないが、子どもの主体性を重視することは、決して教師の指導性を軽視することではない。(略)求められるのは、教師による「外的な評価」と学習者による「内的な評価」の双方向的な関係である。(p.76)

 めちゃくちゃ長くなってしまったけれども、「評価」の可能性をすごく感じる第2章でした。この章は、何度も読み直すことになると思います。

 No.4に続きます。

(為田)