西岡加名恵 先生・石井英真 先生・田中耕治 先生 編『新しい教育評価入門 人を育てる評価のために [増補版]』を読みました。
今回は、「第1章 教育評価の立場 評価の物差しにはどんな違いがあるのか」の読書メモを共有したいと思います。
第1章 教育評価の立場 評価の物差しにはどんな違いがあるのか
「第1章 教育評価の立場 評価の物差しにはどんな違いがあるのか」では、さまざまな評価の物差しについて書かれています。
最初に、「相対評価」の対義語としての「絶対評価」の言葉のなかに3つの価値観が混在している、と書かれていたところをまとめてみます。
絶対評価という言葉が日常的に使われるとき、そこには相対評価以外の本来区別すべき3つの評価観が混在している。(p.27-29)
- 狭義の絶対評価(戦前型絶対評価と認定評価)
- 絶対者としての指導者(評価者)が、その心のうちに暗黙の形で保持している評価規準の絶対性に従って判断する評価。
- 目標に準拠した評価
- 教育目標を規準にその到達状況や実現状況を評価する。多くの場合、「絶対評価」という日常用語で想定されるのは、これ。
- 自動車運転免許の試験をはじめ、各種資格の検定試験など。
- ただし、「目標に準拠した評価」にも、「主体的に学習に取り組む態度」など情意領域の評価が入ると、事実上、戦前型の絶対評価と同様になってしまう。
- 個人内評価
- 子ども(個人)それ自体を規準とし、その子どもなりのもち味・がんばりを継続的・全体的に評価する。
- 個人内評価にも、過去のその子どもの成績と比べて変容を評価する「縦断的個人内評価」と、計算は苦手だけど作文は上手、というように、子どもの得意・不得意や長所・短所を明らかにする「横断的個人内評価」がある。
ここに書かれている3つの価値観、特に2つ目の「目標に準拠した評価」と3つ目の「個人内評価」という考え方は、とても大事だなと思います。
また、「目標にとらわれない評価」として、「ゴール・フリー評価」が紹介されているなかで、「総括的評価」と「形成的評価」が料理のたとえで紹介されていて、この話は頭に入れておくといいなと思いました。
スクリヴァン(Scriven, M.)は、「ゴール・フリー評価」(goal-free evaluation:目標にとらわれない評価)の必要性を説いた。彼は、カリキュラム評価において、カリキュラムを開発する途中で、その改善を目的に開発・実施の当事者が行う評価(形成的評価:formative evaluation)と、開発されたカリキュラムについて、第三者が行う最終的な価値判断としての評価(総括的評価)とを区別する。料理人がスープを味見するのが形成的評価で、お客がそれを味わうのが総括的評価というわけである。なお、このスクリヴァンの“formative evaluation”概念は、ブルームによって授業改善のための評価として読み替えられ、フィードバックを重視する現在の「形成的評価」概念につながっていく。(p.38-39)
続いて、「目標に準拠した評価」として「真正の評価」が紹介されています。言葉としてはよく聞きますが、どういうものなのか自分自身としては理解しきっていないところがあるのでじっくり読みました。
「真正の評価」とは、「大人が仕事場、市民生活、私生活の場で『試されている』、その文脈を模写したりシミュレートしたりする」課題に取り組ませるなかで、知識・技能を現実世界で総合的に活用する力を評価する考え方である。(p.46)
「真正の評価」の代表的な評価方法として、パフォーマンス評価が紹介されています。
パフォーマンス評価は「真正の評価」の代表的な評価方法であるが、「真正の評価」という言葉には、創造的な教育実践が育む本物の学力を映し出す評価という意味が込められている。
パフォーマンス評価論の提唱者のなかには、標準テストへの批判意識ゆえに、子どもの学習の質を目標にとらわれずに多面的・全体的に評価する点を重視し、スタンダードや目標の明確化に対して否定的なスタンスをとる者もある。(略)「真正の評価」の提唱者であるウィギンズ(Wiggins, G.)は、スタンダードの設定と内在的に結びつけながら、パフォーマンス評価論を展開した。(p.45-46)
パフォーマンス評価のためのパフォーマンス課題は、「do a subject=教科する」学習である必要がある、という考え方は好きです。
ウィギンズは、思考する必然性のある場面で生み出される学習者の「振る舞いや作品」(パフォーマンス)を直接的に評価するパフォーマンス評価の方法に着目する。(略)実際に生活や社会で直面するような文脈に即して問題場面(パフォーマンス課題)を設定して、そこでの思考過程を評価するわけである。パフォーマンス課題は、知識が実生活で活かされている場面や、その領域の専門家が知を探究する過程を追体験する場面を設定するものといえる。いわば、「教科を学ぶ」(learn about a subject)ことではなく、「教科する」(do a subject)学習が重視されているのである。
パフォーマンス評価では、伝統的なテストのように、目標の達成・未達成の二分法で評価することは困難である。そこでは、子どもの反応に多様性と幅が生じるため、教師による質的な判断が求められる。そこで、パフォーマンス課題の評価では、「ルーブリック」と呼ばれる評価基準法を用いることが有効となる。(p.46-47)
上でも書いた、「do a subject=教科する」学習である必要がある、という考え方は好きなのですが、そうした課題をつくることが大事だし、それを評価する手法も大事です。
そのために、「ルーブリック」についても紹介されていました。ルーブリックもできあがったものはたくさん見ているのですが(というか、自分で作っていもいますが)、書かれていた内容をまとめてみました。参考にしたいと思います。
ルーブリックとは(p.47):
- パフォーマンス課題の評価で有効に用いられる、評価基準法。
- 成功の度合いを示す数値的な尺度あるいは評語と、それぞれの数値や評語にみられる認識や行為の質的特徴を示した記述語からなる。
- それぞれの評点を代表する典型的な作品事例(アンカー作品)も添付される。
- ルーブリックは、実際の子どもの作品群をもとに、複数の採点者の点数とその根拠のすり合わせを通して作成される。実践のなかでより多くの作品事例が集まるにつれてルーブリックは再検討される。
- ルーブリックは、子どもたちと共有され、学習過程において検討の対象にもされることで、子どもたちの評価行為への参加を促すものとなる。
ルーブリックを作るとき・使うときには、たしかに「典型的な作品事例」があるといいですよね。アンカー作品って言うんですね。「たとえば、どんなことが書けていたら/言えていたら/わかっていたら、この評点をあげられるのか」というのがわかりにくいことも多いんですよね。そのあたりが柔軟なのがルーブリックの良さだと思っているのですが、同時にそれは評価の難しさにも繋がるな、といつも思っています。
ルーブリックはまだこの後の章にも出てきていました。勉強はまだまだ続きます。No.3に続きます。
(為田)
