评价语文高考试题质量的五个维度
从理论上说,合理的课程计划理应符合教育原理,合理的高考试题应有利于促进受教育者的全面发展。但是在现实社会中,受各种因素的影响,我们在制定课程计划的过程中,在对教育进行评价时,结果与初衷往往有些不一致,也就是我们“实际上做的”与“应该做”的有不少不一致的地方。
以“理想教育”维度去衡量语文试题,能引领人们追求教育的理想境界,从而促进试题完善的可能,但是,“理想维度”一方面可能代表着最先进的教育理念,却又往往带着个人的主观看法,因此可以不顾现实条件的限制、不顾是否具有可行性。例如,有入主张高考试题中应取消全部客观题,甚至只需要写一篇作文即可,认为这样能看出学生的真实想法和能力:还有人建议取消统一的高考,而代之以20世纪30代曾成功实施、现今世界一些国家普遍采用的申请录取制。这些建议都有一定的合理性,但这涉及整个教育制度的变革问题,显然超出了一份试题命制的范围,因而不能作为评价试题质量的依据。
另外,这种角度也常常打错板子,即把不属于高考试题的责任推到试题身上。例如,有批评者就把教学中的知识本位、复习中的题海战术归咎于试题。其逻辑是,语文学习的问题是高考“指挥棒”造成的,而高考“指挥棒”问题的罪魁祸首又是高考试题。更有甚者,有人连中国学生的创造力不足、人文素养滑坡等社会问题这笔账也算在试题头上。这其实是把属于整个教育环境乃至社会背景的问题,简单归罪于一份高考试题了。
四、测量学的维度
测量是利用一定的测试技术来保证测试目的的实现,人们通常用“信度”、“效度”和“区分度”来描述试题质量或测试结果。
从测量学的维度出发,要求试题必须真实、全面地反映学生学习结果,准确评断出学生的语文水平和存在的问题。语文高考试题要真正承担起这一功能,必须满足如下要求:(1)能真实地反映考生语文学习类型和语文生活样式,如学习或生活中学生阅读什么材料,考试就应提供什么材料来让考生阅读,阅读或生活中学生这样阅读,考试就应检测考生怎样阅读;(2)考点的覆盖面要广,尽量覆盖语文知识和语文素养的主要内容,且各部分的得分比例(赋分)要合理;(3)测试的结果能很好地区分不同考生的语文素养,也就是有区分度;(4)测试过程公平,测试结果准确。
母语的学习非常复杂,学生的语文素养也很复杂。测试也只是评价的一种手段,一份试题往往还不能完全测试出所有考生的全部语文素养。可能还需要评价主体的多元化以及评价方式的多元,注重过程评价,不能考有限的几种题型,不能一张试卷决高低、一次考试定终身。例如英国的英语考试就非常重视学生平时的学业水平与学习表现。
如果严格用上面的标准来衡量,我们的高考几乎都是“不合格”的。但奇怪的是,这种不合格的测评方式不仅能够延续多年,而且其人才选拔价值还得到越来越多用人单位的肯定,这是因为,高考试题的信度和效度是相对的,受多种因素的局限,当我们不能够用完美的、规范的测试模型来评价学习状态、区分发展水平,那么退而求其次,用比较低廉的成本与相对简单的手段来代替它,也能部分地达成测试目的。从某种角度看,现今的高考就是一种简单可行的测试手段,虽不十分如意,但不能说它一点都不可靠。
五、试题的自洽及与考试组织的融洽性
语文试题也是一种文本,有其自身的文本特点和结构要求。如选文类型、篇幅要有一定的稳定性,试题类型及分值要有从单纯知识到综合能力、由易到难的变化。甚至考卷中的文字在具体页码的分布上也要考虑是否便于学生阅读。以结构和题型的稳定为例,稳定就是使试题保持一定的历史延续性,无论试题结构、选文的文体样式、题型及赋分比例,都应保持一定的稳定,减少不必要的变动,否则,师生不能适应快速的变化,会带来不必要的麻烦。
一份试题除了其内在逻辑的自洽性,还要考虑与其他社会系统的关系。在中国,高考不仅是一种以考生为主体的学习活动,还是涉及众多社会成员、部门的社会行为。一份考卷不仅要能甄别学生的语文水平,还要有利于考试活动的组织。这就要求考卷在满足基本选拔功能的前提下,具有内容的简约性和评阅的可操作性。
语文高考是在一定的考试时间——两个半小时,特定空间——考场,利用有限的考试材料——一份试题,考查学生的语文能力。这些特点决定了语文考试在内容、形式等方面与语文学习有很大的区别。一般来说,语文学习中运用的材料要比较全面地反映社会生活的内容、比较充分地体现人类语言表达方面的智慧与经验,类型丰富、篇目繁多。但是,一份高考试题通常只能容纳三五个语段,而通过这三五个语段的阅读无论如何也无法还原人们在生活中的阅读状态。高考试题容量的这种有限性与语文学习的无限性,决定了语文试题中无论是语料类型还是考点设置,都必然具有一定的“借代性”,也就是借一两篇文章考查学生对多类文章的阅读能力,借局部知识考查学生的整体知识。而笔者认为,在试题中文体少的情况下,用一种文体考查学生多种文体的阅读能力,比考查一种文体的阅读能力,其测试信度可能更高。
上述五个维度,分别考查一份试题的一个特点,若单看其中的每一条,都是有道理的,都应该在试题中得到体现。但是,我们若是把这五个维度的要求放在同一个平面上,则这些要求中有许多就不能兼顾,甚至有的原则上互相矛盾,价值上相互抵消。例如,从理想教育与培养人才的角度,试题应顾及学生的差异、鼓励创造性、激发个性,多采用开放性、没有标准答案的题目;而从考试组织的角度看,试题则要求具有规范性和公平性,尽量减少阅卷入的个人喜好等人为因素的影响,同时还要考虑阅卷的时间和人力成本。一份试题不可能既能最大限度地满足创造性和个性的要求,又能最大限度地满足考试的公平性和阅卷操作性的要求。高考命题工作的着力点应该在多种原则之间谨慎地寻找平衡点,而论者也应该理解自己的立场与对立面的关系,如果只站在自己的某一维度去分析评价试题,势必执于一端。
再看某一具体知识的学术价值、语文学习价值与语文测试价值的关系。
对某一段语料的解读、某一处知识点的运用,从不同维度考察,研究价值、学习价值、测试价值不完全一致。语文研究价值应站在学术研究的最高端,提供新的思考和研究成果:语文学习价值应看重的是材料中的公共知识和有意义的内容,意在让学生获得有意义的经验:语文测试价值是通过这段语料,检测 《评价语文高考试题质量的五个维度》