形成性评价(形成性评价和终结性评价的区别)原创2021-03-31 22:05·南方周末
2020年8月30日,浙江宁波江北区实验小学,一年级新生入学。 (视觉中国/图)
浙江杭州凤凰小学的校长缪华良,已是第四年在校内实行“综合素质报告单”代替打分的评价改革。
他向南方周末记者展示的“报告单”,细分为学业水平评价、表现性评价、发展性评价和形成性评价四个部分,还辅以体育、美术、音乐等学科的分项等第评价表。
“不公布考试成绩和排名”,2021年3月18日,教育部等六部门印发的《义务教育质量评价指南》(下称《评价指南》)中,对义务教育阶段学校提出这项硬性要求。
《评价指南》是我国义务教育质量评价首个系统化的标准和依据。
尽管素质教育已经倡导多年,但在实际推进中仍然不畅,以至于“鸡娃”和“内卷”现象成为社会近年高频讨论的话题。学生、家长、学校、地方教育行政部门和党委政府都紧盯评价这根“指挥棒”,“指挥棒”改不改,直接影响教育发展的方向。
教育部基础教育司司长吕玉刚回应,此次制定《评价指南》就是要着力构建以发展素质教育为导向的科学评价体系,引导地方党委、政府树立正确的政绩观。切实履行举办义务教育的职责,引导学校提高办学水平,促进德智体美劳全面发展。
《评价指南》能否真正影响学校和学生的评价,成为教育界人士关注的话题。
最直接影响在县域评价
值得注意的是,《评价指南》从学校、学生和县域三个层面,构成了一个指标体系。
要理解这套体系,可以回溯到2019年,《中共中央国务院关于深化教育教学改革全面提高义务教育质量的意见》提出,“建立以发展素质教育为导向的科学评价体系,国家制定县域义务教育质量、学校办学质量和学生发展质量评价标准。”
“对学生评价‘唯分数’,到了学校评价和县域评价就‘唯升学’。”浙江省教育厅教研室副主任张丰,对南方周末记者直指目前义务教育质量评价存在的问题。
对于县域,《评价指南》提出“不给学校下达升学指标,不单纯以升学率评价学校、校长和教师”“不举办重点学校”“不公布、不炒作中高考状元、升学率”等考查要点。
在学校办学质量评价当中,则提出“要严控考试的次数”“不公布考试成绩和排名”等硬性要求,明确考试主要是考察学生的学业状况,以此来反馈和改进教学,不能公布考试成绩和排名;提出要“实行均衡编班,不分重点班、快慢班”等考查要点。评价学校也不看升学率,更注重增值性的评价,要看学校办学质量的总体状况以及年度的变化情况。
在学生的发展质量评价中,提出从德智体美劳五个方面进行全面综合的评价。此外,即使是学业发展评价,也不局限于学业水平,而是更突出学生的学习习惯、创新精神,为学生综合素质和终身发展奠基。
张丰分析,《评价指南》的核心是要把握不同层面的教育质量的实质,这是首次把县级党委政府纳入作为评价对象。“这意味着,最先影响、影响最深的应该在县域一层。”
在地方教育实践中,一些现象屡禁不止。比如,一些地方党委政府对学生发展的状况把握不够,没有进行深入的专门研究和督查检查。还有的一味注重名校升学率,对教育行政部门、学校、老师下达不合理的指标。
这些都对教育的生态环境和导向产生了消极的影响。
山东潍坊市一名小学校长对南方周末记者承认,目前学校对学生的评价还是传统的横向比较为主,缺乏纵向比较。所谓横向比较,就是考试排名,纵向比较则应该更多关注学生在不同阶段取得的进步或存在的困难。
归根结底在于,学校还承担着区域层面评价的压力。县域评价一所学校办学质量时,将升学率看作重要指标。这关乎下一年度学校的各项工作能否得到区域教育行政部门的支持,接受采访的校长们均证实了这点。
矛盾在于,目前的中高考,无法对教育质量作出全面的评价。
事实上,我国早在2006年修订的义务教育法中就已提出要在全国范围提供统一的评价标准。2013年,教育部发布《关于推进中小学教育质量综合评价改革的意见》,提出品德发展水平、学业发展水平、身心发展水平、兴趣特长养成、学业负担状况等5个方面20个关键性指标,并以此为基础,建立一套“绿色评价”体系。
对比2021年的评价体系指标,南方周末记者发现,以前基本都有相关规定,此次几乎没有新要求。“以前我国没有专门的义务教育质量评价标准,”教育部基础教育司副司长朱东斌解释,“原来的各项要求散见于各种教育法规、教育文件、教育政策,不够系统,比较柔性。《评价指南》相当于把它系统化、集成化,变成更加刚性、硬性的标准,能够更切实发挥评价‘指挥棒’的作用。”
“刚性、硬性标准”,在《评价指南》的评价结果应用方面有所体现。比如“将学校办学质量评价结果作为对学校奖惩、政策支持、资源配置和考核校长的重要依据”“将县域义务教育质量评价结果与县级党委政府领导履行教育职责评价、义务教育优质均衡发展认定等工作挂钩”等。
北京师范大学校长董奇认为,这对于各地真正落实《评价指南》十分重要。
“无分成绩单”
近年来,各地实际上陆续有一些淡化分数的评价改革实践。而不同地区的实践,都面对过家长不理解、评价标准模糊、老师也不知怎么评的问题,这也将是《评价指南》落地面临的难题。
对缪华良的改革来说,一份基础的评价报告单远远不够。
改写这张报告单是在2017年底,缪华良发现区教育局制定的报告单虽然也是等第制评价(即用“优秀”“良好”“合格”“须努力”等等级指标代替“百分制”),但评价框架相对比较粗放。一个学科不填分数,只填“ABCD”等或“优良”,这样的评价方式模糊,容易引起学生和家长的反感。
还可能催生“阴阳成绩单”的现象。即使是正在实践等第制评价改革的校长,也有不止一人透露,如果家长私下问老师,老师架不住压力,还是会“悄悄告知各门成绩的分数和排名”。
缪华良的解决方法是,将每个学科都进行分项评定,把评价标准定得更细致,评价角度也更多样化。“比如语文,分了五项细评,学生和家长一看,能知道是阅读方面欠缺还是写作方面欠缺,而不是笼统的语文总分好不好。”缪华良认为,这样能更有针对性地帮孩子补分数,跨等第。
“无分成绩单”,不可避免地引起部分家长不满。其中一位家长还不断上访,称这一评价改革阻碍学生发展。虽然得不到地方教育局明确支持,缪华良还是顶着压力坚持了下来,“愣是没告诉家长分数”。
“如果这分数给了,接下来改革怎么推进呢?”缪华良说,评价改革有着诸多难点,解决了怎么评的问题,如何提高老师的评价素养更难。
另一位刚开始实施类似改革的校长表达了同样的困惑。“在学生、老师和家长的固有观念中,分数评价是最透明和公平的。当你不让拿分数评价,在实际操作中可能就会有学生自评、互评,老师评价等主观性较强的评价。”该校长说,评价标准模糊,最先感到无从下手的是老师。
为了改变观念,缪华良会定期组织老师集中学习综合素质的评价方法,对评价标准进行解读和答疑。此外,评价标准的去唯一化是另一个解决办法。
除了期末考试的分数转化等第,作为评价的新方式,老师在考试前半个月还要为学生设计情景测验。缪华良认为,相比于纸笔测验,情景测验更侧重考察学生的口头表达、观察力、逻辑思维能力、知识实际运用,还有解决问题的应变能力。
评价的“三条线”
“无分数”评价改革之所以能推动,是因为得到了所在区域教育行政部门的支持或“默许”。但这种支持,在现有教育生态下相当有限。
“对县域的义务教育质量评价有三条线,主线是教育主管部门的评价,就是从县教育局、市教育局,再到省教育厅、教育部这条线。另一条是,从县政府到市政府,再到省政府,国家政府的评价。第三条线是从家长、社会的角度评价。”李一楠解释。李一楠在江浙某县教育局担任基础教育科科长。
当各方力量都站在自身立场去看问题,其中博弈,不言而喻。
“如果县域不改变,再想传导到学校乃至每个学生,几乎不可能。”张丰说,“我们应从结构的视角看区域层面的质量,从过程的视角看学校层面的质量。”
李一楠回忆起2020年开县人代会时的一个场景。一位人大代表直接问县教育局长,该县什么时候才能有人考上清华北大?教育局局长无奈答:“我也不知道怎么办,要不我教育局局长不当?”
幸而后来该县有人考进了清华北大。教育局局长再碰到那位人大代表才打趣:“你看我教育局局长还有得当吗?”
一位县级小学校长举例,该校在他到校之前,每年都有几个人能考进县重点中学,结果他到那年偏偏一个都没有。于是,他经历了各种形式的“追责”。主要来自两方面,一方面是行政上的,另一方面则是家长的控诉,后者更让他压力大。
现有行政体制评价一所学校的义务教育质量,主导权正是在于区县一级,这种行政评价并非教育行政,而来自地方政府。
缪华良所在的杭州市上城区,通常按照年度督导来评价学校教育质量。缪华良认为,这缺乏三到五年的长期整体设计的发展规划。另一方面,评价标准比较陈旧,也需要改革。
前述山东潍坊市的小学校长建议,《评价指南》提出的对学生进行发展性评价要落地,必须有基础性数据。比如,一个班各次考试成绩都要有记录,才能看出成长过程。因此,教育行政部门也要有专门的岗位,实地调研、收集整理相关情况。
不少区县教育局人士认为《评价指南》正如其名,是一个“指南”。但真正落到县域层面,操作仍然很难。“教育会有自己生长的力量,会朝这个方向去努力,但肯定会受到外界的评价,尤其家长评价的挤压。”李一楠说。
他还举了一个现实又残酷的例子,综合素质评价其实早些年就已推行。但真正在高考录取时,高校往往在录取结束后,才收到这份学生评价。后来有所改变,高考录取时,系统显示第一张是综合素质评价,第二张才是分数,但高校往往直接跳过第一张,只看第二张的分数。
一位东部沿海地区县级教育局长对南方周末记者说,落地难还是因为升学压力,只要中高考的“指挥棒”悬在头顶,地方教育局评价教育质量,就不得不强调成绩。
(应受访者要求,李一楠为化名。)
南方周末记者 贺佳雯 南方周末实习生 王鹏凯 李福