新时代教育评价改革的理论回应与实践探索

9月30日,2021年中国教育科学论坛“新时代教育评价改革的理论回应与实践探索”分论坛召开。论坛采取线下线上相结合的形式,面向全国邀请高校专家学者、各区县教育行政人员、中小学校长和教师从理论思考、实践探索等维度交流和分享了教育评价改革的新思考、新动向。


【新时代教育评价改革的理论回应】

理论是实践的先导,思想是行动的指南。《深化新时代教育评价改革总体方案》的出台除了从行动上明确了五大主体22项评价改革的重点任务,也对教育评价改革的理论探究提出了更高要求。据此,与会专家学者进行了学术交流和思想碰撞,切实回应了新时代教育评价改革的理论需求。

(一)教育评价基本问题之理论思考

1.评价概念之辨析

教育评价中有相当一部分专业术语来自西方教育话语体系,从英文翻译成中文后,往往存在翻译的模糊和理解的困难,造成了学术应用上的不规范和实践中的混用。因此,亟需从学理上对相关概念加以辨析。华南师范大学教育科学学院博士研究生高洁对国际视域下教育评价中常用的四个核心概念“评价(evaluation)、评估(assessment)、考核(appraisal)、监测(monitoring)”进行了学理辨析。研究发现,评价是通过分析与教育项目相关的事实、问题和建议来确定教育项目的价值属性,确保教育项目驶于正确的价值轨道。评估在国际上更多的被常用来指关注学生的学习,即通过评估学生认知技能和非认知技能的发展状况,检析学生的学习成就,为学习者提供有意义的反馈,进而改进自己的学习方略、提高学习成效。考核更为关注教师的工作绩效,具体实践中考核者会深入一线,从教师的课堂组织力、教学内容呈现力、师生互动力以及学生的课堂学习的效果对教师的教学实绩进行评估。监测指通过全方位、持续性地采集教育质量运行数据,为教育决策提供证据支撑,增强教育治理的科学化。

《总体方案》中提到“改进结果评价,强化过程评价,探索增值评价,健全综合评价”,对于“四个评价”,不论学界还是一线教育工作者,都或多或少存在误解或误读的现象。基于此,中国教科院教育督导评估研究所任春荣研究员分别界定了“四个评价”的概念要义。其中,结果评价指一个时间单元结束时开展的评价,提供了学生学业成就达到什么水平的证据或者教育效果的证据,是一种正式评价。过程评价指在一个时间单元的中间部分发生的,且在这个时间段内可以多次开展,过程评价可以是正式的也可以是非正式的。增值评价是对学生学习、教师教学、学校办学、政府工作的进步幅度和努力程度的评价。综合评价的基本特征是评价内容、手段和主体的多元,主要类型有学生综合素质评价、学校综合评价、对地方政府的教育履职情况督导等。这四类评价不是绝对的并列关系,可以根据评价目的进行不同的组合。

2.评价指标之构建

《总体方案》中各种“评价或评估标准”出现十余次之多,足见其在本次评价改革中的重要性和迫切性。有了具体的评价标准和评价指标,就能以相对科学客观的方式开展评价,对评价对象做出基于证据的价值判断和比较结果。

广西师范大学教育学部杨小微教授从“产出”“投入”“机会”和“过程”四大维度对中国与OECD教育发展指标的异同进行比较,基于比较分析的结果,提出完善中国教育发展指标的建议。一是面向世界,在共性指标上与OECD保持可比性;二是依据国情,在中国特色指标的选取和完善中体现本土性;三是关注未来,凸显教育发展指标的前瞻性。

中国教科院高等教育研究所蓝文婷博士在借鉴美国一流公立大学经费运行绩效评价经验的基础上,结合当前我国大学经费运行与绩效评价实践,从绩效评价方式方法、绩效评价职责归属、绩效评价改革方向三个方面提出“双一流”建设高校经费运行绩效评价建议。

北京师范大学中国教育政策研究院王新凤博士使用访谈、问卷调查等评估工具,以过程(三阶段——高中教学、招生录取、高校教学)、对象(四要素——改革目标、改革措施、改革成效、改革保障)、主体(五类利益相关群体——管理者、高校教师、高中教师、学生、家长)为评估框架,考察新高考目标的达成度、改革措施的认可度、改革成效的满意度以及改革保障方面的一些情况。研究发现:新高考改革在促进学生健康发展、促进科学选才、促进社会公平上的目标达成度高;人民群众对招生录取方式的改革认可度高;新高考增加了学生的选择性,但也带来功利化选科问题,学生的选择特别有盲目性,存在趋易避难的倾向;不同利益相关群体对改革效果满意度存在差异。

职业教育作为一种教育类型,其评价指标的构建具有特殊性。南通大学教育科学院张宇博士从评价目标、评价理念、评价指标等方面对职业教育评价标准与指标体系建构进行了初步的理论思考。

3.评价方式之创新实验

新时代教育评价改革亟需教育评价方式的创新。《总体方案》中专门提及“深化考试招生制度改革”“稳步推进中高考改革”。目前,高考正在经历新一轮改革,仍以考试分数为主,学生综合素质档案的建设和使用方法还有待完善。在此背景下,区别于此的全新的录取模式值得期待。

北京师范大学教育科技中心魏柳英博士介绍了一项高校招生方式的思想实验——贷分升学。贷分升学的思想基础是新分配正义思想(不同于新自由主义对于再分配的不作为,不同于平等自由主义的强制再分配原则,也不同于社群主义者的随机再分配方案),是一种自由再分配的方式。这一高校招生方式能够基于能力和努力的标准增加公平竞争的机会,对弱者有利又不会助长“被歧视”与“被傲慢”看待心态,是消除特权、偏见、辅助社会公正的可取方式。此外,贷分升学方式还让参与者发出自己的声音,表达和参与决策自己的分数借贷和还贷方案,同时提供给年轻人一次做出重大决定的机会,测试、展示和积淀自己的人格风采,让分数在工具价值、才德/贡献表征的社会价值和经济价值之外,教育价值得以回归到场域的中心位置。总之,贷分升学方式是创新而富有弹性的制度设计,能够使得原先使用评定分数升学的副作用得到缓和——缓和出生之后、高考之前学生积累的常年拼搏的焦虑感,通过“升学分数可以借可以还”的翻转,来让他们的智力和胆识能够发散更多创想。

(二)新时代教育评价改革之理性省思

1.新时代教育评价改革之哲学启示

清华大学教育研究院石中英教授从道家哲学思想出发,提出其对教育评价改革的四点启示。一是道家哲学的本体论“道”的启示。评价者应当承认对“教育本体”“教育之道”以及一切评价对象等的根本性无知,并由此产生敬畏之心,努力使教育评价成为一种审慎的理智活动。二是道家哲学的物性和人性论“自然”的启示。教育评价应当反映评价对象(政府、学校、教师、学生等)的内在性质,将教育评价的目的定位在帮助评价对象更好地表现或实现它们的内在性质。三是道家哲学的价值论主张“无为”的启示。教育评价者应认识到评价对象的内在价值,认识到内在价值的不可比较,总体上减少各类评价项目,放宽评价周期,谨慎开展和积极治理各种排名,禁止将各种排名结果功利化使用,更不可轻率地将评价结果作为基本教育资源配置的根据。四是道家哲学的教育哲学主张“不言之教”的启示。评价者应高度重视评价文化建设:树立正确的评价价值观,把引导评价对象按照学校办学规律、教育教学规律、学生学习和发展规律办学、教学、学习作为评价的根本价值取向;反思现有评价对评价对象行为的影响和支配作用,突出评价对象在评价过程中的主体性、评价过程评价对象的参与性以及评价结果对于学校办学、教师教育教学及学生学习与发展的发展性,将教育评价纳入完整的教育活动中去;合理使用外部第三方评价,增强评价对象自我诊断、反思和发展的意识与能力;将评价作为一种赋能活动而不是一种控制活动;强调评价对于教育生态的改良作用,而不是放纵评价导致的教育生态破坏作用。

2.新时代教育评价改革的内涵之思

华东师范大学基础教育改革与发展研究所李政涛教授认为,新时代的教育改革是一个评价改革的新时代;教育评价改革是新时代教育改革的最前沿;通过评价改革撬动和引领教育改革的时代已经来临!在对教育评价改革重要性认识的基础上,提出关于教育评价改革的九大观点。一是教育评价改革是以评价的方式回到教育改革的初衷和原点,即关注具体的人、个体的人。二是教育评价具有育人价值,内含“育人力”“学习力”和“生长力”。三是教育评价改革在根本上是教育价值观的转向。四是教育评价改革也是思维方式的转型。五是教育评价需要兼顾内外两个尺度,即客体的外在尺度和人自身的内在尺度。六是教育评价改革要有学生立场。七是要对现有教育评价方式的局限有充分警醒与认知,实现多种评价方式的互补协同。八是教育评价改革最终要落到校长和教师的评价能力上。九是每个区域和学校的评价改革需要在把握前沿中找到适合自己的参照系。

3.新时代教育评价改革的困境之思

不容否认,我国现有的教育评价制度体系在加快教育发展、提高教育质量等方面发挥着重要的作用,但也在长期的实践过程中形成了唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾。新时代的教育评价改革在破“五唯”的进程中,将面临评价目标、评价主体、评价内容、评价标准、评价方法等多方面的困境。

李政涛教授指出了教育评价改革的十大难点。一是整体之难。目前为止没有一个教育系统对所有教育目标的评价是完整的,往往只关注了教育目标中很少一部分知识技能,而且用这很少一部分的评价对学生、教师和学校进行分量很重的判断,导致教育评价狭隘化,进而导致教育活动狭隘化。二是成本之难。教育评价需要极大成本:研发评价工具、实施评价、给出结论的直接经济成本,还包括学生、教师等参与评价的时间和精力成本等。如果将所有学科所有能力都纳入正规的统一评价,成本必然大幅增加。三是能力之难。创造力、合作能力、沟通交流能力、道德能力、思维能力本身等非常复杂,很难有统一的标准进行评价。四是工具之难。今天的教育评价基本被评价工具所主宰,不是想评价什么就评价什么,而是我们能评价什么就评价什么。人工智能的出现为评价创造了工具条件、技术条件,应充分利用。五是冲突之难。评价改革中面临三个冲突,即近期和远期冲突、成绩和情感冲突、认知能力和非认知能力冲突,需要加以协调解决。六是融合之难。素养融合之难、跨学科融合之难、五育融合之难、线上线下融合之难、跨界学习融合之难、双师融合之难。七是体系之难。包括评价改革自身的体系,还有协同体系,如家校社协同体系等。八是生态之难。整个社会科学评价观念的转变需要较长的时间。九是主体之难。包括家长、教师、校长、教育研究者等要建立评价改革相应的理念非常难。十是引领之难。希望通过教育评价改革,让中国的评价无论是理论还是实践,能够走到世界前沿,能够成为世界教育评价改革的引领者。

与此同时,广西师范大学教育学部马焕灵教授从现代性危机视域出发,指出“五唯”评价改革存在过度否定、路径依赖等现代性风险。

4.新时代教育评价改革的路径之思

部分专家学者针对教育评价现状的剖析、评价改革面临的难点和现代性危机,从理论和宏观层面探讨了教育评价改革的实现路径,以期为新时代教育评价改革的实施提供方法论指导。

李政涛教授认为教育评价改革的未来发展方向包括六个方面。一是走向个性化。在选拔性评价体系里,应该采用能够展现学生个性的评价手段,让高校及其专业寻找适合的人才。二是走向能力化。知识的能力化可以摆脱传统学科的约束,评价的不是掌握某一学科的知识,而是掌握这些知识后能够达到的能力,而这些能力可以通过活动和跨学科的学习来培养。三是走向作品化。越来越看重学生做过什么、有什么作品,通过作品来反映学生所达到的能力,而不仅仅是他们学过什么课程。知识的价值越来越小,人们看重的是一个人能否运用知识解决问题、是否具备超越知识的能力和睿智。四是走向深度化。现在非常热的深度学习强调复杂情境、复杂问题学习,因为思维是隐性的,难以进行评价。需要思考如何让思维在课堂上可见、可教、可学还要可测评。五是走向可视化。从内隐到外显、从文字到视频,视频图像时代和文字时代相比,学习方式、教学方式变了,评价方式也要改变。六是走向融合化。包括跨学科融合、五育融合、线上线下融合、学习方式融合。

绍兴文理学院教师教育学院付八军教授认为中国教育评价容易在“唯”与“维”之间来回选择,呈现“钟摆现象”,“钟摆”处于平衡稳定的状态是最佳的理想状态。


【新时代教育评价改革的实践探索】

长期以来“唯分数”的评价方式限制了区域层面的教育改革发展和学校层面的教育教学创新。《总体方案》发布引起了各地教育一线工作者的高度重视,在实践中开展了积极的探索,形成了生动的案例,并为教育评价理论研究提供了鲜活的土壤,力求实现理论与实践的相互融通、共生共长。

(一)区域实践探索

教育评价改革的区域实践探索主要聚焦于基础教育阶段,以县为主的教育管理模式决定了教育评价改革实践创新探索的中心在县一级层面。在《总体方案》的指引下,四个县级单位在原有工作的基础上,不断深耕教育评价实践探索,借助评价改革助力教育高质量发展。

山东省肥城市教育和体育局赵永军局长介绍了山东省肥城市教育评价改革的探索与实践。该县紧紧抓住关键、最活跃的人的因素,从校长、教师、教辅、学生四个层面提出72字工作要求,把国家、省市教育督导考核指标高度融合到四层面“72字”工作要求中,构建起独具特色的肥城教育千分考核体系,架构起教育评价的“四梁八柱”,即“四层面千分制”考核评价体系改革(县域多元主体分类评价)。在千分考核中,校长层面占300分,教师层面占300分,教辅层面占100分,学生层面占300分。学生考试成绩只占50分,还要考查初中毕业生的高考情况,一并纳入初中学校教学成绩。目的在于引领初中学校淡化考试分数,重点培养学生的综合素养。

北京市海淀区教科院教育质量监测与评价中心白雪主任介绍了海淀区开展增值评价的经验和做法。海淀区使用了国际上常用的学生成长百分等级模型(Student Growth Percentile, SGP)开展增值评价。该模型是一种描述性模型,回答关于学生、教师、学校三个不同层面关注的核心问题,既以学生的进步幅度评价教师和学校,也易于理解。以海淀区2018届和2019届初三毕业生为样本,选取每名学生7年级入学一个月内参与全区统一摸底考试的语文、数学、英语单科成绩及3科总成绩作为基线测试成绩,选取同一批学生在9年级期末参与的上述学科全市学业水平考试所获得的中考成绩作为再测成绩,构建增值评价模型。

重庆市南岸区教育督导评估中心董宏燕主任介绍了南岸区“一中心两支点”教育督导评估转型升级推动现代学校优质发展的实践探索。具体做法包括:第一,放——精准定向赋权,完善自治结构,试行校本督导;强化专业引领,校际集群善治,升级校内督导;加强依法治校,科学配置权责,优化自主办学。第二,管——督评学校治理水平,指导提高服务质量;督评特色项目发展,着力提升办学品质;督评学校育人质量,导向正确教育评价。第三,服——创建“双轮驱动”工作机制,形成督导合力;形成“三级进阶”督导机制,多方协同诊断;创建“四级议题”处置机制,联动全区资源。第四,治——系统架构,织密督导立体网;队伍建设,专业发展强动力;数据循证,创建平台强支持。

山东省威海市文登区葛家中学正高级教师吕兵文通过文献资料法、调查法、德尔菲法、案例研究法、数据统计法等,构建了县域中小学体育教学质量监测指标体系。研究结果显示,体育教学质量监测的实施情况不容乐观;对“体育教学质量评价”与“体育教学评价”含糊不清;中小学体育教学质量评价主要指向学生运动技能与体能变化的评价;县域中小学体育教学质量监测体系包括监测内容、标准、方法、保障、反馈五个方面并构建了区级、校级、班级三级联动监测模式。

(二)学校实践探索

学校是教育系统的基本组成单元,也是教育评价改革的直接发生地,学校的教育评价改革实践以学生为中心,以质量为目标,促进学生德智体美劳全面发展。从与会的一线学校校长或教师的分享来看,不论是高等教育还是基础教育,如大连工业大学高校教学质量评价的实践、北京市综合素质评价结果应用案例、重庆市石柱土家族自治县南宾小学校的“校园集优卡”综合素质评价体系、山东省滕州市大坞镇中心小学“绿色评价”、浙江省杭州市红缨幼儿园基于游戏卡的活动等,都不再只关注学生的考试成绩或幼儿的知识获取,而是关注学生或幼儿作为个体的人的全面发展。

(文/中国教科院教育督导评估研究所 张文静)