科研简报
美国、芬兰、台湾的教育评价制度比较
作者:黄晓婷 发布时间:2017-05-23
摘要:

本文以美国、芬兰和台湾为例,比较这三个国家和地区的教育评价体系,分析其在评价内容、评价主体、经费来源和市场监管等方面的特点,以期为我国教育评价制度的进一步完善提供参考。

  在过去很长的时间里,我国考试的最主要功能是为国家选拔人才,因而考试被赋予了重要的政治意义,由教育主管部门直接组织实施。近年来,随着我国高等教育规模的不断扩大,考试的作用逐渐发生变化。2013年11月,《中共中央关于全面深化改革若干重大问题的决定》对深化教育领域综合改革提出了“深入推进管办评分离”的要求;2015年5月,教育部发布了《关于深入推进教育管办评分离,促进政府职能改变的若干意见》(下文简称《若干意见》)。不同于以往针对高考或某一特定考试的改革,《若干意见》的提出,把我国教育评价的改革从内容、形式等技术层面扩展到了制度层面。

  《若干意见》颁布以来,第三方评价机构如雨后春笋般兴起,既有商业公司,也有各种协会、学会等社会组织及高校和教育研究机构,由第三方提供的评价服务丰富多样,包括区域教育质量监测、学校质量评估、教师评价到学生认知诊断等。这些有偿评价服务进入教育体系的渠道各不相同,既有政府购买,也有学校或学生家庭买单。在第三方评价迅速发展的同时,政府对于如何支持第三方评价、如何监管教育评价市场,尚未形成明确的办法,还处在积极探索、积累经验的过程中。

  本文以美国、芬兰和台湾为例,比较这三个国家和地区的教育评价体系,分析其在评价内容、评价主体、经费来源和市场监管等方面的特点,以期为我国教育评价制度的进一步完善提供参考。

  

一、美国

  1. 评价内容丰富,评价主体以社会第三方专业机构为主

  美国的教育评价已有很长的发展历史,在评价内容、评价技术、评价制度等方面都有了长时间的积累,是许多国家和地区学习、借鉴的对象。美国目前的评价内容非常丰富,包括对学生的学业水平、综合素质评价,对教师的资格考试、绩效考核,对学校效能的评价,对区域教育质量的评价,对很多行业从业人员职业资格的认证等。仅针对学生发展的测评就有不下几百种考试,包涵了从学前到研究生阶段的各个学科和能力维度,既有选拔性的入学考试,也有阶段性发展状况评价,以及帮助学生自适应学习的认知诊断等。各相关机构根据美国课程改革等情况的变化,还在不断开发新的评价产品,替换过时的考试和评价服务。

  实施评价的主体除了少数由政府设立的专门机构外,大部分是社会第三方专业机构。这些第三方机构包括非营利组织(如ETS[1]、ACT[2]等)、商业公司(如培生集团[3]、CTB[4])、高校和研究机构(如伯克利测评中心[5]、美国研究院[6])以及行业协会(麻省教师协会[7])等。表1列举了几类主要考试评价的案例及其实施主体。其中,除了服务于国家宏观教育政策的国家教育进展评估(NAEP)由政府设立的国家教育统计局[8](NCES)组织实施外,其他大部分考试,包括高利害的大学入学考试在内,都是由社会第三方机构提供的。高校和研究机构在这一实践领域也十分活跃,这大大促进了美国教育评价领域的人才培养和技术革新。

  表1 美国现有评价内容及评价主体举例

评价类型 评价示例 实施主体 机构性质
学生学业水平评价 高考1:SAT考试 大学委员会[9] 非营利机构
  高考2:ACT考试 ACT 非营利机构
  研究生考试GRE ETS 非营利机构
学校绩效评价 田纳西州增值评价体系(TVAAS) 田纳西大学增值研究和评价中心 高校研究机构
州教育质量监测 阿肯色州学生发展评估 ACT 非营利机构
国家教育质量监测 国家教育进展评估(NAEP) 国家教育统计局 政府机构
教师资格考试 麻省教师资** 麻省教师协会 行业协会
职业资格认证 通用就业能力测评(WorkKeys) ACT 非营利机构
  护士资格证 培生测评(培生集团) 商业公司

  2. 评价经费来源多样,政府购买服务制度健全

  不同的考试或评价,根据其服务对象不同,经费来源也各不相同。例如,入学考试基本由学生付费。美国高考SAT考试注册费为26美元,每一个科目20-30美元。考试费包括了向4所大学发送成绩单的费用,如果需要向更多的大学发送成绩单,则每所加收12美元。考生根据自己想申请的大学和专业的要求参加考试,报送成绩。学生还可以购买模拟考试和帮助自己学习的发展诊断测评等。

  国家或州一级的质量监测由政府提供经费。在《不让一个孩子掉队法》通过后,各州都需要对K-12阶段的学校教育质量进行监测,因此州一级的标准化测试经费被列入预算。经费的使用方式主要有两种:一是由相关的政府机构直接用于评价活动;二是通过招投标购买社会专业机构的评价服务。如表1提到的国家教育进展评估(NAEP)就是由联邦政府直接提供经费给国家教育统计局(National Center for Educational Statistics, NCES)。少数州一级的质量监测也由州政府直接拨款给州教育局的相关部门,如加州学生表现与发展测评(CAASPP)[10]就由加州州政府全额拨款给加州教育局的质量提升与问责处(Improvement & Accountability Division)。

  不过大部分州都没有设立专门的业务部门来实施评价,而是采用招投标的形式,购买营利或非营利专业机构的服务。例如,ACT为阿拉巴马、阿肯色、路易斯安那、密西西比等州提供州基础教育质量评价;表1提到的田纳西州则向高校研究机构购买服务,建立了该州的学校问责增值评价体系。各州的招投标程序较为类似,即依据该州相关的法律条例组织公开竞标,并由州教育局组织评审委员会来决定哪家机构中标。评审委员会的成员一般包括州教育局官员、相关领域知名研究人员、教师和校长代表等。这种做法比较灵活,各级政府能够按照自己的需求,及时得到高质量的服务,因此在美国各州和各教育层级的考试评价中被广泛使用。

  另外,学校和学区也有一定的自主权,支配经费购买所需的考试或评价服务。比如纽约州的Valhalla Union Free学区就向CTB购买基础教育阶段学生学科能力和高阶认知能力测评服务;不少学校和学区会购买筛选天才儿童(gifted students)的考试;还有学校向美国(中小学)校长联合会购买学校发展诊断(school improvement diagnosis)服务等。由于学校和学区购买评价服务的金额不高,有时不会通过严格的招投标,不过选择评价产品和服务的过程还是十分公开透明,多由董事会或相关的委员会决定。

  职业资格考试等通常由考生付费。大部分的职业资格考试都由行业协会制定技能标准,如美国护士资**的技能标准由国家护理委员会(National Council of State Boards of Nursing,NCSBN)制定,该委员会又委托培生公司开发和组织的资格考试,研究和运营经费基本都来自考生支付的考试费。一些企业也会向专业**购买人格、心理及职业能力测试,用于公司招聘。

  此外,一些基金会和商业机构也会资助教育评价实践。例如,盖茨基金会就资助了全美教师能力测查项目(Measures of Effective Teaching Project,MET),花旗银行曾资助学生财商测查等。

  3. 政府监管、市场竞争和行业自律促进评价服务的质量提升

  目前美国教育评价产品的质量在全球处于领先水平,这一方面是由于近代教育评价理论和技术在美国科研环境下得到了长足的发展,更重要的原因则是政府监管、市场竞争和行业自律多管齐下,促进了评价服务质量的提升。

  政府监管主要体现在通过法律要求考试科学、公平。例如,如果考生认为在考试中因为族裔、性别或其他原因受到歧视,则可以起诉提供考试的机构,要求相应赔偿。此外,在政府购买的评价服务中,教育局一般会有相关部门全程参与整个测评过程,该部门还会邀请教育测评领域的知名专家,组成顾问小组或专业委员会,对整个测评过程进行有效的监督和对质量进行把控。

  开放的市场竞争机制也是促进评价服务质量提升的重要动力。提供类似评价服务的专业机构要在招投标中获胜,或者争取到更多个人或学校用户,就必须提高其产品的科学性、适用性和性价比。例如,ACT和SAT多年来一直竞争高考市场,两家机构的研发部门都定期公布工具开发、数据处理、考试成绩预测效度等方面的技术报告和研究报告。特别是考试成绩对学生进入大学以后学业表现的预测效度是影响大学选择使用哪种考试的最重要的因素,因此两家机构的研发部都投入很多资源验证其预测效度。此外,这两个考试的内容每3-5年会根据全国课程调查(national curriculum survey)进行调整,测试方式也随着电脑的普及和信息技术的发展,迅速由纸笔考试转变为更方便、快捷的机考。各**对于测评的各项工作都十分审慎,因为一旦有因公平性或信、效度引起的法律纠纷,该机构除了面临高额赔偿,公信力也会大大受损,严重损害其市场竞争力。

  最后,行业协会对教育评价产品的质量保障和提升也起到了积极的作用。美国国家教育测量委员会(National Council on Measurement in Education[11], NCME)是全国性的教育测评行业协会。该委员会定期发布行业指导性文件和质量标准。1999年,NCME出版了《教育与心理测量标准》[12],明确了**应该达到的信度、效度、公平性等方面的标准,2014年出版了第二版,在第一版的基础上根据这一领域理论和技术的发展对标准进行了调整。

  4. 教育评价人才和技术储备丰富

  美国教育评价市场较为长期、稳定的发展使得高校有动力和资金培养大量的专业人员。大部分有教育学院的研究型大学都设有教育测评相关专业,并以博士点居多,如Stanford、UC Berkeley、UCLA、各州立大学等。这些高校为政府部门、学区、营利性或非营利性的考试服务机构及教育研究机构提供稳定充足的人才供给。例如,ACT就脱胎于爱荷华大学的测评专业,从60年代末成立以来,一直和爱荷华大学保持着紧密合作,该校教育测量专业每年有大批研究生在ACT实习,并有很多毕业生进入ACT工作。

  在技术发展方面,联邦政府通过国家研究基金(如美国国家自然科学基金,NSF)对评价研究提供持续、稳定的资金支持。一些私人基金会(如Spenser基金会)也有一定的经费,每年以竞争性研究课题的形式,为该领域的研究提供资助。此外,营利性或非营利性考试评价机构都有相当规模的研发部门,如ACT的R&D有100多名雇员,ETS的R&D雇员接近公司总人数的一半。这些机构的研究人员不仅针对本机构的评价产品进行研究,也进行理论和技术方面的基础研究。长期、稳定的市场和研究经费支持,为美国在教育评价专业人才培养和技术发展方面创造了良好的条件。

  

二、芬兰

  1. 评价主体以学校为主

  芬兰的基础教育质量在全球名列前茅,曾在“国际学生评价项目”(PISA)中多次夺冠,因此有很多国家研究和借鉴芬兰模式。芬兰的评价体系主要包括学生学业水平考试(包括招生类考试)、行业执照和教育资格考试、国家、区域和学校质量监测[13]。此外,芬兰也参加了OECD和欧盟等国际组织主持的教育评价活动。

  自上世纪90年代以来,芬兰将多数的教育管理权、决策权和监督权都下放到了地方政府和学校。与这一教育管理体制相适应,学校成为很多教育评价的实施主体。政府设立的专门机构也承担了一部分评价任务,社会第三方组织实施的评价活动则相对较少。

  以芬兰的大学招生考试为例,大学入学考试主要由两部分组成:国家统一的高等教育入学考试(Matriculation Examination)和各高校自主举行的招生考试。高等教育入学考试由高等教育入学资格考试委员会(The Matriculation Examination Board)负责。该委员会是政府设立的专门机构,委员会主席由教育部直接任命。委员会成员约40人,包括大学教授、高中教师、教育政策制定者等。委员会的主要职责包括考务管理、组织试题编制、试卷评价,以及对学生考试成绩的复查[14]。试题编制及试卷评价的具体工作则由约330名不同学科的联合委员(associate member)承担。委员会秘书处约22位工作人员负责考试的技术问题、人员招聘、安全和协调等。

  各高校的自主招生考试由该校专门的招生**组织实施。高校在确定各专业招生和选择标准方面有很大的自主权。通常,各院系在认真查看学生申请材料、了解学生高中成绩、日常表现和教师评语后,选出符合要求的学生来校面试或参加专业考试,最后做出是否录取的决定。因此,全国统一的“高考”并非高校筛选学生的决定性因素,高校自己的考试和选拔机制在招生中起到了更重要的作用。

  在质量监测方面,芬兰的教育质量监测体系从上至下分为国家、地方和学校三个层次,由外部评价和自我评价两部分相结合,组成“教育评价网络”[15]。国家层面的评价由芬兰教育评价中心(Finnish Education Evaluation Center,FINEEC)负责。该中心成立于2014年,是政府设立的、独立于芬兰教育与文化部的、非行政性专业教育评价机构,下设评价委员会、高等教育评价委员会、基教及职教评价部门。该中心负责制定全国教育评价五年计划,承担具体的国家教育评价及相关研究工作。为全国学前至高等教育阶段的教育质量保障提供评价服务。目前,芬兰已经裁撤了其他国家层面的教育质量监测机构,以避免过去多个机构并存时出现的职权交叉、组织重叠等问题。

  在地方层面,芬兰的《基础教育法》等相关法律和文件明确规定,地方政府有责任为国家组织的外部评价提供准确的数据和信息,并对所辖区域的教育活动开展自评。自治市的自评主体通常由市委员会、市审计委员会、市教育委员会共同构成。根据地方自治原则,具体的评价模式、评价方案和评价方法均由各区、各市自行决定。如赫尔辛基市就经常通过“校间同行审核”对学校的办学质量进行评价和监测,具体来讲就是让各校校长及部分教师对其他学校的办学质量进行同行评审。需要指出的是,芬兰国家和地区的教育质量外部评价并不具有行政约束力,不管学校在监测中的表现如何,政府一般都不会直接干预学校运作。

  学校在质量监测体系中不仅是被评价的对象,同时也是评价(自评)的主体。学校自评包括对其教学服务的可获得性和有效性的评价等,通常由校长自评、教师自评、学生自评和学生学业水平评价几部分组成。其中,学校组织的学生学业评价的目的是为了鼓励和指导学生的学习,及时反馈学生学业中存在的问题,同时也是国家开展外部教育评价的重要信息来源。值得一提的是,学生学业成就的评价并非由教师单方面进行等级打分,而是师生共同决定。

  最后,在职业资格认证方面,高校毕业证书取代了很多资格证书。如应用科技大学中的机电工程等专业,毕业证即被视作从业证;又如大学和应用科技大学的教育硕士学位等同于教师资格证书等。但对于律师和医生类职业,则由相关的行业协会或国家机构组织实施资格认证考试。

  2. 评价经费主要来自财政拨款

  芬兰是一个高福利国家,绝大部分教育评价的经费都来自政府财政拨款。例如,各高校的自主招生费用由学校从国家核心拨款中自行决定使用比例。在国家教育质量监测中,教育与文化部全额拨款给芬兰教育评价中心;市/区教育质量监测经费由地方政府承担;而学校层面的评价经费则是由学校从财政拨款中自行决定使用比例。芬兰通过法律来保障各级各类教育评价都能得到充足的资源,同时法律也强调了评价的具体工作不受行政部门的干扰。

  少数考试也向学生收取一定的费用。如高等教育入学资格考试,学生须支付考试费,每门课约20欧,共考4门课,每科的证书约为32欧。收取的这些费用被用于高等教育入学资格考试委员会的管理和运营[16]。此外,医师资格等少数行业资格认证也会由组织实施该考试的行业协会或相关机构向考生收取费用。

  3. 政府职能定位为服务者

  随着芬兰教育决策和管理权的不断下放,国家对学校办学的直接管控越来越多地被学校自我规范所取代。政府在教育领域中的定位是服务者,而非管理者或监督者。在教育评价体系中亦是如此。学校在评价中享有很大的自主权,既是评价的主体,也是使用结果的利益相关方。政府仅提供评价标准,作为给学校的参考,而没有实际的约束力。在具体的评价活动中,政府充分信任学校和专业的力量,尽可能弱化行政干预和管控。

  除了为本国各级各类教育提供内、外部评价的经费外,芬兰政府还投入经费,积极参与OECD、欧盟等国际组织的评价活动(如PISA项目等),期待通过与国际专业机构的合作来提升本国的教育测评技术。

  

三、台湾

  1. 评价主体以政府设立的专业机构为主,高校和行业协会也扮演了重要的角色

  台湾地区的教育管理制度相对集权,在教育评价中,评价主体以政府设立的专业机构为主。不过,值得注意的是,高校、教育研究机构以及教育评价等方面的相关行业协会也是相当活跃的评价主体。

  台湾的教育评价内容主要包括学生学业水平考试、职业资格认证和学校办学质量评鉴三类。在学生学业水平考试中,高考是最高利害的考试。台湾的高考由“财团法人大学入学考试中心基金会”(简称“大考中心”)组织实施。大考中心既不属于“教育部”,也不是民间组织,而是登记为民间文教机构,其组织架构如图1所示[17]。该机构表面看来独立于“教育部”,但实际上“教育部”占有一定的股份。中心的各项业务都需要接受“教育部”的监督。

美国、芬兰、台湾的教育评价制度比较

  图1 台湾大学入学考试中心基金会组织架构

  台湾的职业及技术人员执业资格考试由政府设立的考试院承担[18]。具体来说,考试院每年定期举办9-10次职业及技术人员考试,考试类科达78种,涵盖的职业包括金融社会、工程、医事兽医、海事等四大领域,囊括了台湾经济社会发展所需的人才命脉。此外,考试院还负责监督各个委托机关、团体办理各项考试和评价业务。

  除了学生学业水平考试和职业资格认证,台湾还常规性地对学校办学质量进行评价。上世纪90年代以前,对各级各类学校的质量评价主要由教育行政部门下设的对应分管机构组织实施,以便于“教育部”对学校的管理和监督,如中等教育司负责对中学的评价等。90年代以后,“教育部”开始尝试委托高校、研究机构、行业协会等专业机构组织和实施评价。作为独立的法人机构,这些单位的立场不受教育行政部门的影响,有助于增强评价工作的公正性,同时,由台湾的优质高校或其他类别优质学校组织评价,还可以充分发挥这些优秀学校的引领、辐射作用,更好地促进同类学校相互检视、相互学习。以职业技术学校质量评价为例,1990年初起由台湾的科技大学轮流办理,取得了良好的成效。近年来改为由社团法人台湾评鉴协会负责实施[19]。在这一类评价中,教育行政部门逐步转变角色,由评价的组织者逐步转变为评价的指导者和评价结果的运用者。

  2. 评价经费来源多样,但仍以政府财政拨款为主

  依据评价的性质、用途和评价主体的性质不同,评价经费的来源也各不相同。例如,台湾考试院作为政府职能部门,其运转经费主要来自于国家财政直接拨款,仅有很小一部分来自于向考生收取的报考费用。而大考中心则以基金会的方式运作,主要经费来自基金收益、考生缴纳的考试费和国内外公私机构、团体或个人的捐赠。参与学校质量评价的高校、行业协会进行评价活动的主要经费来源仍然是政府购买其评价服务的委托收益,此外,也有小部分来自捐赠、会费、基金收益等。总的来说,各项评价的经费仍以政府拨款为主。

  3. 注重专业队伍建设与技术储备

  台湾高校、研究机构、教育评价的行业协会(台湾评鉴协会)在教育评价活动中的积极参与,无疑有利于评价专业人才的培养和先进评价技术的推广。目前,台湾的很多高校,特别是师范类院校(如台湾师范大学),都开设了教育评价的相关专业,研究机构中相当比例的专业研究人员曾在美国获得过系统的专业训练。此外,台湾政府每年也参照美国的做法,每年在评价研究方面投入竞争性经费。个别私人基金(如蒋经国基金会)也有类似的研究经费投入。这些举措都促进了台湾教育评价方面人才和技术的储备。

  

四、政策建议

  随着我国教育管理体制改革的不断深入,我国的教育评价制度正朝着政府监管与市场调节相结合的方向发展。上述几个国家和地区,特别是美国在教育评价发展方面的经验,对我国如何加强政府监管、激发市场活力有着一定的借鉴作用。据此,本文提出以下几点政策建议:

  1. 厘清政府在教育评价中的职能边界,做到管、评分离。转变政府职能的一个重要方面就是将教育评价交给专业机构。评价业务并非政府所长,因此评价不应该进入政府权力清单。政府可以依据专业机构的评价结果改进政策。同时,评价也要有自身的边界。如果政府决策,特别是对学校的直接管理过度依赖评价结果,那么决策势必过于简单机械。

  2. 将委托专业机构和社会组织开展教育评价纳入政府购买服务范围,建立健全招投标制度和绩效管理制度。目前已经有不少地区和学校尝试购买社会组织提供的第三方评价服务,但很多地方政府购买评价服务的渠道还不健全,招投标制度也亟待进一步完善。

  3. 制定专业机构和社会组织参与教育评价的资质认证标准。目前市场上的评价服务良莠不齐,很多教育行政部门及学校又缺少辨别能力。第三方评价市场能否有长期、健康的发展,在很大程度上取决于我国能否尽快建立评价机构的资质认证和评价产品的市场准入标准。否则,第三方机构将会很快失去各级教育主管部门和学校、学生的信任,难以生存和发展。

  4. 行业归口,缕清督导机构和评价机构的关系。评价并非督导机构的专长,督导机构应通过合理的、制度化的筛选程序选择评价机构及服务。

  5. 通过相关的法律,对评价机构的信息保密作出规定,保护学生、学校不受伤害。

  6. 重视专业人才培养和技术积累。近年来教育评价的迅速兴起凸显了我国评价技术和人才不足的问题。目前我国高校系统培养教育评价专业人才的能力明显缺失,具有世界水准的教育评价研究机构和研究人才凤毛麟角。虽有越来越多的研究机构开始开展国际合作,但高水准的国际教育评价技术资源尚未得到充分利用。教育评价前期研究和实践都需要较高成本,只靠市场的力量难以形成整体性的突破。政府应在人才培养、机构建设、技术引进与合作研究、项目资助方面制定配套政策,支持和引导教育评价技术整体提升和教育评价事业健康发展。

  7. 健全行业组织,行业协会要建立行业标准,进行行业自律。全国性的、权威性的教育评价行业组织应当确立行业规范、制定产品标准、进行质量认证等。随着我国第三方评价的发展,行业协会也应逐步发挥更大的作用。


  [1] ETS: http://www.ets.org

  [2] ACT: http://www.act.org

  [3] Pearson Vue: https://home.pearsonvue.com

  [4] DRC|CTB: http://www.ctb.com/ctb.com/control/main

  [5] BEAR Center: http://bearcenter.berkeley.edu

  [6] American Institute of Research (AIR): http://www.air.org

  [7] Massachusetts Teachers Association (MTA): http://www.massteacher.org/educators/licensure.aspx

  [8] National Center for Educational Statistics (NCES):http://nces.ed.gov/nationsreportcard/about/

  [9] College Board: https://www.collegeboard.org

  [10] California Assessment of Student Performance and Progress (CAASPP): http://www.cde.ca.gov/ta/tg/ca/

  [11] NCME: www.ncme.org

  [12] Standards for Educational and Psychological Testing: http://mp125118.cdn.mediaplatform.com/125118/wc/mp/4000/5592/5599/39268/Archive/default.htm

  [13] National Plan for Education Evaluation 2016-2019, p.1.

  [14] 刘彬. 芬兰大学入学考试制度及对我国高考制度的启示[J]. 教育与考试,2009(5).

  [15] 丁瑞常,刘强. 芬兰教育质量监测体系探析[J]. 比较教育研究,2014(9):54-58.

  [16] https://www.washingtonpost.com/news/answer-sheet/wp/2014/03/24/the-brainy-questions-on-finlands-only-high-stakes-standardized-test/.

  [17] 财团法人大学入学考试中心基金会:http://www.ceec.edu.tw/CeecIntro/CeecStructure.htm

  [18] 台湾考试院:http://wwwc.moex.gov.tw/main/content/SubMenu.aspx?menu_id=29.

  [19] 台湾评鉴协会:http://www.twaea.org.tw/about.php.2016-10-12.