授人以鱼不如授人以渔。
这本书,是一本解答“什么是影响评估”的启蒙手册。
一本传递“如何科学评价政策或项目的实施效果”的方法手册。
一本“为项目设计者和执行者提供指导”的经验手册。
一本“推动科学公益,促进科学政策制定”的操作手册。
图1 农村计算机辅助学习项目照片(拍摄于2013年)
图2 看清未来:农村学生视力保护项目照片(拍摄于2018年)
图3 养育未来:农村婴幼儿早期发展项目照片(拍摄于2018年)
归因,或者说识别某一政策/项目/干预(下统称“干预”)的净影响,其方法精细且不断发展,需要系统学习和长久的实践才能逐渐掌握。本书的目的与其说在介绍影响识别的具体方法,不如说是希望通过本书,帮助项目设计者和执行者(包括政策制定者、社会组织管理者等)进一步了解科学施政和科学公益的内涵——影响评估是科学公益的深刻内涵,评估特定项目的有效性是影响评估的基本形式,基于问题识别设计项目方案是影响评估的最终目的。
影响评估的方法体系涵盖了项目问题识别、目标制定、干预方法制定、项目实施、项目效果评估的设计和执行以及成本效益分析的一系列内容。而在运用影响评估各类方法评估项目的“净影响”时,随机干预实验方法被誉为是因果推断的黄金标准。2012年诺贝尔经济学奖得主埃尔文·罗斯(Alvin Roth)将实验方法在经济学领域的应用比喻为“与理论家对话”(speak to theorists)、“寻找事实”(search for facts)、“在君主耳边低语”(whisper in the ears of princes)。近年来,随着大规模实地实验的兴起,越来越多的实验经济学家开始借助大规模随机干预实验直接参与现实经济活动,以确保经济学理论的合理应用和经济政策的正确实施。作为一个新兴领域,这种经济学实验方法在中国的影响评估领域有着广泛的应用前景。
《影响评估手册—经济学实验方法在中国农村教育与健康领域的实践与发展》把这种“高深莫测”的经济学实验方法以通俗易懂的言语、简明扼要的阐述、生动贴切的案例为读者展现了在中国农村教育与健康领域运用经济学实验方法进行影响评估的具体实践。这是一本适合影响评估的初级学习者以及基金会、NGO等公益项目和政策模拟项目的设计者、执行者和决策者阅读的入门手册。
本手册基于CEEE研究团队多年来采用影响评估方法在中国农村教育与健康领域开展的60余个实地试验的经验基础上撰写而成,从实践应用视角切入,结合开展影响评估积累的实践经验,阐释影响评估的定义和核心,回答“什么是影响评估”;同时详细呈现在随机干预实验设计、执行、分析等阶段的原则、要点和完整细节,回答“如何运用随机干预实验方法开展影响评估和作用机制的分析”;试图解释开展影响评估的原因,逐层论证影响评估是科学地选择、设计与开展公益项目的基础和核心,即回答“为什么要开展影响评估”;也总结了基于影响评估进行政策和项目推动的方法和理念,回答“如何推动政策前行”的问题。引导读者通过思考回答这些问题,系统掌握影响评估的科学方法和理念。
一本解答“什么是影响评估”的启蒙手册。一本传递“如何科学评价政策或项目的实施效果”的方法手册。
什么是影响评估?
影响评估就是评估具体项目或政策的影响(即项目“是否”改善了项目受益人的一系列相关结果指标)并分析背后的作用机制(即项目“如何”产生了影响)。需要指出的是,我们所说的影响是指政策(或者干预)的作用对象与其在接受和未接受政策(或干预)的情况下在结果上的差别,即“影响=受到干预的结果—未受到干预的结果”,我们称之为项目干预的“净影响”(即项目干预的影响而不是项目外其他因素的影响)。
影响评估的核心是什么?
识别“净影响”的关键是科学地构建反事实数据,以清楚地说明干预是否对最终结果产生了影响,并进一步分析干预的影响是如何产生的。构建反事实的思维已被逐渐应用于经济教育研究、政府决策和教育改善等领域的影响评估研究中。构建反事实的方法既包括随机干预实验方法,也包括匹配法、断点回归法、倍差分析法、工具变量法等“准实验方法”。本书除了简介准实验方法的理念,更是重点详细阐述了随机干预方法的理念和步骤。
项目如何产生或没有产生影响?
在识别项目“净影响”之后,分析项目“如何”产生或者未产生影响是通过建立项目作用的因果链并验证其是否成立来厘清从投入到产生影响的作用机制。具体步骤包括:问题的提出(problem)、目标的设立(objective)和(可测量)的预期结果的选择、干预方法的选择(包含因果链分析)和评估方法的选择(approach)、结果的评估与阐述(result),也就是基于理论的影响评估方法(TBIE)的初始步骤。
影响评估的其他重要步骤
影响评估思维的应用除了评估本身,还要向前延伸到问题识别(问题的发现、界定和分析,现有研究/实践的综述评析等)、目标提出和指标制定、途径设定(干预设计),向后延伸到成本效益分析,规模化阶段(结果推广)的项目监测和项目改进。其中,最重要的是问题识别———这是科学公益的起点。
在掌握上述基本理念和方法后,就可以开始完整设计和开展一项运用随机干预实验方法的影响评估。本手册系统地介绍了从提出问题到抽样分配的设计步骤,从收集基线数据到收集跟踪数据的执行过程,从数据到结论的数据分析过程,以及开展随机干预实验需要注意的一些常见问题及应对方法,同时详细说明项目设计者和项目实施者需要格外注意的伦理问题。随机干预实验项目与公益项目没有根本性区别,只是增加了随机化这一过程,在其他方面二者是完全一致的。与公益项目相比,随机干预实验项目并没有更复杂,也没有更难以执行。公益项目能够以更科学的方式执行,需要改进的关键环节是通过随机化产生可比较的对照组(即控制组)。
此外,如果一个影响评估项目的设计是科学的,但是数据收集缺乏规范性,那么仍然将无法获得有效的数据和评价项目的真实效果,因此数据质量是影响评估的关键部分。手册中介绍现有的几种数据来源及一个完整的调查设计过程,如怎样进行数据收集,怎样进行数据质量控制,以及收集数据的管理如调查时间、许可及归档,并且强调抽样调查的方法以及统计功效的计算。
一本“为项目设计者和执行者提供指导”的经验手册。一本“推动科学公益,促进科学政策制定”的操作手册。
每一项随机干预实验从设计到实施,从执行到影响结果分析,都离不开研究 团队和各方的不懈努力。该手册是影响评估的经验凝集,致力于为政策制定者和项目设计者执行者提供一些有益可行的借鉴参考。
一方面,本手册为政策制定者提供了一些可行性策略。尽管政策决策受多种因素共同影响,但如果政策的制定是基于高质量的实证研究结果,那么政策制定过程本身就可以促进和保障政策的科学性。如果政策制定者充分理解随机干预实验在验证项目效果方面的科学性,知道哪些新政策和新项目确实有助于改善既定政策的实施效果,哪些可能是无用功,政策制定者们就可以把资源投向有效的政策和项目。CEEE从政策倡导的视角提出了四大策略:第一,问题导向,精准聚焦,选题要有较强政策性;第二,多方合力,设计干预方案时加强多学科合作;第三,逐步探索,简单渐进;第四,干预设计注重理论指导下的创新性。书中基于CEEE利用影响评估开展政策倡导的经验总结及其在中国的实践对这四大策略进行了详细的阐述。
另一方面,本手册给项目设计者和执行者提供了一些指导和建议。本手册凝结了CEEE在开展影响评估过程中的经验、心得,为项目设计者和执行者在教育、营养、卫生健康等领域开展影响评估项目提供一些理论和实践性指导、思考。CEEE认为影响评估从研究走向应用具有三种可行路径:(1)开展政策倡导,助推科研成果转化为实际行动;(2)在开展影响评估的过程中,可寻求与地方政府部门合作;(3)与企业或社会组织合作。越来越多的企业或社会组织青睐经“科学影响评估”的项目,经随机干预实验验证后的研究项目具有可靠性高、操作流程标准化、成本效益可测算的特点,因此研究方也可与这些组织合作,助力科研成果转化为服务经济社会发展的举措。基于第三点,本手册对公益组织的项目设计者和执行者给予了更加值得借鉴的建议。公益组织为了设计出更好的公益项目,可以从专业性和执行力来考察选择专业权威的项目评估方,从资助或执行优势出发,聚焦于对问题解决效果的评估及项目实施效率的监测。
图4 赋能农村基层医生项目照片(拍摄于2020年)
图5 养育未来:农村婴幼儿早期发展项目在宁陕整县推广揭牌仪式(拍摄于2019年)
在中国农村教育和健康领域,应用影响评估方法验证政策或项目有效性还未得到普遍推广,随机干预实验也尚未得到广泛应用。未来随着研究的深入,必将会引入更多基于随机干预实验方法的影响评估研究,实践操作也会更加完善、细致,这将不断推动随机干预实验在中国更多领域的应用与发展,从而更好地服务于项目设计、项目评估、政府决策和政策制定。这本手册见证了影响评估方法在中国农村教育和健康领域的萌芽,也将见证着它的枝繁叶茂。
附:《影响评估手册——经济学实验方法在中国农村教育与健康领域的实践与发展》封面及目录:
前言
第一章 影响评估概述
第一节 什么是影响评估
一、影响评估的起源和发展
二、现代影响评估的理念
三、创造性地构建反事实
第二节 现代影响评估发展现状
一、卫生和卫生服务领域的影响评估
二、教育领域的影响评估
三、社会政策领域的影响评估
四、影响评估现状小结
第三节 为什么要做影响评估
一、从方法到问题
二、从初心到效益
三、从过程到结果
四、从相关到因果
第四节 全球影响评估实践概览
一、国际组织的理念和行动——没有科学测量难以预知改善
二、学术团体的理念与行动——因果推断是评估核心
第五节 影响评估是科学公益的内涵
一、狭义影响评估是归因方法
二、所有公益项目均需要影响评估
第二章 影响评估的核心与方法
第一节 影响评估与因果推断
一、因果推断的基本逻辑
二、因果推断中的常见错误
三、构建严格的反事实
第二节 随机干预实验方法
一、随机干预实验方法与因果推断
二、随机干预实验方法的局限性
第三节 非随机干预实验的方法(准实验方法)
一、匹配法
二、断点回归法
三、倍差分析法
四、工具变量法
第三章 影响评估的初始步骤
第一节 初始步骤说明
第二节 一切从问题出发
第三节 明确并良好界定目标
第四节 确定干预方法
第五节 项目干预的变化理论(因果链分析)
一、变化理论的定义
二、变化理论的作用
三、如何建立变化理论及其呈现方式(因果链分析方法)
第六节 应用案例——改善婴幼儿贫血项目
第七节 常见问题
第四章 随机干预实验设计
第一节 随机干预实验设计步骤
一、提出问题
二、提出干预
三、因果链分析
四、抽样和分配策略
第二节 随机干预实验的执行
一、收集基线数据
二、随机分配干预组或控制组
三、干预执行
四、成本记录
五、收集跟踪数据
第三节 数据分析:从数据到结论
一、评估项目的影响效果
二、应用分析结果改进项目
三、项目的成本—效益分析
第四节 开展随机实验的常见问题和应对方法
一、内部有效性的两个案例:霍桑效应及约翰·亨利效应
二、内部有效性问题及应对办法
三、外部有效性问题及应对方法
第五节 随机干预实验的伦理问题
一、关于伦理问题的一项思想实验
二、随机干预实验的基本伦理原则
三、满足基本伦理原则的常见做法
第五章 影响评估数据收集
第一节 数据的重要性
第二节 数据来源
一、数据来源分类
二、两类数据的优缺点比较
第三节 调查设计
一、分析计划
二、定量数据收集的过程
三、数据质量控制
四、定性数据的角色
第四节 数据收集管理
一、调查时间
二、许可
三、数据归档
第五节 抽样
一、抽样方法介绍
二、影响评估中的抽样方法选择
第六节 统计功效
一、功效的定义
二、统计功效的计算
三、缺乏统计功效的研究存在的风险
第六章 影响评估案例分析
第一节 如何进行影响评估因果推断
一、从问题出发设计项目
二、项目干预的因果链分析
第二节 如何开展影响评估的设计
一、项目的抽样和分配策略
二、项目的干预材料与问卷设计
三、针对伦理问题的应对办法
第三节 如何开展影响评估的实施与数据收集
一、项目的数据收集与干预执行
二、项目质量控制
第四节 影响评估结果与政策推动
一、评估项目的影响
二、项目成本—效益分析
三、政策推动
第七章 利用影响评估开展政策倡导的经验总结及其在中国的实践
第一节 政策倡导的四个策略
一、问题导向,精准聚焦,选题要有较强政策性
二、多方合力,设计干预方案时加强多学科合作
三、逐步探索,简单渐进
四、干预设计注重理论指导下的创新性
第二节 与政府合作的三种模式及其在中国的实践
一、与政府合作的三种模式
二、与政府合作的三种模式在中国的实践——以儿童早期发展项目为例
第三节 随机干预实验在政策倡导中的作用
参考文献
后记