科学研究

当前位置: 首页 -> 科学研究 -> 正文

【BMJ】 Evidence-Based Medicine|徐畅、Luis、顾智淳、Suhail等全球20余位学者共同定义证据污染,确立循证医学理论与实践新边界

发布日期:2026-04-15

一、引言

    “我可以忍受怀疑和不确定,也接受自己无知。但我认为,活在无知中比活在错误里有趣得多”——《发现的乐趣》,费曼。循证医学同样如此:作为制定临床指南的核心依据,可以容忍不确定的证据,但无法接受错误的证据三十多年来,方法学家们投入巨大精力,试图在“确定性”与“可及性”之间建立平衡。然而,研究诚信问题的日益严峻正在打破这一平衡,循证医学再次面临挑战。

    2025年初,徐畅教授团队在《英国医学杂志(BMJ)》发表VITALITY Study I,所揭示的证据污染现象,引起了全球循证医学领域的关注。这一发现让我们重新思考:当“高质量”证据可以被捏造时,什么才是最佳证据?带着这个根本性问题,我们联合20余位国内外学者,对最佳证据进行重新审视,并正式确立“证据污染”的定义及理论框架,成果发表在领域权威期刊BMJ Evidence-Based Medicine(IF: 10.4)。

二、为什么需要“证据污染”这个新概念?从二维到三维:重新定义“最佳证据”

    要理解这个问题,首先需要回答:什么是“最佳证据”?

    传统循证医学对“最佳证据”的定义建立在两个维度之上:系统误差(偏倚) 随机误差。前者衡量证据的准确度,后者衡量证据的精确度。这两个维度共同构成了传统证据评价体系的基石。

    然而,这一定义隐含着一个默认前提:证据本身是诚实的当研究存在欺诈时,讨论其准确度及精确度已经失去了意义——因为证据的根基已经崩塌,传统框架下“高质量”完全可以被捏造!欺诈不是一种“误差”,无法通过方法学改进来修正;它是一个“资格”问题,决定了一项研究是否还有资格进入证据合成的讨论。

    因此,传统的最佳证据定义(准确度+精确度)是不完整的。它缺少了第三个、也是更基础的维度:可信度。存在系统误差或随机误差的证据,虽不完美,仍可被视为“最佳可得证据”;而一旦存在欺诈,无论其方法学质量如何,都不再属于“最佳”或“最佳可得”的范畴。

   一个简单的类比有助于理解存在误差的研究,就像营养价值不高的食物,虽不理想但尚可食用而存在欺诈的研究,则如同有毒的食物,无论其营养成分多么丰富,都必须彻底丢弃。

     这正是我们提出“证据污染”这一新概念的根本原因——它试图填补传统循证医学方法论在“可信度”维度上的空白,为识别和应对欺诈性研究提供理论框架。

三、何为证据污染?

    我们正式将“证据污染”定义为(Evidence contamination):欺诈性证据进入下游证据整合过程的情形,这包括各种类型的综述、临床指南、临床实践等以Meta分析为例:如果纳入的原始研究中包含欺诈性试验,无论研究者是否知情,该Meta分析即被“污染”。值得注意的是,受操控的专家观点,进入临床指南制定过程,亦构成证据污染。

    污染过程可以看作一条污染链:欺诈性证据是初级污染物,受污染的证据整合是次级污染物,受污染的临床指南是三级污染物。需要特别强调的是:证据污染在下游合成中未必是故意的。大多数情况下,研究者并不知道自己纳入了欺诈性研究——但即便如此,污染的结论仍然不可信(如下图所示)。

    证据污染存在两个关键特征,积累效应与放大效应积累效应是指多个欺诈性研究从低层级向高层级流动,在更高层级累积放大效应是指污染物在传播过程中被成倍放大。

四、证据污染 vs 证据偏离:故意与无意之分

    证据污染与证据偏离(Evidence deviation)的区别,核心在于“故意”与“无意”之分。证据污染源于欺诈性证据,欺诈性证据属于故意的学术不端行为;而证据偏离源于系统误差或随机误差,误差属于无意的研究缺陷。误差既可产生于原始研究(如设计与实施缺陷),也可产生于证据整合过程(如数据提取错误)。

    除此之外,以下几类情形亦不属于证据污染:一是非故意的数据提取错误、纳入错误或分析错误,这类错误虽会影响结论,但本质属于证据整合层面的误差,最终引起证据偏离;二是引用欺诈性研究但未将其纳入证据合成,因为引用不代表纳入,更不会计入权重,不会影响合成结论;三是与欺诈无关的撤稿,如因重复发表或伦理问题被撤稿,只要数据未被重复使用,也不构成污染。

五、如何应对证据污染?

    应对证据污染的唯一方法是彻底清除欺诈性证据。这需要建立正式的检测机制,但目前面临两大难题:欺诈研究的识别难度大,从发表到撤稿的周期过长(中位数为4年)。这导致一个严肃的事实——欺诈研究已撤稿,但通过系统综述等载体,仍然流通在证据生态体系中,继续造成污染。

   替代方案为可信度评估。目前已有多种工具可用于评估研究的可信度,如REAPPRAISE清单、Cochrane妊娠与分娩可信度筛查工具(CPC-TST)、TRACT清单以及INSPECT-SR等。系统评价作者和指南制定者可借助这些工具对纳入研究进行可信度评估。敏感性分析也是检验污染影响的重要手段——通过剔除未通过可信度检查的研究,检验结论的稳健性。

    需要指出的是,现有的证据确定性评级体系(如GRADE)在处理证据污染方面作用有限,因为其所有评价域均默认证据为“诚实”的起点。

六、重塑循证医学核心范式

    当前循证医学的方法论范式,本质上是为检测、评估和处理偏倚与不确定性而设计的,而不是为处理证据污染而设计的,这意味着,大量现有的方法论框架需要重构。例如,报告指南(如PRISMA)应增加关于“可信度”评价的条目,证据评级系统(如GRADE)应将“欺诈”作为独立维度,敏感性分析应制度化成为常规操作。

    证据污染的提出,标志着循证医学方法论从“方法严谨”向“证据本体可靠”的范式转变。这不仅是术语的更新,更是对循证医学根基的重塑,为应对日益严峻的研究诚信危机提供了理论基础。

七、结语

    证据污染是一个严峻的时代性课题,它侵蚀着证据的可信度,动摇着证据生态的根基。从实证发现到理论建构,我们团队迈出了关键一步。但真正解决问题,需要整个学术共同体的参与——证据生产者、整合者、使用者、指南制定者、期刊编辑乃至临床医生,都应成为证据生态的“守门人”。

    这是我们提出“证据污染”理论的初衷,也是我们期待看到的改变。

    本研究发表于BMJ Evidence-based Medicine,引用格式如下:Xu C, Furuya-Kanamori L, Gu ZC, et al. Evidence contamination: what it is and why it matters. BMJ Evidence-based Medicine, 2026.  DOI: 10.1136/bmjebm-2025-114305.