7 家中国医院 “跻身” 全球撤稿率前十!《自然》发布研究报告
7 家中国医院 “跻身” 全球撤稿率前十!《自然》发布研究报告

近日,《自然》杂志发布的一份研究报告,首次从机构层面对全球论文撤稿现象进行系统性分析,引发广泛关注。在这份 “撤稿率最高机构” 榜单中,令人遗憾的是,中国山东济宁市第一人民医院以超过 5% 的撤稿率(2014 - 2024 年)位居首位,成为世界上撤稿率最高的科研机构之一。这意味着该院平均每发表 20 篇论文,就有 1 篇被撤回,其撤稿率超过全球平均水平 50 倍以上。
济宁市第一人民医院的学术不端问题并非一朝一夕。早在 2020 年,加州学术诚信调查员伊丽莎白・比克(Elisabeth Bik)就发现了 400 多篇内容高度雷同、疑似来自论文工厂的论文,其中济宁市第一人民医院的论文数量最多,超过 100 篇。事件曝光后,据《澎湃新闻》报道,济宁市第一人民医院从 2021 年 9 月 7 日到 2022 年 1 月 21 日陆续发布 10 份通报,对 107 篇论文涉及的 107 起学术不端事件相关责任人,分别给予院内通报批评、科研诚信诫勉谈话、党内警告、行政警告、免职等处理措施 。然而,此次仍在撤稿率榜单中 “名列前茅”,凸显出问题的严重性和复杂性。
在《自然》统计的撤稿率前十机构中,中国机构占据七席,且均为医院及医学院。除济宁市第一人民医院外,河北沧州市中心医院、河南大学淮河医院分列二三位,撤稿率约为 3.5% 左右。此外,潍坊市人民医院、临沂市人民医院、新乡医学院第一附属医院、齐齐哈尔医学院也进入前十。其他三席则由巴基斯坦的加齐大学、埃塞俄比亚 “亚的斯亚贝巴”(Addis Ababa) 理工大学、印度 KPR 工程技术学院占据。

《自然》的撤稿分析基于三家研究诚信公司提供的数据,包括 Scitility 的 Argos、Research Signals 的 Signals,以及 Digital Science 的 Dimensions Author Check。这些公司整合了 Retraction Watch(撤稿观察)的数据库、Crossref 的出版数据、PubMed 的索引以及期刊网站信息,构建了全球撤稿数据集。虽然不同数据来源的结果存在一定差异,但中国小型医院和医学院在撤稿问题上占据主导地位这一规律较为明显。
根据 Dimensions 的数据,在撤稿率超过 1% 的 136 家机构中,大约 70% 为中国机构,其中接近 60% 为医院或医科大学。Argos 数据库统计的 186 家撤稿率 1% 以上的机构,也呈现出类似规律。进一步分析不同类型机构发现,中国医院的撤稿率普遍高于高校,成为撤稿率最高的一类机构。
医院已然成为学术不端的重灾区。2023 年国家自然科学基金委第一批不端行为案件处理结果通报中,8 起案例有 7 起当事人来自各医院、医学院、医科大学;同年第二批通报中,也有三分之一案例和医院、医学院相关。基于 2015 年至 2020 年国家自然科学基金委员会通报数据的一项研究显示,被处理人员中专业为生物医药类的占比约 75.9% 。一项通过人工智能算法识别论文工厂论文的研究表明,在 SCI 收录的论文中,医院是论文工厂产出论文的主要来源,占比高达 67.5%,且全球医院发表的 SCI 论文中,几乎所有论文工厂论文均出自中国医院 。
深入探究这些医院的问题根源,年轻医生为满足职业晋升的论文要求,从 “论文工厂” 购买伪造数据或直接发表伪造论文的现象较为普遍。伊丽莎白・比克指出,这些医生承受着巨大压力,因为发表论文往往是他们获得工作或晋升的必要条件。在职称评定方面,许多省份的卫健委规定评职称需要论文,且有严格的计分方式,不仅考核篇数,还对影响因子有要求。尽管近年来广东等少数地区不再把论文作为评职称的必要条件,但大部分地区的情况仍未得到根本改善 。
从国家层面来看,统计过去 10 年的撤稿数量,不少中国机构排名靠前。但值得注意的是,若只统计过去 5 年(2020 - 2024)撤稿数量,印度和沙特阿拉伯的几家科研机构主导了榜单,这主要是受 2023 年 Hindawi 撤稿潮的影响。2023 年,Hindawi 发布了超过 9,600 篇撤稿声明,撤稿数量史无前例。本次《自然》研究报告显示,Hindawi 旗下 4 种期刊自 2014 年以来的撤稿率超过 20%,另有 4 种超过 10%,在期刊撤稿排行榜中位居前列。这些撤稿论文中也有部分中国科研人员参与,受此影响,2024 年初,教育部科学技术与信息化司发布通知,要求各高校开展撤稿论文自查工作,全面检索中英文科技文献数据库,梳理过去 3 年来本单位、本人署名的科研论文被撤稿情况,核实原因并严惩学术不端行为 。
撤稿数量在一定程度上与机构和国家的体量有关,排名靠前的机构撤稿概率未必突出。从撤稿率看,2014 至 2024 年间,全球范围内过去十年发表的 5000 万篇或更多文章中,约 4 万篇(不到 0.1%)被撤稿。中国学者参与的撤稿论文占比近 60%(逾 2 万篇),目前中国整体撤稿率约为 0.3%,三倍于全球平均水平。埃塞俄比亚与沙特阿拉伯的撤稿率甚至比中国更高,根据不同数据源,伊拉克与巴基斯坦以及俄罗斯撤稿率也与中国水平相当。相比之下,美国、英国等国的撤稿率约为 0.04%,远低于全球平均水平,许多国家甚至更低。总体而言,中国的撤稿率大致排名在第 3 到第 5 之间。撤稿原因虽可能包括无心之失或编辑错误,但多数案例与学术不端行为相关,《自然・人类行为》今年年初的一篇评论文章调查显示,20.5% 的中国撤稿论文和论文工厂有关 。
从 2014 年到 2024 年间,撤稿声明数量从 2014 年不到 2,000 增长到 2023 年超过 12,000,增长速度不断加快。这一方面源于论文工厂的兴起,另一方面是学术侦探发现了更多问题。从 2014 年到 2022 年,论文撤稿率显著上升,2022 年发表论文的撤稿率已达约 0.2%。虽然 2023 年和 2024 年的撤稿数据看似较低,但可能是这两年发表的论文尚未经过足够时间暴露问题,因为论文撤回通常需要一定时间 。
全球撤稿率持续上升的背后,已曝光的问题或许只是冰山一角。法国图卢兹大学计算机科学家纪尧姆・卡巴纳克(Guillaume Cabanac)认为,一些领域或机构撤稿率低,可能只是因为未对存在的问题进行调查。纪尧姆开发了检测学术论文中 “扭曲短语” 的工具,人工智能生成或多次翻译以逃避抄袭检测的论文中,常出现无法理解的短语。例如人工智能(Artificial intelligence)被错误翻译为伪造意识(Counterfeit consciousness)或者人造脑力(Man-made brainpower)。此前,中国一篇把摘要(Abstract)错译为抽象(Pumping elephant)的撤稿论文就属此类错误。截至 2023 年 8 月 20 日,纪尧姆开发的工具已发现 16,000 篇引用了 5 个或更多此类扭曲短语的论文,但被撤稿的仅占 18% 。
印度的自由数据科学家、印度研究观察组织(IRW)创始人阿查尔・阿加瓦尔(Achal Agrawal)发现,印度高撤稿率机构几乎全部集中在教育重镇泰米尔纳德邦的私立院校。他认为,印度公立大学和政府机构研究人员发表压力小于私立机构,私立机构不仅鼓励学生和教师多发论文,还在某些情况下提供奖金。在 2024 年 1 月发布的预印本论文中,阿加瓦尔对撤稿观察数据库中 25 个国家的撤稿数据研究发现,过去五年论文出版数量和撤稿声明率高度正相关,发文数量大量增长的国家往往撤稿率也迅速提升。虽然相关不代表因果,但不健康的激励制度很可能是高撤稿率的重要原因 。
此次《自然》发布的撤稿率相关研究报告,为中国科研界敲响了警钟。中国医院等科研机构在撤稿问题上的严峻现状,需要从制度层面、监管力度以及科研人员观念等多方面进行深刻反思与改进,以维护中国科研的国际声誉,营造健康的学术生态环境。
标签:
