科研成果的信任危机:从超导闹剧到AI幻觉,我们还能相信什么?
前几天大半夜,我一个搞物理的朋友突然打电话过来,语气崩溃得像是刚发现自家猫会开冰箱偷吃——不对,比那个更严重。他说,哥们,你知道么,我们组这半年时间全白费了。就因为去年那篇号称发现了室温超导的论文,十几个人的团队,烧了几百万经费,结果连个毛都没复现出来。我在这头差点笑出声,不是没同情心,是这事儿太典型了。典型得就像年年都会有的那种新闻:惊天突破、全球轰动、然后…就没有然后了。对吧?
说实话,我当时也激动了一把。尤其是看到那个视频——一片材料飘浮在磁铁上,像科幻片里的反重力装置。谁不激动啊?要是真成了,诺贝尔奖不提,整个能源行业能翻天。可冷静下来一想,这种戏码又不是没演过。早几年的“上帝粒子”乌龙,还有那个轰动一时的“冷核聚变”,最后都成了科研史上的烂尾楼。只不过这一次传播得更快,打脸也更响。
你可能会说,科学不就是试错吗?没错,但这里头有个边界,一旦跨过去,就不是在探索,是在画饼。而且这饼还特别费钱,费年轻人的头发。
让人上头的“里程碑”,怎么就烂尾了?
L那个超导——对,就是LK-99,我到现在都记得名字——它的爆雷路径堪称教科书。先是预印本网站上一篇未经同行评议的论文,然后推特上几个大V一吹,媒体疯狂跟进,股价应声暴涨,仿佛第二天就能诞生万亿元市场。可是呢?全球几十个顶尖实验室吭哧吭哧忙活大半年,结果发现那所谓的“零电阻”不过是样品不纯闹出的乌龙。更讽刺的是,原始团队后来承认“表述有误”——轻飘飘四个字,多少人的饭碗差点因此砸了。
我得插一句,这事儿真正让我恼火的不是论文作者,是那套畸形的评价体系。现在的科研生态,发文章比发真相更重要,标题越炸裂越好,数据越完美越好。至于结果能不能重复?谁在乎。反正先占山头,再慢慢圆谎。有统计说,心理学领域超过一半的经典实验无法复现,生物医学更惨,有些顶级期刊的论文撤稿率十年涨了十倍。这些数字看得我后背发凉——我们引以为傲的知识大厦,地基到底牢不牢?
科研论文撤稿率上升趋势图
我有个在药企工作的朋友私下吐槽,他们拿《自然》《科学》上的靶点论文去验证,三分之一以上根本做不出来。你想想,这要是用来开发新药,几十亿美金打水漂不说,病人还空等一场。所以啊,下次再看到“重大突破”的新闻,先别忙着转发,泡杯茶,等三个月,消息还在,咱们再慢慢品。
AI掺和进来,是火上浇油还是救星?
就在人类自己把科研信任度折腾得够呛的时候,AI又举着火把冲进来了。这两年大模型火得不行,写代码、画图、搞创作,当然也少不了助攻科研。我用过一工具,能把实验设计自动生成,还能找文献里的隐藏关联,绝了,简直就是博士后们的天降外挂。但——注意这个但——问题也跟着来了。
AI会“幻觉”,这事已经不是秘密。它编起参考文献来有模有样,题目、作者、期刊名一应俱全,可你仔细一查,全是虚构的。去年就有人拿ChatGPT做皮肤癌诊断研究,AI一本正经地推荐了压根不存在的化疗方案,论文还差点在会议上宣读。这要是不知情的小组拿去用,后果不堪设想。更可怕的是,这种假象自带高级感,因为它逻辑严密、措辞专业,比人类造假更难识别。
AI生成虚假科研论文示意图
不过话说回来,倒也不能一棍子打死。我最近看了一篇报道,麻省理工的团队用AI网络发现了一种新型抗生素,能干掉耐药菌。他们不是靠瞎猜,是把成千上万的分子结构喂给模型,让AI预测哪些有效,然后再去实验室验证,结果是实打实的。这路子就对了嘛——AI当副驾驶,人类握方向盘。可惜现在很多地方是反过来,人类偷懒,AI飙车,翻沟里活该。
信任的修复术:慢慢来,比较快
写到这儿,心里其实有点堵。科研本应是我们认知世界的最后一道防线,如今却被玩成了狼来了的游戏。但也不是没救。整个科学圈正在悄悄发生变化,一些不起眼但很关键的小动作。
比如说“预注册”(preregistration),简单讲,就是做实验之前先把假设、方法、分析计划公之于众,接受监督,事后不能乱改。这招最早是心理学界推的,现在流行病学、经济学也在用。还有“开放数据”运动,要求论文发表必须附带原始数据,谁都可以查。我认识的几个刚入职的青椒,他们课题组已经强制把代码和数据传到公共平台,说虽麻烦,但睡得踏实。这才是正道,对吧?
另外,同行评议的改革也提上日程了。那种三四个审稿人躲在帘子后面打分的模式,太容易滋生偏见。现在有平台尝试公开评审意见,甚至允许作者和审稿人实时对话,透明度一高,捣鬼的成本就大了。我在想,要是当年LK-99的预印本底下能挂着几个专家的即时质疑,或许就不会有那么多人被骗下水。
当然,这些修补措施在牛逼闪闪的AI面前还是有点力不从心。有人建议,不如以毒攻毒:用AI来检测科研中的造假。比如能嗅出图片是否被PS的算法,能比对数据是否异常的统计工具。我觉得这个思路有意思,但立刻又想到,这不就是军备竞赛么?造假的用AI,打假的也用AI,最后拼的是谁的显卡多。有点荒谬。
其实,最关键的还是人心。这行业里太多的诱惑:职称、经费、头衔。为了这些,有人铤而走险,有人慢慢妥协。我一个在985当副教授的同学,五年没发大文章,没评上优青,反而活得挺通透。他带学生重复那些“经典实验”,重复不出来就写报告曝光,得罪了不少人。我问他图啥,他说,图个心安,图以后教科书上印的都是真东西。
听着挺理想主义的,但我默默给他转了五百块钱红包,算赞助,毕竟这种傻瓜不多了。





