3479 字

C指数

今年期刊影响因子出来后网上一片死寂,就跟这事没发生一样,原因很直观,今年八成的学术期刊影响因子都下降了。去年影响因子普涨,几乎所有期刊都在报喜,今年虽说看新闻大家都喜欢看离谱的,但跟自己密切相关的东西还都是不喜欢这种下坡路新闻。

不过我觉得无所谓,影响因子本就是评论期刊的方法,学术出版公司热闹下无可厚非但具体到个人是不应该用评刊的方式来评人的,大多数说自己发了多少高分文章的人引用数应该是够不到期刊平均值的,如果够了他就会说自己文章一年多少引用了。不过影响因子普降也确实有原因,而且大概率跟新冠有关。

去年影响因子出来时计算的是2020-2021年的引用数,这个时间别人在干嘛我不知道,但我当时只能在家里写论文。另一个原因则在于影响因子的计算方式,也就是被引用数除以文章数,这里面文章数是没法动手脚的,但引用数是可以刷的,常见方法就是写非同行评议的社论或展望来介绍工作,这招本来就CNS这些大刊在用,现在很多小刊也学会了这个套路。打个比方,我发表一篇论文,在当期期刊再找人写个介绍引用一次,综合性期刊通常有这样介绍研究进展的栏目,因此你文章发到顶刊大概率当期就会产生引用。

本来这个计算方式其实能贡献的也就是自引,数目有限。但新冠大流行后短期内就搞出了上万篇新冠相关的蹭热点文章或预印本,各大国也纷纷开启了研究撒钱模式来促进研发,后果就是2020-2021这个阶段发表了大量跟新冠相关的研究且引发了大量的媒体追踪与报道,而这里面很多媒体就是综合性期刊。假设一篇新冠论文引用个三四十论文,而论文发表后引用也就三四(这是平均水平,不吹不黑),那么这篇论文实质就是给学术期刊注水了三四十的引用,基本都流向了中高档期刊,在这个趋势下中高档期刊影响因子一定是越来越高的。具体到去年就是所有跟新冠沾边的生物医药基础研究的期刊普涨一大截。

空口无凭,我还是说下数据吧。影响因子大涨的2022年用的是2020-2021这两年数据,2021年 《科学》杂志covid相关论文有142篇,2020年有175篇。我们只看当年引用也会发现,2020年当年引用有7673次,每一篇被引用了约44次,2021年当年引用4006次,每篇被引用约28次。那么所有论文呢?《科学》2020年发表2656篇,当年总引用数19788篇,2021年发表2636篇,当年总引用数12943,2022年发表2496篇,当年总引用数10343,而疫情前的2019年发表2729篇,当年总引用数7217. 什么概念呢?就是说2019年《科学》上所有论文当年引用数大概跟2020年covid相关论文的当年引用数相当。所以毫无疑问,新冠是给科研论文带了一波大流量,这是搞出过去两年影响因子膨胀的主要原因。

那么今年发生了什么呢?主要是研究关注度下降,相关研究项目数量回归正常水平。去年(2022)《科学》上发了2496篇论文,Covid相关主题的有85篇,而当年引用有1076次,每篇只被引用了约13次。但倒霉的是很多追随论文发表都是有滞后性的,这些新冠论文去年发出来后引用数上不去了,而这些文章的发表又占用了常规论文的数目,后果自然是一波普跌,综合类跟生物医药类跌的最惨。今年的统计数据还包含了2021年这个引用膨胀年,但最多到后年,这些都要回归到2019年水平。但因为存在我刚才说的引用数的光环效应,所以整体中高档期刊还是会吸引更多的引用。网上传的新期刊稀释作用比新冠影响差了不是一点半点,好的研究发在任意中高档期刊上长时间看都会是引用大户,更多的论文只会让这些优质内容引用更多,期刊层面的影响对研究人员而言没意义。

说到这里就绕回原点了,究竟怎么评价论文?现在的麻烦在于不论你用啥指标都可能被刷。当前考察的引用数也好,论文数也罢也好,都属于单向指标,也就是越高越好,一个单调函数无论如何都会被刷的。最常见的方法就是发一堆中低档论文去刷引用,或者写综述来骗引用。但如果你给出一个指标,数值越高难度越高就会好很多,例如H指数就不好刷。但H指数不能评价单篇论文,我想了下设计了一个更通用的C指数。

C指数计算方法很简单,就是文章被引用的次数(以评价时间为准)除以引用的论文数,如果超过1,那么就说明这篇论文引用质量比较高,毕竟引用这篇的人比这篇引用的还要多,对于学科来说是扩大了影响力。每个人发表过的论文里比例超过1的篇数累计为这个人的C指数,期刊也可以这么算。

这个C指数的门槛还是很高的,一篇实验支撑的学术论文引用数怎么也得三四十,而能被引用三四十次对任何期刊而言都是优质论文了。而且C指数最大优势在于可以屏蔽掉综述文章的影响,现在一篇综述文章动辄上百引用的研究,但发表后能获得上百引用的综述一定是里程碑式的,绝大多数综述其实都够不到这个水平。另外C指数的基本假设在于如果一篇研究是开拓性的,那么其引用的工作一定是会少于被引用的工作的。如果一篇研究论文引用上百篇论文,那么最大的可能就是实验证据不够,只能拿别人的工作来当佐证。如果使用这个指数,也可以屏蔽掉很多审稿人要求加引用来提高自己引用数的无理要求,因为加入的引用会自动提高自己文章C指数的门槛。而且这个指标是天然防刷的,你只有做原创性工作且通过审稿人与引用者认可才能喜加一,单纯做排列组合的工作的话肯定自引比较多,而你自引的工作越多,C指数就越低。使用C指数评价可以让作者在引用时更为慎重而不是漫天引用,通过取悦审稿人来获得通过,这种论文对期刊来说也是拉低平均引用的那一批。对个人或期刊而言,C指数越高,说明原创性工作越多,更值得关注前沿的人去读。而有C指数的综述则可以重点研读,肯定不出错,也适合教学的人去读。

我猜测绝大多数研究人员C指数可能都到不了两位数,毕竟大多数人都是做跟随式研究而不是开拓式,跟随式研究引用数天然就要多于开拓式。你要是说好,我以后控制引用数量,那就看审稿人是否乐意了,因为跟随式研究引用数少的话会被审稿人认为背景了解不够或质量不够。C指数唯一的问题就是看怎么计算引用数,这个也不难,各学科都有自己的引用半衰期,就看文章发表后引用半衰期只能的C指数就可以了。有些学科半衰期比较短,C指数就更难刷,而半衰期长的天然就要求你的工作有长期价值。因此,这样考虑引用半衰期的C指数应该是可以跨学科比较的,虽然我觉得意义不大,但很多时候评价科研成果就是拿苹果比橘子的事。

到这里我们可以回头看看《科学》上的论文C指数如何,这里我们就把半衰期定为两年,跟影响因子计算一致,我也不去查单篇参考文献了,用平均值。2019年,2729篇论文一共引用了112842篇论文,平均每一篇引用41篇参考论文,在2020-2021两年被引用数超过文章引用数的有多少呢?大概550-600篇左右,也就是C指数大概是550-600。2020年平均引用为45篇,可以看出没有受到多少新冠影响,2021-2022两年C指数大概也在550-600之间。也就是说,这个指数天然对热点是有免疫力的,不论是否存在大趋势,学者整体被引用的论文数目与参考的论文数目是相对稳定的。影响力大到《科学》这个水平,C指数每年变化也不大,大概20%的论文是真正原创性的。

作为对比我们看一下ES&T,这是环境科学的顶刊。2019年发表1548篇,参考了43981篇,平均参考文献为28.4篇,那么C指数呢,大概是150-200之间,原创比例是13%左右。2020年,发表1691篇,参考了35276篇,平均参考文献为21篇,C指数是250-300之间,原创比例就到20%左右了。也就是说,子学科的顶刊论文中原创性高的论文跟综合期刊里原创高的论文差距不算大,主流综合期刊日常保持2成的原创高质量文章,子学科在出现重大科学问题时大概也能达到这个比例,不过平时可能会差一点。同时也要注意了,大概八成的顶刊论文其实影响力很有限,很可能是关系户灌水或者运气好,是达不到期刊平均水准或撼动学科根基的。

就个人而言,能上两位数的C指数的人大概都已经是教授了,这意味着发表了超过10项原创性成果,或者说H指数至少二三十了。如果只看一作,大多数教授一作文章都不到两位数就已经建立课题组了,而作为通讯作者原创性就不好说是学生、博后还是教授本身的了,但C指数评价一个课题组也是没问题的,起码C指数大于1才能算上一个有原创性的课题组。

我倒不担心C指数不好算,但作为野生评价指数,在当前这个时间点应该是没人去“优化”的而且也不好优化,大家可以算着玩。要是哪天成了公认指标我也不意外,毕竟科研一定要构建在开拓性而不是追随性工作上。