3050 字

婴儿潮、棉花糖与ABM

婴儿潮

现在国内正在经历的是第四次婴儿潮(第一次在建国后,第二次在三年自然灾害后,第三次在86-91年),一个婴儿潮肯定会导致下一个婴儿潮,这个周期受目前在25-30年左右。同时,经济水平的增长与女性教育水平的提高在一定程度上也稀释了婴儿潮,相信这个周期会不断延长并最终消失。

我自己属于第三次婴儿潮,成长在一个不怎么缺小伙伴的独生子女政策下,过去的三十年一直都有一种感觉:人多。初中上一届有8个班,到了我们这一届成了12个班,随之而来的是初中高中连续4-5年的疯狂扩招,公立学校分裂出私立学校单独运营,大学则从1999年就开启了扩招的水龙头。然而,当我上大学后就开始听到小学校车频繁出事的新闻,其实这也有婴儿潮的影响。由于学生数量在我们那几届后锐减,很多小学直接开不下去了,特别在农村,原来每个村都有小学,人数减少后只能好几个村合并办学,但上学就成了问题,所以会出现装很多人的不合规的校车,自然也就会有相关新闻。当我读博士时,周边听到就是生孩子建档麻烦,排不上队,很正常,因为又到了我们这一代的生育年龄了。然后就是奶粉代购与母婴用品的高峰期,到现在又闹了一波学区房,想来也是这波人为人父母后懂得预先给孩子争取资源了。如果我是个商人,只要关注我到这个年龄段自己缺什么就去卖什么就可以了,毕竟人多。

人口,从来都是一个了解世界最重要也最有预测能力的基数。1万人的社区里是发展不出有规模的小众兴趣的,但1000万人的城市你能看到各种规模化的活跃社团。地理上与出生时间上的聚集会衍生出各种前所未有的事件,也不能说前所未有,之前只有苗头,聚集后才会涌现出新事物。而且你会发现在某样兴趣上同样活跃的人年龄也差不多,不在婴儿潮的想活跃起来的时代没有提供足够的人口基数让他遇到有同样兴趣的人。最近几年的用工荒、农村衰落与城市化进程背后也有人口因素,年轻人都进了城自然后代的生活环境更适应城市,而技术含量较低的工作所需要的青年劳动力却在减少。而各种营销概念忽悠的对象也是我这一代人为主,人多购买力大且现在也都有了一定的消费能力。这甚至都不仅仅是经济现象,还造就了文化现象。就连文学影视作品炒的冷饭用的梗也是80、90年代回忆风格的,不是因为这代人的回忆更重要,而仅仅就是因为人多,不仅消费者多,生产者也多,新闻焦点跟着转。很多不同年龄段的人则感受不到这种变化,由此产生的认知与行为偏差很难在代际间传递。

任何一个组织的年龄分布都隐含了大量的信息,特别是时代背景,正常人思维最容易忽略的就是时代背景。我们可以肆意点评大萧条时代、民国与文革,但总是对自己时代背景隐含的偏见视而不见,这可能是很多悲剧的源泉。这个偏见通过地理位移也不能尽数发现,我也不知道答案,但看新消息时总会有个预设,那就是这背后一定有些偏见与其他的角度,这样去想可以抵御九成以上的概念忽悠。

棉花糖

斯坦福大学的棉花糖实验常被用来作为说明自制力对成才的重要性,无数本畅销书以此为案例大谈特谈成功经验与育儿心法。因为我的同龄人大都处于这个阶段,所以最近这个研究在我周围的曝光度也很高,很多父母信誓旦旦说一定要提高自己孩子的自控力。这也是很多人对这类信息的处理方式,抛开论证过程,直击结论并用这个结论指导生活。类似的结论有很多,例如相貌会给事业加分,经济指标与口红、裙摆的关系…这一类的研究结论其实也是一种棉花糖。

在看科学研究报道时要首先区别开两种研究,一种是调查类研究,另一种是实验类研究。从结论可信度来说后者比前者更可信,但前者是更准确的现状描述。对于调查类研究,有意思的现象是亮点,但因为是调查类研究,通常研究人员并不干涉这个现象。但一定注意的是当结果被报道后,有些现象的根基会被报道所影响产生反馈。例如山东某地的胃癌发病率一直很高,研究人员调查后发现跟当地吃煎饼的习惯有关,因为当地人喜欢吃杂粮煎饼且一次烙好一大摞存放起来慢慢吃,此时在杂粮煎饼中某些杂粮成分并不适合长期保存,容易发酸而刺激胃,进而导致胃癌,经过报道后当地人改变饮食习惯发病率就降下来了。也就是说很多现象会随着反馈消失或加剧,例如如果所有年轻女性都认为外貌会给事业加分,那么美容业与化妆品厂商就会比较高兴且乐于宣传这些,反过来又加剧了这个现象。这个问题在各类畅销书里尤其严重,很多观察与调查类事实被当成不变的规律去论述,后果就是产生了一片佩戴“科学”有色眼镜的求知者,心心念念的都是些社科结论。实验类研究通过良好的设计与数据分析而产生的结论可能更靠谱,但由于存在研究者偏见与p值歧视,这类结论要关注实验过程与数据分析是否合理。我刚读研的前半年每晚打印一篇论文带回宿舍读,初期关注的也是知识性的结论,毕竟我对学科领域不了解,到了后期就更关注结论得出的过程与论证方法了,也正是这个过程让我意识到很多实验性结论的得出是存在问题的,作者跟同行都能看出来,但外界就不一定看得出来了。而且新发表的结论相比学科教科书里的东西更不稳定,在关注时也是需要注意的。虽然我经常对不懂的新研究乱评论,但对于新发现结论本事更多的是观望而不是马上相信。例如关于癌症是坏运气的研究当时感觉是作者玩了一个观察性数据分析的花招,但这两天作者最新的研究则提供了更多的证据,这个过程更符合科学对真相的探索,是持续性改进的。

很多科学报道或畅销书都在越来越多的使用研究与数据来阐述道理,这点很好,但读者应该也可以用一种科研的态度来对待结论并思考过程。不然这种结论棉花糖会让很多人自认为已经掌握了真相与全貌,而事实上只是一个幻象。最好的方法就是在看到一个结论时去搜相反的意见与评论,这样一个过程不能给你带来确定性,但那又如何,世界本就不是确定的。

ABM

ABM,这个是Agent Based Model的简称,是一种研究工具,特别适合动态过程的模拟。现实社会存在一个问题,无论什么样的秘籍,大家都用的话也就不叫秘籍了。这就是反馈过程,做自然科学研究很少遇到这个问题,例如你发现某种鱼的秘密洄游路线也不能把论文给它的天敌看,看也看不懂。但跟人沾边的社会科学研究就不一样了,你哪怕瞎编一个结论都可能对特定人群的认知与行为产生影响,这个影响你用回归分析就搞不定,因为这类行为不回归,完全是反馈反馈再反馈,个体层次看不出规律。但ABM可以模拟这个过程,让你在整体层面上去观察一些现象。举个例子,某城市出现了一个传染病,因为刚出现,你知道的只有一个粗略的感染率与康复率及平均康复时间,此时你打算估算一个整体城市的康复时间(不考虑疫苗),此时就可以用ABM模拟这个动态过程。同理,也可以用在交通灯的设计上。

我一直认为在计算相对便宜的今天一味追求数据量来解决问题不如用这些计算资源去模拟复杂场景,你只要搞清楚你会怎么选,然后设计一个空间用不断反馈的动态过程来模拟一群人,最后关注整体指标就可以了。这个过程最需要的知识就是了解个体的行动决策的集合并建模,对于大多数个体行为给一个先验概率赋值并不困难,这样也就很容易对整体建模。模拟这一部分在国内大多数自然科学教材里基本都不怎么讲,但其实这是一个很好的启发式学习方法。例如把污染物迁徙看成一个传播过程,你可以很快用ABM估计出这类污染物在特定污染交互场景里能传播多久,影响多大。现实问题的复杂性并不是几个基本方程可以求解的,此时模拟一个非平衡群体过程可能让你发现之前没有注意到的东西。

结合年龄分布,理论传播与ABM,你能否探索出一些新东西?又能否付诸实践?应用中的知识才会发挥价值,要学会把实际问题抽象成同构模型。

君子不器。