2405 字

关于模型的模型

模型是认识论的基础,所有的模型都是在抽象描述一些事物或事物的历史,也就是说物理上至少四个维度:三维空间与时间。但我们之所以可以称为事物,是因为其区别于其他事物或真空,那么指称事物就要求其可被描述或相对稳定,不能今天是鸭子明天成了玉米,这个事物要在空间内稳定存在而事物概念本身就是依赖语义模型搭建的,不同语言各有侧重,概念不清导致的扯皮就像是鸡同鸭讲,很多人拒绝形而上的讨论,很大程度是因为有些问题定义本身就不止一个。所谓稳定存在,指的是描述上要可重复指代,这个事物可以是固定不变的,可以是周期运动的,可以是随机化的,也可以是复杂的。后面两种的区别在于随机化的事物可以整体上统计描述而很难具体描述,复杂事物则存在规律性或模式。这四种形态可以用细胞自动机这种离散模型来生成,但真实世界事物比这个复杂很多。

事物本身的规律是物理学家研究的内容,从亚原子到全宇宙。物理规律的存在让世界变得可被认识与预测。物理学中关于分子转化的那部分独立出来就是化学,化学里关注的分子中跟生命过程相关的部分就是生物。从物理到生物,规律的普适性在缩小与精准,越是普适的规律越像有用的废话,例如电磁作用力非常重要,但在描述蛋白质折叠上就不如氢键这种作用力模型来的容易懂。学科在细化过程中会针对物理世界存在事物的特性去构筑新概念,但本意应是为了方便交流描述而不是构建学科壁垒。其实,描述事物的物理模型可认为是缩小了的数理逻辑或加了限制条件的数理逻辑模型,例如数学上负数没有止境而物理上你写个零下一千摄氏度那就闹笑话了。同样的,虽然逻辑模型条理清晰易于梳理,但存在那种完全不合逻辑的事实,这个时候你改不了事实,最好考虑下是不是逻辑上漏了什么重要问题。从这个意义上看,虽然因果分析对于机理研究是非常好的工具,但如果事实收集有偏或关系错综复杂,那可能就是不能过分简化描述一件事。很多文章看似条理清晰有逻辑但事实却完全可能走另一条路,所以任何模型都不应该脱离现实世界。

现实世界的模型描述根源上都是物理模型。物理模型可以描述一个物体,也可以描述两个及以上物体间的关系。在这个基础上提出的模型可以是描述事物稳定状态下的热力学模型,也可以描述事物在时间尺度上的动力学模型。然而,物理模型的研究因为历史原因到今天都偏爱自下而上用分析后组合的描述思路,结果就是经常无法反应现实。偏综合启发性的系统论则更侧重从描述事物间的关系出发来提出模型或框架,而很多时候我们也能观察到不同事物发展规律的相似性,例如幂律分布等。不论如何,模型可视作对事物认知的一个简化思考过程,如果为了用模型而生搬硬套,那就是本末倒置让简单事变复杂了。同时,模型的简化是很主观的说法,好在现代智人都有个共同的非洲祖宗,大家都认可的主观经常有客观的现实地位,但换个文明物种故事可能会很不一样。

我们为什么用模型,很可能是因为模型减少了思考消耗,从现实的花花世界里提取出了共性与规律,这对生存非常重要。否则,我们就需要一个记忆力超好的大脑来对所有个人历史进行记录与反查。打个比方,一棵树结满了果子,如果我们大脑不能直接给出这是颗苹果树的认知,我们就得记住树枝啥样,每个树枝上挂的果子啥样,即使每个果子都长得差不多。这里苹果树的概念就是个很简单的认知模型,将我们从细节与噪音中拯救出来。因此,模型一定是抽象了概念并损失了细节信息的。知道前面有苹果树并不能告诉你哪个叶子上有虫子,而客观事物上却含有这部分信息,只不过我们这颗进化出来的大脑默默把这部分抛弃了。真实世界、模型与人的认知的关系是一层层递进的:

$$真实世界 = 认知模型+模型未捕获信息 = 人的认知+人对认知模型的理解偏差+模型未捕获信息$$

人起码都是要通过神经系统组成的生理模型来进行认识的,进一步讲则是语言模型,语言模型描述不准就因此产生偏差,配合模型本身对现实的抽象,人能认识到的世界都包含了模型的偏见与自己的偏见。自己的偏见可以通过学习或引入数学描述等方法来降低,但模型的偏见就不太好降低了。举个例子,地域歧视就是一种简化的认知模型,通过对家乡的询问来直接给出好坏判断,这个模型也许不反映现实但依旧流行,当然流行不代表就是合理。同时,模型本身也存在稳健度问题,简单的模型稳健度高但会因为对事实不敏感而描述单一,精细的模型会捕捉事实的细微变动但又因为过于敏感而描述变动很大。其实这个类似的描述在统计学里称为偏差-方差权衡,单一模型的优化实际上就是在过拟合现实与欠拟合现实中找个平衡点,然后提取出参数。当我们通过单一模型认识世界时,同样存在拟合度问题,地域歧视就是欠拟合而经验主义则常常过拟合。

如何降低模型偏见?最简单的方法就是掌握多个独立模型,也就是说,单一模型的偏见/未捕获信息会被多个模型各自独立的部分抵消/覆盖掉,实现更全面立体的认识。在历史研究中,用某某主义单一解释历史事件通常会发现伪规律,好比拿锤子找钉子类事实去论证,但螺母这类需要扳手的史实就完全忽略了,多种历史观同时使用可能更有助于还原历史事实。不论哪一种都是对事实的偏离,简单模型符合奥卡姆剃刀原则而更容易被接受,然而整体看一个完美模型应该是构建在多个独立模型的结果加权整合上的,此时模型最反映现实,但有时候人们需要看的可能不是现实而恰恰是模型过滤后的结果。不过真正原理独立的模型可能并不多,很多模型直接本就相关或者存在更本质的一致性,这类模型整合后并不会发现更新的东西。如果两个模型是互相承接的,那么其组合模型的效果应该是独立模型的乘积而非加和。同样的,如果两个模型独立描述,其整体效果相当于单一模型效果的加权,只是权重是依赖实际问题的。

$$完美模型 = 独立模型1 + 独立模型2 + … +独立模型n$$

模型永远处于接近完美而不能真正完美,因为总会有未知信息或视角我们还没发现。不过,现在人工智能的发展会导致我们可能做出一个描述超越人认知水平的模型出来,我们也许永远都无法理解其是如何运行但其预测性能却出奇的好。从工程角度看这并不问题,只是伦理上估计还得照顾下现代智人的情绪。更多的模型可以让最优点系统向以前认为的噪音部分移动,当然更多的事实或数据也会起到类似效果,现在感觉大家对更多模型的整合关注度还不够。

总之,这就是关于模型的一个认知模型。对个人而言,更多的见识与开拓眼界会有助于发现世界的复杂与累积更多的经验,而更多视角的开放态度则可以让你发现更贴合事实的综合模型。诚然,很多模型虽然独立但跟你想关注的事无关就没必要整合,说不定还带了更多方差进来,很多事就是简单规则就最实际好用,不过在认知的探索阶段,多模型有助于实现整体超越个人的效果。