理论上最好的办法,往往是最简单的、也是最容易想到的。几何学告诉我们:两点之间直线最短;狗没有学过几何,但却知道沿着直线的方向去追兔子;几何学告诉我们,正六边形建设蜂巢时,是最节省材料的做法;蜜蜂没有学过几何,却建起了正六边形的蜂巢。
现实中有些好的办法,没有采用理论上最佳的办法。是因为不知道理论吗?不是,是理论的方法走不通!现实中是存在约束的,使得理论上最优的办法不可行。这就好比:要做到河流的对岸,直线是最短的路线。但受到河流的阻断,这条理论上最短的路线是走不通的。现实中最短的路线,可能是绕道远方的桥梁。如下图所示:
“如无必要、勿增实体”。这个原理被称为“奥卡姆剃刀”。意思是简单的就是最好的。这个原理,被无数的科技实践证明。真正热爱科技的人,往往喜欢简单的办法。喜欢显摆的人,才喜欢复杂的办法。
所以,面对一个问题(比如数学建模问题),科学的方法论应该是:首先要去想最简单、最直接的方法是什么?如果最简单直接的做法走不通,再去探讨:什么原因阻碍了这个办法的应用?原因找到之后,再去想:在存在阻碍的前提下,最简单的、次优的方法是什么?如果次优的方法仍然走不通,就再次去找到潜在的阻碍,直到找到现实中最简单的办法为止。
但是,我们许多同志,稍微遇到一点麻烦就直接采用那些复杂的方法。比如,当简单线性模型的精度不高时,就采用复杂的AI算法。他们不去考虑:导致模型误差大的原因是什么。现实往往是数据质量不理想、数据误差太大。面对数据质量的约束,复杂模型就能解决问题了?其实,复杂模型会带来更多的麻烦,最典型的就是稳定性差。
当模型稳定性差的时候,许多人不去研究导致问题的原因,统统归结为“模型可泛化性”差。岂不知:数据本身有问题时,相同的模型输入,输出可能是不一样的。今天精度高,明天就会精度低。这是可泛化性问题吗?搞科技工作的人,切不可人云亦云。
笔者经常强调回到问题的本源。如果模型问题的本源,是数据质量有问题,那就设法去解决数据质量问题。你用复杂的算法来掩盖问题,岂不是舍本取末?
我们过去一直强调理论联系实际。什么是理论联系实际?就是多花点时间去研究实际(约束和条件),少闭上眼睛搞方法。实际问题研究不透,就去找高级方法,就是理论脱离实际。
来源:仪表圈/作者:郭朝晖,工业自动化博士、教授级高工,专注于工业数字化转型及技术创新研究领域