在中国数据库时代,经常听到“开源套壳”这个词。这是说国产数据库厂商,通过对开源数据库进行改造,而推出自有的数据库产品。
一度,很多舆论声音在反对这种形式。部分原因是,基于开源的产品,成本低、售价低,对数据市场造成了一定的价值影响。
甚至,这些产品被冠以扰乱数据库市场,影响中国数据库产业发展的罪魁祸首。甚至有言论表达,“只有自研数据库”才算“国产数据库”。
然而换了一个赛道就完全不同了,当 DeepSeek 将自身对于大模型的理解创造开源之后,甚至图灵奖获得者杨立昆都站出来表示:“DeepSeek的成功并非表明中国在人工智能领域超越美国,而是开源模型正在超越专有模型。”
那么回到数据的世界,过往的历史是怎样的呢?我在《数据库简史》中绘制了一张数据库产品的路线图,其中在 Ingres 的路线上的产品图谱是如下这样的。
也就是说,从全球看,迈克尔·斯通布雷克所开创的 Ingres 数据库,通过开源,随后衍生了一系列的“开源套壳”数据库产品。这其中包括Sybase SQL Server、PostgreSQL、Microsoft SQL Server等。以及一系列国产数据。斯通布雷克也多次表示:开源数据库让数据库领域的后来者,可以有一个高起点,不必一切从头开始,从而可以节省数百万的启动资金,开源让很多创业成为可能。
那我们反对的是什么?对于“开源套壳”,我们应该反对的是,“仅仅套个壳”。而我们应当鼓励的是,基于开源的应用、发展、反馈、创新。
历史上 Microsoft SQL Server 的最初源代码是源自Sybase SQL Server,但是微软随后构建了强大的人才队伍,用于发展自身的数据产品,这个人才团队就包括来自DEC RDB团队的哈尔•贝伦森(Hal Berenson)、彼得•斯皮罗(Peter Spiro)、大卫•坎贝尔(David Campbell)等人;来自IBM的詹姆斯•汉密尔顿(James Hamilton)、卢博尔•科拉(Lubor Kollar)等人;来自Oracle的比尔•贝克(Bill Baker)、佩德罗•塞利斯(Pedro Celis)和天腾的帕特•海伦(Pat Hellan)。此外,微软还为研发团队配备的最好的研究人员,包括吉姆•格雷、菲尔·伯恩斯坦(Philip Bernstein)等。
这些故事写在《数据库简史》一书中,有详细的讲述,请大家支持收看:
有了最好的团队,持续的投入,事实上Microsoft SQL Server重生为一个完全不同的产品,也就不再有人计较微软的 “Sybase 套壳”了。
今天,几乎所有的云数据库都是基于开源数据库的改造“套壳”,AWS的 Aurora,Google的AlloyDB等,都因其创新进化而被铭记和采用。
关键在于需求。
中国数据库市场上,当用户的需求真正涌现出来之后,不同的产品通过不同角度、场景和售价满足用户的不同需求,这才是健康的生态。
基于开源的数据库,甚至仅仅进行易用性、安全性的改造,合规开源规则的进行市场化销售,能够解决用户的“真实需求”,那么开源数据的应用应该被大力支持和提倡。
有了商业数据库,中国数据库市场也一定需要“开源数据库”,开源改变了数据库的世界,开源也改变了人工智能的世界。
中国的数据库通过开源,也一定能够像 DeepSeek 那样,快速的影响和改变世界,TiDB、openGauss 都在进行这样的探索。
云和恩墨大讲堂 | 一个分享交流的地方
长按,识别二维码,加入万人交流社群
请备注:云和恩墨大讲堂