Postgre 的实现始于 1986 年。第一个“演示性”系统在 1987 年便可使用了, 并且在 1988 年的 ACM-SIGMOD 大会上展出。
1989 年 6 月,Postgre 版本 1 正式发布,并开放给一些外部的用户使用。 为了回应用户对第一个规则系统的批评,1990 年 6 月,使用了新规则系统的 Postgre 版本 2 正式发布。
Postgre 版本 3 在 1991 年出现,增加了多存储管理器的支持, 并且改进了查询执行器、重写了规则系统。为了避免占用过多的研究实践,伯克利的 Postgres 项目在版本 4.2 时正式终止。
在 1994 年,Andrew Yu 和 Jolly Chen 向 Postgres 中增加了 SQL 语言的解释器,并随后用新名字“Postgres95”将源代码发布到互联网上供大家使用,成为最初 Postgres 伯克利代码的开源继承者。
到了 1996 年,很明显“Postgres95”这个名字已经跟不上时代了。于是伯克利 Postgres 项目选择了一个新名字PostgreSQL来反映与最初的 Postgres 和最新的具有 SQL 能力的版本之间的关系。
同时版本号也从 6.0 开始,将版本号放回到最初由伯克利 Postgres 项目开始的序列中。这就是我们现在看到的 PostgreSQL 系列。
目前,PostgreSQL 已经发展成了全球最受欢迎的开源数据库之一。PostgreSQL 和MySQL这两个领先的开源关系型数据库的使用率分别是 46.5%和 45.7%,而 Oracle 只有大约 12%的开发者使用,DB2 的使用率只有 2%。专业开发者比那些正在学习编写代码的开发者更有可能使用 Redis、PostgreSQL、Microsoft SQL Server 和 Elasticsearch。
由此可见,在全球开发者中,开源数据库的受欢迎程度远高于商业数据库。但开源数据库相较于商业软件也有着明显缺陷:支持性差、部署难度大、更容易发现漏洞、更易被攻击等。
为了解决开源数据库存在的种种弊端,一些基于开源数据库的商业公司应运而生。
但要想成功运营,也并非容易事。
运营一家基于开源数据库的商业公司到底会面对哪些挑战?开源服务的价值是什么?Postgres 和商业版本 Postgres 相比有哪些明显的优势?
带着这些问题,我们采访了数据库平台提供商 EnterpriseDB (EDB)公司总裁兼 CEO Ed Boyajian,请他来聊一聊全球数字化转型大背景下,PostgreSQL 开源数据库及商业版本未来将走向何方?
Ed 在数据库领域深耕多年,为 EDB 公司制定出并引导执行一系列增长策略。Ed 曾在 Red Hat 效力 6 年并晋升为北美副总裁兼总经理,随后于 2008 年加入 EDB。依托于强大的核心领导能力,他将开源精神引入企业的现代商业模式。在Red Hat任职期间,他曾担任 OEM 业务副总裁,负责管理惠普、IBM 及戴尔等 Linux 客户的合作伙伴关系。
作为参与开源软件运动 15 年以上的资深专家,Ed 也是一位经验丰富的企业软件主管。在他看来,EDB 首先需要优先关注技术,之后才有资格领导开源数据管理生态系统。他坚信伟大的技术高于一切,正是凭借这样的信念,他推动着 EDB 一路走到今天。
Ed 还坚信在开源和商业软件/硬件生态系统中建立投资合作伙伴关系的重要性。Ed 曾任美国陆军上尉,并接受过空降兵训练。在 EDB 公司,他指导并鼓励每一位员工磨练自己的领导技能。Ed 总是有着不竭的热情、充沛的精力和出色的战略领导力。
以下为 InfoQ 与 Ed Boyajian 的访谈实录,经编辑。
InfoQ:您在数据库领域深耕多年,是否遇到过一些技术挑战?
Ed Boyajian:在我们看来没有真正的挑战,所谓挑战只是机遇的另一种形态。
PostgresSQL 的普及还面临着很多非技术挑战,主要是意识、员工教育和培训。总之,就是需要企业高管进行变革引导、发挥领导能力的各个领域。
我们的全托管云产品 BigAnimal 就是专为解决现有云 Postgres 产品所面临的挑战而生。大型企业需要一定的透明度和性能保障,才能放心把关键任务应用程序交由云端运行。为了满足需求,我们在云端建立起首个全托管的 Postgre 数据库,这意味着客户能够体验到与Oracle技术原生兼容、极高的可用性和对数据库的精细控制。现在,客户已经可以跨多个云环境运行统一的 PostgresSQL。
InfoQ:最初,您对技术的兴趣从何而来?
Ed Boyajian:我一直想用科技简化日常生活。虽然我在九十年代末才进入软件行业,但之前出现的那些酷炫技术我可一个都没错过。80 年代那会,我还买过原装的苹果 Macintosh,它用鼠标就能完成图形操作的强大功能给我留下了深刻印象。从那一刻起,我知道生活将就此改变。这对我来说,也成为后来一切探索的起点。真希望我能好好留着那台 Mac。
InfoQ:技术一直在迅速发展,作为技术人员,您是怎么与最新技术保持同步的?
Ed Boyajian:我一直很敬重 EDB 那些才华横溢的技术伙伴们。我一直觉得自己是技术方面的“学徒”,所以我会虚心跟客户交流、关注宏观技术趋势,并结合这些背景与 EDB 的PostgresSQL技术主管们合作,再定期阅读期刊杂志。这些好习惯,让我始终都对未来保持着一定的了解。
InfoQ:您在 EDB 担任管理岗位多年,您是如何吸引并挽留技术人才的?
Ed Boyajian:大家都希望能加入到具备市场影响力的企业当中。这种影响力始于在细分市场上的领导地位,而且会延伸到软件产品的领导地位。EDB 在Postgres数据库这块细分市场上就具有领导地位。
其次,人们都喜欢有亲和力的企业,喜欢那种会优先考虑团队福祉的公司。在拥挤的技术人才市场上,员工最需要的是个人的成长机会和接触新兴技术的可能性,EDB 就能很好地满足这两个条件。根据我们最近的开源人才调查,去年考虑辞去当前岗位、转而投身前沿技术的员工数量翻了一番。
InfoQ:目前全球数据库市场上几百款数据库产品,您认为 PostgreSQL 为什么能取得成功?
Ed Boyajian:在开源领域,大家有个常见的误解,就是大家觉得开源项目会缺少完整易读的说明文档,所以必然导致开发延迟。某些开源项目确实是这样,但 PostgresSQL 没有这样的问题。
1996 年,加州大学伯克利分校在设计 PostgresSQL 时,设计团队也考虑到了底层数据模型的可扩展性。当时的数据库只能支持非常简单的数据类型,例如数字、字符串和日期。Postgres 创始人、EDB 的杰出顾问和战略家之一 Michael Stonebreaker 及其团队则做出一项影响深远的决策,让 PostgresSQL 更易于添加新的数据类型及相关操作。
例如,PostGIS 就是 PostgresSQL 的一个扩展,能够轻松处理地理数据元素、多边形、路线等数据。仅此一点,就让 PostgresSQL 成为地图系统领域的首选解决方案之一。其他重要扩展还包括文档存储(JSON)和键值对(HSTORE)。
这种可扩展的数据模型和良好的云端运行能力,为 PostgresSQL 开发人员赋予了极大的生产力创新能力空间。这是 PostgreSQL 取得成功的关键因素之一。
InfoQ:目前市场上的数据库种类繁多,那 Postgres 和 Postgres 企业版有哪些明显的优势?
Ed Boyajian:EDB Postgres 在各类关键环境中优于其他数据库,主要体现在技术/性能灵活性,以及在广泛企业工作负载和价值诉求中的适用性。而这些优势的核心,就在于开源。
像甲骨文这样的占有遗留数据库在市场上仍占有 400 亿美元左右的市场份额,但它在技术上已经不再优于 Postgres,反而给企业用户带来了不合理的运营成本。
以数据中心基础设施和硬件专业服务为核心的各大新云服务商,也在积极涉足软件业务,其中当然也包括 Postgres。然而,这些供应商并不是数据库专家,所以企业客户往往不敢贸然选用。PostgresSQL 本身缺乏专业服务,再加上混合和多云解决方案构成的应用门槛,导致 PostgresSQL 在市场推广上一度受阻。
专用 NoSQL 数据库最适合那些有针对性的用例,但这同时意味着其可扩展性较差,无法处理更为复杂的企业级应用工作负载。此外,绝大多数专用 NoSQL 数据库都被一家企业所垄断,所以未来的发展潜力也比较有限。
PostgresSQL 是真正的开源数据库,拥有独立且强大的全球管理社区。借助 EDB,PostgresSQL 的功能得到显著增强,能够提供无与伦比的灵活性、可扩展性和成本优势。
InfoQ:数字化转型已经成为全球最热门的议题,PostgresSQL 又能在企业的数字化转型进程中发挥哪些积极作用?
Ed Boyajian:PostgresSQL 是数字化转型领域的优先选择的数据库,因为它的应用程序支持范围最广。组织不仅能够在 PostgresSQL 上构建新应用程序,而且还能轻松把遗留数据迁移至其中。
市场的内在挑战、猛烈的通货膨胀和持续攀升的利率水平,迫使企业加快推进业务转型。组织正转向开源模型,借此在市场上保持竞争优势与业务地位。在这样的背景下,PostgresSQL 成为众多企业的优先选择。PostgresSQL 能够提供符合遗留系统的同等功能,甚至还有所扩展,同时保证更好的成本效益。
综合来看,PostgresSQL 已经成为全球使用最广、最符合现实需求的数据库。根据 Stack Overflow 的开发者调查,Postgres 数据库在 2022 年及之后将迎来指数级的市场份额增长。Postgres 也被 Gartner 认定为约 800 亿美元总体数据库市场上,增长速度最快的数据库管理系统。
EDB 拥有 300 多名专职开发人员和三成以上的 PostgresSQL 代码贡献比例,成为 Postgres 最主要的技术创新源头。我们连续 50 个季度的业务增长,也证明了 PostgresSQL 为企业带来的持久价值。
InfoQ:您能给我们介绍几个使用 PostgresSQL 数据库实现数字化转型的具体案例吗?
Ed Boyajian:新加坡一家头部保险公司就完成了一项数字化转型计划,目的是将现有应用程序迁移至现代平台。该公司的保险产品涵盖保护、储蓄和投资等多个领域,各产品通过国际银行等多渠道分销网络进行交付。因此,这项转型计划着重强调保险公司与该国际银行间的数据交换,希望以双方协同的方式迅速扩大在东南亚市场上的份额占比。
这家保险公司与合作银行之间的银行业务,主要以定期发送电子邮件的方式交换保险业务信息。由于数据格式不符合行业认定的标准或代码共享标准,因此大量电子邮件永久被遗忘在邮箱的角落。这套系统需要持续不断地人为干预,因此显著增加了维护和管理成本,并最终导致销售延迟、响应时间过长和业务流失。
我们的合作伙伴 Ashnik 为他们设计了符合行业标准、强大、可扩展、自动化且近实时的数据交换解决方案,于是这家保险公司得以用 XML SOAP 消息同合作银行快速交换信息。通过与 EDB 合作,Ashnik 得以设计出高度优化的数据模型,并整合不同来源的数据以保证一致性。此外,EDB Postgres Advanced Server(EPAS)还提供一套可靠且强大的错误处理与数据协调框架。以开源 PostgreSQL 为基础,Ashnik 得以轻松将数据库平台同 Pentaho 企业版相集成,生成复杂的多级 XML 消息提要。
EPAS 可以集成 XML 和 NoSQL 格式的数据,以确保数据质量的同时简化标准流程。EPAS 严格遵循美国国家标准协议(ANSI)和国际标准化组织(ISO)采用的 SQL 标准,为负责处理关键业务和敏感数据的保险企业提供必要保证,承诺代码在当下和将来始终拥有支持、易于支持。
通过数据整合和标准化,这家保险公司已经能够以近实时方式交换信息,同时显著降低由人工干预产生的成本。
InfoQ:作为 Postgres 社区最大的贡献者之一,你是如何看待开源的?你认为开源服务的价值是什么?
Ed Boyajian:开源项目及其贡献者代表着软件创新领域的新标杆。整个世界曾经转向 Linux、也曾经转向 Kubernetes,现在则开始转向 Postgres。这一切都不是偶然,而代表着更好的软件形态和行业标准发展方式。
业界已经将开源成果作为 IT 堆栈中的关键组件。随着 Linux 的大获成功以及开源数据库在非关键任务解决方案(例如分析和社交媒体平台)上的迅速普及,开源项目现在开始迅速取代各类传统数据库管理系统,尝试接管作为业务核心的(事务)关键任务解决方案。
现代应用程序也在推动业务创新,支持与传统应用完全不同的全新应用程序形式。随着数据总量的爆炸式增长,开源使组织能够充分发掘经济效益,以更低廉的数据管理成本支持业务盈利。此外,现代应用程序还需要能在任何位置、任何云、任何虚拟机乃至任何数据中心内运行。随着用户和事务规模的增长,组织还希望数据库的可用性能根据需求灵活浮动。
InfoQ:对于想基于开源软件提供服务的企业,您有哪些建议给他们?
Ed Boyajian:请先把“回报”的观念放一放,着力建立起无条件支持开源项目的文化。要随时间推移始终保持这个承诺,别用几个月来衡量收益,而是要把眼光延伸到几年甚至几十年的周期。我们也是这样,始终如一地投入时间、精力和资源,不计回报。
领取专属 10元无门槛券
私享最新 技术干货