摘要:谷歌最近在MySQL数据库服务中加入了向量搜索功能,这让甲骨文有点尴尬……
现在,谷歌云里的几大数据库服务,包括Cloud SQL for MySQL、Memorystore for Redis、还有那个传说中的分布式数据库Spanner,都能用上这个新技术了,虽然现在还在预览阶段,但足够让人眼前一亮。
谷歌云的数据库副总裁Andi Gutmans说,过去12年里,谷歌在向量方面创新得很快。
向量搜索是啥?简单说,就是“在海里找针”,一种能帮助你在一大堆数据中,快速定位到特定数据点的技术。特别是在搞大语言模型(LLM)的时候,这个功能能大显身手。谷歌自己早在2013年就出过一个处理语言的技术Word2Vec,算是这方面的老手了。
现在,谷歌给MySQL装上了“向量搜索”功能,简直就是在市场上偷偷摸摸地给甲骨文来了个“措手不及”,要知道根据DB-Engines的榜单,在全球主流数据库中,MySQL一直是最流行的开源数据库,拥有广泛受众,排名也就仅次于Oracle。
开源数据库支持公司Percona的技术布道者Dave Stokes透露,甲骨文似乎更多的精力都放在了HeatWave上,对社区版的MySQL支持就...嗯,有点敷衍了。
他说。“这让MySQL在其他数据库选择面前显得有点落后,比如PostgreSQL和新兴的向量数据库。社区版缺少新特性,而商业版却加入了JavaScript和向量搜索,这肯定会让社区用户考虑转向谷歌提供的替代方案。”
不过,谷歌不是唯一一个在MySQL服务中引入向量搜索的玩家。还有PlanetScale和Redis这两个服务也紧跟潮流,加入了这个功能。
Couchbase,一家分布式文档数据库公司,也在他们的服务中加入了向量搜索,看来大家都在往这个方向努力。
Forrester Research的大佬Noel Yuhanna说,现在向量搜索几乎成了任何认真的企业级数据库的标配。他预计,未来一年半内,使用向量数据库的企业会从35%增长到50%。
虽然现在只有大约22%的企业在考虑把他们的数据库搞成LLM/GenAI模式,但Forrester预计这个数字在未来两三年内会翻倍。看来,向量搜索和大数据的春天已经到来。
谷歌也没闲着,他们还在尝试把自家的GenAI模型和分析环境更紧密地结合起来。通过Vertex AI,谷歌让BigQuery的用户也能使用他们的Gemini模型,为数据提供更深层次的分析和推理能力。
Yuhanna认为,把这些技术结合起来,不仅能避免数据移动的麻烦,还能提供更深入的洞察力,改善数据治理和安全性,减少冗余数据,降低管理成本。看来,整合非结构化数据和结构化BI数据的“湖仓”概念,将是未来企业降本增效的新选择。
参考资料:
https://www.theregister.com/2024/03/04/google_vector_search_mysql/
领取专属 10元无门槛券
私享最新 技术干货