首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >架构派|专访欧冶云商数据库首席薛晓刚:从非科班到数据库专家的破壁之路

架构派|专访欧冶云商数据库首席薛晓刚:从非科班到数据库专家的破壁之路

作者头像
TVP官方团队
发布2025-08-19 13:15:00
发布2025-08-19 13:15:00
1360
举报
文章被收录于专栏:腾讯云TVP腾讯云TVP

薛晓刚采访视频

2025年7月,腾讯云架构师技术同盟与欧冶云商数据库首席、腾讯云架构师上海同盟理事薛晓刚进行了一次深度对话,以下是采访文字实录,为了您的阅读体验,我们做了不变原意的编辑。

Q:您的履历非常特别,横跨了服务器、网络、存储甚至机房装潢,这在顶尖数据库专家里非常少见。能和我们聊聊您早期的职业经历吗?”

薛晓刚: 我本科学机电,研究生读电子通信,你可以看到和我现在的工作其实是几乎是一点不相关的,我现在做的是做数据架构。其实说来纯属巧合,初入职场时,我当时的领导给我安排了一个任务,说:“小薛你去把 Oracle 装一下”。当时我根本没有听过这个单词,那是我第一次接触数据库。这段经历让我意识到:技术人必须直面未知 。

我第一个公司是做公安行业,在公安系统集成项目中,我接触过服务器部署、程控交换机调试,甚至手绘过城市矢量地图支撑实时警情调度。我们用地图软件去看一张地图,它是一张静态图片,但矢量图片就是可以在这个图上有标注向量,我曾经手绘过一个地级市的矢量图。最后我们在矢量图上标注出车道。有人报警,我们能确定周围有哪些警车,我们可以在前面画一个包围圈,让相关的警力去那里进行围堵。这些所有的后台,都是与数据库相关的,道路拥堵的显示也是根据这些数据算出来的。所以我第一份工作做的是公安行业的一个大的系统集成,这些和我在学校里学的都没有关系。我的所有都是从我第一份工作慢慢开始积累起来的。

Q:那是什么契机,让您在2010年下定决心,要一头扎进‘数据库’这个深水区呢?在那么多您熟悉的领域里,为什么偏偏是它?

薛晓刚:因为工作了几年以后,当我有了一定的积累,我意识到自己需要有一个主要的方向,不能再这么分散,当时的自己主动地去评估了很多方向,最后认定数据库在将来的发展会更好。

为什么当时我会这样想?曾经我们做过光像 CCTV 的监控,当时很多东西都是模拟信号,后来都变成数字信号了。我就觉得连摄像机都是从模拟转向了数字,未来更多的东西也可能会终究转向数字。最终我认定了数据库这条路能走得更长远一点,从此一头扎进数据库领域。

Q:“这段‘万花筒’般的经历,对您后来排查和解决数据库问题,带来了哪些科班出身的专家可能不具备的独特视角?有没有一个案例,是被您用这些经验‘破案’的?”

薛晓刚:有的,因为我当年做的系统最大的一个特点就是并发程度非常高。你试想一个场景,当一个路口的绿灯亮起来,双向几个车道,一亮灯所有车就同时过去。但每辆车,十几年前的公安的要求是全部记录,无论是机动车还是非机动车,不只会有闯红灯或超速记录,而是将所有全部记录。这些数据是要拿去做分析的,这是一个城市的路口,像这种路口会有多少?以上海为例,不会少于5000个。而在高峰时刻,每秒的写入都是成千上万的写入,如何设计好一个能支持高并发的系统,这对当时的我是一个挑战。

要处理这么一个场景,对于公安来说,至少要存三个月的数据。我以前处理一个表,大概要几百亿数据,而表单可能会达到几十t到上百 t的规模。现如今很多传统行业,它可能连十几年的数据都没有,并发程度也没有这么高。我在公安行业积累的这些东西在我日后的工作中都是可以复用的。

我的第二个转折点就是做优化。当时我来到第二家公司上班,我看了现有的系统后,我给了他一堆建议,因为有很多地方都要修改,你有没有兴趣猜一下,修改之前是 15 个小时,我改完后它提速了多少倍?

最后是 6 秒,是 9000 倍。这是我 2014 年做过最高的纪录,当时所有的技术团队都已经惊呆了,他说怎么会这样?我说这才是一个真实的应有的状态。所以从那一刻开始,我在第二个公司入职的第二天就帮他们解决了大问题。以后所有开发团队的遇到了相似的问题都来找我,这就是我的一次翻身仗,就等于立足。

Q:接下来,我们想聊聊那段最经典的‘战役’——把一个年均12次故障的系统,做到全年0故障。能和我们讲讲您的经验吗?

薛晓刚: 这段经历与我的工作调动有关。当时我所在的是下级公司,因上级公司领导赏识,被调至上级公司负责处理原与我平级的各公司系统。调任后,首要任务是解决系统稳定性问题——尽管此前系统已有高可用设计,但实际运行中仍不稳定。

我像医生翻看病历一样,查阅了历史故障记录,发现多数问题与数据库相关,且根源在于设计和实现的不当。以系统锁问题为例,部分技术人员对锁的类型和构成不清晰,处理时已有些麻木。我通过捕获后台运行状态,定位问题后,联系了一位熟悉各项目团队的总监,由其协调对应开发团队落实改进。调整后,系统负荷从80%降至约5%,稳定性显著提升。

按此方式解决的系统中,一年内基本未再出现数据库相关故障。这也让我在调任过程中站稳脚跟,因为切实解决了各团队的痛点,甚至后续领导的朋友遇到系统问题时,也找我协助。通过这些案例,各开发团队逐渐信服我的能力——按我的建议改进后问题均被解决,我做出承诺“若按我说的做出了问题,责任算我的”。这也成为我职业发展的重要转折。

Q:那么您是如何定位到这些问题的?

薛晓刚: 首先我们要谈到一个概念,叫做可观测性。有些公司或者团队里,他并不一定能够深入的了解什么是可观测性,为我们监控了一套系统,随着时间的推移,你可以看到它的各项指标——几条像心电图一样的线。可是数据库它不一样,虽然也有高有低。但我们要想知道在这个波峰期间,到底是哪些应用的请求让它高或低,精确的把它们识别出来,那是需要一套系统来监测的。如果没有系统的时候,就要凭经验了。

用一句网上流行的话,“我的眼睛就是尺”。一个语句,别人可能需要用一些工具来给语句打分,我只要扫一遍,我就什么都知道了。哪怕这个语句写的没问题,但是我依然能感觉到业务逻辑是否出错,这与我多年的经验有关。

怎么能够去凭经验去判断问题?必备的前提条件是:让你的技术经验,达到一定程度后成为业务经验。我们昨天的会议上,有个老师说的话令我印象深刻:“大家最后都是用 AI,那我们能跟别人拉开差距的点,在于对自己的垂直领域有没有非常深刻的理解。”

Q:如今技术更新如此迅速,技术工作者必须要持续学习,您是怎么做到保持持续学习的状态的。

薛晓刚:自驱力肯定是要有的。如果说你现在是一个舒适的想躺平的状态,那的确怎么说都没有用。要有一定的自驱力和一些危机感,这样就迫使你去了解。唯一不变的是变化,我们谁也不知道将来会怎么样,只有去学习。业内有句话说,计算机行业是唯一一个比时装行业概念更多的一个行业。可能打开一下你的朋友圈,都会看到一些新的概念。如果不去了解,技术人就会被时代淘汰。我是抱着这种心态不断地去学习。自从加入 TVP 和架构师同盟后,我每天看着群里大家聊天的消息,我就能够学习一个名词来,如果这个名词我不知道,我就会感觉到很羞耻,赶快去查一查这个是什么。

我还有一个比较好的经验可以分享给大家。每年有各式各样的跟技术相关的大会,只要有机会我就去参加,哪怕是自费。在这些会上我结识到了很多业内的(像腾讯、阿里、京东的)技术专家,我结识到他们后,每天去看他们在干什么,他们在研究什么?他们在怎么样思考问题?然后我就明白我们中国最前沿的一部分技术是什么了。

我自认为我是走了十年弯路的,最终也是通过这样的一个途径获得成长。像我每年都去北京参加几个技术大会。北京的两会是人大跟政协,但对于我来说,参加技术大会,这就是我生命的两会。

还有就是要参加到技术团体中去,比如我们的「腾讯云架构师技术同盟」,你要看到这里有着代表了国内最先进的技术水平的人。那么其中成员们在探讨的东西,哪怕在工作中遇不到,我也会私下里去学习或尝试的运用一下。时间久了,也就融入到这个团队中去了。当加入到技术组织,我认识 A,A 认识 B,大家的社交关系都扩大了。

Q:AI究竟是我们的协助者还是替代者?开发者该恐惧AI还是拥抱它?

薛晓刚:面对AI,我也焦虑——焦虑学不完新技术!(笑)但想清楚一点就不慌:

首先,有一些事情是我们能做 AI 也能做的,那这部分其实也没什么可说的。剩下有一部分是 AI 能做,我们不能做的,这就是我们的短板;在AI 无法替代的领域中,AI 不能做,我们能做的,那这个就是我们的价值。

要先保证我们有价值,再利用AI提升我们的短板。昨天的腾讯云上海架构峰会上也提到了要与AI共生共存,我们跟 AI 不是竞争关系,如果去跟AI抢AI 擅长的事情,必然是抢不过的,那我们只要把体现自己价值那一部分用好。AI当然在未来还有另外一种可能性,是我们要去探索的,这是我们希望大家加入同盟后一起做的事情。

Q:如果让您回头看自己这条“非典型”但无比精彩的职业道路,用一句话给那些同样在技术路上奋斗、偶尔感到迷茫的年轻朋友们一些建议,您想说什么?

薛晓刚:我会说,坚定自己的技术路线,找志同道合的人,我们一起走下去。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云TVP 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档