分布式事务问题,无论在面试,还是工作中经常会遇到。
分布式系统下,数据一致性不再是数据库事务那么简单的。
分布式事务作为其中最复杂的挑战之一,曾让无数团队深夜加班、焦头烂额。
今天这篇文章就跟大家一起聊聊分布式事务问题的7种常见解决方案,希望对你会有所帮助。
在单体应用时代,数据库的ACID事务保证了数据一致性。
但在微服务架构下,一个业务操作需要跨多个服务、多个数据库,传统事务模型不再适用。
想象一下电商下单场景:
这四个操作要么全部成功,要么全部失败。
这就是分布式事务要解决的核心问题。
那么,如何解决问题呢?
该方案是强一致性方案。
2PC是最经典的分布式事务协议,通过协调者(Coordinator) 统一调度参与者(Participant) 的执行。
分为两个阶段:
第一阶段:准备阶段协调者询问所有参与者:“能否提交事务?”
参与者执行本地事务但不提交,锁定资源并回复YES/NO。
// 参与者伪代码
public boolean prepare() {
try {
startTransaction();
executeSql("UPDATE account SET frozen = 100 WHERE id = 1"); // 预留资源
return true; // 返回YES
} catch (Exception e) {
rollback();
return false; // 返回NO
}
}
第二阶段:提交/回滚阶段
致命缺陷:
该方案也是强一致性方案。
3PC可以解决2PC阻塞问题。
3PC在2PC基础上增加预提交阶段,并引入超时机制:
改进点:
但依然存在问题:
该方案是最终一致性方案。
它是业务层面的2PC。
TCC将业务逻辑拆分为三个阶段:
// 积分服务TCC实现
publicclass PointsService {
@Transactional
public boolean tryDeductPoints(Long userId, int points) {
// 检查用户积分是否充足
UserPoints user = userPointsDao.selectForUpdate(userId);
if (user.getAvailable() < points) {
thrownew InsufficientPointsException();
}
// 冻结积分
userPointsDao.freeze(userId, points);
}
public boolean confirmDeductPoints(Long userId, int points) {
// 实际扣减冻结积分
userPointsDao.confirmDeduct(userId, points);
}
public boolean cancelDeductPoints(Long userId, int points) {
// 释放冻结积分
userPointsDao.unfreeze(userId, points);
}
}
执行流程:
优势:
挑战:
金融核心系统首选:某银行跨境支付系统采用TCC方案,日均处理200万笔交易,跨5个服务的事务成功率99.99%
该方案也是最终一致性方案。
可以使用RocketMQ的事务消息。
RocketMQ的事务消息完美解决本地操作与消息发送的一致性问题:
关键步骤:
示例代码:
// 订单服务使用事务消息
publicclass OrderService {
@Autowired
private RocketMQTemplate rocketMQTemplate;
public void createOrder(Order order) {
// 1. 发送half消息
Message msg = MessageBuilder.withPayload(order).build();
TransactionSendResult result = rocketMQTemplate.sendMessageInTransaction(
"order_topic", msg, null);
// 2. 执行本地事务(在TransactionListener中实现)
}
}
// 事务监听器
@RocketMQTransactionListener
class OrderTransactionListener implements RocketMQLocalTransactionListener {
@Override
public RocketMQLocalTransactionState executeLocalTransaction(Message msg, Object arg) {
try {
Order order = (Order) msg.getPayload();
orderDao.save(order); // 本地事务
return RocketMQLocalTransactionState.COMMIT;
} catch (Exception e) {
return RocketMQLocalTransactionState.ROLLBACK;
}
}
@Override
public RocketMQLocalTransactionState checkLocalTransaction(Message msg) {
// 回查逻辑
return checkOrderStatus(msg);
}
}
该方案是弱一致性方案。
适用于对实时性要求低的场景(如短信通知):
// 最大努力通知服务
publicclass BestEffortNotifier {
privatestaticfinalint[] RETRY_INTERVALS = {1, 5, 10, 30, 60}; // 分钟
public void notify(String event) {
int retryCount = 0;
while (retryCount < RETRY_INTERVALS.length) {
try {
if (sendNotification(event)) {
return; // 通知成功
}
} catch (Exception e) {
// 记录日志
}
Thread.sleep(RETRY_INTERVALS[retryCount] * 60 * 1000);
retryCount++;
}
alertManualIntervention(event); // 人工介入
}
}
实战经验:支付回调采用此方案,重试8次跨12小时,99.5%的通知在30分钟内成功
该方案是自动化的TCC。
Seata的AT(Auto Transaction)模式在不侵入业务代码的前提下实现分布式事务:
核心机制:
/* 原始SQL */
UPDATE product SET stock = stock - 10 WHERE id = 1001;
/* Seata自动记录回滚日志 */
INSERT INTO undo_log (branch_id, xid,
before_image, after_image)
VALUES (?, ?,
'{"stock":100}', -- 更新前值
'{"stock":90}'); -- 更新后值
性能对比:
方案 | 锁持有时间 | 锁冲突检测耗时 | 适用场景 |
---|---|---|---|
传统2PC | 500~2000ms | 5~20ms | 低并发强一致性 |
Seata AT | 1~10ms | 0.01ms | 高并发最终一致性 |
局限:
该方案是基于本地事务的最终一致性方案。
eBay提出的经典方案:
-- 订单服务数据库
BEGIN TRANSACTION;
-- 1. 创建订单
INSERT INTO orders (...) VALUES (...);
-- 2. 记录事件(与订单在同一个事务)
INSERT INTO event_queue (event_type, payload, status)
VALUES ('ORDER_CREATED', '{"orderId":1001}', 'PENDING');
COMMIT;
-- 定时任务扫描事件表并发布
该方案在早期eBay系统中每天处理1亿+事件,保证核心交易链路最终一致
根据业务场景选择合适方案:
方案 | 一致性级别 | 性能 | 复杂度 | 适用场景 |
---|---|---|---|---|
2PC/3PC | 强一致性 | 低 | 中 | 银行核心系统 |
TCC | 最终一致 | 高 | 高 | 电商交易、积分体系 |
RocketMQ事务消息 | 最终一致 | 高 | 中 | 订单创建、物流通知 |
最大努力通知 | 弱一致 | 高 | 低 | 短信提醒、运营通知 |
Seata AT | 最终一致 | 高 | 低 | 微服务架构的常规业务 |
eBay事件队列 | 最终一致 | 高 | 中 | 内部状态同步 |
黄金法则:
经过十年演进,分布式事务解决方案已从强一致性向高性能最终一致性发展。
技术没有绝对的好坏,只有适合与否。
我曾见过团队为了追求理论上的强一致性,把系统搞得复杂不堪;也见过过度追求性能导致资金损失的血泪教训。
分布式事务的本质,是在业务需求与技术可行性之间找到平衡点。
致开发者:不必追求完美的分布式事务解决方案,适合业务场景的才是最好的。
在设计时多问自己:
愿你在分布式系统的海洋中,乘风破浪,游刃有余。