TCC概述和解决方案

发布于 2022-04-30  1.82k 次阅读


一,TCC的概述

TCC是Try,Confirm,Cancel三个词语的缩写,TCC要求每一个分支事务实现三个操作:预处理Try,确认Confirm,撤销Cancel

  • Try:进行业务的检查及资源预留,
  • Confirm:做业务确认操作
  • Cancel:实现一个与Try相反的回滚操作

  TM首先发起所有的分支事务try操作,任何一个分支事务的try操作执行失败,TM将会发起所有分支事务的Canel回滚操作,若try操作全部成功,TM将会发起分支事务的Confirm操作,其中Confirm/Cancel操作若执行失败,TM会进行回退直到Try成功或者失败

TCC基于2PC但在基础上做了优化应用

TCC分为三个阶段:

  1. Try阶段:做业务检查(一致性)及资源预留(隔离),此阶段仅是一个初步操作,它和后续的Confirm一起才能真正构成一个完整的业务逻辑
  2. Confirm阶段:确认提交,Try阶段所有分支事务执行成功后开始执行,通常情况下,采用TCC则认为Confirm阶段是不会出错的,即:只要Try成功,Confirm一定成功,若Confirm阶段出错需要引入人工处理
  3. Cancel阶段:在业务执行错误需要回滚的状态下执行分支事务的业务取消,预留的资源释放,通常情况下,采用TCC则认为Cancel阶段也是一定成功的,若Cancel阶段真的出错了,需要引入重试机制或人工处理

TM事务管理者可以实现独立的服务,也可以让全局事务发起者充当TM的角色,TM独立出来是为了成为公用组件,主要为了考虑系统结构和软件复用

  TM在发起全局事务时生成全局事务记录,全局事务ID(XID)贯穿整个分布式事务调用链条,用来记录事务上下文,追踪和记录状态,由于Confirm和Cancel失败需要重试,因此需要实现幂等性

二,TCC的解决方案

目前市面上的TCC框架众多比如有如下几种:

框架名称
GitHub地址
tcc-transcation
Hmily
ByteTCC
EasyTranscation
Seata
   Seata也支持TCC,当Seata的TCC模式对Spring Cloud并没有支持,在这些框架中大多都要独立TC事务协 调者,而Hmily很轻量级不需要独立TC,所以使用Hmily

  Hmily是一个高性能分布式事务TCC开源框架,基于java语言来开发(JDK1.8),支持Dubbo,Spring Cloud等RPC框架进行分布式事务

Hmily的特性:

  • 复杂场景:支持嵌套事务(Neste
  • d transaction support)
  • 采用disruptor框架进行事务日志的异步读写,与RPC框架的性能毫无差别
  • 支持SpringBoot-starter项目启动,使用简单
  • 高可靠性:支持分布式场景下的异常事务回滚,以及随时间推移的异常恢复,防止事务暂停8
  • 可用性:p零侵入,快速与业务系统集成Spring-Boot,Spring-Namespace
  • 高性能:d集中式设计,与业务系统完全集成,自然支持集群部署
  • 可观察性:指标多个指标性能监控,管理员管理后台UI显示
  • 各种 RPC :Dubbo,SpringCloud,MotanSofa-rpcbrpctars
  • 日志存储:mysql,oracle,mongodb,redis,zookeeper

  Hmily利用AOP对参与分布式事务的本地方法与远程方法进行拦截处理,通过多方拦截事务参与者能透明的调用到另一方的Try,Confirm,Cancel方法,传递事务上下文,并记录事务日志

Hmily不需要事务协调服务,但需要提供一个数据库(mysql/mongodb/zookeeper等)来进行日志存储

  Hmily实现的TCC服务与普通的服务一样,只需要暴露一个接口,它就是它的Try业务,Confirm/Canel业务逻辑,只是因为全局事务提交/回滚的需要才提供的,因此Confirm/Cancel业务只需要被Hmily TCC事务框架发现即可,不需要被调用它的其他业务服务所感知

TCC实现需要注意三种异常处理:

  • 空回滚
  • 幂等
  • 悬挂

1,空回滚

  在没有调用TCC资源Try方法的情况下,调用了二阶段的Cancel方法,Cancel方法需要识别出这是一个空回滚,然后直接返回成功

  出现空回滚的原因:当一个分支事务所在服务宕机或网络异常,分支事务调用记录失败,没有执行Try阶段的,当故障恢复后,分布式事务进行回滚则会执行二阶段的Cancel方法,从而形成空回滚这个时候其实是

  解决思路是关键要识别出这个空回滚,思路很简单就是需要知道一阶段是否执行,如果执行了,那就是正常回滚,如果没有执行那就是空回滚,前面已经说过TM在发起全局事务时会生成全局事务记录,全局事务ID贯穿整个分布式事务调用链条,再额外增加一张分支事务记录表,其中有全局事务ID和分支事务ID,第一阶段Try方法里面会插入一条记录,表示一阶段执行了,Cancel接口里读取该记录,如果该记录存在,则正常回滚,如果该记录不存在,则是空回滚

2,幂等

  通过前面介绍已经了解到,为了保证TCC二阶段提交重试机制不会引发数据不一致,要求TCC的二阶段Try,Confirm,Cancel接口保证幂等,这样不会重复使用或者释放资源,如果幂等控制没有做好,很有可能导致数据不一致等严重问题

解决思路再上述"分支事务记录"中增加执行状态,每次执行前都查询该状态

3,悬挂

悬挂就是对于一个分布式事务,其二阶段Cancel接口比Try接口先执行

出现原因:在RPC调用分支事务Try时,先注册分支事务,在执行RPC调用,如果此时RPC调用的网络发生拥堵,通常RPC调用是有超时时间的,RPC超时以后,TM就会通知RM回滚分布式事务,可能回滚完成后,RPC请求才到达参与者真正执行,而一个Try方法预留的业务资源,只要该分布式事务才能完成,该分布式事务第一阶段预留的业务资源就在也没有人能够处理,对于这种情况就称为悬挂

解决思路:如果二阶段执行完成,那一阶段就不能再继续执行,再执行一阶段事务时判断在该全局事务下"分支事务记录"表是否已经有二阶段事务,如果有则不执行Try

举例:场景为A转账100给B,A和B账户在不同的服务

① 账户A

try:
    检查余额是否够100
        扣减100元
confirm:
    空
cancel:
    增加100元

② 账户B

try:
    增加100
confirm:
    空
cancel:
    减少100元

方案的说明:

1)账户A,这里的余额就是所谓的业务资源,按照前面提到的原则,在第一阶段需要检查并预留业务的资源,因此,我们在扣钱,TCC资源的Try接口先检查A账户余额是否足够,如果足够则扣除100元,Confirm接口表示正式提交,由于业务资源已经在Try接口里扣除掉了,那么在第二阶段的Confirm接口里可以什么都不做,Cancel接口的执行表示整个事务回滚,账户A回滚则需要把Try接口里面扣除的100块还给账户

2)账户B,在第一阶段Try接口里实现给账户B加钱,Cancel接口的执行表示整个事务回滚,账户B回滚则需要·把Try接口里加的100减去

存在的问题:

  1. 如果账户A的Try没有执行,那么直接执行Cancel则多加了100
  2. 由于Try,Cancel,confirm都由单独的线程调用,且会出现重复调用,所以都需要实现幂等
  3. 账户B在Try中增加100元,当try执行完成后可能会被其他线程给消费
  4. 如果账户B的try没有执行在Cancel则多减了100

问题的解决:

  1. 账户A的Cancel方法需要判断try方法是否执行,正常执行try后可执行Cancel
  2. try,cancel,confirm方法实现幂等性
  3. 账户B在try方法中不允许更新账户金额,在confirm中更新账户金额
  4. 账户B的Cancel方法需要判断try方法是否执行,正常执行try后才可执行cancel

优化后的方案:

① 账户A

try:
    try幂等性效验
    try悬挂处理
    检查余额是否够100
    扣减100元
confirm:
    空
cancel:
    cancel幂等性效验
    cancel空回滚处理
    增加100元

② 账户B

try:
     空
confirm:
    confirm幂等性效验
    正式增加100
cancel:
   空

三,Hmily框架实现TCC

项目资源:https://www.aliyundrive.com/s/6kCeXqwH2ES 

提前码:4t7l

一,前期准备

本实例通过Hmily实现TCC分布式事务,模拟两个账户的转账交易过程。

两个账户分别在不同的银行(张三在bank1、李四在bank2),bank1、bank2是两个微服务。交易过程是,张三给

李四转账指定金额。

上述交易步骤,要么一起成功,要么一起失败,必须是一个整体性的事务

微服务及数据库的关系 :

dtx/dtx-tcc-demo/dtx-tcc-demo-bank1 银行1,操作张三账户, 连接数据库bank1

dtx/dtx-tcc-demo/dtx-tcc-demo-bank2 银行2,操作李四账户,连接数据库bank

一,创建数据库

导入数据库脚本:在项目资源的SQL文件中

1,创建hmily数据库,用于存储hmily框架记录的数据。

CREATE DATABASE `hmily` CHARACTER SET 'utf8' COLLATE 'utf8_general_ci';

2,创建bank1库,并导入以下表结构和数据(包含张三账户)

CREATE DATABASE `bank1` CHARACTER SET 'utf8' COLLATE 'utf8_general_ci';
DROP TABLE IF EXISTS `account_info`;
CREATE TABLE `account_info`
(
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`account_name` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin NULL DEFAULT NULL COMMENT '户
主姓名',
`account_no` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin NULL DEFAULT NULL COMMENT '银行
卡号',
`account_password` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin NULL DEFAULT NULL COMMENT
'帐户密码',
`account_balance` double NULL DEFAULT NULL COMMENT '帐户余额',
PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 5 CHARACTER SET = utf8 COLLATE = utf8_bin ROW_FORMAT =
Dynamic;
INSERT INTO `account_info` VALUES (2, '张三的账户', '1', '', 10000);

3,创建bank2库,并导入以下表结构和数据(包含李四账户)

CREATE DATABASE `bank2` CHARACTER SET 'utf8' COLLATE 'utf8_general_ci';
CREATE TABLE `account_info`
(
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`account_name` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin NULL DEFAULT NULL COMMENT '户
主姓名',
`account_no` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin NULL DEFAULT NULL COMMENT '银行
卡号',
`account_password` varchar(100) CHARACTER SET utf8 COLLATE utf8_bin NULL DEFAULT NULL COMMENT
'帐户密码',
`account_balance` double NULL DEFAULT NULL COMMENT '帐户余额',
PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 5 CHARACTER SET = utf8 COLLATE = utf8_bin ROW_FORMAT =
Dynamic;
INSERT INTO `account_info` VALUES (3, '李四的账户', '2', NULL, 0);

4,每个数据库都创建try、confirm、cancel三张日志表:

CREATE TABLE `local_try_log` (
`tx_no` varchar(64) NOT NULL COMMENT '事务id',
`create_time` datetime DEFAULT NULL,
PRIMARY KEY (`tx_no`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
CREATE TABLE `local_confirm_log` (
`tx_no` varchar(64) NOT NULL COMMENT '事务id',
`create_time` datetime DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
CREATE TABLE `local_cancel_log` (
`tx_no` varchar(64) NOT NULL COMMENT '事务id',
`create_time` datetime DEFAULT NULL,
PRIMARY KEY (`tx_no`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

dtx/dtx-tcc-demo/dtx-tcc-demo-bank1 银行1,操作张三账户,连接数据库bank1

dtx/dtx-tcc-demo/dtx-tcc-demo-bank2 银行2,操作李四账户,连接数据库bank2

二,环境搭建

1,引入maven依赖

<dependency>
<groupId>org.dromara</groupId>
<artifactId>hmily‐springcloud</artifactId>
<version>2.0.4‐RELEASE</version>
</dependency>

2,配置hmily

application.yml:

org:
  dromara:
    hmily :
      serializer : kryo
      recoverDelayTime : 30
      retryMax : 30
      scheduledDelay : 30
      scheduledThreadMax :  10
      repositorySupport : db
      started: true
      hmilyDbConfig :
        driverClassName  : com.mysql.jdbc.Driver
        url :  jdbc:mysql://localhost:3306/hmily?useUnicode=true
        username : root
        password : mysql

3,新增配置类接收application.yml中的Hmily配置信息,并创建HmilyTransactionBootstrap Bean:

@Bean
public HmilyTransactionBootstrap hmilyTransactionBootstrap(HmilyInitService hmilyInitService){
    HmilyTransactionBootstrap hmilyTransactionBootstrap = new HmilyTransactionBootstrap(hmilyInitService);
    hmilyTransactionBootstrap.setSerializer(env.getProperty("org.dromara.hmily.serializer"));
    hmilyTransactionBootstrap.setRecoverDelayTime(Integer.parseInt(env.getProperty("org.dromara.hmily.recoverDelayTime")));
    hmilyTransactionBootstrap.setRetryMax(Integer.parseInt(env.getProperty("org.dromara.hmily.retryMax")));
    hmilyTransactionBootstrap.setScheduledDelay(Integer.parseInt(env.getProperty("org.dromara.hmily.scheduledDelay")));
    hmilyTransactionBootstrap.setScheduledThreadMax(Integer.parseInt(env.getProperty("org.dromara.hmily.scheduledThreadMax")));
    hmilyTransactionBootstrap.setRepositorySupport(env.getProperty("org.dromara.hmily.repositorySupport"));
    hmilyTransactionBootstrap.setStarted(Boolean.parseBoolean(env.getProperty("org.dromara.hmily.started")));
    HmilyDbConfig hmilyDbConfig = new HmilyDbConfig();
    hmilyDbConfig.setDriverClassName(env.getProperty("org.dromara.hmily.hmilyDbConfig.driverClassName"));
    hmilyDbConfig.setUrl(env.getProperty("org.dromara.hmily.hmilyDbConfig.url"));
    hmilyDbConfig.setUsername(env.getProperty("org.dromara.hmily.hmilyDbConfig.username"));
    hmilyDbConfig.setPassword(env.getProperty("org.dromara.hmily.hmilyDbConfig.password"));
    hmilyTransactionBootstrap.setHmilyDbConfig(hmilyDbConfig);
    return hmilyTransactionBootstrap;
}

3,启动类增加@EnableAspectJAutoProxy并增加org.dromara.hmily的扫描项:

@SpringBootApplication
@EnableDiscoveryClient
@EnableHystrix
@EnableFeignClients(basePackages = {"cn.itcast.dtx.tccdemo.bank1.spring"})
@ComponentScan({"cn.itcast.dtx.tccdemo.bank1","org.dromara.hmily"})
public class Bank1HmilyServer {
    public static void main(String[] args) {
        SpringApplication.run(Bank1HmilyServer.class, args);
    }
}

三,TCC实现

一,dtx-tcc-demo-bank1

dtx-tcc-demo-bank1实现try和cancel方法,如下:

try:
    try幂等校验
    try悬挂处理
    检查余额是够扣减金额
    扣减金额
confirm:
    空
cancel:
    cancel幂等校验
    cancel空回滚处理
    增加可用余额

① Dao

@Mapper
@Component
public interface AccountInfoDao {
@Update("update account_info set account_balance=account_balance ‐ #{amount} where
account_balance>#{amount} and account_no=#{accountNo} ")
int subtractAccountBalance(@Param("accountNo") String accountNo, @Param("amount") Double
amount);
@Update("update account_info set account_balance=account_balance + #{amount} where
account_no=#{accountNo} ")
int addAccountBalance(@Param("accountNo") String accountNo, @Param("amount") Double amount);
/**
* 增加某分支事务try执行记录
* @param localTradeNo 本地事务编号
* @return
*/
@Insert("insert into local_try_log values(#{txNo},now());")
int addTry(String localTradeNo);
@Insert("insert into local_confirm_log values(#{txNo},now());")
int addConfirm(String localTradeNo);
@Insert("insert into local_cancel_log values(#{txNo},now());")
int addCancel(String localTradeNo);
/**
* 查询分支事务try是否已执行
* @param localTradeNo 本地事务编号
* @return
*/
@Select("select count(1) from local_try_log where tx_no = #{txNo} ")
int isExistTry(String localTradeNo);
/**
* 查询分支事务confirm是否已执行
* @param localTradeNo 本地事务编号
* @return
*/
@Select("select count(1) from local_confirm_log where tx_no = #{txNo} ")
int isExistConfirm(String localTradeNo);
/**
* 查询分支事务cancel是否已执行
* @param localTradeNo 本地事务编号
* @return
*/
@Select("select count(1) from local_cancel_log where tx_no = #{txNo} ")
int isExistCancel(String localTradeNo);
}

② try和cancel方法

@Service
@Slf4j
public class AccountInfoServiceImpl implements AccountInfoService {
private Logger logger = LoggerFactory.getLogger(AccountInfoServiceImpl.class);
@Autowired
private AccountInfoDao accountInfoDao;
@Autowired
private Bank2Client bank2Client;
@Override
@Transactional
@Hmily(confirmMethod = "commit", cancelMethod = "rollback")
public void updateAccountBalance(String accountNo, Double amount) {
//事务id
String transId = HmilyTransactionContextLocal.getInstance().get().getTransId();
log.info("******** Bank1 Service begin try... "+transId );
int existTry = accountInfoDao.isExistTry(transId);
//try幂等校验
if(existTry>0){
log.info("******** Bank1 Service 已经执行try,无需重复执行,事务id:{} "+transId );
return ;
}
//try悬挂处理
if(accountInfoDao.isExistCancel(transId)>0 || accountInfoDao.isExistConfirm(transId)>0){
   log.info("******** Bank1 Service 已经执行confirm或cancel,悬挂处理,事务id:{} "+transId
);
return ;
}
//从账户扣减
if(accountInfoDao.subtractAccountBalance(accountNo ,amount )<=0){
//扣减失败
throw new HmilyRuntimeException("bank1 exception,扣减失败,事务id:{}"+transId);
}
//增加本地事务try成功记录,用于幂等性控制标识
accountInfoDao.addTry(transId);
//远程调用bank2
if(!bank2Client.test2(amount,transId)){
    throw new HmilyRuntimeException("bank2Client exception,事务id:{}"+transId);
}
if(amount==10){//异常一定要抛在Hmily里面
    throw new RuntimeException("bank1 make exception 10");
}
    log.info("******** Bank1 Service end try... "+transId );
}
@Transactional
public void commit( String accountNo, double amount) {
    String localTradeNo = HmilyTransactionContextLocal.getInstance().get().getTransId();
    logger.info("******** Bank1 Service begin commit..."+localTradeNo );
}
@Transactional
public void rollback( String accountNo, double amount) {
    String localTradeNo = HmilyTransactionContextLocal.getInstance().get().getTransId();
    log.info("******** Bank1 Service begin rollback... " +localTradeNo);
   if(accountInfoDao.isExistTry(localTradeNo) == 0){ //空回滚处理,try阶段没有执行什么也不用做
       log.info("******** Bank1 try阶段失败... 无需rollback "+localTradeNo );
      return;
}
  if(accountInfoDao.isExistCancel(localTradeNo) > 0){ //幂等性校验,已经执行过了,什么也不用做
     log.info("******** Bank1 已经执行过rollback... 无需再次rollback " +localTradeNo);
return;
}
   //再将金额加回账户
   accountInfoDao.addAccountBalance(accountNo,amount);
   //添加cancel日志,用于幂等性控制标识
   accountInfoDao.addCancel(localTradeNo);
   log.info("******** Bank1 Service end rollback... " +localTradeNo);
}}

③ feignClient

@FeignClient(value = "seata‐demo‐bank2", fallback = Bank2Fallback.class)
public interface Bank2Client {
@GetMapping("/bank2/transfer")
@Hmily
Boolean transfer(@RequestParam("amount") Double amount);
}

④ Controller

@RestController
public class Bank1Controller {
@Autowired
AccountInfoService accountInfoService;
@RequestMapping("/transfer")
public String test(@RequestParam("amount") Double amount) {
    this.accountInfoService.updateAccountBalance("1", amount);
    return "cn/itcast/dtx/tccdemo/bank1" + amount;
}
}

二,dtx-tcc-demo-bank2

dtx-tcc-demo-bank2实现如下功能:

try:
    空
confirm:
    confirm幂等校验
    正式增加金额
cancel:
    空

① Dao

@Component
@Mapper
public interface AccountInfoDao {
@Update("update account_info set account_balance=account_balance + #{amount} where
account_no=#{accountNo} ")
int addAccountBalance(@Param("accountNo") String accountNo, @Param("amount") Double amount);
/**
* 增加某分支事务try执行记录
* @param localTradeNo 本地事务编号
* @return
*/
@Insert("insert into local_try_log values(#{txNo},now());")
int addTry(String localTradeNo);
@Insert("insert into local_confirm_log values(#{txNo},now());")
int addConfirm(String localTradeNo);
@Insert("insert into local_cancel_log values(#{txNo},now());")
int addCancel(String localTradeNo);
/**
* 查询分支事务try是否已执行
* @param localTradeNo 本地事务编号
* @return
*/
@Select("select count(1) from local_try_log where tx_no = #{txNo} ")
int isExistTry(String localTradeNo);
/**
* 查询分支事务confirm是否已执行
* @param localTradeNo 本地事务编号
* @return
*/
@Select("select count(1) from local_confirm_log where tx_no = #{txNo} ")
int isExistConfirm(String localTradeNo);
/**
* 查询分支事务cancel是否已执行
* @param localTradeNo 本地事务编号
* @return
*/
@Select("select count(1) from local_cancel_log where tx_no = #{txNo} ")
int isExistCancel(String localTradeNo);
}

② 实现confirm方法

@Service
@Slf4j
public class AccountInfoServiceImpl implements AccountInfoService {

     @Autowired
     private AccountInfoDao accountInfoDao;

@Override
@Transactional
@Hmily(confirmMethod = "confirmMethod", cancelMethod = "cancelMethod")
public void updateAccountBalance(String accountNo, Double amount) {
    String localTradeNo = HmilyTransactionContextLocal.getInstance().get().getTransId();
    log.info("******** Bank2 Service Begin try ..."+localTradeNo);
}
@Transactional
public void confirmMethod(String accountNo, Double amount) {
    String localTradeNo = HmilyTransactionContextLocal.getInstance().get().getTransId();
    log.info("******** Bank2 Service commit... " +localTradeNo);
    if(accountInfoDao.isExistConfirm(localTradeNo) > 0){ //幂等性校验,已经执行过了,什么也不用做
    log.info("******** Bank2 已经执行过confirm... 无需再次confirm "+localTradeNo );
    return ;
}
     //正式增加金额
    accountInfoDao.addAccountBalance(accountNo,amount);
    //添加confirm日志
    accountInfoDao.addConfirm(localTradeNo);
}
@Transactional
public void cancelMethod(String accountNo, Double amount) {
     String localTradeNo = HmilyTransactionContextLocal.getInstance().get().getTransId();
    log.info("******** Bank2 Service begin cancel... "+localTradeNo );
}
}

③ Controller

@RestController
public class Bank2Controller {
@Autowired
AccountInfoService accountInfoService;
@RequestMapping("/transfer")
public Boolean test2(@RequestParam("amount") Double amount) {
     this.accountInfoService.updateAccountBalance("2", amount);
   return true;
}
}

测试:

张三向李四转账成功。

李四事务失败,张三事务回滚成功。

张三事务失败,李四分支事务回滚成功。

分支事务超时测试。

总结:

如果拿TCC事务的处理流程与2PC两阶段提交做比较,2PC通常都是在跨库的DB层面,而TCC则在应用层面的处

理,需要通过业务逻辑来实现。这种分布式事务的实现方式的优势在于,可以让应用自己定义数据操作的粒度,使

得降低锁冲突、提高吞吐量成为可能。

而不足之处则在于对应用的侵入性非常强,业务逻辑的每个分支都需要实现try、confirm、cancel三个操作。此

外,其实现难度也比较大,需要按照网络状态、系统故障等不同的失败原因实现不同的回滚策略。


路漫漫其修远兮,吾将上下而求索