线上账务系统余额并发更新问题记录

栏目: IT技术 · 发布时间: 6年前

内容简介:某电商平台,某天线上用户报bug说账户余额信息与交易流水对不上。可以认为是数据库并发更新问题,由此定位出具体原因,更进一步了解mysql,并给出解决方案。

某电商平台,某天线上用户报bug说账户余额信息与交易流水对不上。可以认为是数据库并发更新问题,由此定位出具体原因,并给出解决方案。

问题现象

场景描述

线上账务系统,在定时结算给卖家钱时,且高并发量的情况下,出现提现x元(假设当前用户余额为x元)余额为0后,再转入该账户一笔钱(假设为y元),结果账户余额变为了x+y 元,导致用户余额错误。 ps:账户余额的变更都是在事务中update的

环境说明

mysql5.7 + innodb,事务隔离级别是REPEATABLE-READ

场景模拟

我们简化下线上的数据结构,进行场景模拟。 数据表如下: ‘账户主表’

 

‘账户余额明细表’

 

账户类型配置

 

具体数据为:

 

模拟提现(即余额减)和入账(即余额加)并发操作的事务如下:

session1-提现10元 session2-入账20元
begin;
select description from user_conf where type_id = 100;
select * from user where uid = 10001 for update; // user表用来做互斥
select amount from user_account where uid = 10001; // 10.00
begin;
select description from user_conf where type_id = 100;
select * from user where uid = 10001 for update; // wating
//wating
update user_account set amount = 0.00 where uid = 10001;
commit;
拿到锁
select amount from user_account where uid = 10001; //10.00
入账20元,代码中计算后应该为30元
update user_account set amount = 30.00 where uid = 10001;
commit;

问题出现了,后面再查询该用户余额为30元,即用户提现的10元未反映在余额中

原因定位

熟悉 mysql 的同学或许已经知道问题是由REPEATABLE-READ隔离级别下快照读导致

具体解释:

RR级别下,第一次读操作会生成快照,对于可见性来说,只有当第一次读之前其他事务提交的修改和自己的修改可见,其他的均不可见。

官网文档:https://dev.mysql.com/doc/refman/5.7/en/glossary.html snapshot A representation of data at a particular time, which remains the same even as changes are committed by other transactions.

With REPEATABLE READ isolation level, the snapshot is based on the time when the first read operation is performed.

可见性原理

可参考文章:http://hedengcheng.com/?p=148

回到上述模拟场景中,session2在 sql 语句select description from user_conf where type_id = 100; 时已生成快照,虽然session1提交了,但仍然不可见,导致并发更新问题。

另外,开启事务后,SELECT … FOR UPDATE 是不会生成快照的,大家可自行实验

解决方案

方案一

将REPEATABLE-READ隔离级别改为READ-COMMITTED,这样即能看到最新提交的数据。

方案二

在读’账户余额明细表’user_account 的时候加 for update,这样会 1.强制读该行记录的最新版本数据,2.且若其他事务未commit,本事务将阻塞,保证串行更新

方案三

延时生成快照。开启事务后,首先就通过user表做互斥,直接for update加锁,针对多个事务并发更新即变为串行。

附:定位过程

  1. 针对上报bug用户,查询其交易流水明细与余额变更明细,确认账务存在问题
  2. 查询账务系统近几天是否有上线变更,检查无
  3. 拉取账务数据库mysql general log,找到并发更新的两个事务session
  4. 查询数据库设置的隔离级别为RR,查询应用数据库连接池配置即session的隔离级别未配置,采用数据库配置
  5. 确认由RR级别导致(当然也可以认为是代码问题导致)
  6. 确认是一个月前账务系统分库分表上线,改用其他连接池且未设置session隔离级别。而之前是有配置session的隔离级别为READ-COMMITTED。

延伸思考

mysql RR级别适用的业务场景是什么,应该怎么选择? 有兴趣或有见解的同学可以留言回复或私信~~

参考

http://blog.csdn.net/chen77716/article/details/6742128#comments

http://hedengcheng.com/?p=148

https://liuzhengyang.github.io/2017/04/18/innodb-mvcc/


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Ruby for Rails

Ruby for Rails

David Black / Manning Publications / 2006-05-11 / USD 44.95

What's Inside * How Ruby and Rails work, separately and together * Extensive Ruby language tutorial * Ruby techniques for Rails applications * Explore the Rails framework source code A new level of pr......一起来看看 《Ruby for Rails》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试