【架构入门 - 高性能篇】数据库高性能

栏目: 数据库 · 发布时间: 7年前

内容简介：单机高性能与集群高性能都是针对负责计算的服务器而言的，负责存储的数据库服务器因为处理的是数据而不是计算，架构和使用方式又有所不同基本原理是将数据库读写操作分散到不同节点上，从而分散读写压力到不同的节点上

单机高性能与集群高性能都是针对负责计算的服务器而言的，负责存储的数据库服务器因为处理的是数据而不是计算，架构和使用方式又有所不同

【架构入门 - 高性能篇】数据库高性能

SQL - 读写分离

基本原理是将数据库读写操作分散到不同节点上，从而分散读写压力到不同的节点上

【架构入门 - 高性能篇】数据库高性能

一主一从或一主多从都可以；主机负责读写操作，从机负责读操作，每个机器都需要同时工作；主机通过复制将数据同步到从机，每个节点都存储了所有的数据

MySQL的主从复制延迟可能达到1秒，如果有大量数据，1分钟也可能，那么这样很容易造成用户注册了但是无法登陆

一般的解决方法是将关键业务全部指向主机，非关键业务进行读写分离，比如注册登陆都指向主机，修改个人信息就读写分离，即使查询出来的是旧的数据，业务上的影响也不会太大

如何将读写操作分开，访问不同的数据库呢？

【1】程序代码封装

在程序中抽象出一个数据访问层，实现读写操作分离和数据库服务连接的管理，比如

【架构入门 - 高性能篇】数据库高性能

实现简单，但无法通用，每个语言都需要写一个，主从数据库发生切换则需要修改所有系统并重启

【2】中间件封装

独立出一套系统来，实现读写操作分离和数据库服务连接的管理，中间件对业务服务器提供 SQL 兼容的协议。业务服务器访问中间件与数据库无差异，如图

【架构入门 - 高性能篇】数据库高性能

能够支持多种语言，且能够探测服务器主从状态，比如向某个测试表里写个数据，成功就是主机，失败就是从机。但是对应的实现极其复杂，容易出BUG，所有数据库请求都走中间件的话性能是个大问题。一般使用成熟的中间件方案，如MySQL Proxy，Atlas

为什么需要分这么多东西，主要是因为如果在单库或者单表上：

为了解决数据量太大，且读写操作太多的问题，分库是按不同的业务模块将数据分散到不同的数据库服务器，比如：

【架构入门 - 高性能篇】数据库高性能

但会存在以下问题：

事务问题。在执行分库之后，由于数据存储到了不同的库上，数据库事务管理出现了困难。如果依赖数据库本身的分布式事务管理功能去执行事务，将付出高昂的性能代价；如果由应用程序去协助控制，形成程序逻辑上的事务，又会造成编程方面的负担
跨库跨表的join问题。在执行了分库分表之后，难以避免会将原本逻辑关联性很强的数据划分到不同的表、不同的库上，我们无法join位于不同分库的表，也无法join分表粒度不同的表，结果原本一次查询能够完成的业务，可能需要多次查询才能完成
额外的数据管理负担和数据运算压力。额外的数据管理负担，最显而易见的就是数据的定位问题和数据的增删改查的重复执行问题，这些都可以通过应用程序解决，但必然引起额外的逻辑运算
成本问题。本来是1台服务器，现在是3台，所以一开始是不需要考虑分库的，除非一开始就是业务特别多，用户量特别大，否则一定要避免初期在开发上的无端开销，以后业务起来之后再分库也不迟