详解Mysql基础结构

发布时间：2024-01-05 栏目：建站知识浏览：分类：数据库教程

MySQL是一种关系型数据库管理系统，它的基础结构包括客户端、服务器和存储引擎。客户端是用户与MySQL交互的工具，如命令行界面或图形界面。服务器负责处理客户端的请求并执行SQL语句。存储引擎则负责数据的存储和管理，常见的存储引擎有InnoDB、MyISAM等。在MySQL中，数据以表的形式存储，每个表由行和列组成。MySQL还提供了许多高级功能，如索引、事务、触发器等，这些功能可以帮助用户更高效地管理和查询数据。总之，了解MySQL的基础结构对于学习和使用MySQL非常重要。

引言

内容为**的《高并发高性能高可用 MySQL 实战》**视频的学习笔记内容和个人整理扩展之后的笔记，在快速视频学习一遍之后发现了许多需要补充的点，比如三次握手的连接和Mysql的内部交互流程等等，关于后续的章节也会整合多篇文章后续会陆续发布。

Mysql的连接方式

使用最多的方式是第一种方式，另外三种方式受限于特殊的平台方式实现，重点掌握第一种TCP/IP的方式即可。

tcp/ip的连接形式

共享内存的连接方式

命名空间模式

unix套接字的连接方式

Tcp/ip的通讯协议

这一块在视频中讲解比较浅，所以这里参考了多方资料后，以《TCP/IP协议》作为参考介绍三次握手和四次挥手的过程。

通讯协议也就是我们常见的三次握手和四次挥手的流程，注意这里忽略TCP/IP报文的格式介绍。

SYN：同步序号。

FIN：发送方完成标记。

ACK：仅当ACK=1时，确认号字段才有效，并且建立TCP连接之后所有的连接必须ACK=1。

ack：接受请求之后将请求序列号+1进行回送使用。

ISN：起始序号也别叫做Seq，该序号由时间决定，所以每一个Tcp都有一个唯一的起始序号，组成的方式是开始的序号、一个冒号、隐含的结尾序号及圆括号内的数据字节数，比如1415531521:1415531521（0），如果字节为0则被隐藏，只有当存在字节数据或者SYN、 FIN 或 RST 被设置为 1 才进行展示。

Mss：表示的是当前报文的最大字节数。

ISM可看作是一个32比特的计数器，每 4ms + 1。

三次握手建立TCP连接

第一步：客户端主动打开TCB端口，服务器被动打开TCB端口。发起方携带一个SYN标志，并且携带一个ISN序号Seq=x，但是需要注意的是第一步的过程这个ISN序号是隐藏传递的（因为没有传递数据），但是如果不存在数据的交换，则不会被显示。客户端发送SYN命令之把SYN=1，并且把SYN-SENT（同步-已发送状态）。

第二步：服务器收到客户端TCP报文之后，也将SYN=1，并且回送一个新的ISN序号ack=x+1，并且将ACK=1表示自己收到了，然后在返回参数回送自己新的序列号表示自己的确认请求Seq=y，将状态设置为SYN-RCVD（同步收到）状态，（表示希望收到的序号为xxxx1522），最后也是指定MSS。

第三步：客户端收到服务器的确认报文之后，还需要向服务端返回确认报文，确认报文的ACK=1，并且回传服务器传递的ISN序号+1（ack = y+1），以及自己的ISN序号+1（Seq = x+1），此时TCP连接进入已连接状态，ACK是可以携带数据的，但是如果不携带数据则不消耗序列号。

最后一步：当服务器收到客户端的确认，也进入已连接状态。

Mysql认证连接

Mysql的认证链接可以看作是三次交互，注意第一次请求是服务端发起的，有点类似我们去店里面买东西，首先开口的肯定是员工，比如问我们要什么东西，于是我们花钱买东西，然后把东西带走，认证过程可以类似于这样的一个过程。

服务端 → 客户端发送初始化包：服务端首先确认是那个客户端需要连接

客户端 → 服务端验证

服务端 → 认证结果消息

认证通过客户端与服务端断开

四次挥手端口tcp连接

第一步（客户端）：TCP发送释放连接的报文，停止发送数据，释放报文首部，把FIN=1，同时发送序列号，根据上一次传送的序列号+1传送Seq = t + 1（由于下图是在连接之后立马进行四次挥手，所以序列号没有变），此时客户端进行终止等待1的状态。注意FIN不携带数据也需要消耗序列号。

第二步（服务端）：服务器回送确认报文，发出确认报文，ACK=1，并且把回传序列号+1回传（ack = t + 1），然后再带上自己的序列号Seq = y，此时服务端进入CLOSE-WAIT状态（关闭等待状态），TCP服务器此时需要停止上层应用客户端向服务端请求释放，处于半关闭阶段，此时服务端依然可以向客户端发数据并且客户端需要接受并处理，关闭等待状态意味着整个状态还需要持续一段时间。

第三步（客户端）：客户端接收到服务端确认请求，此时客户端进入到FIN-WAIT-2终止等待2的阶段，等待服务器的释放报文。（还有一部分服务器没有发送完的数据需要处理）

第四步（服务端）：服务器把最后的数据处理完毕，向客户端发送释放报文，FIN=1，ack=t + 1，由于需要把剩下的数据发送完成，假设处理完成之后需要带上自己的序列号Seq=w，服务器进入最后确认状态，等待客户端确认。

第五步（客户端）：客户端收到报文之后，发出确认 ACK=1，ack=w+1，自己的序列号为Seq = t + 1，此时客户端进入到了TIME-WAIT（时间等待状态），此时客户端还是没有释放，必须经过*2MSL（最长报文寿命）**之后，客户端撤掉TCB之后才进入CLOSED状态。

第六步（服务端）：服务器收到客户端的请求立马进入CLOSE状态，同时撤销TCB，结束此次TCP的连接。（服务端结束TCP连接要比客户端早一些）

为什么需要四次挥手才能关闭连接？

TCP/IP 是一种全双工的协议，任何一方关闭都需要双向的确认操作，双方关闭需要给对方发送一个FIN来终止连接，一端收到FIN通知应用层的另一端终止数据的发送，而收到一个FIN仅仅说明一个方向不进行数据流动，通常关闭的一方（发送FIN的一方）为主动关闭，接受方为被动关闭，因为全双工特性双方都需要对方被动关闭。

通过下面的图可以简单了解为什么要这样设计：

Mysql的报文格式

Mysql的报文格式比较简单，它主要分为下面的部分，Mysql通过自己构建的协议进行内部通信，简单了解即可：

消息头：3个字节的报文长度，1个字节的序号

消息体：1个字节指令，存储数据，长度不定

指令案例：切换数据库（0x02），查询指令（ox03）

如何使用工具验证如何通信？命令是如何执行的？

连接上去之后会执行如下的操作流程。

客户端→服务端：发送命令包

服务端→客户端：发送回应包

命令是如何执行的？可以使用一些辅助的抓包工具查看，比如Windows平台有一个Wireshark的工具，我们可以通过一个简单的抓包案例查看：
在实际的开始之前我们需要弄清楚Mysql到底使用的是什么协议，MySQL客户端使用TCP协议作为底层传输协议，而使用Mysql公司自身的Mysql Protocol协议作为应用层协议作为内部通信。

这里使用window的wireShark工具抓包，读者也可以使用tcpdump进行抓包，命令行操作更加简洁：

首先是三次握手的过程：

如下面的图所示，首先由客户端发起连接请求，传送Seq序号和设置SYN为1并且设置为同步发送状态，接着服务端受到请求之后，将ACK设置为1，并且将客户端序号+1之后回送，并且也传递一个自己的序号，此时服务端也处于同步接受状态，最后当客户端受到服务端请求之后也把ack设置为1，并且传递服务端的序列号，至此建立连接。

接下来是客户端和服务端的交互，由于这里使用了navicat进行连接测试，所以可以发现navicat在这其中发送了很多自己的包：

这里需要注意的是在内部通信的时候Mysql使用的是自身的协议，根据客户端的命令请求返回相应的数据。

最后是四次挥手的过程，由于上面进行了详细的解释合理就不再啰嗦了，四次挥手的过程要复杂不少，客户端存在最终等待1和最终等待2的阶段，而服务端在接受到请求之后不会立刻回复客户端可以关闭，而是需要将数据传输完成之后，再回送客户端停止传送，当客户端收到断开指令之后，则会立即停止此次TCP交互，而客户端这里需要经过最长等待时间才会释放连接，所以对于服务器连接优化来说，TCP的最长等待时间是一个重要的优化点。

数据库和excel的对比

存储和磁盘空间大小类似

数据库面向软件，提供接口

excel文件级别，面向终端用户

事务：数据库千人千面

常见的架构

事件驱动架构

事件驱动的模式常见于GUI的软件当中，我们点击某个按钮的时候，会触发与之关联的其他事件组，从下面的架构图可以看到事件和事件执行之间是结偶的，有很好的复用性。

管道-过滤器架构

管道过滤的架构比较常见是http请求过滤处理，比如我们想要对于一个请求进行不同层次的分析，对于请求次数，请求时间，或者请求来源或者对于请求拦截的处理，可以通过过滤链的方式对于请求进行处理。

微核架构

微核架构常用于精简项目架构，通过插件的方式对于系统的核心功能增强，微核架构具有很好的灵活性，能根据不同的实际情况进行灵活组合完成不同的效果。

![image-20220318201602082](/Users/zhaoxudong/Library/Application Support/typora-user-images/image-20220318201602082.png)

分层架构

通过拆分server和存储引擎，将整个连接的步骤拆分为下面的部分，sever层负责连接管理，而存储引擎则负责与后台的交互动作。

数据库的基础架构

在Mysql的设计中，可以看到主要使用了三种架构模式：

事件驱动架构

分层架构

微核架构

常见存储引擎介绍

innodb：互联网常用，支持事务。

myISAM：查询快。

memory：临时内存表。

Archive：归档表。

sql语句查询过程

sql的查询语句大致分为下面四个模块：

查询缓存（8.0删除）

分析器

优化器

执行器

存储引擎

下面是一个sql查询的大致步骤

查询缓存（8.0删除）

分析器

分析语法，解析语句

拆分编译语句

解析SQL的核心步骤

优化器

通过mysql的规则优化查询链路或者sql执行的过程

建立并且把执行计划传递给执行器

执行器

- 负责具体的sql执行- 通过存储引擎的接口进行接口调用，最后结果返回给客户端

无相关信息