为什么需要学MySQL?我们每天都在访问各种站、APP,如微信、QQ、抖、今头条、腾讯新闻等,这些 东西上都存在量的信息,这些信息都需要有地存储,存储在哪呢?数据库。 所以如果我们需要开发个站、app,数据库我们必须掌握的技术,常的数据库有 mysql、oracle、sqlserver、db2等。 上介绍的个数据库,oracle性能排名第,服务也是相当到位的,但是收费也是常 的,融公司对数据库稳定性要求较,般会选择oracle。 mysql是免费的,其他个前暂时收费的,mysql在互联公司使率也是排名第, 资料也常完善,社区也常活跃,所以我们主要学习mysql。 篇幅所限,本文只详写了MySQL索引,需要的同学可自行领取完整版MySQL学习笔记 一、什么是索引? 索引就好比字典的目录一样 我们通常都会先去目录查找关键偏旁或者字母再去查找 要比直接翻查字典查询要快很多 二、为什么要有索引?然而我们在使用mysql数据库的时候也像字典一样有索引的情况下去查询,肯定速度要快很多 2.1问题: 1.mysql数据存储在什么地方?磁盘 2.查询数据慢,一般卡在哪?IO 3.去磁盘读取数据,是用多少读取多少吗?磁盘预读 局部性原理:数据和程序都有聚集成群的倾向,同时之前被访问过的数据很可能再次被查询,空间局部性,时间局部性 磁盘预读:内存和磁盘发生数据交互的时候,一般情况下有一个最小的逻辑单元,页。 页一般由操作系统觉得大小,4k或8k,而我们在进行数据交互的时候,可以取页的整数倍来读取。 关注公众号:北游学Java 即可获取一份578页PDF文档的MySQL学习笔记 innodb存储引擎每次读取数据,读取16k 4.索引存储在哪?磁盘,查询数据的时候会优先将索引加载到内存中 5.索引在存储的时候,需要什么信息?需要存储存储什么字段值?key:实际数据行中存储的值 文件地址 offset:偏移量 6.这种格式的数据要使用什么样的数据结构来进行存储?key-values 哈希表,树(二叉树、红黑树、AVL树、B树、B+树) 7.mysql索引系统中不是按照刚刚说的格式存储的,为什么?OLAP:联机分析处理----对海量历史数据进行分析,产生决策性的策略----数据仓库—Hive OLTP:联机事务处理----要求很短时效内返回对应的结果----数据库—关系型数据库(mysql、oracle) 三、mysql的索引数据结构3.1哈希表:HashMap数组加链表的结构,不适合作为索引的原因: 1.哈希冲突会造成数据散列不均匀,会产生大量的线性查询,比较浪费时间 2.不支持范围查询,当进行范围查询的时候,必须挨个遍历 3.对于内存空间的要求比较高 优点:如果是等值查询,非常快 在mysql中有没有hash索引? 1.memory存储引擎使用的是hash索引 2.innodb支持自适应hash
3.2树:树这种数据结构有很多,我们常见的有: 二叉树、BST、AVL、红黑树、B树、B+树 ①二叉树:无序插入 这就是我们的树的结构图,但是二叉树的数据插入是无序的,也就是说当需要查找的时候,还是得一个一个挨着去遍历查找 ②BST(二叉搜索树): 插入的数据有序,左子树必须小于根节点,右子树必须大于根节点--------使用二分查找来提高效率 这样的话如果要查询数据,可以通过二分查找,快速缩小范围,减少了时间复杂度 **但是如果插入的顺序是升序或者降序的话,树的形状会变成如下: 此时二叉搜索树就会退化成链表,时间复杂度又会变成O(n) ③AVL:平衡二叉树 为了解决上述问题,通过左旋转或右旋转让树平衡 最短子树跟最长子树高度只差不能超过1 由图我们可以看到,当顺序插入的时候,会自动的进行旋转,以达到平衡 但是会通过插入性能的损失来弥补查询性能的提升 当我们插入的数据很多时候,而查询很少的时候,由于插入数据会旋转同样会消耗很多时间 ④红黑树(解决了读写请求一样多) 同样是经过左右旋让树平衡起来,还要变色的行为 最长子树只要不超过最短子树的两倍即可 查询性能和插入性能近似取得平衡 但是随着数据的插入、发现树的深度会变深,树的深度会越来越深,意味着IO次数越多,影响数据读取的效率 ⑤ B树 为了解决上述数据插入过多,树深度变深的问题,我们采用B树 把原来的有序二叉树变成有序多叉树 举例:如果要查询select * from table where id=14?
问题1:B树不支持范围查询的快速查找,如果我们查询一个范围的数据,查找到范围一个边界时,需要回到根节点重新遍历查找,需要从根节点进行多次遍历,即便找到范围的另一个边界,查询效率会降低。问题2:如果data存储的是行记录,行的大小随着列数的增多,所占空间会变大。这时,一个页中可存储的数据量就会变少,树相应就会变高,磁盘IO次数就会变大。 思考2:三层B树能够存储多少条记录?答:假设一个data为1k,innodb存储引擎一次读取数据为16k,三层即161616=4096; 但是往往在开发中,一个表的数据要远远大于4096,难道要继续加层,这样岂不就加大了IO 四、为什么使用B+树?实际存储表数据的时候,怎么存储呢? key 完整的数据行 改造B+树 B+树对B树进行了改进,把数据全放在了叶子节点中,叶子节点之间使用双向指针连接,最底层的叶子节点形成了一个双向有序链表。例如:查询范围 select * from table where id between 11 and 35?
对比B树和B+树?
问题:创建索引时用int还是varchar? 答:视情况而定,但是记住一定让key越小越好 五、索引的创建在创建索引之前,我先说一下存储引擎 存储引擎:表示不同的数据在磁盘的不同表现形式 大家去观察mysql的磁盘文件会发现 innodb:innodb的数据和索引都存储在一个文件下.idb myisam:myisam的索引存储在.MYI文件中,数据存储在.MYD中 5.1聚簇索引和非聚簇索引概念:判断是否是聚簇索引就看数据和索引是否在一个文件中 innodb:
myisam:非聚簇索引 MySQL—innodb----B+树 索引和数据存储在一起,找到索引即可读取对应的数据 MySQL—myisam----B+树 索引和存储数据的地址在一起,找到索引得到地址值,再通过地址找到对应的数据 5.2回表接下来,我会创建一张案例表给大家展示
首先先根据uname查询到id,再根据id查询到行的信息 这样的操作走了两棵B+树,就是回表 当根据普通索引查询到聚簇索引的key值之后,再根据key值在聚簇索引中获取数据 我们可以发现这样的操作是很浪费时间的,因此我们日常操作的时候,尽量减少回表的次数 5.3覆盖索引
5.4最左匹配在说最左匹配之前,我们先聊一下几个名词 主键(一般为一个列)-------->联合主键(多个列) 索引-------->联合索引(可能包含多个索引列)
5.5索引下推mysql5.7之后,默认支持的一个特点 举一个例子:
分析:有索引下推的好处,如果我们有50条数据,我们通过过滤会得到10条数据,如果没有索引下推,会先获取50条再去排除得到10条,而有了下推之后,我们会直接在存储引擎就过滤成了10条 |
说得好不如写得好,赶紧留下你评论吧!
你可能喜欢
-
2021-04-13
-
2021-04-13
-
圣景园鸡蛋—徐桂亮品牌设计-CND设计网,中国设计网络首选品牌
2021-04-13