`
yutuer
  • 浏览: 9078 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

MySQL索引和查询优化的实际操作

阅读更多
以下的文章主要介绍的是MySQL索引和查询优化的实际操作流程,我们大家都知道MySQL索引和查询优化在实际操作中出现的比例较高,所以对其有更深的了解会在你今后的学习中有所收获所。

恰当的索引可以加快查询速度,可以分为四种类型:主键、唯一索引、全文索引、普通索引。



主键:唯一且没有null值。



create table pk_test(f1 int not null,primary key(f1));  alter table customer modify id int not null, add primary key(id);


普通索引:允许重复的值出现。



create table tableanme (fieldname1 columntype,fieldname2 columntype,index [indexname] (fieldname1 [,fieldname2...]));  create table tablename add index [indexname] (fieldname1 [fieldname2...]);  alter table slaes add index(value);


全文MySQL索引:用来对大表的文本域(char,varchar,text)进行索引。


语法和普通索引一样-fulltext。


使用全文索引:create table ft2 (f1 varchar(255),fulltext(f1));


insert into ft2 values('wating for the bvarbariands'),('in the heart of the country'),('the master of petersburg'),('writing and being'),('heart of the beast'),('master master');


select * from ft2 where match(f1) against('master'); // match()-匹配域;against()匹配值。


MySQL会对某些字忽略,造成查询的误差:a. 50%以上的域出现的单词;b.少于三个字的单词;c.MySQL预定义的列表,包括the。查询语句:select * from ft2 where match(f1) against('the master'); // 与希望的结果是不同的


相关性分数查询:select f1,(match(f1) against('master')) from ft2;


MySQL4的新功能-布尔全文查询:select * from ft2 where match(f1) against('+master -pet' in boolean mode); // 运算符类型 +-<>()~*"



唯一索引:除了不能有重复的记录外,其它和普通索引一样。


create table ui_test (f1 int,f2 int,unique(f1));


alter table ui_test add unique(f2);


对域(varchar,char,blob,text)的部分创建MySQL索引:alter table customer add index (surname(10));


自动增加域:每次插入记录时会自动增加一个域的值,只能用于一个域,且这个域有索引。


create table tablename(fieldname int auto_increment,[fieldname2...,] primary key(filedname));


alter table tablename modify fieldname columntype auto_increment;


last_insert_id()函数返回最新插入的自动增加值。


select last_insert_id() from customer limit 1;


此函数在多个连接同时进行时,会发生错误。


重置自动增加计数器的值:


create table tablename(fieldname int auto_increment,[fieldname2...,] primary key(filedname) auto_increment=50);


alter table tablename auto_increment=50;


如果重置的值比存在的值小,自动增加计数器会从记录中最大的那个值开始增加计数,比如customer表中的id已经有1、2、3、15、16、20,当把自动增加计数器的值设为1时,下次插入的记录会从21开始。


自动增加计数器的越界:有效值为1~2的127次方,即2147483647。如果超过这个值(包括负值),MySQL会自动把它设为最大值,这样就会产生一个重复键值的错误。


自动增加域在多列MySQL索引中的使用:


create table staff(rank enum('employee','manager','contractor') not null,position varchar(100),id int not null auto_increment,primary key(rank,id));


insert into staff(rank,position) values('employee','cleaner'),('cotractor','network maintenance'),('manager','sales manager');


在对每个级别添加一些数据,会看到熟悉的自动增加现象:


insert into staff(rank,position) values('employee','cleaner1'),('employee','network maintenance1'),('manager','sales manager1');


在这种情况下是不能重置自动增加计数器的。


删除或更改索引:对索引的更改都需要先删除再重新定义。


alter table tablename drop primary key;


alter table table drop index indexname;


drop index on tablename;



高效使用索引:下面讨论的是用了索引会给我们带来什么?


1.) 获得域where从句中匹配的行:select * from customer where surname>'c';


2.) 查找max()和min()值时,MySQL只需在排序的索引中查找第一个和最后一个值。


3.) 返回的部分是MySQL索引的一部分,MySQL就不需要去查询全表的数据而只需看索引:select id from custo及mer;


4.) 对域使用order by的地方:select * from customer order by surname;


5.) 还可以加速表的连接:select first_name,surname,commission from sales,sales_rep where sales.sales_rep=sales_rep.employee_number and code=8;


6.) 在通配符的情况下:select * from sales_rep where surname like 'ser%';


这种情况就不能起作用:select * from sales_rep where surname like '%ser%';

选择索引:


1.) 有查询需要使用索引(比如where从句中条件的域)的时候,要创建索引;不要不使用的域(不如第一个字符是通配符的)创建索引。


2.) 创建的索引返回的行越少越好,主键最好,枚举类型的索引不什么用处。


3.) 使用短索引(比如,名字的头十个字符而不是全部)。


4.) 不要创建太多的MySQL索引,虽然加快了查询的速度,但增加了更新的添加记录的时间。如果索引在查询中很少使用,而没有索引只是轻微的影响速度,就不要创建索引。



最左边规则:这种情况发生在多个有索引的域上,MySQL从索引列表的最左边开始,按顺序使用他们。



alter table customer add initial varchar(5);   alter table customer add index(surname,initial,first_name);   update customer set initial='x' where id=1;   update customer set initial='c' where id=2;   update customer set initial='v' where id=3;   update customer set initial='b' where id=4;   update customer set initial='n' where id=20;   update customer set initial='m' where id=21;

如果在查询中使用了这三个域,那就最大限度的利用了索引:select * from customer where surname='clegg' and initial='x' and first_name='yvonne';


或者是利用MySQL索引的大部分:select * from customer where surname='clegg' and initial='x';


或仅仅是surname:select * from customer where surname='clegg';


如果打破最左边规则,下面的例子就不会用到索引:select * from customer where initial='x' and first_name='yvonne';


select * from customer where initial='x' ;


select * from customer where first_name='yvonne';


select * from customer where surname='clegg' and first_name='yvonne';


使用explain-解释MySQL如何使用索引来处理select语句及连接表的。

输入 explain select * from customer; 后,出现一张表,个行的意思如下:


table-显示此行数据属于哪张表;type-重要的一列,显示使用了何种连接,从好到差依次为const、eq_ref、ref、range、index、all,下面会详细说明;possible_keys-可以应用在这张表中的索引,如果为null,则表示没有可用索引;key-实际使用的索引,如为null,表示没有用到索引;key_len-索引的长度,在不损失精确度的情况下,越短越好;ref-显示索引的哪一列被使用了,如果可能的话,是个常数;rows-返回请求数据的行数;extra-关于MySQL如何解析查询的额外信息,下面会详细说明。


extra行的描述:distinct-MySQL找到了域行联合匹配的行,就不再搜索了;


not exists-MySQL优化了left join,一旦找到了匹配left join的行,就不再搜索了;


range checked for each-没找到理想的索引,一次对于从前面表中来的每一个行组合;


record(index map: #)-检查使用哪个MySQL索引,并用它从表中返回行,这是使用索引最慢的一种;


using filesort-看到这个就需要优化查询了,MySQL需要额外的步骤来发现如何对返回的行排序。他根据连接类型以及存储排序键值和匹配条件的全部行的行指针来排序全部行。


using index-列数据是从单单使用了索引中的信息而没有读取实际行的表返回的,这发生在对表的全部的请求列都是同一个索引时;


using temporary-看到这个就需要优化查询了,MySQL需要创建一个临时表来查询存储结果,这通常发生在多不同的列表进行order by时,而不是group by;


where used-使用了where从句来限制哪些行将与下一张表匹配或是返回给用户。如不想返回表中用的全部行,并连接类型是all或index,这就会发生,也可能是查询有问题。


type的描述:system-表只有一行,这是const连接类型的特例;const-表中一个记录的最大值能够匹配这个查询(索引可以是主键或唯一索引)。因为只有一行,这个值实际就是常数,因为MySQL先读这个值,再把它当作常数对待;eq_ref-从前面的表中,对每一个记录的联合都从表中读取一个记录。在查询使用索引为主键或唯一索引的全部时使用;ref-只有使用了不是主键或唯一索引的部分时发生。

对于前面表的每一行联合,全部记录都将从表中读出,这个连接类型严重依赖索引匹配记录的多少-越少越好;range-使用索引返回一个范围中的行,比如使用>或<查找时发生;index-这个连接类型对前面的表中的每一个记录联合进行完全扫描(比all好,因为索引一般小于表数据);all-这个连接类型多前面的表中的每一个记录联合进行完全扫描,这个比较糟糕,应该尽量避免。


举个例子:create index sales_rep on sales(sales_rep); // 可以比较一下创建MySQL索引前后的变化


explain select * from sales_rep left join sales on sales.sales_rep = sales_rep.employee_number;


结果如下:


table type possible_keys key key_len ref rows extra   sales_rep all null null null null 5   sales ref sales_rep sales_rep 5 sales_rep.employee_number 2 

这个结果表示sales_rep表有个不好的连接类型-all,没用到索引,要查询的行数为5;sales的连接类型为ref,可用的索引是sales_rep,实际也使用sales_rep索引,这个索引的长度是5,对应的列是employee_number,要查询的行数为2,所以这次查询对表共进行了5×2次查询。

查看索引信息:show index from tablename;

列的描述:table-正在查看的表名;non_unique-1或1.0表示索引不能包含重复值(主键和唯一索引),1表示可以;key_name-索引名;seq_in_index-索引中列的顺序,从1开始;column_name-列名;collation-a或null,a表示索引以序升排列,null表示不排序;

cardinality-索引中唯一值的个数;sub_part-如果整个列为MySQL索引,值为null,否则以字符表示索引的大小;packed-是否打包;null-如果列能包含null,则为yes;comment-各种注释。
分享到:
评论

相关推荐

    MySQL索引的缺点以及MySQL索引在实际操作中有哪些事项

    以下的文章主要介绍的是MySQL索引的缺点以及MySQL索引在实际操作中有哪些事项是值得我们大家注意的,我们大家可能不知道过多的对索引进行使用将会造成滥用。因此MySQL索引也会有它的缺点: 虽然索引大大提高了查询...

    MySQL索引优化的实际案例分析

    主要介绍了MySQL索引优化的一些实际案例,主要是用到Order by desc/asc limit M的方法,需要的朋友可以参考下

    MySql索引详解,索引可以大大提高MySql的检索速度

    创建索引时,你需要确保该索引是应用在SQL查询语的条件(一般作为WHERE 子句的条件)实际上,索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录。上面都在说使用索引的好处,但过多的使用索引将会造成...

    Mysql查询优化从入门到入土详解含示例(值得珍藏)

    我们介绍了查询优化技术的各个方面,包括索引、查询语句、表结构等基本优化方法以及高级优化技术如查询缓存、数据库分区、使用覆盖索引和使用压缩技术等。通过合理应用这些优化技术,可以提高数据库的响应速度、降低...

    MySQL面试题进阶版附答案高难度深入挖掘MySQL的核心概念与技术探索ACID特性、事务隔离级别、索引优化、连接操作

    这些问题涵盖了MySQL数据库的重要概念和技术,回答这些问题需要对MySQL的架构、事务处理、索引优化等方面有一定的了解。在面试准备过程中,熟悉这些问题并深入学习相关知识将有助于你在面试中展现出对MySQL的深入...

    MySQL查询优化

    《MySQL索引优化》 2 分页查询优化 很多时候我们业务系统实现分页功能可能会用如下sql实现: select * from employees limit 10000,10; 表示从表employees中取出从10001行开始的10行记录。看似只查询了10条记录,...

    Mysql面试过关!(详解:索引+常用引擎+常见问题+sql调优)

    一、Mysql索引 1、添加索引sql语句 2、查看MySQL中建立的索引是否生效 3、索引失效场景(补充:以下在实际应用中并不会一定导致索引失效,基于mysql不同版本的优化规则) 3.1 在联合索引的场景下,查询条件不满足最...

    美团网技术团队分享的MySQL索引及慢查询优化教程

    主要介绍了美团网技术团队分享的MySQL索引及慢查询优化教程,结合了实际的磁盘IO情况对一些优化方案作出了分析,十分推荐!需要的朋友可以参考下

    mysql面试题文档,主要讲述了一些数据库的基本理论

    索引和查询优化:理解索引的作用和原理,掌握查询优化的方法和技巧,能够根据查询需求选择合适的索引类型和优化策略。 存储过程和触发器:了解存储过程和触发器的概念和作用,掌握存储过程的编写和触发器的应用场景...

    MySQL工程师必备面试题【事务与锁机制、备份与恢复、性能优化、高可用方案、索引优化、ACID特性、主从/半同步复制】

    内容概要:题目涵盖了MySQL的基础概念、索引、事务、锁、视图、存储过程、备份恢复等方面的知识点,适合用于MySQL的初级和中级面试。 适用人群:适用于对MySQL有一定了解和使用经验的后端开发人员、DBA、面试官和...

    mysql重复索引与冗余索引实例分析

    本文实例讲述了mysql重复索引与冗余索引。分享给大家供大家参考,具体如下: 重复索引:表示一个列或者顺序相同的几个列上建立的多个索引。 冗余索引:两个索引所覆盖的列重叠 冗余索引在一些特殊的场景下使用到了...

    mysql数据库索引自学笔记,基础+单表索引+多表索引的创建方法及原理

    索引优化时,问题一般集中在以下三种情况:1、没有足够多的索引;2、没有有效的索引;3、索引列的顺序不对。这三种情况也是此系列要讲述的重点。同是提一下一些“误区”,之所以称为误区是因为在没有特定背景的情况...

    oracle与mysql差异分析

    本文详细描述了oracle数据库和mysql数据库两者在运用,操作,实施方面的不同,根据不同场景可以进行不同的优化策略,结合实际项目可以动态调整。

    MySQL的id关联和索引使用的实际优化案例

    主要介绍了MySQL的id关联实际优化案例,关联和索引一直是MySQL常见的可优化大块儿,需要的朋友可以参考下

    关于MySQL索引的深入解析

    我们知道,索引的选择是优化器阶段的工作,但是优化器并不是万能的,它有可能选错所要使用的索引。一般优化器选择索引考虑的因素有:扫描行数,是否排序,是否使用临时表。 使用explain分析sql explain是很好的自测...

    mysql的count()函数如何选择索引,千万级表的count()查询优化实例

    文章目录一、前言1、网上的主要两种说法2、不贴出mysql版本的测试都是耍流氓~3、mysql的count(*)和count(1)二、测试索引长度和索引基数对count(*)查询的影响1、总数据量1100W+ 表的速度2、默认使用的索引3、查看该表...

    mysql处理海量数据时的一些优化查询速度方法

    由于在参与的实际项目中发现当mysql表的数据量达到百万级时,普通SQL查询效率呈直线下降,而且如果where中的查询条件较多时,其查询速度简直无法容忍。曾经测试对一个包含400多万条记录(有索引)的表执行一条条件...

    Mysql面试手册大全实例

    在Mysql面试中,面试官可能会提问关于Mysql基本概念、查询语句、表设计、索引优化、事务处理、备份与恢复等方面的问题。面试者需要展示自己对Mysql的理解和掌握程度,回答面试官的问题,并且能够解释和演示自己在...

    浅析mysql索引

    INSERT和UPDATE语句需要更多的时间来创建索引,作为在SELECT语句快速在这些表上操作。其原因是,在执行插入或更新数据时,数据库需要将插入或更新索引值也更新。 简单和唯一索引 可以在表上创建唯一值索引。唯一索引...

Global site tag (gtag.js) - Google Analytics