10 分鐘 MySQL 索引從入門到精通
10分鐘,只要10分鐘,帶你了解 MySQL 索引的精華所在,走一走看一看,看了不吃虧,看了不上當~ :-D
1、索引是做什么的?
索引用于快速找出在某個列中有一特定值的行。不使用索引,MySQL必須從第1條記錄開始然后讀完整個表直到找出相關的行。
表越大,花費的時間越多。如果表中查詢的列有一個索引,MySQL能快速到達一個位置去搜尋到數據文件的中間,沒有必要看所有數據。
大多數MySQL索引(PRIMARY KEY、UNIQUE、INDEX和FULLTEXT)在B樹中存儲。只是空間列類型的索引使用R-樹,并且MEMORY表還支持hash索引。
2、索引好復雜,我該怎么理解索引,有沒一個更形象點的例子?
有,想象一下,你面前有本詞典,數據就是書的正文內容,你的大腦就是那個cpu,而索引,則是書的目錄
3、索引越多越好?
大多數情況下索引能大幅度提高查詢效率,但:
-
數據的變更(增刪改)都需要維護索引,因此更多的索引意味著更多的維護成本
</li> -
更多的索引意味著也需要更多的空間 (一本100頁的書,卻有50頁目錄?)
</li> -
過小的表,建索引可能會更慢哦 :) (讀個2頁的宣傳手冊,你還先去找目錄?)
</li> </ul>4、索引的字段類型問題
-
text類型,也可建索引(需指定長度)
</li> -
myisam存儲引擎索引鍵長度綜合不能超過1000字節
</li> -
用來篩選的值盡量保持和索引列同樣的數據類型
</li> </ul>5、like 不能用索引?
-
盡量減少like,但不是絕對不可用,”xxxx%” 是可以用到索引的,
想象一下,你在看一本成語詞典,目錄是按成語拼音順序建立,查詢需求是,你想找以 “一”字開頭的成語(”一%“),和你想找包含一字的成語(“%一%”)
</li> -
除了like,以下操作符也可用到索引:
<,<=,=,>,>=,BETWEEN,IN
<>,not in ,!=則不行
</li> </ul>6、什么樣的字段不適合建索引?
-
一般來說,列的值唯一性太小(如性別,類型什么的),不適合建索引(怎樣叫太小?一般說來,同值的數據超過表的百分之15,那就沒必要建索引了)
</li> -
太長的列,可以選擇只建立部分索引,(如:只取前十位做索引)
</li> -
更新非常頻繁的數據不適宜建索引(怎樣叫非常?意會)
</li> </ul>7、一次查詢能用多個索引嗎?
不能。
比如:
我有一個A表,有b,c,d字段,其中在b,c上各自加了索引。(可以使用SQL:SHOW INDEX from A 查看A表的索引)
1</td>select * from A WHERE b=x and c=x; --x表示要查詢的值</div> </td> </tr> </tbody> </table> </div> </div>通過這條SQL,我們可以看到有兩列:possible_keys和key
pk表示此條SQL語句可能用到的索引,k表示實際用到的索引。
你會發現,實際只用到了一個索引,至于是b還是c,mysql會通過分析選擇使用給出結果集小的索引(cardinality),如通過b索引查詢的記錄比較少, 則會使用b作為實際索引。
注:嵌套、關聯查詢 explain 下可以看做多次查詢,而每次獨立的查詢都可以有單獨的索引被使用。
8、多列查詢該如何建索引?
一次查詢只能用到一個索引,所以 首先槍斃 a,b各建索引方案
a還是b? 誰的區分度更高(同值的最少),建誰!
當然,聯合索引也是個不錯的方案,ab,還是ba,則同上,區分度高者,在前
9、聯合索引的問題?
where a = “xxx” 可以使用 AB 聯合索引
where b = “xxx” 則不可 (再想象一下,這是書的目錄?)
所以,大多數情況下,有AB索引了,就可以不用再去建一個A索引了
10、哪些常見情況不能用索引?
-
like “%xxx”
</li> -
not in , !=
</li> -
對列進行函數運算的情況(如 where md5(password) = “xxxx”)
</li> -
WHERE index=1 OR A=10
</li> -
存了數值的字符串類型字段(如手機號),查詢時記得不要丟掉值的引號,否則無法用到該字段相關索引,反之則沒關系
也即
select * from test where mobile = 13711112222;
可是無法用到mobile字段的索引的哦(如果mobile是char 或 varchar類型的話)
btw,千萬不要嘗試用int來存手機號(為什么?自己想!要不自己試試)
</li> </ul>11、覆蓋索引(Covering Indexes)擁有更高效率
索引包含了所需的全部值的話,就只select 他們,換言之,只select 需要用到的字段,如無必要,盡量避免select *
12、NULL 的問題
-
要盡量避免 NULL,盡可能地把字段定義為 NOT NULL。即使應用程序無須保存 NULL(沒有值),也有許多表包含了可空列(Nullable Column),這僅僅是因為它為默認選項。除非真的要保存 NULL,否則就把列定義為 NOT NULL。
</li> -
MySQL難以優化引用了可空列的查詢,它會使索引、索引統計和值更加復雜。可空列需要更多的儲存空間,還需要在MySQL內部進行特殊處理。當可空列被索引的時候,每條記錄都需要一個額外的字節,還可能導致 MyISAM 中固定大小的索引(例如一個整數列上的索引)變成可變大小的索引。
</li> -
即使要在表中儲存「沒有值」的字段,還是有可能不使用 NULL 的。考慮使用 0、特殊值或空字符串來代替它。
</li> -
把 NULL 列改為 NOT NULL 帶來的性能提升很小,所以除非確定它引入了問題,否則就不要把它當作優先的優化措施。然而,如果計劃對列進行索引,就要盡量避免把它設置為可空。
</li> </ul>13、如何查看索引信息,如何分析是否正確用到索引?
show index from tablename;
explain select ……;
關于explain,改天可以找個時間專門寫一篇入門帖,在此之前,可以嘗試 google
14、了解自己的系統,不要過早優化!
過早優化,一直是個非常討厭而又時刻存在的問題,大多數時候就是因為不了解自己的系統,不知道自己系統真正的承載能力
比如:幾千條數據的新聞表,每天幾百幾千次的正文搜索,大多數時候我們可以放心的去like,而不要又去建一套全文搜索什么的,畢竟cpu還是比人腦厲害太多。
15、后記:
看到這兒,也許你花了不止10分鐘,但建議多看幾遍,有條件的話最好上機嘗試加深理解,紙上得來終覺淺,絕知此事要躬行嘛~
還有這篇文章幾乎覆蓋了《高性能MYSQL》中索引一章的所有結論,建議和那本書參照起來一起看,也許那本書就不那么難讀了~
Refer:
[1] mysql索引需要了解的幾個注意
[2] mysql 查詢可以同時使用幾條索引
[3] MySQL 索引詳解
http://my.oschina.net/leejun2005/blog/134932?fromerr=DQVDBPHK
[4] 關于mysql 索引自動優化機制: 索引選擇性(Cardinality:索引基數)
http://my.oschina.net/leejun2005/blog/75688
[5] 如何應對并發(1) - 關于數據索引
[6] 如何應對并發(2) - 請求合并及異步處理
http://dwz.cn/2cJxgS
來自:http://my.oschina.net/leejun2005/blog/532956
-
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!相關資訊
sesese色 -
-
-
-