|
索引的優點:這個顯而易見,正確的索引會大大提高數據查詢,對結果進行排序、分組的操作效率。
索引的缺點:優點顯而易見,同樣缺點也是顯而易見:
1:創建索引需要額外的磁盤空間,索引最大一般為表大小的1.2倍左右。
2:在表數據修改時,例如增加,刪除,更新,都需要維護索引表,這是需要系統開銷的。
3:不合理的索引設計非但不能利于系統,反而會使系統性能下降。例如我們在一個創建有非聚集索引的列上做范圍查詢,此列的索引不會起到任何的優化效果,反而由于數據的修改而需要維護索引表,從而影響了對數據修改的性能。
實際例子:還是拿前兩篇文章的學生表來講吧,要查詢成績在50分以上的學生信息select * from student where score>50。學生表包含了100000行記錄,而且學分是隨機生成的,這樣從數據量以及數據分布上都有一定的保障。
第一種情況:學生表有索引
1:存在聚集索引,但聚集索引不在學分上,這里只分析學分不是聚集索引的情況。
(1): 學分上沒有索引。此時SQL會通過聚集索引來查找數據,這點估計大家都會知道。
(2): 學分上有索引。這種情況,SQL會使用上學分上的索引嗎?這個問題估計不是每個人都能回答正確的。既然學分上有索引,而where中又有此列,理應使用了索引,但實際情況并沒有使用索引。因為出現了范圍查找,如果一個索引一個索引的比較,在性能上比起直接按聚集索引查找全部數據后再過濾來的差。那學分上的索引什么時候 SQL會優先考慮呢?當score指定為一個具體值時,就能使用學分索引查找了。從下圖的SQL執行計劃可以得知。
2:不存在聚集索引。
(1):在學分上沒有索引,其它字段有索引,這種情況就會出現表掃描。
(2):在學分上有索引,是否會按照學分上的索引進行查找呢?由于上面的表數據量也不少,一般會認為SQL不會采用表掃描,因為會查找全部記錄,但實際情況表明SQL對于范圍查詢也行采用表掃描而不是按學生索引查詢。我們也可以強制SQL按學分查詢,于是有下面的SQL執行計劃比較,我們可以清楚的看出,強制使用學分做為索引查詢比表搜索的性能要差很多。
第二種情況:學生表沒有索引。這個情況沒有分析的價值。
什么字段不適合創建索引?
1:不經常使用的列,這種索引帶來缺點遠大于帶來的優點。
2:邏輯性的字段,例如性別字段等等,匹配的記錄太多,和表掃描比起來不相上下。
3:字段內容特別大的字段,例如text等,這會大大增大索引所占用的空間以及索引更新時的速度。
我們說SQL在維護索引時要消耗系統資源,那么SQL維護索引時究竟消耗了什么資源?會產生哪些問題?究竟怎樣才能優化字段的索引?
第一:當數據頁達到了8K(數據頁最大為8K) 容量,如此時發生插入或更新數據的操作,將導致頁的分裂。
1、聚集索引的情況下:聚集索引將被插入和更新的行指向特定的頁,該頁由聚集索引關鍵字決定;
2、只有堆的情況下:有空間就可以插入新的行,對行數據的更新需要更多的空間,如果大于了當前頁的可用空間,行就被移到新的頁中,且在原位置留下一個轉發指針,指向被移動的新行,如果具有轉發指針的行又被移動了,那么原來的指針將重新指向新的位置;
3、堆中有非聚集索引,盡管插入和更新操作,不會發生頁分裂,但非聚集索引上仍然產生頁分裂。
總結:無論有無索引,很多數據將保留在老頁面,其它將放入新頁面,并且新頁面可能被分配到任何可用的頁,頻繁頁分裂,表會產生大量數據碎片,直接造成I/O 效率下降。
引出問題:為什么數據庫對于varchar最大值設置為8000,而不是10000呢?
答:是由于數據頁大小最大為8K。
第二:針對上述索引可能造成的頁分頁的解決方案,填充因子。
創建索引時,可以為索引指定一個填充因子,在索引的每個葉級頁面上保留一定百分比的空間,將來數據可以進行擴充和減少頁分裂。值從0到100的百分比數值,100 時表示將數據頁填滿。不對數據進行更改時(例如只讀表中)才用此設置,實用價值不大。值越小則數據頁上的空閑空間越大,可以減少在索引增長過程中進行頁分裂,但需要占用更多的硬盤空間。填充因子也不能設置過小,過小會影響SQL的讀取性能,因為填充因子造成數據頁的增多。一般我們公司設置的填充因子是80。
索引是否是一塵不變的?
隨著業務的變化,數據的變化,會發生有些索引的用處可能發生變化,例如:
1:原來主要靠用戶名搜索記錄,現在業務更改為按用戶所在城市搜索等等,此時我們需要即時變更表索引以適應新業務的變化,即數據和使用模式發生了大幅度變化。
2:系統上線前不合理的索引,隨著數據的增加,缺點越來越明顯,此時需要調整索引。
3:隨著數據的增加,產生了越來越多的頁分裂,導致索引性能越來越低。
上面的幾種情況,我們就需要選擇重建索引來徹底解決問題。
總結索引使用原則:
1:不要索引數據量不大的表,對于小表來講,表掃描的成本并不高。
2:不要設置過多的索引,在沒有聚集索引的表中,最大可以設置249個非聚集索引,過多的索引首先會帶來更大的磁盤空間,而且在數據發生修改時,對索引的維護是特別消耗性能的。
3:合理應用復合索引,有某些情況下可以考慮創建包含所有輸出列的覆蓋索引。
4:對經常使用范圍查詢的字段,可能考慮聚集索引。
5:避免對不常用的列,邏輯性列,大字段列創建索引。
it知識庫:軟件開發人員真的了解SQL索引嗎(索引使用原則),轉載需保留來源!
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。