優(yōu)質(zhì)文章,及時(shí)送達(dá) 這篇文章總結(jié)了 52 條 SQL 性能優(yōu)化技巧,用簡潔明了的語言介紹給大家,不廢話全是干貨,需要的可以收藏,退出。不不不,收藏,看完再退出。 1. 對查詢進(jìn)行優(yōu)化,應(yīng)盡量避免全表掃描,首先應(yīng)考慮在 where 及 order by 涉及的列上建立索引。 2. 應(yīng)盡量避免在 where 子句中對字段進(jìn)行 null 值判斷,創(chuàng)建表時(shí)NULL是默認(rèn)值,但大多數(shù)時(shí)候應(yīng)該使用NOT NULL,或者使用一個(gè)特殊的值,如0,-1作為默 認(rèn)值。 3. 應(yīng)盡量避免在 where 子句中使用!=或<>操作符, MySQL只有對以下操作符才使用索引:<,<=,=,>,>=,BETWEEN,IN,以及某些時(shí)候的LIKE。 關(guān)于 MySQL 相關(guān)的文章和教程發(fā)布了很多,關(guān)注微信公眾號(hào) Java后端,回復(fù) 666 下載就行了。 4. 應(yīng)盡量避免在 where 子句中使用 or 來連接條件, 否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描, 可以 使用UNION合并查詢: select id from t where num=10 union all select id from t where num=20 5. in 和 not in 也要慎用,否則會(huì)導(dǎo)致全表掃描,對于連續(xù)的數(shù)值,能用 between 就不要用 in 了:
6. 下面的查詢也將導(dǎo)致全表掃描: select id from t where name like ‘%abc%’ 或者
若要提高效率,可以考慮全文檢索。而 select id from t where name like ‘a(chǎn)bc%’ 才用到索引 7. 如果在 where 子句中使用參數(shù),也會(huì)導(dǎo)致全表掃描。 8. 應(yīng)盡量避免在 where 子句中對字段進(jìn)行表達(dá)式操作,應(yīng)盡量避免在where子句中對字段進(jìn)行函數(shù)操作 9. 很多時(shí)候用 exists 代替 in 是一個(gè)好的選擇:select num from a where num in(select num from b).用下面的語句替換:select num from a where exists(select 1 from b where num=a.num) 10. 索引固然可以提高相應(yīng)的 select 的效率,但同時(shí)也降低了 insert 及 update 的效率,因?yàn)?insert 或 update 時(shí)有可能會(huì)重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個(gè)表的索引數(shù)最好不要超過6個(gè),若太多則應(yīng)考慮一些不常使用到的列上建的索引是否有必要。 11. 應(yīng)盡可能的避免更新 clustered 索引數(shù)據(jù)列, 因?yàn)?clustered 索引數(shù)據(jù)列的順序就是表記錄的物理存儲(chǔ)順序,一旦該列值改變將導(dǎo)致整個(gè)表記錄的順序的調(diào)整,會(huì)耗費(fèi)相當(dāng)大的資源。若應(yīng)用系統(tǒng)需要頻繁更新 clustered 索引數(shù)據(jù)列,那么需要考慮是否應(yīng)將該索引建為 clustered 索引。 12. 盡量使用數(shù)字型字段,若只含數(shù)值信息的字段盡量不要設(shè)計(jì)為字符型,這會(huì)降低查詢和連接的性能,并會(huì)增加存儲(chǔ)開銷。 13. 盡可能的使用 varchar/nvarchar 代替 char/nchar , 因?yàn)槭紫茸冮L字段存儲(chǔ)空間小,可以節(jié)省存儲(chǔ)空間,其次對于查詢來說,在一個(gè)相對較小的字段內(nèi)搜索效率顯然要高些。 14. 最好不要使用”“返回所有:select from t ,用具體的字段列表代替“*”,不要返回用不到的任何字段。 15. 盡量避免向客戶端返回大數(shù)據(jù)量,若數(shù)據(jù)量過大,應(yīng)該考慮相應(yīng)需求是否合理。 16. 使用表的別名(Alias):當(dāng)在SQL語句中連接多個(gè)表時(shí),請使用表的別名并把別名前綴于每個(gè)Column上.這樣一來,就可以減少解析的時(shí)間并減少那些由Column歧義引起的語法錯(cuò)誤。 17. 使用“臨時(shí)表”暫存中間結(jié)果 簡化SQL語句的重要方法就是采用臨時(shí)表暫存中間結(jié)果,但是,臨時(shí)表的好處遠(yuǎn)遠(yuǎn)不止這些,將臨時(shí)結(jié)果暫存在臨時(shí)表,后面的查詢就在tempdb中了,這可以避免程序中多次掃描主表,也大大減少了程序執(zhí)行中“共享鎖”阻塞“更新鎖”,減少了阻塞,提高了并發(fā)性能。 18. 一些SQL查詢語句應(yīng)加上nolock,讀、寫是會(huì)相互阻塞的,為了提高并發(fā)性能,對于一些查詢,可以加上nolock,這樣讀的時(shí)候可以允許寫,但缺點(diǎn)是可能讀到未提交的臟數(shù)據(jù)。使用 nolock有3條原則。 查詢的結(jié)果用于“插、刪、改”的不能加nolock !查詢的表屬于頻繁發(fā)生頁分裂的,慎用nolock !使用臨時(shí)表一樣可以保存“數(shù)據(jù)前影”,起到類似Oracle的undo表空間的功能,能采用臨時(shí)表提高并發(fā)性能的,不要用nolock 。 19. 常見的簡化規(guī)則如下:不要有超過5個(gè)以上的表連接(JOIN),考慮使用臨時(shí)表或表變量存放中間結(jié)果。少用子查詢,視圖嵌套不要過深,一般視圖嵌套不要超過2個(gè)為宜。 20. 將需要查詢的結(jié)果預(yù)先計(jì)算好放在表中,查詢的時(shí)候再Select。這在SQL7.0以前是最重要的手段。例如醫(yī)院的住院費(fèi)計(jì)算。 21. 用OR的字句可以分解成多個(gè)查詢,并且通過UNION 連接多個(gè)查詢。他們的速度只同是否使用索引有關(guān),如果查詢需要用到聯(lián)合索引,用UNION all執(zhí)行的效率更高.多個(gè)OR的字句沒有用到索引,改寫成UNION的形式再試圖與索引匹配。一個(gè)關(guān)鍵的問題是否用到索引。 22. 在IN后面值的列表中,將出現(xiàn)最頻繁的值放在最前面,出現(xiàn)得最少的放在最后面,減少判斷的次數(shù)。 23. 盡量將數(shù)據(jù)的處理工作放在服務(wù)器上,減少網(wǎng)絡(luò)的開銷,如使用存儲(chǔ)過程。存儲(chǔ)過程是編譯好、優(yōu)化過、并且被組織到一個(gè)執(zhí)行規(guī)劃里、且存儲(chǔ)在數(shù)據(jù)庫中的SQL語句,是控制流語言的集合,速度當(dāng)然快。反復(fù)執(zhí)行的動(dòng)態(tài)SQL,可以使用臨時(shí)存儲(chǔ)過程,該過程(臨時(shí)表)被放在Tempdb中。 24. 當(dāng)服務(wù)器的內(nèi)存夠多時(shí),配制線程數(shù)量 = 最大連接數(shù)+5,這樣能發(fā)揮最大的效率;否則使用 配制線程數(shù)量<最大連接數(shù)啟用SQL SERVER的線程池來解決,如果還是數(shù)量 = 最大連接數(shù)+5,嚴(yán)重的損害服務(wù)器的性能。 25. 查詢的關(guān)聯(lián)同寫的順序 select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = ‘JCNPRH39681’ (A = B ,B = ‘號(hào)碼’)
select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = ‘JCNPRH39681’ and a.personMemberID = ‘JCNPRH39681’ (B = ‘號(hào)碼’, A = ‘號(hào)碼’) 26. 盡量使用exists代替select count(1)來判斷是否存在記錄,count函數(shù)只有在統(tǒng)計(jì)表中所有行數(shù)時(shí)使用,而且count(1)比count(*)更有效率。 27. 盡量使用“>=”,不要使用“>”。 28. 索引的使用規(guī)范:索引的創(chuàng)建要與應(yīng)用結(jié)合考慮,建議大的OLTP表不要超過6個(gè)索引;盡可能的使用索引字段作為查詢條件,尤其是聚簇索引,必要時(shí)可以通過index index_name來強(qiáng)制指定索引;避免對大表查詢時(shí)進(jìn)行table scan,必要時(shí)考慮新建索引; 在使用索引字段作為條件時(shí),如果該索引是聯(lián)合索引,那么必須使用到該索引中的第一個(gè)字段作為條件時(shí)才能保證系統(tǒng)使用該索引,否則該索引將不會(huì)被使用;要注意索引的維護(hù),周期性重建索引,重新編譯存儲(chǔ)過程?! ?/span> 29. 下列SQL條件語句中的列都建有恰當(dāng)?shù)乃饕珗?zhí)行速度卻非常慢:
分析: WHERE子句中對列的任何操作結(jié)果都是在SQL運(yùn)行時(shí)逐列計(jì)算得到的,因此它不得不進(jìn)行表搜索,而沒有使用該列上面的索引;如果這些結(jié)果在查詢編譯時(shí)就能得到,那么就可以被SQL優(yōu)化器優(yōu)化,使用索引,避免表搜索,因此將SQL重寫成下面這樣: SELECT * FROM record WHERE card_no like ‘5378%’ (< 1秒) 30. 當(dāng)有一批處理的插入或更新時(shí),用批量插入或批量更新,絕不會(huì)一條條記錄的去更新! 31. 在所有的存儲(chǔ)過程中,能夠用SQL語句的,我絕不會(huì)用循環(huán)去實(shí)現(xiàn)! (例如:列出上個(gè)月的每一天,我會(huì)用connect by去遞歸查詢一下,絕不會(huì)去用循環(huán)從上個(gè)月第一天到最后一天) 32. 選擇最有效率的表名順序(只在基于規(guī)則的優(yōu)化器中有效): oracle 的解析器按照從右到左的順序處理FROM子句中的表名,F(xiàn)ROM子句中寫在最后的表(基礎(chǔ)表 driving table)將被最先處理,在FROM子句中包含多個(gè)表的情況下,你必須選擇記錄條數(shù)最少的表作為基礎(chǔ)表。 如果有3個(gè)以上的表連接查詢, 那就需要選擇交叉表(intersection table)作為基礎(chǔ)表, 交叉表是指那個(gè)被其他表所引用的表. 33. 提高GROUP BY語句的效率, 可以通過將不需要的記錄在GROUP BY 之前過濾掉.下面兩個(gè)查詢返回相同結(jié)果,但第二個(gè)明顯就快了許多. 低效:
高效: SELECT JOB , AVG(SAL) 34. sql語句用大寫,因?yàn)閛racle 總是先解析sql語句,把小寫的字母轉(zhuǎn)換成大寫的再執(zhí)行。 35. 別名的使用,別名是大型數(shù)據(jù)庫的應(yīng)用技巧,就是表名、列名在查詢中以一個(gè)字母為別名,查詢速度要比建連接表快1.5倍。 36. 避免死鎖,在你的存儲(chǔ)過程和觸發(fā)器中訪問同一個(gè)表時(shí)總是以相同的順序;事務(wù)應(yīng)經(jīng)可能地縮短,在一個(gè)事務(wù)中應(yīng)盡可能減少涉及到的數(shù)據(jù)量;永遠(yuǎn)不要在事務(wù)中等待用戶輸入。 37. 避免使用臨時(shí)表,除非卻有需要,否則應(yīng)盡量避免使用臨時(shí)表,相反,可以使用表變量代替;大多數(shù)時(shí)候(99%),表變量駐扎在內(nèi)存中,因此速度比臨時(shí)表更快,臨時(shí)表駐扎在TempDb數(shù)據(jù)庫中,因此臨時(shí)表上的操作需要跨數(shù)據(jù)庫通信,速度自然慢。 38. 最好不要使用觸發(fā)器,觸發(fā)一個(gè)觸發(fā)器,執(zhí)行一個(gè)觸發(fā)器事件本身就是一個(gè)耗費(fèi)資源的過程;如果能夠使用約束實(shí)現(xiàn)的,盡量不要使用觸發(fā)器;不要為不同的觸發(fā)事件(Insert,Update和Delete)使用相同的觸發(fā)器;不要在觸發(fā)器中使用事務(wù)型代碼。 39. 索引創(chuàng)建規(guī)則:
表上建立的每個(gè)索引都會(huì)增加存儲(chǔ)開銷,索引對于插入、刪除、更新操作也會(huì)增加處理上的開銷。另外,過多的復(fù)合索引,在有單字段索引的情況下,一般都是沒有存在價(jià)值的;相反,還會(huì)降低數(shù)據(jù)增加刪除時(shí)的性能,特別是對頻繁更新的表來說,負(fù)面影響更大。 盡量不要對數(shù)據(jù)庫中某個(gè)含有大量重復(fù)的值的字段建立索引。 40,mysql查詢優(yōu)化總結(jié):使用慢查詢?nèi)罩救グl(fā)現(xiàn)慢查詢,使用執(zhí)行計(jì)劃去判斷查詢是否正常運(yùn)行,總是去測試你的查詢看看是否他們運(yùn)行在最佳狀態(tài)下。 久而久之性能總會(huì)變化,避免在整個(gè)表上使用count(*),它可能鎖住整張表,使查詢保持一致以便后續(xù)相似的查詢可以使用查詢緩存 ,在適當(dāng)?shù)那樾蜗率褂肎ROUP BY而不是DISTINCT,在WHERE, GROUP BY和ORDER BY子句中使用有索引的列,保持索引簡單,不在多個(gè)索引中包含同一個(gè)列,有時(shí)候MySQL會(huì)使用錯(cuò)誤的索引,對于這種情況使用USE INDEX,檢查使用SQL_MODE=STRICT的問題,對于記錄數(shù)小于5的索引字段,在UNION的時(shí)候使用LIMIT不是是用OR。 為了避免在更新前SELECT,使用INSERT ON DUPLICATE KEY或者INSERT IGNORE ,不要用UPDATE去實(shí)現(xiàn),不要使用 MAX,使用索引字段和ORDER BY子句,LIMIT M,N實(shí)際上可以減緩查詢在某些情況下,有節(jié)制地使用,在WHERE子句中使用UNION代替子查詢. 在重新啟動(dòng)的MySQL,記得來溫暖你的數(shù)據(jù)庫,以確保您的數(shù)據(jù)在內(nèi)存和查詢速度快,考慮持久連接,而不是多個(gè)連接,以減少開銷,基準(zhǔn)查詢,包括使用服務(wù)器上的負(fù)載,有時(shí)一個(gè)簡單的查詢可以影響其他查詢,當(dāng)負(fù)載增加您的服務(wù)器上,使用SHOW PROCESSLIST查看慢的和有問題的查詢,在開發(fā)環(huán)境中產(chǎn)生的鏡像數(shù)據(jù)中 測試的所有可疑的查詢。 41. MySQL 備份過程: 從二級(jí)復(fù)制服務(wù)器上進(jìn)行備份。在進(jìn)行備份期間停止復(fù)制,以避免在數(shù)據(jù)依賴和外鍵約束上出現(xiàn)不一致。徹底停止MySQL,從數(shù)據(jù)庫文件進(jìn)行備份。 如果使用 MySQL dump進(jìn)行備份,請同時(shí)備份二進(jìn)制日志文件 – 確保復(fù)制沒有中斷。不要信任LVM 快照,這很可能產(chǎn)生數(shù)據(jù)不一致,將來會(huì)給你帶來麻煩。為了更容易進(jìn)行單表恢復(fù),以表為單位導(dǎo)出數(shù)據(jù) – 如果數(shù)據(jù)是與其他表隔離的。 當(dāng)使用mysqldump時(shí)請使用 –opt。在備份之前檢查和優(yōu)化表。為了更快的進(jìn)行導(dǎo)入,在導(dǎo)入時(shí)臨時(shí)禁用外鍵約束。 為了更快的進(jìn)行導(dǎo)入,在導(dǎo)入時(shí)臨時(shí)禁用唯一性檢測。在每一次備份后計(jì)算數(shù)據(jù)庫,表以及索引的尺寸,以便更夠監(jiān)控?cái)?shù)據(jù)尺寸的增長。 通過自動(dòng)調(diào)度腳本監(jiān)控復(fù)制實(shí)例的錯(cuò)誤和延遲。定期執(zhí)行備份。 42. 查詢緩沖并不自動(dòng)處理空格,因此,在寫SQL語句時(shí),應(yīng)盡量減少空格的使用,尤其是在SQL首和尾的空格(因?yàn)?,查詢緩沖并不自動(dòng)截取首尾空格)。 43. member用mid做標(biāo)準(zhǔn)進(jìn)行分表方便查詢么?一般的業(yè)務(wù)需求中基本上都是以u(píng)sername為查詢依據(jù),正常應(yīng)當(dāng)是username做hash取模來分表吧。分表的話 mysql 的partition功能就是干這個(gè)的,對代碼是透明的; 在代碼層面去實(shí)現(xiàn)貌似是不合理的。 44. 我們應(yīng)該為數(shù)據(jù)庫里的每張表都設(shè)置一個(gè)ID做為其主鍵,而且最好的是一個(gè)INT型的(推薦使用UNSIGNED),并設(shè)置上自動(dòng)增加的AUTO_INCREMENT標(biāo)志。 45. 在所有的存儲(chǔ)過程和觸發(fā)器的開始處設(shè)置 SET NOCOUNT ON ,在結(jié)束時(shí)設(shè)置 SET NOCOUNT OFF 。 無需在執(zhí)行存儲(chǔ)過程和觸發(fā)器的每個(gè)語句后向客戶端發(fā)送 DONE_IN_PROC 消息。 46. MySQL查詢可以啟用高速查詢緩存。這是提高數(shù)據(jù)庫性能的有效Mysql優(yōu)化方法之一。當(dāng)同一個(gè)查詢被執(zhí)行多次時(shí),從緩存中提取數(shù)據(jù)和直接從數(shù)據(jù)庫中返回?cái)?shù)據(jù)快很多。 47. EXPLAIN SELECT 查詢用來跟蹤查看效果 使用 EXPLAIN 關(guān)鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫你分析你的查詢語句或是表結(jié)構(gòu)的性能瓶頸。EXPLAIN 的查詢結(jié)果還會(huì)告訴你你的索引主鍵被如何利用的,你的數(shù)據(jù)表是如何被搜索和排序的……等等,等等。 48. 當(dāng)只要一行數(shù)據(jù)時(shí)使用 LIMIT 1 當(dāng)你查詢表的有些時(shí)候,你已經(jīng)知道結(jié)果只會(huì)有一條結(jié)果,但因?yàn)槟憧赡苄枰etch游標(biāo),或是你也許會(huì)去檢查返回的記錄數(shù)。在這種情況下,加上 LIMIT 1 可以增加性能。這樣一樣,MySQL數(shù)據(jù)庫引擎會(huì)在找到一條數(shù)據(jù)后停止搜索,而不是繼續(xù)往后查少下一條符合記錄的數(shù)據(jù)。 49. 選擇表合適存儲(chǔ)引擎: myisam: 應(yīng)用時(shí)以讀和插入操作為主,只有少量的更新和刪除,并且對事務(wù)的完整性,并發(fā)性要求不是很高的。 Innodb:事務(wù)處理,以及并發(fā)條件下要求數(shù)據(jù)的一致性。除了插入和查詢外,包括很多的更新和刪除。(Innodb有效地降低刪除和更新導(dǎo)致的鎖定)。對于支持事務(wù)的InnoDB類型的表來說,影響速度的主要原因是AUTOCOMMIT默認(rèn)設(shè)置是打開的,而且程序沒有顯式調(diào)用BEGIN 開始事務(wù),導(dǎo)致每插入一條都自動(dòng)提交,嚴(yán)重影響了速度??梢栽趫?zhí)行sql前調(diào)用begin,多條sql形成一個(gè)事物(即使autocommit打開也可以),將大大提高性能。 50. 優(yōu)化表的數(shù)據(jù)類型,選擇合適的數(shù)據(jù)類型: 原則:更小通常更好,簡單就好,所有字段都得有默認(rèn)值,盡量避免null。 例如:數(shù)據(jù)庫表設(shè)計(jì)時(shí)候更小的占磁盤空間盡可能使用更小的整數(shù)類型.(mediumint就比int更合適) 比如時(shí)間字段:datetime和timestamp, datetime占用8個(gè)字節(jié),而timestamp占用4個(gè)字節(jié),只用了一半,而timestamp表示的范圍是1970—2037適合做更新時(shí)間 MySQL可以很好的支持大數(shù)據(jù)量的存取,但是一般說來,數(shù)據(jù)庫中的表越小,在它上面執(zhí)行的查詢也就會(huì)越快。 因此,在創(chuàng)建表的時(shí)候,為了獲得更好的性能,我們可以將表中字段的寬度設(shè)得盡可能小。例如, 在定義郵政編碼這個(gè)字段時(shí),如果將其設(shè)置為CHAR(255),顯然給數(shù)據(jù)庫增加了不必要的空間, 甚至使用VARCHAR這種類型也是多余的,因?yàn)镃HAR(6)就可以很好的完成任務(wù)了。同樣的,如果可以的話, 我們應(yīng)該使用MEDIUMINT而不是BIGIN來定義整型字段。 應(yīng)該盡量把字段設(shè)置為NOT NULL,這樣在將來執(zhí)行查詢的時(shí)候,數(shù)據(jù)庫不用去比較NULL值。 對于某些文本字段,例如“省份”或者“性別”,我們可以將它們定義為ENUM類型。因?yàn)樵贛ySQL中,ENUM類型被當(dāng)作數(shù)值型數(shù)據(jù)來處理, 而數(shù)值型數(shù)據(jù)被處理起來的速度要比文本類型快得多。這樣,我們又可以提高數(shù)據(jù)庫的性能。 51. 字符串?dāng)?shù)據(jù)類型:char,varchar,text選擇區(qū)別 作者:SimpleWu |
|