之前做過(guò)一個(gè)每天訪問(wèn)量達(dá)到800w的系統(tǒng),簡(jiǎn)單說(shuō)下自己的見(jiàn)解!
從整個(gè)應(yīng)用系統(tǒng)來(lái)看,想要支持超高并發(fā)量,負(fù)載均衡,緩存,消息中間件,數(shù)據(jù)庫(kù)讀寫(xiě)分離,分庫(kù)分表等必不可少,既然文章只問(wèn)了數(shù)據(jù)庫(kù)系統(tǒng),那就只談數(shù)據(jù)庫(kù)!
數(shù)據(jù)庫(kù)層面,一般無(wú)外乎是主從復(fù)制,讀寫(xiě)分離,分庫(kù)分表這些東西!
1,從單臺(tái)數(shù)據(jù)庫(kù)性能來(lái)看,單個(gè)mysql實(shí)例最大連接數(shù)為16384,就是說(shuō)在同一時(shí)間最多能容納那么多的訪問(wèn)量,同時(shí)受服務(wù)器CPU,內(nèi)存,硬盤(pán)等的影響,但是在實(shí)際應(yīng)用中能達(dá)到2000就不錯(cuò)了!
需要使用druid等數(shù)據(jù)庫(kù)監(jiān)控中間件,實(shí)時(shí)的監(jiān)控?cái)?shù)據(jù)庫(kù)連接,sql效率等各種指標(biāo),在達(dá)到瓶頸之前找到辦法,show status;這個(gè)指令也可以方便的查看數(shù)據(jù)庫(kù)實(shí)例的各項(xiàng)指標(biāo)
單臺(tái)數(shù)據(jù)庫(kù)實(shí)例配置最優(yōu)化是保證整個(gè)數(shù)據(jù)庫(kù)集群最優(yōu)化的基本保證!
2,數(shù)據(jù)庫(kù)集群:以分庫(kù)分表為例,分庫(kù)分表的方式有很多,比如mycat,Sharding-jdbc等。
分庫(kù)分表的思想很簡(jiǎn)單,比如單表1億的數(shù)據(jù)量,查詢效率很低,如果使用8庫(kù)1024表拆分,每張表中的數(shù)據(jù)不會(huì)超過(guò)10萬(wàn),對(duì)數(shù)據(jù)庫(kù)來(lái)說(shuō)不存在任何瓶頸,就算總數(shù)據(jù)量達(dá)到100億,單表的查詢也不會(huì)慢!
拆分的策略通常以某個(gè)全局唯一的業(yè)務(wù)主鍵使用某種方式(比如hash取模,按月份等等)進(jìn)行分庫(kù)分表的計(jì)算!
那么問(wèn)題來(lái)了,全局唯一的字段怎么獲???普通的數(shù)據(jù)庫(kù)主鍵自增,uuid等不再合適,可以使用redis,zookeeper等獲取全局唯一的id,具體可參見(jiàn)之前的其他回答!
問(wèn)題:分庫(kù)分表之后存在跨庫(kù)join的問(wèn)題,通常的解決方式為1,盡量使用分庫(kù)分表主鍵能保證在同一庫(kù),同一類(lèi)型的表中進(jìn)行連接查詢,2,增加專(zhuān)門(mén)的查詢庫(kù):將常用的數(shù)據(jù)字段冗余到查詢庫(kù)中,方便連接查詢和常用字段的快速查詢;
4,sql優(yōu)化:最基本的條件查詢,count,分組等使用索引字段等避免全局查詢,避免null值判斷,避免使用not in,避免無(wú)效的like語(yǔ)句,避免查詢的時(shí)候使用函數(shù)操作等等!
5,像秒殺系統(tǒng)等這種瞬時(shí)高并發(fā),最好借助緩存系統(tǒng)來(lái)完成!
總而言之,數(shù)據(jù)庫(kù)是整個(gè)應(yīng)用系統(tǒng)當(dāng)中最核心,也是最容易出問(wèn)題的地方,做好監(jiān)控,提前預(yù)防才能保證系統(tǒng)訪問(wèn)量的增長(zhǎng)!