session的概念什么是session?服務器為每個用戶創建一個會話,存儲用戶的相關信息,以便多次請求能夠定位到同一個上下文。這樣,當用戶在應用程序的 Web 頁之間跳轉時,存儲在 Session 對象中的變量將不會丟失,而是在整個用戶會話中一直存在下去。當用戶請求來自應用程序的 Web 頁時,如果該用戶還沒有會話,則 Web 服務器將自動創建一個 Session 對象。當會話過期或被放棄后,服務器將終止該會話。Web開發中,web-server可以自動為同一個瀏覽器的訪問用戶自動創建session,提供數據存儲功能。最常見的,會把用戶的登錄信息、用戶信息存儲在session中,以保持登錄狀態。什么是session一致性問題?只要用戶不重啟瀏覽器,每次http短連接請求,理論上服務端都能定位到session,保持會話。分布式session單服務器web應用中,session信息只需存在該服務器中,這是我們前幾年最常接觸的方式,但是近幾年隨著分布式系統的流行,單系統已經不能滿足日益增長的百萬級用戶的需求,集群方式部署服務器已在很多公司運用起來,當高并發量的請求到達服務端的時候通過負載均衡的方式分發到集群中的某個服務器,這樣就有可能導致同一個用戶的多次請求被分發到集群的不同服務器上,就會出現取不到session數據的情況,于是session的共享就成了一個問題。如上圖,假設用戶包含登錄信息的session都記錄在第一臺web-server上,反向代理如果將請求路由到另一臺web-server上,可能就找不到相關信息,而導致用戶需要重新登錄。Session一致性解決方案1.session復制(同步) 思路:多個web-server之間相互同步session,這樣每個web-server之間都包含全部的session優點:web-server支持的功能,應用程序不需要修改代碼不足:
session的同步需要數據傳輸,占內網帶寬,有時延
所有web-server都包含所有session數據,數據量受內存限制,無法水平擴展
有更多web-server時要歇菜
2.客戶端存儲法 思路:服務端存儲所有用戶的session,內存占用較大,可以將session存儲到瀏覽器cookie中,每個端只要存儲一個用戶的數據了優點:服務端不需要存儲缺點:
每次http請求都攜帶session,占外網帶寬
數據存儲在端上,并在網絡傳輸,存在泄漏、篡改、竊取等安全隱患
session存儲的數據大小受cookie限制
“端存儲”的方案雖然不常用,但確實是一種思路。 3.反向代理hash一致性 思路:web-server為了保證高可用,有多臺冗余,反向代理層能不能做一些事情,讓同一個用戶的請求保證落在一臺web-server上呢? 方案一:四層代理hash反向代理層使用用戶ip來做hash,以保證同一個ip的請求落在同一個web-server上 方案二:七層代理hash反向代理使用http協議中的某些業務屬性來做hash,例如sid,city_id,user_id等,能夠更加靈活的實施hash策略,以保證同一個瀏覽器用戶的請求落在同一個web-server上優點:
只需要改nginx配置,不需要修改應用代碼
負載均衡,只要hash屬性是均勻的,多臺web-server的負載是均衡的
可以支持web-server水平擴展(session同步法是不行的,受內存限制)
不足:
如果web-server重啟,一部分session會丟失,產生業務影響,例如部分用戶重新登錄
如果web-server水平擴展,rehash后session重新分布,也會有一部分用戶路由不到正確的session
session一般是有有效期的,所有不足中的兩點,可以認為等同于部分session失效,一般問題不大。對于四層hash還是七層hash,個人推薦前者:讓專業的軟件做專業的事情,反向代理就負責轉發,盡量不要引入應用層業務屬性,除非不得不這么做(例如,有時候多機房多活需要按照業務屬性路由到不同機房的web-server)。 4.后端統一集中存儲 思路:將session存儲在web-server后端的存儲層,數據庫或者緩存優點:
沒有安全隱患
可以水平擴展,數據庫/緩存水平切分即可
web-server重啟或者擴容都不會有session丟失
不足:增加了一次網絡調用,并且需要修改應用代碼對于db存儲還是cache,個人推薦后者:session讀取的頻率會很高,數據庫壓力會比較大。如果有session高可用需求,cache可以做高可用,但大部分情況下session可以丟失,一般也不需要考慮高可用。 總結保證session一致性的架構設計常見方法:
session同步法:多臺web-server相互同步數據
客戶端存儲法:一個用戶只存儲自己的數據
反向代理hash一致性:四層hash和七層hash都可以做,保證一個用戶的請求落在一臺web-server上
后端統一存儲:web-server重啟和擴容,session也不會丟失
對于方案3和方案4,個人建議推薦后者:
web層、service層無狀態是大規模分布式系統設計原則之一,session屬于狀態,不宜放在web層
讓專業的軟件做專業的事情,web-server存session?還是讓cache去做這樣的事情吧。