眾所周知,獲取當前網頁的域名非常簡單,只需要使用JavaScript的location對象中的hostname屬性就行了。但是,如果我們需要獲取某個網址的頂級域名,常規方法就無法滿足我們的需求。
那么什么是頂級域名呢?頂級域名指的是在域名中最后一個“.”之后的部分。比如說,“www.baidu.com”這個域名的頂級域名就是“com”,“www.google.com.hk”這個域名的頂級域名就是“hk”。
為了更好地理解問題,下面我們舉一個具體例子:假設我們要獲取“abc.sina.com.cn”這個網址的頂級域名。根據常規方法,我們使用location對象獲取其域名,“sina.com.cn”,然后再去解析這個域名,可能需要使用正則表達式進行匹配處理,才能夠得到其頂級域名“cn”。這個過程雖然不難,但是卻比較繁瑣,并且容易出錯。
function getTopLevelDomain(url) { var regex = /^https?:\/\/(?:[^.]+\.)?([^.]+\.[^.]+)/; var matches = url.match(regex); if (matches) { return matches[1]; } return null; } var url = "http://abc.sina.com.cn/index.html"; var topLevelDomain = getTopLevelDomain(url); console.log(topLevelDomain); // cn
上面的代碼使用了正則表達式來匹配域名,并且使用了match函數來獲取匹配結果。雖然這個方法可以解決問題,但是存在一些缺點。首先,正則表達式的編寫難度較大,需要考慮多種情況;其次,如果我們要對多個網址進行處理,需要不斷地調用這個函數,效率也并不高。
那么有沒有一種更加簡便的方法呢?答案是肯定的。我們可以借助于JavaScript提供的URL對象來獲取頂級域名。這個對象可以幫助我們解析網址,獲取其中各個部分的信息。
function getTopLevelDomain(url) { var u = new URL(url); var domainParts = u.hostname.split("."); if (domainParts.length >= 2) { return domainParts[domainParts.length - 2] + "." + domainParts[domainParts.length - 1]; } return null; } var url = "http://abc.sina.com.cn/index.html"; var topLevelDomain = getTopLevelDomain(url); console.log(topLevelDomain); // sina.com.cn
這個方法的思路非常簡單,就是先使用URL對象來解析網址,然后獲取其hostname屬性,再將其按照“.”進行切割,取最后兩個部分,拼接在一起就是頂級域名。這樣的方法不僅簡單易懂,而且效率也較高。而且,如果我們要處理多個網址,也可以直接構造URL對象,而不需要在每個網址上都調用函數。
需要注意的是,這個方法只適用于瀏覽器環境,如果要在Node.js環境下獲取頂級域名,需要使用第三方模塊,如“tldjs”。
總之,獲取頂級域名是在Web開發中經常遇到的問題,我們可以通過借助于JavaScript的URL對象來解決這個問題,并且這個方法比正則表達式更加簡單明了,大大提高了代碼的可讀性。