色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

css選擇器標(biāo)簽選擇器,jsoup爬蟲的優(yōu)點(diǎn)

老白2年前80瀏覽0評論

JSoup是現(xiàn)在比較火的爬取數(shù)據(jù)的技術(shù),因?yàn)槠浜唵斡行В瑢τ趯W(xué)習(xí)過JS,JQuery的開發(fā)人員比較容易。現(xiàn)在爬蟲技術(shù)一般都是通過HTTPClient進(jìn)行獲取頁面源碼,然后通過JSoup進(jìn)行解析HTML頁面。

JSoup是一款Java的HTML解析器,主要用來對HTML解析。

JSoup的特點(diǎn)?

JSoup可以對Html頁面字符串,文件,URL進(jìn)行爬取并解析HTML。

JSoup可以利用DOM或則CSS選擇器來查找標(biāo)簽進(jìn)行獲取數(shù)據(jù)

JSoup可以通過attr進(jìn)行標(biāo)簽屬性的更改

JSoup可以通過白名單來清理用戶提交的內(nèi)容,防止XSS攻擊。

css里大于號表示css3特有的子元素選擇器;子元素選擇器只能選擇作為某元素子元素的元素;如果你不希望選擇任意的后代元素,而是希望縮小范圍,只選擇某個元素的子元素,就可以使用子元素選擇器

css指的是層疊樣式表(Cascading Style Sheets),它是一種用來表現(xiàn)html或XML等文件樣式的計(jì)算機(jī)語言,是用來表示html樣式的一種編程語言,是可以做到網(wǎng)頁和內(nèi)容進(jìn)行分離的一種樣式語言。

css中大于符號

css中大于符號(“>”)代表的是css3特有的子元素選擇器(element>element )。子元素選擇器(Child selectors)只能選擇作為某元素子元素的元素。

如果你不希望選擇任意的后代元素,而是希望縮小范圍,只選擇某個元素的子元素,請使用子元素選擇器(Child selector)。

BCD B 比如class類型 class = "nav"的話 那么css對應(yīng) .nav{} C 比如 body input 就是直接對應(yīng) body{} input{} D ID選擇器 id="name" 那么css對應(yīng) #name{}

選擇器的種類可以分為三種:標(biāo)簽名選擇器、類選擇器和ID選擇器。

類選擇器和標(biāo)簽名選擇器的不同,類選擇器是自己定義的,如class="aaa";標(biāo)簽名選擇器是html已經(jīng)規(guī)定好的標(biāo)簽名,如a標(biāo)簽是鏈接,h1是標(biāo)題,img是圖片,它們有默認(rèn)的一些樣式