如何通過網絡爬蟲獲取網站相關數據

如何通過網絡爬蟲獲取網站相關數據？

1、在站內尋找API入口；

2、用搜索引擎搜索“某網站API”；

3、抓包，有的網站雖然用到了ajax，但是通過抓包還是能夠獲取XHR里的json數據的（可用抓包工具抓包，也可以通過瀏覽器按F12抓包：F12-Network-F5刷新）。二、不開放API的網站1、如果網站是靜態頁面，那么可以用requests庫發送請求，再通過HTML解析庫（lxml、parsel等）來解析響應的text；解析庫強烈推薦parsel，不僅語法和css選擇器類似，而且速度也挺快，Scrapy用的就是它。2、如果網站是動態頁面，可以先用selenium來渲染JS，再用HTML解析庫來解析driver的page_source。

上一篇java語言常用的英語單詞都有哪些

下一篇ASUS路由ftp登不上

色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

網站導航

網站導航

網站分類

如何通過網絡爬蟲獲取網站相關數據

色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

網站導航

網站導航

網站分類

如何通過網絡爬蟲獲取網站相關數據

相關文章