Python是一門廣泛使用的編程語言,它可以幫助我們輕松地爬取網站上的數據。然而,有些網站的數據是以JavaScript(.js)形式呈現的,這就需要我們采用不同的方法來爬取這些數據。
下面是一個使用Python爬取.js的例子:
from selenium import webdriver import time # 初始化一個Chrome瀏覽器驅動 driver = webdriver.Chrome() # 用Chrome瀏覽器訪問目標網站 driver.get("https://example.com") # 等待頁面加載完全 time.sleep(3) # 使用JavaScript獲取頁面上特定的數據 result = driver.execute_script("return document.getElementsByClassName('target-class')[0].innerHTML") # 打印獲取到的數據 print(result) # 關閉Chrome瀏覽器 driver.quit()
上面的代碼使用了Selenium庫來驅動Chrome瀏覽器,并使用execute_script()方法執行了一段JavaScript代碼來獲取頁面上特定的類名為target-class的元素的innerHTML值。獲取到的數據可以進一步處理,例如存入文件或數據庫中。
需要注意的是,爬取網站上的數據,一定要遵守法律法規,尊重網站的知識產權,不要做出侵犯他人利益的行為。
上一篇c 怎么序列化json
下一篇python 矩陣a 1