Python爬蟲是一種自動化抓取互聯網數據的工具,Python作為一門易學易用的編程語言,被廣泛應用于爬蟲領域。下面是一段簡單的Python爬蟲代碼:
import requests from bs4 import BeautifulSoup url = 'https://www.example.com' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) html = response.content.decode('utf-8') soup = BeautifulSoup(html, 'html.parser') title = soup.find('title').text print(title)
這段代碼中,我們使用了Python的requests庫發起了一個get請求,獲取了網頁的html內容。然后使用BeautifulSoup庫對html文檔進行解析,根據標簽名稱獲取了網頁的標題,并將其打印出來。
通過Python爬蟲,我們可以方便地獲取互聯網上的各種數據,為數據分析、機器學習等領域提供更多的數據資源。
上一篇docker json
下一篇python 相鄰兩數差