Python爬蟲技術可以讓我們輕松地獲取網絡上的數據,包括各種圖片資源。本文將介紹如何使用Python爬蟲獲取貼吧中的圖片。
import requests from bs4 import BeautifulSoup # 定義函數,傳入url參數和目標文件夾路徑 def download_pictures(url, folder_path): # 發送請求獲取網頁內容 response = requests.get(url) # 使用BeautifulSoup解析網頁 soup = BeautifulSoup(response.text, 'html.parser') # 查找所有圖片鏈接 img_tags = soup.find_all('img', class_='BDE_Image') # 循環下載圖片 for img in img_tags: img_url = img['src'] # 發送請求下載圖片 img_data = requests.get(img_url).content # 構造文件名 file_name = img_url.split('/')[-1] # 保存圖片 with open(folder_path + file_name, 'wb') as f: f.write(img_data) # 調用函數,傳入url和保存路徑 download_pictures('https://tieba.baidu.com/p/123456789', './pictures/')
上述代碼使用requests庫發送請求獲取貼吧頁面內容,并使用BeautifulSoup解析網頁。然后再通過查找所有圖片鏈接,逐個下載圖片,并保存到指定文件夾下。在調用函數時,只需要傳入需要下載的貼吧帖子的url和保存路徑即可。