Python 是一種高效的編程語言,可以用來編寫網絡爬蟲來獲取網絡圖片。Python 有三個庫可用于創建網絡爬蟲:urllib,requests 和 Beautiful Soup。
我們將使用 requests 庫作為我們的網絡爬蟲,因為它可以與 Beautiful Soup 配合使用來解析 HTML 頁面。
import requests from bs4 import BeautifulSoup #替換成你要爬取的地址 url = 'https://www.example.com/' #訪問頁面 r = requests.get(url) #使用 Beautiful Soup 解析 HTML 頁面 soup = BeautifulSoup(r.content, 'html.parser') #找到所有的 img 標簽 images = soup.find_all('img') #創建一個空列表來存儲我們獲取的圖片 image_urls = [] #循環遍歷所有的 img 標簽 for image in images: #獲取圖片的 URL src = image['src'] #將圖片的 URL 添加到 image_urls 列表中 image_urls.append(src) #循環遍歷所有的圖片 URL for url in image_urls: #下載圖片 r = requests.get(url) #獲取圖片的文件名 filename = url.split('/')[-1] #保存圖片到本地 with open(filename, 'wb') as f: f.write(r.content) print(f"圖片 {filename} 已經保存到本地!")
上述代碼將首先訪問指定 URL 的頁面,然后使用 Beautiful Soup 解析 HTML 頁面。我們會使用 find_all 方法來找到頁面上的所有 img 標簽,并使用 for 循環遍歷 img 標簽獲取它的 URL,將獲取到的 URL 保存到 image_urls 列表中。
最后,我們再次使用一個 for 循環來遍歷我們存儲的所有 URL,并下載每個圖片。將圖片保存到本地的代碼位于 with open 語句內,這將創建一個名為 filename 的文件并將圖片寫入文件。