最近很多人都在用Python進行數據分析、爬蟲等操作,有時我們需要抓取某些數據進行分析。今天我來介紹一下如何使用Python來抓取妹子圖。
#導入所需模塊 import requests import re import os #定義一個函數,用來爬取某一頁的圖片 def get_one_page(url): #設置headers,防止網站反爬蟲 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36' } #請求url response = requests.get(url,headers=headers) #設置正則表達式,匹配圖片地址 pattern = re.compile('',re.S) #獲取圖片地址 result = re.findall(pattern,response.text) #遍歷所有圖片地址,并保存圖片 for imgUrl in result: imgName = imgUrl.split('/')[-1] with open(imgName,'wb') as f: f.write(requests.get(imgUrl).content) print(imgName,'保存成功') #定義一個函數,用來爬取多頁的圖片 def get_many_page(start,end): #遍歷所有頁數 for i in range(start,end+1): url = 'https://www.mzitu.com/page/'+str(i)+'/' #調用函數獲取某一頁的圖片 get_one_page(url) print('第',i,'頁爬取完成') #主函數 if __name__ == '__main__': #設置起始頁和結束頁 start = int(input('請輸入起始頁:')) end = int(input('請輸入結束頁:')) get_many_page(start,end)
以上就是如何使用Python抓取妹子圖的代碼。需要注意的是,爬蟲會消耗網站及網絡資源,且有違法風險,請勿過分依賴、濫用。