Python 爬蟲是目前很火的一種應用,可以用于抓取網站上各種數據。其中,爬圖和文字是兩種重要的爬蟲實現。下面我們介紹一下如何使用 Python 進行爬圖和文字。
import requests
from bs4 import BeautifulSoup
# 爬取圖片
url = 'https://www.example.com'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
imgs = soup.find_all('img')
for img in imgs:
img_url = img.attrs.get('src')
if img_url and 'http' in img_url:
img_data = requests.get(img_url).content
with open('img.jpg', 'wb') as f:
f.write(img_data)
# 爬取文字
url = 'https://www.example.com'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
text = soup.get_text()
with open('text.txt', 'a', encoding='utf-8') as f:
f.write(text)
以上代碼就是簡單的 Python 爬蟲示例,可以幫助我們快速實現爬圖和文字的功能。不過,需要注意的是,爬蟲需要合法,不可用于非法用途,否則將會產生法律后果。