Python是一種非常強大的編程語言,也是現代Web爬蟲的首選編程語言之一。在接下來的文章中,我們將介紹如何使用Python爬取攜程網站的數據。
# 導入相關庫 import requests from bs4 import BeautifulSoup # 攜程網址及請求頭部 url = 'https://www.ctrip.com/' header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36'} # 獲取網頁源代碼 response = requests.get(url, headers=header) html = response.content # 解析網頁源代碼 soup = BeautifulSoup(html, 'html.parser') # 獲取酒店排名信息 hotel_rank = soup.find_all('a', class_='rank-list-title') for hotel in hotel_rank: print(hotel.text)
以上代碼使用requests庫發送請求并獲得攜程網站的源代碼,然后使用BeautifulSoup庫解析網頁源代碼。然后,我們從攜程網站上獲取酒店排名信息并輸出。這是在爬取攜程網站時的一個簡單例子。
總之,使用Python爬取攜程網站的方法有很多,代碼隨時可以進行修改和調試,這需要您熟練掌握Python的基礎知識以及Web爬蟲的相關知識。使用Python爬取攜程網站的過程中還要注意遵守相關法律法規。
上一篇python 爬取新冠
下一篇python 爬取rss