Python是一種功能強大的編程語言,它可以用來實現各種不同的任務,包括爬取源代碼。在這篇文章中,我們將介紹如何使用Python爬取網站的源代碼。
import requests # 定義要爬取的網址 url = 'https://www.baidu.com' # 發送HTTP請求 response = requests.get(url) # 輸出網頁源代碼 print(response.text)
在上面的代碼示例中,我們先定義了要爬取的網址(這里我們選擇百度),然后使用Python的requests庫發送HTTP請求,并將返回的響應存在response變量中。使用response.text可以獲取到網頁的源代碼,最后將源代碼輸出。
當然,這只是一個簡單的示例,如果要爬取更多的網頁源代碼,需要使用循環語句和其他方法。同時,你也需要注意法律和倫理問題,確保你的爬蟲程序不會侵犯任何人的權利。