如果您需要從網頁中提取JSON數據,那么使用BeautifulSoup庫是您的最佳選擇。BeautifulSoup是一個強大的Python庫,它可以將HTML和XML文檔轉換為Python對象。下面是使用BeautifulSoup提取JSON數據的方法。
# 導入庫 from bs4 import BeautifulSoup import json # 創建示例HTML文檔 html_doc = '''示例網頁 以下是JSON數據:
{ "name": "張三", "age": 25, "gender": "男", "interests": [ "音樂", "電影", "運動" ] }''' # 解析HTML文檔 soup = BeautifulSoup(html_doc, 'html.parser') # 查找pre標簽 json_data = soup.find('pre').string # 將JSON數據轉換為Python對象 python_data = json.loads(json_data) # 打印Python對象 print(python_data)
上述代碼的兩個關鍵步驟是使用BeautifulSoup查找pre標簽,并使用json.loads方法將JSON數據轉換為Python對象。由于JSON數據在pre標簽中作為字符串出現,我們需要使用.string屬性來獲取它。
使用BeautifulSoup提取JSON數據是一種簡單而有效的方法。尤其是在處理大量數據時,它可以讓您輕松地將不同的數據類型轉換為Python對象。