BeautifulSoup是一個Python庫,主要用于從HTML或XML文件中提取數據、解析數據、或者進行數據操作。而JSON(JavaScript Object Notation)是一種輕量級和易于理解的數據交換格式。在BeautifulSoup中,我們可以使用JSON格式進行數據操作和解析。
import requests import json from bs4 import BeautifulSoup url = 'https://api.github.com/users/octocat' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} resp = requests.get(url, headers=headers) soup = BeautifulSoup(resp.text, 'html.parser') json_data = json.loads(str(soup)) print(json_data['login'])
在上述代碼中,我們首先定義了一個URL地址,并設置了請求頭,使用Requests庫獲取該URL地址的頁面源代碼。然后,利用BeautifulSoup庫將頁面源代碼解析成一個BeautifulSoup對象,接著將該對象轉換成JSON格式數據,并使用Python內置的JSON庫進行解析和操作,最后輸出該用戶的登錄名。
總之,使用BeautifulSoup和JSON格式數據,我們可以輕松地獲取和解析HTML或XML文件中的數據,以及進行數據操作和處理。
上一篇bean轉為json
下一篇css3扇形圖百分比