色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

beautifulsoup轉(zhuǎn)json

錢良釵2年前9瀏覽0評論

Python中的BeautifulSoup庫可以用來解析HTML/XML文檔。它提供了諸如查找、修改、遍歷 HTML/XML 樹的功能。

不過通常我們在處理數(shù)據(jù)時需要將其轉(zhuǎn)換成JSON格式,以方便后續(xù)的操作。下面是一個使用BeautifulSoup將HTML轉(zhuǎn)換成JSON格式的例子:

from bs4 import BeautifulSoup
import json
html_doc = <<<EOF
<html>
<head>
<title>Welcome to my blog</title>
</head>
<body>
<div id="post-container">
<div class="post">
<h2>My first post</h2>
<p>This is my first blog post. I hope you like it!</p>
</div>
<div class="post">
<h2>My second post</h2>
<p>This is my second blog post. I hope you like it too!</p>
</div>
</div>
</body>
</html>
EOF
soup = BeautifulSoup(html_doc, 'html.parser')
posts = []
for post in soup.find_all('div', class_='post'):
title = post.h2.text
content = post.p.text
posts.append({'title': title, 'content': content})
print(json.dumps(posts))

上面的代碼將HTML文檔中所有帶有class="post"的div元素的標題和內(nèi)容提取出來,并將其轉(zhuǎn)換成JSON格式。最后輸出了轉(zhuǎn)換后的JSON字符串。

使用BeautifulSoup將HTML文檔轉(zhuǎn)換成JSON格式非常方便,只需要遍歷HTML DOM樹,提取出需要的信息,然后將其轉(zhuǎn)換成JSON格式即可。