Java具有很強大的JSON處理能力,可以很方便地將HTML轉化為JSON格式數據。
使用Java將HTML轉化為JSON需要使用到json庫,最常用的有Gson、Jackson等。
下面我們以Gson庫為例來介紹如何將HTML轉化為JSON。
public static String html2json(String html) {
Document doc = Jsoup.parse(html);
Elements elements = doc.getAllElements();
JsonObject jsonObject = new JsonObject();
for (Element element : elements) {
JsonObject innerObject = new JsonObject();
if (element.hasAttr("id")) innerObject.addProperty("id", element.attr("id"));
if (element.hasAttr("class")) innerObject.addProperty("className", element.attr("class"));
innerObject.addProperty("text", element.text());
jsonObject.add(element.tagName(), innerObject);
}
return new Gson().toJson(jsonObject);
}
以上代碼首先使用Jsoup庫將HTML解析為Document對象,然后遍歷所有元素,將元素的ID、class、text等屬性加入到Json 對象中,最后將處理好的Json轉換為字符串返回即可。
需要注意的是,這種將HTML轉化為JSON的方式僅僅只是針對HTML中的標簽進行轉化,不包含樣式/JS等信息。