Go語言中常用的編碼格式有JSON、XML等。這里我們介紹使用Go語言解析HTML中的JSON數據。HTML中的JSON數據通常被嵌入在script標簽中的textContent中。
package main
import (
"fmt"
"strings"
"github.com/PuerkitoBio/goquery"
)
func main() {
htmlData := `
<html>
<body>
<div id="myData">
<script>
var data = {"name": "Tom", "age": 18};
</script>
</div>
</body>
</html>
`
reader := strings.NewReader(htmlData)
doc, err := goquery.NewDocumentFromReader(reader)
if err != nil {
panic(err)
}
scriptContents := doc.Find("#myData script").Text()
jsonData := strings.TrimPrefix(scriptContents, "var data = ")
fmt.Println(jsonData)
}
在上述代碼中,我們使用goquery庫來解析HTML數據,并通過CSS選擇器找到含有JSON數據的script標簽。Python中也有類似用途的庫,比如Beautiful Soup。
最終,我們獲得了JSON格式的數據,并可以使用Go語言中的json庫來進一步處理它。