dataframe是一種常用的數(shù)據(jù)結(jié)構(gòu),可以方便地對(duì)數(shù)據(jù)進(jìn)行處理和分析。而在處理數(shù)據(jù)時(shí),json格式的數(shù)據(jù)也是非常常見(jiàn),因此了解如何用dataframe讀取數(shù)組json數(shù)據(jù)是非常有用的。
在pandas中,利用read_json方法可以讀取json格式的數(shù)據(jù)。當(dāng)json數(shù)據(jù)為數(shù)組形式時(shí),需要設(shè)置參數(shù)lines為T(mén)rue,這樣pandas才能一行一行地讀取數(shù)據(jù)。
import pandas as pd # 讀取json數(shù)據(jù) df = pd.read_json('data.json', lines=True) # 查看讀取的數(shù)據(jù) print(df)
上述代碼中,我們使用pandas讀取了名為data.json的文件,并設(shè)置參數(shù)lines為T(mén)rue。files.json中的數(shù)據(jù)為數(shù)組形式,pandas將讀取各個(gè)元素,并生成一個(gè)dataframe對(duì)象。
在讀取數(shù)據(jù)后,我們可以利用pandas提供的各種方法對(duì)數(shù)據(jù)進(jìn)行處理和分析。例如,我們可以使用head()方法查看前幾行數(shù)據(jù)。
# 查看前5行數(shù)據(jù) print(df.head())
除了讀取文件外,我們還可以將數(shù)組json數(shù)據(jù)轉(zhuǎn)化為字符串形式,并用read_json函數(shù)讀取該字符串。
import pandas as pd # 定義數(shù)組json數(shù)據(jù) data = '[{"name":"shirley","age": 21,"score": 89},{"name": "bob","age": 19, "score": 76}]' # 讀取數(shù)組json數(shù)據(jù) df = pd.read_json(data) # 查看讀取的數(shù)據(jù) print(df)
在上述代碼中,我們定義了一個(gè)數(shù)組json數(shù)據(jù),并將其轉(zhuǎn)化為字符串形式,并最后用read_json函數(shù)讀取該字符串。這種方法同樣可以讀取數(shù)組json數(shù)據(jù)。
總之,使用dataframe讀取數(shù)組json數(shù)據(jù)是非常簡(jiǎn)單的。我們只需要使用pandas提供的read_json方法,并設(shè)置lines參數(shù)為T(mén)rue即可。然后就可以通過(guò)各種pandas方法對(duì)數(shù)據(jù)進(jìn)行處理和分析。