Python的數據框(DataFrame)是一個非常常用的數據結構,它以表格的形式存儲數據,可以用于數據分析、處理、轉換等工作。數據框可以用pandas庫來創建和管理。其中,pandas庫是Python數據直觀和處理庫中最重要的一個。
要使用pandas庫創建數據框,首先需要導入該庫,然后使用DataFrame()函數來創建。以下是一個簡單的例子,可以創建一個名為“df”的數據框:
import pandas as pd df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'Dave'], 'Age': [24, 25, 23, 22], 'Country': ['USA', 'Canada', 'Australia', 'England']})
在上面的代碼中,我們創建了一個包含4個員工的數據框,每個員工擁有3組信息,分別是名字、年齡以及國家/地區。接下來,我們可以使用print()函數將數據框打印出來:
print(df)
執行以上命令,將會得到如下輸出結果:
Name Age Country 0 Alice 24 USA 1 Bob 25 Canada 2 Charlie 23 Australia 3 Dave 22 England
在這個數據框中,每個員工作為一行,而每個員工的信息則以列的形式呈現。
在數據框中,我們也可以使用許多其他的函數來實現對數據集的操作,如篩選、排序、聚合等。除此之外,pandas庫還提供了許多其他用于數據操作和清理的函數。