補充:推薦一個Python新數據可視化模塊——PlotlyExpress。
PlotlyExpress
PlotlyExpress是一個新的高級Python數據可視化庫,它是Plotly.py的高級封裝,它為復雜的圖表提供了一個簡單的語法。只需一次導入,大多數繪圖只要一個函數調用,接受一個整潔的Pandasdataframe,就可以創建豐富的交互式繪圖。
PlotlyExpress安裝
慣例,使用pip進行安裝。
pipinstallplotly_express
PlotlyExpress支持構建圖表類型
- scatter:在散點圖中,每行data_frame由2D空間中的符號標記表示。
- scatter_3d:在3D散點圖中,每行data_frame由3D空間中的符號標記表示。
- scatter_polar:在極坐標散點圖中,每行data_frame由極坐標中的符號標記表示。
- scatter_ternary:在三元散點圖中,每行data_frame由三元坐標中的符號標記表示。
- scatter_mapbox:在Mapbox散點圖中,每一行data_frame都由Mapbox地圖上的符號標記表示。
- scatter_geo:在地理散點圖中,每一行data_frame都由地圖上的符號標記表示。
- scatter_matrix:在散點圖矩陣(或SPLOM)中,每行data_frame由多個符號標記表示,在2D散點圖的網格的每個單元格中有一個,其將每對dimensions彼此相對繪制。
- density_contour:在密度等值線圖中,行data_frame被組合在一起成為輪廓標記,以可視化該值的聚合函數histfunc(例如,計數或總和)的2D分布z。
- density_heatmap:在密度熱圖中,行data_frame被組合在一起成為彩色矩形瓦片,以可視化該值的聚合函數histfunc(例如,計數或總和)的2D分布z。
- line:在2D線圖中,每行data_frame表示為2D空間中折線標記的頂點。
- line_polar:在極線圖中,每行data_frame表示為極坐標中折線標記的頂點。
- line_ternary:在三元線圖中,每行data_frame表示為三元坐標中折線標記的頂點。
- line_mapbox:在Mapbox線圖中,每一行都data_frame表示為Mapbox地圖上折線標記的頂點。
- line_geo:在地理線圖中,每一行都data_frame表示為地圖上折線標記的頂點。
- parallel_coordinates:在平行坐標圖中,每行data_frame由折線標記表示,該折線標記穿過一組平行軸,每個平行軸對應一個平行軸dimensions。
- parallel_categories:在并行類別(或平行集)圖中,每行data_frame與其他共享相同值的行組合,dimensions然后通過一組平行軸繪制為折線標記,每個平行軸對應一個dimensions。
- area:在堆積區域圖中,每行data_frame表示為2D空間中折線標記的頂點。連續折線之間的區域被填充。
- bar:在條形圖中,每行data_frame表示為矩形標記。
- bar_polar:在極坐標圖中,每一行都data_frame表示為極坐標中的楔形標記。
- violin:在小提琴圖中,將data_frame行分組成一個曲線標記,以便可視化它們的分布。
- box:在箱形圖中,行data_frame被組合在一起成為盒須標記,以顯示它們的分布。
- strip:在條形圖中,每一行都data_frame表示為類別中的抖動標記。
- histogram:在直方圖中,行data_frame被組合在一起成為矩形標記,以可視化該值的聚合函數histfunc(例如,計數或總和)的1D分布y(或者x如果orientation是'h')。
- choropleth:在等值區域圖中,每行data_frame由地圖上的彩色區域標記表示。
gapminder數據集說明
我們使用gapminder數據集進行體驗PlotlyExpress。
gapminder數據集顯示2007年按國家/地區的人均預期壽命和人均GDP之間的趨勢:包含1952~2007年世界各國家人口、GDP發展與/地區的人均預期壽命和人均GDP之間的趨勢。
- Country:國家,China
- Continent:洲,Asia
- Year:年份,1952
- LifeExp:預期壽命,44
- POP:人口,556263527
- GdpPercap:分均GDP,400.448611
- iso_alpha:國家編碼,CHN
- iso_num:國家代碼,156
上手體驗一下,輕松地進行數據可視化。
散點圖scatter
- data_frame:一個'整潔'pandas.DataFrame
- x:(字符串:列的名稱data_frame)此列中的值用于沿笛卡爾坐標沿x軸定位標記。對于水平histogram()s,這些值用作輸入histfunc。
- y:(字符串:列的名稱data_frame)此列中的值用于沿笛卡爾坐標中的y軸定位標記。對于垂直histogram()s,這些值用作輸入histfunc。
- color:(字符串:列的名稱data_frame)此列中的值用于為標記指定顏色。
- size:(字符串:列名稱data_frame)此列中的值用于指定標記大小。
- color_continuous_scale:(有效CSS顏色字符串列表)此列表用于在表示的列color包含數字數據時構建連續顏色標度。plotly_express.colors子模塊中有各種有用的色標,特別plotly_express.colors.sequential是plotly_express.colors.diverging和plotly_express.colors.cyclical。
- title:(字符串)圖標題。
- template:(字符串或Plotly.py模板對象)圖模板名稱或定義。
- width:(整數,默認None)圖形寬度(以像素為單位)。
- height:(整數,默認600)圖形高度(以像素為單位)。
地理散點圖scatter_geo
- data_frame:“整潔”pandas.DataFrame
- lat:(字符串:data_frame)此列的值用于根據地圖上的緯度定位標記。
- lon:(字符串:data_frame)此列的值用于根據地圖上的經度定位標記。
- locations:(字符串:data_frame)該列中的值將根據locationmode并映射到經度/緯度。
- locationmode:(字符串,“ISO-3”、“美國-州”、“國家名稱”之一)確定用于匹配locations地圖上的區域。
- color:(字符串:data_frame)此列的值用于為標記指定顏色。
- size:(字符串:data_frame)此列的值用于分配標記大小。
- color_continuous_scale:(有效的css-顏色字符串列表)此列表用于在color包含數字數據。中提供了各種有用的色標。plotly_express.colors子模塊,特別是plotly_express.colors.sequential,plotly_express.colors.diverging和plotly_express.colors.cyclical.
- title:(字符串)圖形標題。
- width:(整數,默認)None)以像素為單位的圖形寬度。
- height:(整數,默認)600)以像素為單位的圖形高度。
折線圖(line)
- data_frame:“整潔”pandas.DataFrame
- x:(字符串:data_frame)該列的值用于在笛卡爾坐標中沿x軸定位標記。臥式histogram(),這些值用作histfunc.
- y:(字符串:data_frame)該列的值用于在笛卡爾坐標中沿y軸定位標記。垂直histogram(),這些值用作histfunc.
- color:(字符串:data_frame)此列的值用于為標記指定顏色。
- facet_col:(字符串:data_frame)此列中的值用于在水平方向平面子圖分配標記。
- title:(字符串)圖形標題。
- width:(整數,默認)None)以像素為單位的圖形寬度。
- height:(整數,默認)600)以像素為單位的圖形高度。
條形圖(bar)
- data_frame:“整潔”pandas.DataFrame
- x:(字符串:data_frame)該列的值用于在笛卡爾坐標中沿x軸定位標記。臥式histogram(),這些值用作histfunc.
- y:(字符串:data_frame)該列的值用于在笛卡爾坐標中沿y軸定位標記。垂直histogram(),這些值用作histfunc.
- color:(字符串:data_frame)此列的值用于為標記指定顏色。
- facet_row:(字符串:data_frame)此列的值用于向垂直方向上的平面子圖分配標記。
- facet_col:(字符串:data_frame)此列中的值用于在水平方向平面子圖分配標記。
- text:(字符串:data_frame)此列的值以文本標簽的形式顯示在圖中。
- title:(字符串)圖形標題。
- template:(String或Plotly.py模板對象)圖形模板名稱或定義。
- width:(整數,默認)None)以像素為單位的圖形寬度。
- height:(整數,默認)600)以像素為單位的圖形高度。
等值區域圖(choropleth)
- data_frame:“整潔”pandas.DataFrame
- lat:(字符串:data_frame)此列的值用于根據地圖上的緯度定位標記。
- lon:(字符串:data_frame)此列的值用于根據地圖上的經度定位標記。
- locations:(字符串:data_frame)該列中的值將根據locationmode并映射到經度/緯度。
- locationmode:(字符串,“ISO-3”、“美國-州”、“國家名稱”之一)確定用于匹配locations地圖上的區域。
- color:(字符串:data_frame)此列的值用于為標記指定顏色。
- size:(字符串:data_frame)此列的值用于分配標記大小。
- color_continuous_scale:(有效的css-顏色字符串列表)此列表用于在color包含數字數據。中提供了各種有用的色標。plotly_express.colors子模塊,特別是plotly_express.colors.sequential,plotly_express.colors.diverging和plotly_express.colors.cyclical.
- title:(字符串)圖形標題。
- width:(整數,默認)None)以像素為單位的圖形寬度。
- height:(整數,默認)600)以像素為單位的圖形高度。
若對你有所幫助,歡迎大家評論、留言。