在數(shù)據(jù)分析行業(yè)中,往往一張圖表勝過(guò)千言萬(wàn)語(yǔ),而python的一大應(yīng)用方向就是數(shù)據(jù)的分析和處理。在我們進(jìn)行數(shù)據(jù)的挖掘和分析后可以得到一些有用的結(jié)果,然而這些結(jié)果往往只是一個(gè)數(shù)字,極其抽象。這時(shí)候我們就需要想辦法將數(shù)據(jù)進(jìn)行可視化處理,讓數(shù)據(jù)真正變成容易理解的參考材料。這時(shí)候我們就可以借助python生成數(shù)據(jù)可視化網(wǎng)頁(yè)了,那么python怎么制作web可視化頁(yè)面呢?其實(shí)只需要借助一個(gè)名叫streamlit的庫(kù)就可以生成可視化網(wǎng)頁(yè)了,接下來(lái)的這篇文章小編就帶你了解python怎么使用streamlit庫(kù)來(lái)生成可視化網(wǎng)頁(yè)吧!
每當(dāng)你對(duì)Excel文件進(jìn)行更改保存,Web頁(yè)面還能夠?qū)崟r(shí)進(jìn)行更新,確實(shí)挺不錯(cuò)的。
Streamlit的文檔和教程地址如下。
https://docs.streamlit.io/en/stable/
相關(guān)的API使用可以去文檔中查看,都有詳細(xì)的解釋。
項(xiàng)目一共有三個(gè)文件,程序、圖片、Excel表格數(shù)據(jù)。
數(shù)據(jù)情況如下,某公司年底問(wèn)卷調(diào)查(虛構(gòu)數(shù)據(jù)),各相關(guān)部門(mén)對(duì)生產(chǎn)部門(mén)在工作協(xié)作上的打分情況。
有效數(shù)據(jù)總計(jì)約676條,匿名問(wèn)卷,包含問(wèn)卷填寫(xiě)人所屬部門(mén),年齡,評(píng)分。
最后對(duì)各部門(mén)參與人數(shù)進(jìn)行匯總計(jì)數(shù)(右側(cè)數(shù)據(jù))。
首先來(lái)安裝一下相關(guān)的Python庫(kù),使用百度源。
# 安裝streamlit
pip install streamlit -i https://mirror.baidu.com/pypi/simple/
# 安裝Plotly Express
pip install plotly_express==0.4.0 -i https://mirror.baidu.com/pypi/simple/
# 安裝xlrd
pip install xlrd==1.2.0 -i https://mirror.baidu.com/pypi/simple/
因?yàn)槲覀兊臄?shù)據(jù)文件是xlsx格式,最新版的xlrd,只支持xls文件。
所以需要指定xlrd版本為1.2.0,這樣pandas才能成功讀取數(shù)據(jù)。
命令行終端啟動(dòng)網(wǎng)頁(yè)。
# 命令行終端打開(kāi)文件所在路徑
cd Excel_Webapp
# 運(yùn)行網(wǎng)頁(yè)
streamlit run app.py
成功以后會(huì)有提示,并且瀏覽器會(huì)自動(dòng)彈出網(wǎng)頁(yè)。
如果沒(méi)有自動(dòng)彈出,可以直接訪問(wèn)上圖中的地址。
得到結(jié)果如下,一個(gè)數(shù)據(jù)可視化網(wǎng)頁(yè)出來(lái)了。
目前只能在本地訪問(wèn)查看,如果你想放在網(wǎng)上,可以通過(guò)服務(wù)器部署,需要自行去研究~
下面我們來(lái)看看具體的代碼吧。
import pandas as pd
import streamlit as st
import plotly.express as px
from PIL import Image
# 設(shè)置網(wǎng)頁(yè)名稱
st.set_page_config(page_title='調(diào)查結(jié)果')
# 設(shè)置網(wǎng)頁(yè)標(biāo)題
st.header('2020年調(diào)查問(wèn)卷')
# 設(shè)置網(wǎng)頁(yè)子標(biāo)題
st.subheader('2020年各部門(mén)對(duì)生產(chǎn)部的評(píng)分情況')
導(dǎo)入相關(guān)的Python包,pandas處理數(shù)據(jù),streamlit用來(lái)生成網(wǎng)頁(yè),plotly.express則是生成圖表,PIL讀取圖片。
設(shè)置了網(wǎng)頁(yè)名稱,以及網(wǎng)頁(yè)里的標(biāo)題和子標(biāo)題。
# 讀取數(shù)據(jù)
excel_file = '各部門(mén)對(duì)生產(chǎn)部的評(píng)分情況.xlsx'
sheet_name = 'DATA'
df = pd.read_excel(excel_file,
sheet_name=sheet_name,
usecols='B:D',
header=3)
# 此處為各部門(mén)參加問(wèn)卷調(diào)查人數(shù)
df_participants = pd.read_excel(excel_file,
sheet_name=sheet_name,
usecols='F:G',
header=3)
df_participants.dropna(inplace=True)
# streamlit的多重選擇(選項(xiàng)數(shù)據(jù))
department = df['部門(mén)'].unique().tolist()
# streamlit的滑動(dòng)條(年齡數(shù)據(jù))
ages = df['年齡'].unique().tolist()
讀取Excel表格數(shù)據(jù),并且得出年齡分布以及部門(mén)情況,一共是有5個(gè)部門(mén)。
添加滑動(dòng)條和多重選擇的數(shù)據(jù)選項(xiàng)。
# 滑動(dòng)條, 最大值、最小值、區(qū)間值
age_selection = st.slider('年齡:',
min_value=min(ages),
max_value=max(ages),
value=(min(ages), max(ages)))
# 多重選擇, 默認(rèn)全選
department_selection = st.multiselect('部門(mén):',
department,
default=department)
結(jié)果如下。
年齡是從23至65,部門(mén)則是市場(chǎng)、物流、采購(gòu)、銷售、財(cái)務(wù)這幾個(gè)。
由于滑動(dòng)條和多重選擇是可變的,需要根據(jù)過(guò)濾條件得出最終數(shù)據(jù)。
# 根據(jù)選擇過(guò)濾數(shù)據(jù)
mask = (df['年齡'].between(*age_selection)) & (df['部門(mén)'].isin(department_selection))
number_of_result = df[mask].shape[0]
# 根據(jù)篩選條件, 得到有效數(shù)據(jù)
st.markdown(f'*有效數(shù)據(jù): {number_of_result}*')
# 根據(jù)選擇分組數(shù)據(jù)
df_grouped = df[mask].groupby(by=['評(píng)分']).count()[['年齡']]
df_grouped = df_grouped.rename(columns={'年齡': '計(jì)數(shù)'})
df_grouped = df_grouped.reset_index()
得到數(shù)據(jù)便可以繪制柱狀圖了。
# 繪制柱狀圖, 配置相關(guān)參數(shù)
bar_chart = px.bar(df_grouped,
x='評(píng)分',
y='計(jì)數(shù)',
text='計(jì)數(shù)',
color_discrete_sequence=['#F63366']*len(df_grouped),
template='plotly_white')
st.plotly_chart(bar_chart)
使用plotly繪制柱狀圖。
當(dāng)我們?cè)诰W(wǎng)頁(yè)調(diào)整選項(xiàng)時(shí),有效數(shù)據(jù)和柱狀圖也會(huì)隨之變化。
此外streamlit還可以給網(wǎng)頁(yè)添加圖片和交互式表格。
# 添加圖片和交互式表格
col1, col2 = st.beta_columns(2)
image = Image.open('survey.jpg')
col1.image(image,
caption='Designed by 小F / 法納斯特',
use_column_width=True)
col2.dataframe(df[mask], width=300)
得到結(jié)果如下。
可以看到表格有一個(gè)滑動(dòng)條,可以使用鼠標(biāo)滾輪滾動(dòng)查看。
最后便是繪制一個(gè)餅圖啦!
# 繪制餅圖
pie_chart = px.pie(df_participants,
title='總的參加人數(shù)',
values='人數(shù)',
names='公司部門(mén)')
st.plotly_chart(pie_chart)
結(jié)果如下。
各部門(mén)參加問(wèn)卷調(diào)查的人數(shù),也是一個(gè)可以交互的圖表。
將銷售、市場(chǎng)、物流取消掉,我們就能看出財(cái)務(wù)和采購(gòu)參加問(wèn)卷調(diào)查的人數(shù)占比情況。
好了,本期的分享就到此結(jié)束了,有興趣的小伙伴可以自行去實(shí)踐學(xué)習(xí)。
小結(jié)
以上就是python怎么使用Streamlit庫(kù)生成可視化網(wǎng)頁(yè)的全部?jī)?nèi)容,更多關(guān)于python streamlit庫(kù)的使用教程請(qǐng)關(guān)注W3Cschool其它相關(guān)文章!