App下載

Python怎么實(shí)現(xiàn)Excel表格處理

猿友 2021-07-30 10:36:18 瀏覽數(shù) (2734)
反饋

不少小伙伴學(xué)習(xí)python是為了使用python辦公自動(dòng)化。但是有些小伙伴剛開(kāi)始學(xué)習(xí)python并不知道怎么使用python來(lái)辦公自動(dòng)化。今天小編就帶來(lái)一份代碼,教你如何使用python實(shí)現(xiàn)表格處理。

一、文件

一個(gè)測(cè)試有兩個(gè)sheet頁(yè)的Excel測(cè)試文件 test.xlsx

測(cè)試文件

二、代碼

import pandas as pd

file1 = pd.ExcelFile('D:\data\py\test.xlsx')
file2 = pd.read_excel('D:\data\py\test.xlsx')
print(file)
<pandas.io.excel._base.ExcelFile object at 0x0000021DE525DF88>
-----------------分割線---------------------
   姓名  年齡 性別  住址
0  張三   7  男 NaN
1  李四   6  男 NaN
2  王芳   6  女 NaN

三、分析

pd.read_excel讀出來(lái)是一個(gè)dataframe可以直接打印出內(nèi)容,但是只能讀取一個(gè)sheet頁(yè),默認(rèn)第一個(gè)sheet頁(yè)

@Appender(_read_excel_doc)
@deprecate_kwarg("skip_footer", "skipfooter")
def read_excel(
    io,
    sheet_name=0,
    header=0,
    names=None,
    index_col=None,
    usecols=None,
    squeeze=False,
    dtype=None,
    engine=None,
    converters=None,
    true_values=None,
    false_values=None,
    skiprows=None,
    nrows=None,
    na_values=None,
    keep_default_na=True,
    verbose=False,
    parse_dates=False,
    date_parser=None,
    thousands=None,
    comment=None,
    skip_footer=0,
    skipfooter=0,
    convert_float=True,
    mangle_dupe_cols=True,
    **kwds
):

    for arg in ("sheet", "sheetname", "parse_cols"):
        if arg in kwds:
            raise TypeError(
                "read_excel() got an unexpected keyword argument " "`{}`".format(arg)
            )

    if not isinstance(io, ExcelFile):
        io = ExcelFile(io, engine=engine)
    elif engine and engine != io.engine:
        raise ValueError(
            "Engine should not be specified when passing "
            "an ExcelFile - ExcelFile already has the engine set"
        )

    return io.parse(
        sheet_name=sheet_name,
        header=header,
        names=names,
        index_col=index_col,
        usecols=usecols,
        squeeze=squeeze,
        dtype=dtype,
        converters=converters,
        true_values=true_values,
        false_values=false_values,
        skiprows=skiprows,
        nrows=nrows,
        na_values=na_values,
        keep_default_na=keep_default_na,
        verbose=verbose,
        parse_dates=parse_dates,
        date_parser=date_parser,
        thousands=thousands,
        comment=comment,
        skipfooter=skipfooter,
        convert_float=convert_float,
        mangle_dupe_cols=mangle_dupe_cols,
        **kwds
    )

pd.ExcelFile 返回值是一個(gè)Excel對(duì)象,不能直接用,但是可以讀取整個(gè)Excel內(nèi)容

四、pd.ExcelFile

file = pd.ExcelFile('D:\data\py\test.xlsx')

sheet頁(yè)名稱

print(file.sheet_names)
['一年級(jí)', '二年級(jí)']

遍歷讀取每個(gè)sheet頁(yè)的內(nèi)容

for name in file.sheet_names:
    _df = pd.read_excel(file,name)
    print(_df)
  姓名  年齡 性別  住址
0  張三   7  男 NaN
1  李四   6  男 NaN
2  王芳   6  女 NaN
   姓名  年齡 性別
0  李明   8  男
1  劉敏   8  女
2  張強(qiáng)   7  男

將兩個(gè)sheet頁(yè)的內(nèi)容合并,并添加一列內(nèi)容為sheet頁(yè)名稱

df_list=[]
for name in file.sheet_names:
    _df = pd.read_excel(file,name)
    _df['班級(jí)']=name
    df_list.append(_df)
df = pd.concat([_df for _df in df_list],sort=False)
print(df)
姓名  年齡 性別  住址   班級(jí)
0  張三   7  男 NaN  一年級(jí)
1  李四   6  男 NaN  一年級(jí)
2  王芳   6  女 NaN  一年級(jí)
0  李明   8  男 NaN  二年級(jí)
1  劉敏   8  女 NaN  二年級(jí)
2  張強(qiáng)   7  男 NaN  二年級(jí)

忽略掉原來(lái)的index

df = pd.concat([_df for _df in df_list],ignore_index=True,sort=False)
print(df)
姓名  年齡 性別  住址   班級(jí)
0  張三   7  男 NaN  一年級(jí)
1  李四   6  男 NaN  一年級(jí)
2  王芳   6  女 NaN  一年級(jí)
3  李明   8  男 NaN  二年級(jí)
4  劉敏   8  女 NaN  二年級(jí)
5  張強(qiáng)   7  男 NaN  二年級(jí)

修改列名為英文

df = df.rename(columns={'姓名': 'name', '年齡': 'age', '性別': 'sex', '住址': 'address', '班級(jí)': 'class'})
print(df)
name  age sex  address class
0   張三    7   男      NaN   一年級(jí)
1   李四    6   男      NaN   一年級(jí)
2   王芳    6   女      NaN   一年級(jí)
3   李明    8   男      NaN   二年級(jí)
4   劉敏    8   女      NaN   二年級(jí)
5   張強(qiáng)    7   男      NaN   二年級(jí)

將df保存為CSV、Excel文件

df.to_csv('../data/sheet合并.csv',index=False) 
df.to_excel('../data/sheet合并.xls',index=True) 

五、總結(jié)

可以發(fā)現(xiàn)Python讀寫(xiě)Excel文件還是很方便的!

/python/blob/master/data/sheet%E5%90%88%E5%B9%B6.xls)

df.to_csv('../data/sheet合并.csv',index=False) 
df.to_excel('../data/sheet合并.xls',index=True) 

到此這篇如何使用python實(shí)現(xiàn)表格處理的文章就介紹到這了,更多Python辦公自動(dòng)化的學(xué)習(xí)內(nèi)容請(qǐng)關(guān)注W3Cschool!


0 人點(diǎn)贊