Python實現讀取Word表格計算彙總寫入Excel

語言: CN / TW / HK

快過年了,又到了公司年底評級的時候了。今年的評級和往常一下,每個人都要填寫公司的民主評議表,給各個同事進行評價打分,然後部門收集起來根據收集上來的評價表進行彙總統計。想想要收集幾十號人的評價表,並根據每個人的評價表又要填到Excel中進行彙總計算統計給出每個人的評價,就頭大。雖然不是個什麼難事,但是是個無腦的細緻活。幾十個人的評價也得要花大半天的時間來弄,而且搞多了還容易搞錯。如是就想起乾脆用Python寫個小程式自動來處理這些髒活累活,評級年年都要評,每年都可以用。

要做的事情就是讀放到某個資料夾中的word文件中的評價表格,根據表格內容進行處理,然後彙總所有的表格資料,根據計算規則,算出每個人的評分,在根據評分計算每個人的評價。彙總後寫入Excel中。

不可否認用Python來實現這樣的事情真的是太方便了,人生苦短我用Python。

我是用的python的docx包來處理word,用pandas來處理資料並寫入excel

一、首先匯入包

pip install docx
pip install pandas

pandas寫excel依賴openpyxl包所以也到匯入

pip install openpyxl

二、讀評價表所在的目錄檔案

通過python的os包,列出資料夾裡面的檔案,識別出.docx的檔案

files=os.listdir(filepah)
for file in files:
    if file.find('.docx')>0:
        docfilepah=filepah+file

三、讀word檔案,處理word中的表格資料

data=[]
#讀word的docx評議表文件,並讀取word中的表格資料
def procdoc(docfilepath):
    document=Document(docfilepath)
    tables=document.tables
    table=tables[0]
    for i in range(1,len(table.rows)):
        id=int(table.cell(i,0).text)
        name=table.cell(i,1).text
        excellent=0
        if table.cell(i,2).text!='' and table.cell(i,2).text is not None:
            excellent=1
        competent = 0
        if table.cell(i, 3).text!='' and table.cell(i, 3).text is not None:
            competent=1
        basicacompetent=0
        if table.cell(i, 4).text!='' and table.cell(i, 4).text is not None:
            basicacompetent=1
        notcompetent = 0
        if table.cell(i, 5).text!='' and table.cell(i, 5).text is not None:
            notcompetent=1
        dontunderstand =0
        if table.cell(i, 6).text!='' and table.cell(i, 6).text is not None:
            dontunderstand=1
        appraisedata=[id,name,excellent,competent,basicacompetent,notcompetent,dontunderstand]
        data.append(appraisedata)

四、統計計算

通過pandas直接對資料進行統計計算,避免了傳統的迴圈計算。

df = pd.DataFrame(data,columns=['序號','姓名','優秀','稱職','基本稱職','不稱職','不瞭解'])
df=df.groupby(['序號','姓名']).sum() #彙總每個人每一項的評分
df['票數'] = df.apply(lambda x: x.sum(), axis=1) #統計票數
df['計分'] = (df['優秀']*95+df['稱職']*85+df['基本稱職']*75+df['不稱職']*65+df['不瞭解']*0)/len(df)#根據規則計分
df['評價']=df['計分'].map(getscore) #根據規則評價評級

計分方法:民主評議得分=Σ各等級票數*等級計分分數/總票數,其中“優秀”計95分,“稱職”計85分,“基本稱職”計75分,“不稱職”計65分,“不瞭解”不計分。

#根據評分規則計算評級
def getscore(x):
    if x>=95:
        score='優秀'
    elif x>=80 and x<95:
        score='稱職'
    elif x>=75 and x<80:
        score='基本稱職'
    elif x<75:
        score='不稱職'
    return score

五、將統計計算結果寫入彙總Excel

通過pandas直接可以將dataframe寫入到Excel檔案

#將彙總計算好的資料寫入Excel
def write2excle(exclefile,dataframe):
    writer = pd.ExcelWriter(exclefile)
    dataframe.to_excel(writer)
    writer.save()
    print('輸出成功')

完整程式碼

Python不到八十行程式碼,實現讀Word->處理表格資料->彙總計算資料->寫Excel。

完整的程式碼如下:

import os
import pandas as pd
from docx import Document

data=[]
#讀word的docx評議表文件,並讀取word中的表格資料
def procdoc(docfilepath):
    document=Document(docfilepath)
    tables=document.tables
    table=tables[0]
    for i in range(1,len(table.rows)):
        id=int(table.cell(i,0).text)
        name=table.cell(i,1).text
        excellent=0
        if table.cell(i,2).text!='' and table.cell(i,2).text is not None:
            excellent=1
        competent = 0
        if table.cell(i, 3).text!='' and table.cell(i, 3).text is not None:
            competent=1
        basicacompetent=0
        if table.cell(i, 4).text!='' and table.cell(i, 4).text is not None:
            basicacompetent=1
        notcompetent = 0
        if table.cell(i, 5).text!='' and table.cell(i, 5).text is not None:
            notcompetent=1
        dontunderstand =0
        if table.cell(i, 6).text!='' and table.cell(i, 6).text is not None:
            dontunderstand=1
        appraisedata=[id,name,excellent,competent,basicacompetent,notcompetent,dontunderstand]
        data.append(appraisedata)

#讀取評議表的目錄,並處理目錄中的docx檔案,根據評議表計算評分,寫入彙總表。
def readfile(filepah):
    files=os.listdir(filepah)
    for file in files:
        if file.find('.docx')>0:
            docfilepah=filepah+file
            procdoc(docfilepah)
    df = pd.DataFrame(data,columns=['序號','姓名','優秀','稱職','基本稱職','不稱職','不瞭解'])
    print(df)
    df=df.groupby(['序號','姓名']).sum()
    df['票數'] = df.apply(lambda x: x.sum(), axis=1)
    df['計分'] = (df['優秀']*95+df['稱職']*85+df['基本稱職']*75+df['不稱職']*65+df['不瞭解']*0)/len(df)
    df['評價']=df['計分'].map(getscore)
    print(df)
    write2excle('民主評議\\民主評議表彙總.xlsx',df)

#根據評分規則計算評級
def getscore(x):
    if x>=95:
        score='優秀'
    elif x>=80 and x<95:
        score='稱職'
    elif x>=75 and x<80:
        score='基本稱職'
    elif x<75:
        score='不稱職'
    return score

#將彙總計算好的資料寫入Excel
def write2excle(exclefile,dataframe):
    writer = pd.ExcelWriter(exclefile)
    dataframe.to_excel(writer)
    writer.save()
    print('輸出成功')

if __name__ == '__main__':
    readfile('民主評議\\')

全部原始碼: https://github.com/xiejava1018/pythonprocword

作者部落格: http://xiejava.ishareread.com/