文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,著作权归创作者全部,如有什么问题请立即在线留言以作解决
下列文章内容来自财会学习同盟,创作者:我是龙哥啊
私聊回应“材料” ,就可以免费领Python实战演练实例讲解视频
Python 自动化技术企业办公,解决Excel报表视频讲解
https://www.bilibili.com/video/BV1Lh411R7Kd/
序言
本文要做的事儿,如题目上述 ,便是获取好几张excel表上的数据信息或信息,合拼归纳到一张新表上,它是大家工作上常常会碰到的事儿。
例如将每月市场销售状况归纳到一张表上开展市场销售状况剖析 ,例如将各月税票信息归纳到一张表上开展数据分析,还例如将每月薪水表上的一些信息归纳到一张表上开展薪水成本分析报告这些 。
实际看表即是:
各期科目余额表截屏
最终获得的新表为:
要完成所述总体目标,能够分以下四步开展。
1.获得各科目余额表文件路径
将2017年1-12月 、2018年1-12月、2019年1-12月及2020年1-6月各期科目余额表放到同一文件夹名称下 ,要载入多少个文档 ,就把多少个文档所有放到同一个文件夹名称下,如下图。
随后载入全部文档的途径,编码以下 。
1dir_xls = []
2def get_file(folder_path): #获得同一文件夹名称下全部科目余额表分别的文件路径
3 dir_file = os.listdir(folder_path)
4 #print(dir_file)
5 for path in dir_file:
6 if path[-4:] == 'xlsx' or path[-3:] == 'xls':
7 whole_path = r'd:/F:学习培训/python/账龄分析/科目余额表/{}'.format(path)
8 dir_xls.append(whole_path)
9 return dir_xls
2.获得各科目余额表中应收帐款一级科目编码所属的队伍
例如在2017年科目余额表中 ,应收帐款一级科目编码为“1122 ”,其所属的单元格为C12,也即是第12行第三列 ,这儿的行号12、列号3,即是其精准定位。
其他科目余额表同样,均为获得一级科目编码“1122”的行号和列号 ,获得编码以下。
1dict_row_col = {}
2def get_row_col(dir_xls): #获得每一张表格中应收帐款一级科目编码所属的行号和列号
3 for i in dir_xls:
4 #print(i)
5 account_balance_sheet_data = pd.DataFrame(pd.read_excel(i))
6 for a in account_balance_sheet_data.index:
7 for b in range(len(account_balance_sheet_data.loc[a].values)):
8 if account_balance_sheet_data.loc[a].values[b] == '1122':
9 row = a 1
10 col = b 1
11 dict_row_col[i] = [row,col]
12 return dict_row_col
3.获得各科目余额表中应收帐款全部二级科目编码
依据获得到的应收帐款一级科目编码行号和列号,即依据其精准定位,再获得每一张表格中应收帐款全部二级科目编码 ,并将其不反复且升序排序加上到一张新表中,编码以下 。
1def get_ar_code(dict_row_col):
2 i = 0
3 ar_list1 = []
4 ar_list2 = []
5 for key in dict_row_col.keys():
6 workbook = xlrd.open_workbook(key)
7 balance_sheet = workbook.sheet_by_index(0)
8 row = dict_row_col[key][0]
9 col = dict_row_col[key][1]
10 while True:
11 if '1122' in balance_sheet.cell_value(row 1,col-1):
12 ar_code = balance_sheet.cell_value(row 1,col-1)
13 if ar_code not in ar_list1:
14 ar_list1.append(ar_code)
15 else:
16 pass
17 row = row 1
18 else:
19 break
20 ar_list1.append('科目编码')
21 ar_list1.sort(reverse=False) #科目编码目录升序排序
22 #将“科目编码”从最后一个原素总体挪动到第一个原素
23 ar_list2.append(ar_list1[len(ar_list1)-1])
24 for i in range(1,len(ar_list1)):
25 ar_list2.append(ar_list1[i-1])
26 #将全部原素载入到excel表格中
27 for i in range(len(ar_list2)):
28 ar_sheet.write(i,0,ar_list2[i])
获得的新表內容以下。
由上可看得出,2017年至2020年1-6月 ,四张科目余额表 ,应收帐款现有617个二级科目,相匹配着617个不一样的顾客。
4.依据二级科目数据库索引获得所有所需信息
此步的操作流程,即上一篇《如何用python实现excel中的vlookup功能?》所共享的全过程 ,这儿就已不详细描述了,编码以下 。
1def get_ar_info(dict_row_col):
2 #载入导进总体目标表
3 file_target = r'd:\F:学习培训\python\账龄分析\AR.xls'
4 list_ar_code = []
5 workbook = xlrd.open_workbook(file_target)
6 balance_sheet = workbook.sheet_by_index(0)
7 rows = balance_sheet.nrows
8 for i in range(1,rows):
9 list_ar_code.append(balance_sheet.cell_value(i,0))
10 #print(list_ar_code)
11 data = {'科目编码':list_ar_code}
12 df_target = pd.DataFrame(data)
13
14 for key in dict_row_col.keys():
15 #载入原始记录来源于表
16 file_source = key
17 df_source = pd.read_excel(file_source)
18 #将原始记录来源于表及导进总体目标表信息合拼到同一表上
19 dfneed = df_source[['科目编码','科目名字','初期借方','初期借贷方','本期发生借方','本期发生借贷方','期终借方','期终借贷方']]
20 df_target = pd.merge(df_target,dfneed,how='left',on='科目编码')
21 df_target.to_excel(file_target,index=False)
5.终极目标完成
前四步即是封裝的四个涵数,每一个涵数为在其中一个流程 ,最后归纳能够完成此篇目标,启用编码及运行代码以下 。
1import os
2import pandas as pd
3import xlrd,xlwt
4
5folder_path = r'd:\F:学习培训\python\账龄分析\科目余额表'
6f = xlwt.Workbook()
7ar_sheet = f.add_sheet(u'ar_sheet',cell_overwrite_ok=True)
8dir_xls = get_file(folder_path)
9dict_row_col = get_row_col(dir_xls)
10get_ar_code(dict_row_col)
11f.save(r'd:\F:学习培训\python\账龄分析\AR.xls')
12get_ar_info(dict_row_col)
运作后形成的报表以下。
再历经简易梳理后,便可得到上文最后报表 ,到此完成了从好几张excel表格中获取所需数据信息或信息并归纳到同一张新表上的目地。