PythonExcel文件操作_openpyxl与pandas结合实例【教程】

admin 百科 16
最实用的组合是openpyxl负责样式、公式、合并单元格等排版,pandas专注数据清洗与分析;读取需data_only=True获取公式结果,写入须单元格级赋值以保留格式,新增sheet用openpyxl创建并逐行写入。

PythonExcel文件操作_openpyxl与pandas结合实例【教程】-第1张图片-佛山资讯网

openpyxl 读写 Excel 格式细节(如样式、公式、合并单元格),再用 pandas 做数据清洗和分析,是最实用的组合方案。关键在于分工明确:pandas 负责“算”,openpyxl 负责“排版”。

读取带格式的 Excel 并转为 DataFrame

openpyxl 默认不解析公式值,只读原始公式字符串;若要读计算结果,需启用 data_only=True。同时注意:它不自动跳过空行或识别表头,需手动指定范围。

  • load_workbook(filename, data_only=True) 打开文件,避免公式显示为 =SUM(A1:A10) 而不是实际数值
  • 通过 ws.iter_rows(min_row=2, max_row=100, values_only=True) 按行提取数据,values_only=True 返回纯值(忽略样式)
  • 把结果转成列表,再传给 pd.DataFrame(),并用第一行作列名:df = pd.DataFrame(data[1:], columns=data[0])

用 pandas 处理完数据,写回原工作表(保留格式)

直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是:用 openpyxl 定位目标区域,逐单元格赋值,其他格式不动。

  • 先用 load_workbook(filename, keep_vba=True, read_only=False) 打开(keep_vba 可选,若含宏)
  • 定位目标工作表:ws = wb['Sheet1'],再确定起始单元格,如 start_cell = ws['C5']
  • 遍历 DataFrame:for r_idx, row in enumerate(df.values, 1):,再嵌套列循环:for c_idx, value in enumerate(row, 1):,写入 ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)

在已有 Excel 中插入新 sheet 并写入 pandas 表格

适合生成报表时追加分析页,不影响原表结构和样式。

标签: excel python 数据清洗

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~