PythonExcel文件操作_openpyxl与pandas结合实例【教程】

admin 百科 2025-12-23 24

最实用的组合是openpyxl负责样式、公式、合并单元格等排版，pandas专注数据清洗与分析；读取需data_only=True获取公式结果，写入须单元格级赋值以保留格式，新增sheet用openpyxl创建并逐行写入。

PythonExcel文件操作_openpyxl与pandas结合实例【教程】-第1张图片-佛山资讯网

用 openpyxl 读写 Excel 格式细节（如样式、公式、合并单元格），再用 pandas 做数据清洗和分析，是最实用的组合方案。关键在于分工明确：pandas 负责“算”，openpyxl 负责“排版”。

openpyxl 默认不解析公式值，只读原始公式字符串；若要读计算结果，需启用 data_only=True。同时注意：它不自动跳过空行或识别表头，需手动指定范围。

用 load_workbook(filename, data_only=True) 打开文件，避免公式显示为 =SUM(A1:A10) 而不是实际数值
通过 ws.iter_rows(min_row=2, max_row=100, values_only=True) 按行提取数据，values_only=True 返回纯值（忽略样式）
把结果转成列表，再传给 pd.DataFrame()，并用第一行作列名：df = pd.DataFrame(data[1:], columns=data[0])

直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是：用 openpyxl 定位目标区域，逐单元格赋值，其他格式不动。

先用 load_workbook(filename, keep_vba=True, read_only=False) 打开（keep_vba 可选，若含宏）
定位目标工作表：ws = wb['Sheet1']，再确定起始单元格，如 start_cell = ws['C5']
遍历 DataFrame：for r_idx, row in enumerate(df.values, 1):，再嵌套列循环：for c_idx, value in enumerate(row, 1):，写入 ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)