最实用的组合是openpyxl负责样式、公式、合并单元格等排版,pandas专注数据清洗与分析;读取需data_only=True获取公式结果,写入须单元格级赋值以保留格式,新增sheet用openpyxl创建并逐行写入。

用 openpyxl 读写 Excel 格式细节(如样式、公式、合并单元格),再用 pandas 做数据清洗和分析,是最实用的组合方案。关键在于分工明确:pandas 负责“算”,openpyxl 负责“排版”。
读取带格式的 Excel 并转为 DataFrame
openpyxl 默认不解析公式值,只读原始公式字符串;若要读计算结果,需启用 data_only=True。同时注意:它不自动跳过空行或识别表头,需手动指定范围。
- 用
load_workbook(filename, data_only=True)打开文件,避免公式显示为=SUM(A1:A10)而不是实际数值 - 通过
ws.iter_rows(min_row=2, max_row=100, values_only=True)按行提取数据,values_only=True返回纯值(忽略样式) - 把结果转成列表,再传给
pd.DataFrame(),并用第一行作列名:df = pd.DataFrame(data[1:], columns=data[0])
用 pandas 处理完数据,写回原工作表(保留格式)
直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是:用 openpyxl 定位目标区域,逐单元格赋值,其他格式不动。
- 先用
load_workbook(filename, keep_vba=True, read_only=False)打开(keep_vba可选,若含宏) - 定位目标工作表:
ws = wb['Sheet1'],再确定起始单元格,如start_cell = ws['C5'] - 遍历 DataFrame:
for r_idx, row in enumerate(df.values, 1):,再嵌套列循环:for c_idx, value in enumerate(row, 1):,写入ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)
在已有 Excel 中插入新 sheet 并写入 pandas 表格
适合生成报表时追加分析页,不影响原表结构和样式。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~