pandas读取Excel最常用pd.read_excel(),写入用df.to_excel();需注意引擎依赖(如openpyxl、xlrd)、参数设置(sheet_name、skiprows、dtype等)及大文件优化策略。

用pandas读取Excel文件最常用的方法是pd.read_excel(),写入则用df.to_excel()。关键在于参数设置和常见格式兼容性,不是所有Excel文件都能直接打开。
读取Excel:核心参数与常见问题
基础用法:df = pd.read_excel("data.xlsx")。默认读取第一个工作表(sheet),但实际中需注意:
-
指定工作表:用
sheet_name=0(索引)、"Sheet1"(名称)或None(读取全部,返回字典) -
跳过行/设置标题:用
skiprows=2跳过前两行,header=1表示第1行(0起始)为列名 -
处理空值与数据类型:用
na_values=["N/A", "NULL"]自定义缺失值标识;用dtype={"ID": str}强制列类型,避免数字自动转int后丢前导零 -
大文件优化:加
usecols="A:C"或[0, 1, 3]只读需要的列,大幅提速
写入Excel:保存多表与样式控制
df.to_excel("output.xlsx", index=False)是最简写法。进阶操作包括:
-
写入多个工作表:需用
pd.ExcelWriter上下文管理器,例如:
with pd.ExcelWriter("report.xlsx") as writer:
df1.to_excel(writer, sheet_name="汇总", index=False)
df2.to_excel(writer, sheet_name="明细", index=False)
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~