Pandas DataFrame 列转换为多级索引：将列提升为主索引的教程

admin 百科 2025-12-14 23

本教程详细介绍了如何将 pandas dataframe 中的某个列提升为新的主索引，同时保留原有的索引作为二级索引。通过使用 `set_index` 方法结合 `append=true` 参数，以及 `swaplevel` 操作，您可以灵活地重构 dataframe 的索引结构，实现将列数据转换为多级索引的需求，从而优化数据访问和分析。

在数据分析和处理中，Pandas DataFrame 是一种强大的工具。有时，我们需要根据 DataFrame 中某个列的值来构建更复杂的索引结构，例如将其提升为多级索引中的主索引，同时保留原始索引作为次级索引。这种操作对于数据的组织、查询和聚合都至关重要。

理解问题场景

假设我们有一个 Pandas DataFrame，其结构如下：

                     data  day_of_month  days_in_month
timestamp                                             
2022-01-03 09:00:00    12             3             31

登录后复制

Pandas DataFrame 列转换为多级索引：将列提升为主索引的教程-第2张图片-佛山资讯网

当前 DataFrame 的索引是 timestamp（一个 Pandas Timestamp 类型）。我们的目标是将 days_in_month 列的值作为新的主索引，而 timestamp 则变为二级索引。

对于这种需求，一些常见的 DataFrame 重塑操作，如 pivot 或 melt，通常不适用于直接将列转换为多级索引并保留现有索引的场景。pivot 主要用于将列值转换为新的列，而 melt 则用于将宽格式数据转换为长格式。我们需要的是一种更直接的索引操作。

解决方案：set_index 结合 append 和 swaplevel

Pandas 提供了 set_index 方法，它允许我们将 DataFrame 中的一个或多个列设置为新的索引。结合 append=True 参数和 swaplevel 方法，我们可以优雅地实现上述目标。

1. 准备示例数据

首先，我们创建一个与问题描述相符的 DataFrame：

import pandas as pd

# 创建一个示例索引
idx = pd.Index(['2022-01-03 09:00:00'], name='timestamp')

# 创建示例 DataFrame
df = pd.DataFrame([[12, 3, 31]], index=idx, columns=['data', 'day_of_month', 'days_in_month'])

print("原始 DataFrame:")
print(df)

登录后复制

输出：

原始 DataFrame:
                     data  day_of_month  days_in_month
timestamp                                             
2022-01-03 09:00:00    12             3             31

登录后复制