Python Pandas怎么读取XML文件 pandas.read_xml

admin 百科 15
pandas官方不提供read_xml()函数,需用xml.etree.ElementTree、第三方pandas-read-xml或lxml解析XML后转DataFrame;不推荐用BeautifulSoup处理纯XML。

Python Pandas怎么读取XML文件 pandas.read_xml-第1张图片-佛山资讯网

注意:pandas 本身不提供 pandas.read_xml() 函数。

截至 pandas 2.2.x(2024 年最新稳定版),pandas 官方并未内置 XML 解析功能pandas.read_xml() 并不存在。你在网上看到的 read_xml 要么是误传,要么是混淆了其他库(比如第三方包 pandas-read-xml),或是误将 read_html()read_json() 的用法套用到了 XML 上。

✅ 正确做法是:用标准 XML 解析器(如 xml.etree.ElementTreelxml)解析 XML,再手动或借助辅助工具转为 DataFrame


1. 使用标准库 xml.etree.ElementTree(推荐入门)

适合结构清晰、层级较扁平的 XML(如配置文件、简单数据列表)。

示例 XML(data.xml):

立即学习“Python免费学习笔记(深入)”;

<root>
  <item><name>Apple</name><price>1.2</price></item>
  <item><name>Banana</name><price>0.8</price></item>
</root>

登录后复制

读取并转为 DataFrame:

```python import pandas as pd import xml.etree.ElementTree as ET

tree = ET.parse("data.xml") root = tree.getroot()

data = [] for item in root.findall("item"): row = { "name": item.find("name").text, "price": float(item.find("price").text) } data.append(row)

df = pd.DataFrame(data) print(df)

<p>输出:</p>
<pre class="brush:php;toolbar:false;">    name  price
0  Apple    1.2
1 Banana    0.8

登录后复制

---

2. 使用第三方库 pandas-read-xml(最接近“read_xml”体验)

这个社区维护的包提供了类似 `pd.read_xml()` 的接口,支持 XPath、属性提取、嵌套展开等。

安装:

标签: python html js git json go github app 工具 office apple 配置文件 x

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~