Python查找所有匹配项_findall使用实例讲解【教程】

admin 百科 12
re.findall() 是 Python 中用于一次性提取字符串中所有符合正则模式子串的函数,返回列表;含捕获组时仅返回组内内容,多行或大小写匹配需添加对应标志位。

Python查找所有匹配项_findall使用实例讲解【教程】-第1张图片-佛山资讯网

re.findall() 是 Python 中最常用、最直接的正则匹配提取工具,它能一次性找出字符串中所有符合模式的子串,并以列表形式返回,不重叠、不遗漏。

基础用法:匹配纯文本或简单模式

最常见场景是提取所有数字、邮箱、手机号等固定格式内容。例如:

  • 提取所有连续数字:re.findall(r'\d+', '价格:299元,折扣后199.5元')['299', '1995'](注意小数点未被包含)
  • 提取带小数的价格:re.findall(r'\d+\.\d+|\d+', '原价399.99,现价249')['399.99', '249']
  • 匹配英文单词:re.findall(r'[a-zA-Z]+', 'Hello, 你好!Python3.11 is great.') ['Hello', 'Python', 'is', 'great']

捕获组的特殊行为:只返回括号内的内容

如果正则表达式中包含一个或多个 捕获组(即圆括号 ())findall 默认只返回组内匹配的内容,而不是整个匹配项:

  • re.findall(r'(\d{4})-(\d{2})-(\d{2})', '日期:2023-12-25 和 2024-01-01') → 返回列表套元组:[('2023', '12', '25'), ('2024', '01', '01')]
  • 若只想取年份,可简化为:re.findall(r'(\d{4})-\d{2}-\d{2}', '2023-12-25')['2023']
  • 想强制返回完整匹配,可用非捕获组 (?:...) 或去掉括号;或者改用 re.finditer() 配合 .group(0)

处理多行与特殊字符:记得加标志位

默认情况下 . 不匹配换行符,^/$ 只匹配字符串首尾。遇到跨行文本时需显式传入标志:

标签: python git 正则表达式 工具 邮箱

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~