Python正则表达式怎么用_re模块实战教程【教程】

admin 百科 2025-12-20 23

Python re模块核心用法：re.search()扫描全文找首匹配，re.match()仅从开头匹配；re.findall()批量提取，分组影响返回格式；re.sub()支持字符串/函数替换；高频使用需re.compile()预编译提升效率。

Python正则表达式怎么用_re模块实战教程【教程】-第1张图片-佛山资讯网

Python 的 re 模块是处理文本匹配与提取最常用、最高效的工具之一。掌握它，能帮你快速完成日志解析、数据清洗、网页内容抽取、格式校验等任务。关键不在于背所有语法，而在于理解“模式怎么写、函数怎么选、结果怎么用”。

基础匹配：用 re.search() 和 re.match() 找第一个匹配

re.match() 只从字符串开头匹配，re.search() 则扫描整个字符串找第一个符合的位置——大多数时候该用 search。

例如，从一段文字中提取手机号（假设是 11 位数字）：

import re
text = "联系我：13812345678，或邮箱 hello@abc.com"
pattern = r"1[3-9]\d{9}"  # 匹配以 1 开头、第二位 3-9、共 11 位的数字
match = re.search(pattern, text)
if match:
    print(match.group())  # 输出：13812345678

登录后复制

注意：group() 返回匹配到的完整字符串；如果正则里用了括号 ()，还能用 group(1)、group(2) 提取子组。

立即学习“Python免费学习笔记（深入）”；

标签： python 正则表达式工具数据清洗邮箱 python正则表达式

本文地址： https://www.fsgp.cn/p/baike/81358.html