您的位置:首 页 > 新闻中心 > 公司网站制作 > 企业建网站常用正则表达式语法

公司网站制作

企业建网站常用正则表达式语法

发布:2026-04-28 12:00:43 浏览:31

一、正则表达式基础语法(通用)

正则表达式(Regex)是用于匹配字符串模式的工具,在企业网站开发中,主要用于表单验证(如手机号、邮箱、网址)、后台数据筛选、前端输入校验等场景。核心语法如下,适配大多数网站开发语言(PHP、JavaScript、Python等)。

1. 基础匹配符号

  • .:匹配任意单个字符(除换行符\n),例:h.t 可匹配 hat、hot、hxt 等。
  • ^:匹配字符串开头,例:^abc 仅匹配以 abc 开头的字符串(如 abc123,不匹配 xabc)。
  • $:匹配字符串结尾,例:abc$ 仅匹配以 abc 结尾的字符串(如 123abc,不匹配 abcxyz)。
  • *:匹配前面的字符0次或多次,例:ab* 可匹配 a、ab、abb、abbb 等。
  • +:匹配前面的字符1次或多次,例:ab+ 可匹配 ab、abb、abbb,不匹配 a。
  • ?:匹配前面的字符0次或1次,例:ab? 可匹配 a、ab,不匹配 abb。
  • {n}:匹配前面的字符恰好n次,例:a{3} 仅匹配 aaa。
  • {n,}:匹配前面的字符至少n次,例:a{2,} 可匹配 aa、aaa、aaaa 等。
  • {n,m}:匹配前面的字符n到m次,例:a{2,4} 可匹配 aa、aaa、aaaa。
  • []:匹配括号内任意一个字符,例:[abc] 可匹配 a、b、c;[0-9] 匹配任意数字;[a-zA-Z] 匹配任意大小写字母。
  • [^]:匹配括号内以外的任意字符,例:[^0-9] 匹配非数字字符。
  • \:转义字符,用于匹配特殊符号(如 .、*、+ 等),例:\. 仅匹配小数点,不匹配任意字符。

2. 常用预定义字符集

  • \d:等价于 [0-9],匹配任意数字。
  • \D:等价于 [^0-9],匹配非数字。
  • \w:等价于 [a-zA-Z0-9_],匹配字母、数字、下划线(企业网站中常用于用户名、密码校验)。
  • \W:等价于 [^a-zA-Z0-9_],匹配非字母、数字、下划线(用于过滤特殊符号)。
  • \s:匹配任意空白字符(空格、制表符、换行符等),例:\s+ 匹配多个连续空白。
  • \S:匹配非空白字符。

3. 分组与逻辑匹配

  • ( ):分组,将多个字符视为一个整体,例:(ab)+ 可匹配 ab、abab、ababab 等。
  • |:逻辑或,匹配其中一个表达式,例:abc|def 可匹配 abc 或 def。

二、企业建网站高频正则表达式(直接套用)


企业网站开发中,正则主要用于表单验证(用户注册、联系我们、留言板等)和URL/数据提取,以下是最常用场景的正则,附带说明和适配场景。

1. 表单验证类(核心场景)

(1)手机号验证(适配国内企业用户)

语法:^1[3-9]\d{9}$

说明:开头为1,第二位为3-9(覆盖国内所有手机号段),后面跟9位数字,总长度11位。适用于企业网站“联系电话”“注册手机号”输入校验。

(2)企业邮箱验证(支持企业域名、个人邮箱)

语法:^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$

说明:支持字母、数字、下划线、减号,适配企业邮箱(如 admin@company.com、sales@xxx.cn)和个人邮箱,可直接用于“邮箱订阅”“留言邮箱”校验。

(3)企业网址验证(支持http/https、www/非www)

语法:^https?://([a-zA-Z0-9_-]+\.)+[a-zA-Z0-9_-]+(/[a-zA-Z0-9_-]*)*$

说明:匹配 http 或 https 开头,支持企业官网域名(如 http://www.company.com、http://xxx.cn),可用于“友情链接”输入校验、后台网址录入。

(4)企业名称验证(支持中文、字母、数字、空格、标点)

语法:^[a-zA-Z0-9\u4e00-\u9fa5\s·()-]{2,50}$

说明:支持中文(企业中文名称)、字母(英文名称)、数字、空格、常见标点(·、()、-),长度2-50位,适用于“企业信息登记”“供应商录入”。

(5)密码验证(企业后台用户密码,安全等级中等)

语法:^(?=.*[a-zA-Z])(?=.*\d)[a-zA-Z0-9]{8,16}$

说明:8-16位,必须包含字母和数字,不允许特殊符号(适配企业后台简单密码需求);若需更高安全,可添加特殊符号:^(?=.*[a-zA-Z])(?=.*\d)(?=.*[!@#$%^&*])[a-zA-Z0-9!@#$%^&*]{8,16}$

(6)邮政编码验证(国内6位邮编)

语法:^[1-9]\d{5}$

说明:开头不为0,共6位数字,适用于企业“联系地址”表单中的邮编校验。

(7)固定电话验证(国内固定电话,支持分机号)

语法:^0\d{2,3}-\d{7,8}(-\d{1,4})?$

说明:开头为0,区号2-3位(如010、0571),号码7-8位,可带1-4位分机号(如010-12345678-123),适配企业固定电话录入。

2. 数据提取/过滤类(后台常用)

(1)提取网页中的所有链接(URL)

语法:https?://[^\s"]+

说明:提取网页中所有 http/https 开头的链接,可用于企业网站爬虫、友情链接批量提取。

(2)过滤HTML标签(后台接收前端富文本,过滤危险标签)

语法:<[^>]+>

说明:匹配所有HTML标签(如