正则表达式匹配⾝份证电话号码邮箱住宅电话邮编等
⾝份证号码的匹配
⼤陆的居民⾝份证号码有两种:18位和15位,15位的⾝份证号码是⽼⼀代⾝份证号码。
18位和15位的区别在于两个部分:第⼀,18位号码的年份以4位计⽽15位号码的年份为2位,如1987年在18位号码中
为‘1987’⽽在15位号码中为‘87’,这⾥1987只是作为⼀个例⼦可能1987年及以后根本不存在15位号码;第⼆处不同在于18位号码的最后⼀位为数字校验码,15位号码没有数字校验位。
好吧,可能你还不知道⾝份证号码各个部分代表着什么,那么让我简略地介绍⼀下。
⾝份证号码总共有4个部分(15位号码只有3部分),从左向右分别为:第⼀部分有6位,为居民在办理⾝份证时户⼝所在地的地址码(什么是地址码?⾃⼰到统计局去吧,地址如下:);第⼆部分有8位(15位号码为6位),为居民出⽣⽇期码;第三部分有3位,为数字顺序码,也就是同⼀天出⽣的⼈的⼀个排序,奇数代表男性⽽偶数代表⼥性;第四部分也就是最后⼀部分有1位,为数字校验码,此部分只有18位号码才有,关于数字校验码怎样计算得出,稍后会详述。
先举个例⼦吧,假设存在以下⾝份证号码:350525************(15位的话为350525*********),⽤‘-’号将各部分区分如下:350525-19870101-888-X。其中,350525为地址码,没错,到统计局查询的结果是‘福建省永春县’——⼀个桃园胜境,算了,不废话;19870101为出⽣⽇期码,呵呵,1987年1⽉1⽇这⼀天出⽣的⼈肯定是有滴;888为顺序码,估计1987年1⽉1⽇第888个出⽣的⼈应该没有吧,倘若真的有,那真不是⼈,是神!!呵呵,估计我党也不会给神这个号码,不多说了,再多说可能要⼈神共怒了……好吧,那么X是什么呢?怎么有些⼈的⾝份证号码最后⼀位会突然冒出⼀个X呢,是这些⼈⽐较特殊吗?答案是:不是的,也算是吧,倘若有⼀种个位数等于10,这些⼈也不⽤在⾝份证号码的最后⼀位被不明不⽩地加上⼀个X了,究竟是怎么⼀回事且听我细细道来^_^
18位居民⾝份证号码最后⼀位——数字校验码的计算⽅法:
1. 将⾝份证号码的前17位数分别乘以以下系数:7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2;
2. 将以上分别相乘得到的结果相加;
3. 将以上相加的结果除以11,得出余数;
4. 以上得出的余数可能为0 - 10这11个数中的某⼀个数字。10是⼀个另类,因为我们的数字校验位只
有1位显然需要⼀种替换⽅案,⽤1位将10换下,于是X派上⽤场了。注意了,数字校验位并不就是余数!!所得的11个余数:
0,1,2,3,4,5,6,7,8,9,10 的数字校验位分别为:
1,0,X,9,8,7,6,5,4,3,2
PS:通过以上的计算,现在应该⾮常清楚了,⾝份证号码的最后⼀位为X是因为在作校验时所得的余数是2,显然这些号码也没什么特别的吗。需要强调⼀下的是,X并不是英⽂字母哦,⽽是罗马数字X,记住,它不是字母⽽是数字,但是,呵呵,我们⼀般⽤英⽂⼤写字母X来表⽰罗马数字X,囧nz……出师表原文及翻译
让我花点时间来校验以上的⾝份证号码:350525************是否正确吧,先声明倘若证实可⽤千万别拿去做,⼀切本⼈概不负责!
1.前17位分别乘以相应系数:3*7+5*9+0*10+5*5+2*8+5*4+1*2+9*1+8*6+7*3+0*7+1*9+0*10+1*5+8*8+8*4+8*2=333(假如没算错的话^_^)
2.将以上所得结果333除以11,得出余数:3
3.呵呵350525************这个号码不是有效的⾝份证号码,有效号码应该为350525************
好了,知道了居民⾝份证号码各部分的意思后,我们终于可以动⼿寻求号码验证的解决⽅案了。
假设我们的系统并不知道输⼊号码之⼈的任何信息(如果系统还要求输⼊籍贯和出⽣⽇期,还可以进⼀步进⾏检验真伪喔
^_^)
⾸先,地址码的前2位是省级的编号,到统计局去查询得知第1位⾮0,并且⽬前的范围为1-9,9是国外的⾝份证号码。第2位的范围为0-7。统计局⼀般每⼀年都会公布⼀次更码,但对⽐多年来的地址码可以看出地址码基本上是不变的(要是变了,现有的⾝份证号码岂不是都没⽤了^_^)。我们的地址码的正则表达式可以这样写:/^[1-9][0-7]\d{4}/,其实,这么写不够精确,倘若要就⽬前的地址码写出精确的表达式,应该这么写/^((1[1-5])|(2[1-3])|(3[1-7])|(4[1-6])|(5[0-4])|(6[1-5])|71| (8[12])|91)\d{4}/,这样写显然精确多了,但表达式长了很多,当然为求精确表达式长⼀点是可以接受的,但是假如统计局修改了省级地址码,那么该表达式要根据实际情况稍作改动,所幸省级地址码应该是不会变的,呵呵,所以选择哪⼀种表达式都是可以的,我这就不写那么长的表达式了,所以选择/^[1-9][0-7]\d{4}/吧。
接下来就是⽇期了喔,呵呵,貌似之前写过的⽇期匹配可以借鉴来⽤⼀下,当时的那个表达式如下:
/^((((19|20)\d{2})-(0?[13-9]|1[012])-(0?[1-9]|[12]\d|30))|(((19|20)\d{2})-(0?[13578]|1[02])-31)|(((19|20)\d{2})-0?2-(0?[1-
四川汶川地震9]|1\d|2[0-8]))|((((19|20)([13579][26]|[2468][048]|0[48]))|(2000))-0?2-29))$/
这个表达式可以匹配1900-2099年的⽇期,还⽀持闰年。
我们的表达式不需要匹配那么长的时间,能够匹配⼆⼗世纪的就够了,什么,不知道⼆⼗世纪?1900-1999总该知道吧^_^为什么匹配了这个范围就够了呢?去查⼀下居民⾝份证的历史吧,我敢打保票1900-1999的范围还太⼤了。⾄于⼆⼗⼀世纪的新⼀代,呵呵,就算他是2000年出⽣的,⽬前也就15岁(有些算法是14岁,囧),这些⼈的号码应该还打印在户⼝簿⾥,拿出⼿也不会产⽣什么作⽤,再说,⼆⼗⼀世纪的⼈也不屑于我⽬前所写的匹配^_^
好吧,废话太多了,开始匹配⽇期吧。稍微修改了以上表达式:
/((19\d{2}(0[13-9]|1[012])(0[1-9]|[12]\d|30))|(19\d{2}(0[13578]|1[02])31)|(19\d{2}02(0[1-9]|1\d|2[0-8]))|(19([13579][26]|[2468] [048]|0[48])0229))/
正则表达式⾥没有计算验证的能⼒,所以对于顺序码,我们除了基本的匹配外⽆⼒于做什么,所以顺序码的表达式
为:/\d{3}/
最后⼀位数字验证码——/(\d|X|x)?$/。之所以那么写是因为,最后⼀位可能值为数字或X,但有些⼈可能习惯将X写成⼩写的x,我们必须视为正确,⽽最后的?是为了与15位号码兼容,此时只需将15位号码的年份⽤4位表⽰即可⽤我们以下整合的表达式进⾏匹配了——
/^[1-9][0-7]\d{4}((19\d{2}(0[13-9]|1[012])(0[1-9]|[12]\d|30))|(19\d{2}(0[13578]|1[02])31)|(19\d{2}02(0[1-9]|1\d|2[0-8]))|
(19([13579][26]|[2468][048]|0[48])0229))\d{3}(\d|X|x)?$/
地址码精确⼀点的表达式:
/^((1[1-5])|(2[1-3])|(3[1-7])|(4[1-6])|(5[0-4])|(6[1-5])|71|(8[12])|91)\d{4}((19\d{2}(0[13-9]|1[012])(0[1-9]|[12]\d|30))|(19\d{2}
(0[13578]|1[02])31)|(19\d{2}02(0[1-9]|1\d|2[0-8]))|(19([13579][26]|[2468][048]|0[48])0229))\d{3}(\d|X|x)?$/
区号+座机号码+分机号码:regexp="^(0[0-9]{2,3}/-)?([2-9][0-9]{6,7})+(/-[0-9]{1,4})?$"
⼿机(中国移动⼿机号码):regexp="^((/(/d{3}/))|(/d{3}/-))?13[456789]/d{8}|15[89]/d{8}"
所有⼿机号码:regexp="^((/(/d{3}/))|(/d{3}/-))?13[0-9]/d{8}|15[89]/d{8}"(新添加了158,159两个号段)
((/d{11})|^((/d{7,8})|(/d{4}|/d{3})-(/d{7,8})|(/d{4}|/d{3})-(/d{7,8})-(/d{4}|/d{3}|/d{2}|/d{1})|(/d{7,8})-(/d{4}|/d{3}|/d{2}|/d{1}))$)
匹配格式:
11位⼿机号码
3-4位区号,7-8位直播号码,1-4位分机号
如:12345678901、1234-12345678-1234
1.⽤正则表达式限制只能输⼊全⾓字符:οnkeyup="place(/[^/uFF00-/uFFFF]/g,'')"
onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^/uFF00-/uFFFF]/g,''))"
2.⽤正则表达式限制只能输⼊数字:οnkeyup="place(/[^/d]/g,'')
"onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^/d]/g,''))"
3.⽤正则表达式限制只能输⼊数字和英⽂:οnkeyup="place(/[/W]/g,'')
"onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^/d]/g,''))"
4.计算字符串的长度(⼀个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){place([^/x00-/xff]/g,"aa").length;}
5.javascript中没有像vbscript那样的trim函数,我们就可以利⽤这个表达式来实现,如下:
im = function()
{
place(/(^/s*)|(/s*$)/g, "");
}
利⽤正则表达式分解和转换IP地址:
6.下⾯是利⽤正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:
function IP2V(ip)
{
re=/(/d+)/.(/d+)/.(/d+)/.(/d+)/g //匹配IP地址的正则表达式
st(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("不是⼀个正确的IP地址!")
}
}
不过上⾯的程序如果不⽤正则表达式,⽽直接⽤split函数来分解可能更简单,程序如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
正则表达式⽤于字符串处理、表单验证等场合,实⽤⾼效。现将⼀些常⽤的表达式收集于此,以备不时之需。
匹配中⽂字符的正则表达式: [/u4e00-/u9fa5]
评注:匹配中⽂还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^/x00-/xff]
评注:可以⽤来计算字符串的长度(⼀个双字节字符长度计2,ASCII字符计1)
匹配空⽩⾏的正则表达式:/n/s*/r
评注:可以⽤来删除空⽩⾏
匹配HTML标记的正则表达式:<(/S*?)[^>]*>.*?<//1>|<.*? />
评注:⽹上流传的版本太糟糕,上⾯这个也仅仅能匹配部分,对于复杂的嵌套标记依旧⽆能为⼒
匹配⾸尾空⽩字符的正则表达式:^/s*|/s*$
评注:可以⽤来删除⾏⾸⾏尾的空⽩字符(包括空格、制表符、换页符等等),⾮常有⽤的表达式
匹配Email地址的正则表达式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
评注:表单验证时很实⽤
匹配⽹址URL的正则表达式:[a-zA-z]+://[^/s]*
评注:⽹上流传的版本功能很有限,上⾯这个基本可以满⾜需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实⽤
匹配国内电话号码:/d{3}-/d{8}|/d{4}-/d{7}
评注:匹配形式如 0511-******* 或 021-********
匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始
匹配中国:[1-9]/d{5}(?!/d)
评注:中国为6位数字
匹配⾝份证:/d{15}|/d{18}
评注:中国的⾝份证为15位或18位
匹配ip地址:/d+/./d+/./d+/./d+
评注:提取ip地址时有⽤
匹配特定数字:
^[1-9]/d*$ //匹配正整数
^-[1-9]/d*$ //匹配负整数
^-?[1-9]/d*$ //匹配整数
^[1-9]/d*|0$ //匹配⾮负整数(正整数 + 0)
^-[1-9]/d*|0$ //匹配⾮正整数(负整数 + 0)
^[1-9]/d*/./d*|0/./d*[1-9]/d*$ //匹配正浮点数
^-([1-9]/d*/./d*|0/./d*[1-9]/d*)$ //匹配负浮点数
^-?([1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0)$ //匹配浮点数
^[1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0$ //匹配⾮负浮点数(正浮点数 + 0)
^(-([1-9]/d*/./d*|0/./d*[1-9]/d*))|0?/.0+|0$ //匹配⾮正浮点数(负浮点数 + 0)
保养车
评注:处理⼤量数据时有⽤,具体应⽤时注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英⽂字母组成的字符串
^[A-Z]+$ //匹配由26个英⽂字母的⼤写组成的字符串
^[a-z]+$ //匹配由26个英⽂字母的⼩写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英⽂字母组成的字符串
^/w+$ //匹配由数字、26个英⽂字母或者下划线组成的字符串
评注:最基本也是最常⽤的⼀些表达式
匹配中⽂字符的正则表达式: [/u4e00-/u9fa5]
匹配双字节字符(包括汉字在内):[^/x00-/xff]
匹配空⾏的正则表达式:/n[/s| ]*/r
匹配HTML标记的正则表达式:/<(.*)>.*<///1>|<(.*) //>/
匹配⾸尾空格的正则表达式:(^/s*)|(/s*$)
匹配Email地址的正则表达式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
匹配⽹址URL的正则表达式:- ./?%&=]*)?
^/d+$ //匹配⾮负整数(正整数 + 0)
^[0-9]*[1-9][0-9]*$ //匹配正整数
^((-/d+)|(0+))$ //匹配⾮正整数(负整数 + 0)
^-[0-9]*[1-9][0-9]*$ //匹配负整数
金木水火土名字^-?/d+$ //匹配整数
^/d+(/./d+)?$ //匹配⾮负浮点数(正浮点数 + 0)
手机密码忘了怎么解锁
^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮点数^((-/d+(/./d+)?)|(0+(/.0+)?))$ //匹配⾮正浮点数(负浮点数 + 0)
^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配负浮点数^(-?/d+)(/./d+)?$ //匹配浮点数
^[A-Za-z]+$ //匹配由26个英⽂字母组成的字符串
^[A-Z]+$ //匹配由26个英⽂字母的⼤写组成的字符串
^[a-z]+$ //匹配由26个英⽂字母的⼩写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英⽂字母组成的字符串
^/w+$ //匹配由数字、26个英⽂字母或者下划线组成的字符串
^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$
"^/d+$"  //⾮负整数(正整数 + 0)
"^[0-9]*[1-9][0-9]*$"  //正整数
"^((-/d+)|(0+))$"  //⾮正整数(负整数 + 0)
"^-[0-9]*[1-9][0-9]*$"  //负整数
"^-?/d+$"    //整数
"^/d+(/./d+)?$"  //⾮负浮点数(正浮点数 + 0)
"^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮点数"^((-/d+(/./d+)?)|(0+(/.0+)?))$"  //⾮正浮点数(负浮点数 + 0)
"^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //负浮点数
"^(-?/d+)(/./d+)?$"  //浮点数
"^[A-Za-z]+$"  //由26个英⽂字母组成的字符串
"^[A-Z]+$"  //由26个英⽂字母的⼤写组成的字符串
"^[a-z]+$"  //由26个英⽂字母的⼩写组成的字符串
"^[A-Za-z0-9]+$"  //由数字和26个英⽂字母组成的字符串
"^/w+$"  //由数字、26个英⽂字母或者下划线组成的字符串
"^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$"    //email地址
"^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$"  //url
/^13/d{9}$/gi⼿机号正则表达式
董卿6任男友曝光public static bool IsValidMobileNo(string MobileNo)
{
const string regPattern = @"^(130|131|132|133|134|135|136|137|138|139)/d{8}$";  return Regex.IsMatch(MobileNo, regPattern);
}
正则表达式--验证⼿机号码:13[0-9]{9}
实现⼿机号前带86或是+86的情况:^((/+86)|(86))?(13)/d{9}$
电话号码与⼿机号码同时验证:(^(/d{3,4}-)?/d{7,8})$|(13[0-9]{9})
提取信息中的⽹络链接:(h|H)(r|R)(e|E)(f|F) *= *('|")?(/w|//|//|/.)+('|"| *|>)?
提取信息中的邮件地址:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
提取信息中的图⽚链接:(s|S)(r|R)(c|C) *= *('|")?(/w|//|//|/.)+('|"| *|>)?
提取信息中的IP地址:(/d+)/.(/d+)/.(/d+)/.(/d+)
提取信息中的中国⼿机号码:(86)*0*13/d{9}
提取信息中的中国固定电话号码:(/(/d{3,4}/)|/d{3,4}-|/s)?/d{8}
提取信息中的中国电话号码(包括移动和固定电话):(/(/d{3,4}/)|/d{3,4}-|/s)?/d{7,14}    提取信息中的中国:[1-9]{1}(/d+){5}
提取信息中的中国⾝份证号码:/d{18}|/d{15}
提取信息中的整数:/d+
提取信息中的浮点数(即⼩数):(-?/d*)/.?/d+
提取信息中的任何数字:(-?/d*)(/./d+)?
提取信息中的中⽂字符串:[/u4e00-/u9fa5]*
提取信息中的双字节字符串 (汉字):[^/x00-/xff]*