关于regex：如何使用正则表达式验证电子邮件地址？

How to validate an email address using a regular expression?

多年来，我慢慢地开发了一个正则表达式，它可以正确地验证大多数电子邮件地址，假设它们不使用IP地址作为服务器部分。

我在几个PHP程序中使用它，它大多数时候都能工作。但是，有时我会被一个使用它的网站有问题的人联系，最后我不得不做一些调整(最近我意识到我不允许使用4字符的TLD)。

您在验证电子邮件时看到或看到的最佳正则表达式是什么？

我见过一些使用几个较短表达式的函数的解决方案，但我更愿意在简单函数中使用一个长的复杂表达式，而不是在更复杂的函数中使用几个短表达式。

完全符合RFC822的regex由于其长度而效率低下且晦涩难懂。幸运的是，RFC822被两次取代，目前电子邮件地址的规范是RFC5322。RFC5322导致了一个regex，如果研究几分钟就可以理解，并且对于实际使用来说足够有效。

在http://emailregex.com/的页面顶部可以找到一个符合RFC 5322的regex，但使用的IP地址模式在Internet上浮动，其错误允许00用于点分隔地址中的任何无符号字节十进制值，这是非法的。其余部分似乎与RFC 5322语法一致，并通过了几个使用grep -Po的测试，包括案例域名、IP地址、坏域名和带引号和不带引号的帐户名。

纠正了IP模式中的00错误，我们得到了一个运行良好、速度相当快的regex。(为实际代码刮除呈现的版本，而不是标记。)

(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])*")@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\[(?:(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9]))\.){3}(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9])|[a-z0-9-]*[a-z0-9]:(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21-\x5a\x53-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])+)\])

下面是上面的regexp的有限状态机图，它比regexp本身更清楚。 enter image description here

Perl和PCRE中更复杂的模式(例如在PHP中使用的regex库)可以无障碍地正确解析RFC5322。python和c也可以这样做，但它们使用的语法与前两种不同。但是，如果您被迫使用许多不太强大的模式匹配语言之一，那么最好使用真正的解析器。

同样重要的是要理解，根据RFC验证它完全不会告诉您该地址是否确实存在于所提供的域中，或者输入该地址的人是否是其真正的所有者。人们总是用这种方式把其他人注册到邮件列表中。修复这一问题需要一种更高级的验证，即向该地址发送一条消息，其中包含一个确认令牌，该令牌应与地址输入在同一网页上。

确认令牌是唯一知道输入者地址的方法。这就是为什么大多数邮件列表现在使用该机制来确认注册。毕竟，任何人都可以放下[email protected]，这甚至是合法的，但不太可能是另一端的人。

对于php，您不应该使用php验证电子邮件地址中给出的模式，这是我引用的正确方式：

There is some danger that common usage and widespread sloppy coding will establish a de facto standard for e-mail addresses that is more restrictive than the recorded formal standard.

这并不比所有其他非RFC模式都好。它甚至不够聪明，处理甚至RFC822，更不用说RFC5322。然而，这个是。

如果你想得到花哨和学究，实现一个完整的状态引擎。正则表达式只能用作基本筛选器。正则表达式的问题在于，告诉某人他们的完全有效的电子邮件地址是无效的(误报)，因为从用户的角度来看，正则表达式无法处理它是粗鲁和不礼貌的。为此目的，状态引擎可以验证甚至更正电子邮件地址，否则将被视为无效，因为它根据每个RFC反汇编电子邮件地址。这会带来一种潜在的更愉快的体验，比如

The specified e-mail address 'myemail@address,com' is invalid. Did you mean '[email protected]'?

另请参见验证电子邮件地址，包括注释。或者比较验证正则表达式的电子邮件地址。

Regular expression visualization

调试程序演示

相关讨论

您说"没有好的正则表达式"。这是一般的还是特定于电子邮件地址验证的？
@托马拉克：仅用于电子邮件地址。正如Bortzmeyer所说，RFC非常复杂
你提到的Linux期刊文章在几个方面实际上是错误的。特别是，洛维尔显然没有读到RFC3696的勘误表，并在已发布的RFC版本中重复了一些错误。更多信息请访问：dominicsayers.com/isemail
Jeff Atwood在这篇博客文章中有一个可爱的regex来验证所有有效的电子邮件地址：codinghorry.com/blog/2005/02/regex-use-vs-regex-abuse.html
请参阅：simonclick.com/veaf，了解如何有效地使用正则表达式来验证电子邮件地址。
这些脚本似乎不适用于Unicode域名
如果"没有好的正则表达式"，那么这个答案是怎么做到的呢？
@zsolti:有关于unicode域名的规范吗？此解决方案枚举其标记中的一组合法域文本字符。这个正则表达式显然是从一个RFC编写的。如果有一个应该具有优先权的更新的模式，我相信更新是很简单的，因为阿比盖尔的模式写得很好。
@是的，Unicode域名有一个标准，它有七年的历史(现在的RFC3490，现在的RFC5891和5892)。
@Bortzmeyer：是的，Unicode域名有一个标准，但是将其集成到电子邮件中的相关RFC仍处于实验状态，可能会发生变化。RFC5322还没有更新来处理它们。
Monster regex以"地址"语法元素为目标，要求用户输入"addr spec"并将显示名称设为单独的框是完全合理的。regex太大了，因为它必须多次重复addr spec(并允许折叠空白，您可以简单地要求用户不要使用空白)。您的web表单不是一个smtp服务器，它不需要处理一个地址的"groups"或多个等效表单(由于空格和显示名称的原因)。一个不允许折叠空格的addr-spec regex最终只包含大约100个字符。
大部分的RFC5322与问题无关。因为RFC还描述了如何格式化多个地址的列表，或者邮箱的一些元数据(例如：显示名称)。其他答案中大多数"巨大的regexp"只给出了几乎完整的rfc5322 regexp，因此也不相关。
以下是一些有效电子邮件的官方规则：rumkin.com/software/email/rules.php
请注意，当前的HTML5规范包括用于电子邮件类型输入验证的regex和abnf，这比原始的RFC更严格。
RFC5336已经被弃用，取而代之的是更为光亮的RFC6531(smtputf8)，它已经被谷歌在Gmail中部署，并在Postfix中发布。突然，Unicode电子邮件地址变得更加有趣了。
域名可以包含空格？regex与ainfo@ täst . d e匹配
对于新的域扩展，是否应该更新，因为最后一部分现在可以包含2，13字符？
或者，遵循HTML5规范对电子邮件地址的定义。它与RFC不一致，但与实际使用情况一致。很容易验证。
这是一个很好的答案。不过，我确实有一个问题，我知道我的营销总监会和我争论这个问题，并强调为什么我们需要有效的电子邮件地址。我从潜在客户的角度理解他的观点，但我也理解过滤每一封潜在无效的电子邮件似乎是不现实和不可能的。在我去和一个不明白的人辩论之前，有人能告诉我这是真的吗？
回复：debuggex演示-也许我对规范一无所知，没有读过它，或者这证明了regex不是验证电子邮件地址的好方法…但是，:;是有效的电子邮件地址吗？它传递以Debuggex为宿主的表达式(？)
注意，php7.1有一个新的电子邮件验证实现。支持国际电子邮件的RFC 6531。
我试图验证foo@example，但是这个正则表达式说它是无效的。它似乎想要一个.在这个领域。但我读了RFC5322，说domain是dot-atom / domain-literal / obs-domain，dot-atom是1*atext *("." 1*atext)，在我看来，点是可选的。我读得对吗？
它似乎也不喜欢user@[IPv6:2001:DB8::1]，en.wikipedia.org/wiki/email_-address说它应该是有效的。我在regexr.com测试。我只是做错了什么吗？
"完全有效的电子邮件地址无效(误报)"这不是误报吗？
有些有效的电子邮件在regex中不匹配："very.()，：；<>[]"。very."very@"very".unnormal"@strange.example.com admin@mailserver1"()<>[]：，；@"！β%＆？^` ~.a"@example.org user@localserver user@[2001:db8:：1]来源：regextester.com/？FAM＝99667
此regex易受javascript(node/v8)中灾难性回溯的攻击。我没有测试其他语言。
验证电子邮件的唯一有用regex是/@/。
在HTML输入模式属性中引发错误…
这会通过吗？[email protected]'但是是否有任何singlr char域可用，或者甚至允许？？
给定的regex模式允许单字符顶级域。这些都是技术上允许的(请参阅stackoverflow.com/a/21872376/1512790)，但目前不存在，这意味着任何包含单个字符TLD的电子邮件实际上都是无效的。因为重点是电子邮件验证，所以模式不应该排除单字符TLD吗？
regexp和关系图都有一个错误：在域部分，字符类范围之一包括范围x21-x5a和范围x53-x7f，它们重叠(5a>53)。
RFC 822，第6.2.4节。特别明确地允许大写字母，但这个答案不允许。w3.org/protocols/rfc822/z26也许是这个答案的作者，目的是让他们的regex不敏感地应用。如果是这样，应该在答案的正文中明确说明。

您不应该使用正则表达式来验证电子邮件地址。

相反，使用mailaddress类，如下所示：

1
2
3
4
5

try {
address = new MailAddress(address).Address;
} catch(FormatException) {
//address is invalid
}

mailaddress类使用bnf解析器完全按照rfc822验证地址。

如果您真的想使用regex，这里是：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389

(?:(?:

)?[ \t])*(?:(?:(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t]
)+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(
?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[
\t]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\0
31]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\
](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+
(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:
(?:

)?[ \t])*))*|(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z
|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)
?[ \t])*)*\<(?:(?:

)?[ \t])*(?:@(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:\
r
)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[
\t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)
?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t]
)*))*(?:,@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[
\t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*
)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t]
)+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*)
*:(?:(?:

)?[ \t])*)?(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+
|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t
]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031
]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](
?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?
:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?
:

)?[ \t])*))*\>(?:(?:

)?[ \t])*)|(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?
:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?
[ \t]))*"(?:(?:

)?[ \t])*)*:(?:(?:

)?[ \t])*(?:(?:(?:[^()<>@,;:\".\[\]
\000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|
\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>

@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"
(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t]
)*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?
:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[
\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*|(?:[^()<>@,;:\".\[\] \000-
\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(
?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)*\<(?:(?:

)?[ \t])*(?:@(?:[^()<>@,;
:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([
^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\"
.\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\
]
\\]|\\.)*\](?:(?:

)?[ \t])*))*(?:,@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\
[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]\
r\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\]
\000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]
|\\.)*\](?:(?:

)?[ \t])*))*)*:(?:(?:

)?[ \t])*)?(?:[^()<>@,;:\".\[\] \0
00-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\
.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,
;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?
:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t])*
(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".
\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[
^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]
]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*\>(?:(?:

)?[ \t])*)(?:,\s*(
?:(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(
?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[
\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t
])*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t
])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?
:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|
\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*|(?:
[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\
]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)*\<(?:(?:

)
?[ \t])*(?:@(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["
()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)
?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>

@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*(?:,@(?:(?:

)?[
\t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,
;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t]
)*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*)*:(?:(?:

)?[ \t])*)?
(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".
\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\[
"()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])
*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])
+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\
.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z
|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*\>(?:(
?:

)?[ \t])*))*)?;\s*)

相关讨论

您会发现.NET 4.0中的mailaddress类在验证电子邮件地址方面比以前的版本要好得多。我对它做了一些重要的改进。
我觉得有点…不起作用…更简单的ID。A@B无法验证。[email protected]只匹配到ar@b，该.com不匹配。但是，像"我就是我"@[10.10.10.10]这样的东西确实有效！：)
你确定是正确的吗？haacked.com/archive/2007/08/21/&hellip；
为了澄清，我没有写的部分是regex，而不是MailAddress代码。
交叉发布到Lisp和Perl论坛，然后观看火花飞舞。
顺便说一句，那个正则表达式是个错误的答案。它不处理注释(如代码所述)，而是用于已过时的RFC822。
嘿，slaks，mailaddress也坏了：stackoverflow.com/questions/7173401/&hellip；
我真的以为这是个笑话，因为我发现：ex parrot.com/~pdw/mail-rfc822-address.html现在我明白了为什么你得到这么多的赞成票了。
如果把它放在mailadress.check()方法中，那么普通人(不是针对你的slaks！)能够意识到这一点！@斯莱克斯：你发明了一种计时机器来获取这些知识吗？我要买一个！需要128小时的工作日！
取代了RFC822的新协议RFC5322怎么样？
请注意，这些符合RFC的regex验证器将通过许多您可能不想接受的电子邮件地址，例如"a"这是Perl电子邮件中的有效电子邮件地址：：valid(它使用了那个巨大的regex)，并且可以用于xss rt.cpan.org/public/bug/display.html吗？ID＝75650
@马修洛克：这不比埃多克斯1〔5〕差。您不能依赖电子邮件验证来阻止XSS。
仅仅因为这是一个规范的答案：这个regex不验证电子邮件地址。它验证to/bcc字段，即"my name is"这样的字符串。
仅供参考：微软确实为这个任务提供了一个"推荐"的正则表达式，说明如何：验证字符串是否是有效的电子邮件格式。但是，在解释了regex的工作原理之后，他们抛出了"您可以使用System.net.mail.mail address类，而不是使用正则表达式来验证电子邮件地址。"：)
@马修洛克，你为什么不接受？！如果这是某人的电子邮件地址呢？您是否也拒绝包含"空"的姓氏？
只是听取小鲍比表妈妈的建议，对数据库输入进行消毒xkcd.com/327
@MatthewLock:不需要。您需要转义SQL查询(或者更好的是，使用参数)。卫生处理不是正当防卫。
我建议使用消毒作为第一道防线，然后对查询进行参数化，最后对HTML进行转义以避免XSS。如果你在一个大团队中工作，你不能保证有人会记住避免XSS，所以最好还是对输入进行消毒。
问题是关于PHP。
不！不要使用regex或类。如果您想像您所展示的那样使用PHP，那么就使用内置的PHP电子邮件验证器FILTER_VALIDATE_EMAIL。

这个问题被问了很多，但我认为你应该退后一步，问问你自己为什么要在语法上验证电子邮件地址？真正的好处是什么？

它不会捕获常见的打字错误。
它不会阻止人们输入无效或虚构的电子邮件地址，或输入其他人的地址。

如果要验证电子邮件是否正确，除了发送确认电子邮件并让用户答复之外，您别无选择。在许多情况下，出于安全原因或道德原因，您必须发送确认邮件(例如，您不能违背他们的意愿为某人注册服务)。

相关讨论

可能值得检查的是，他们在客户端验证的字段中输入了一些@something，只是为了捕捉简单的错误——但一般来说，您是对的。
马丁，我给了你一个+1，后来才知道foobar@dk是一封有效的电子邮件。它不会很漂亮，但是如果您希望既符合RFC又使用常识，那么您应该检测这样的情况，并要求用户确认这是正确的。
我想更多的是用户在密码字段中输入"name"，或者忘记了.com/.dk部分。但一般来说，用regex验证地址是不值得的。
@奥拉夫克：如果有人输入错别字(如：me@hotmail)，他们显然不会收到你的确认邮件，那么他们在哪里？他们已经不在你的网站上了，他们想知道为什么他们不能注册。事实上，他们不是-他们完全忘记了你。但是，如果你可以在regex还和你在一起的时候，对它们进行基本的健全性检查，那么它们就可以立即捕捉到这个错误，这样你就有了一个快乐的用户。
验证电子邮件的一个原因是，有些SMTP服务器对电子邮件收件人列表中的地址格式和分隔非常挑剔。例如，我工作时使用的SMTP服务器不喜欢在地址之间混合分号和逗号作为分隔符。与这个问题相关的是，它也不喜欢"none"和"blah."@something.com(注意@前面的句号)。如果这些异常之一在列表中，那么整个收件人列表将不会收到电子邮件。
@雅克：你说得很有道理。仅仅因为它通过了每个RFC的集合并不意味着它真的是那个用户的地址。否则，所有这些[email protected]地址都表示一个非常网络繁忙的总司令。：)
我会说一些@something.something至少。原因是您不希望电子邮件发送到本地主机或本地域。我还将防止"空白"和任何介于0x00-0x1F之间的内容出现在您的电子邮件中，因为这可能是您的邮件服务器的攻击向量。也要设置大小限制，以防止257+字符的电子邮件地址。
@尼克：从技术上讲，不需要TLD，我@hotmail是有效的。比Regex更好的解决方案是列出常见的电子邮件提供商(hotmail.com、me.com、gmail.com、yahoo.com)并在地址中搜索拼写错误。
也许可以添加一个JS typeahead，它建议所有常见的电子邮件提供者帮助用户防止输入错误(当然，除了电子邮件确认系统)。
最重要的是，对于[email protected]来说，这并不是失败的，它是一个可爱的电子邮件地址，可以发送给那些毫无理由想要电子邮件的讨厌地方。
在客户端验证的一个原因是保存到服务器的访问。一个更合理的理由可能是在注册过程中尽早发出警告，以提供更好的用户体验，这样既可以为用户节省时间，也可以为客户服务人员节省时间。
它不必是黑色或白色的。如果电子邮件看起来错误，请告知用户。如果用户仍想继续，让他继续。不要强迫用户遵守您的regex，而是使用regex作为一种工具来帮助用户知道可能存在错误。
同样值得一提的是，尽管这个问题提到了验证，但谁说在检查regex时需要验证一些东西？许多垃圾邮件发送者很容易以一个基本的regex为目标，这样他们就不会在数据库中填充过多的垃圾。
@实际上，在me@hotmail中，hotmail是TLD。(当然，这不是一个有效的TLD，但这不是我的观点。)
@nickf除了你的评论外，我建议检查是否可以访问域部分，如果不能，请将反馈返回给用户。例如，EDOCX1[2]可能是"抱歉，我们无法达到[192.168.0.255]。你喜欢忽略这个吗？是的/不。在现实世界的例子中，这将避免与me@hotmail的问题，但它不会与[email protected]的问题(以及打字错误)。但最后，要抓住所有的打字错误是不可能的。
比完美少一点应该很简单。这应该可以捕获99.9%的情况：没有空格，只有一个@符号，电子邮件名称的任何字符，只有有效的域名字符。/^[^ ^@.]+@[a-z0-9][\.a-z0-9_-]*\.[a-z0-9]{2,}$/i
@jcalfee314:该regex还将禁止某些有效的电子邮件地址。为什么你想在没有理由的情况下拒绝合法用户？
当用户输入一个明显不正确的电子邮件地址时，用户会被困在等待5-10分钟，等待电子邮件(从不)到达。最好实现一个简单的regex，它不覆盖电子邮件地址的整个范围。
您还可以使用regex进行清理，以确保收到的是实际的电子邮件地址，而不是一些SQL命令。
@jcalfee314-"你能更具体一点吗…"首先，你完全不允许在用户名部分使用"."(dot)，所以"[email protected]"是不允许的。类似(但不太可能)的问题有"@"、""(空格)和"^"。当然，如果允许"."，则必须在开头或结尾处禁用".."或"."，例如："[email protected]"、"sue."@example.com"或"[email protected]"。更重要的是，如果验证失败，您会怎么做。您是否阻止用户使用未通过测试(坏)的电子邮件地址，或者在您通知他们检查正确性(好)后允许他们继续使用？
另请参见：lists.w3.org/archives/public/public whatwg archive/2009aug/&hellip；

这取决于你所说的"最好"是什么意思：如果您要捕获每个有效的电子邮件地址，请使用以下内容：

(?:(?:

)?[ \t])*(?:(?:(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t]
)+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(
?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[
\t]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\0
31]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\
](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+
(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:
(?:

)?[ \t])*))*|(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z
|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)
?[ \t])*)*\<(?:(?:

)?[ \t])*(?:@(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:\
r
)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[
\t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)
?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t]
)*))*(?:,@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[
\t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*
)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t]
)+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*)
*:(?:(?:

)?[ \t])*)?(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+
|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t
]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031
]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](
?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?
:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?
:

)?[ \t])*))*\>(?:(?:

)?[ \t])*)|(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?
:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?
[ \t]))*"(?:(?:

)?[ \t])*)*:(?:(?:

)?[ \t])*(?:(?:(?:[^()<>@,;:\".\[\]
\000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|
\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>
@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"
(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t]
)*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?
:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[
\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*|(?:[^()<>@,;:\".\[\] \000-
\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(
?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)*\<(?:(?:

)?[ \t])*(?:@(?:[^()<>@,;
:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([
^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\"
.\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\
]
\\]|\\.)*\](?:(?:

)?[ \t])*))*(?:,@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\
[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]\
r\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\]
\000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]
|\\.)*\](?:(?:

)?[ \t])*))*)*:(?:(?:

)?[ \t])*)?(?:[^()<>@,;:\".\[\] \0
00-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\
.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,
;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]]))|"(?
:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*))*@(?:(?:

)?[ \t])*
(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".
\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[
^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\]
]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*\>(?:(?:

)?[ \t])*)(?:,\s*(
?:(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(
?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[
\["()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t
])*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t
])+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?
:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|
\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*|(?:
[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".\[\
]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)*\<(?:(?:

)
?[ \t])*(?:@(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["
()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)
?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>
@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*(?:,@(?:(?:

)?[
\t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,
;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t]
)*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*)*:(?:(?:

)?[ \t])*)?
(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\["()<>@,;:\".
\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])*)(?:\.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z|(?=[\[
"()<>@,;:\".\[\]]))|"(?:[^"
\\]|\\.|(?:(?:

)?[ \t]))*"(?:(?:

)?[ \t])
*))*@(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])
+|\Z|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*)(?:\
.(?:(?:

)?[ \t])*(?:[^()<>@,;:\".\[\] \000-\031]+(?:(?:(?:

)?[ \t])+|\Z
|(?=[\["()<>@,;:\".\[\]]))|\[([^\[\]
\\]|\\.)*\](?:(?:

)?[ \t])*))*\>(?:(
?:

)?[ \t])*))*)?;\s*)

(http://www.ex-parrot.com/~pdw/mail-rfc822-address.html)如果您正在寻找更简单但能捕捉到最有效的电子邮件地址，请尝试以下方法：

1	"^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$"

编辑：从链接：

This regular expression will only validate addresses that have had any comments stripped and replaced with whitespace (this is done by the module).

相关讨论

这完全取决于你想要的准确度。为了我的目的，如果我只是想避开像EDOCX1(电子邮件中的空格)或steve(完全没有域)或mary@aolcom(在.com之前没有句号)，我使用

1	/^\S+@\S+\.\S+$/

当然，它会匹配那些无效的电子邮件地址，但这是玩90/10规则的问题。

相关讨论

[更新]我在这里整理了我所知道的关于电子邮件地址验证的所有信息：http://isemail.info，它现在不仅可以验证电子邮件地址，还可以诊断电子邮件地址的问题。我同意这里的许多评论，即验证只是答案的一部分；请参阅我的文章http://isemail.info/about。

据我所知，_email()仍然是唯一能明确告诉您给定字符串是否为有效电子邮件地址的验证器吗？我在http://isemail.info上传了一个新版本/

我整理了Cal Henderson、Dave Child、Phil Haack、Doug Lovell、RFC5322和RFC3696的测试案例。共275个测试地址。我用我能找到的所有免费验证器运行了所有这些测试。

当人们增强他们的验证器时，我将尝试使此页面保持最新。感谢Cal、Michael、Dave、Paul和Phil在编译这些测试时的帮助和合作以及对我自己的验证器的建设性批评。

人们应该特别注意RFC3696的勘误表。其中三个规范示例实际上是无效地址。地址的最大长度是254或256个字符，而不是320个字符。

相关讨论

根据W3C HTML5规范：

1	^[a-zA-Z0-9.!#$%&'+/=?^_`{\|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)$

语境：

A valid e-mail address is a string that matches the ABNF production […].

Note: This requirement is a willful violation of RFC 5322, which defines a syntax for e-mail addresses that is simultaneously too strict (before the"@" character), too vague (after the"@" character), and too lax (allowing comments, whitespace characters, and quoted strings in manners unfamiliar to most users) to be of practical use here.

The following JavaScript- and Perl-compatible regular expression is an implementation of the above definition.

1
/^[a-zA-Z0-9.!#$%&'*+/=?^_`{|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$/

相关讨论

在Perl5.10或更高版本中很容易实现：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53

/(?(DEFINE)
(? (?&mailbox) | (?&group))
(?<mailbox> (?&name_addr) | (?&addr_spec))
(?<name_addr> (?&display_name)? (?&angle_addr))
(? (?&CFWS)? < (?&addr_spec) > (?&CFWS)?)
(?<group> (?&display_name) : (?:(?&mailbox_list) | (?&CFWS))? ;
(?&CFWS)?)
(?<display_name> (?&phrase))
(?<mailbox_list> (?&mailbox) (?: , (?&mailbox))*)

(? (?&local_part) \@ (?&domain))
(?<local_part> (?&dot_atom) | (?&quoted_string))
(?<domain> (?&dot_atom) | (?&domain_literal))
(?<domain_literal> (?&CFWS)? \[ (?: (?&FWS)? (?&dcontent))* (?&FWS)?
\] (?&CFWS)?)
(?<dcontent> (?&dtext) | (?&quoted_pair))
(?<dtext> (?&NO_WS_CTL) | [\x21-\x5a\x5e-\x7e])

(? (?&ALPHA) | (?&DIGIT) | [!#\$%&'*+-/=?^_`{|}~])
(? (?&CFWS)? (?&atext)+ (?&CFWS)?)
(?<dot_atom> (?&CFWS)? (?&dot_atom_text) (?&CFWS)?)
(?<dot_atom_text> (?&atext)+ (?: \. (?&atext)+)*)

(?<text> [\x01-\x09\x0b\x0c\x0e-\x7f])
(?<quoted_pair> \\ (?&text))

(?<qtext> (?&NO_WS_CTL) | [\x21\x23-\x5b\x5d-\x7e])
(?<qcontent> (?&qtext) | (?&quoted_pair))
(?<quoted_string> (?&CFWS)? (?&DQUOTE) (?:(?&FWS)? (?&qcontent))*
(?&FWS)? (?&DQUOTE) (?&CFWS)?)

(?<word> (?&atom) | (?&quoted_string))
(?<phrase> (?&word)+)

# Folding white space
(?<FWS> (?: (?&WSP)* (?&CRLF))? (?&WSP)+)
(?<ctext> (?&NO_WS_CTL) | [\x21-\x27\x2a-\x5b\x5d-\x7e])
(?<ccontent> (?&ctext) | (?&quoted_pair) | (?&comment))
(?<comment> $ (?: (?&FWS)? (?&ccontent))* (?&FWS)? $ )
(?<CFWS> (?: (?&FWS)? (?&comment))*
(?: (?:(?&FWS)? (?&comment)) | (?&FWS)))

# No whitespace control
(?<NO_WS_CTL> [\x01-\x08\x0b\x0c\x0e-\x1f\x7f])

(?<ALPHA> [A-Za-z])
(?<DIGIT> [0-9])
(?<CRLF> \x0d \x0a)
(?<DQUOTE> ")
(?<WSP> [\x20\x09])
)

(?&address)/x

相关讨论

我用

1	^\w+([-+.']\w+)@\w+([-.]\w+)\.\w+([-.]\w+)*$

这是RegularExpressionValidator在ASP.NET中使用的。

相关讨论

不知道什么是最好的，但这个至少是正确的，只要地址的注释被删除并替换为空白。

说真的。您应该使用已经编写的库来验证电子邮件。最好的方法可能是将验证电子邮件发送到该地址。

相关讨论

我要验证的电子邮件地址将由ASP.NET Web应用程序使用System.NET.Mail命名空间向人员列表发送电子邮件。所以，我不使用非常复杂的正则表达式，而是尝试从地址创建mailaddress实例。如果地址格式不正确，mailaddress construtor将引发异常。这样的话，我知道我至少可以把邮件拿出去。当然，这是服务器端验证，但至少您需要这样做。

1
2
3
4
5
6
7
8
9
10
11
12

protected void emailValidator_ServerValidate(object source, ServerValidateEventArgs args)
{
try
{
var a = new MailAddress(txtEmail.Text);
}
catch (Exception ex)
{
args.IsValid = false;
emailValidator.ErrorMessage ="email:" + ex.Message;
}
}

相关讨论

快速回答

使用以下regex进行输入验证：好的。

([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)+好的。

此regex匹配的地址：好的。

具有严格符合RFC 5321/5322的本地部件(即@符号前的部件)。
有一个域部分(即@符号后面的部分)，它是一个主机名，至少有两个标签，每个标签最长63个字符。

第二个约束是对RFC5321/5322的限制。好的。详尽的回答

使用识别电子邮件地址的正则表达式在各种情况下可能很有用：例如扫描文档中的电子邮件地址、验证用户输入或作为数据存储库的完整性约束。好的。

但是，应该注意的是，如果您想知道地址是否实际引用了现有邮箱，则无法替代向该地址发送邮件。如果您只想检查地址的语法是否正确，那么可以使用正则表达式，但请注意，""@[]是一个语法正确的电子邮件地址，它肯定不会引用现有的邮箱。好的。

电子邮件地址的语法已经在各种RFC中定义，最显著的是RFC822和RFC5322。RFC822应被视为"原始"标准，RFC5322应被视为最新标准。RFC822中定义的语法是最宽松的，随后的标准进一步限制了语法，在这种情况下，较新的系统或服务应该识别过时的语法，但决不生成它。好的。

在这个答案中，我将使用"电子邮件地址"来表示RFC中定义的addr-spec(即[email protected]，但不是"John Doe"，也不是some-group:[email protected],[email protected];)。好的。

将RFC语法转换成regex有一个问题：语法不规则！这是因为它们允许电子邮件地址中可以无限嵌套的可选注释，而无限嵌套不能由正则表达式描述。要扫描或验证包含注释的地址，您需要分析器或更强大的表达式。(注意，像Perl这样的语言都有以类似regex的方式描述上下文无关语法的构造。)在这个答案中，我将忽略注释，只考虑适当的正则表达式。好的。

RFC为电子邮件定义语法，而不是电子邮件地址。地址可能出现在不同的标题字段中，这是它们主要定义的地方。当它们出现在头字段中时，地址可能包含(在词汇标记之间)空格、注释甚至换行符。然而，从语义上讲，这没有意义。通过从一个地址中删除这个空格等，您可以得到一个语义上等价的规范表示。因此，first. last (comment) @ [3.5.7.9]的规范表示是first.last@[3.5.7.9]。好的。

不同的语法应该用于不同的目的。如果您想扫描(可能非常旧)文档中的电子邮件地址，最好使用RFC822中定义的语法。另一方面，如果要验证用户输入，您可能需要使用RFC5322中定义的语法，可能只接受规范表示。您应该决定哪种语法适用于您的特定情况。好的。

我在这个答案中使用POSIX"扩展"正则表达式，假设使用与ASCII兼容的字符集。好的。RFC 822

我得到了下面的正则表达式。我邀请每个人尝试打破它。如果你发现任何误报或误报，请发表评论，我会尽快修复表达。好的。

([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]))*(\\
)*")(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]))*(\\
)*"))*@([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]))*(\\
)*])(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]))*(\\
)*]))*好的。

我相信它完全符合包括勘误表在内的RFC822。它只以其规范形式识别电子邮件地址。对于识别(折叠)空白的regex，请参见下面的派生。好的。

推导过程显示了我是如何得出表达式的。我列出了RFC中所有相关的语法规则，与它们显示的完全相同，后面跟着相应的regex。在发布了勘误表的地方，我为已更正的语法规则(标记为"勘误表")提供了一个单独的表达式，并在随后的正则表达式中使用更新的版本作为子表达式。好的。

如第3.1.4段所述。在RFC822中，可选的线性空白可以插入词法标记之间。在适用的情况下，我扩展了表达式以适应此规则，并将结果标记为"opt lwsp"。好的。

CHAR =
=~ .

CTL =
=~ [\x00-\x1F\x7F]

CR = <ASCII CR, carriage return>
=~

LF = <ASCII LF, linefeed>
=~

SPACE = <ASCII SP, space>
=~

HTAB = <ASCII HT, horizontal-tab>
=~ \t

<"> = <ASCII quote mark>
=~"

CRLF = CR LF
=~

LWSP-char = SPACE / HTAB
=~ [ \t]

linear-white-space = 1*([CRLF] LWSP-char)
=~ ((

)?[ \t])+

specials = "(" /")" /"<" /">" /"@" / "," /";" /":" /"" / <"> / "." /"[" /"]"
=~ [][()<>@,;:\".]

quoted-pair = "" CHAR
=~ \\.

qtext = ,"" & CR, and including linear-white-space>
=~ [^"\\
]|((

)?[ \t])+

dtext =
=~ [^][\\
]|((

)?[ \t])+

quoted-string = <"> *(qtext|quoted-pair) <">
=~"([^"\\
]|((

)?[ \t])|\\.)*"
(erratum) =~"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*"

domain-literal = "[" *(dtext|quoted-pair)"]"
=~ \[([^][\\
]|((

)?[ \t])|\\.)*]
(erratum) =~ \[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*]

atom = 1*
=~ [^][()<>@,;:\". \x00-\x1F\x7F]+

word = atom / quoted-string
=~ [^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*"

domain-ref = atom

sub-domain = domain-ref / domain-literal
=~ [^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*]

local-part = word *("." word)
=~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*")(\.([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*"))*
(opt-lwsp) =~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*")(((

)?[ \t])*\.((

)?[ \t])*([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*"))*

domain = sub-domain *("." sub-domain)
=~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*])(\.([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*]))*
(opt-lwsp) =~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*])(((

)?[ \t])*\.((

)?[ \t])*([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*]))*

addr-spec = local-part"@" domain
=~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*")(\.([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*"))*@([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*])(\.([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*]))*
(opt-lwsp) =~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*")((

)?[ \t])*(\.((

)?[ \t])*([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]|(

)?[ \t]))*(\\
)*")((

)?[ \t])*)*@((

)?[ \t])*([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*])(((

)?[ \t])*\.((

)?[ \t])*([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]|(

)?[ \t]))*(\\
)*]))*
(canonical) =~ ([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]))*(\\
)*")(\.([^][()<>@,;:\". \x00-\x1F\x7F]+|"(
|(\\
)*([^"\\

]|\\[^
]))*(\\
)*"))*@([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]))*(\\
)*])(\.([^][()<>@,;:\". \x00-\x1F\x7F]+|\[(
|(\\
)*([^][\\

]|\\[^
]))*(\\
)*]))*

RFC 5322

我得到了下面的正则表达式。我邀请每个人尝试打破它。如果你发现了任何误报或误报，请发表评论，我会尽快修复表达。好的。

([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|\[[\t -Z^-~]*])好的。

我相信它完全符合包括勘误表在内的RFC5322。它只以其规范形式识别电子邮件地址。对于识别(折叠)空白的regex，请参见下面的派生。好的。

推导过程显示了我是如何得到表达式的。我列出了RFC中所有相关的语法规则，与它们出现的完全相同，后面跟着相应的regex。对于包含语义无关(折叠)空白的规则，我给出了一个单独的regex，标记为"(normalized)"，它不接受这个空白。好的。

我忽略了来自RFC的所有"obs-"规则。这意味着regex只匹配严格符合RFC5322的电子邮件地址。如果您必须匹配"旧"地址(例如更宽松的语法，包括"obs-"规则)，您可以使用上一段中的RFC822正则表达式之一。好的。

VCHAR = %x21-7E
=~ [!-~]

ALPHA = %x41-5A / %x61-7A
=~ [A-Za-z]

DIGIT = %x30-39
=~ [0-9]

HTAB = %x09
=~ \t

CR = %x0D
=~

LF = %x0A
=~

SP = %x20
=~

DQUOTE = %x22
=~ "

CRLF = CR LF
=~

WSP = SP / HTAB
=~ [\t ]

quoted-pair = "" (VCHAR / WSP)
=~ \\[\t -~]

FWS = ([*WSP CRLF] 1*WSP)
=~ ([\t ]*

)?[\t ]+

ctext = %d33-39 / %d42-91 / %d93-126
=~ []!-'*-[^-~]

("comment" is left out in the regex)
ccontent = ctext / quoted-pair / comment
=~ []!-'*-[^-~]|(\\[\t -~])

(not regular)
comment = "(" *([FWS] ccontent) [FWS]")"

(is equivalent to FWS when leaving out comments)
CFWS = (1*([FWS] comment) [FWS]) / FWS
=~ ([\t ]*

)?[\t ]+

atext = ALPHA / DIGIT /"!" /"#" /"$" /"%" /"&" /"'" /"*" /"+" /"-" /"/" /"=" /"?" /"^" /"_" /"`" /"{" /"|" /"}" /"~"
=~ [-!#-'*+/-9=?A-Z^-~]

dot-atom-text = 1*atext *("." 1*atext)
=~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*

dot-atom = [CFWS] dot-atom-text [CFWS]
=~ (([\t ]*

)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*

)?[\t ]+)?
(normalized) =~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*

qtext = %d33 / %d35-91 / %d93-126
=~ []!#-[^-~]

qcontent = qtext / quoted-pair
=~ []!#-[^-~]|(\\[\t -~])

(erratum)
quoted-string = [CFWS] DQUOTE ((1*([FWS] qcontent) [FWS]) / FWS) DQUOTE [CFWS]
=~ (([\t ]*

)?[\t ]+)?"(((([\t ]*

)?[\t ]+)?([]!#-[^-~]|(\\[\t -~])))+(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?)"(([\t ]*

)?[\t ]+)?
(normalized) =~ "([]!#-[^-~ \t]|(\\[\t -~]))+"

dtext = %d33-90 / %d94-126
=~ [!-Z^-~]

domain-literal = [CFWS]"[" *([FWS] dtext) [FWS]"]" [CFWS]
=~ (([\t ]*

)?[\t ]+)?\[((([\t ]*

)?[\t ]+)?[!-Z^-~])*(([\t ]*

)?[\t ]+)?](([\t ]*

)?[\t ]+)?
(normalized) =~ \[[\t -Z^-~]*]

local-part = dot-atom / quoted-string
=~ (([\t ]*

)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?"(((([\t ]*

)?[\t ]+)?([]!#-[^-~]|(\\[\t -~])))+(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?)"(([\t ]*

)?[\t ]+)?
(normalized) =~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+"

domain = dot-atom / domain-literal
=~ (([\t ]*

)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?\[((([\t ]*

)?[\t ]+)?[!-Z^-~])*(([\t ]*

)?[\t ]+)?](([\t ]*

)?[\t ]+)?
(normalized) =~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|\[[\t -Z^-~]*]

addr-spec = local-part"@" domain
=~ ((([\t ]*

)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?"(((([\t ]*

)?[\t ]+)?([]!#-[^-~]|(\\[\t -~])))+(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?)"(([\t ]*

)?[\t ]+)?)@((([\t ]*

)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*

)?[\t ]+)?|(([\t ]*

)?[\t ]+)?\[((([\t ]*

)?[\t ]+)?[!-Z^-~])*(([\t ]*

)?[\t ]+)?](([\t ]*

)?[\t ]+)?)
(normalized) =~ ([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|\[[\t -Z^-~]*])

请注意，一些来源(尤其是W3C)声称RFC5322对本地部分(即@符号前的部分)过于严格。这是因为".."、"A..B"和"A."不是有效的点原子，而它们可以用作邮箱名称。然而，RFC允许像这样的本地部件，除非它们必须被引用。因此，你应该写"a..b"@example.net，而不是[email protected]，这在语义上是等价的。好的。进一步限制

SMTP(定义见RFC5321)进一步限制了一组有效的电子邮件地址(或者实际上是邮箱名)。强加这种更严格的语法似乎是合理的，这样匹配的电子邮件地址就可以实际用于发送电子邮件。好的。

RFC5321基本上只保留"局部"部分(即@符号前的部分)，但在域部分(即@符号后的部分)更严格。它只允许主机名代替点原子，地址字代替域字。好的。

当涉及到主机名和IP地址时，RFC5321中的语法太过宽泛。我冒昧地"修正"了相关的规则，使用这个草案和RFC1034作为指导方针。这是生成的regex。好的。

([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)*|\[((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+)])好的。

注意，根据用例的不同，您可能不希望在regex中允许"常规地址文本"。另外请注意，我在最后的regex中使用了一个负的lookahead (?!IPv6:)，以防止"常规地址文字"部分与格式错误的ipv6地址匹配。有些regex处理器不支持负向前看。如果要去掉整个"通用地址文字"部分，请从regex中删除子字符串|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+。好的。

推导如下：好的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64

Let-dig = ALPHA / DIGIT
=~ [0-9A-Za-z]

Ldh-str = *( ALPHA / DIGIT /"-" ) Let-dig
=~ [0-9A-Za-z-]*[0-9A-Za-z]

(regex is updated to make sure sub-domains are max. 63 charactes long - RFC 1034 section 3.5)
sub-domain = Let-dig [Ldh-str]
=~ [0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?

Domain = sub-domain *("." sub-domain)
=~ [0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)*

Snum = 1*3DIGIT
=~ [0-9]{1,3}

(suggested replacement for"Snum")
ip4-octet = DIGIT / %x31-39 DIGIT /"1" 2DIGIT /"2" %x30-34 DIGIT /"25" %x30-35
=~ 25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9]

IPv4-address-literal = Snum 3("." Snum)
=~ [0-9]{1,3}(\.[0-9]{1,3}){3}

(suggested replacement for"IPv4-address-literal")
ip4-address = ip4-octet 3("." ip4-octet)
=~ (25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}

(suggested replacement for"IPv6-hex")
ip6-h16 = "0" / ( (%x49-57 / %x65-70 /%x97-102) 0*3(%x48-57 / %x65-70 /%x97-102) )
=~ 0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}

(not from RFC)
ls32 = ip6-h16":" ip6-h16 / ip4-address
=~ (0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}

(suggested replacement of"IPv6-addr")
ip6-address = 6(ip6-h16":") ls32
/ "::" 5(ip6-h16":") ls32
/ [ ip6-h16 ]"::" 4(ip6-h16":") ls32
/ [ *1(ip6-h16":") ip6-h16 ]"::" 3(ip6-h16":") ls32
/ [ *2(ip6-h16":") ip6-h16 ]"::" 2(ip6-h16":") ls32
/ [ *3(ip6-h16":") ip6-h16 ]"::" ip6-h16":" ls32
/ [ *4(ip6-h16":") ip6-h16 ]"::" ls32
/ [ *5(ip6-h16":") ip6-h16 ]"::" ip6-h16
/ [ *6(ip6-h16":") ip6-h16 ]"::"
=~ (((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::

IPv6-address-literal = "IPv6:" ip6-address
=~ IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)

Standardized-tag = Ldh-str
=~ [0-9A-Za-z-]*[0-9A-Za-z]

dcontent = %d33-90 / %d94-126
=~ [!-Z^-~]

General-address-literal = Standardized-tag":" 1*dcontent
=~ [0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+

address-literal = "[" ( IPv4-address-literal / IPv6-address-literal / General-address-literal )"]"
=~ \[((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+)]

Mailbox = Local-part"@" ( Domain / address-literal )
=~ ([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)*|\[((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+)])

用户输入验证

一个常见的用例是用户输入验证，例如在HTML表单上。在这种情况下，排除地址文本和要求主机名中至少有两个标签通常是合理的。以前一节中改进的RFC 5321 regex为基础，得到的表达式为：好的。

([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)+好的。

我不建议进一步限制本地部分，例如通过排除带引号的字符串，因为我们不知道某些主机允许使用哪种邮箱名称(如"a..b"@example.net甚至"a b"@example.net)。好的。

我也不建议针对文字顶级域列表进行明确验证，甚至不建议使用长度限制(记住".museum"如何使[a-z]{2,4}无效)，但如果必须：好的。

([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?\.)*(net|org|com|info|等…)等好的。

如果您决定执行显式顶级域验证，请确保您的regex是最新的。好的。进一步考虑

当只接受域部分中的主机名(@符号之后)时，上面的regex只接受最多63个字符的标签，因为它们应该接受。但是，它们并不强制要求整个主机名的长度不能超过253个字符(包括点)。虽然严格地说，这个约束仍然是规则的，但是要生成一个包含这个规则的regex是不可行的。好的。

另一个考虑因素，特别是在使用regex进行输入验证时，是对用户的反馈。如果用户输入的地址不正确，最好给出的反馈比简单的"语法错误地址"多一点。用"香草"正则表达式是不可能的。好的。

这两个注意事项可以通过解析地址来解决。在某些情况下，主机名上的额外长度约束也可以通过使用一个额外的regex来解决，该regex检查主机名，并将地址与两个表达式匹配。好的。

此答案中的所有regex都没有针对性能进行优化。如果性能是一个问题，您应该看看您选择的regex是否可以优化(以及如何优化)。好的。好啊。

相关讨论

网络上有很多这样的例子(我认为即使是一个可以完全验证RFC的例子——但是如果内存可用的话，它有数十/数百行长)。人们往往会对验证这类事情感到不知所措。为什么不检查一下它有一个@和至少一个。并满足一些简单的最小长度。输入一封假电子邮件，仍然匹配任何有效的regex，这很简单。我想假阳性比假阴性更好。

相关讨论

在决定允许哪些字符时，请记住您的撇号和连字符朋友。我无法控制我的公司使用我的名字从人力资源系统生成我的电子邮件地址。这包括我姓中的撇号。我不能告诉你有多少次我被阻止与一个网站互动，因为我的电子邮件地址是"无效的"。

相关讨论

此regex来自Perl的email:：valid library。我相信这是最准确的，它符合所有822。它基于O'Reilly书中的正则表达式：

Regular expression built using Jeffrey Friedl's example in
Mastering Regular Expressions (http://www.ora.com/catalog/regexp/).

$RFC822PAT = <<'EOF';
[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\
xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xf
f
\015()]*)*\)[\040\t]*)*(?:(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\x
ff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|"[^\\\x80-\xff
\015
"]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015"]*)*")[\040\t]*(?:$[^\\\x80-\
xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80
-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*
)*(?:\.[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\
\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\
x80-\xff
\015()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x8
0-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|"[^\\\x80-\xff

\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015"]*)*")[\040\t]*(?:$[^\\\x
80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^
\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040
\t]*)*)*@[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([
^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\
\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\
x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-
\xff
\015\[\]]|\\[^\x80-\xff])*\])[\040\t]*(?:$[^\\\x80-\xff
\015()
]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\
x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:\.[\04
0\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\
n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\
015()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?!
[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff
\015\[\
]]|\\[^\x80-\xff])*\])[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\
x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\01
5()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*)*|(?:[^(\040)<>@,;:".
\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]
)|"[^\\\x80-\xff
\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015"]*)*")[^
()<>@,;:".\\\[\]\x80-\xff\000-\010\012-\037]*(?:(?:$[^\\\x80-\xff
\0
15()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][
^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)|"[^\\\x80-\xff\
n\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015"]*)*")[^()<>@,;:".\\\[\]\
x80-\xff\000-\010\012-\037]*)*<[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?
:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-
\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:@[\040\t]*
(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015
()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()
]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\0
40)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff
\015\[\]]|\\
[^\x80-\xff])*\])[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\
xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*
)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:$[^\\\x80
-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x
80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t
]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\
\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff
\015\[\]]|\\[^\x80-\xff])
*\])[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x
80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80
-\xff
\015()]*)*\)[\040\t]*)*)*(?:,[\040\t]*(?:$[^\\\x80-\xff
\015(
)]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\
\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*@[\040\t
]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\0
15()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015
()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(
\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff
\015\[\]]|
\\[^\x80-\xff])*\])[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80
-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()
]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:$[^\\\x
80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^
\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040
\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".
\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff
\015\[\]]|\\[^\x80-\xff
])*\])[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\
\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x
80-\xff
\015()]*)*\)[\040\t]*)*)*)*:[\040\t]*(?:$[^\\\x80-\xff
\015
()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\
\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*)?(?:[^
(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-
\037\x80-\xff])|"[^\\\x80-\xff
\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff\
n\015"]*)*")[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|
\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)
[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:$[^\\\x80-\xff

\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\x
ff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(
?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\
000-\037\x80-\xff])|"[^\\\x80-\xff
\015"]*(?:\\[^\x80-\xff][^\\\x80-\
xff
\015"]*)*")[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\x
ff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)
*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*)*@[\040\t]*(?:$[^\\\x80-\x
ff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-
\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)
*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\
]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff
\015\[\]]|\\[^\x80-\xff])*\]
)[\040\t]*(?:$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-
\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\x
ff
\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:$[^\\\x80-\xff
\015()]*(
?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]*(?:\\[^\x80-\xff][^\\\x80
-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)*\)[\040\t]*)*(?:[^(\040)<
>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x8
0-\xff])|\[(?:[^\\\x80-\xff
\015\[\]]|\\[^\x80-\xff])*\])[\040\t]*(?:
$[^\\\x80-\xff
\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff
\015()]
*(?:\\[^\x80-\xff][^\\\x80-\xff
\015()]*)*$)[^\\\x80-\xff
\015()]*)
*\)[\040\t]*)*)*>)
EOF

相关讨论

在用PHP编写时，我建议您使用PHP内置电子邮件验证。

1	filter_var($value, FILTER_VALIDATE_EMAIL)

如果运行的PHP版本低于5.3.6，请注意以下问题：https://bugs.php.net/bug.php？ID＝53091

如果您想了解更多关于内置验证如何工作的信息，请参见这里：php的filter_var filter_validate_email是否实际工作？

相关讨论

Cal Henderson(Flickr)在PHP中写了一篇名为"解析电子邮件地址"的文章，并展示了如何正确地进行符合RFC(2)822的电子邮件地址解析。您还可以使用获得CC许可的PHP、Python和Ruby获取源代码。

相关讨论

我从不费心用我自己的正则表达式来创建，因为很可能其他人已经想出了一个更好的版本。我总是用regexlib来找到我喜欢的。

相关讨论

没有真正有用的。我在回答中讨论了一些问题：是否有用于电子邮件地址验证的PHP库？在regexp中还讨论了如何硬识别电子邮件地址？

简言之，不要期望一个单一的、可用的regex做一个适当的工作。最好的regex将验证语法，而不是电子邮件的有效性([email protected]是正确的，但它可能会反弹…)。

相关讨论

一个至少不会拒绝任何有效电子邮件地址的简单正则表达式是检查某个内容，后跟@符号，然后是句点和至少2个内容。它不会拒绝任何东西，但是在审阅规范之后，我找不到任何有效和被拒绝的电子邮件。

email=~/.+@[^@]+\.[^@]{2,}$/。

相关讨论

您可以使用jquery验证插件使用的插件：

/^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$/i

相关讨论

有关验证电子邮件地址的最佳正则表达式的最全面评估，请参阅此链接；"比较电子邮件地址验证正则表达式"

以下是用于引用的当前top表达式：

1	/^([\w\!\#$\%\&\'\\+\-\/\=\?\^\`{\\|\}\~]+\.)[\w\!\#$\%\&\'\*\+\-\/\=\?\^\`{\\|\}\~]+@((((([a-z0-9]{1}[a-z0-9\-]{0,62}[a-z0-9]{1})\|[a-z])\.)+[a-z]{2,6})\|(\d{1,3}\.){3}\d{1,3}(\:\d{1,5})?)$/i

相关讨论

更不用说在不久的将来允许使用非拉丁(中文、阿拉伯语、希腊语、希伯来语、西里尔文等)域名。每个人都必须更改regex使用的电子邮件，因为这些字符肯定不会被[a-z]/i或\w覆盖。他们都会失败。

毕竟，验证电子邮件地址的最佳方法仍然是将电子邮件实际发送到相关地址以验证该地址。如果电子邮件地址是用户身份验证(注册/登录/etc)的一部分，那么您可以将其与用户激活系统完美结合。即，将带有唯一激活密钥的链接的电子邮件发送到指定的电子邮件地址，并且仅当用户使用电子邮件中的链接激活新创建的帐户时才允许登录。

如果regex的目的只是快速地通知用户，指定的电子邮件地址的格式不正确，那么最好还是检查它是否与以下regex基本匹配：

1	^([^.@]+)(\.[^.@]+)*@([^.@]+\.)+([^.@]+)$

就这么简单。你到底为什么会关心名字和域名中使用的字符？客户有责任输入一个有效的电子邮件地址，而不是服务器的。即使客户输入一个语法上有效的电子邮件地址，如[email protected]，这也不能保证它是合法的电子邮件地址。没有一个Regex可以覆盖这一点。

相关讨论

HTML5规范建议使用一个简单的regex来验证电子邮件地址：

1	/^[a-zA-Z0-9.!#$%&'+\/=?^_`{\|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)$/

这故意不符合RFC5322。

Note: This requirement is a willful violation of RFC 5322, which defines a syntax for e-mail addresses that is simultaneously too strict (before the @ character), too vague (after the @ character), and too lax (allowing comments, whitespace characters, and quoted strings in manners unfamiliar to most users) to be of practical use here.

根据RFC 3696勘误表1690，总长度也可以限制为254个字符。

相关讨论

对于一个生动的演示，下面的怪物是相当好的，但仍然不能正确识别所有语法上有效的电子邮件地址：它可以识别多达四层的嵌套注释。

对于解析器来说，这是一个任务，但是即使地址在语法上是有效的，它仍然可能无法交付。有时你不得不求助于乡巴佬式的"嘿，你们，看我们！"

// derivative of work with the following copyright and license:
// Copyright (c) 2004 Casey West. All rights reserved.
// This module is free software; you can redistribute it and/or
// modify it under the same terms as Perl itself.

// see http://search.cpan.org/~cwest/Email-Address-1.80/

private static string gibberish = @"
(?-xism:(?:(?-xism:(?-xism:(?-xism:(?-xism:(?-xism:(?-xism:\
s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^
\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))
|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+
|\s+)*[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+(?-xism:(?-xism:\
s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^
\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))
|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+
|\s+)*)|(?-xism:(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism:(
?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?
:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x
0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*<DQ>(?-xism:(?-xism:[
^\\<DQ>])|(?-xism:\$?-xism:[^\x0A\x0D])))+<DQ>(?-xism:(?-xi
sm:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xis
m:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\
]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\
s*)+|\s+)*))+)?(?-xism:(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?
-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:
\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[
^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*<(?-xism:(?-xi
sm:(?-xism:(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism:(?>[^(
)\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(
?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))
|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()<
>\[\]:;@\,.<DQ>\s]+(?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]
+)*)(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))
|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:
(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s
*$\s*))+)*\s*\)\s*)+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*$(?
:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x
0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xi
sm:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*
<DQ>(?-xism:(?-xism:[^\\<DQ>])|(?-xism:\$?-xism:[^\x0A\x0D]
)))+<DQ>(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\
]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-x
ism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+
)*\s*$\s*))+)*\s*\)\s*)+|\s+)*))\@(?-xism:(?-xism:(?-xism:(
?-xism:\s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?
-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^
()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s
*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+(
?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+)*)(?-xism:(?-xism:
\s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[
^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+)
)|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)
+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism:
(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((
?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\
x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*\[(?:\s*(?-xism:(?-x
ism:[^\[\]\\])|(?-xism:\$?-xism:[^\x0A\x0D])))+)*\s*\](?-xi
sm:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:
\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(
?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+
)*\s*\)\s*)+|\s+)*)))>(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-
xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\
s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^
\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*))|(?-xism:(?-x
ism:(?-xism:(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism:(?>[^
()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*
(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D])
)|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()
<>\[\]:;@\,.<DQ>\s]+(?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s
]+)*)(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+)
)|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism
:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\
s*$\s*))+)*\s*\)\s*)+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*$(
?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\
x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-x
ism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)
*<DQ>(?-xism:(?-xism:[^\\<DQ>])|(?-xism:\$?-xism:[^\x0A\x0D
])))+<DQ>(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\
\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-
xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)
+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*))\@(?-xism:(?-xism:(?-xism:
(?-xism:\s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(
?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[
^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\
s*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+
(?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+)*)(?-xism:(?-xism
:\s*$(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:
[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+
))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*
)+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*$(?:\s*(?-xism:(?-xism
:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\(
(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A
\x0D]))|)+)*\s*$\s*))+)*\s*\)\s*)+|\s+)*\[(?:\s*(?-xism:(?-
xism:[^\[\]\\])|(?-xism:\$?-xism:[^\x0A\x0D])))+)*\s*\](?-x
ism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism
:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:
(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*$\s*))
+)*\s*\)\s*)+|\s+)*))))(?-xism:\s*$(?:\s*(?-xism:(?-xism:(?
>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:
\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0
D]))|)+)*\s*$\s*))+)*\s*\)\s*)*)"
.Replace("<DQ>",""")
.Replace("\t","")
.Replace("","")
.Replace("
","")
.Replace("
","");

private static Regex mailbox =
new Regex(gibberish, RegexOptions.ExplicitCapture);

这是我使用的PHP。我选择这个解决方案的精神是"假阳性比假阴性更好"，正如这里的另一位评论员所声明的，关于保持您的响应时间上升和服务器负载下降…当使用正则表达式消除最简单的用户错误时，实际上不需要浪费服务器资源。如果你想的话，你可以发送一封测试邮件来跟进。

1
2
3

function validateEmail($email) {
return (bool) stripos($email,'@');
}

相关讨论

RFC 5322标准：

允许点原子本地部分、带引号的字符串本地部分、过时(混合点原子和带引号的字符串)本地部分、域名域(IPv4、IPv6和IPv4映射的IPv6地址)、域文本域和(嵌套)CFW。

'/^(?!(?>(?1)"?(?>\\\[ -~]|[^"])"?(?1)){255,})(?!(?>(?1)"?(?>\\\[ -~]|[^"])"?(?1)){65,}@)((?>(?>(?>((?>(?>(?>\x0D\x0A)?[\t ])+|(?>[\t ]*\x0D\x0A)?[\t ]+)?)($(?>(?2)(?>[\x01-\x08\x0B\x0C\x0E-\'*-\[\]-\x7F]|\\\[\x00-\x7F]|(?3)))*(?2)$))+(?2))|(?2))?)([!#-\'*+\/-9=?^-~-]+|"(?>(?2)(?>[\x01-\x08\x0B\x0C\x0E-!#-\[\]-\x7F]|\\\[\x00-\x7F]))*(?2)")(?>(?1)\.(?1)(?4))*(?1)@(?!(?1)[a-z0-9-]{64,})(?1)(?>([a-z0-9](?>[a-z0-9-]*[a-z0-9])?)(?>(?1)\.(?!(?1)[a-z0-9-]{64,})(?1)(?5)){0,126}|\[(?:(?>IPv6:(?>([a-f0-9]{1,4})(?>:(?6)){7}|(?!(?:.*[a-f0-9][:\]]){8,})((?6)(?>:(?6)){0,6})?::(?7)?))|(?>(?>IPv6:(?>(?6)(?>:(?6)){5}:|(?!(?:.*[a-f0-9]:){6,})(?8)?::(?>((?6)(?>:(?6)){0,4}):)?))?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?9)){3}))\])(?1)$/isD'

RFC 5321标准：

允许点原子本地部分、带引号的字符串本地部分、域名域和(IPv4、IPv6和IPv4映射的IPv6地址)域文本域。

'/^(?!(?>"?(?>\\\[ -~]|[^"])"?){255,})(?!"?(?>\\\[ -~]|[^"]){65,}"?@)(?>([!#-\'*+\/-9=?^-~-]+)(?>\.(?1))*|"(?>[ !#-\[\]-~]|\\\[ -~])*")@(?!.*[^.]{64,})(?>([a-z0-9](?>[a-z0-9-]*[a-z0-9])?)(?>\.(?2)){0,126}|\[(?:(?>IPv6:(?>([a-f0-9]{1,4})(?>:(?3)){7}|(?!(?:.*[a-f0-9][:\]]){8,})((?3)(?>:(?3)){0,6})?::(?4)?))|(?>(?>IPv6:(?>(?3)(?>:(?3)){5}:|(?!(?:.*[a-f0-9]:){6,})(?5)?::(?>((?3)(?>:(?3)){0,4}):)?))?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?6)){3}))\])$/iD'

基本的：

允许点原子本地部分和域名域(至少需要两个域名标签，TLD限制为2-6个字母字符)。

1	"/^(?!.{255,})(?!.{65,}@)([!#-'+\/-9=?^-~-]+)(?>\.(?1))@(?!.[^.]{64,})(?>[a-z0-9](?>[a-z0-9-][a-z0-9])?\.){1,126}[a-z]{2,6}$/iD"

相关讨论

根据官方标准RFC 2822，有效的电子邮件regex是

(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])*")@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\[(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?|[a-z0-9-]*[a-z0-9]:(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21-\x5a\x53-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])+)\])

如果你想在Java中使用它，它真的很简单。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

import java.util.regex.*;

class regexSample
{
public static void main(String args[])
{
//Input the string for validation
String email ="[email protected]";

//Set the email pattern string
Pattern p = Pattern.compile(" (?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"
+"(?:[\\x01-\\x08\\x0b\\x0c\\x0e-\\x1f\\x21\\x23-\\x5b\\x5d-\\x7f]|\\[\\x01-\\x09\\x0b\\x0c\\x0e-\\x7f])*")"
+"@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\\[(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?|[a-z0-9-]*[a-z0-9]:(?:[\\x01-\\x08\\x0b\\x0c\\x0e-\\x1f\\x21-\\x5a\\x53-\\x7f]|\\[\\x01-\\x09\\x0b\\x0c\\x0e-\\x7f])+)\\]");

//Match the given string with the pattern
Matcher m = p.matcher(email);

//check whether match is found
boolean matchFound = m.matches();

if (matchFound)
System.out.println("Valid Email Id.");
else
System.out.println("Invalid Email Id.");
}
}

相关讨论

奇怪的是你"不能"允许4个字符的TLD。你在禁止人们使用.info和.name，以及限制长度的stop、travel和.museum，但是是的，它们比两个字符的tld和三个字符的tld要少。

你也应该允许大写字母。电子邮件系统将规范本地部分和域部分。

对于域部分的regex，域名不能以"-"开头，也不能以"-"结尾。破折号只能停留在中间。

如果您使用了Pear库，请查看它们的邮件功能(忘记了确切的名称/库)。您可以通过调用一个函数来验证电子邮件地址，它根据RFC822中的定义来验证电子邮件地址。

相关讨论

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

public bool ValidateEmail(string sEmail)
{
if (sEmail == null)
{
return false;
}

int nFirstAT = sEmail.IndexOf('@');
int nLastAT = sEmail.LastIndexOf('@');

if ((nFirstAT > 0) && (nLastAT == nFirstAT) && (nFirstAT < (sEmail.Length - 1)))
{
return (Regex.IsMatch(sEmail, @"^[a-z|0-9|A-Z]*([_][a-z|0-9|A-Z]+)*([.][a-z|0-9|A-Z]+)*([.][a-z|0-9|A-Z]+)*(([_][a-z|0-9|A-Z]+)*)?@[a-z][a-z|0-9|A-Z]*\.([a-z][a-z|0-9|A-Z]*(\.[a-z][a-z|0-9|A-Z]*)?)$"));
}
else
{
return false;
}
}

我已经用了一段时间了，这是你的regex的润色版，它没有给我太多的惊喜。我从未在电子邮件中遇到过撇号，因此它不会验证这一点。它确实验证了[email protected]和试@例子.测试.????.???????，但没有奇怪地滥用这些非字母数字字符[email protected]。

1
(?!^[.+&'_-]*@.*$)(^[_\w\d+&'-]+(\.[_\w\d+&'-]*)*@[\w\d-]+(\.[\w\d-]+)*\.(([\d]{1,3})|([\w]{2,}))$)

它确实支持IP地址[email protected]，但我还没有对它进行足够的改进，以处理诸如999.999.999.1之类的假IP范围。
~~它还支持超过3个字符的所有TLD，这些字符停止了[email protected]，我认为原始的let-through。~~我已经被打败了，现在有太多的TLD超过3个字符。~~~~
~~我知道阿克罗斯曼已经放弃了他的雷格克斯，但这种味道仍然存在。~~

如果您可以接受空值(这不是无效的电子邮件)，并且正在运行php 5.2+，我建议：

1
2
3
4
5
static public function checkEmail($email, $ignore_empty = false) {
if($ignore_empty && (is_null($email) || $email == ''))
return true;
return filter_var($email, FILTER_VALIDATE_EMAIL);
}

我总是使用下面的正则表达式来验证电子邮件地址。这是我见过的验证电子邮件地址的最好的regex。

1
"\A(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?)\Z";

我在ASP.NET代码中总是使用这个正则表达式，我对此非常满意。
使用此程序集引用

1
using System.Text.RegularExpressions;

并尝试以下代码，因为它很简单，可以为您完成工作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
private bool IsValidEmail(string email) {
bool isValid = false;
const string pattern = @"\A(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?)\Z";

isValid = email !="" && Regex.IsMatch(email, pattern);

// an alternative of the above line is also given and commented
//
//if (email =="") {
// isValid = false;
//} else {
// // address provided so use the IsMatch Method
// // of the Regular Expression object
// isValid = Regex.IsMatch(email, pattern);
//}
return isValid;
}

此函数用于验证电子邮件字符串。如果电子邮件字符串为空，则返回假；如果电子邮件字符串的格式不正确，则返回假。只有电子邮件的格式有效时才会返回true。

相关讨论

此代码接受"h&229；kan.s&246；derstr&246；m@malm&246；.se"或"[email protected]."？？？？？？？？？？？？？？"电子邮件？

它适用于带有标准字符的标准电子邮件服务器。如果是非英语语言，则必须制作自己的自定义regex。

对于标准的英语电子邮件，看起来不错！

我知道这个问题是关于regex的，但我猜想90%阅读这些解决方案的开发人员都在试图验证浏览器中显示的HTML表单中的电子邮件地址。
如果是这种情况，我建议检查新的HTML5 表单元素：
HTML5：

1
<input type="email" required />

CSS3：

1
2
3
4
5
6
7
8
9
10
11
12
13
input:required {
background-color: rgba(255,0,0,0.2);
}

input:focus:invalid {
box-shadow: 0 0 1em red;
border-color: red;
}

input:focus:valid {
box-shadow: 0 0 1em green;
border-color: green;
}

http://jsfiddle.net/myre7/1
这有两个优点：

自动验证，无需定制解决方案：简单易用

没有javascript，如果JS已被禁用，则没有问题。

没有服务器必须为此计算任何内容

用户有即时反馈

旧浏览器应自动回退到输入类型"文本"

移动浏览器可以显示专用键盘(@-键盘)

使用CSS3，表单验证反馈非常简单

明显的缺点可能是缺少对旧浏览器的验证，但这会随着时间的推移而改变。比起这些疯狂的雷鬼杰作，我更喜欢这个。
还可以看到：

http://jsfiddle.net/myre7/1/

http://diveintohtml5.info/forms.html

http://blog.mozilla.org/webdev/2011/03/14/html5-form-validation-on-sumo/

相关讨论

另一方面，这只是客户端。有利于提供流畅的用户体验，有利于验证数据。

默认电子邮件验证的问题在于它有很多误报。你需要使用我的完整模式来消除所有误报，同时防止误报潜入。该模式可以通过pattern属性添加。更多信息见我的帖子。

我们使用http://www.aspnetmx.com/已有几年的成功经验。您可以选择要验证的级别(例如语法检查、域检查、MX记录或实际电子邮件)。
对于前端表单，我们通常会验证域是否存在以及语法是否正确，然后在进行批量邮件发送之前，我们会进行更严格的验证以清除数据库。

我使用多步骤验证。由于没有完美的方法来验证电子邮件地址，因此无法创建完美的电子邮件地址，但至少您可以通知用户他/她正在做错误的事情-这是我的方法
1)我首先使用非常基本的regex进行验证，它只检查电子邮件是否正好包含一个@符号，并且在该符号之前或之后不是空白的。如/^[^@\s]+@[^@\s]+$/。
2a)如果第一个验证器没有通过(对于大多数地址，它应该是不完美的)，那么警告用户电子邮件是无效的，并且不允许他/她继续输入。
2b)如果通过，则针对更严格的regex进行验证-这可能会禁止有效的电子邮件。如果不通过，则会警告用户可能发生的错误，但允许用户继续。与步骤(1)不同，因为这是一个明显的错误，所以不允许用户继续。
换句话说，第一次自由验证只是为了去掉明显的错误，它被视为"错误"。人们输入一个空地址，不带@符号的地址等等。这应该被视为错误。第二个更严格，但被视为"警告"，允许用户继续输入，但警告用户至少检查他/她输入的条目是否有效。这里的关键是错误/警告方法——错误是指在99.99%的情况下不能成为有效电子邮件的东西。
当然，你可以调整什么使第一个正则表达式更自由，第二个正则表达式更严格。
根据您的需要，上述方法可能适用于您。

这是电子邮件的regex之一

1
^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$

我不相信Bortzmeyer在上面所说的"语法(在rfc5322中指定)对它来说太复杂了"(不能用正则表达式来处理)。
语法如下：(摘自http://tools.ietf.org/html/rfc5322第3.4.1节)

1
2
3
4
5
6
7
addr-spec = local-part"@" domain
local-part = dot-atom / quoted-string / obs-local-part
domain = dot-atom / domain-literal / obs-domain
domain-literal = [CFWS]"[" *([FWS] dtext) [FWS]"]" [CFWS]
dtext = %d33-90 / ; Printable US-ASCII
%d94-126 / ; characters not including
obs-dtext ; "[","]", or""

假设点原子、引用字符串、obs局部、obs域本身都是常规语言，这是一种非常简单的语法。只需将addr spec产品中的本地部分和域替换为它们各自的产品，您就拥有了一种可直接翻译为正则表达式的正则语言。

相关讨论

在开始在这里做假设之前，您应该调查CFW。这是一场噩梦。

cfws=(1*([fws]注释)[fws])/fws。不过，我看不出任何规则会使语言变得不规则。当然，这很复杂，但是一个复杂的正则表达式仍然可以处理它。

这不能回答问题。这是对另一个答案的回应。

我看到的每个regex(包括微软使用的一些regex)都不允许通过以下有效电子邮件：[email protected]。
刚刚有一个真正的客户有一个这种格式的电子邮件地址，他不能下订单。
我的决定是：

一个最小的正则表达式，不会有假阴性。或者使用带有一些附加检查的MailAddress构造函数(见下文)：

检查常见的输入错误.cmo或.gmial.com并要求确认Are you sure this is your correct email address. It looks like there may be a mistake.允许用户接受他们键入的内容(如果他们确定)。

处理在实际发送电子邮件时反弹，并手动验证它们以检查是否存在明显错误。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
try
{
var email = new MailAddress(str);

if (email.Host.EndsWith(".cmo"))
{
return EmailValidation.PossibleTypo;
}

if (!email.Host.EndsWith(".") && email.Host.Contains("."))
{
return EmailValidation.OK;
}
}
catch
{
return EmailValidation.Invalid;
}

相关讨论

这个答案有误导性，与问题无关。允许用户输入错误的电子邮件是一个商业决策，问题是要用regex验证它。

我没有找到任何处理顶级域名的，但应该考虑。
所以对我来说，以下的工作-

1
[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+(?:[A-Z]{2}AAA|AARP|ABB|ABBOTT|ABOGADO|AC|ACADEMY|ACCENTURE|ACCOUNTANT|ACCOUNTANTS|ACO|ACTIVE|ACTOR|AD|ADAC|ADS|ADULT|AE|AEG|AERO|AF|AFL|AG|AGENCY|AI|AIG|AIRFORCE|AIRTEL|AL|ALIBABA|ALIPAY|ALLFINANZ|ALSACE|AM|AMICA|AMSTERDAM|ANALYTICS|ANDROID|AO|APARTMENTS|APP|APPLE|AQ|AQUARELLE|AR|ARAMCO|ARCHI|ARMY|ARPA|ARTE|AS|ASIA|ASSOCIATES|AT|ATTORNEY|AU|AUCTION|AUDI|AUDIO|AUTHOR|AUTO|AUTOS|AW|AX|AXA|AZ|AZURE|BA|BAIDU|BAND|BANK|BAR|BARCELONA|BARCLAYCARD|BARCLAYS|BARGAINS|BAUHAUS|BAYERN|BB|BBC|BBVA|BCN|BD|BE|BEATS|BEER|BENTLEY|BERLIN|BEST|BET|BF|BG|BH|BHARTI|BI|BIBLE|BID|BIKE|BING|BINGO|BIO|BIZ|BJ|BLACK|BLACKFRIDAY|BLOOMBERG|BLUE|BM|BMS|BMW|BN|BNL|BNPPARIBAS|BO|BOATS|BOEHRINGER|BOM|BOND|BOO|BOOK|BOOTS|BOSCH|BOSTIK|BOT|BOUTIQUE|BR|BRADESCO|BRIDGESTONE|BROADWAY|BROKER|BROTHER|BRUSSELS|BS|BT|BUDAPEST|BUGATTI|BUILD|BUILDERS|BUSINESS|BUY|BUZZ|BV|BW|BY|BZ|BZH|CA|CAB|CAFE|CAL|CALL|CAMERA|CAMP|CANCERRESEARCH|CANON|CAPETOWN|CAPITAL|CAR|CARAVAN|CARDS|CARE|CAREER|CAREERS|CARS|CARTIER|CASA|CASH|CASINO|CAT|CATERING|CBA|CBN|CC|CD|CEB|CENTER|CEO|CERN|CF|CFA|CFD|CG|CH|CHANEL|CHANNEL|CHAT|CHEAP|CHLOE|CHRISTMAS|CHROME|CHURCH|CI|CIPRIANI|CIRCLE|CISCO|CITIC|CITY|CITYEATS|CK|CL|CLAIMS|CLEANING|CLICK|CLINIC|CLINIQUE|CLOTHING|CLOUD|CLUB|CLUBMED|CM|CN|CO|COACH|CODES|COFFEE|COLLEGE|COLOGNE|COM|COMMBANK|COMMUNITY|COMPANY|COMPARE|COMPUTER|COMSEC|CONDOS|CONSTRUCTION|CONSULTING|CONTACT|CONTRACTORS|COOKING|COOL|COOP|CORSICA|COUNTRY|COUPONS|COURSES|CR|CREDIT|CREDITCARD|CREDITUNION|CRICKET|CROWN|CRS|CRUISES|CSC|CU|CUISINELLA|CV|CW|CX|CY|CYMRU|CYOU|CZ|DABUR|DAD|DANCE|DATE|DATING|DATSUN|DAY|DCLK|DE|DEALER|DEALS|DEGREE|DELIVERY|DELL|DELTA|DEMOCRAT|DENTAL|DENTIST|DESI|DESIGN|DEV|DIAMONDS|DIET|DIGITAL|DIRECT|DIRECTORY|DISCOUNT|DJ|DK|DM|DNP|DO|DOCS|DOG|DOHA|DOMAINS|DOOSAN|DOWNLOAD|DRIVE|DUBAI|DURBAN|DVAG|DZ|EARTH|EAT|EC|EDEKA|EDU|EDUCATION|EE|EG|EMAIL|EMERCK|ENERGY|ENGINEER|ENGINEERING|ENTERPRISES|EPSON|EQUIPMENT|ER|ERNI|ES|ESQ|ESTATE|ET|EU|EUROVISION|EUS|EVENTS|EVERBANK|EXCHANGE|EXPERT|EXPOSED|EXPRESS|FAGE|FAIL|FAIRWINDS|FAITH|FAMILY|FAN|FANS|FARM|FASHION|FAST|FEEDBACK|FERRERO|FI|FILM|FINAL|FINANCE|FINANCIAL|FIRESTONE|FIRMDALE|FISH|FISHING|FIT|FITNESS|FJ|FK|FLIGHTS|FLORIST|FLOWERS|FLSMIDTH|FLY|FM|FO|FOO|FOOTBALL|FORD|FOREX|FORSALE|FORUM|FOUNDATION|FOX|FR|FRESENIUS|FRL|FROGANS|FUND|FURNITURE|FUTBOL|FYI|GA|GAL|GALLERY|GAME|GARDEN|GB|GBIZ|GD|GDN|GE|GEA|GENT|GENTING|GF|GG|GGEE|GH|GI|GIFT|GIFTS|GIVES|GIVING|GL|GLASS|GLE|GLOBAL|GLOBO|GM|GMAIL|GMO|GMX|GN|GOLD|GOLDPOINT|GOLF|GOO|GOOG|GOOGLE|GOP|GOT|GOV|GP|GQ|GR|GRAINGER|GRAPHICS|GRATIS|GREEN|GRIPE|GROUP|GS|GT|GU|GUCCI|GUGE|GUIDE|GUITARS|GURU|GW|GY|HAMBURG|HANGOUT|HAUS|HEALTH|HEALTHCARE|HELP|HELSINKI|HERE|HERMES|HIPHOP|HITACHI|HIV|HK|HM|HN|HOCKEY|HOLDINGS|HOLIDAY|HOMEDEPOT|HOMES|HONDA|HORSE|HOST|HOSTING|HOTELES|HOTMAIL|HOUSE|HOW|HR|HSBC|HT|HU|HYUNDAI|IBM|ICBC|ICE|ICU|ID|IE|IFM|IINET|IL|IM|IMMO|IMMOBILIEN|IN|INDUSTRIES|INFINITI|INFO|ING|INK|INSTITUTE|INSURANCE|INSURE|INT|INTERNATIONAL|INVESTMENTS|IO|IPIRANGA|IQ|IR|IRISH|IS|ISELECT|IST|ISTANBUL|IT|ITAU|IWC|JAGUAR|JAVA|JCB|JE|JETZT|JEWELRY|JLC|JLL|JM|JMP|JO|JOBS|JOBURG|JOT|JOY|JP|JPRS|JUEGOS|KAUFEN|KDDI|KE|KFH|KG|KH|KI|KIA|KIM|KINDER|KITCHEN|KIWI|KM|KN|KOELN|KOMATSU|KP|KPN|KR|KRD|KRED|KW|KY|KYOTO|KZ|LA|LACAIXA|LAMBORGHINI|LAMER|LANCASTER|LAND|LANDROVER|LANXESS|LASALLE|LAT|LATROBE|LAW|LAWYER|LB|LC|LDS|LEASE|LECLERC|LEGAL|LEXUS|LGBT|LI|LIAISON|LIDL|LIFE|LIFEINSURANCE|LIFESTYLE|LIGHTING|LIKE|LIMITED|LIMO|LINCOLN|LINDE|LINK|LIVE|LIVING|LIXIL|LK|LOAN|LOANS|LOL|LONDON|LOTTE|LOTTO|LOVE|LR|LS|LT|LTD|LTDA|LU|LUPIN|LUXE|LUXURY|LV|LY|MA|MADRID|MAIF|MAISON|MAKEUP|MAN|MANAGEMENT|MANGO|MARKET|MARKETING|MARKETS|MARRIOTT|MBA|MC|MD|ME|MED|MEDIA|MEET|MELBOURNE|MEME|MEMORIAL|MEN|MENU|MEO|MG|MH|MIAMI|MICROSOFT|MIL|MINI|MK|ML|MM|MMA|MN|MO|MOBI|MOBILY|MODA|MOE|MOI|MOM|MONASH|MONEY|MONTBLANC|MORMON|MORTGAGE|MOSCOW|MOTORCYCLES|MOV|MOVIE|MOVISTAR|MP|MQ|MR|MS|MT|MTN|MTPC|MTR|MU|MUSEUM|MUTUELLE|MV|MW|MX|MY|MZ|NA|NADEX|NAGOYA|NAME|NAVY|NC|NE|NEC|NET|NETBANK|NETWORK|NEUSTAR|NEW|NEWS|NEXUS|NF|NG|NGO|NHK|NI|NICO|NINJA|NISSAN|NL|NO|NOKIA|NORTON|NOWRUZ|NP|NR|NRA|NRW|NTT|NU|NYC|NZ|OBI|OFFICE|OKINAWA|OM|OMEGA|ONE|ONG|ONL|ONLINE|OOO|ORACLE|ORANGE|ORG|ORGANIC|ORIGINS|OSAKA|OTSUKA|OVH|PA|PAGE|PAMPEREDCHEF|PANERAI|PARIS|PARS|PARTNERS|PARTS|PARTY|PE|PET|PF|PG|PH|PHARMACY|PHILIPS|PHOTO|PHOTOGRAPHY|PHOTOS|PHYSIO|PIAGET|PICS|PICTET|PICTURES|PID|PIN|PING|PINK|PIZZA|PK|PL|PLACE|PLAY|PLAYSTATION|PLUMBING|PLUS|PM|PN|POHL|POKER|PORN|POST|PR|PRAXI|PRESS|PRO|PROD|PRODUCTIONS|PROF|PROMO|PROPERTIES|PROPERTY|PROTECTION|PS|PT|PUB|PW|PY|QA|QPON|QUEBEC|RACING|RE|READ|REALTOR|REALTY|RECIPES|RED|REDSTONE|REDUMBRELLA|REHAB|REISE|REISEN|REIT|REN|RENT|RENTALS|REPAIR|REPORT|REPUBLICAN|REST|RESTAURANT|REVIEW|REVIEWS|REXROTH|RICH|RICOH|RIO|RIP|RO|ROCHER|ROCKS|RODEO|ROOM|RS|RSVP|RU|RUHR|RUN|RW|RWE|RYUKYU|SA|SAARLAND|SAFE|SAFETY|SAKURA|SALE|SALON|SAMSUNG|SANDVIK|SANDVIKCOROMANT|SANOFI|SAP|SAPO|SARL|SAS|SAXO|SB|SBS|SC|SCA|SCB|SCHAEFFLER|SCHMIDT|SCHOLARSHIPS|SCHOOL|SCHULE|SCHWARZ|SCIENCE|SCOR|SCOT|SD|SE|SEAT|SECURITY|SEEK|SELECT|SENER|SERVICES|SEVEN|SEW|SEX|SEXY|SFR|SG|SH|SHARP|SHELL|SHIA|SHIKSHA|SHOES|SHOW|SHRIRAM|SI|SINGLES|SITE|SJ|SK|SKI|SKIN|SKY|SKYPE|SL|SM|SMILE|SN|SNCF|SO|SOCCER|SOCIAL|SOFTBANK|SOFTWARE|SOHU|SOLAR|SOLUTIONS|SONY|SOY|SPACE|SPIEGEL|SPREADBETTING|SR|SRL|ST|STADA|STAR|STARHUB|STATEFARM|STATOIL|STC|STCGROUP|STOCKHOLM|STORAGE|STUDIO|STUDY|STYLE|SU|SUCKS|SUPPLIES|SUPPLY|SUPPORT|SURF|SURGERY|SUZUKI|SV|SWATCH|SWISS|SX|SY|SYDNEY|SYMANTEC|SYSTEMS|SZ|TAB|TAIPEI|TAOBAO|TATAMOTORS|TATAR|TATTOO|TAX|TAXI|TC|TCI|TD|TEAM|TECH|TECHNOLOGY|TEL|TELEFONICA|TEMASEK|TENNIS|TF|TG|TH|THD|THEATER|THEATRE|TICKETS|TIENDA|TIFFANY|TIPS|TIRES|TIROL|TJ|TK|TL|TM|TMALL|TN|TO|TODAY|TOKYO|TOOLS|TOP|TORAY|TOSHIBA|TOURS|TOWN|TOYOTA|TOYS|TR|TRADE|TRADING|TRAINING|TRAVEL|TRAVELERS|TRAVELERSINSURANCE|TRUST|TRV|TT|TUBE|TUI|TUSHU|TV|TW|TZ|UA|UBS|UG|UK|UNIVERSITY|UNO|UOL|US|UY|UZ|VA|VACATIONS|VANA|VC|VE|VEGAS|VENTURES|VERISIGN|VERSICHERUNG|VET|VG|VI|VIAJES|VIDEO|VILLAS|VIN|VIP|VIRGIN|VISION|VISTA|VISTAPRINT|VIVA|VLAANDEREN|VN|VODKA|VOLKSWAGEN|VOTE|VOTING|VOTO|VOYAGE|VU|WALES|WALTER|WANG|WANGGOU|WATCH|WATCHES|WEATHER|WEBCAM|WEBER|WEBSITE|WED|WEDDING|WEIR|WF|WHOSWHO|WIEN|WIKI|WILLIAMHILL|WIN|WINDOWS|WINE|WME|WORK|WORKS|WORLD|WS|WTC|WTF|XBOX|XEROX|XIN|XN--11B4C3D|XN--1QQW23A|XN--30RR7Y|XN--3BST00M|XN--3DS443G|XN--3E0B707E|XN--3PXU8K|XN--42C2D9A|XN--45BRJ9C|XN--45Q11C|XN--4GBRIM|XN--55QW42G|XN--55QX5D|XN--6FRZ82G|XN--6QQ986B3XL|XN--80ADXHKS|XN--80AO21A|XN--80ASEHDB|XN--80ASWG|XN--90A3AC|XN--90AIS|XN--9DBQ2A|XN--9ET52U|XN--B4W605FERD|XN--C1AVG|XN--C2BR7G|XN--CG4BKI|XN--CLCHC0EA0B2G2A9GCD|XN--CZR694B|XN--CZRS0T|XN--CZRU2D|XN--D1ACJ3B|XN--D1ALF|XN--ECKVDTC9D|XN--EFVY88H|XN--ESTV75G|XN--FHBEI|XN--FIQ228C5HS|XN--FIQ64B|XN--FIQS8S|XN--FIQZ9S|XN--FJQ720A|XN--FLW351E|XN--FPCRJ9C3D|XN--FZC2C9E2C|XN--G2XX48C|XN--GECRJ9C|XN--H2BRJ9C|XN--HXT814E|XN--I1B6B1A6A2E|XN--IMR513N|XN--IO0A7I|XN--J1AEF|XN--J1AMH|XN--J6W193G|XN--JLQ61U9W7B|XN--KCRX77D1X4A|XN--KPRW13D|XN--KPRY57D|XN--KPU716F|XN--KPUT3I|XN--L1ACC|XN--LGBBAT1AD8J|XN--MGB9AWBF|XN--MGBA3A3EJT|XN--MGBA3A4F16A|XN--MGBAAM7A8H|XN--MGBAB2BD|XN--MGBAYH7GPA|XN--MGBB9FBPOB|XN--MGBBH1A71E|XN--MGBC0A9AZCG|XN--MGBERP4A5D4AR|XN--MGBPL2FH|XN--MGBT3DHD|XN--MGBTX2B|XN--MGBX4CD0AB|XN--MK1BU44C|XN--MXTQ1M|XN--NGBC5AZD|XN--NGBE9E0A|XN--NODE|XN--NQV7F|XN--NQV7FS00EMA|XN--NYQY26A|XN--O3CW4H|XN--OGBPF8FL|XN--P1ACF|XN--P1AI|XN--PBT977C|XN--PGBS0DH|XN--PSSY2U|XN--Q9JYB4C|XN--QCKA1PMC|XN--QXAM|XN--RHQV96G|XN--S9BRJ9C|XN--SES554G|XN--T60B56A|XN--TCKWE|XN--UNUP4Y|XN--VERMGENSBERATER-CTB|XN--VERMGENSBERATUNG-PWB|XN--VHQUV|XN--VUQ861B|XN--WGBH1C|XN--WGBL6A|XN--XHQ521B|XN--XKC2AL3HYE2A|XN--XKC2DL3A5EE0H|XN--Y9A3AQ|XN--YFRO4I67O|XN--YGBI2AMMX|XN--ZFR164B|XPERIA|XXX|XYZ|YACHTS|YAMAXUN|YANDEX|YE|YODOBASHI|YOGA|YOKOHAMA|YOUTUBE|YT|ZA|ZARA|ZERO|ZIP|ZM|ZONE|ZUERICH|ZW)\b

很容易被丢弃的电子邮件，比如[email protected], [email protected]等
如果需要，可以进一步编辑域名，例如特定国家/地区的域名等。

相关讨论

正如对其他答案的多次评论所指出的，有效TLD的列表正在迅速增长。你的"2字母CCTLD或Big-6、Information、Mobi等中的一个"在五年前是合理的，但不再可靠地工作。

即使是在最初的写作时，这已经被几百个TLD无效了。到目前为止，你已经错过了1200种可能性(并且以相当规律的速度增长)以下有效域的当前列表：data.iana.org/tld/tld s-alpha-by-domain.txt

对我来说，检查电子邮件的正确方法是：

检查符号@是否存在，符号前后有一些非@符号：
/^[^@]+@[^@]+$/。

尝试用一些"激活码"向此地址发送电子邮件。

当用户"激活"他的电子邮件地址时，我们会看到一切都是正确的。

当然，当用户输入"奇怪"的电子邮件时，您可以在前端显示一些警告或工具提示，以帮助他避免常见的错误，如域部分没有点或名称中没有引用的空格等。但如果用户真的想要地址"hello@world"，您必须接受它。
另外，您必须记住，电子邮件地址标准是并且可以进化，所以您不能只输入一些"标准有效"的regexp一次又一次。而且，您必须记住，一些具体的互联网服务器可能会使一些通用标准的细节失效，实际上使用自己的"修改后的标准"。
所以，只需检查@，在前端提示用户并在给定地址发送验证电子邮件。

我仍在使用：

1
^[A-Za-z0-9._+\-\']+@[A-Za-z0-9.\-]+\.[A-Za-z]{2,}$

但随着ipv6和unicode的出现，也许：

1
^\w[^@\s]*@[^@\s]{2,}$

是最好的。Gmail已经允许连续点，但MicrosoftExchangeServer2007拒绝了它们。

相关讨论

不允许"John Smith"@example.com。

是的，但什么时候真正需要呢？

电子邮件地址中有空格吗？

我从来没有见过真正被使用的版本，我认为官方规范说它只是为了向后兼容。

根据我的理解，最有可能的情况是……

1
/^([a-z0-9_-]+)(@[a-z0-9-]+)(\.[a-z]+|\.[a-z]+\.[a-z]+)?$/is

相关讨论

改进/建议总是起到催化剂的作用，所以请催化和催化我。

Gmail用户经常使用。在他们的电子邮件中，尼克和这一页上的一些评论提到了"和！.

现在有更多(1000)个TLD。这里的大多数答案需要投票否决，因为它们不再正确-这个问题可能有第二版。
请随意访问其他帖子的更新讨论…

相关讨论

2011年的"更当前的讨论"？

对于php，我使用nette框架中的电子邮件地址验证程序-http://api.nette.org/2.3.3/source utils.validators.php.html 234-247

1
2
3
4
5
6
7
8
9
/* public static */ function isEmail($value)
{
$atom ="[-a-z0-9!#$%&'*+/=?^_`{|}~]"; // RFC 5322 unquoted characters in local-part
$localPart ="(?:"(?:[ !\\x23-\\x5B\\x5D-\\x7E]*|\\\\[ -~])+"|$atom+(?:\\.$atom+)*)"; // quoted or unquoted
$alpha ="a-z\x80-\xFF"; // superset of IDN
$domain ="[0-9$alpha](?:[-0-9$alpha]{0,61}[0-9$alpha])?"; // RFC 1034 one domain component
$topDomain ="[$alpha](?:[-0-9$alpha]{0,17}[$alpha])?";
return (bool) preg_match("(^$localPart@(?:$domain\\.)+$topDomain\\z)i", $value);
}

我找到了一篇不错的文章，上面说验证电子邮件地址的最佳方法是使用regex expresion：/.+@.+\..+/i

相关讨论

它不匹配有效地址，如：me@localhost。

它还匹配无效地址，如john doe@his domain.com。

列表项
我用这个函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function checkmail($value){
$value = trim($value);
if( stristr($value,"@")
&& stristr($value,".")
&& (strrpos($value,".") - stripos($value,"@") > 2)
&& (stripos($value,"@") > 1)
&& (strlen($value) - strrpos($value,".") < 6)
&& (strlen($value) - strrpos($value,".") > 2)
&& ($value == preg_replace('/[ ]/', '', $value))
&& ($value == preg_replace('/[^A-Za-z0-9\-_.@!*]/', '', $value))
){

}else{
return"Invalid Mail-Id";
}
}

根据RFC 2821和RFC 2822，电子邮件地址的本地部分可以使用以下任何ASCII字符：

大写和小写字母

数字0到9

人物，！γ%$＆AM'*+/=？^ {{}}

字符"."的前提是它不是本地部分的第一个或最后一个字符。

比赛：

邮箱：[email protected]

邮箱：a*[email protected]

邮箱：a/[email protected]

非匹配：

[email protected]网站

[email protected]公司

a>[email protected]

对于符合RFC 2821、2822的产品，您可以使用：

1
^((([!#$%&'*+\-/=?^_`{|}~\w])|([!#$%&'*+\-/=?^_`{|}~\w][!#$%&'*+\-/=?^_`{|}~\.\w]{0,}[!#$%&'*+\-/=?^_`{|}~\w]))[@]\w+([-.]\w+)*\.\w+([-.]\w+)*)$

电子邮件-符合RFC 2821、2822

由于新的通用顶级域(gtlds)即将到来(例如伦敦，.basketball，.通)，此线程中发布的正则表达式现在已过时。要验证电子邮件地址，有两个答案(与绝大多数相关)。

正如主答案所说-不要使用正则表达式，只需向地址发送电子邮件来验证它(捕获无效地址的异常)

使用非常通用的regex至少要确保它们使用的是电子邮件结构{something}@{something}.{something}。使用详细的regex是没有意义的，因为你不能全部捕捉到它们，几年后会有一个新的批处理，你必须再次更新正则表达式。

我决定使用正则表达式，因为不幸的是，有些用户不会读取表单，也不会将错误的数据放在错误的字段中。这至少会在他们试图将非电子邮件的内容放入电子邮件输入字段时提醒他们，这样可以节省您在电子邮件问题上为用户提供支持的时间。

1
(.+)@(.+){2,}\.(.+){2,}

此规则与我们的后缀服务器无法发送的内容匹配。
允许字母、数字、-、-、+、、&；、/、！
没有-Fo.@ BA.com
没有ASD@ -BAR.com

1
/^([a-z0-9\+\._\/&!][-a-z0-9\+\._\/&!]*)@(([a-z0-9][-a-z0-9]*\.)([-a-z0-9]+\.)*[a-z]{2,})$/i

嗯，奇怪的是，没有在答案中看到这个答案。这是我做的。它不是一个防弹版本，但它是"简单的"，检查几乎所有的东西。

1
[\w+-]+(?:\.[\w+-]+)*@[\w+-]+(?:\.[\w+-]+)*(?:\.[a-zA-Z]{2,4})

我认为已经有了一个解释，如果您需要，可以修改它：
(e)[\w+-]+与a-z、a-z、x、+、-至少匹配一次
(m)(?:\.[\w+-]+)*匹配a-z、a-z、x、+、-零次或更多次，但需要从a开始。(点)
@=@。
(i)[\w+-]+与a-z、a-z、x、+、-至少匹配一次
(l)(?:\.[\w+-]+)*匹配a-z、a-z、x、+、-零次或更多次，但需要从a开始。(点)
(com)(?:\.[a-zA-Z]{2,4})与a-z、a-z匹配2到4次，从a开始。(点)
给予e(.m)@i(.l).com，其中(.m)和(.l)是可选的，但也可以重复多次。我认为这会验证所有有效的电子邮件地址，但会阻止潜在的无效地址，而不使用在大多数情况下不必要的过于复杂的正则表达式。
注意，这将允许[email protected]，但这是保持简单的折衷办法。

相关讨论

谢谢！这对我有用。这里有一个用Qt5:QReXEP RX([\W+-+])(+)使用的测试C/C++越狱版本。：.[\w+-]+)*@[\w+-]+(？：.[\w+-]+)*(？：.[&zwnj；&8203；a-z a-z]2，)"；

我不建议使用regex——电子邮件地址太复杂了。这是一个常见的问题，所以我猜想有很多库包含一个验证器——如果你使用Java，Apache Calon验证器的EualValueAuthor是一个很好的库。

没有人提到本地化的问题(i18)，如果你有来自世界各地的客户呢？然后，您需要按国家/地区对regex进行子分类，我看到开发人员最终构建了一个大型字典/配置。检测用户的浏览器语言设置可能是一个很好的起点。

不得不提的是，几乎已经添加了新的域名"yandex"。可能的电子邮件：[email protected]。而且还支持大写字母，所以稍微修改一下的Acrosman解决方案版本是：

1
^[_a-zA-Z0-9-]+(\.[_a-zA-Z0-9-]+)*@[a-zA-Z0-9-]+(\.[a-zA-Z0-9-]+)*(\.[a-zA-Z]{2,6})$

Java邮件API对我们有魔力。

1
2
3
4
5
6
7
8
9
10
try
{
InternetAddress internetAddress = new InternetAddress(email);
internetAddress.validate();
return true;
}
catch(Exception ex)
{
return false;
}

我从这里得到这个

相关讨论

JavaMail API是一个用于Java SE平台的可选包，包含在JavaEE平台中。

如果你想改进一个已经相当好用了几年的regex，那么答案取决于你到底想要达到什么样的目标——什么样的电子邮件地址失败了。微调电子邮件正则表达式非常困难，我还没有看到一个完美的解决方案。

如果您的应用程序在本质上涉及到一些非常技术性的东西(或者组织内部的东西)，那么您可能需要支持IP地址而不是域名，或者在电子邮件地址的"本地"部分提供注释。

如果您的应用程序是多国的，我会考虑重点支持unicode/utf8。

您问题的主要答案当前链接到"完全RFC"？822–符合REGEX"。然而，尽管regex的复杂性和它在RFC规则中对细节的假定关注，但在Unicode支持方面它完全失败了。
我为我的大多数应用程序编写的regex着重于Unicode支持，以及对RFC标准的合理良好的总体遵从性：

1
/^(?!\.)((?!.*\.{2})[a-zA-Z0-9\u0080-\u00FF\u0100-\u017F\u0180-\u024F\u0250-\u02AF\u0300-\u036F\u0370-\u03FF\u0400-\u04FF\u0500-\u052F\u0530-\u058F\u0590-\u05FF\u0600-\u06FF\u0700-\u074F\u0750-\u077F\u0780-\u07BF\u07C0-\u07FF\u0900-\u097F\u0980-\u09FF\u0A00-\u0A7F\u0A80-\u0AFF\u0B00-\u0B7F\u0B80-\u0BFF\u0C00-\u0C7F\u0C80-\u0CFF\u0D00-\u0D7F\u0D80-\u0DFF\u0E00-\u0E7F\u0E80-\u0EFF\u0F00-\u0FFF\u1000-\u109F\u10A0-\u10FF\u1100-\u11FF\u1200-\u137F\u1380-\u139F\u13A0-\u13FF\u1400-\u167F\u1680-\u169F\u16A0-\u16FF\u1700-\u171F\u1720-\u173F\u1740-\u175F\u1760-\u177F\u1780-\u17FF\u1800-\u18AF\u1900-\u194F\u1950-\u197F\u1980-\u19DF\u19E0-\u19FF\u1A00-\u1A1F\u1B00-\u1B7F\u1D00-\u1D7F\u1D80-\u1DBF\u1DC0-\u1DFF\u1E00-\u1EFF\u1F00-\u1FFFu20D0-\u20FF\u2100-\u214F\u2C00-\u2C5F\u2C60-\u2C7F\u2C80-\u2CFF\u2D00-\u2D2F\u2D30-\u2D7F\u2D80-\u2DDF\u2F00-\u2FDF\u2FF0-\u2FFF\u3040-\u309F\u30A0-\u30FF\u3100-\u312F\u3130-\u318F\u3190-\u319F\u31C0-\u31EF\u31F0-\u31FF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FFF\uA000-\uA48F\uA490-\uA4CF\uA700-\uA71F\uA800-\uA82F\uA840-\uA87F\uAC00-\uD7AF\uF900-\uFAFF\.!#$%&'*+-/=?^_`{|}~\-\d]+)@(?!\.)([a-zA-Z0-9\u0080-\u00FF\u0100-\u017F\u0180-\u024F\u0250-\u02AF\u0300-\u036F\u0370-\u03FF\u0400-\u04FF\u0500-\u052F\u0530-\u058F\u0590-\u05FF\u0600-\u06FF\u0700-\u074F\u0750-\u077F\u0780-\u07BF\u07C0-\u07FF\u0900-\u097F\u0980-\u09FF\u0A00-\u0A7F\u0A80-\u0AFF\u0B00-\u0B7F\u0B80-\u0BFF\u0C00-\u0C7F\u0C80-\u0CFF\u0D00-\u0D7F\u0D80-\u0DFF\u0E00-\u0E7F\u0E80-\u0EFF\u0F00-\u0FFF\u1000-\u109F\u10A0-\u10FF\u1100-\u11FF\u1200-\u137F\u1380-\u139F\u13A0-\u13FF\u1400-\u167F\u1680-\u169F\u16A0-\u16FF\u1700-\u171F\u1720-\u173F\u1740-\u175F\u1760-\u177F\u1780-\u17FF\u1800-\u18AF\u1900-\u194F\u1950-\u197F\u1980-\u19DF\u19E0-\u19FF\u1A00-\u1A1F\u1B00-\u1B7F\u1D00-\u1D7F\u1D80-\u1DBF\u1DC0-\u1DFF\u1E00-\u1EFF\u1F00-\u1FFF\u20D0-\u20FF\u2100-\u214F\u2C00-\u2C5F\u2C60-\u2C7F\u2C80-\u2CFF\u2D00-\u2D2F\u2D30-\u2D7F\u2D80-\u2DDF\u2F00-\u2FDF\u2FF0-\u2FFF\u3040-\u309F\u30A0-\u30FF\u3100-\u312F\u3130-\u318F\u3190-\u319F\u31C0-\u31EF\u31F0-\u31FF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FFF\uA000-\uA48F\uA490-\uA4CF\uA700-\uA71F\uA800-\uA82F\uA840-\uA87F\uAC00-\uD7AF\uF900-\uFAFF\-\.\d]+)((\.([a-zA-Z\u0080-\u00FF\u0100-\u017F\u0180-\u024F\u0250-\u02AF\u0300-\u036F\u0370-\u03FF\u0400-\u04FF\u0500-\u052F\u0530-\u058F\u0590-\u05FF\u0600-\u06FF\u0700-\u074F\u0750-\u077F\u0780-\u07BF\u07C0-\u07FF\u0900-\u097F\u0980-\u09FF\u0A00-\u0A7F\u0A80-\u0AFF\u0B00-\u0B7F\u0B80-\u0BFF\u0C00-\u0C7F\u0C80-\u0CFF\u0D00-\u0D7F\u0D80-\u0DFF\u0E00-\u0E7F\u0E80-\u0EFF\u0F00-\u0FFF\u1000-\u109F\u10A0-\u10FF\u1100-\u11FF\u1200-\u137F\u1380-\u139F\u13A0-\u13FF\u1400-\u167F\u1680-\u169F\u16A0-\u16FF\u1700-\u171F\u1720-\u173F\u1740-\u175F\u1760-\u177F\u1780-\u17FF\u1800-\u18AF\u1900-\u194F\u1950-\u197F\u1980-\u19DF\u19E0-\u19FF\u1A00-\u1A1F\u1B00-\u1B7F\u1D00-\u1D7F\u1D80-\u1DBF\u1DC0-\u1DFF\u1E00-\u1EFF\u1F00-\u1FFF\u20D0-\u20FF\u2100-\u214F\u2C00-\u2C5F\u2C60-\u2C7F\u2C80-\u2CFF\u2D00-\u2D2F\u2D30-\u2D7F\u2D80-\u2DDF\u2F00-\u2FDF\u2FF0-\u2FFF\u3040-\u309F\u30A0-\u30FF\u3100-\u312F\u3130-\u318F\u3190-\u319F\u31C0-\u31EF\u31F0-\u31FF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FFF\uA000-\uA48F\uA490-\uA4CF\uA700-\uA71F\uA800-\uA82F\uA840-\uA87F\uAC00-\uD7AF\uF900-\uFAFF]){2,63})+)$/i

我将避免复制粘贴完整的答案，所以我将这个链接到我在这里提供的类似答案：如何验证Unicode电子邮件？
上面的regex还有一个实时演示，网址是：http://jsfiddle.net/aossikine/qclvh/3/

很好，我把代码转换成Java来匹配编译器。

1
String pattern ="(?:[a-zA-Z0-9!#$%&'*+/=?^_`{|}~-]+(?:\\.[a-zA-Z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\\x01-\\x08\\x0b\\x0c\\x0e-\\x1f\\x21\\x23-\\x5b\\x5d-\\x7f]|\\\\[\\x01-\\x09\\x0b\\x0c\\x0e-\\x7f])*")@(?:(?:[a-zA-Z0-9](?:[a-zA-Z0-9-]*[a-zA-Z0-9])?\\.)+[a-zA-Z0-9](?:[a-zA-Z0-9-]*[a-zA-Z0-9])?|\\[(?:(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9]))\\.){3}(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9])|[a-zA-Z0-9-]*[a-zA-Z0-9]:(?:[\\x01-\\x08\\x0b\\x0c\\x0e-\\x1f\\x21-\\x5a\\x53-\\x7f]|\\\\[\\x01-\\x09\\x0b\\x0c\\x0e-\\x7f])+)\\])";

世界上最流行的博客平台WordPress使用此功能验证电子邮件地址。
但他们是通过多个步骤来实现的。
在使用此函数中提到的regex时，不再需要担心。
这是函数……

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
/**
* Verifies that an email is valid.
*
* Does not grok i18n domains. Not RFC compliant.
*
* @since 0.71
*
* @param string $email Email address to verify.
* @param boolean $deprecated Deprecated.
* @return string|bool Either false or the valid email address.
*/
function is_email( $email, $deprecated = false ) {
if ( ! empty( $deprecated ) )
_deprecated_argument( __FUNCTION__, '3.0' );

// Test for the minimum length the email can be
if ( strlen( $email ) < 3 ) {
return apply_filters( 'is_email', false, $email, 'email_too_short' );
}

// Test for an @ character after the first position
if ( strpos( $email, '@', 1 ) === false ) {
return apply_filters( 'is_email', false, $email, 'email_no_at' );
}

// Split out the local and domain parts
list( $local, $domain ) = explode( '@', $email, 2 );

// LOCAL PART
// Test for invalid characters
if ( !preg_match( '/^[a-zA-Z0-9!#$%&\'*+\/=?^_`{|}~\.-]+$/', $local ) ) {
return apply_filters( 'is_email', false, $email, 'local_invalid_chars' );
}

// DOMAIN PART
// Test for sequences of periods
if ( preg_match( '/\.{2,}/', $domain ) ) {
return apply_filters( 'is_email', false, $email, 'domain_period_sequence' );
}

// Test for leading and trailing periods and whitespace
if ( trim( $domain," \t

\0\x0B." ) !== $domain ) {
return apply_filters( 'is_email', false, $email, 'domain_period_limits' );
}

// Split the domain into subs
$subs = explode( '.', $domain );

// Assume the domain will have at least two subs
if ( 2 > count( $subs ) ) {
return apply_filters( 'is_email', false, $email, 'domain_no_periods' );
}

// Loop through each sub
foreach ( $subs as $sub ) {
// Test for leading and trailing hyphens and whitespace
if ( trim( $sub," \t

\0\x0B-" ) !== $sub ) {
return apply_filters( 'is_email', false, $email, 'sub_hyphen_limits' );
}

// Test for invalid characters
if ( !preg_match('/^[a-z0-9-]+$/i', $sub ) ) {
return apply_filters( 'is_email', false, $email, 'sub_invalid_chars' );
}
}

// Congratulations your email made it!
return apply_filters( 'is_email', $email, $email, null );
}

根据我所看到的，一个完全按照标准所说的做的regex是允许的，是这样的：

1
/^(?!(^[.-].*|.*[.-]@|.*\.{2,}.*)|^.{254}.+@)([a-z\xC0-\xFF0-9!#$%&'*+\/=?^_`{|}~.-]+@)(?!.{253}.+$)((?!-.*|.*-\.)([a-z0-9-]{1,63}\.)+[a-z]{2,63}|(([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])\.){3}([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9]))$/gim

演示/调试对象分析(交互式)
分裂：

1
2
3
4
5
6
7
8
9
10
11
^(?!(^[.-].*|.*[.-]@|.*\.{2,}.*)|^.{254}.+@)
([a-z\xC0-\xFF0-9!#$%&'*+\/=?^_`{|}~.-]+@)
(?!.{253}.+$)
(
(?!-.*|.*-\.)
([a-z0-9-]{1,63}\.)+
[a-z]{2,63}
|
(([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])\.){3}
([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])
)$

分析：

1
(?!(^[.-].*|.*[.-]@|.*\.{2,}.*)|^.{254}.+@)

对以.开头、以..结尾、或超过最大长度254个字符的地址进行反向前瞻。

1
([a-z\xC0-\xFF0-9!#$%&'*+\/=?^_`{|}~.-]+@)

匹配一个或多个允许的字符，并对其应用负外观

1
(?!.{253}.+$)

域名部分为负前视，总共限制为253个字符

1
(?!-.*|.*-\.)

不允许以.开头或结尾的每个域名都为负向前看。

1
([a-z0-9-]{1,63}\.)+

简单组匹配域名中允许的字符，每个字符限制为63个字符

1
[a-zA-Z]{2,63}

允许的顶级域的简单组匹配，目前仍仅限于字母，但包含>4个字母的TLD。

1
2
(([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])\.){3}
([01]?[0-9]{2}|2([0-4][0-9]|5[0-5])|[0-9])

域名的替代方法：将IP地址中的前3个数字与后面的.匹配，然后将IP地址中的第4个数字与后面没有.的数字匹配。

相关讨论

不要用这个。它将拒绝像"&246；&229；&252；&241；"这样的国际域名。blog.cloudflare.com/non-latinutf8-domains-now-fully-support&zwnj；&8203；d

下面是验证电子邮件地址的正则表达式

1
^.+@\w+(\.\w+)+$

如前所述，您不能用regex验证电子邮件。但是，这里是我们目前用来确保用户输入不是完全伪造的(忘记TLD等)。
此regex将允许在@符号前后使用IDN域和特殊字符(如umlauts)。

1
/^[\w.+-_]+@[^.][\w.-]*\.[\w-]{2,63}$/iu

我有一个类似的愿望：希望在电子邮件地址中快速检查语法，而不会超出电子邮件发送实用程序的范围(Mail::RFC822::Address答案，这显然是正确的答案)。我是这样做的(我是一个posix-re人，所以我通常不使用\d和pcre的类似工具，因为它们会使我看不清东西)：

1
preg_match("_^[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*@[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([-0-9A-Za-z]{0,61}[0-9A-Za-z])?)*\$_", $adr)

这是正确的RFC，但明确排除了过时的表单以及直接IP(IP和传统IP都是)，该实用程序的目标组中的某个人(主要是：在IRC上发送邮件时打扰我们的人)通常不会想要或需要这些IP。
IDN(国际化域名)明确不在电子邮件范围内：地址如"foo@c"？cilinchor bonn.de"必须在网上写"[email protected]"(这包括mailto:html中的链接和类似的乐趣)，只允许GUI显示(接受然后转换)这些名称到(和来自)用户。

我发现了一个符合RFC2822的正则表达式。上述标准符合RFC 5322。这个正则表达式的性能似乎相当好，可以覆盖大多数情况，但是随着RFC5322成为标准，可能会有一些应该堵塞的孔。

1
^(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])*")@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\[(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?|[a-z0-9-]*[a-z0-9]:(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21-\x5a\x53-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])+)\])$

文档中说您不应该使用上面的正则表达式，而是更喜欢这种风格，这种风格更易于管理。

1
[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?

我注意到这是区分大小写的，所以我对这个着陆点做了修改。

1
^[a-zA-Z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-zA-Z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-zA-Z0-9](?:[a-zA-Z0-9-]*[a-zA-Z0-9])?\.)+[a-zA-Z0-9](?:[a-zA-Z0-9-]*[a-zA-Z0-9])?$

您可以对任何电子邮件地址使用以下正则表达式

1
^(([^<>()[\]\\.,;:\s@"]+(\.[^<>()[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$

对于PHP

1
2
3
4
5
6
7
8
9
10
11
function checkEmailValidation($email)
{
$expression='/^(([^<>()[\]\\.,;:\s@"]+(\.[^<>()[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/';
if(preg_match($expression, $email))
{
return true;
}else
{
return false;
}
}

对于JavaScript

1
2
3
4
5
6
7
8
9
10
11
function checkEmailValidation(email)
{
var pattern='/^(([^<>()[\]\\.,;:\s@"]+(\.[^<>()[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/';
if(pattern.test(email))
{
return true;
}else
{
return false;
}
}

相关讨论

if(preg_match($expression, $email)) { return true; } else { return false; }可以简化为return (bool) preg_match($expression, $email);。

根据W3组织和维基百科的有效regex

1
[A-Z0-9a-z.!#$%&'*+-/=?^_`{|}~]+@[A-Za-z0-9.-]+\\.[A-Za-z]{2,4}

例如！γ%$＆AM'*+/=？^`[email protected]

相关讨论

mail@example通行证，有效，但很可能不太有用。

这个regex是错误的，不是w3.org上推荐的。

那么什么是正确的呢？@ Brad

W3C链接到的页面上的实际regex也不错。

1
^[_a-zA-Z0-9-]+(\.[_a-zA-Z0-9-]+)*@[a-zA-Z0-9-]+(\.[a-zA-Z0-9-]+)*\.(([0-9]{1,3})|([a-zA-Z]{2,3})|(aero|coop|info|museum|name))$

这匹配了99.99%的电子邮件地址，包括一些更新的顶级域名扩展，如信息、博物馆、名称等。它还允许直接绑定到IP地址的电子邮件。

我用这个；

1
^(([^<>()\[\]\\.,;:\s@"]+(\.[^<>()\[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$

我用过

1
/^[_A-Za-z0-9-]+(\.[_A-Za-z0-9-]+)*@[A-Za-z0-9-]+(\.[A-Za-z0-9-]+)*(\.[A-Za-z]{2,4})$/

包括大写字母。在这种情况下，您甚至不需要使用ToLowercase。

对于Angular2/Angular7，我使用以下模式：

1
2
3
4
5
6
7
emailPattern = '^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+[.]+[a-zA-Z0-9-.]+(\\s)*';

private createForm() {
this.form = this.formBuilder.group({
email: ['', [Validators.required, Validators.pattern(this.emailPattern)]]
});
}

它还允许在末尾添加额外的空间，在将其发送到后端之前应该截断这些空间，但是有些用户，特别是在移动设备上，很容易在末尾错误地添加空间。

相关讨论

我想你会发现这让无效的电子邮件地址。

@Jonathanleffler谢谢你的提示。你有什么例子吗？你将如何修复它？

正则表达式的简捷语法

1
2
3
"^(?!\.)(""([^""
\\]|\\[""
\\])*""|" + @"([-a-z0-9!#$%&'*+/=?^_`{|}~]|(?<!\.)\.)*)(?<!\.)" + @"@[a-z0-9][\w\.-]*[a-z0-9]\.[a-z][a-z\.]*[a-z]$"

在代码中使用验证电子邮件。

为了使用javascript验证电子邮件地址，使用此功能(根据W3School)更方便和高效：

1
2
3
4
5
6
7
8
9
10
11
function validateEmail()
{
var x=document.f.email.value;
var atpos=x.indexOf("@");
var dotpos=x.lastIndexOf(".");
if (atpos<1 || dotpos=x.length)
  {
  alert("Not a valid e-mail address");
  return false;
  }
}

我用它，它很完美。我希望有用。

相关讨论

充其量，这是对电子邮件地址的最小验证。与这里的其他产品相比，它确实没有用处。

关于python：如何检查有效的电子邮件地址？

关于regex:javascript正则表达式电子邮件验证

关于正则表达式：在django / python中检查电子邮件的有效性

关于ruby：有效的电子邮件地址正则表达式？

关于正则表达式：PHP电子邮件验证

用于电子邮件验证的正则表达式

关于java：在String中查找电子邮件

关于正则表达式：电子邮件正则表达式

关于php：使用正则表达式进行简单的电子邮件验证

关于正则表达式：有效电子邮件地址的正则表达式？

关于数字验证：在JavaScript中验证decimal数 - IsNumeric()

关于regex：如何在javascript中验证电子邮件地址？

关于regex：是否有正则表达式检测有效的正则表达式？

关于验证：有效电子邮件地址的最大长度是多少？

关于regex:与不包含单词的行匹配的正则表达式

关于regex：如何访问javascript正则表达式中匹配的组？

关于javascript：如何在正则表达式中使用变量？

regex:如何替换JavaScript中出现的所有字符串

用于验证电子邮件地址的C＃代码

关于表单：电子邮件地址中允许使用哪些字符？