1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
|
---
title: Классы символов
slug: Web/JavaScript/Guide/Regular_Expressions/Character_Classes
tags:
- Guide
- JavaScript
- Reference
- RegExp
- Regular Expression
- character classes
translation_of: Web/JavaScript/Guide/Regular_Expressions/Character_Classes
---
<p>{{JSSidebar("JavaScript Guide")}}</p>
<p>Классы символов позволяют различать виды символов, к примеру, как различия между буквами и цифрами.</p>
<div>{{EmbedInteractiveExample("pages/js/regexp-character-classes.html")}}</div>
<h2 id="Типы">Типы</h2>
<div class="hidden">The following table is also duplicated on <a href="/en-US/docs/Web/JavaScript/Guide/Regular_Expressions/Cheatsheet">this cheatsheet</a>. Do not forget to edit it as well, thanks!</div>
<table class="standard-table">
<thead>
<tr>
<th scope="col">Символ</th>
<th scope="col">Значение</th>
</tr>
</thead>
<tbody>
</tbody>
<tbody>
<tr>
<td><code>.</code></td>
<td>
<p>Точка имеет одно из следующих смыслов:</p>
<ul>
<li>Совпадение с любым одним символом <em>за исключение</em> символов завершения строки: <code>\n</code>, <code>\r</code>, <code>\u2028</code> or <code>\u2029</code>. Например, <code>/.y/</code> совпадает "my" с "ay", и не совпадает с "yes" и "yes make my day".</li>
<li>В набор символов, точка теряет свой специальный смысл и совпадает с литеральным символом точка.</li>
</ul>
<p>Замечание. <code>m</code> флаг поиска по множеству строк не меняет поведения точки. Чтобы найти воспаления во многострочном поиске можно использовать набор символов <code>[^]</code> — он совпадает с любым символом включая символы завершения строки.</p>
<p>В ES2018 добавили <code>s</code> "dotAll" флаг, который позволяет точке <code>(.</code>) находить все символы включая символы переноса строк.</p>
</td>
</tr>
<tr>
<td><code>\d</code></td>
<td>
<p>Совпадёт с любой цифрой (арабский числа). Эквивалентно <code>[0-9]</code>. Например, <code>/\d/</code> или <code>/[0-9]/</code> находит "2" в "B2 is the suite number"..</p>
</td>
</tr>
<tr>
<td><code>\D</code></td>
<td>
<p>Совпадёт с любым символом, который не является цифрой (арабский числа). Эквивалентно <code>[^0-9]</code>. Например, <code>/\D/</code> or <code>/[^0-9]/</code> находит "B" в "B2 is the suite number".</p>
</td>
</tr>
<tr>
<td><code>\w</code></td>
<td>
<p>Совпадёт с любой буквенно-числовым символом из базового латинского алфавита включая нижнее подчёркивание. Эквивалентно <code>[A-Za-z0-9_]</code>. Например, <code>/\w/</code> находит "a" в "apple", "5" в "$5.28", "3" в "3D" и "m" в "Émanuel".</p>
</td>
</tr>
<tr>
<td><code>\W</code></td>
<td>
<p>Совпадёт с любой буквенно-числовым, которое не является символом базового латинского алфавита, так же исключая нижнее подчёркивание. Эквивалентно <code>[^A-Za-z0-9_]</code>. Например, <code>/\W/</code> или <code>/[^A-Za-z0-9_]/</code> находит "%" в "50%" и "É" in "Émanuel".</p>
</td>
</tr>
<tr>
<td><code>\s</code></td>
<td>
<p>Совпадёт с любым пробельным символом, включая пробел, символ табуляции, символ подачи страницы, символ подачи строки и другие Unicode пробелы. Эквивалентно <code>[ \f\n\r\t\v\u00a0\u1680\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]</code>. Например, <code>/\s\w*/</code> находит " bar" в "foo bar".</p>
</td>
</tr>
<tr>
<td><code>\S</code></td>
<td>
<p>Совпадёт с любым символом, не являющимся пробельным. Эквивалентно <code>[^ \f\n\r\t\v\u00a0\u1680\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]</code>. Например, <code>/\S\w*/</code> находит "foo" в "foo bar".</p>
</td>
</tr>
<tr>
<td><code>\t</code></td>
<td>Совпадёт с символом горизонтальной табуляции.</td>
</tr>
<tr>
<td><code>\r</code></td>
<td>Совпадёт с символом возврата каретки.</td>
</tr>
<tr>
<td><code>\n</code></td>
<td>Совпадёт с символом подачи строки.</td>
</tr>
<tr>
<td><code>\v</code></td>
<td>Совпадёт с символом вертикальной табуляции</td>
</tr>
<tr>
<td><code>\f</code></td>
<td>Совпадёт с символом подачи страницы (формы).</td>
</tr>
<tr>
<td><code>[\b]</code></td>
<td>Совпадёт с символом возврат назад (англ. backspace). Если вы ищите символ границы слова (<code>\b</code>), смотри <a href="https://developer.mozilla.org/en-US/docs/Web/JavaScript/Guide/Regular_Expressions/Boundaries">Границы</a>.</td>
</tr>
<tr>
<td><code>\0</code></td>
<td>Совпадёт с символом NUL character. Не используйте другую цифру.</td>
</tr>
<tr>
<td><code>\c<em>X</em></code></td>
<td>
<p>Совпадёт с контрольным символом using <a href="https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%80%D0%B5%D1%82%D0%BD%D0%B0%D1%8F_%D0%BD%D0%BE%D1%82%D0%B0%D1%86%D0%B8%D1%8F">каретную нотацию</a>, где "X" буква A–Z (соответствует кодам <code>U+0001</code><em>–</em><code>U+001F</code>). For example, <code>/\cM/</code> matches "\r" in "\r\n".</p>
</td>
</tr>
<tr>
<td><code>\x<em>hh</em></code></td>
<td>Совпадёт с символом, код которого <code><em>hh</em></code> (две шестнадцатеричных цифры).</td>
</tr>
<tr>
<td><code>\u<em>hhhh</em></code></td>
<td>Совпадёт с код-блоком UTF-16 со значением <code><em>hhhh</em></code> (четыре шестнадцатеричных цифры).</td>
</tr>
<tr>
<td><code>\u<em>{hhhh} </em>or <em>\u{hhhhh}</em></code></td>
<td>(Только когда установлен флаг <code>u</code>.) Совпадёт с Unicode символом со значением <code>U+<em>hhhh</em></code> или <code>U+<em>hhhhh</em></code> (шестнадцатеричные цифры).</td>
</tr>
<tr>
<td><code>\</code></td>
<td>
<p>Определяет что последующий символ должен быть интерпретирован по особому или должен быть "экранирован. Это работает в двух вариантах:</p>
<ul>
<li>Для символов, которые относятся к литералам, последующий символ - это специальный символ, который не должен быть интерпретирован, как литерал. Например, <code>/b/</code> совпадает с символом "b". Установ обратного слеша перед "b". Таким образом <code>/\b/</code>. Будет означать символ границы слова. </li>
<li>Для символов, которые относятся к специальным, определяет что это не специальным символ, а должен быть интерпретирован, как литерал. Например, <code>*</code> - это специальный символ, который означает 0 или любое другое совпадений предыдущего символа, Например <code>/a*/</code> совпадает с любым количеством символов "a" идущих подряд (или 0 "a") <code>a, aaaa, aaaaaa</code>. Если специальный символ <code>*</code>, как литерал, то перед ним ставится обратных слеш. Например, <code>/a\*/</code> совпадает только с "a*".</li>
</ul>
<div class="blockIndicator note">
<p>Чтобы найти литеральное совпадение с этим символов (<code>\</code> , экранируйте его самим же. Другими словами для поиска <code>\</code> используйте <code>/\\/</code>.</p>
</div>
</td>
</tr>
</tbody>
</table>
<h2 id="Примеры">Примеры</h2>
<h3 id="Поиск_серии_цифр">Поиск серии цифр</h3>
<pre class="brush: js">var randomData = "015 354 8787 687351 3512 8735";
var regexpFourDigits = /\b\d{4}\b/g;
// \b определяет границу поиска (например, не начинает поиск с середины слова)
// \d{4} определяет цифру, четыре раза
// определяет другую границу поиска (например, не начинает поиск с середины слова)
// Вывод всех чисел имеющих только 4 цифры
console.table(randomData.match(regexpFourDigits));
// ['8787', '3512', '8735']
</pre>
<h3 id="Поиск_слов_латинский_алфавит_начинающих_с_A">Поиск слов (латинский алфавит), начинающих с A</h3>
<pre class="brush: js">var aliceExcerpt = "I’m sure I’m not Ada,’ she said, ‘for her hair goes in such long ringlets, and mine doesn’t go in ringlets at all.";
var regexpWordStartingWithA = /\b[aA]\w+/g;
// \b определяет границу поиска (например, не начинает поиск с середины слова)
// [aA] определяет букву a или A
// \b определяет границу поиска (например, не начинает поиск с середины слова)
console.table(aliceExcerpt.match(regexpWordStartingWithA));
// ['Ada', 'and', 'at', 'all']
</pre>
<h3 id="Поиски_слов_из_Unicode_символов">Поиски слов (из Unicode символов)</h3>
<p>Вместо латинского алфавита, мы может использовать диапазон Unicode символов для определения слова (благодаря этому мы можем работать с текстами написанным, например на русском или арабском языке or Arabic). Unicode содержит большинство символов используемых на планете, мы так же можем объединять их диапазоны и классы символов.</p>
<pre class="brush: js">var nonEnglishText = "Приключения Алисы в Стране чудес";
var regexpBMPWord = /([\u0000-\u0019\u0021-\uFFFF])+/gu;
// BMP goes through U+0000 to U+FFFF but space is U+0020
console.table(nonEnglishText.match(regexpBMPWord));
[ 'Приключения', 'Алисы', 'в', 'Стране', 'чудес' ]
</pre>
<div class="hidden">
<p>Note for MDN editors: please do not try to add funny examples with emoji as those characters are not handled by the platform (Kuma).</p>
</div>
<h2 id="Совместимость_с_браузерами">Совместимость с браузерами</h2>
<p>Для информации о совместимости с браузерами, посмотрите <a href="/ru/docs/Web/JavaScript/Guide/Regular_Expressions#Browser_compatibility">основную таблицу совместимости Regular Expressions</a>.</p>
<h2 id="Смотрите_по_теме">Смотрите по теме</h2>
<ul>
<li><a href="/ru/docs/Web/JavaScript/Guide/Regular_Expressions">Руководство по Regular expressions</a>
<ul>
<li><a href="/ru/docs/Web/JavaScript/Guide/Regular_Expressions/Assertions">Assertions</a></li>
<li><a href="/ru/docs/Web/JavaScript/Guide/Regular_Expressions/Quantifiers">Quantifiers</a></li>
<li><a href="/ru/docs/Web/JavaScript/Guide/Regular_Expressions/Unicode_Property_Escapes">Unicode property escapes</a></li>
<li><a href="/ru/docs/Web/JavaScript/Guide/Regular_Expressions/Groups_and_Ranges">Groups and ranges</a></li>
</ul>
</li>
<li><a href="/ru/docs/Web/JavaScript/Reference/Global_Objects/RegExp">Конструктор <code>RegExp()</code></a></li>
</ul>
|