--- title: Лексический синтаксис slug: Web/JavaScript/Reference/Lexical_grammar tags: - JavaScript - Keyword - Literal - ключевые слова - литералы translation_of: Web/JavaScript/Reference/Lexical_grammar ---
Спецсимволы не имеют визуального представления, однако используются для управления интерпретацией текста.
Code point | Name | Abbreviation | Description |
---|---|---|---|
U+200C |
Zero width non-joiner | <ZWNJ> | Размещается между символами во избежание их соединений в лигатуры для некоторых языков (Wikipedia) |
U+200D |
Zero width joiner | <ZWJ> | Размещается между символами, которые не могли бы нормально объединиться для того, чтобы символы отрисовывались, используя их соединительную форму в некоторых языках (Wikipedia) |
U+FEFF |
Byte order mark | <BOM> | Используется вначале скрипта для того, чтобы пометить Юникод и порядок байтов (Wikipedia) |
Пробельные символы улучшают читабельность исходного текста и разделяет токены друг от друга. Пробельные символы обычно не обязательны для функционирования кода. Утилиты для уменьшения объёма кода часто удаляют пробельные символы, чтобы уменьшить объем кода.
Code point | Name | Abbreviation | Description | Escape sequence |
---|---|---|---|---|
U+0009 | Character tabulation | <HT> | Горизонтальная табуляция | \t |
U+000B | Line tabulation | <VT> | Вертикальная табуляция | \v |
U+000C | Form feed | <FF> | Символ контроля разрыва страницы (Wikipedia) | \f |
U+0020 | Space | <SP> | Обычный пробел | |
U+00A0 | No-break space | <NBSP> |
Обычный пробел без точки, на которой может произойти разрыв страницы |
|
Others | Other Unicode space characters | <USP> | Другие символы в Юникоде на Википедии |
В дополнение к пробельным символам, символы окончания строк тоже используются для читабельности исходного кода. Однако, в некоторых случаях, символы окончания строк могут влиять на выполнение JavaScript-кода, т.к. есть некоторые места, где они запрещены.
Окончания строк также затрагивают процесс автоматического проставления точки с запятой. Также окончания строк попадают под условия регулярных выражений при поиске \s класса.
В ECMAScript, в качестве окончания строк можно использовать только ниже перечисленные Юникод символы. Другие символы окончания строк будут интерпретированы, как пробельные символы (например, Next Line, NEL, U+0085 будут интерпретироваться, как пробельные символы).
Code point | Name | Abbreviation | Description | Escape sequence |
---|---|---|---|---|
U+000A | Line Feed | <LF> | Новая строка в UNIX системах. | \n |
U+000D | Carriage Return | <CR> | Новая строка в Commodore и ранних Mac systems. | \r |
U+2028 | Line Separator | <LS> | Wikipedia | |
U+2029 | Paragraph Separator | <PS> | Wikipedia |
Комментарии используются для добавления подсказок, заметок, предложений или предупреждений. Они могут упростить чтение и понимание кода. Также они могут быть использованы для предотвращения выполнения кода (этот приём практикуется при отладке кода).
В JavaScript есть несколько способов указать комментарии в коде.
Первый способ //
комментарий; в этом случае весь текст в строке после двойного слеша будет комментарием, например:
function comment() { // Это комментарий в строке console.log("Hello world!"); } comment();
Второй способ - это /* */
, такой способ более гибок, чем первый.
Например, вы можете использовать его в одной строке:
function comment() { /* Это однострочный комментарий */ console.log("Hello world!"); } comment();
Либо вы можете сделать многострочный комментарий, как показано здесь:
function comment() { /* Этот комментарий располагается на нескольких линиях. Обратите внимание, что вам не нужно обрывать комментарий, пока вы его не закончите*/ console.log("Hello world!"); } comment();
Также, если пожелаете, то вы можете использовать такое комментирование посреди строки кода. Хотя это может ухудшить читабельность кода:
function comment(x) { console.log("Hello " + x /* вставьте значение x */ + " !"); } comment("world");
Чтобы отключить выполнение кода, просто оберните код в комментарий, как здесь:
function comment() { /* console.log("Hello world!"); */ } comment();
В этом случае console.log()
никогда не выполнится, пока он внутри комментария. Таким способом можно отключить любое количество строк кода.
Третий специализированный синтаксис комментариев, шебанг комментарий, в процессе стандартизации в ECMAScript (смотреть Hashbang Grammar proposal).
Шебанг комментарий ведёт себя точно также как и однострочный (//
) комментарий. Вместо этого, он начинается с #!
и действителен только в самом начале скрипта или модуля. Обратите внимание, что никакие пробелы не разрешены перед #!
. Комментарий состоит из всех символов после #!
до конца первой строки; только такой комментарий разрешён.
Шебанг комментарий определяет путь к JavaScript интерпретатору, скрипт которого вы хотите выполнить. Пример, как это работает:
#!/usr/bin/env node console.log("Hello world");
Note: Hashbang comments in JavaScript mimic shebangs in Unix used to run files with proper interpreter.
Although BOM before hashbang comment will work in a browser it is not advised to use BOM in a script with hasbang. BOM will not work when you try to run the script in Unix/Linux. So use UTF-8 without BOM if you want to run scripts directly from shell.
Для определения JavaScript интерпретатора используйте только #!
. В любых других случаях используйте //
(или многострочный комментарий).
class
catch
else
extends
finally
if
in
try
yield
Следующие ключевые слова зарезервированы на будущее ECMAScript спецификацией. За ними сейчас не стоит никакой функциональности, но она может появиться в будущих версиях, поэтому эти ключевые слова не могут быть использованы, как идентификаторы. Эти ключевые слова не могут быть использованы даже в strict или non-strict режимах.
enum
await
Следующие ключевые слова зарезервированы для кода, который выполняется в strict режиме:
implements
package
protected
static
interface
private
public
Перечисленные ниже ключевые слова зарезервированы для старых версий ECMAScript спецификаций (ECMAScript от 1 по 3).
abstract
boolean
byte
char
double
final
float
goto
int
long
native
short
synchronized
transient
volatile
К тому же, литералы null
, true
, и false
зарезервированы в ECMAScript для их обычной функциональности.
Зарезервированные слова действительно применяются только к идентификаторам (vs. IdentifierNames). Как описано в es5.github.com/#A.1, это все имена IdentifierNames, которые не исключают зарезервированных слов.
a.import a["import"] a = { import: "test" }.
С другой стороны, следующее выражение неправильно, т.к. Идентификатор IdentifierName
не содержит зарезервированных слов. Идентификаторы используются для FunctionDeclaration, FunctionExpression, VariableDeclaration
и т.п., в то время, как IdentifierNames
используются для MemberExpression, CallExpression
и т.п.
function import() {} // неправильно.
Подробнее о {{jsxref('Global_Objects/null','null')}}null
.
null
Подробнее о {{jsxref('Global_Objects/Boolean','Boolean')}}
.
true false
1234567890 42 // Будьте осторожны с использованием нуля вначале числа: 0888 // 888 распознается, как десятичное число 0777 // распознается, как восьмеричное число, 511 - как десятичное число
Имейте в виду, что литералы десятичных чисел могут начинаться с нуля (0), за которым следует другое десятичное число, но в случае, если число начинается с нуля и за ним идёт цифра меньше 8, то число будет распознано как восьмеричное. This won't throw in JavaScript, see {{bug(957513)}}. See also the page about {{jsxref('Global_Objects/parseInt','parseInt()','Octal_interpretations_with_no_radix')}}
.
Синтаксис двоичных чисел состоит из цифры ноль, за которой следует маленькая или большая латинская буква "B" (0b или 0B). Этот синтаксис новый и появился только в ECMAScript 2015, пожалуйста посмотрите таблицу совместимости с браузерами. Это может производить ошибку {{jsxref('Global_Objects/SyntaxError','SyntaxError')}}
: "Missing binary digits after 0b", Если цифры не 0 или 1.
var FLT_SIGNBIT = 0b10000000000000000000000000000000; // 2147483648 var FLT_EXPONENT = 0b01111111100000000000000000000000; // 2139095040 var FLT_MANTISSA = 0B00000000011111111111111111111111; // 8388607
Восьмеричный числовой синтаксис, который использует 0 с последующей, в нижнем или верхнем регистре, латинскую букву "О" (0o
или 0O)
. Этот синтаксис появился в ECMAScript 2015, пожалуйста, посмотрите таблицу совместимости с браузерами. Это может производить ошибку SyntaxError
: "Missing octal digits after 0o", если цифры не между 0 и 7.
var n = 0O755; // 493 var m = 0o644; // 420 // Так же возможно с лидирующими нулями (см. заметку о десятичных дробях выше) 0755 0644
Шестнадцатеричный числовой синтаксис, который использует 0 с последующей, в нижнем или верхнем регистре, латинскую букву "X" (0x
или 0X)
. Если числа после 0x вне диапазона (0123456789ABCDEF), то может последовать за этим {{jsxref("SyntaxError")}}: "Identifier starts immediately after numeric literal".
0xFFFFFFFFFFFFFFFFF // 295147905179352830000 0x123456789ABCDEF // 81985529216486900 0XA // 10
Смотрите также {{jsxref("Object")}} и {{jsxref('Operators/Object_initializer','Object initializer')}} для получения более подробной информации.
var o = { a: "foo", b: "bar", c: 42 }; // сокращённая нотация. Появилась в ES2015 var a = "foo", b = "bar", c = 42; var o = {a, b, c}; // вместо var o = { a: a, b: b, c: c };
Смотрите также {{jsxref("Array")}} для получения более подробной информации.
[1954, 1974, 1990, 2014]
'foo' "bar"
'\xA9' // "©"
Для экранирования Юникод символов обязательно нужно указать по крайней мере 4 символа после \u.
'\u00A9' // "©"
Новое в ECMAScript 2015. With Unicode code point escapes, any character can be escaped using hexadecimal numbers so that it is possible to use Unicode code points up to 0x10FFFF
. With simple Unicode escapes it is often necessary to write the surrogate halves separately to achieve the same.
See also {{jsxref("String.fromCodePoint()")}} or {{jsxref("String.prototype.codePointAt()")}}.
'\u{2F804}' // the same with simple Unicode escapes '\uD87E\uDC04'
Смотрите также {{jsxref('Global_Objects/RegExp','RegExp')}}
для получения более подробной информации.
/ab+c/g // An "empty" regular expression literal // The empty non-capturing group is necessary // to avoid ambiguity with single-line comments. /(?:)/
Смотрите также {{jsxref('template_strings','template strings')}} для получения более подробной информации.
`string text` `string text line 1 string text line 2` `string text ${expression} string text` tag `string text ${expression} string text`
Некоторые {{jsxref('Statements','JavaScript условия')}} должны быть завершены точкой с запятой и поэтому на них влияет автоматическая вставка точки с запятой (ASI):
let
, const
, переменныеimport
, export
, объявление модулейdebugger
continue
, break
, throw
return
Спецификация ECMAScript напоминает о трёх правилах вставки точки с запятой.
1. Точка с запятой ставится до, когда ограничитель строки или "}" is encountered that is not allowed by the grammar.
{ 1 2 } 3 // согласно ASI, будет преобразовано в { 1 2 ;} 3;
2. Точка с запятой ставится в конце, когда обнаружен конец вводимой строки токенов и парсер is unable to parse the single input stream as a complete program.
Here ++
is not treated as a {{jsxref('Operators/Arithmetic_Operators','postfix operator','Increment')}} applying to variable b
, because a line terminator occurs between b
and ++
.
a = b ++c // согласно ASI, будет преобразовано в a = b; ++c;
3. Точка с запятой вставляется в конце, когда согласно инструкции с ограниченным производством в грамматике следует ограничитель строки. Эти утверждения с правилами «no LineTerminator here» здесь:
++
and --
)continue
break
return
yield
, yield*
module
return a + b // согласно ASI, будет преобразовано в return; a + b;
{{Compat}}