--- title: RegExp slug: Web/JavaScript/Reference/Global_Objects/RegExp tags: - JavaScript - Klasse - Referenz - RegExp - Reguläre Ausdrücke translation_of: Web/JavaScript/Reference/Global_Objects/RegExp ---
{{JSRef}}
Der RegExp constructor
erstellt ein Objekt mit regulären Werten, um diese dann als Muster an einem Text anzuwenden.
Für eine Einführung über reguläre Ausdrücke, lies das Kapitel Regular Expressions im JavaScript Guide (englisch).
/muster/flags
RegExp(muster [, flags])
muster
flags
Optional, flags kann eine Zeichenkette mit einer beliebige Kombination folgender Werte sein:
g
i
m
y
{{non-standard_inline}}lastIndex
property of this regular expression in the target string (and does not attempt to match from any later indexes). This allows the match-only-at-start capabilities of the character "^" to effectively be used at any location in a string by changing the value of the lastIndex
property.Es bestehen zwei Möglichkeiten, ein RegExp-Objekt zu erzeugen: Eine literale Notation und ein Konstruktor. In der literaren Version werden im Gegensatz zu der Konstruktorversion keine Anführungszeichen verwendet, um Zeichenketten zu kennzeichnen. Dementsprechend erzeugen beide der folgenden Zeilen den gleichen regulären Ausdruck:
/ab+c/i; new RegExp("ab+c", "i");
Die literale Notation stellt eine Kompilierung des regulären Ausdrucks während der Auswertung des Ausdrucks bereit. Nutzen Sie die literale Notation, wenn der reguläre Ausdruck unverändert bleiben wird. Wenn Sie zum Beispiel die literale Notation für die Erzeugung eines regulären Ausdruck verwenden, um ihn in einer Schleife zu anzuwenden, wird der reguläre Ausdruck nicht in jedem Schleifendurchlauf rekompiliert.
Der Konstruktor des RegExp-Objekts, z.B. new RegExp("ab+c")
, stellt eine Laufzeitkompilierung des regulären Ausdrucks bereit. Nutzen Sie die Konstruktor-Funktion, wenn sich das reguläre Suchmuster ändern wird oder Sie das Muster nicht kennen und es aus einer anderen Quelle wie z.B. einer Benutzereingabe beziehen.
Bei Verwendung der Konstruktor-Funktion sind die normalen Zeichenfolgenmaskierungsregeln (Voranstellen eines Rückwärtsschrägstrichs (\) vor Sonderzeichen innerhalb von Zeichenketten) einzuhalten. Zum Beispiel sind folgende Zeilen äquivalent:
var re = /\w+/; var re = new RegExp("\\w+");
Zeichenklassen | |
---|---|
Zeichen | Bedeutung |
. |
(Punkt, Satzendezeichen) stimmt mit jedem Einzelzeichen außer den Zeilenvorschub- und Wagenrücklaufzeichen ( Zu beachten ist, dass das
|
\d |
Stimmt mit einer arabischen Ziffer überein. Äquivalent zu
|
\D |
Stimmt mit jedem Zeichen überein, das keine arabische Ziffer ist. Äquivalent zu
|
\w |
Stimmt mit einem alphanumerischen Zeichen (Wortzeichen) einschließlich dem Unterstrich überein. Äquivalent zu
|
\W |
Stimmt mit jedem Zeichen überein, das kein alphanumerisches Zeichen (Wortzeichen) ist. Äquivalent zu
|
\s |
Stimmt mit einem einzelnen Leerraumzeichen überein (Leerzeichen, Tabulator, Seitenvorschub, Zeilenvorschub und weitere Unicode-Zeichen). Äquivalent zu
|
\S |
Stimmt mit einem einzelnen Zeichen überein, das kein Leerraumzeichen ist. (Nicht-Leerraumzeichen).
|
\t |
Stimmt mit einem Tabulatorzeichen überein. |
\r |
Stimmt mit einem Wagenrücklaufzeichen überein. |
\n |
Stimmt mit einem Zeilenvorschub überein. |
\v |
Stimmt mit einem vertikalen Tabulatorzeichen überein. |
\f |
Stimmt mit einem Seitenvorschub überein. |
[\b] |
Stimmt mit einem Rücklöschzeichen (Backspace) überein. (Nicht zu verwechseln mit |
\0 |
Stimmt mit einem NUL-Zeichen überein. (Keine weiteren Ziffern dürfen folgen!) |
\cX |
Wobei
|
\xhh |
Stimmt mit einem Zeichen mit dem Code /foo\x20bar/ passt z.B. auf 'o b' in "foo bar". |
\uhhhh |
Stimmt mit einem Zeichen mit dem Unicode hhhh (vier hexadezimale Ziffern) überein. |
\ |
Bei einem Zeichen, das normalerweise als Literal behandelt wird, signalisiert ein vorangestellter Rückschrägstrich, dass es als Spezialzeichen und nicht als Literal zu interpretieren ist. Z.B. passt oder Bei einem Zeichen, das normalerweise als Zeichen mit spezieller Bedeutung interpretiert wird, signalisiert ein vorangestellter Rückschrägstrich, dass es ohne besondere Bedeutung als Literal interpretiert werden soll. Zum Beispiel ist * Quantor-Spezialzeichen, das eine Übereinstimmung mit null oder mehreren Vorkommen des vorausgehenden Zeichens bedeutet; z.B. bedeutet |
Zeichen | Bedeutung |
[xyz] |
Zeichenauswahl, stimmt mit einem Beliebigen der eingeschlossenen Zeichen überein. Mittels eines Bindestriches kann ein Bereich von Zeichen angegeben werden.
|
[^xyz] |
Eine negative bzw. komplementäre Zeichenauswahl. Das bedeutet eine Übereinstimmung mit jedem Zeichen, das nicht in den eckigen Klammern eingeschlossen ist. Mittels eines Bindestriches kann ein Bereich von Zeichen angegeben werden. Zum Beispiel ist |
Bereichsgrenzen | |
Zeichen | Bedeutung |
^ |
Stimmt mit dem Anfang eines Subjekts und, wenn das multiline flag gesetzt ist, auch mit der Stelle unmittelbar nach einem Zeilenumbruchzeichen überein.
|
$ |
Stimmt mit dem Ende eines Subjekts und, wenn das multiline flag gesetzt ist, auch mit der Stelle unmittelbar vor einem Zeilenumbruchzeichen überein.
|
\b |
Stimmt mit einer null-breiten Wortgrenze wie zwischen einem Buchstaben und einem Leerzeichen überein. (Nicht zu verwechseln mit der Zeichenklasse
|
\B |
Stimmt mit einer null-breiten Nichtwortgrenze wie zwischen zwei Buchstaben oder zwischen zwei Leerzeichen überein.
|
Gruppierung und Rückwärtsreferenz | |
Zeichen | Bedeutung |
(x) |
Stimmt mit
Aufzeichnende Gruppierungen führen zu Performanzeinbußen. Wenn die übereinstimmenden Teilzeichenketten nicht wiederverwendet werden müssen, sind nicht aufzeichnende Klammern zu bevorzugen (siehe weiter unten). |
\n |
Wobei
|
(?:x) |
Stimmt mit x überein, speichert die Übereinstimmung aber nicht, auch non-capturing parentheses genannt. Auf die übereinstimmende Teilzeichenkette kann nicht mittels der Elemente [1], ..., [n] des Arrays oder der vordefinierten Eigenschaften $1, ..., $9 des RegExp -Objekts zugegriffen werden . |
Quantoren | |
Zeichen | Bedeutung |
* |
Stimmt mit dem null- oder mehrmaligen Vorkommen des voranstehenden Zeichen überein.
|
+ |
Stimmt mit dem ein- oder mehrmaligen Vorkommen des voranstehenden Zeichen überein. Äquivalent zu
|
*? +? |
Passt wie
|
? |
Stimmt mit dem null- oder einmaligen Vorkommen des voranstehenden Zeichens überein.
If used immediately after any of the quantifiers Das Fragezeichen wird auch in lookahead assertions verwendet, welche unter |
x(?=y) |
Passt nur auf x , wenn y darauf folgt. Zum Beispiel passt /Jack(?=Sprat)/ nur auf 'Jack', wenn danach 'Sprat' folgt. /Jack(?=Sprat|Frost)/ passt nur auf 'Jack', wenn 'Sprat' oder 'Frost' folgt. Allerdings ist weder 'Sprat' noch 'Frost' Teil der Übereinstimmungsresultate. |
x(?!y) |
Passt nur auf
|
x|y |
Passt entweder auf
|
{n} |
Wobei
|
{n,} |
Wobei
|
{n,m} |
Wobei
|
[\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]
[^\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]
Das globale RegExp
Objekt hat keine eigenen Methoden. Es erbt allerdings manche Methoden durch die Prototypenkette.{{jsOverrides("Function", "Methods", "prototype")}}
RegExp
-InstanzenDas folgende Script nutzt die replace
Methode und nutzt die vererbte String Instanz (re)
um als Rückgabewert eine Übereinstimmung des Namens (str)
in dem Format erster, letzter und im Format letzter, erster zu finden. In dem zu ersetzenden Text nutzt das Script $1 und $2 um das Ergebnis der übereinstimmenden Treffer in der Klammer als Muster des regulären Ausdrucks.
var re = /(\w+)\s(\w+)/; var str = "John Smith"; var newstr = str.replace(re, "$2, $1"); print(newstr);
Das ergibt: "Smith, John".
var s = "Please yes\nmake my day!"; s.match(/yes.*day/); // Returns null s.match(/yes[^]*day/); // Returns 'yes\nmake my day'
Dieses Beispiel zeigt, wie man die feste Kennzeichung (sticky flag
) an reguläre Ausdrücke nutzt, um Übereinstimmungen von individuelle Treffer von mehrzeigen Eingaben zu erhalten.
var text = "First line\nSecond line"; var regex = /(\S+) line\n?/y; var match = regex.exec(text); print(match[1]); // prints "First" print(regex.lastIndex); // prints 11 var match2 = regex.exec(text); print(match2[1]); // prints "Second" print(regex.lastIndex); // prints "22" var match3 = regex.exec(text); print(match3 === null); // prints "true"
One can test at run-time whether the sticky flag is supported, using try { … } catch { … }
. For this, either an eval(…)
expression or the RegExp(regex-string, flags-string)
syntax must be used (since the /regex/flags
notation is processed at compile-time, so throws an exception before the catch
block is encountered). For example:
var supports_sticky; try { RegExp('','y'); supports_sticky = true; } catch(e) { supports_sticky = false; } alert(supports_sticky); // alerts "true"
Wie oben erwähnt treffen Übereinstimmugnen mit \w
or \W
nur ASCII basierende Zeichen; als Beispiel: 'a' bis 'z', 'A' bis 'Z', 0 bis 9 und '_'. Um Übereinstimmungen für Zeichensätze anderer Sprachen wie Kyrillisch oder Hebräisch zu erzielen, nutze \uhhhh
., während "hhhh" den Unicode-Wert des Zeichensatzes in Hexadezimal angibt. Dieses Beispiel demonstriert wie man Unicode-Zeichen aus einem Wort erhält:
var text = "Образец text на русском языке"; var regex = /[\u0400-\u04FF]+/g; var match = regex.exec(text); print(match[0]); // prints "Образец" print(regex.lastIndex); // prints "7" var match2 = regex.exec(text); print(match2[0]); // prints "на" [did not print "text"] print(regex.lastIndex); // prints "15" // and so on
Hier ist eine externe Quelle um alle Unicode Blöcke für verschiedene Scripte zu erhalten: Regexp-unicode-block
var url = "http://xxx.domain.com"; print(/[^.]+/.exec(url)[0].substr(7)); // prints "xxx"
{{CompatibilityTable}}
Feature | Chrome | Firefox (Gecko) | Internet Explorer | Opera | Safari (WebKit) |
---|---|---|---|---|---|
Basic support | {{CompatUnknown}} | {{CompatVersionUnknown}} | {{CompatUnknown}} | {{CompatUnknown}} | {{CompatUnknown}} |
Feature | Android | Firefox Mobile (Gecko) | IE Phone | Opera Mobile | Safari Mobile |
---|---|---|---|---|---|
Basic support | {{CompatUnknown}} | {{CompatVersionUnknown}} | {{CompatUnknown}} | {{CompatUnknown}} | {{CompatUnknown}} |