--- title: String.prototype.charCodeAt() slug: Web/JavaScript/Reference/Global_Objects/String/charCodeAt tags: - JavaScript - Method - Reference - String - Unicode translation_of: Web/JavaScript/Reference/Global_Objects/String/charCodeAt ---
charCodeAt()
メソッドは、指定された位置にある UTF-16 コードユニットを表す 0
から 65535
までの整数を返します。
単一の UTF-16 コードユニットで表現可能なコードポイントであれば、 UTF-16 コードユニットは Unicode コードポイントと一致します。 Unicode コードポイントが単一の UTF-16 コードユニットで表現できない場合 (値が 0xFFFF
を超える場合)、返されるコードユニットはそのコードポイントのサロゲートペアの最初の部分になります。コードポイント値全体を取得したい場合は、 {{jsxref("Global_Objects/String/codePointAt", "codePointAt()")}} を使用してください。
str.charCodeAt(index)
index
0
以上、文字列の length
未満の値です。 index
が数値でない場合は、既定で 0
になります。与えられた index
の位置にあるコードポイント値を表す数値です。 index
の位置に要素がない場合は {{jsxref("Global_Objects/NaN", "NaN")}} を返します。
Unicode コードポイントの範囲は、 0
から 1114111
(0x10FFFF
) です。最初の 128 の Unicode コードポイントは、 ASCII 文字エンコーディングに直接対応しています。 (Unicode についての詳細は、Java Script ガイドを参照してください。)
注: charCodeAt()
は常に 65536
より小さい値を返すことに注意してください。これは、より高いコードポイントは、実際の文字を含むように使用されている (下の値) の "代理" 擬似文字のペアで表されているためです。
これにより、 65536
以上の値の個々の文字について完全な文字を検証したり再現したりするためには、 charCodeAt(i)
だけではなく、 charCodeAt(i+1)
(2 文字の文字列を検証/再現する場合) か codePointAt(i)
を代わりに使用する必要があります。下記の例 2 と 3 を見てください。
与えられたインデックスが 0 と文字列の長さの間にない場合、charCodeAt()
は {{jsxref("Global_Objects/NaN", "NaN")}} を返します。
後方互換: (JavaScript 1.2 などの) 過去のバージョンでは、 charCodeAt()
メソッドは、与えられた位置の文字の ISO-Latin-1 コードセットの値を示す数を返します。 ISO-Latin-1 コードセットの範囲は 0 から 255 です。最初の 0 から 127 までは ASCII 文字セットに直接対応しています。
以下の例では、 Unicode 文字の A である 65
を返します。
'ABC'.charCodeAt(0) // returns 65
このバージョンは、指定された位置の前に BMP 以外の文字が存在するかどうかが不明な場合に、 for ループなどで使用されることがあります。
function fixedCharCodeAt(str, idx) { // ex. fixedCharCodeAt('\uD800\uDC00', 0); // 65536 // ex. fixedCharCodeAt('\uD800\uDC00', 1); // false idx = idx || 0; var code = str.charCodeAt(idx); var hi, low; // High surrogate (could change last hex to 0xDB7F // to treat high private surrogates // as single characters) if (0xD800 <= code && code <= 0xDBFF) { hi = code; low = str.charCodeAt(idx + 1); if (isNaN(low)) { throw 'High surrogate not followed by ' + 'low surrogate in fixedCharCodeAt()'; } return ( (hi - 0xD800) * 0x400) + (low - 0xDC00) + 0x10000; } if (0xDC00 <= code && code <= 0xDFFF) { // Low surrogate // We return false to allow loops to skip // this iteration since should have already handled // high surrogate above in the previous iteration return false; // hi = str.charCodeAt(idx - 1); // low = code; // return ((hi - 0xD800) * 0x400) + // (low - 0xDC00) + 0x10000; } return code; }
function knownCharCodeAt(str, idx) { str += ''; var code, end = str.length; var surrogatePairs = /[\uD800-\uDBFF][\uDC00-\uDFFF]/g; while ((surrogatePairs.exec(str)) != null) { var li = surrogatePairs.lastIndex; if (li - 2 < idx) { idx++; } else { break; } } if (idx >= end || idx < 0) { return NaN; } code = str.charCodeAt(idx); var hi, low; if (0xD800 <= code && code <= 0xDBFF) { hi = code; low = str.charCodeAt(idx + 1); // Go one further, since one of the "characters" // is part of a surrogate pair return ((hi - 0xD800) * 0x400) + (low - 0xDC00) + 0x10000; } return code; }
仕様書 |
---|
{{SpecName('ESDraft', '#sec-string.prototype.charcodeat', 'String.prototype.charCodeAt')}} |
{{Compat("javascript.builtins.String.charCodeAt")}}