From 33058f2b292b3a581333bdfb21b8f671898c5060 Mon Sep 17 00:00:00 2001 From: Peter Bengtsson Date: Tue, 8 Dec 2020 14:40:17 -0500 Subject: initial commit --- files/ja/glossary/unicode/index.html | 19 +++++++++++++++++++ 1 file changed, 19 insertions(+) create mode 100644 files/ja/glossary/unicode/index.html (limited to 'files/ja/glossary/unicode/index.html') diff --git a/files/ja/glossary/unicode/index.html b/files/ja/glossary/unicode/index.html new file mode 100644 index 0000000000..3c85ddec04 --- /dev/null +++ b/files/ja/glossary/unicode/index.html @@ -0,0 +1,19 @@ +--- +title: Unicode +slug: Glossary/Unicode +tags: + - Infrastructure +translation_of: Glossary/Unicode +--- +

Unicode とは、世界の様々な言語、書式、記号に、番号を割り当てて定義した標準の{{Glossary("Character set","文字コード")}} です。一つ一つの{{Glossary("Character","文字")}} に番号を割り当てることで、プログラマーは、どの言語が混ざっていても、コンピューターに保存、処理、伝送させるような{{Glossary("Character encoding","文字エンコーディング")}}を同じファイルやプログラムの中に作ることができます。

+ +

Unicode ができる以前は、同じデータのなかに異なる言語を入れることは難しく、誤りが起こりがちでした。例えば、ある文字コードは日本語の文字を格納するためのもので、別のある文字コードはアラビア文字を格納するためのものだとします。もしデータのどの部分がどの文字コードであるか明確に示していない場合、他のプログラムやコンピューターは、文章を誤って表示してしまったり、処理中にデータを破損してしまったりしていました。二重引用符 (“”)のような文字が £ のようなわけのわからないものに置き換わっているのを見たことがあるかもしれません。それがこの問題です。{{Interwiki("wikipedia", "文字化け ")}}として知られています。

+ +

ウェブ上でもっとも一般的な文字エンコーディングは {{Glossary("UTF-8")}} です。UTF-16 や 廃止された UCS-2 といったエンコーディングも存在しますが、UTF-8 が推奨されています。

+ +

関連項目

+ + -- cgit v1.2.3-54-g00ecf