blob: 9be0c984eda7bf4e511b8cd181229fc45dd4d598 (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
---
title: Unicode
slug: Glossary/Unicode
translation_of: Glossary/Unicode
---
<p><span class="seoSummary">Unicode 是一种{{Glossary("Character set","字符集")}}标准,用于对来自世界上不同语言、文字系统和符号进行编号和{{Glossary("Character","字符")}}定义。</span>通过给每个字符分配一个编号,程序员可以创建{{Glossary("Character encoding","字符编码")}},让计算机在同一个文件或程序中存储、处理和传输任何语言组合。</p>
<p>在 Unicode 定义之前,在同一数据中混合使用不同的语言是很困难的,而且容易出错。例如,一个字符集存储的是日文字符,而另一个字符集存储的是阿拉伯字母。如果没有明确标明数据的哪些部分属于哪个字符集,其他程序和计算机就会错误地显示文本,或者在处理过程中损坏文本。如果你曾经见过像 (<code>“”</code>) 被替换为胡言乱语 <code>£</code>,那么你就已经看到过这个被称为 {{Interwiki("wikipedia", "Mojibake")}} 的问题。</p>
<p>网络上最常见的 Unicode 字符编码是{{Glossary("UTF-8")}}。还存在一些其他编码,如 UTF-16或过时的 UCS-2,但推荐使用 UTF-8。</p>
<h2 id="了解更多">了解更多</h2>
<ul>
<li>{{Interwiki("wikipedia", "Unicode")}} on Wikipedia</li>
<li><a href="http://www.unicode.org/standard/principles.html">The Unicode Standard: A Technical Introduction</a></li>
</ul>
|