blob: b4dd4182290c0df82ffba2f340347854ba2f7f01 (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
---
title: UTF-8
slug: Glossaire/UTF-8
tags:
- Encodage
- Glossaire
- HTML
- JavaScript
- Utf-8
translation_of: Glossary/UTF-8
---
<p>UTF-8 (UCS Transformation Format 8) est le {{Glossary("Character encoding","codage de caractères")}} le plus répandu sur le world wide web. Chaque caractère est représenté par un à quatre octets. UTF-8 est rétro-compatible avec l'{{Glossary("ASCII")}} et peut représenter n'importe quel caractère Unicode.</p>
<p>Les 128 premiers caractères UTF-8 correspondent exactement aux 128 premiers caractères ASCII (numérotés de 0 à 127), ce qui signifie que tous les textes ASCII existants sont déjà valides en UTF-8. Tous les autres caractères utilisent de deux à quatre octets. Chacun de ces octets possède quelques bits réservés à des fins d'encodage. Comme les caractères non-ASCII nécessitent plus d'un octet pour être enregistrés, ils courent le risque d'être corrompus s'ils sont séparés ou s'ils ne sont pas recombinés.</p>
<h2 id="Pour_approfondir" style="line-height: 18px; font-size: 1.28571rem;"><strong style="font-size: 1.71428571428571rem;">Pour approfondir</strong></h2>
<h3 id="Culture_générale"><strong>Culture générale</strong></h3>
<ul>
<li>{{Interwiki("wikipedia", "UTF-8")}} sur Wikipédia</li>
<li><a href="http://www.unicode.org/faq/utf_bom.html#UTF8">FAQ sur l'UTF-8, sur le site web d'Unicode</a></li>
</ul>
|