O que é?
- Unicode é um padrão adotado mundialmente que possibilita que todos os caracteres de todas as linguagens escritas utilizadas no planeta possam ser representados em computadores;
- Unicode fornece um número único para cada caractere;
- O padrão Unicode é capaz de representar não somente as letras utilizadas pelas linguagens mais “familiares” para nós ocidentais, como Inglês, Espanhol, Francês e o nosso Português, mas também letras e símbolos utilizados em qualquer outra linguagem: Russo, Japonês, Chinês, Hebreu, etc.
- Além disso, inclui símbolos de pontuação, símbolos técnicos e outros caracteres que podem ser utilizados em texto escrito.
Como trabalha o Unicode?
No padrão Unicode, cada letra ou símbolo de cada alfabeto utilizado no mundo é mapeado para um diferente code point, isto é, para um código no formato U + número em hexadecimal. O exemplo abaixo mostra os códigos das letras que compõem a palavra “BRASIL” (em maiúsculo).
B - U+0042
R - U+0052
A - U+0041
S - U+0053
I - U+0049
L - U+004C
NOTA:
- É muito importante mencionar que as letras maiúsculas possuem code points diferentes das letras minúsculas.
Webgrafia:
Unicode: conceitos básicos http://www.devmedia.com.br/unicode-conceitos-basicos/25169#ixzz3Gsf9Yy5f
Sem comentários:
Enviar um comentário