Professional Documents
Culture Documents
O computador é uma grande calculadora, tudo que ele faz é executar cálculos com números. Ele é incapaz
de entender um texto. Os códigos são, portanto, formas de transformar informações de texto em dados
numéricos, compreensíveis ao PC.
1. O ASCII
2. O UNICODE
3. UNICODE na prática: UTF-8
4. Como fazer nas páginas web
5. Veja também: Utf8 unicode
O ASCII
Existem diferentes códigos. O mais conhecido é o código ASCII (American Standard Code for Information
Interchange). Este é um padrão americano, mas é um dos mais utilizados em todo o mundo. O código
ASCII define, com precisão, a correspondência entre símbolos e números até o número 127:
Portanto, use o número 97 para representar um a minúsculo. Para representar o ?, use o código 63. Alguns
deles (os inferiores a 32) são códigos de controle e não são feitos para serem exibidos. Por exemplo, o
código 10 pula a linha, o código 7 emite um sinal sonoro no computador, entre outras funções. Mas você
reparou que não há caracteres acentuados? Pois é, os americanos não pensaram no resto do mundo.
Muitas vezes usamos os códigos de 128 a 255 para os acentos, mas os códigos são diferentes de um país
para outro. Nada prático para trocar documentos. Assim, foi preciso encontrar um código mais prático: o
UNICODE.
O UNICODE
Em vez de usar apenas os códigos de 0 a 127, o UNICODE utiliza códigos de valor bem maiores. Com
isso, pode representar todos os caracteres específicos de diversos idiomas. Novos códigos são
regularmente atribuídos para novos caracteres, como caracteres latinos (acentuados ou não), gregos,
cirílicos, armênios, hebraicos, tailandeses, hiraganas, katakanas etc. Só o alfabeto chinês Kanji contém
6.879 caracteres. Assim sendo, o UNICODE define uma correspondência entre símbolos e números. Veja
uma pequena parte da tabela UNICODE cujos números são apresentados em notação hexadecimal.
Primeiro, caracteres de 0000 a 007F (de 0 a 127 - caracteres latinos)::
Caracteres de 0080 a 00FF (de 128 a 255 - caracteres latinos com acentos):
De qualquer maneira, para ser mais rigoroso, indicamos o início do arquivo, que está em UTF-8, com
caracteres especiais:
O UTF-8 reúne a eficiência do ASCII e o âmbito do UNICODE. Aliás, o UTF-8 foi adotado como padrão
para a codificação de arquivos XML. A maioria dos navegadores atuais também suportam o UTF-8 e o
detectam automaticamente nas páginas HTML.
O ISO-8859-1 é adequado para a maioria dos idiomas latinos ou ocidentais (inglês, francês, alemão,
espanhol etc.) e o UTF-8 será indispensável para outras línguas (japonês, hebraico etc.). Você deverá
escolher uma dessas três opções de acordo com as suas necessidades.
Foto: © Pixabay.
Recomendado para você Recomendado por