Professional Documents
Culture Documents
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
Los documentos HTML estn construidos a partir de caracteres Del juego denominado ISO-Latn-1, de 256 elementos. Por ello, el formato de transferencia de informacin entre los clientes y servidores HTTP asocia un nico byte a cada carcter, segn el orden que tienen asociado en la definicin de la tabla. Por qu esta limitacin? Los documentos HTML se editan y almacenan en un entorno, pero son vistos en otros sistemas, cuyas facilidades para representar informacin son desconocidas para el creador de los mismos. En cada uno de estos sistemas se utilizan tablas de presentacin de caracteres totalmente diferentes, por lo cual el carcter (ASCII 160 en un sistema MSDOS en castellano) tendr una representacin completamente diferente en un sistema americano, o al cambiar entre un PC y un Macintosh. El caso extremo se halla en sistemas que utilicen alfabetos cirlicos o japoneses. Una pgina web se ha de ver en pases distintos, que usan conjuntos de caracteres distintos. El lenguaje HTML nos ofrece un mecanismo por el que podemos estar seguros que una serie de caracteres raros se van a ver bien en todos los ordenadores del mundo, independientemente de su juego de caracteres. Por su nmero, con el formato &#nnn; (nnn es el cdigo decimal del elemento). Por su nombre mnemotcnico, segn se recoge en ISO-LATIN-1. Por ejemplo, la se puede representar como á o á. (el ; indica el final de la etiqueta). Como nota importante, los caracteres < > ; " # " no pueden ser incluidos directamente dentro de un documento ya que seran interpretados como parte del propio cdigo HTML. Por ello, se deben utilizar los siguientes nombres mnemotcnicos: Sin embargo, el uso una tabla de caracteres nica es una limitacin demasiado estricta para un Web internacional, cuyos usuarios requieren disponer de documentos con alfabetos de caracteres ms amplios que los contemplados por ISO-LATIN-1. Por ello, los clientes Web modernos (principalmente Netscape Navigator e Internet Explorer) son capaces de mostrar un mismo documento utilizando diferentes juegos de caracteres. A travs de sus mens de configuracin, es posible hacer que determinado documento se muestre con una tabla de caracteres diferente de la por defecto; adems, los documentos HTML pueden incluir una etiqueta, <META>, para fijar el juego de caracteres necesario para su visualizacin, a partir de una aplicacin de la clasificacin MIME de los documentos HTML. Lgicamente, se debe disponer de una fuente adecuada para presentar el documento (por
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
ejemplo, una fuente True Type de los entornos Windows). <META> debe aparecer en la seccin <HEAD> del documento, y su formato es: <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=juego _de_caracteres"> Por ejemplo: <!-- Juego de caracteres Occidental --> <META HTTP-EQUIV="Content-Type" CONTENT="text/html;charset=us-ascii"> <!-- Juego de caracteres Cirlico --> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=csKOI8R"> <!-- Juego de caracteres Chino Tradicional --> <META HTTP-EQUIV="Content-Type" CONTENT="text;/html; charset=chinese";> A efectos prcticos, nuestros documentos deberan usar referencias a carcter, segn los identificadores definidos en ISO-LATIN-1, ya que no todos los browsers interpretan la etiqueta <META>. Si se especifica el juego de caracteres, dentro del documento se pueden utilizar directamente los caracteres grficos correspondientes (acentos, etc.), con el riesgo de que algn cliente Web los muestre con el carcter correspondiente de su tabla de cdigos Local.
Tabla Meta caracteres Result Displays Description Uppercase A acute Uppercase A grave Uppercase A circumflex Uppercase Result Displays Description Lowercase A acute
Command Syntax
Command Syntax
Á
á
À
à
 Ã
â ã
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
Å
Uppercase Uppercase A umlaut or dieresis Uppercase ligature Uppercase C Cedilla Uppercase E acute Uppercase E grave Uppercase E circumflex Uppercase E umlaut or dieresis Uppercase I acute Uppercase I grave Uppercase I circumflex Uppercase I umlaut or dieresis
å
Ä
ä
Æ
æ
Ç
ç
É
é
Lowercase E acute
È
è
Ê
ê
Ë
ë
Í
í
Lowercase I acute
Ì
ì
Î
î
Ï
ï
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
Uppercase Eth Uppercase Uppercase O acute Uppercase O grave Uppercase O circumflex Uppercase Uppercase O umlaut or dieresis Uppercase Uppercase ligature No matching metacharacter name Uppercase U acute Uppercase U grave Uppercase U circumflex Uppercase U
Ò
ò
Lowercase O grave Lowercase O circumflex Lowercase Lowercase O umlaut or dieresis Lowercase Lowercase ligature No matching metacharacter name
Ô Õ
ô õ
Ö
ö
Ø
ø
Œ
œ
Ú
ú
Lowercase U acute
Ù
ù
Û Ü
û ü
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
umlaut or dieresis; Ý Uppercase Y acute Uppercase Y dieresis No matching metacharacter name Uppercase Thorn Uppercase S Caron No matching metacharacter name Lowercase Scharfes S There is no uppercase version. ý
or dieresis
Lowercase Y acute
Ÿ
ÿ
Lowercase Y dieresis
Þ
þ
Lowercase Thorn
Š
š
ß
"
"
Double Quote
®
Registered tradeMark
™
TradeMark Not supported in Netscape use™instead. Greater than Non-breaking space Inverted question mark
< ©
<
>
> [ space ]
¡
¿
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
¢ ¤
Cent sign General currency sign Section sign Ordinal indicator feminine Vertical bar Hyphen Degree sign Acute accent Umlaut (dieresis) Micro sign Superscript one Superscript three Fraction onehalf Left angle quotation Multiplication
£ ¥
Pound sterling sign Yen sign Pilcrow (paragraph sign) Ordinal indicator masculine Not sign Macron Plus/minus sign Cedilla
§
¶
ª
º
· ²
³
¼
1/4
½
1/2
¾
3/4
« ×
» ÷
REGIONAL DISTRITO CAPITAL CENTRO DE ELECTRICIDAD ELECTRONICA Y TELECOMUNICACIONES ANLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN Fecha:
sign
AUTORES