You are on page 1of 7

XML para principiantes

Es posible que haya odo hablar del lenguaje de marcado extensible/lenguaje XML, as como de muchas razones por las que su organizacin debera utilizarlo. Pero, qu es XML, exactamente? En este artculo se explican los conceptos bsicos sobre XML: qu es y su funcionamiento. En este artculo

Breve presentacin del marcado, las marcas y las etiquetas Qu lo convierte en XML? Comentario sobre los datos con formato correcto Una ojeada a los esquemas Una ojeada a las transformaciones XML en Microsoft Office System Ms informacin

Breve presentacin del marcado, las marcas y las etiquetas

Para entender XML, es til comprender la idea del marcado de datos. Las personas llevan siglos creando documentos y siempre los han marcado. Por ejemplo, los maestros de escuela marcan constantemente lo que escriben los estudiantes. Les indican que deben mover prrafos, aclarar frases, corregir errores ortogrficos, etc. Mediante el marcado de los documentos es como definimos la estructura, el significado y la apariencia de la informacin del documento. Si alguna vez ha utilizado la caracterstica Control de cambios de Microsoft Office Word, ha utilizado una forma informatizada de marcado.

En informtica, el trmino ingls "mark up" ha evolucionado a "markup" (marcado). El marcado es el proceso de usar cdigos denominados etiquetas (o, a veces, token) para definir la estructura, la apariencia visual y, en el caso de XML, el significado de cualquier dato.

El cdigo HTML para este artculo es un buen ejemplo del marcado relacionado con la informtica en funcionamiento. Si lo examina (en Microsoft Internet Explorer, haga clic con el botn secundario del mouse (ratn) en la pgina y a continuacin, en Ver cdigo fuente), ver una mezcla de texto legible y etiquetas de Lenguaje de marcado de hipertexto (HTML), como <p> y <h2>. Las etiquetas de los documentos HTML y XML son fciles de reconocer porque estn delimitadas por corchetes angulares. En el cdigo fuente de este artculo, las etiquetas HTML desempean varias funciones, como definir el principio y el final de cada prrafo (<p> ... </p>) y marcar la ubicacin de cada imagen.

Qu lo convierte en XML?

Los documentos HTML y XML contienen datos delimitados por etiquetas, pero ah acaban las similitudes entre ambos lenguajes. En HTML, las etiquetas definen la apariencia y el funcionamiento de los datos: aqu van los ttulos, all empieza el prrafo, etc. En XML las etiquetas definen la estructura y el significado de los datos: qu son los datos.

Al describir la estructura y el significado de los datos, se pueden volver a utilizar estos datos de muchas maneras. Por ejemplo, si tiene un bloque de datos de ventas y cada elemento del bloque est claramente identificado, puede cargar los elementos que necesite en un informe de ventas y cargar otros elementos en una base de datos de contabilidad. Dicho de otra forma, puede usar un sistema para generar los datos y marcarlos con etiquetas XML, y despus procesar esos datos en otros muchos sistemas, independientemente de la plataforma de hardware y del sistema operativo. Esta portabilidad es la razn por la que XML se ha convertido en una de las tecnologas ms populares para el intercambio de datos.

Recuerde esta informacin a medida que avance:

No es posible utilizar HTML en lugar de XML. Puede, no obstante, incluir los datos XML en etiquetas HTML y mostrarlos en una pgina Web. HTML est limitado a un conjunto predefinido de etiquetas que comparten todos los usuarios. XML permite crear cualquier etiqueta necesaria para describir los datos y la estructura de esos datos. Por ejemplo, supongamos que necesita almacenar y compartir informacin sobre mascotas. Puede crear el siguiente cdigo XML:

Detalle cdigo uno

Puede ver que las etiquetas XML permiten saber exactamente qu tipos de datos se est viendo. Por ejemplo, sabiendo que estos datos son de un gato encontrar fcilmente su nombre, edad, etc. La capacidad de crear etiquetas que definan casi cualquier estructura de datos es lo que hace al XML "extensible".

Sin embargo, no debe confundir las etiquetas de ese ejemplo de cdigo con etiquetas de un archivo HTML. Por ejemplo, si pega esa estructura XML en un archivo HTML y ve el archivo en el explorador, el resultado tendr un aspecto similar al siguiente:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

El explorador hace caso omiso de las etiquetas XML y muestra nicamente los datos.

Comentario sobre los datos con formato correcto

Quiz haya odo que alguien del departamento de IT habla de XML "correcto". Un archivo XML con formato correcto se ajusta a un conjunto de reglas muy estrictas que rigen XML. Si un archivo no se ajusta a esas reglas, XML deja de funcionar. Por ejemplo, en el ejemplo de cdigo anterior, cada etiqueta de apertura tiene una etiqueta de cierre, as que el ejemplo cumple una de las reglas para ser correcto. Si quita una etiqueta e intenta abrir el archivo en uno de los programas de Office, ver un mensaje de error y el programa le impedir usar el archivo.

No es necesario conocer las reglas de creacin de XML con formato correcto (aunque son fciles de comprender), pero s es necesario recordar que slo se puede compartir datos XML entre programas y sistemas si los datos tienen formato correcto. Si no puede abrir un archivo XML, lo ms probable es que su formato no sea correcto.

XML es adems independiente de la plataforma, lo que significa que cualquier programa generado para usar XML podr leer y procesar sus datos XML, independientemente del hardware y del sistema operativo. Por ejemplo, con las etiquetas XML correctas, puede usar un programa de escritorio para abrir y trabajar con datos procedentes de un gran sistema. Adems, independientemente de quin cree un cuerpo de datos XML, es posible trabajar con los mismos datos en varios de los programas de Microsoft Office 2003 y Microsoft Office Professional 2007, incluidos Microsoft Office Access 2007, Microsoft Office Word 2007, Microsoft Office InfoPath 2007, y Excel Microsoft Office Excel 2007. Debido a que es tan porttil, XML se ha convertido en una de las tecnologas ms populares para el intercambio de datos entre bases de datos y equipos de usuario.

Uso de XML en otros programas

Adems de datos etiquetados, correctos, los sistemas XML normalmente utilizan dos componentes adicionales: esquemas y transformaciones. Las secciones siguientes explican cmo funcionan estos componentes adicionales.

Una ojeada a los esquemas

No deje que el trmino "esquema" le intimide. Un esquema es slo un archivo XML que contiene las reglas de lo que puede y lo que no puede residir en un archivo de datos XML. Los archivos de esquema suelen usar la extensin de nombre de archivo .xsd, mientras que los archivos de datos XML utilizan la extensin .xml.

Los esquemas permiten a los programas validar datos. Proporcionan el marco de trabajo para estructurar datos y garantizar que tienen sentido para el creador y para cualquier otro usuario. Por ejemplo, si un usuario especifica datos no vlidos, tales como texto en un campo de fecha, el programa puede pedir al usuario que introduzca los datos correctos. Siempre que los datos de un archivo XML se ajusten a las reglas de un esquema dado, cualquier programa que admita XML puede utilizar ese esquema para leer, interpretar y procesar los datos. Por ejemplo, como se muestra en la ilustracin siguiente, Excel y Word pueden validar los datos <CAT> de acuerdo con el esquema CAT.

Los esquemas permiten a aplicaciones compartir datos XML.

Los esquemas pueden complicarse y la tarea de ensearle cmo crearlos est ms all del propsito de este artculo (adems, es probable que tenga un departamento de IT que sepa cmo hacerlo). No obstante, es til saber qu aspecto tiene un esquema. El esquema siguiente define las reglas para el conjunto de etiquetas <CAT> ... </CAT>.

Detalle cdigo dos

No se preocupe si no comprende todo lo que aparece en el ejemplo. Slo tiene que recordar lo siguiente:

Los elementos de lnea del esquema de ejemplo se denominan declaraciones. Si necesitara informacin adicional sobre un animal, como el color o las marcas, lo ms probable es que su departamento de IT agregara una declaracin al esquema. Puede cambiar el sistema XML a medida que evolucionen las necesidades de su negocio. Las declaraciones proporcionan un nivel de control muy alto sobre la estructura de datos. Por ejemplo, la declaracin <xsd:sequence> indica que etiquetas, como <NAME> y <BREED>, deben aparecer en el orden que se muestra ms arriba. Las declaraciones tambin pueden controlar los tipos de datos que pueden especificar los usuarios. Por ejemplo, el esquema anterior requiere un nmero positivo para la edad del gato y valores booleanos (TRUE o FALSE) para las etiquetas ALTERED y DECLAWED. Cuando los datos de un archivo XML siguen las reglas proporcionadas por un esquema, se dice que los datos son vlidos. El proceso de comprobacin de un archivo de datos XML con un esquema se denomina (lgicamente) validacin. La gran ventaja de usar esquemas es que ayudan a evitar que se daen los datos. Tambin facilitan la tarea de buscar datos daados, porque XML se detiene si detecta un problema.

Una ojeada a las transformaciones

Como ya se ha mencionado antes, XML proporciona tambin medios muy eficaces para usar o reutilizar datos. El mecanismo para reutilizar datos se denomina Transformacin de lenguaje de hoja de estilo extensible (XSLT) o, simplemente, transformacin. Es en las transformaciones donde XML se pone realmente interesante. Por ejemplo, despus de validar un archivo de datos con un esquema, puede aplicar una transformacin que haga que los datos funcionen como un folleto de marketing en Microsoft Office Word 2003 y aplicar otra transformacin para crear un informe de ventas en Office Excel 2007.

Usted (mejor, su departamento de IT) tambin puede utilizar transformaciones para intercambiar datos entre sistemas de servidor, tales como base de datos. Por ejemplo, supongamos que la Base de datos A almacena datos en una estructura de tabla adecuada para el departamento de ventas. La Base de datos B almacena los datos de ingresos y gastos en una estructura de tabla a medida del departamento de contabilidad. La Base de datos B puede usar una transformacin para aceptar datos de A y escribir esos datos en las tablas correctas.

La combinacin de archivo de datos, esquema y transformacin constituye un sistema XML bsico. La ilustracin siguiente muestra cmo funcionan normalmente tales sistemas. El archivo de datos se valida con el esquema y, a continuacin, se representa de cualquier forma que resulte til usando una transformacin. En este caso, la transformacin despliega los datos en una tabla en una pgina Web.

Una estructura bsica de archivos XML con un esquema y una transformacin

En el siguiente ejemplo de cdigo se muestra una forma de escribir una transformacin. Carga los datos <CAT> en una tabla de una pgina Web. De nuevo, el propsito del ejemplo no es ensearle a escribir una transformacin, sino mostrarle qu forma puede adoptar la transformacin.

Detalle cdigo tres.

En este ejemplo se muestra qu aspecto puede tener un tipo de transformacin al codificarla; recuerde, no obstante, que es posible describir lo que se necesita de los datos en simple espaol. Por ejemplo, puede ir al departamento de IT y decirles que necesita imprimir las ventas de determinadas regiones durante los dos ltimos aos, "y necesito que tenga este aspecto". El departamento de IT puede entonces escribir (o modificar) una transformacin para realizar esa tarea.

Lo que hace an ms cmodo todo esto es que Microsoft y un nmero creciente de otros proveedores estn creando transformaciones para trabajos de todo tipo. En el futuro, lo ms probable es que pueda descargar una transformacin que satisfaga sus necesidades o que pueda ajustar para que se adecue a sus propsitos. Eso significa que cada vez costar menos usar XML.

XML en Microsoft Office System

Las ediciones profesionales de Microsoft Office 2003 y de Versin de Office 2007 proporcionan una amplia compatibilidad con XML.

Office Excel 2007, Office Word 2007, y Office PowerPoint 2007 utilizan XML como formato predeterminado de archivo, cambio que tiene varias ventajas: Archivos de menor tamao. El nuevo formato usa ZIP y otras tecnologas de compresin para reducir el tamao de los archivos hasta un 75 por ciento, en comparacin con los formatos binarios utilizados en versiones anteriores de Office. Recuperacin de datos ms sencilla y mayor seguridad. XML es legible para las personas as que, si se daa un archivo, puede abrirlo en el Bloc de notas u otro editor de texto y recuperar al menos parte de la informacin. Adems, los nuevos archivos son ms seguros, porque no pueden contener cdigo de Visual Basic para Aplicaciones (VBA). Si usa el nuevo formato para crear plantillas, los controles ActiveX y las macros de VBA residirn en una seccin separada, ms segura, del archivo. Adems, puede utilizar herramientas tales como el Inspector de documento, para eliminar cualquier dato personal. Si desea obtener ms ayuda sobre el uso del Inspector de documento, consulte el artculo Quitar datos ocultos e informacin personal de los documentos de Office. Mayor portabilidad y flexibilidad. Dado que XML almacena datos en formato de texto en lugar de un formato binario propietario, los clientes pueden definir sus propios esquemas y usar los datos de ms formas, todo sin tener que pagar derechos de autor. Para obtener ms informacin acerca de los nuevos formatos, vea Introduccin a los formatos XML abiertos. Cada programa de Office ofrece un conjunto de herramientas diferente. Las interfaces de usuario y los procesos que siga en Word sern diferentes de las interfaces de usuario y los procesos que use en Excel o PowerPoint. Por qu? Porque lo que sirve para Word no sirve necesariamente para Excel, etc. Los programas de Office pueden trabajar con esquemas, transformaciones y datos de otros proveedores siempre que el formato de XML sea correcto. Algunos de los programas de Office utilizan XML en segundo plano y otros, tales como Microsoft Office OneNote, no lo admiten en absoluto. La mejor manera de ver cmo admite XML un programa es iniciar la Ayuda en pantalla de ese programa y buscar XML.

Hasta aqu no ha habido problemas pero, qu ocurre si se tiene datos XML sin esquema? Los programas de Office que admiten XML tienen enfoques propios para ayudarle a trabajar con los datos. Por ejemplo, si se abre un archivo XML en Word sin un esquema adjunto, Word muestra las etiquetas y los datos y permite aplicar una transformacin si, por ejemplo, el creador del archivo o el departamento de IT proporciona uno. Al menos podr leer las etiquetas y los datos del archivo.

Excel, por su parte, infiere un esquema si no tiene ya uno. Excel, a continuacin, le ofrece la opcin de cargar estos datos en un archivo de slo lectura o de asignar los datos a una lista XML (en Microsoft Office Excel 2003) o en una tabla XML (en Office Excel 2007). Puede utilizar las listas y tablas XML para ordenar, filtrar o agregar clculos a los datos.

Office Professional 2007 y Microsoft Office 2003 proporcionan el mismo conjunto de herramientas de XML. En Office Professional 2007, debe antes habilitar la compatibilidad con XML y a continuacin, iniciar las herramientas desde diferentes ubicaciones. Ahora bien, una vez iniciadas las herramientas, funcionan igual en Microsoft Office 2003 que en Office Professional 2007. Los siguientes pasos explican cmo iniciar las herramientas de XML para Office Excel 2007 y Office Word 2007.

Nota Microsoft Office Access 2007 habilita las herramientas de XML de manera predeterminada, de forma que puede omitir los primeros pasos si utiliza Access. Habilite las herramientas de XML en Office Excel 2007 y Office Word 2007

En Excel o Word, haga clic en el botn de Microsoft Office Imagen del botn y, a continuacin, haga clic en Opciones de Excel u Opciones de Word, segn el programa que desee abrir. Haga clic en Personalizar. En Opciones principales para trabajar con nombre de aplicacin, seleccione Mostrar ficha Programador en la cinta de opciones y, a continuacin, seleccione Aceptar.

Nota The Ribbon is part of the Interfaz de usuario de Microsoft Office Fluent Inicie las herramientas de XML en Office Excel 2007 y Office Word 2007

En ambos programas, en la ficha Programador, haga clic en cualquier comando disponible en el grupo XML.

Inicie las herramientas de XML en Office Access 2007

Haga clic en la ficha Datos externos. Siga uno de estos pasos: En el grupo Importar, haga clic en Archivo XML. En el grupo Exportar, haga clic en Ms y, a continuacin, en Archivo XML.

You might also like