You are on page 1of 14

GBD

T1: Sistemas de almacenamiento de la informacin

TEMA 1: SISTEMAS DE ALMACENAMIENTO DE LA INFORMACIN 1.1. Sistema lgico de almacenamiento. Concepto, caractersticas y clasificacin (ver presentacin) Ficheros tradicionales, concepto y tipos. Concepto (ver presentacin) Tipos: Secuencial: Concepto: (ver presentacin) CARACTERISTICAS DE LOS ARCHIVOS SECUENCIALES: o Lectura ordenada obligatoria: Para leer un registro situado en medio del archivo debemos pasar por todos los registros anteriores No permite retroceso: Se realiza la lectura solo hacia delante, de manera que leemos 1.2.3,4 y si queremos volver a leer el 2 tenemos que cerrar el archivo y abrirlo de nuevo. o Los archivos secuenciales son monousuarios: No permiten acceso simultaneo de varios usuarios , si accedes en modo escritura de manera simultanea los resultados son impredecibles y puede haber corrupcin de datos o Estructura rgida de campos: Todos los registros deben aparecer en orden, si escogemos un orden no podremos cambiarlo por otro orden ya que el programa lee a ciegas. Si queremos incluir mas datos en ese orden, debemos rehacer todo el archivo, llevando mucho trabajo. El otro problema es que solo podremos imprimir los datos del primer orden y luego a parte los datos que hemos introducido al rehacer el orden. o Apertura (Lectura/ Escritura): Dependen del modo de apertura en el que se haya abierto un archivo secuencia, solo puede hacer una de las 2 operaciones, pero no las 2. o Lecturas parciales pero escrituras totales: Las operaciones de lectura pueden ser parciales , pero las de escritura son totales ya que al abrirlo en este modo estamos borrando el contenido anterior si existe. Algunos lenguajes de programacin contienen un modo de apertura llamado Append que escribe al final de un archivo en vez de reescribirlo. o Marca final del archivo (EOF): Las operaciones de lectura deben comprobar siempre que no rebasan el final del archivo secuencial, mediante la comparacin del carcter (EOF). Se coloca siempre y de modo implcito al cerrarlo en modo escritura. o Borrado de registros omitiendo contenido: Consiste en la escritura de todos los registros menos el que deseamos eliminar. Otra forma es mantener la informacin pero marcarla como borrada, aunque es mas complejo. o Posibilidad de uso de la marca de sincronismo: La marca de sincronismo es una lnea con un contenido especfico que es palabra reservada. Esto significa que sin nosotros elegimos es FIN, ninguna otra puede ser FIN, de manera que cuando lleguemos a esa marca comienza una nueva.

1.2.

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

o Registros de longitud variable: Los registros tienen una longitud variable ya que tambin sus campos tienen una longitud variable. Por ejemplo un registro que se llame Juan Snchez no ocupa lo mismo que otro que se llame Jos Mara de Castro. Esto implica a no saber el tamao de las variables, por lo que para resolverlo surgieron los archivos aleatorios. o Contenido legible en un procesador de textos: El contenido de un archivo secuencial es legible en un procesador de textos. Uno de los primeros fue Wordstar. Los archivos secuenciales siguen siendo buenas opciones para almacenamiento de pocos registros, para tener ms velocidad de acceso. Directo o aleatorio: Concepto: Con los archivos de acceso aleatorio o directo no tenemos porque pasar para llegar a la informacin que nos interesa desde el inicio hasta la posicin que nos interesa. Podemos ir a la posicin 100, volver a la posicin 40 y avanzar hasta la 300 tantas veces como queramos. La medida bsica de la posicin del puntero de lectura es el byte. Esto implica que si utilizamos una estructura delimitada en longitud, podemos calcular la posicin en la que debemos situarnos para leer un registro. Pongamos por caso que tenemos un registro como ste codificado en ANSI (1 byte por carcter): Nombre: 80 caracteres ANSI. Direccin: 100 caracteres ANSI. Poblacin: 50 caracteres ANSI. Su longitud ser de 230 caracteres. Esto implica que el primer registro se encontrar en la posicin 0; el segundo registro se encontrar en la posicin 230; el tercero en la posicin 460 y as sucesivamente. En cada lenguaje de programacin dispondr de su propia funcin para el posicionamiento del cursor de lectura o de escritura para realizar el acceso aleatorio.

CARACTERISTICAS DE LOS ARCHIVOS DE ACCESO ALEATORIO: o Posicionamiento inmediato. Permite situar el puntero de lectura o escritura sobre una posicin concreta del archivo sin necesidad de pasar por las posiciones anteriores, con el consiguiente incremento de rapidez.

o Registros de longitud fija. Todos los registros tienen la misma longitud, ya que se utiliza siempre una estructura rgida dimensionada a la mxima longitud para cada campo.

o Apertura para lectura/escritura. Permiten su apertura en modo mixto (lectura y escritura), de forma que con una sola operacin de apertura podemos leer o escribir a voluntad en cualquier posicin segn nos convenga.

o Permiten el uso concurrente (multiusuario)

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

Al establecerse zonas especficas y limitadas de actuacin para lectura y escritura, diversos usuarios pueden acceder y escribir en diferentes porciones del archivo de forma simultnea.

o Dimensionamiento mximo al ser creado. Los archivos de acceso aleatorio deben dimensionarse hasta un nmero de registros mximos en el momento de crearse.

o Borrado de registro mediante ceros. Se realiza poniendo a 0 el espacio que ocupa; rellenndolo con bytes con el valor binario 0. En sistemas ms complejos se emplea un algoritmo de reutilizacin de gaps o espacios vacos, o incluso de compactacin. Si empleamos un algoritmo de compactacin de registros de gaps, deberemos ser conscientes de que el nmero de registro cambiara para un cliente dado en el momento en que se reubica, por lo cual una clave de acceso basada en nmero de registro no tendr validez. Si utilizamos un algoritmo de reutilizacin de gaps deberemos ser conscientes de que un cliente nuevo puede reutilizar el espacio de un cliente borrado. Por tanto, si utilizamos referencias a su nmero de registro en otros archivos, deberemos ser cuidadosos de que un cliente no sea falsamente referenciado en otros archivos. Estos son problemas de integridad referencial que se resuelven mejor en sistemas gestores de bases de datos, como veremos mas adelante, y que fueron una de las razones para realizar el cambio desde el sistema de informacin basado en archivos al sistema de informacin basado en bases de datos. Indexado: (ver presentacin)

Desventajas de los archivos tradicionales en oposicin a las bases de datos. Las principales desventajas de la utilizacin de archivos tradicionales frente a bases de datos son las siguientes: 1. La redundancia e inconsistencia de los datos: Los archivos pueden tener distintos formatos. Los datos pueden estar almacenados en distintos sitios, duplicados. La redundancia aumenta los costes de almacenamiento y acceso, como consecuencia aparece una inconsistencia en los datos, en otras palabras, las copias de los datos no coinciden por aparecer en varios archivos. 2. Dependencia de los datos fsica-lgica: La estructura fsica de los datos esta codificada en los programas de aplicacin, al modificar esta estructura, el programador debe identificar, modificar y probar todos los programas en los que se encuentran esos archivos. 3. Dificultad para tener acceso a los datos, proliferacin de programas: Para la utilizacin de consultas, las cuales no fueron previstas en el inicio,

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

conlleva la necesidad de codificar el programa de aplicacin necesario, no recuperan los datos necesarios de una forma conveniente y eficiente. 4. Separacin y aislamiento de los datos: Como los datos estn repartidos en distintos archivos, y tienen diferentes formatos, escribir programas que manipulen los datos correctamente es algo complicado, primero debera sincronizarse todos los archivos para que los datos coincidiesen. 5. Dificultad para el acceso concurrente: Las actualizaciones concurrentes, en un sistema de gestin de archivos, pueden dar lugar a datos inconsistentes, ya que el acceso a los datos se puede realizar por medio de diversos programas de aplicacin. 6. Dependencia de la estructura del fichero con el lenguaje de programacin: Al definirse la estructura dentro de los programas implica que los formatos de los ficheros sean incompatibles. Los ficheros generados por distintos lenguajes llevan consigo una incompatibilidad, que hace que los datos sean difciles de procesar. 7. Problemas en la seguridad de los datos: Como las aplicaciones se aaden al sistema segn se van necesitando, resulta difcil implantar restricciones de seguridad. 8. Problemas de integridad de datos: Los valores almacenados en los ficheros deben cumplir con restricciones de consistencia.

1.3.

Bases de datos. Conceptos, usos y tipos segn el modelo de datos y la ubicacin de la informacin. Concepto de base de datos: - Definicin del diccionario de la Real Academia Representacin de una informacin de manera adecuada para su tratamiento por un ordenador. Es una coleccin de datos formateados regularmente a la que ms de una persona tiene acceso y/o que se emplea para ms de un propsito. - Concepto de BD Es un conjunto de datos relacionados entre s, organizados y estructurados, con informacin referente a algo. Ejemplo 1: Agenda personal de telfonos. Ejemplo 2: Gestin de una empresa. Tipos de bases de datos segn el modelo de datos: - Base de datos jerrquico: Son bases de datos que, como su nombre indica, almacenan su informacin en una estructura jerrquica. En este modelo los datos se

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

organizan en una forma similar a un rbol (visto al revs), en donde un nodo padre de informacin puede tener varios hijos. El nodo que no tiene padres es llamado raz, y a los nodos que no tienen hijos se los conoce como hojas. Las bases de datos jerrquicas son especialmente tiles en el caso de aplicaciones que manejan un gran volumen de informacin y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento. Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos. Base de datos en red: Una base de datos de red es una base de datos conformada por una coleccin o set de registros, los cuales estn conectados entre s por medio de enlaces en una red. El registro es similar al de una entidad como las empleadas en el modelo relacional. Un registro es una coleccin o conjunto de campos (atributos), donde cada uno de los que contiene solamente un nico valor almacenado, exclusivamente el enlace es la asociacin entre dos registros, as que podemos verla como una relacin estrictamente binaria. Una estructura de base de datos de red, llamada algunas veces estructura de plex, abarca ms que la estructura de rbol, porque un nodo hijo en la estructura red puede tener ms de un nodo padre. En otras palabras, la restriccin de que en un rbol jerrquico cada hijo puede tener slo un padre, se hace menos severa. Base de datos relacional: ste es el modelo utilizado en la actualidad para modelar problemas reales y administrar datos dinmicamente. Tras ser postulados sus fundamentos en 1970 por Edgar Frank Codd, de los laboratorios IBM en San Jos (California), no tard en consolidarse como un nuevo paradigma en los modelos de base de datos. Su idea fundamental es el uso de "relaciones". Estas relaciones podran considerarse en forma lgica como conjuntos de datos llamados "tuplas". Pese a que sta es la teora de las bases de datos relacionales creadas por Codd, la mayora de las veces se conceptualiza de una manera ms fcil de imaginar. Esto es pensando en cada relacin como si fuese una tabla que est compuesta por registros (las filas de una tabla), que representaran las tuplas, y campos (las columnas de una tabla). En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a diferencia de otros modelos como el jerrquico y el de red). Esto tiene la considerable ventaja de que es ms fcil de entender y de utilizar para un usuario espordico de la base de datos. La informacin puede ser recuperada o almacenada mediante "consultas" que ofrecen una amplia flexibilidad y poder para administrar la informacin.

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

El lenguaje ms habitual para construir las consultas a bases de datos relacionales es SQL, Structured Query Language o Lenguaje Estructurado de Consultas, un estndar implementado por los principales motores o sistemas de gestin de bases de datos relacionales. Durante su diseo, una base de datos relacional pasa por un proceso al que se le conoce como normalizacin de una base de datos. Las bases de datos relacionales pasan por un proceso al que se le conoce como normalizacin de una base de datos, el cual es entendido como el proceso necesario para que una base de datos sea utilizada de manera ptima. Entre las ventajas de este modelo estn: Garantiza herramientas para evitar la duplicidad de registros, a travs de campos claves o llaves. Garantiza la integridad referencial: As al eliminar un registro elimina todos los registros relacionados dependientes. Favorece la normalizacin por ser ms comprensible y aplicable.

Tipos de bases de datos segn su uso: Las bases de datos estn en continua evolucin tecnolgica y lo que antes requera una tecnologa separada de la propia base de datos, ahora se integra dentro de las prestaciones normales de las bases de datos relacionales de mayor auge en el mercado. Ya podemos dar un uso temtico a las bases de datos relacionales, puesto que las mencionadas tecnologas presuponan anteriormente la necesidad de utilizar un sistema de informacin separado para realizar la tarea encomendada, mientras que ahora la gran flexibilidad de las bases de datos relacionales para crear nuevos tipos de datos complejos nos lleva a un nivel global de integracin de todos los sistemas de informacin de una empresa. Vamos a ver a continuacin algunos tipos de bases de datos segn su uso: Bases de datos documentales. Se encargan de almacenar documentos de diversas naturalezas (predominantemente texto, pero tambin planos, hojas de clculo, fotografas, documentos digitalizados mediante escner, etc.). Proporcionan herramientas de recuperacin de la informacin mediante claves y mediante temas (thesaurus). Con la incorporacin de los tipos de datos binarios largos (BLOB) los documentos pueden pasar a almacenarse dentro de las bases de datos relacionales sin mayor problema y las estructuras de ndices facilitan mucho la implementacin de thesaurus. Bases de datos geogrficas o sistemas de informacin geogrfica (SIG). Almacenan datos vectoriales sobre puntos geogrficos, superficies regulares o irregulares, volmenes, etc., asociados a valores estadsticos empleando sistemas de coordenadas geogrficas o UTM (propias de los sistemas de posicionamiento global o GPS). Estos tipos de bases de datos ofrecen informacin acerca del territorio, tales como estadsticas demogrficas, meteorolgicas, ventas de productos o clculos sobre terrenos, tales como solapamiento de superficies, distancia entre puntos, clculo de rutas, etc. Con las ltimas versiones de determinados fabricantes de SGBDR del ao 2008/2009 se incluyen tipos de datos geogrficos (puntos, reas, superficies) como tipos de datos nativos al mismo tiempo

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

que se suministran libreras especializadas de procedimientos almacenados (los clculos mencionados) para manejarlos. Bases de datos OOP (orientadas a objetos). La incorporacin de las prestaciones nuevas a las bases de datos relacionales pasa tambin por establecer mecanismos de almacenamiento de objetos de las longitudes indeterminadas que sean capaces de encapsular mtodos en su interior. En este sentido, algunos fabricantes de SGBDR estn introduciendo extensiones del lenguaje SQL para poder utilizar estos objetos bien sea como datos complejos, bien sea como funciones. Minera de datos. Son bases de datos pensadas para obtener estadsticas y tendencias de negocio. En las bases de datos actuales se est introduciendo la minera de datos dentro de un nuevo apartado llamado Inteligencia de negocio (Business Intelligence). Su finalidad es la deteccin de tendencias para agrupar tipos de clientes y utilizar de forma retroalimentada esta informacin para manejar el negocio. Bases de datos transaccionales (OLTP). En el polo opuesto de la minera de datos tenemos las bases de datos transaccionales masivas, para clientes tales como entidades bancarias, instituciones burstiles o mayoristas de ventas. Sus caractersticas son alto rendimiento, alta disponibilidad y preparacin contra contingencias catastrficas (en ingls, mission critical). La mayor parte de los sistemas gestores de bases de datos relacionales estn preparadas para actuar como mission critical mediantes sistemas de almacenamiento redundante (RAID) basados en copias mirroring y distribucin de datos recuperables mediante striping with parity.

Hoy da las bases de datos relacionales asumen con eficiencia las tareas de todas estas bases de datos que ahora deberan mantenerse aisladas en otros sistemas de informacin, gestionando el conocimiento y adaptndose globalmente y con mayor fidelidad al modelo de negocio real de la empresa. 1.4. Sistemas gestores de base de datos. Concepto, estructura, componentes, funciones y tipos. Ventajas de los SGBD frente a los sistemas de ficheros tradicionales. Definicin: - Un sistema de Gestin de Base de Datos (SGBD, en espaol DBMS, del ingls Data Base Management System) es el conjunto de software destinado a la creacin, control y manipulacin de la informacin de una base de datos. - Permite a los usuarios definir, crear y mantener la BD. - Proporciona un acceso controlado a la BD. - La BD almacena datos + metadatos (descripciones de los datos). - Antes de aparecer los SGBD la informacin se gestionaba utilizando los sistemas de gestin de datos basados en ficheros. Caractersticas de un SGBD: 1. Acceso mltiple. Diversos usuarios pueden acceder a la base de datos, sin que se produzcan conflictos, ni visiones incoherentes. 2. Utilizacin mltiple. Cada usuario podr tener una imagen o visin particular de la estructura de la base de datos.

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

3. Flexibilidad. Se podrn usar distintos mtodos de acceso, con tiempos de respuesta razonablemente pequeos. 4. Confidencialidad y seguridad. Se controlar el acceso a los datos (a nivel de campo), impidindoselo a los usuarios no autorizados. Uno concreto podr acceder a unos datos y a otros no. 5. Proteccin contra fallos. Deben existir mecanismos concretos de recuperacin en caso de fallo del sistema. 6. Independencia fsica. Se puede cambiar el soporte fsico de la base de datos (modelo de discos, por ejemplo), sin que esto repercuta en la base de datos o en los programas que la usan. 7. Independencia lgica. Se pueden modificar los datos contenidos en la base, las relaciones existentes entre ellos o incluir nuevos datos, sin afectar a los programas que la usan. 8. Redundancia controlada. Los datos se almacenan una sola vez. 9. Integridad: una BD posee integridad cuando es capaz de : Conseguir recuperar la informacin que pierde o queda daada cuando se producen fallos en el sistema. Mantener todos los datos cumpliendo las reglas de validacin. Para esto se realiza el control de transacciones, es un mecanismo que almacena las operaciones sobre la base de datos en el mismo orden en el que se han ejecutado. Servicios que presta un SGBD (ver presentacin) Componentes de los SGBD Lenguajes de los SGBD - Lenguaje de definicin de datos (LDD DDL). Sirve para especificar el esquema de la BD. La informacin resultante se almacena en el diccionario de datos, que es un archivo que contiene datos de los datos (metadatos). - Lenguaje de manipulacin de datos (LMD DML). Sirve para expresar las consultas y actualizaciones de la BD. Manipulacin de datos supone: recuperacin, insercin, borrado y/o modificacin de la informacin de la BD. El lenguaje de manipulacin de datos ms popular hoy da es SQL, usado para recuperar y manipular datos en una base de datos relacional. Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u otras. Una parte del DML es el lenguaje de consulta. Dos tipos de DML o DML procedimentales. El usuario debe especificar qu datos se necesitan y cmo obtenerlos. o DML no procedimentales. El usuario especifica qu datos se necesitan sin especificar cmo obtener esos datos.

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

Los usuarios informticos, como el DBA, analistas y programadores requerirn medios poderosos por los cuales podrn definir, extraer y manipular los datos en algn lenguaje de programacin. A este lenguaje se le llama lenguaje anfitrin (por ej, C). Casi la totalidad de los SGBD disponen de lenguajes de 4 generacin, que se caracterizan por ser poco procedimentales y el acceso a la base de datos se realiza mediante sentencias embebidas en el lenguaje de 4 generacin y escritas en SQL (SGBD relacionales). Los lenguajes que por si mismos pueden actuar con la base de datos, sin necesidad de apoyarse en otro lenguaje se llaman autocontenidos. El SQL como lenguaje de manipulacin de datos tiene la propiedad dual, es decir, puede actuar como husped o autocontenido. El lenguaje de consulta estructurado o SQL (por sus siglas en ingls structured query language) es un lenguaje declarativo de acceso a bases de datos relacionales que permite especificar diversos tipos de operaciones en stas. Una de sus caractersticas es el manejo del lgebra y el clculo relacional permitiendo efectuar consultas con el fin de recuperar -de una forma sencilla- informacin de inters de una base de datos, as como tambin hacer cambios sobre ella. Es un lenguaje de cuarta generacin (4GL).

El diccionario de datos Lugar donde se deposita informacin sobre los elementos que forman la base de datos. En una BD relacional proporciona informacin acerca de: (ver pg. 5 fotocopias) El administrador de la BD es el responsable de su creacin y mantenimiento. Seguridad e integridad de los datos Un SGBD proporciona los siguientes mecanismos para garantizar la seguridad e integridad de los datos: Proteccin de los datos contra accesos no autorizados. Restricciones de integridad en la BD que especificar el administrador de la BD. Planificacin y realizacin de copias de seguridad y restauracin. Debe ser capaz de recuperar la BD llevndola a un estado consistente. Asegurar el acceso concurrente (conservar la consistencia) Cuanto menor sea el nmero de elementos de una BD a los que puede acceder una persona, menor ser el riesgo de fallos de seguridad.

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

Se han de crear diversos niveles de derechos o autorizaciones. Auditora y gestin de errores: Auditora: mtodos que permiten conocer qu operaciones han sido realizadas por los usuarios. A la tabla que almacena las operaciones slo puede acceder el administrador: operacin realizada, usuario, nombre del ordenador, fecha y hora, datos del registro, valores antiguos y nuevos. Usuarios de los SGBD Existen diferentes categoras de usuarios. Cada categora tiene algunos permisos sobre los objetos de la BD. Suelen existir varias categoras: Administrador de B.D (DBA - Database Administrator). Nivel ms alto de privilegios. Es el usuario ms importante de los tres, ya que es el que se encarga de disear y modificar la estructura de la B.D. Programadores de aplicaciones: Se encargan de disear y programar las aplicaciones necesarias para la utilizacin de la B.D., realizando las peticiones pertinentes al SGBD. Usuario final: Es la persona que se dedica a trabajar sobre los datos almacenados en la B.D. Hay usuarios finales avanzados que por medio del lenguaje de programacin SQL pueden acceder a los datos.

Las personas que tienen acceso al SGBD (usuarios finales o programadores) tambin se pueden clasificar de la siguiente manera: USUARIOS INGENUOS. Son aquellos que interactan con el sistema por medio de aplicaciones permanentes. USUARIOS SOFISTICADOS.- son aquellos con la capacidad de acceder a la informacin por medios de lenguajes de consulta. PROGRAMADORES DE APLICACIN.- son aquellos con un amplio dominio del DML capaces de generar nuevos mdulos capaces de manejar nuevos datos en el sistema. USUARIOS ESPECIALIZADOS.- son aquellos que desarrollan mdulos que no se refieren precisamente al manejo de los datos, sino a aplicaciones avanzadas como sistemas expertos, reconocimientos de imgenes, procesamiento de audio y dems. Arquitectura de un SGBD Para acceder a los datos a partir de un lenguaje de alto nivel es necesario realizar una abstraccin de los datos, de manera que los distintos usuarios que interaccionen con el sistema no tengan que conocer la estructura interna (fsica) de ste. Arquitectura de un SGBD:

10

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

- Nivel Fsico o interno: El nivel ms bajo de abstraccin, describe cmo se almacenan realmente los datos, define las estructuras de datos complejas del nivel ms bajo. - Nivel Conceptual: El siguiente nivel ms alto de abstraccin describe qu datos son realmente almacenados en la base de datos y las relaciones que existen entre los datos. Se describe la base de datos completa en trminos de un nmero pequeo de estructuras relativamente sencillas. Este nivel lo usan los administradores de la base de datos para decidir qu informacin y cmo se va a guardar en la base de datos. - Nivel de visin externo: El nivel ms alto de abstraccin describe slo parte de la base de datos completa. A pesar del uso de estructuras ms sencillas en el nivel conceptual, sigue existiendo cierta complejidad, que para determinados usuarios es bueno ocultar. Por ejemplo, usuarios que slo vayan a hacer uso de una parte de la base de datos, se les muestra una vista de sta, que facilita su interaccin con el sistema.

NIVEL DE VISIN NIVEL CONCEPTUAL NIVEL FSICO

Esquema externo para cada usuario

Reglas de validacin Relaciones entre tablas Campos y sus propiedades

Ficheros: nombre, tipo, volumen,.. Tablas y registros ndices Diccionario de Datos

DD

11

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

Descripcin simple de los elementos: - Una Vista Externa es una visin particular de un usuario o un grupo de usuarios de la Base de Datos. El Esquema Externo representa una forma de definicin o formalizacin de esta vista externa. - La Vista Conceptual pretende ser la representacin total y abstracta de los datos que componen la Base; la formalizacin de esta se logra mediante el Esquema Conceptual. - Por ltimo, la Vista Interna es de un nivel muy bajo y corresponde al almacenamiento fsico de los datos de la Base, sobre un Esquema Interno que es la formalizacin de esto, e.d. tipos de registros almacenados, ndices, etc. Un DSL es un sublenguaje de datos, es una combinacin de dos lenguajes: un lenguaje de definicin de datos (DDL) y un lenguaje de manipulacin de Datos (DML). Este lenguaje representa un nexo entre el Sistema de Base de Datos y algn lenguaje anfitrin (p.e. COBOL, FORTRAN, C, etc.); e.d., el DSL provee herramientas a los lenguajes tradicionales para que se integren al Sistema de Base de Datos. Puede haber distintos tipos de DSL para un mismo sistema.

Funciones de un SGBD Las funciones esenciales de un SGBD son las de descripcin, manipulacin y control (o utilizacin). Funcin de definicin o descripcin La funcin de definicin (tambin llamada de descripcin) debe permitir al diseador de la base especificar los elementos de datos que la integran, su estructura y las relaciones que existen entre ellos, las reglas de integridad semntica, etc., as como las caractersticas de tipo fsico y las vistas lgicas de los usuarios. Esta funcin, realizada por el lenguaje de descripcin o definicin de datos (LDD) propio de cada SGBD, debe suministrar los medios para definir las tres estructuras de datos (externa, lgica global e interna), especificando las caractersticas de los datos a cada uno de estos niveles. Funcin de manipulacin Una vez descrita la base de datos, es preciso cargar los datos en las estructuras previamente creadas, con lo que la base de datos estar ya dispuesta para su utilizacin. Los usuarios tendrn necesidad de recuperar la informacin (consultar la base de datos), o bien de actualizarla porque se hayan producido cambios en los datos. La consulta a la base de datos puede ser de dos tipos: Totalidad de los datos, en la que se recuperan todos los datos de la base de datos o todos los de un determinado tipo; por ejemplo, para la

12

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

confeccin de la nmina ser preciso recuperar todos los registros de los empleados de la empresa. Consulta selectiva, en la que se tendrn que localizar los registros que cumplan una determinada condicin (criterio de seleccin); por ejemplo, obtener los empleados que sean informticos y sepan ingls.

La actualizacin o puesta al da de una base de datos supondr tres tipos de operaciones distintas: Insercin, cuando aparezcan nuevos elementos; por ejemplo, en un fichero de personal es preciso dar de alta a los nuevos empleados. Borrado, porque hayan desaparecido algunos elementos; por ejemplo en el fichero de personal es preciso dar de baja a los empleados que ya no estn en la empresa. Modificacin de los datos de aquellos registros en los cuales se hayan producido cambios; por ejemplo, cuando se ha alterado la categora profesional de un empleado.

La funcin de manipulacin permite a los usuarios de la base, informtico s o no, buscar, aadir, suprimir o modificar los datos de la misma, siempre de acuerdo con las especificaciones y normas de seguridad dictadas por el administrador. La funcin de manipulacin se llevar a cabo por medio de un lenguaje de manipulacin de datos (LMD) que facilita los instrumentos necesarios para la realizacin de estas tareas. Muchas veces se trata de un conjunto de mandatos (lenguaje husped) que se escriben en un lenguaje de programacin (lenguaje anfitrin); mientras que otras veces se trata de un lenguaje autocontenido que no precisa apoyarse en ningn otro lenguaje, ya que dispone en s mismo del conjunto de instrucciones necesarias para llevar a cabo tanto la recuperacin como la actualizacin de los datos. La mayora de los SGBD actuales atienden la funcin de manipulacin mediante ambos tipos de lenguajes, huspedes y autocontenidos; estos ltimos, orientados a los usuarios no informticos, suelen usarse de forma interactiva. Funcin de Control Esta funcin rene todas las interfaces que necesitan los diferentes usuarios para comunicarse con la base y proporciona un conjunto de procedimientos para el administrador. Las exigencias respecto a la forma de utilizar la base de datos son muy diferentes, segn los tipos de procesos y segn los usuarios, siendo preciso que la funcin de utilizacin responda a todas ellas. En especial, esta funcin debe integrar una serie de instrumentos que faciliten las tareas del administrador. En la mayora de los SGBD existen funciones de servicio, como

13

OTF

GBD

T1: Sistemas de almacenamiento de la informacin

cambiar la capacidad de los ficheros, obtener estadsticas de utilizacin, cargar archivos, etc., y principalmente las relacionadas con la seguridad fsica (copias de seguridad, rearranque en caso de cada del sistema, etc.) y de proteccin frente a accesos no autorizados.

14

OTF

You might also like