You are on page 1of 25

UNIDAD I. PRINCIPIOS FUNDAMENTALES SOBRE ARCHIVOS DE DATOS CONTENIDO 1.

Conceptos bsicos: Campo, Registro, Archivo, Longitud y tipo de Dato de los Campos, Longitud de un Registro, Longitud de un Archivo, Organizacin de Archivos, Mantenimiento y Procesamiento de Archivo 2. Archivos segn su acceso (secuencial e indexado) y segn su contenido (Maestro, Transacciones, Tabla, Histrico, Respaldo y Reporte) 3. Conceptos de: Base de datos y Banco de Datos http://www.rena.edu.ve/cuartaEtapa/Informatica/Tema9.html

CONTENIDO

INTRODUCCIN..............................................................................................................................................3 1. ARCHIVOS DE DATOS...............................................................................................................................4 1.1. Conceptos Bsicos....................................................................................................................................4 Procesamiento de Datos..................................................................................................................................9 Existen dos maneras tradicionales para procesar datos. El procesamiento por lotes y el procesamiento en tiempo real. Procesamiento por lotes: En este procesamiento, los datos se renen por un periodo de tiempo das o hasta semanas) al final del cual, se procesan en una sola operacin o lote. (horas,

Procesamiento en tiempo real: Este ocurre cuando los datos se procesan en el mismo momento en que son generados. Al principio, tan slo se dispona de almacenamiento en cintas magnticas que nicamente permiten almacenamiento secuencial. Esto obligaba a realizar todo el procesamiento por lotes. Con la aparicin de los dispositivos de acceso directo (discos duros), fue posible el almacenamiento de acceso directo, que permite localizar velozmente el registro de inters. Esto posibilit el procesamiento en tiempo real, que es muy apreciado en operaciones, como las de empresas comerciales. El procesamiento en tiempo real permite, por ejemplo, saber al instante cuntos productos han sido vendidos y con cuntos se cuenta en inventario, en tanto se van haciendo las ventas. An cuando el procesamiento por lotes precedi al procesamiento en tiempo real, motivado a factores como la disponibilidad de la tecnologa, no es correcto pensar en el procesamiento por lotes como algo caduco. Existen procesos que por su naturaleza deben hacerse por lotes, como por ejemplo el clculo de la nmina de una compaa cada mes............................................................................................................9 1.2. Caractersticas de los archivos de datos..................................................................................................9 1.3 Operaciones sobre Archivos de Datos...................................................................................................10 1.3.1. Crear un archivo..............................................................................................................................10 1.3.2. Abrir un archivo..............................................................................................................................11 1.3.3. Ampliacin de un archivo...............................................................................................................12 1.3.4. Cerrar archivos................................................................................................................................12 1.3.5. Borrar archivos................................................................................................................................12 1.3.6. Mantenimiento de archivos.............................................................................................................13 2. ESTRUCTURA DE LOS REGISTROS QUE CONFORMAN EL ARCHIVO DE DATOS...............15 3. TIPOS DE ARCHIVOS DE DATOS..........................................................................................................16 Archivos Convencionales.............................................................................................................................16 Bases de Datos..............................................................................................................................................17 4. Organizacin de archivos.............................................................................................................................19 4.1. Organizacin secuencial........................................................................................................................19 4.2. Organizacin directa o aleatoria...........................................................................................................20 4.3. Modos de acceso.....................................................................................................................................22
2

4.4. Procesamiento de Archivos Secuenciales..............................................................................................22 4.5. Procesamiento de Archivos Aleatorios..................................................................................................24

INTRODUCCIN. En la actualidad, para poder cumplir con sus objetivos, cualquier empresa u organizacin necesita almacenar y manejar grandes cantidades de datos. Por ejemplo, se necesitan los datos de los empleados, de los clientes, de los proveedores, de los productos almacenados, etc. Aos atrs, la gestin de estos datos se realizaba manualmente. Se organizaban en forma de fichas, informes o expedientes, colocndolos en carpetas y almacenando stas en un archivador. Por ejemplo, un archivo de clientes en el que cada ficha contiene todos los datos correspondientes a un cliente un archivo de alumnos donde en cada ficha tendremos todos los datos de cada alumno. La utilizacin de las computadoras en la administracin de las empresas ha cambiado el concepto de almacenamiento y gestin de sus datos, dando lugar al uso de los denominados archivos informticos y bases de datos. En consecuencia, el almacenamiento y recuperacin de datos es importante en el diseo y operacin de los sistemas de informacin. Una organizacin debe, por lo tanto, determinar que datos estarn en los archivos y bases de datos. Los datos elementales no son almacenados de una manera aleatoria o arbitraria; ellos se organizan y almacenan para una recuperacin eficiente. La organizacin del almacenamiento debe tambin tener en cuenta las caractersticas del medio de almacenamiento y de los dispositivos que se usan para tal efecto. La creacin y mantenimiento de datos ordenados es una parte importante de la carga de trabajo de un sistema de procesamiento de informacin. En el procesamiento de datos tradicional anterior al perodo de la tecnologa de las bases de datos, el nfasis se pona en los archivos y en las relaciones entre archivos. En el contexto informtico, un archivo es cualquier informacin permanente que se almacena de cualquier forma en algn dispositivo de almacenamiento secundario, que es
3

tratado como una unidad por el sistema operativo. Normalmente a cada archivo se le asocia un nombre y una extensin (depende del sistema operativo. Los nombres de archivo DOS pueden tener de 1 a 8 caracteres para el nombre y 0 a 3 para la extensin) que lo identifica y diferencia del resto.

nombre.ext
La mayora de los programas tienen una extensin de norma (por defecto) las que sern asignadas a los archivos que guardan, a menos que especficamente se desee escribir algo diferente. Otros datos importantes asociados al archivo son su fecha y hora de creacin y actualizacin, el tamao, permisos de acceso, etc. De forma muy general, los archivos pueden clasificarse en dos grandes grupos: archivos de programas y archivo de datos. Nuestro inters en este tema son los archivos de datos o conjunto de informacin en memoria secundaria relativas a un mismo tema. Nota: Caracteres ilegales en un nombre de archivo son: . , / \ : ; [ ] " | = Son extensiones ilegales CON, AUC, COM1, COM2, COM3, COM4, LPT1, LPT2, LPT3, PRN, o NUL 1. ARCHIVOS DE DATOS. 1.1. Conceptos Bsicos. La jerarqua en la organizacin de datos. Cada sistema de informacin cuenta con una jerarqua en la organizacin de datos en la que cada nivel subsiguiente es resultado de la combinacin de los elementos del nivel anterior. As, la informacin se combina en forma lgica hasta que se obtenga una base de datos. Los bits (el primer nivel) se manejan de manera automtica, sin que exista ninguna accin por parte del programador ni del usuario final. Los otros cinco niveles son consideraciones de diseo importantes para cualquier procesamiento de informacin.
Los bits se configuran para representar
0, 1

formar

11000001 = A Mara Prez

Caracteres (bytes) que se combinan para

Campos que se agrupan de manera lgica Registros que contienen los

para formar Prez, Vereda 21, Mara


Maturn, etc.

elementos relacionados Luis Marn, etc.

Mara Prez, Jos Garca, ,

Archivo maestro de empleados; archivo maestro de inventarios, Archivo se integran de maestro de clientes; archivo maestro de proveedores, etc.

con la informacin y se expresan en Archivos que se reorganizan y manera lgica para obtener una
4

Base de datos

Bits y caracteres. Un carcter est representado por un grupo de bits, que se configuran de acuerdo con un sistema de codificacin, como el ASCII. En tanto que el bit es la unidad bsica de almacenamiento primario y secundario, el carcter es la unidad bsica para la percepcin humana. En trminos de almacenamiento de datos, por lo general, un carcter es lo mismo que un byte. Campo. Es una agrupacin de caracteres que representa una caracterstica del objeto o entidad cuya informacin se almacena. Por ejemplo, el campo nombre de un empleado. En un campo se deben establecer tres caractersticas: Nombre del campo: permite rotular el mismo. Tipo de campo: permite establecer qu tipo de dato contiene el campo (alfabticos, numricos, alfanumricos, binarios, lgicos, etc.) Tamao del campo: cantidad de caracteres que pueden almacenarse. Campo clave. Es un campo de datos cuyo valor sirve para identificar de forma nica el registro y lo diferencia de otros; por tanto, dicho valor no puede aparecer repetido en otro registro diferente. Puede suceder que un archivo no tenga campo clave en sus registros o, por el contrario, que tenga varios, denominndose a la principal clave primaria y a las dems secundarias. Una clave simple est formada por el valor de un solo campo, ejemplo, nro.
5

empleado y una clave compuesta, por el valor de ms de un campo, por ejemplo, cdigo de localidad y nro. empleado. Si un archivo contiene la informacin de un conjunto de individuos u objetos, sus registros contienen la informacin de cada uno de ellos y los campos los diferentes datos que la componen. Por ejemplo, en el archivo de personal de una empresa cada registro contiene la informacin de un empleado y los campos contienen su nmero de DNI, nombre, direccin, fecha de ingreso, etc. La calle en que vive ser un subcampo y el campo clave puede ser el nmero de DNI.

Registro. Es un conjunto de campos interrelacionados, que pueden ser de diferentes tipos y que a su vez pueden estar compuestos por subcampos. Por ejemplo, el registro nmina de un empleado podra estar compuesto del campo nombre, el campo cdula de identidad, el campo departamento y el campo sueldo. Cuando el nmero y tamao de los datos en un registro son constantes para cada registro, a stos se le denomina de longitud fija, sin embargo los registros de este tipo no siempre hacen uso eficiente del espacio asignado. Por ejemplo; el campo fecha es un campo de longitud fija el cual hace uso adecuado del espacio asignado, ya que siempre ocupara los ocho caracteres especificados; dos para el da, dos para el mes y cuatro para el ao. Sin embargo, los campos Nombres y Apellidos teniendo longitud fija, puede perder espacio valioso ya que no siempre el nombre y apellido del alumno pueden estar especificados por una cadena de cincuenta (50) caracteres. Los registros de longitud variable son menos comunes en la mayora de las aplicaciones de las empresas que los diseos de longitud fija, debido a que estos ltimos son ms fciles de manejar y cubren las necesidades de la mayora de las aplicaciones.
1.4.1.- Organizacin lgica de archivos. (http://boards4.melodysoft.com/2005AAV0102/-organizacion-de-archivos-15.html) Los registros pueden ser de longitud fija o variable. Los archivos de registros de longitud fija: son elementos del mismo tamao y almacenan la informacin en los archivos mediante un encabezado y luego se introducen uno a uno los registros ubicados en posiciones consecutivas. En el tamao del campo produce un desperdicio de espacio pero facilita la direccin y extraccin de la informacin del campo. Los registros de longitud variable: almacenan registros de varios tipos en un archivo y permite uno o ms campos de longitudes variables y dichos campos pueden ser repetidos. La longitud de los registros debe estar definida correctamente para poder leer y escribir de forma efectiva. Aqu hay un aprovechamiento del espacio pero se
6

complica la localizacin y extraccin de la informacin. Si el registro contiene un nmero fijo de campos y cada uno de ellos tiene longitud fja, sera de longitud fija. Si el registro contiene un nmero fijo de campos en donde alguno de ellos sea de longitud variable, ser de longitud variable. Si el registro contiene un nmero variable de campos y cada uno de ellos tiene longitud fija, ser de longitud fija. Si el registro contiene un nmero variable de campos en que alguno de ellos sea de longitud variable, ser de longitud variable.

Bloque (registro fsico). Un registro fsico o bloque corresponde a la cantidad de informacin que se transfiere fsicamente en cada operacin de acceso (lectura o escritura) sobre el exterior. Ejemplos de registros fsicos son: una tarjeta perforada, una lnea de impresin, un sector de un disco magntico, etc. Conviene separar claramente los conceptos de registro lgico y registro fsico, diferencindose en que el tamao y formato del registro lgico los define el programador mientras que el tamao del registro fsico viene dado por las caractersticas fsicas de la computadora utilizada. En general, un bloque tendr capacidad para contener uno o ms registros, pero tambin puede ocurrir que un registro ocupe ms de un bloque. En el primer caso se habla de registros bloqueados, denominndose factor de bloqueo al nmero de registros lgicos que contiene cada registro fsico, y se denominan registros expandidos a aquellos que ocupan ms de un bloque. Una lectura de un archivo con registros bloqueados transfiere a la memoria central varios registros a la vez, pero para leer un registro expandido ser necesario realizar ms de un acceso. Archivos de Datos. Un archivo o fichero es un elemento de almacenamiento de informacin, que reside en memoria secundaria y est conformado por un conjunto de registros, todos del mismo tipo y en nmero indeterminado. Desde el punto de vista lgico, los archivos de datos suelen dividirse en unidades lgicas llamadas registros, que a su vez se dividen en campos. Entonces, podemos decir que, por ejemplo, un archivo nmina podra estar compuesto de los registros nmina de todos los empleados de una empresa. Base de datos. Es la fuente de datos para cada sistema de informacin basado en la computadora. Podemos definir una base de datos como un conjunto integrado de datos interrelacionados, junto con una serie de aplicaciones para su manejo, accesibles simultneamente por diferentes usuarios y programas. Por ejemplo, la base de datos personal de una empresa podra incluir archivos de nmina, de conductas de personal y de habilidades de los empleados. Sus principales caractersticas son: . Control centralizado de los datos. . Integridad de los datos . Minimizacin de las redundancias. . Independencia de los datos y las aplicaciones.
7

. . . . .

Acceso concurrente a los datos. Costo mnimo de almacenamiento y mantenimiento. Versatilidad para la representacin de relaciones. Establecimiento de medidas de seguridad. Facilidad para el cambio (hardware y software).

Los programas que permiten gestionar las bases de datos se denominan SGBD Sistemas de Gestin de Base de Datos. Una caracterstica fundamental de un SGBD es que puede trabajar con diferentes bases de datos, por ejemplo, Almacn, Biblioteca, Agenda, etc. Ejemplo: Oracle, Access, etc. Entidad. Una entidad es cualquier persona, lugar, cosa o evento de inters para la organizacin y acerca del cual se capturan, almacenan o procesan datos. En una universidad los alumnos y empleados son entidades propias del sistema.

Campo Nombre Juan Prez

Registro Nmina Juan Prez 5.123.889 Bs. 350.000,00 etc

Archivo Nmina

Base de datos del Personal


8

Procesamiento de Datos. Existen dos maneras tradicionales para procesar datos. El procesamiento por lotes y el procesamiento en tiempo real. Procesamiento por lotes: En este procesamiento, los datos se renen por un periodo de tiempo (horas, das o hasta semanas) al final del cual, se procesan en una sola operacin o lote. Procesamiento en tiempo real: Este ocurre cuando los datos se procesan en el mismo momento en que son generados. Al principio, tan slo se dispona de almacenamiento en cintas magnticas que nicamente permiten almacenamiento secuencial. Esto obligaba a realizar todo el procesamiento por lotes. Con la aparicin de los dispositivos de acceso directo (discos duros), fue posible el almacenamiento de acceso directo, que permite localizar velozmente el registro de inters. Esto posibilit el procesamiento en tiempo real, que es muy apreciado en operaciones, como las de empresas comerciales. El procesamiento en tiempo real permite, por ejemplo, saber al instante cuntos productos han sido vendidos y con cuntos se cuenta en inventario, en tanto se van haciendo las ventas. An cuando el procesamiento por lotes precedi al procesamiento en tiempo real, motivado a factores como la disponibilidad de la tecnologa, no es correcto pensar en el procesamiento por lotes como algo caduco. Existen procesos que por su naturaleza deben hacerse por lotes, como por ejemplo el clculo de la nmina de una compaa cada mes. 1.2. Caractersticas de los archivos de datos. Las principales caractersticas que diferencian esta estructura de datos de las restantes son las siguientes: - Residencia en soportes de informacin externos, tambin denominados memorias secundarias o auxiliares, como son las cintas y discos. - Independencia respecto de los programas. Significa que la vida del archivo no est limitada por la vida del programa que lo cre, y tambin que el archivo puede ser utilizado por diferentes programas. - Permanencia de la informacin almacenada. Es decir, toda la informacin almacenada en la memoria central desaparece cuando se termina la ejecucin del programa que la maneja, pero para hacer desaparecer un archivo ser necesario realizar explcitamente una operacin de borrado.

- Gran capacidad de almacenamiento. Tericamente esta capacidad es ilimitada, est en funcin del soporte de almacenamiento. Por el contrario, las estructuras de datos que residen en la memoria central tienen limitado su tamao por la capacidad de sta. 1.3 Operaciones sobre Archivos de Datos. Las operaciones generales que se realizan sobre un archivo son: Crear archivos (crear) Abrir o arrancar (open) un archivo que fue creado con anterioridad a la ejecucin de este programa Incrementar o ampliar el tamao del archivo (append, extend) Cerrar el archivo despus que el programa ha terminado de utilizarlo (close) Borrar (delete) un archivo que ya existe Transferir datos desde (leer) o a (escribir) el dispositivo, diseado por el programa

Con anterioridad a la creacin de un archivo se requiere disear la estructura del mismo mediante los campos del registro, longitud y tipo de los mismos. Para poder gestionar un archivo mediante un programa es preciso declarar el archivo, su nombre y la estructura de sus registros. La declaracin se realiza con las siguientes instrucciones: archivo nombre registro campo 1 = tipo campo 2 = tipo campo 3 = tipo 1.3.1. Crear un archivo. Es la operacin mediante la cual se introduce la informacin correspondiente al archivo en un soporte de almacenamiento de datos. La creacin corresponde a la escritura de todos sus registros.
DATOS CREACION de un archivo en disco MAESTRO (desordenado

Para crear un nuevo archivo dentro de un sistema de computadora se necesitan los siguientes datos: nombre dispositivo/usuario: indica el lugar donde se situar el archivo cuando se cree; nombre del archivo: identifica el archivo entre los restantes archivos de una computadora; tamao del archivo: indica el espacio necesario para la creacin del archivo; organizacin del archivo: tipo de organizacin del archivo; tamao del bloque o registro fsico: cantidad de datos que se leen o escriben en cada operacin de entrada/salida
10

El proceso de creacin de un archivo se suele incluir como un subprograma dentro de un programa principal. Al ejecutar el programa de creacin de un archivo se pueden generar una serie de errores entre los que se pueden destacar los siguientes: Otro archivo con el mismo nombre ya exista en el soporte El dispositivo no tiene espacio disponible para crear otro nuevo archivo El dispositivo no est operacional Existe un problema de hardware que hace abortar el proceso Uno ms de los parmetros de entrada en la instruccin son errneos.

1.3.2. Abrir un archivo. La accin de abrir (open) un archivo es permitir al usuario localizar y acceder a los archivos que fueron creados anteriormente. La diferencia esencial entre una instruccin de abrir un archivo y una instruccin de crear un archivo reside en que el archivo no existe antes de utilizar crear y se supone que debe existir antes de utilizar abrir. La informacin que un sistema de tratamiento de archivos requiere para abrir un archivo es diferente de las listas de informacin requerida para crear un archivo. La razn para ello reside en el hecho que toda la informacin que realmente describe el archivo se escribi en ste durante el proceso de creacin del archivo. Por consiguiente, la operacin abrir-archivo slo necesita localizar y leer esta informacin conocida como atributos del archivo. La instruccin de abrir un archivo consiste en la creacin de un canal que comunica a un usuario a travs de un programa con el archivo correspondiente situado en un soporte. Los parmetros que se deben incluir en una instruccin de apertura (abrir) son: Nombre del dispositivo; Nombre del usuario o canal de comunicacin; Nombre del archivo. Archivo no encontrado en el dispositivo especificado (nombre de archivo o identificador de dispositivo errneo); Archivo ya est en uso para alguna otra aplicacin del usuario; Errores hardware

Al ejecutar la instruccin abrir-archivo se pueden encontrar los siguientes errores:

El formato de la instruccin es: abrir nombrearchivo La operacin de abrir archivos se puede aplicar para operaciones de entrada, salida o bien entrada/salida; abrir nombrearchivo para entrada

11

1.3.3. Ampliacin de un archivo. El propsito de la instruccin aadir-archivo (extend-file, append-file) es permitir al usuario incrementar el tamao de un archivo. La informacin que necesita el sistema de gestin de archivos para incrementar el tamao de un archivo es: Nombre del dispositivo y directorio donde est localizado el archivo Nombre del archivo Tamao en que se incrementar el archivo

Antes de poder realizar con xito la operacin de ampliacin de un archivo se necesita comprobar previamente si existe espacio suficiente en el soporte para alojar el tamao de la ampliacin prevista. Los errores ms tpicos que se pueden cometer en la operacin de ampliacin son: El dispositivo no tiene espacio disponible para ampliar el archivo El archivo no se abri previamente

La mayora de los lenguajes de programacin no posee en su sintaxis la instruccin para ampliar un archivo. Sin embargo, se puede disear una rutina especfica que realice dicha tarea. 1.3.4. Cerrar archivos. El propsito de esta operacin es permitir al usuario cortar el acceso o detener el uso del archivo, permitiendo a otros usuarios acceder al archivo. Para ejecutar esta funcin, el sistema de tratamiento de archivos slo necesita conocer el nombre del archivo que se debe cerrar, y que previamente debe estar abierto. El formato de la instruccin es: cerrar nombrearchivo 1.3.5. Borrar archivos. La instruccin de borrar-archivos tiene como objetivo la supresin de un archivo del soporte o dispositivo. El espacio utilizado por un archivo borrado puede ser utilizado para otros archivos. La informacin necesaria para eliminar un archivo es: Nombre del dispositivo y nmero de canal de comunicacin; Nombre del archivo El archivo no se pudo encontrar bien porque el nombre no es vlido o porque nunca existi Otros usuarios estaban actuando sobre el archivo y estaba activo Se detect un problema de hardware

Los errores que se pueden producir son:

12

1.3.6. Mantenimiento de archivos. Esta operacin incluye todas las operaciones que sufre un archivo durante su vida y desde su creacin hasta su eliminacin o borrado. El mantenimiento de un archivo consta de dos operaciones diferentes: Actualizacin Consulta

La actualizacin es la operacin de eliminar o modificar los datos ya existentes, o bien introducir nuevos datos. En esencia, es la puesta al da de los datos del archivo. Las operaciones de actualizacin son: altas, bajas y modificaciones.

Proceso de actualizacin

Las operaciones de consulta tienen como finalidad obtener informacin total o parcial de los datos almacenados y presentados en dispositivos de salida: pantalla o impresora, bien como resultados o como listados en un archivo

Proceso de consulta

Programa Todas las operaciones de mantenimiento de archivos suelen constituir mdulos principal independientes del programa principal y su diseo se realiza con subrutinas o procedimientos especficos. As las subrutinas de mantenimiento de un archivo constan de:

Actualizacin

Consulta 13

Altas

Bajas

Modificaciones

Altas. Consiste en la adicin de un nuevo registro. Para situar correctamente un alta, se deber conocer la posicin donde se desea almacenar el registro correspondiente: al principio, en el interior o al final de un archivo. Bajas. Es la accin de eliminar un registro de un archivo. La baja de un registro se puede presentar de do formas distintas: indicacin del registro especfico que se desea dar de baja o bien visualizar los registros del archivo para que el usuario elija el registro a borrar. La baja de un registro puede ser lgica o fsica. Una baja lgica supone el no borrado del registro en el archivo. Esta baja lgica se manifiesta en un determinado campo del registro con una bandera o flan, carcter, etc, o bien con la escritura o rellenado de espacios en blanco en el registro especfico. Una baja fsica implica el borrado y desaparicin del registro, de modo que se crea un nuevo archivo que no incluye al registro dado de baja. Modificaciones. Consiste en la operacin de cambiar total o parcialmente el contenido de uno de sus registros. Esta fase es tpica cuando cambia el contenido de un determinado campo de un archivo; por ejemplo, la direccin o la edad de un empleado. La forma prctica de modificar un registro es la visualizacin del contenido de sus campos; para ello se debe elegir el registro o registros a modificar. El proceso consiste en la lectura del registro, modificacin de su contenido y escritura, total o parcial del nmero. Consulta. Tiene como fin visualizar la informacin contenida en el archivo, bien de un modo completo, bien de modo parcial, examen de uno ms de sus registros. Las operaciones de consulta de archivo deben contemplar diversos aspectos que faciliten la posibilidad de conservacin de datos. Los aspectos ms interesantes a tener en cuenta son: Opcin de visualizacin en pantalla o listado en impresora. Detencin de la consulta a voluntad del usuario.

14

Listado por registros o campos individuales o bien listado total del archivo (en este caso deber existir la posibilidad de impresin de listados, con opciones de saltos de pgina correctos)

Operaciones sobre registros. Las operaciones de transferencia de datos a/o desde un dispositivo a la memoria central se realizan mediante las instrucciones: Leer nombrearchivo, lista de entrada de datos Escribir nombrearchivo, lista de salida de datos Las operaciones de acceso a un reegistro y de paso de un registro a otro se realiza con las acciones leer y escribir. 2. ESTRUCTURA DE LOS REGISTROS QUE CONFORMAN EL ARCHIVO DE DATOS. La base de datos se subdivide y organiza en archivos de acuerdo con la naturaleza general de los datos y el uso que se pretende hacer con ellos. Cada archivo se compone de un conjunto de registros relacionados, cada uno de los cuales se descompone a su vez en campos individuales que corresponden a cada uno de los valores de datos que se ha de procesar, estos a su vez se subdividen en subcampos. Los conceptos carcter, campo, registro, archivo y base de datos son conceptos lgicos que se refieren al medio en que el usuario de computadoras ve los datos y se organizan.

BLOQUE (Factor de bloqueo = 3)

Registro 1

Registro 2

Registro 3

ARCHIVO CAMPO 1 CAMPO 2 CAMPO 3


SUBCAMPOS

CAMPO 2
15

3. TIPOS DE ARCHIVOS DE DATOS. Los archivos alojados en dispositivos de almacenamiento conocidos como memoria secundaria, pueden almacenarse de dos formas diferentes: archivos convencionales o bases de datos. Archivos Convencionales. Estn asociados a una filosofa de lenguaje ms artesanal, son los que tienen una relacin directa con los programas. Se clasifican en: Archivos Maestros: Tambin denominados archivos de situacin, contienen la informacin que refleja el estado o situacin de una empresa o entidad, o algn aspecto de ella en un determinado momento. Estos archivos se actualizan peridicamente para adaptarlos a cada nueva situacin. Los archivos maestros son tiles slo mientras se mantengan exactos y actualizados. Un ejemplo es el archivo de personal en una empresa, o tambin el archivo de existencias en almacn. Archivo de Transacciones. Es un archivo temporal con dos propsitos: acumular datos acerca de los eventos al momento que ocurran y actualizar los archivos maestros para reflejar los resultados de las transacciones actuales. El trmino transaccin se refiere a cualquier evento que afecte la organizacin y sobre el cual se calculan datos. En nuestro caso de estudio, las transacciones pueden hacer referencia a la asignacin de docentes a la carga acadmica, asignacin de grupos de alumnos por facultad, semestre y carga acadmica, transferencias de alumnos, contratacin de personal, etc. Los archivos de transacciones se utilizan para actualizar los archivos maestros; los archivos maestros son permanentes y duran mientras exista el sistema; sin embargo, los contenidos de los archivos cambian como resultado del procesamiento y actualizacin. Los archivos de transacciones son temporales, en algn momento dejan de ser necesarios y se borran o destruyen, dependiendo del mtodo utilizado para almacenar los datos. Estos archivos de transacciones pueden guardarse por meses, a veces incluso aos despus de que han sido creados, dependiendo de las disposiciones legales y de la organizacin. Archivo de Tablas. Contienen datos de referencias utilizados en el procesamiento de transacciones o actualizacin de los archivos maestros. Por lo general, los archivos de tabla se utilizan para almacenar datos que de otra forma se incluiran en los archivos maestros. Por ejemplo, si se ajusta el costo de la matricula para el siguiente ciclo de acuerdo a las perspectivas del gobierno y de la organizacin, el clculo y los resultados se almacenaran sobre registros tablas y sern utilizados en los diferentes procesos o transacciones que se requieran. Archivos histricos: Se obtienen de los archivos maestros cuando se dejan fuera de uso para futuros estudios estadsticos o consultas .Ser un archivo histrico el que contiene la informacin de libros adquiridos por una biblioteca en la dcada de los ochenta o un archivo con los pagos realizados en los ltimos 5 aos el detalle de comprobantes considerados en un ejercicio contable ya cerrado. Archivo de Respaldo. Cuando los archivos informticos contienen informacin que es extremadamente importante, se usa un proceso de respaldo (back-up) para protegerse contra desastres que podran destruir los archivos. Hacer copias de respaldo de archivos significa simplemente hacer copias de los archivos en una ubicacin separada de modo que
16

se puedan restaurar si le pasara algo a la computadora, o si fueran borrados accidentalmente. Archivos de Reportes. Son archivos temporales que se utilizan cuando el tiempo de impresin no est disponible para todos los reportes producidos. La computadora escribe el reporte a un archivo en disco o cinta magntica, en donde puede permanecer hasta que pueda imprimirse. Bases de Datos. Se originan de los convencionales, pero tienen una estructura ms completa y hacen uso de la tecnologa. Se define una base de datos como una serie de datos organizados y relacionados entre s, los cuales son recolectados y explotados por los sistemas de informacin de una empresa o negocio en particular. La administracin de bases de datos consiste en la planeacin, organizacin y control de las bases de datos de una empresa u organismo. Las bases de datos se distinguen de los archivos maestros comunes y de transacciones en cuatro formas: Un archivo est destinado al almacenamiento. Los registros que contienen un archivo se almacenan juntos y son recabados por medio de un mtodo de accesso (secuencial o aleatorio) Agregar registros a un archivo para agrandarlo no lo convierte en una base de datos. La existencia de una base de datos no est determinada por el nmero de registros almacenados. Los registros referentes a distintas entidades de inters pueden almacenarse dentro de una base de datos.

Las bases de datos ofrecen mltiples beneficios tanto a las organizaciones como a los individuos: Uniformidad: Si se tienen diversos archivos con la informacin relacionada dentro de la organizacin, es probable que cada uno tenga un formato diferente, lo cual dificulta su comparacin. El uso de bases de datos permite informacin en un formato comn. Seguridad: Los usuarios de la informacin tienen niveles de acceso a los archivos y al tipo de informacin que deban manejar, gestionado mediante el uso de contraseas que establecen sus derechos de usuario. Evitar la inconsistencia y redundancia de datos: Una base de datos permite el uso de archivos compartidos accedidos mediante la red, evitando que cada usuario tenga su propia copia de datos. De este modo se evita la duplicacin de la informacin, es decir, que se almacene en ms de un dispositivo de almacenamiento. Esto disminuye los costos de almacenamiento y evita la inconsistencia de los datos, es decir, diversas copias de un mismo dato que no concuerdan entre s. Integridad de datos: Los valores de los datos almacenados deben satisfacer ciertas restricciones de consistencia. Las restricciones son evaluadas mediante programas que
17

determinan si un campo es adecuado; por ejemplo, evitar que en una fecha se coloque el nombre de una ciudad. Base de datos propietarias o Bancos de datos Se trata en general de bases de datos de gran tamao, desarrollada por una organizacin y que contiene temas especializados o de carcter particular. El pblico general puede tener acceso a esta base a veces de forma gratuita y otras mediante el pago de una cuota. Pueden ofrecer informacin que va desde negocios, economa, inversin, tcnica y cientfica hasta servicios de entretenimiento. Permiten encontrar en minutos lo que tardara horas ojeando revistas. Organizacin de sistema de gestin de bases de datos. Base de datos relacional Esta organizacin ofrece la mayor flexibilidad ya que los datos se almacenan en tablas diferentes, conformadas as mismo por filas y columnas. Una tabla se denomina relacin. En una tabla las filas contienen los registros. Las columnas representan los campos. Las tablas relacionadas poseen un campo comn, el campo clave, mediante el cual la informacin almacenada en una tabla puede enlazarse con la informacin almacenada en otra. El acceso a los datos se realiza mediante consultas escritas en SQL. La organizacin de bases de datos relacional es la ms difundida en la actualidad motivada a su sencillez para realizar operaciones de adicin, eliminacin y modificacin en contraste con la mayor rigidez de las organizaciones jerrquicas y de red. Por ejemplo en un modelo relacional para un pequeo negocio, se puede contar con una tabla de clientes y otra de rdenes. Las rdenes que pertenecen a un determinado cliente son identificadas colocando el campo de identificacin del cliente en la orden (campo clave de la tabla de clientes), lo cual permite enlazar las dos tablas.

18

4. Organizacin de archivos. La organizacin de un archivo define la forma en la que los registros se disponen sobre el soporte de almacenamiento, o tambin se define la organizacin como la forma en que se estructuran los datos en un archivo. Segn las caractersticas del soporte empleado y el modo en que se han organizado los registros, se consideran dos tipos de archivos: 4.1. Organizacin secuencial. Es aquella en la cual los registros ocupan posiciones consecutivas de memoria y que slo se puede acceder a ellos de uno en uno a partir del primero. En un archivo secuencial, no se pueden hacer operaciones de escritura cuando se est leyendo, ni operaciones de lectura cuando se est escribiendo. Por otro lado, para actualizarlos es preciso crear nuevos archivos donde se copien los antiguos junto con las actualizaciones. En un archivo secuencial, los registros se insertan en el archivo en orden cronolgico de llegada al soporte, es decir, un registro de datos se almacena inmediatamente a continuacin del registro anterior.

Los archivos secuenciales, que se usan para el procesamiento secuencial, contienen registros ordenados de acuerdo con un campo clave. Un archivo secuencial se procesa de principio a fin. Todo el archivo se debe procesar, aun cuando se actualice slo un registro. El principal medio de almacenamiento para los archivos secuenciales es la cinta magntica. Tambin se pueden usar los discos magnticos. Caractersticas: -. Terminan con una marca de fin de archivo (EOF o bien FF). Cuando se tengan que aadir registros se aadirn en las marcas fin de archivo. -. Ocupan menos memoria y son tiles cuando se desconoce a priori el tamao de los datos y se requieren registros de longitud variable. Tambin son muy empleados para el almacenamiento de informacin., cuyos contenidos sufran pocas modificaciones en el transcurso de su vida til. -. El inconveniente que presentan es la dificultad para alcanzar registros cerca de la mitad o al final de un archivo de gran tamao, cuando los registros del principio no interesan. -. No permiten hacer operaciones de escritura cuando se est leyendo, ni operaciones de lectura cuando se est escribiendo.

19

-. Para actualizarlos es preciso crear nuevos archivos donde se copien los antiguos junto con las actualizaciones. 4.2. Organizacin directa o aleatoria. Los datos se colocan y se acceden aleatoriamente mediante su posicin, es decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones posibles. En esta organizacin se pueden leer y escribir registros, en cualquier orden y en cualquier lugar. En un archivo de acceso directo cada registro se identifica con un nico nmero, con el que se puede acceder al mismo. Cada registro individual puede ser ledo, escrito o actualizado. Cada registro est definido con una longitud fija as como cada campo dentro del registro. Presenta el inconveniente de que es tarea del programador establecer la relacin entre la posicin que ocupa un registro y su contenido; adems puede desaprovecharse parte del espacio destinado al archivo, ya que pueden quedar huecos libres entre unos registros y otros. Su principal ventaja es la rapidez de acceso a un registro cualquiera, puesto que no es preciso pasar por los registros anteriores. Son muy rpidos de acceso a la informacin que contienen.

Un archivo de acceso directo, o archivo aleatorio, es un conjunto de registros que se pueden procesar en forma aleatoria (en cualquier orden). En el procesamiento aleatorio, slo se necesita el valor del campo clave del registro para recuperar o actualizar un registro. Con mucha frecuencia, los discos magnticos constituyen el medio de almacenamiento para el procesamiento aleatorio. Las condiciones para que un archivo sea de organizacin directa son: -. Almacenado en un soporte direccionable -. Los registros deben contener un campo especfico denominado clave que identifica cada registro de modo nico; es decir, dos registros distintos no pueden tener un mismo valor de clave. -. Existencia de una correspondencia entre los posibles valores de la clave y las direcciones disponibles sobre el soporte. Un soporte direccionable es, normalmente, un disco o paquete de discos. Cada posicin se localiza por su direccin absoluta, que en el caso del disco suele venir definida por dos parmetros: nmero de pista y nmero de sector; o bien por tres parmetros: pista, sector y
20

nmero de cilindro; un cilindro i es el conjunto de pistas de nmero i de cada superficie de almacenamiento de la pila. En la prctica el programador no gestiona directamente direcciones absolutas, sino direcciones relativas respecto al principio del archivo. La manipulacin de direcciones relativas permite disear el programa con independencia de la posicin absoluta del archivo en el soporte. El programador crea una relacin perfectamente definida entre la clave indicativa de cada registro y su posicin fsica dentro del dispositivo de almacenamiento. 4.3. Organizacin secuencial de ndice. Es una combinacin de las dos organizaciones presentadas, que busca aprovechar las ventajas de ambas. Los registros se van almacenando en orden secuencial, pero este archivo cuenta con un ndice. El archivo ndice enlista las claves de cada grupo de registros almacenados y sus direcciones de disco correspondientes. Cuando se desea buscar un registro particular, la computadora inicia la bsqueda secuencialmente, identificando el principio del grupo de registros. Esta organizacin es ms rpida que la secuencial, pero no lo es tanto como el acceso directo. Es especialmente til cuado se requiere actualizar ocasionalmente grandes lotes de transacciones y se necesita disponer de acceso rpido y frecuente a los datos.

Ventajas y desventajas de los tipos de organizacin de archivos


Organizacin de Archivos Tipo Secuencial Ventajas Acceso eficiente a todos o gran parte de los datos. Menor uso de espacio de almacenamiento. Acceso rpido a registros especficos. Ms veloz que la secuencial, ms eficiente que la directa. Desventajas Acceso lento a registros especficos. Ineficiente acceso a la totalidad o gran parte de los registros. Mayor uso de espacio de almacenamiento. Menos eficiente que la secuencial, menos rpida que la directa.

Directa Secuencial de ndice

21

4.3. Modos de acceso. Consideremos un soporte de informacin que contiene un archivo. Se denomina modo de acceso a la forma en que el dispositivo que maneja el soporte se posiciona en un determinado lugar del mismo para realizar una operacin de lectura o escritura de un registro. Los dispositivos de disco magntico con frecuencia reciben el nombre de dispositivos de almacenamiento de acceso directo. Por otra parte, medios como las cintas magnticas se conocen como dispositivos de acceso secuencial. El acceso secuencial a un registro supone acceder inicialmente al primer registro del archivo y despus, consecutivamente, a todos los sucesivos hasta llegar al registro deseado. Los medios de almacenamiento secuencial, como la cinta magntica, no tienen direcciones de almacenamiento nicas que puedan dirigirse directamente. En cambio, los registros deben almacenarse y recuperarse utilizando u proceso secuencial. Los registros se graban uno tras otro en una secuencia predeterminada (en orden numrico, por ejemplo). El acceso directo, consiste en el posicionamiento sobre cualquier registro sin necesidad de haber accedido antes a los anteriores. En los archivos de organizacin directa este acceso se consigue proporcionando al dispositivo la posicin del registro que se desea acceder. En ocasiones es conveniente programar una funcin de aleatorizacin o hashing1, la cual permite calcular la posicin de cualquier registro a partir del valor de su clave. 4.4. Procesamiento de Archivos Secuenciales. Las operaciones bsicas que se permiten en un archivo secuencial son: escribir su contenido, aadir un registro al final del archivo y consultar sus registros. Creacin. La creacin de un archivo secuencial es un proceso secuencial, ya que los registros se almacenan consecutivamente en el mismo orden en que se introducen en el archivo. El mtodo de creacin de un archivo consiste en la ejecucin de un programa adecuado que permite la entrada de datos del archivo desde el terminal. El sistema usual es interactivo en el que el programa solicita los datos al usuario que los introduce por teclado, hasta que se introduce una marca de fin de archivo (EOF o FF) que supone el final fsico del archivo. En los archivos secuenciales, EOF o FF es una funcin lgica que toma el valor cierto si se ha alcanzado el final de archivo y falso en caso contrario. La operacin de crear un archivo tiene dos variantes: -. Crear el archivo original -. Aadir datos al archivo ya creado y a continuacin del ltimo registro del mismo La creacin del archivo requerir los siguientes pasos: Abrir el archivo Leer datos del registro Grabar registro Cerrar archivo

Consulta.
22

El proceso de bsqueda o consulta de una informacin se debe efectuar obligatoriamente en modo secuencial. As, para el caso de un archivo de n registros, el nmero de lecturas de registros efectuadas son: -. Mnimo 1, si el registro buscado es el primero del archivo -. Mximo n, si el registro buscado es el ltimo o no existe dentro del archivo Por trmino medio, el nmero de lecturas necesarias para encontrar un determinado registro es: n +1 2 Actualizacin. La actualizacin de un archivo supone: -. Aadir nuevos registros (altas) -. Modificar registros ya existentes (modificaciones) -. Borrar registros (bajas) Altas. La operacin de altas supone la creacin nueva del archivo, ya que un archivo secuencial no admite la incorporacin de nuevos registros. Bajas. Existen dos mtodos para dar de baja a un registro: -. Se utiliza un archivo transitorio -. Almacenar en un arreglo todos los registros del archivo, sealando con un indicador o bandera (flag) el registro que se desea dar de baja. Mtodo 1. Se crea un segundo archivo auxiliar, tambin secuencial, copia del que se trata de actualizar. Se lee el archivo completo registro a registro y en funcin de su lectura se decide si el registro se debe dar de baja o no. Si el registro se va a dar de baja, se omite la escritura en el archivo auxiliar o transitorio. Si el registro no se va a dar de baja, este registro se escribe en el archivo auxiliar. Tras terminar la lectura del archivo original, se tendrn dos archivos: original (o maestro) y auxiliar.
ARCHIVO ORIGINAL ARCHIVO AUXILIAR

ACTUALIZACIN

El proceso de bajas del archivo concluye cambiando el nombre del archivo auxiliar por el de maestro y borrando previamente el archivo maestro original. Mtodo 2.
23

Este procedimiento consiste en sealar los registros que se desean dar de baja con un indicador o bandera; estos registros no se graban en el nuevo archivo secuencial que se crea sin los registros dados de baja. Modificaciones. Consiste en localizar este registro, efectuar dicha modificacin y a continuacin reescribir el nuevo registro en el archivo. El proceso es similar al de bajas. 4.5. Procesamiento de Archivos Aleatorios. Creacin El proceso de creacin de un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en el soporte que los va a contener y en la direccin obtenida resultante del algoritmo de conversin. Altas Para dar de alta un registro, se debe introducir su nmero de orden y contenido Consulta Debe comenzar con la entrada del nmero o nmeros de registros a consultar. Las operaciones a realizar son: Bajas Se toma un campo indicador en el que su valor sea 0, y cuando exista, se pone a 1. Este tipo de baja es una baja lgica, que significa que, pese a usar un registro dado de baja, sigue ocupando el mismo espacio que si estuviera presente. Modificaciones Se localiza el registro que se desea modificar nmero de registro - ; se modifica el contenido y se reescribe

Resumen En la actualidad, la gestin de archivos se ha demostrado insuficiente para cubrir las necesidades de almacenamiento y proceso de datos. Los sistemas de informacin de las empresas son cada vez ms grandes y complejos, y su gestin mediante el uso de archivos presenta algunos inconvenientes, como el hecho de que los datos estn repartidos por distintos departamentos de la empresa, lo que supone tener que desplazarse o solicitarlos cada vez que se necesitan en un lugar diferente de donde se generan; adems, pueden estar repetidos varias veces, con el inconveniente de que su actualizacin dar lugar a inconsistencias si no se realiza en todos los lugares en que se ubican. Las aplicaciones que se creen debern tener en cuenta las distintas estructuraciones de los datos, y los cambios que se realicen tanto en hardware como en software presentarn numerosas complicaciones. Otro problema derivado de la dispersin de los datos radica en la dificultad para establecer sistemas de control y seguridad en los mismos.
24

Los sistemas de bases de datos pretenden dar solucin a los problemas expuestos mediante la integracin de los archivos de datos, de su estructura y de las aplicaciones que los manejan. BIBLIOGRAFIA

1. Senn, James A. Anlisis y Diseo de Sistemas de Informacin, Segunda Edicin, Mc Graw-Hill. Mxico, 2002 2. Cohen, Daniel y Asin, Enrique. Sistemas de Informacin para los Negocios. Un Enfoque de Decisiones, Mc Graw-Hill. Mxico,2000 3. Joyanes A., Luis. Fundamentos de Programacin. Algoritmos y Estructura de Datos. McGraw-Hill. Mxico, 1992 4. Ceballos, Francisco J. Manual para QuickBASIC 4.5. Gua del Programador. Macrobit. Mxico, 1990

25

You might also like