You are on page 1of 26

Universidade Federal Fluminense - UFF Plo Universitrio de Rio das Ostras - PURO Faculdade Federal de Rio das Ostras

- RFR Departamento de Cincia e Tecnologia - RCT

Banco de Dados Multimdia

Paula Ceccon Ribeiro Gabriel Givigier Guimares

Sumrio
1 Introduo 2 Motivao 3 Problemas 3.1 Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Indexao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Armazenamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Objetivos 5 Banco de Dados Multimdia 5.1 A Natureza dos Dados Multimdia . . . . . 5.2 Processamento de Dados Multimdia . . . . 5.3 Sistemas de Informao Multimdia . . . . . 5.4 Arquitetura do Banco de Dados Multimdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 6 6 7 7 8 9 9 10 11 11 17 18 19 21 22 24 25 26 27

6 Sistema de Gerenciamento de Banco de Dados Multimdia - SGBDMM 6.1 Cenrio dos SGBDs Multimdia . . . . . . . . . . . . . . . . . . . 6.2 Conceitos e Caractersticas dos SGBDs Multimda . . . . . . . . 6.3 Requerimentos para um SGBD Multimdia . . . . . . . . . . . . . 6.4 Sistemas Comercias para Gerenciamento de Informaes Multimdias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Aplicaes 8 Concluso 9 Organizao do Trabalho Referncias Bibliogrcas

Introduo

A necessidade cada vez mais acentuada de criar sistemas de informao capazes de gerenciar, de forma integrada, diferentes tipos de dados complexos, no convencionais, como texto livre, imagem, vdeo e som um desao aos especialistas em modelagem de dados e aos que desenvolvem sistemas aplicativos. Atualmente, a utilizao de imagens, principalmente em associao com informaes textuais, relevante na maioria das reas do conhecimento humano. A importncia da representao ecaz de dados complexos reete-se nas novas verses dos sistemas de gerenciamento de banco de dados (SGBDs). Os modernos SGBDs buscam implementar modelos de dados mais abrangentes, como o orientado a objetos ou o relacional estendido. Esses modelos so capazes de agregar diversos tipos de dados complexos mantendo, ao mesmo tempo, vantagens como segurana, independncia, compartilhamento, controle de redundncia e integridade de dados oferecidas atualmente pelos SGBDs baseados no modelo de dados relacional. Em paralelo, as linguagens de programao e as ferramentas para gerao de aplicaes esto se especializando no processamento de dados complexos. Nesse trabalho so discutidas as caractersticas e as tendncias dos SGBDs no mbito do armazenamento e recuperao de dados complexos.

Motivao

A cada dia que se passa mais importante e necessrio se torna a utilizao de dados multimdia. Com a criao de dispositivos de captura de imagem, como cmeras digitais, que lmam e/ou tiram fotos, cada vez mais pequenas, leves, potentes e baratas, se tornou muito comum o armazenamento deste tipo de dados em computadores. Bem como a internet, que tambm tem muito deste tipo de dado. Abaixo so citados alguns cenrios que ilustram o potencial de utilizao do banco de dados multimdias: Um mdico busca curar um paciente que tem um tumor cerebral. Atravs de avanados exames utilizando computadores como a tomograa e a ressonncia magntica imagens da cabea do pacientes so digitalizadas, armazenadas num banco de dados e comparadas com imagens e diagnsticos de outros pacientes com patologia semelhante. Podem tambm ser analisadas as tcnicas cirrgicas utilizadas em cada caso. Modelos tridimensionais projetados em um monitor auxiliam o mdico a planejar o caminho de seus instrumentos cirrgicos. Tambm pode-se ter outros mdicos ajudando, atravs de uma vdeo conferncia, constituindo assim uma junta mdica virtual. Finalmente, as informaes da cirurgia, imagens, grcos, vdeos, diagnsticos gravados em udio, so armazenados em um banco de dados, que poder ser acessados por outros medicos para ns de consultas; Um estudante realizando uma pesquisa na internet, acha um banco de dados onde se tem milhares de documentos, imagens, vdeos, animaes, sobre a histria de seu pas. Ele pode tambm aplicar ltros dentro do banco de dados para buscar somente o que interessa em sua pesquisa. Sendo que ao mesmo tempo outros estudantes podero estar aplicando outros tipos de ltros para buscar outras informaes no mesmo banco de dados; Cenas em Virtual Reality Modeling Language - VRML - permitiram que uma pessoa no Brasil, atravs de seu computador pessoal, visite o museu do Louvre em Paris escolhendo seu prprio percurso e as obras de arte de seu interesse. O observador poder escolher o ngulo e a distncia de observao de cada objeto. Em muitos aspectos sua percepo poder ser mais completa que a de um visitante no prprio museu. Tudo isto atravs de um ambiente tridimensional; Um banco de dados multimdia tem apresentaes embutidas. Quando um usurio invoca uma apresentao, uma demonstrao audiovisual 4

ativada, ilustrando vrios aspectos de algum assunto de interesse, por exemplo: automveis. Pode ser mostrada a histria, o desenvolvimento do automvel, os modelos mais recentes, etc. Todos os cenrios acima descritos pressupem o acesso simultneo e em tempo real a vrios tipos de dados complexos constitudos de texto, imagens, animaes, vdeos e udio. Assim, para que esses cenrios se tornem realidade e isso j est acontecendo - necessria a existncia de sistemas gerenciadores de banco de dados capazes de armazenar e gerenciar dados complexos, da mesma forma que ocorre atualmente com os sistemas de gerenciamento de banco de dados relacionais convencionais e de linguagens e interfaces capazes de processa-los. O SGBD considerado o corao do banco de dados multimdia.

Problemas

A pesquisa em Banco de Dados Multimdia torna-se muito abrangente, incorporando ao seu resultado arquivos de msica, vdeo, texto e imagem. Entretanto, a pesquisa de contedo em dados contnuos uma tarefa de alta complexidade. Algoritmos que separam os arquivos do banco de dados em segmentos e os compara com o dado pesquisado, ou ainda a comparao do timbre de voz entre arquivos de udio, so necessrios para uma busca mais prxima possvel com termo desejado. Para que a pesquisa seja eciente, a indexao deve conter o maior nmero possvel de caractersticas em relao ao contedo do dado. H duas maneiras de se analisar: manual ou automaticamente. A anlise automtica realiza operaes especcas para cada tipo de mdia e consiste na identicao de caractersticas matemticas do contedo. A anlise manual possui a mesma tcnica para todos os tipos de mdia, o dado analisado por uma pessoa que identica e registra as caractersticas presentes. Alm dos problemas relacionados pesquisa e identicao do contedo, o armazenamento de arquivos de vdeo, udio ou imagens muito custoso quando comparado aos tradicionais bancos de dados. Para contornar essa situao, alguns algoritmos de compactao so utilizados, transformando os arquivos originais em arquivos de menor tamanho com qualidade prxima.

3.1

Pesquisa

A busca de imagens em um banco de dados pode ser feita por um segmento da imagem. O SGBD pesquisa esse segmento nas outras imagens no banco, e caso ache elementos que contenham esse padro, exibe o resultado. Pode-se usar uma funo distncia para comparar as medidas das imagens, se a distncia entre elas for pequena, as imagens podem ser semelhantes. H tambm a tcnica de transformar clulas de imagens, atravs de rotao, traduo e outros mtodos, e comparar a semelhana das imagens. Segundo [4] essa tcnica mais demorada e difcil. Os arquivos de udio podem ser pesquisados atravs da comparao com trechos que estejam contidos. Transformaes simples podem ser feitas para que, por exemplo uma msica seja encontrada. Devem ser considerados rudos e disperses. A pesquisa textual apesar de ser de mais fcil implementao, e similaridade com os SGBDs convencionais, apresenta resultados insatisfatrios devido a limitao da descrio textual.

3.2

Indexao

A indexao feita preocupando-se na futura recuperao dos dados. Os SGBDs so responsveis por catalogar caractersticas, utilizando tcnicas diferentes para cada tipo de mdia. Vdeos so segmentados em quadros contguos que representam os mesmos objetos. Os quadros inicial e nal representam um segmento, os objetos presentes nos quadros representam caractersticas do vdeo e so usados na indexao. Arquivos de texto so de mais simples indexao, o processo bsico consiste em separar palavras-chave em conjunto com a quantidade de vezes que a mesma aparece no arquivo. As palavras mais relevantes so utilizadas como caracterstica do texto. As imagens so agrupamentos de pixels, um pixel representa caractersticas da imagem e pode ser utilizado na indexao.

3.3

Armazenamento

A necessidade de armazenar vdeos, udios e imagens obriga que o banco de dados possua grande capacidade. Bancos de dados tradicionais lidam com alfanumricos que ocupam da ordem de kbytes, Bancos de Dados Multimdia operam sobre arquivos da ordem de gbytes. A soluo para trabalhar com esse grande volume de dados a compactao. Essa tcnica reduz o tamanho do arquivo original mantendo suas caractersticas. Existem diversos padres de compactao, para vdeos temos o MPEG e o AVI, para udios o MP3 e o WMA, entre outros. Os dados podem ser armazenados em campos do tipo BLOB, no qual os dados so representados em binrio. Apesar de vrios SGBDs oferecerem suporte a esse tipo, no mesmo, a semntica ca prejudicada.

Objetivos

Aplicaes que envolvam vrios tipos de mdia necessitam mais do que apenas descrio textual, o tratamento dos arquivos tanto na indexao quanto na recuperao torna-se mais complexo, porm, de grande importncia para tirar mximo proveito dos mesmos. Esse tratamento envolve a utilizao de algoritmos para compactao e um SGBD que controle o acesso essas informaes. O domnio dessas tcnicas permite a criao de aplicaes com um banco de dados muito abrangente, e que permitem o avano de reas como a medicina e a militar. Futuramente, com o aumento na velocidade da internet, as casas tero acesso a aplicaes de multimdia interativa. O conceito de banco de dados multimdia visa fornecer mais elementos de pesquisa ao usurio. Exemplo: Um usurio quer buscar um vdeo em que o jogador Phil Ivey fez um straight em uma mesa nal do WSOP. Em uma pesquisa tradicional a busca seria feita pelo ttulo e pela descrio geral o vdeo. J na busca em banco de dados multmidia, o usurio poderia digitar Straight do Phil Ivey no WSOP, visto que o vdeo possui a descrio de cada cena e o SGBD sabe interpretar esse tipo de pesquisa, a busca retornar o resultado esperado. Outro objetivo o armazenamento de grandes volumes dados para criao de ambientes virtuais. Exemplo: Uma empresa deseja exibir, atravs de uma aplicao, aspectos das construes Maia. A empresa armazena os dados referentes s construes e o usurio decide se quer visualizar um templo, um observatrio astronmico, ou quem sabe uma pirmide. A pesquisa por supeitos poder ser feita atravs da comparao da sionomia com o banco de dados policial. Suspeitos acusados de falsidade ideolgica poderiam ser identicados atravs da atual sionomia, o banco de dados dever suportar possveis mudanas de aparncia, atravs de uma pesquisa em um banco de dados nacional.

5
5.1

Banco de Dados Multimdia


A Natureza dos Dados Multimdia

Para entendermos melhor os requisitos para um gerenciador de banco de dados multimdia necessrio conhecermos os tipos de dados que so armazenados. Dados complexos, constitudos preponderantemente de imagem, vdeo e texto livre so diferentes dos dados alfanumricos clssicos, em termos tanto de apresentao quanto de semntica. Inmeras entidades de informao, em diversas reas de aplicao, podem ser vistas como dados complexos como, por exemplo, mapas cartogrcos, plantas de engenharia, formulrios, esquemas de um projeto industrial e documentos. A composio e as caractersticas dos dados multimdia podem ser analisadas sob vrias perspectivas e propriedades a eles inerentes, como: Sobrecarga de informao; Inadequabilidade de descries textuais; Multiplicidade; Natureza espacial e temporal; Gasto com grandes volumes de armazenamento. Os tipos de dados multimdia mais comuns, normalmente encontrados nos bancos de dados multimdia e nos sistemas de informao multimdia so: Texto Livre; Grcos; Imagem; Animao; Vdeo; udio; Composto (combinao de dois ou mais tipos citados acima); Apresentao.

Alguns tipos de dados multimdia como seqencias de vdeo, animao e udio ainda possuem requerimentos temporais que tm implicaes em seu armazenamento, manipulao e apresentao. Essas caractersticas tornam-se mais crticas quando vrios tipos de dados, oriundos de diversas fontes, precisam ser apresentados durante um intervalo de tempo. Por outro lado, imagens, grcos e vdeos possuem restries espaciais em termos do seu contedo. Normalmente, objetos individuais em uma imagem guardam algum relacionamento espacial entre si. Tais relacionamentos iro produzir algumas restries com relao pesquisa por algum objeto, em um banco de dados. O grande consumo de espao para o armazenamento, caracteriza o dado multimdia. Outro fator importante a considerar o trfego de grandes quantidades de dados multimdia pela rede, por uma grande distncia. Assim, considera-se as ferramentas de compactao muito importantes para o armazenamento e o transporte de dados multimdias.

5.2

Processamento de Dados Multimdia

Devido a sua estrutura complexa, o dado multimdia requer um processamento mais elaborado se para extrair informaes de seu contedo. Objetos do mundo real mostrados em imagens, vdeos, grcos e animaes participam de eventos signicativos cuja natureza freqentemente objeto de pesquisas. Usando os avanos tecnolgicos nos campos de processamento de imagem e reconhecimento de voz, os sistemas devem reconhecer objetos e eventos similares do mundo real atravs da extrao de certas informaes dos objetos multimdia correspondentes. Uma srie de fatores diferenciam e tornam signicativamente mais complexo o processamento de dados multimdia quando comparado ao processamento de dados convencionais. Observa-se as seguintes particularidades: O contedo do dado multimdia capturado por tcnicas variadas, diferentes entre si (por exemplo: o processamento digital de imagens). Tcnicas de processamento de dados multimdia devem ser capazes de executar diferentes tipos de captura de contedo, seja automticos ou manuais; Pesquisas executadas em bancos de dados multimdia geralmente no podem ser retornadas apenas com uma resposta textual. A resposta a uma consulta pode ser uma apresentao multimdia complexa; Usurios de um sistema de banco de dados necessitam navegar pela apresentao multimdia reformulando incrementalmente suas pesquisas. Em outras palavras, um usurio que submete uma pesquisa pode desejar 10

modic-la e importante que seja possvel alterar de forma incremental a apresentao multimdia original de modo a permitir seu reuso, no criando uma nova apresentao desde o incio.

5.3

Sistemas de Informao Multimdia

Os principais objetivos de um sistema de informao multimdia so: organizar, apresentar e sincronizar dados multimdias para ambientes interativos. Organizao, sincronizao e interao so elementos crticos em ambientes multimdia. A independncia de dados entre a aplicao multimdia e o armazenamento fsico dos dados geram benefcios signicativos. Quando o contedo de uma aplicao multimdia controlado pelo gerenciador de banco de dados, essa aplicao torna-se extremamente adaptvel s mudanas nos dados, ou seja, as informaes multimdia podem ser atualizadas, eliminadas ou includas sem necessidade de se alterar o sistema. Do ponto de vista tecnolgico, sistemas de informaes multimdia, como qualquer sistema de informao, envolvem dois conjuntos ou categorias de programas como ilustrado na Figura 1. Onde um deles se refere ao armazenamento e gerenciamento da informao multimdia e o outro ao seu processamento, sendo que a interseo destes conjuntos caracteriza o domnio dos sistemas de informao multimdia.

Figura 1: Sistemas de Informao Multimdia O conjunto da direita engloba o armazenamento, a pesquisa, a recuperao e a atualizao dos dados multimdia. constitudo pelos sistemas de gerncia de banco de dados multimdia, que permitem a criao e a manuteno dos bancos de dados. O conjunto da esquerda envolve as ferramentas para a construo dos sistemas de informao multimdia utilizado pelos desenvolvedores e as ferramentas para a apresentao e tratamento dos variados tipos de dados multimdia. So as linguagens, os geradores de aplicaes, as interfaces 11

de apresentao, os produtos para processamento de imagens, udio, vdeo e textos.

5.4

Arquitetura do Banco de Dados Multimdia

O Banco de Dados Multimdia pode ser organizado de trs maneiras: segundo os princpios de autonomia, princpios de uniformidade ou princpios de organizao hbrida. A seguir sero apresentados cada um desses princpios: 1. O Princpio de Autonomia: as imagens, os videos e os documentos, so organizados dentro de uma mdia - especca para cada tipo de mdia. A Figura 2 mostra diagramas de diferentes tipos de dados de mdia organizados de acordo com o princpio de autonomia.

Figura 2: Arquitetura de Banco de Dados Multimdia com o Princpio de Autonomia

2. O Princpio de Uniformidade: usada uma nica estrutura Aonde so indexados todos os tipos de mdia (imagem, vdeo, documento, udio, etc.). A Figura 3 mostra um diagrama conceitual de tipos diferentes de dados de mdia organizados de acordo com o princpio de uniformidade. 3. O Princpio de Organizao Hbrida: uma terceira possibilidade usar o princpio hbrido. De acordo com este princpio, certos tipos de mdia 12

Figura 3: Arquitetura de Banco de Dados Multimdia com o Princpio de Uniformidade

usam os prprios ndices, enquanto outros usam ndices unicados. A gura 4 presenta essa estrutura. Todas as trs representaes apresentam vantagens e desvantagens. A arquitetura baseada no princpio de autonomia requer a criao de algoritmos e uma estrutura de dados para cada tipo de mdia individual. Alm disso, precisase de uma tcnica que une estruturas de dados diferentes. Esta poderia ser uma tarefa complexa e diligente, pois requer muito esforo computacional. Por outro lado, a criao de estruturas especializadas torna ecaz o acesso a cada mdia e um bancos de dados multimdia organizado de acordo com o princpio de autonomia conduz a um tempo de processamento de consulta rpido. Alm disso, no caso de muitos bancos de dados legados onde estruturas de dados e algoritmos para uma mdia especca j exista, o princpio de autonomia pode ser uma boa escolha. As tcnicas orientadas a objeto so bem adaptadas para implementar o princpio de autonomia, tratando cada fonte de dados de mdia como um objeto, cujos mtodos so acessveis ao banco de dados multimdia global. Em contraste com o princpio de autonomia, est o principio de uniformidade, que uma estrutura de dados comum que pode armazenar informao sobre o 13

Figura 4: Arquitetura de Banco de Dados Multimdia com o Princpio da Organizao Hbrida

contedo de imagens, vdeos, documentos, udio, entre outros. Isto requer que examinemos o contedo de cada tipo de mdia e tentemos encontrar sadas comuns entre esses tipos, e ento construir um ndice baseado na parte comum identicada. As principais vantagens do princpio de uniformidade so: Facilidade de implementao- muito fcil Algoritmos resultantes rpidos A principal desvantagem que as anotaes devem ser criadas de algum modo - manualmente ou automaticamente. Um processo de criao manual pode ser caro e demandar muito tempo. Alm disso, algumas informaes podem ser perdidas, como por exemplo se a linguagem para as anotaes no for expressiva o suciente para capturar todos os aspectos do contedo. O princpio de organizao hbrida possui boas caractersticas das duas arquiteturas citadas anteriormente, enquanto algumas das desvantagens so eliminadas. Suponha que desejamos criar um banco de dados multimdia que consiste em tipos de mdia M1 ,..., M . Consideremos o seguinte: 1. Esses tipos de mdias so fontes legadas e j possuem um ndice e um algoritmo para manipular estes ndices. Neste caso, aproveita-se estes ndices e o algoritmo existente. 14

2. Esses tipos de mdias no so fontes legadas e no possuem nenhum ndice (e conseqentemente nenhum algoritmo para manipular o ndice). Neste caso, ser recomendado usar a aproximao de representao uniforme (a menos que a perda de informao fsica detalhada, como textura de pixels individuais, seja crtica aplicao). Assim, criado um cdigo para executar a unio de fontes de mltiplos dados usando os ndices nativos. Esta aproximao conduz a uma economia de cdigo, enquanto minimiza o esforo adicional gasto, pois so utilizados domnios de ndices especcos. Por exemplo, um usurio pode fazer uma consulta que Ache todos os clipes de imagens e udio no qual o chefe de Joo visto (imagem) e ouvido (udio) falando com Jos. Esta consulta envolve multi-indexao, ou seja, so acessados uma imagem no banco de dados (atravs de um ndice de imagem),um udio no banco de dados (atravs de um ndice de udio), e um banco de dados relacional (atravs de um ndice relacional). Pode ser expressado como:
1 2 3 4 5 6 7

SELECT name , image , a u d i FROM e m p l o y e e E , ImageDB I , AudioDB A WHERE E . name = J o a o AND I CONTAINS E . b o s s AND A CONTAINS E . boss , AND A CONTAINS J o s e

15

Sistema de Gerenciamento de Banco de Dados Multimdia - SGBDMM

O desenvolvimento dos sistemas de gerncia de banco de dados - SGBDs foi de fundamental importncia para o incremento do uso da informtica, principalmente em aplicaes com grande volume de dados, com nfase nas reas administrativas e de negcios. Os SGBDs foram inicialmente projetados, a partir da segunda metade desse sculo, para armazenar e manipular grandes volumes de dados alfanumricos, bem formatados e comportados, voltados predominantemente para aplicaes nanceiras e comerciais. Os controles operacionais dessas ferramentas, como concorrncia, integridade, recuperao e segurana, eram tpicos de um ambiente comercial, estabelecendo assim um paradigma comercial que orientou a maioria das pesquisas em banco de dados . A possibilidade de compartilhar informaes em um nico banco de dados permitindo que ao mesmo tempo cada usurio tenha a sua prpria viso dos dados como se fosse o nico a utilizar o banco de dados, alm das facilidades de acesso, manuteno, controle e segurana supridos pelos SGBDs, tornaram essas ferramentas imprescindveis para os modernos sistemas de informao corporativos automatizados. O modelo de dados relacional, denido por CODD, que est sedimentado em base matemtica e denido com muito mais rigor e formalismo que os modelos hierrquicos e de rede que o precedem, domina atualmente a implementao dos SGBSs disponveis comercialmente, como por exemplo, Oracle R , Sybase R , Informix R , DB2 R , Ingres R , PostegreSQL, MySql, produtos lderes de mercado, todos baseados no modelo relacional. Atualmente, a maioria dos sistemas de gerenciamento de banco de dados oriundos do modelo de dados relacional suporta basicamente o tipo de dado clssico constitudo de cadeias no muito grande de nmeros, letras e caracteres e so restritos quando se trata de administrar outros tipos de dados. Entretanto, toda a organizao armazena e utiliza, alm dos dados clssicos, um variado conjunto de dados de carter mais complexo na forma de documentos, diagramas, plantas, mapas, fotograas, udio e vdeo. Esses dados necessitam de estruturas de armazenamento e gerenciamento, que permitam pesquisa, acesso concorrente, atualizao e manuteno de forma consistente e eciente. A exigncia dessas estruturas tem mais nfase se atentarmos que os modernos sistemas de informao multimdia so normalmente distribudos atravs de extensas arquiteturas de rede, como a internet. Um dos desaos para os pesquisadores e a indstria de banco de dados prover suporte ecaz pelos SGBDs a tipos de dados contendo udio, vdeo, 16

imagens e textos livres.

6.1

Cenrio dos SGBDs Multimdia

A utilizao de SGBDs para gerenciar dados complexos no s uma necessidade como tambm uma tendncia crescente e que vem ocorrendo em paralelo ao desenvolvimento da capacidade dos softwares, redes de comunicao e computadores para processar estes dados. A medida que a concorrncia industrial reduz custos e aumenta a funcionalidade dos produtos, a multimdia vem ganhando terreno, tornando-se presente no nosso dia-a-dia. Tendo em vista que a tecnologia de banco de dados est evoluindo, o conceito restrito e tradicional de SGBD se estendeu, dando lugar a ambientes de ferramentas integradas em torno do ncleo bsico, o gerenciador de banco de dados. Tais ambientes favorecem o surgimento de aplicaes de alto nvel, com considervel melhoria na interface com o usurio. Se considerarmos que os sistemas de gerncia de banco de dados multimdia - SGBDMM - so capazes de agregar vrios tipos de dados complexos, deve-se prover as mesmas facilidades como segurana, compartilhamento, independncia, integridade e controle de redundncia de dados oferecidados pelos SGBDs convencionais. As primeiras pesquisas em gerenciamento de dados complexos contemplavam apenas imagens e vdeo, porm, com o passar do tempo, estes estudos forem se estendendo para outros tipos de dados complexos. O incio dos estudos de desenvolvimento de SGBDs para o armazenamento e o gerenciamento de dados complexos datam da dcada de 80, e ainda hoje se tem muitos estudos e trabalhos que tentam desenvolver sistemas cada vez mais ecientes para o armazenamento e o gerenciamento de tais informaes. Dentre os novos tipos de dados a serem armazenados nos banco de dados, as imagens so um bom exemplo para contar a histria dos SBGDs multimdia. Pesquisadores partiram para o desenvolvimento de tcnicas que melhorassem a representao da imagens. Inicialmente, esta representao foi buscada atravs da utilizao do modelo relacional e em seguida com a adoo do modelo relacional estendido e do modelo orientado a objetos. No modelo relacional, um tipo de dado complexo e seu contedo so representados com uma srie de tuplas sobre vrias relaes. Os pesquisadores acreditavam que a maioria das tcnicas relacionais desenvolvidas para indexao, otimizao de pesquisas, gerenciamento de memria, controle de concorrncia, recuperao e segurana funcionavam bem para os novos tipos de dados. Porm, aps vrias experincias com dados complexos, revelou-se a fraqueza inerente a esta proposio. Isto porque existe um descompasso entre a natureza do dado multimdia e a maneira que, no modelo relacional, os usurios e os sistemas so forados a pesquisar e operar este dados. O modelo de dado relacional, assim 17

como outros, precisa ser estendido para gerenciar com ecincia dados multimdia.

6.2

Conceitos e Caractersticas dos SGBDs Multimda

O sistema de gerncia de banco de dados multimdia o cerne de um sistema de informaes multimdias e pode ser estendido como o conjunto de programas e rotinas usadas para denir, criar, armazenar, indexar, gerenciar e pesquisar banco de dados multimdia. Banco de dados multimdia uma coleo controlada de tens de dados multimdia como imagem, udio e vdeo, sendo que o propsito de um SGBD multimdia organizar, classicar e pesquisar no banco de dados multimdia. Neste contexto, um SGBD multimdia deve prover suporte para os dados multimdia da mesma forma que um SGBD tradicional suporta dados alfanumrico simples. Na verdade, os diferentes tipos de dados complexos envolvidos em um banco de dados multimdia requerem mtodos especiais para gerenciamento, armazenamento, acesso, indexao e recuperao dos dados, tornando o SGBDMM ferramenta mais sosticada que o SGBD tradicional. Sendo o processamento de pesquisas em ambiente multimdia mais complexo do que em banco de dados alfanumricos, os resultados de uma pesquisa nem sempre so baseados em perfeita semelhana, mas em graus de similaridade. Por exemplo: recuperar todas as fotos de pessoas que aparecem com um determinado retrato falado. Um SGBD multimdia prov um ambiente favorvel ao uso e gerncia de banco de dados multimdia. Portanto, ele deve dar suporte aos vrios tipos de dados multimdia, em adio ao atendimento de facilidades providas pelas funes dos SGBD tradicionais, tais como denio e criao de um banco de dados, recuperao de dados, acesso a dados, independncia de dados, privacidade, integrao, controle de integridade, controle de verso e suporte a concorrncia. Em resumo, as funes de um SGBD multimdia refazem e estendem aquelas de um SGBD tradicional. Usando as funes gerais providas por um SGBD tradicional como guia, pode-se descrever os propsitos gerais de um SGBD multimdia como sendo os seguintes: Integrao de dados: garante que os tens de dados no necessitem ser duplicados durante a invocao de diferentes programas. Independncia de dados: permite a separao entre as funes de gerncia do SGBD e os programas de aplicao. primeira vista a importncia 18

de independncia dos dados parece bvia, entretanto as necessidades de um SGBD multimdia de garantir a independncia de dados entre a aplicao lgica e o armazenamento fsico tem benefcios signicativos, como otimizar o armazenamento, pesquisa e recuperao dos dados, uma vez que o SGBD tem conhecimento da estrutura e da localizao do dado armazenado. Controle de concorrncia: garante consistncia do banco de dados multimdia atravs de regras que usualmente impem alguma forma de ordem de execuo em transaes concorrentes. Uma caracterstica de banco de dados multimdia que a interao com esse tipo de informao normalmente envolve operaes de longa durao (como exemplo a apresentao de uma seqncia de vdeo) e com mais de um usurio simultneo, como tpico em ambientes colaborativos, como treinamento a distncia e videoconferncias. Adota-se, em muitos desses casos, o acesso apenas para visualizao e no para alterao, para facilitar o uso de algoritmos para controle de concorrncia. Essa simplicao possvel porque nos atuais ambientes de bancos de dados multimdia as atualizaes no so freqentes. Persistncia: trata-se da habilidade dos objetos persistirem (sobreviverem) atravs de transaes e invocaes de programas diferentes. Para conseguir persistncia, um mtodo simples armazenar os arquivos multimdia em algum arquivo do sistema operacional. Contudo, os enormes volumes de dados impem um custo elevado para a sua implementao. Alm disso, o sistema tambm precisa armazenar metadados e possivelmente objetos multimdia compostos. Por isso, a maioria dos SGBDs multimdia classicam os dados em persistentes ou transientes e armazenam somente os dados persistentes depois de uma transao de modicao. Dados transientes somente so usados durante execuo de programas ou transaes e so removidos em seguida. Controle de acesso: restringe acesso e modicao no autorizados aos dados armazenados. Controle de integridade: garante consistncia dos estados do banco entre transaes. Recuperao: mtodos que garantem que falhas na execuo de transaes no afetem a persistncia dos dados multimdia armazenados. Processamento de pesquisa: garante que os mecanismos de pesquisa sejam apropriados para dados multimdia. Tradicionalmente, uma pesquisa 19

seleciona um subconjunto de itens de dados baseados na descrio textual pelo usurio do dado a ser acessado. Operaes de pesquisa e recuperao de dados so crticas em multimdia e precisam ser ecientes e poderosas. Uma pesquisa, usualmente, envolve vrios atributos, possivelmente baseados em palavras chaves ou orientados a contedo e usualmente interativa. Controle de verso: organizao e gerncia de diferentes verses de objetos persistentes, as quais podem ser requeridas pelas aplicaes. Este conceito importante no caso de um objeto multimdia persistente ser atualizado ou modicado, ou quando algumas aplicaes precisam ter acesso ao estado anterior do objeto.

6.3

Requerimentos para um SGBD Multimdia

Um sistema gerenciador de banco de dados multimdia, de acordo com a natureza heterognea do dado multimdia, deve suportar os seguintes requerimentos bsicos: Mtodos de indexao, pesquisa e organizao de dados multimdia: pesquisas em bancos de dados multimdia so computacionalmente onerosas, principalmente se pesquisa por contedo for utilizada para dados como vdeo e imagem. Sincronizao e integrao de diferentes tipos de dados multimdia: o suporte para requisies assncronas uma caracterstica importante dos SGBDs multimdia. Linguagens formais de pesquisa em ambiente multimdia: essas linguagens devem ter capacidade para expressar semntica complexa e as relaes espaciais e temporais associadas a informao multimdia composta. Estruturas ecientes de armazenamento de dados: essas estruturas so necessrias para gerenciar dados multimdia principalmente em aplicaes de alto desempenho. Integrao e suporte ao sistema operacional: a arquitetura de um sistema gerenciador de banco de dados multimdia precisa suportar um amplo conjunto de funcionalidades computacionais e de gerncia de dados. O sistema operacional tambm precisa suportar requerimento de dados multimdia. 20

Gerenciamento de bancos de dados multimdia distribudos: em um ambiente de rede necessria a capacidade de coordenao e gerenciamento entre as localizaes distribudas para possibilitar o acesso transparente e rpido aos dados multimdia pelos diversos usurios distribudos. Tcnicas de modelagem formais para dados multimdia: A representao lgica, o relacionamento dos objetos multimdia e as caractersticas que podem ser extradas de cada objeto domnio da modelagem de dados multimdia. Os modelos de dados precisam ser sucientemente ricos para capturar a semntica do dado multimdia. Devem ser capazes de prover representao cannica para imagens, cenas e eventos em termos de objetos e seu comportamento especial e temporal. Um modelo de dados multimdia deve capturar as seguintes informaes: A estrutura detalhada dos objetos multimdia; As operaes pertinentes aos objetos multimdia; As propriedades dos objetos multimdia; Os relacionamentos entre os objetos multimdia e os objetos do mundo real; Propriedades, relacionamentos e operaes em objetos do mundo real.

6.4

Sistemas Comercias para Gerenciamento de Informaes Multimdias

Como consta, no existem SGBDs projetados com a nalidade nica de gerncia de dados multimdia e, portanto, no existe um SGBD que tenha a extenso de funcionalidades exigidas para suportar completamente todas as aplicaes de gerncia de informaes multimdia. No entanto, vrios SGBDs suportam tipos de dados multimdia, entre eles: 1. Informix Dynamic Server 2. DB2 3. Universal database (UDB) da IBM 4. Oracle 8.0 21

5. CA-JASMINE 6. Sybase 7. ODBII Todos os SGBDs citados acima dispem de suporte para objetos, o que essencial para se modelar uma variedade de objetos multimdia complexos. Um dos problemas encontrados em relao a esses sitemas que blades, cartridges e extensores para se lidar com dados multimdia so projetados de uma maneira extremamente ad-hoc: funcionam mas no se preocupam com a ecincia. Operaes em multimdia precisam se tornar padronizadas e extensveis. Se as operaes bsicas forem padronizadas, os pesquisadores podem trabalhar para torn-las ecientes, se forem extensivas, operaes complexas podem ser denidas atravs das operaes mais simples, preservando a ecincia.

22

Aplicaes

As aplicaes de um banco de dados multimdia podem variar entre as diferentes reas existentes. Como exemplo podemos citar algumas aplicaes: Gerenciamento de documentos e registros: um grande nmero de indstrias e negcios mantm registros muito detalhados e uma variedade de documentos. Os dados podem incluir projetos de engenharia e dados sobre produo, registros mdicos de pacientes, artigos para publicao e registros de reivindicaes de prmios de seguros; Disseminao de conhecimento: o modo multimdia, um meio bastante eciente de disseminao de conhecimento, ir abranger um crescimento fenomenal em livros, catlogos, manuais e enciclopdias eletrnicas, bem como repositrios de informaes em muitos tpicos; Educao e treinamento: o ensino de matrias para diferentes tipos de pblico, desde alunos do jardim-de-infncia, passando por operadores de equipamentos e chegando a prossionais, pode ser projetado a partir de recursos multimdia. Espera-se que bibliotecas digitais tenham uma importante inuncia no modo como futuros alunos e pesquisadores, bem como outros usurios, iro acessar vastos repositrios de matrias pedaggicas. Marketing, propagandas, vendas no varejo, entretenimento e turismo: praticamente no existem limites para a utilizao de informaes multimdias nessas aplicaes, desde apresentaes ecazes de vendas at excurses virtuais em cidades e galerias de arte. A indstria cinematogrca j mostrou a ecincia dos efeitos especiais ao criar animaes em animais, aliengenas e efeitos especiais articialmente projetados. A utilizao de objetos armazenados pr-projetados em banco de dados multimdia ir expandir a extenso dessas aplicaes; Controle e monitoramento em tempo real: em conjunto com a tecnologia de banco de dados ativos, a apresentao multimdia de informaes pode ser um meio bastante eciente de se monitorar e controlar tarefas complexas, como operaes, usinas nucleares, pacientes em unidades de terapia intensiva e sistemas de transporte.

23

Concluso

Podemos observar que existe um interesse crescente em torno da computao multimdia. E esse interesse se estende, mas no se limita, a vrios ramos da Cincia de Computao, como redes de computadores, banco de dados, computao distribuda, compresso de dados, processamento de documentos digitais, computao grca, interface homem/mquina, reconhecimento de padres, realidade virtual e inteligncia articial. Assim se v a importncia de um banco de dados multimdia, pois recursos como requisio de dados com base similares e a entrega dos dados em taxas constantes so tpicos de pesquisa em andamento. A tendncia que a utilizao desse tipo de banco de dados aumente, uma vez que hoje o usurio comum possui grande volume de dados multimdia em seu computador pessoal, no qual poder estar se utilizando um banco de dados multimdia para o gerenciamento e armazenamento deste tipo de dado.

24

Organizao do Trabalho

A seo Introduo dene o que so dados multimdia(complexos) e fornece uma breve descrio dos objetivos dos SGBDs Multimdia. A seo dois cita cenrios que motivam o avano nas tcnicas de representao de dados complexos. A seo Problemas fornece os principais problemas referentes pesquisa, indexao e armazenamento. A seo quatro expe objetivos referentes aos Bancos de Dados Multimdia, entre eles fornecer mais elementos de pesquisa ao usurio e criao de ambientes virtuais. A seo Banco de Dados Multimdia cita caractersticas dos dados multimdia, fornece caractersticas dos dados complexos e mostra porque so de mais difcil tratamento. Alm disso dene objetivos de um sistema de informao multimdia, como organizao, sincronizao e interao. Os princpios de autonomia, uniformidade e de organizao hbrida so explicados na parte de Arquitetura do Banco de Dados Multimdia. A seo SGBDMM narra um pouco da histria dos SGBDs e informa o andamento das pesquisas referentes aos SGBDMM. Tambm cita recuperao, integridade, pesquisa, indexao e outras caractersticas que tanto um SGBD quanto um SGBDMM devem possuir. A seo sete cita reas onde os dados multmidia so de grande valia, alm de fornecer exemplos. E por m, a seo de Concluso exprime a opinio dos autores em relao ao tema.

25

Referncias
[1] Margareth Maria M. Dantas Tito G. Ogando Daniel Nunes, Igor N. Santos. Banco de dados multimdia. Technical report, UFB Universidade Federal da Bahia, 2006. [2] Ramo Corso Diego Rocha Cceres, Delmar Henrique Backes Junior. Banco de dados multimdia. Technical report, FIT - Faculdade de Informtica de Taquara, 2005. [3] Dayana De Biazi e Luiz Jos Homann Filho. Banco de dados multimdia. Technical report, Unioeste - Universidade Estadual do Oeste do Paran, 2005. [4] Shamkant B. Navathe e Ramez Elmasri. Sistema de Banco de Dados. Addison Wesley, 2005.

26

You might also like