Sistema de Backup utilizando IBM - Tivoli Storage Manager
Josmar Neduziak
Curso de Redes e Segurana de Sistemas Curitiba, Outubro de 2010
Resumo No importam quais so os tipos de atividades, com que as empresas trabalho, todos seus sistemas dependem de computadores e seres humanos para gerenci-los, porm estamos sujeitos a falhas tanto por operao voluntria quanto involuntria ou ainda a queima de equipamentos, entre outros fatores que possam acontecer. Sendo assim, por que no investir em uma ferramenta que possa disponibilizar eficazmente a restaurao de dados caso necessrio?
1 - Introduo:
Muitas empresas no do o devido valor ao backup de seus dados, pois no imaginam o prejuzo que podem ter se todos os seus arquivos vierem a se perder, a maioria das organizaes podem at mesmo falir se perderem suas bases. Normalmente estas, s do a importncia que tal assunto merece aps ocorrer alguma falha grave com perdas de informaes importantes e que causem prejuzo financeiro, neste caso, pode ser tarde demais para tomar uma medida preventiva. Apos a conscientizao dos gestores das empresas de que o investimento em backup de dados no dinheiro jogado fora, mas sim, um investimento na garantia da continuidade dos negcios com evoluo segura e projees de crescimento consistente aps o investimento em um sistema de backup confivel, com certeza tais empresas podero continuar a traar metas otimistas sem medo de que a qualquer dia, tudo venha a se perder, devido falta de segurana da informao, ou simplesmente por descuido, ou pior, por descaso. Com a evoluo e o crescimento das redes de internet e dos meios de comunicaes, deu-se origem a novos e complexos ambientes, tais como banco de dados e uma variedade cada vez maior de aplicativos primordiais para prestao de servios. Sendo assim, h necessidade de investir em uma soluo de gerenciamento e armazenamento de dados de forma confivel com atributos e polticas que possam ser ajustados para garantir os nveis de servio que seus clientes exigem. Neste trabalho, abordarei especificamente o sistema de backup da empresa IBM, Tivoli Storage Manager (TSM). Uma das melhores ferramentas do mercado, devido a sua capacidade, confiabilidade, segurana e qualidade no gerenciamento e reteno de dados. Este sistema adquirido principalmente por empresas de mdio e grande porte, devido seu custo, pois empresas de pequeno porte optam por utilizar softwares grtis, onde, embora 2
tambm possam ser eficientes, talvez no tenham a mesma segurana e confiana que o TSM fornece. Este artigo esta estruturado da seguinte forma. Na seo 2 ser apresentado um pouco da histria da ferramenta, suas verses e informaes sobre o banco de dados. Na seo 3 sero informados os requisitos de hardware e software para instalao do TSM Server e dos clientes. Na seo 4 sero apresentadas vrias informaes importantes sobre o seu funcionamento incluindo informaes sobre o seu gerenciamento, formas de reteno dos dados, polticas, armazenamento e tratamento das informaes, entre outros. Na seo 5 sero apresentadas as novidades da verso 6.x. Na seo 6 e 7 respectivamente, apresentarei as principais vantagens e desvantagens do TSM, seguido da concluso na seo 8.
2 - Histria da ferramenta:
A IBM deu o ponta p inicial e impulsionou-se na frente de muitas empresas do mercado na rea de backup e recovery em 1990 com o sistema Workstation DataSave Facility (WDSF40 for VM), onde, nem analistas, clientes e nem mesmo os engenheiros imaginavam que estavam iniciando um caminho para um produto que abriria uma nova era na gesto de armazenamento. Em 1993 ela criou outra ferramenta chamada ADSTAR Distributed Storage Manager (ADSM) com sua verso 1.1, a qual veio a ser desenvolvida apartir da WDSF. O ADSM foi desenvolvido inicialmente no centro de pesquisas Almaden que localiza-se no conhecido Vale do Silcio nos EUA, onde atualmente emprega mais de 500 pesquisadores na rea de sistemas e tecnologia de armazenamento, banco de dados e cincia da computao[1]. A primeira verso do ADSM foi distribudo para o sistema Multiple Virtual Storage (MVS) e para servidores VM mainframe, o qual suportava o processo de backup/restore e archive/retrieve dos seguintes clientes: Novell Netware, AIX, Apple Macintosh, IBM OS/2 e Microsoft Windows [2]. Aps a aquisio da Tivoli Systems a IBM moveu todos os esforos para este grupo com intuito de criar um novo produto destinado ao servio de desaster/recovery criando assim o Tivoli Storage Manager (TSM) em 1999, aonde o mesmo viria a revolucionar este mercado, incluindo-o novas interfaces, inclusive interface de gerenciamento web. Inicialmente com a verso 3.7, evoluindo conforme tabela abaixo at a verso atual (6.2), sendo extremamente confivel e vendida no mundo todo. Release Verso Data de Lanamento Workstation DataSave Facility (WDSF40 for VM) - Setembro 1990 ADSTAR Distributed Storage Manager 1.1 Julio 1993 ADSTAR Distributed Storage Manager 1.2 1994 ADSTAR Distributed Storage Manager 2.1 1995 ADSTAR Distributed Storage Manager 1.2.1 1995 ADSTAR Distributed Storage Manager 3.1 1997 ADSTAR Distributed Storage Manager 3.1.1 1998 ADSTAR Distributed Storage Manager 3.1.2 1998 IBM Tivoli Storage Manager 3.7 1999 IBM Tivoli Storage Manager 4.1 2000 IBM Tivoli Storage Manager 4.2.0 2001 IBM Tivoli Storage Manager 4.2.1 2001 3
IBM Tivoli Storage Manager 5.1.0 2002 IBM Tivoli Storage Manager 5.1.5 2002 IBM Tivoli Storage Manager 5.2 2003 IBM Tivoli Storage Manager 5.3 2005 IBM Tivoli Storage Manager 5.4 Janeiro de 2007 IBM Tivoli Storage Manager 5.5 Novembro de 2007 IBM Tivoli Storage Manager 6.1 Maro de 2009 IBM Tivoli Storage Manager 6.2 Maro de 2010 Tabela 1 - Verses
O TSM considerado uma soluo bastante flexvel embora exija um bom conhecimento tcnico para gerenci-lo, sendo que, aps conhecer suas funcionalidades e polticas o mesmo se torna simples e fcil sua manuteno e gerenciamento. Ele considerado pioneiro na utilizao de banco de dados integrado, utiliza-se um gerenciamento centralizando, e apartir da verso 6.1 utilizado um banco de dados DB2 independente, no sendo necessrio ter um conhecimento avanado em banco de dados para gerenci-lo, facilitando assim o seu suporte. Devido a tais funcionalidades muito utilizado por grandes corporaes como indstrias, governos, organizaes militares, organizaes de educao e de servios em geral, onde tais necessitam de uma ferramenta eficiente, para seu armazenamento seguro e confivel.
Figura 1: Banco de Dados DB2 relacional [11]
A arquitetura e banco de dados centralizada oferece muitas vantagens, quando comparadas a outras tradicionais arquiteturas orientadas a produtos de armazenamento. Por exemplo, o recurso de backup incremental que faz com que arquivos novos e alterados sejam backupeados, e no apenas feitas copias full (completa). Esta tcnica avanada reduz a quantidade de dados que est sendo gerenciada, tempo e a largura de banda que levaria para transferir, diminuindo consideravelmente a quantidade de disco e fitas para o armazenamento. Porm h a necessidade de criar uma poltica de backup confivel para o prprio banco de dados do sistema, sendo que, sem o mesmo no possvel efetuar leitura, nem a restaurao dos dados armazenados. Para garantir a segurana as fitas gravadas em um TSM especifico no pode ser lidas por nenhum outro. 4
O TSM oferece ainda a continuidade sendo possvel efetuar a migrao de uma verso para a outra progressivamente sem nenhum problema, utilizando as fitas de armazenamento antigas, sendo este um fator importante para a deciso das empresas de qual sistema de armazenamento iro utilizar, pois tal deve garantir que a prxima gerao ser compatvel com a anterior.
Figura 3: Progresso das fitas magnticas [6]
3 - Requisitos de software e hardware: As tabelas abaixo mostraro informaes mnimas para a implantao do TSM em sua mais nova verso 6.2 em servidores e clientes Linux e Windows, obtido nos manuais referenciados. Alm destes ainda possvel implantar-lo em mquinas com Sistema Operacional AIX, HP-UX e Solaris. 3.1 - Mnimo necessrio de hardware em servidores Linux: Tipo de Hardware Requisitos de Hardware Hardware Computador com base em processador ou multiprocessadores compatveis com Intel Pentium Espao em disco Os valores mnimos a seguir para o espao em disco: 5 MB para o diretrio /var 10 MB para o diretrio /opt se voc criar pontos de montagem 4 GB para o diretrio /opt/tivoli/tsm se voc criar pontos de montagem 390 MB para o diretrio /tmp 300 MB para o diretrio /usr 2 GB no diretrio inicial Memria 12 GB. 16 GB se voc estiver usando deduplicao. Se voc planeja executar mltiplas instncias, cada instncia exige a memria listada em um servidor. Multiplique a memria para um servidor pelo nmero de instncias planejadas para o sistema. [4]
3.2 - Mnimo necessrio de Softwares em servidores Linux: Tipo de software Requisitos mnimos de software Sistema Operacional O servidor Tivoli Storage Manager no Linux requer um dos seguintes sistemas operacionais: Red Hat Enterprise Linux 5, Update 3 ou posterior SUSE Linux Enterprise Server 10, Service Pack 2 ou posterior SUSE Linux Enterprise Server 11 Protocolo de comunicao TCP/IP Verso 4 ou Verso 6 Protocolo de memria compartilhada (com cliente do Tivoli Storage Manager Verso 6.1 System p) Navegador da Web Os navegadores a seguir so suportados: Microsoft Internet Explorer 6.0 SP1 Microsoft Internet Explorer 7.0 Firefox 2.0 ou superior [4]
5
3.3 - Mnimo necessrio de hardware em servidores Windows: Tipo de Hardware Requisitos de Hardware Hardware Computador com base em processador ou multiprocessadores compatveis com Intel Pentium Espao em disco Pelo menos 3 GB de armazenamento livre em disco (para uma instalao tpica) 200 MB de espao em diretrio temporrio Tamanho de partio de 2 GB na unidade C:\ 300 MB no diretrio de instncia Memria Sistemas Windows de 64 bits (recomendado) 12 GB. 16 GB se voc estiver usando deduplicao. Sistemas Windows de 32 bits 8 GB. A deduplicao no suportada. Executar mais de uma instncia do servidor em um sistema no suportado. [4]
3.4 - Mnimo necessrio de software em servidores Windows: Tipo de software Requisitos mnimos de software Sistema Operacional Microsoft Windows Server 2003: Standard, Enterprise ou Datacenter Edition, Service Pack 2 ou posterior Microsoft Windows Server 2003: Standard, Enterprise ou Datacenter x64 Edition (64 bits), Service Pack 2 ou posterior Microsoft Windows Storage Server 2003 Microsoft Windows Storage Server 2003 x64 Microsoft Windows Server 2008: Standard, Enterprise ou Datacenter Edition Microsoft Windows Server 2008: Standard, Enterprise ou Datacenter x64 Edition (64 bits) Microsoft Windows Server 2008 R2: Standard, Enterprise ou Datacenter Edition Protocolo de comunicao Pelo menos um dos seguintes protocolos de comunicao: Canais Nomeados TCP/IP Verso 4 ou Verso 6 Navegador da Web Microsoft Internet Explorer 6.0 SP1 Microsoft Internet Explorer 7.0 Firefox 2.0 ou superior Tabelas 2 - Requisitos [4] 3.5 Requisitos de software e hardware para instalao de Clientes: Windows: Um dos seguintes Sistemas Operacionais: Windows XP Professional Windows Server 2003 Windows Vista Windows 2008 Server Windows 7 Processador PC baseado em x86 (Pentium ou mais recente) ou AMD64/EM64T Seguem os requisitos mnimos de espao em disco: 8 MB para a API* (Interface de Programao de Aplicaes) de 32 bits 17 MB para a API de 64 bits (isto inclui a API de 32 bits) 29 MB para o cliente de Backup/Archive 143 MB para o cliente HSM Memria: 512 MB [4]
Linux: 6
Um dos seguintes Sistemas Operacionais: CentOS 4 e 5 Debian* 4 e 5 Fedora 11 e 12 Oracle Enterprise Linux 4 e 5 Scientific Linux 4 e 5 SUSE Linux Enterprise Desktop 10 e 11 RedHat Desktop 5 Mandriva Linux 2010 Ubuntu* 8, 9 e 10 Processador PC baseado em x86 (Pentium ou mais recente) ou AMD64/EM64T Seguem os requisitos mnimos de espao em disco: 8 MB para a API de 32 bits 17 MB para a API de 64 bits (isto inclui a API de 32 bits) 29 MB para o cliente de Backup/Archive 143 MB para o cliente HSM Memria: 512 MB[4]
4 - Funcionamento da ferramenta:
Uma Infra-estrutura do TSM normalmente segue o seguinte padro de equipamento: - 1 Tape Library - 1 Servidor TSM (Administrator Center, ISC, DB2, Storage Pool, Logs) - Clientes - Rede WAN, SAN e LAN ou somente LAN Segue abaixo um modelo de uma infra-estrutura padro com o TSM: 7
Figura 4 Rede padro utilizada pelo TSM
4.1 - Gerenciamento do TSM:
Dependendo do ambiente as regras de negcio podem ou no estarem bem definidas. Em uma organizao, um s analista pode executar todas as operaes ao mesmo tempo, mas tambm pode ser que exista um time de analistas compartilhando as responsabilidades de todas as tarefas do TSM. Cada analista poder ter uma funo junto ao gerenciamento do TSM, por isso, a necessidade de disponibilizar as permisses corretas para cada um, visando manter a segurana e possibilitando a utilizao de uma poltica de acesso, criando usurios com privilgios especficos, tais como: System, Policy, Storage, Operator, Analyst. System: Usurio Administrador com maior nvel de privilgios - Registrar e remover administradores - Adicionar e remover privilgios - Renomear administradores e trocar suas senhas - Definir e excluir Polticas e Storage Pools - Cancelar Processos - Alterar parmetros do TSM Server Policy: Esse privilgio pode ou no estar restrito a um Policy Domain. - Registrar, Modificar e Excluir Client Nodes - Registrar, Modificar, Excluir e Associar Schedules - Excluir arquivos armazenados pelos Client Nodes - Registrar, Modificar e Excluir objetos das polticas Operator: - Habilitar e Desabilitar o TSM Server para sesses de Client Nodes - Cancelar sesses 8
- Gerenciar montagem de fitas, e status das mdias - Parar o TSM Server Storage: Esse privilgio pode, ou no estar restrito a um Storage Pool com restries de Storage Pool - Definir e Excluir volumes de Storage Pools - Move data e audit volume - Sem restries de Storage Pool, todos os privilgios acima - Definir, Alterar e Excluir volumes de DB e LOG - Definir, Alterar e Excluir espelhamentos de DB e LOG - Definir, Alterar e Excluir Device Classes Analyst: Somente possui privilgios para zerar contadores de performance do TSM Node: Somente possui privilgios para acesso do client WEB de determinados Nodes (clientes) com algumas opes de backup e restore [10] Tal gerenciamento pode ser efetuado pelo prompt (linha de comando), ou ainda, pela pagina Administration Center, que integra-se com o Integrated Solution Console (ISC), ao qual permite fazer a gerencia de vrios servidores TSM, inclusive sendo possvel instal-lo em outro servidor.
Figura 5 Gerencia com ISC 4.2 Principais comandos O TSM Server, quase em sua totalidade pode ser configurado e gerenciado via linha de comando, estes comandos podem ser inseridos no Administratrive Command Line para verificar e configurar parmetros no servidor, e nos clientes para verificar status e configuraes. Lista com algumas dos principais comandos que um administrador usa no dia-a-dia: q vol - mostra situao de preenchimento das fitas na library; q libv - mostra as fitas que esto montadas na library; q mount - mostra se h alguma fita montada no drive da library; q proc - mostra se h algum processo em execuo no momento; q act - mostra log do tsm; q ev * * - mostra todos os eventos que o tsm executou no dia; 9
q ev * * -begind=-n begint=17:00 - mostra todos os eventos executados no dia, se for 1 ser mostrado dados do dia anterior, se for 2 ser de 2 dias atrs e assim por diante, apartir das 17:00 horas; q req - mostra se h algum processo requisitando interveno do operador. se houver, aparecer um nmero e aps executar a ao necessria, deve-se digitar: reply <n do request> help query - mostra todos os tipos de query e sua sintaxe; query event - informaes sobre eventos schedulados e completos; query log - informaes sobre alocao de logs; query db - estatsticas do banco de dados; query dbvolumes - apresenta volumes que compe o banco de dados do TSM; query system - informaes consolidadas sobre o TSM; query stgpool - informaes sobre o storage pool; query occupancy - recursos usados para informaes dos clients; query status - informaes gerais dos parmetros do servidor; query session - informao sobre as sesses abertas no TSM; query process - processos de clients que estejam rodando em background; query activity log - mostra o log do TSM; query libvolume - mostra volumes montados na library; update admin <user> <password> - alterar password de usurios; show time - mostra horrio do TSM Server; query mgmt - mostra management classes; query cota - mostra tempo de reteno das management classes; query schedule - mostra informaes sobre as schedules criadas; q lic - ver a situao das licenas;
4.3 - Formas de reteno dos dados: Backup: Os dados so controlados individualmente armazenados e retidos segundo certo nmero de verses, especificadas nas polticas (Backup Copy Groups). O backup dispe de quatro tipos, dependendo da necessidade assim podem ser criadas suas polticas: Backup Full: Efetua o backup total de todos os diretrios e arquivos. Backup Incremental: Faz o backup de todos os diretrios e arquivos alterados desde o ultimo backup incremental. Se necessrio restaurar algo, ser preciso utilizar a fita com o ultimo backup full e em seguida todas as fitas utilizadas com o conjunto incrementais subseqentes para restaurao de arquivos alterados durante a semana, por exemplo. Backup Diferencial: Faz o backup de todos os diretrios e arquivos desde o ultimo backup full. Para restaurar os dados neste necessrio restaurar os dados da fita full mais a ultima fita diferencial. Snapshot ou Image Backup: O TSM capaz de fazer uma cpia fiel do sistema, esta opo a menos utilizada, pois muitas vezes o restore do snapshot pode demorar mais do que reinstalar o sistema operacional dependendo da disposio dos arquivos nas fitas. Restore: a restaurao flexvel dos dados para o local de origem ou outro local, at mesmo para outro servidor (utilizando a opo Virtual Node), conforme definio do administrador, garantindo assim o menor impacto possvel. 10
Archive: Os dados so armazenados e retidos por um certo perodo, determinados nas polticas (Archive Copy Groups). Este procedimento mais utilizado para cpia de arquivos grandes com poucas alteraes e com necessidade de longo perodo de reteno. Retrieve: a restaurao dos dados que foram anteriormente arquivados com o processo de archive.
Figura 7 Exemplo de um procedimento de backup/restore e utilizao das fitas
4.4 - Arquitetura Polticas:
A seguir, algumas informaes sobre a forma que o TSM trata e gerenciam as polticas de reteno, esta definio feita atravs de quatro nveis os quais podem ser criados atravs do Administrator Center (pagina web) ou via linha de comando:
Policy Domain Policy Set Management Class Copy Groups
Figura 6 Polticas [8]
Policy Domain: Consiste em aplicar as regras para o gerenciamento e agrupamento clients nodes (Servidores clientes), normalmente agrupa-se pelas caractersticas semelhantes, como tipo de plataforma, domnio, tipo de dados a ser copiados. Policy Set: a parte da politica que contm as definies ativas. 11
Management Class: O Management Class contm as regras usadas para gerenciar os dados por clientes e domnio. Copy Groups: Neste nvel existem dois tipos, o Backup Copy Group e o Archive Copy Group, onde define-se o perodo de reteno e o destino dos dados. Estes dispem de alguns parmetros interessantes como: Backup copy group: destination: Define o stgpool (espao em disco) onde os dados sero armazenados; frequency: Copia o arquivo independente de quando ele foi alterado; verexists: Numero de verses retidas; verdeleted: Numero de verses retidas aps o arquivo ser deletado; retextra: Perodo que o arquivo ficar disponvel aps ele se tornar inativo; retonly: Reteno aps o arquivo ser deletado no cliente; mode: Determina que o TSM faa a cpia do arquivo sempre que ele for modificado, ou sempre que for executado a Schedule (agendamento); serialization: Define o que pode ser feito se o arquivo estiver sendo editado no momento do backup; Archive copy group: destination: Define o stgpool onde os dados sero armazenados; retver: Perodo de reteno do archive; serealization: Define o que pode ser feito se o arquivo estiver sendo editado no momento do backup; Para efetuar toda a configurao das polticas necessrio seguir a seguinte ordem: 1 - Definir a Policy Domain; 2 - Definir a nova Policy Set; 3 - Definir a nova Management Class; 4 - Definir um novo Backup Copy Group ou Archive Copy Group; 5 - Atribuir uma default Management Class; 6 - Validar a Policy Set; 7 - Ativar a Policy Set; 8 - Efetuar o gerenciamento com o Administration Center;
4.5 - Armazenamento temporrio em disco:
Aps definir as polticas necessrio criar os espaos em disco que mantero os arquivos copiados dos clientes temporariamente. interessante a criao deste espao relativamente grande para a acomodao dos backups e archives, levando em conta que, os discos so randmicos, agilizam o processo inicial sendo possvel executar copias simultneas para o disco e posteriormente migrados para as fitas. Diskpool: Local em disco disponvel para armazenamento temporrio dos dados antes do mesmo ser movido automaticamente (migration) ou ser forado migrao para as fitas. Tal espao em disco de primordial importncia, pois, sendo possvel efetuar leitura e gravao simultnea, torna-se vivel efetuar backup/archive de diversos clientes ao mesmo tempo diminuindo o perodo de janelas. Obs.: Se o arquivo a ser efetuado o backup ou archive for maior que o diskpool disponvel, o mesmo ir ser encaminhado direto para as fitas na Tape Library (Unidade de gravao de fitas magnticas). Backuppool: um espao do diskpool onde ficaro armazenados os backups antes de ser envidos para a Tape Library. Archivepool: um espao do diskpool onde ficaro armazenados os archives antes de ser enviados para a Tape Library. 12
4.6 - Tratamento dos dados:
Existem algumas particularidades que o TSM utiliza para tratar os dados, buscando desta forma, facilitar o gerenciamento e melhorar a utilizao das fitas: Expiration: Conforme as polticas criadas para armazenamento dos arquivos e/ou dados, tais vo expirando e vo sendo eliminados automaticamente do banco de dados, desta forma os dados gravados nas fitas no tero mais validade, ou seja, o TSM no reconhece mais. Migration: um processo utilizado pelo TSM para migrar os dados do diskpool (dados que esto no disco do servidor) para as fitas. Isso pode ser feito automaticamente, basta efetuar a configurao no TSM Server, sendo o padro ele migrar os dados quando atinge a 90% do backuppool (quando forem backups) ou archivepool (quando forem archives) migrando at o percentual de 70%, porm o mais interessante migrar completamente os dados quando este atingir 90%, liberando assim o disco para eventuais backups/archives que necessitem de uma maior quantidade de disco.
Figura 8 Forma de tratamento dos dados utilizado pelo TSM [6]
Reclamation: a movimentao ou transferncia dos dados de uma ou mais fitas subutilizadas para outra, desta forma, h a liberao destas, se tornando scratchs (sem dados e pronta para a reutilizao). 13
Figura 9 Processo de reclamation de fitas [6] Versionamento: O TSM permite que se retenham arquivos por mltiplas verses (backup), e no somente por tempo (archive), ou seja, uma vez que o arquivo for modificado, pode-se configurar o produto para manter verses anteriores deste mesmo arquivo, de forma que proteja o ambiente caso alguma inconsistncia tenha ocorrido ao arquivo e o mesmo tenha sido backupeado em uma verso falha, possibilitando assim a restaurao de verses anteriores do mesmo, por exemplo. O produto tambm permite que cada dado tenha sua reteno tratada sob os seguintes aspectos: 1. Enquanto o arquivo existir, quantas verses do mesmo devero ser mantidas em backup? 2. Enquanto o arquivo existir, por quanto tempo deve-se manter cada verso adicional? 3. Quando o arquivo for deletado, quantas verses em backup devem permanecer? 4. Quando o arquivo for deletado, e existir apenas uma ltima verso do mesmo, por quanto tempo a mais deseja-se manter essa ltima verso em backup? Na figura abaixo, segue um exemplo de um arquivo que foi alterado e efetuado o backup diariamente, sendo configurado sua poltica de versionamento para reter as cinco ultimas cpias.
14
Figura 10 Poltica de versionamento
Schedules: So agendamentos realizados no TSM para efetuar os backups/archive restore/retrive automaticamente, sem necessitar da interveno do administrador em tempo real. Existem dois tipos de schedules, so eles: Client Schedules e o Administrative Schedules. Com o Client Schedule, podemos: Agendar Backups Incrementais, Diferenciais e Full; Agendar Archives; Agendar Retrieves e Restores; Agendar Comandos do Sistema Operacional e Scripts; Com o Administrative Schedule, podemos: Agendar Comandos Administrativos como: reclamation, expiration, migration, etc; Para efetuar os agendamentos necessrio seguir alguns passos, para seu real funcionamento: 1. Especificar o Scheduling Mode a ser utilizado; 2. Definir os Scheduling Parameters; 3. Definir os schedules para cada Policy Domain; 4. Associar cada schedule com um ou mais client nodes; 5. Especificar um Retention Time para os Events Records no database; Scheduling Mode: a tcnica de comunicao client/server (Client Polling ou Server Prompted). Events Records: So registros do banco de dados que descreve o status atual e o resultado dos eventos. 15
Figura 11 Agendamentos
4.7 - Maintenance Script:
Para facilitar a administrao de todo o ambiente, o TSM conta com uma configurao de script que faz automaticamente todo o processo necessrio para manter o seu bom funcionamento, normalmente este procedimento agendado diariamente pela manh. Abaixo algumas aes e funcionalidades que devem ser tomadas no Maintenance Script: 1. Criar o script para backup do DB dirio (ex.: seis incrementais backups, seguindo por um backup full). 2. Adicionar o Device Class para efetuar o backup do banco de dados (DB) diariamente. 3. Migrao dos storage pools (backuppool, archivepool) para efetuar a movimentao dos dados para a fita. 4. Executar o Expiration, para limpar os dados expirados dos backups\archives efetuados. 5. Rodar o Reclamation, todas as fitas com menos de 50% (enviar os dados para outras fitas e torn-las scratch) 6. Backup Storage Pools, faz o backup todo o storagepool (dados que esto gravados nas fitas) para a storagepool clone (fitas clones que sero retiradas da Tape Libary diariamente e enviadas para o cofre externo). Desta forma mantendo se a segurana principalmente dos dados crticos contra eventuais desastres de qualquer natureza.
4.9 - Virtual Node:
A funo Virtual Node uma opo utilizada pelos administradores, para restaurao de arquivos originrios de um servidor em outro servidor com o mesmo tipo de Sistema Operacional. Isso bastante utilizado quando se quer restaurar os dados de uma mquina que houve a perda para outra que ir manter tal servio de forma permanente ou temporariamente. Obs.: A restaurao de arquivos no Linux se d apenas via linha de comando, no possvel fazer a restaurao de um arquivo de outro servidor via ambiente grfico neste Sistema Operacional. 16
Figura 12 Restaurao dos dados em servidor diferente
4.9 - Gerenciamento Online:
Uma soluo muito interessante do TSM utilizado em diversas aplicaes padres do mercado o Tivoli Data Protection (TDP), ao qual facilita o backup destas, no sendo necessrio parar o sistema para efetuar as cpias de segurana, alm de poder ser feitas em tempo real e reduzir significativamente as necessidades administrativas, possuem interfaces customizadas que permitem acesso aos dados backupeados em cada tipo de, de forma uniforme e simplificada. Entre os sistemas gerenciados por esta soluo esto: Banco de Dados: IBM DB2, Oracle Enterprise Edition, Oracle Real Aplication Clusters (RAC), IBM Informix (built-in), Microsoft SQL Server. Correio Eletrnico: IBM Lotus Domino, Microsoft Exchange Server, Microsoft Exchange Server VSS, Microsoft Exchange Server Ind. Mailbox Recover. Servidor de aplicao: WebSphere Application Server, Microsoft Sharepoint Portal. Hardware: IBM Enterprise Storage Server, Shark, EMC Symmetrix. ERP: SAP R/3SAP Enterprise (Oracle), SAP Enterprise (DB2), SAP Oracle/DB2 Flashcopy Tabela 3 Solues suportadas pelo TDP [5]
4.9.1 - Vantagens na utilizao dos Agentes TDP:
Proteo em tempo real dos dados fazendo backup automaticamente de sistemas crticos; Reter os arquivos por tempo pr-definidos, com cpias de verses separadas para facilitar a restaurao, alm de expirao automtica dos dados; Fcil implementao e gerenciamento, sendo executado em segundo plano e de forma transparente e sem que ocorram sobrecargas no sistema; Trabalha com mltiplas tecnologias de backup/replicao (local disk, file server, web, Tivoli Storage Manager, NAS device); possvel apagar verses de arquivos antigos para liberar espao para novas verses, alm de efetuar o autogerenciamento da rea de destino; Otimiza e reduz a utilizao da banda de rede e elimina a necessidade de janela para efetuar as cpias de segurana; Utilizao de sesses paralelas de backup e restore; 17
Utilizao de rea em disco do TSM (diskpool) para backup e archive de logs dos bancos de dados; De acordo como a aplicao, opes de restore para servidores diferentes, ou em reas diferentes; Todos os agentes desenvolvidos na soluo de TSM so certificados pelos fabricantes onde atuam;
4.10 - Modelos de Tape Librarys e status das fitas:
A Tape Library um equipamento bastante complexo, que faz a gravao dos dados oriundos dos clientes nas fitas magnticas, onde apenas uma Tape Library pode atender a diversos servidores TSM. Existem diversos modelos de library, desde as mais simples com apenas uma unidade de gravao (Tape Library TS3100) at as mais avanadas com 192 drives (Tape Library TS3500) sendo compatveis com as fitas IBM LTO Ultrium 1, 2, 3, 4 e 5. Esta ultima com capacidade de armazenamento de 1,5 TB nativos e 3 TB compactados e transferncia de at 140 MBps. As fitas utilizadas nas Tape Librarys tem alguns status, dependendo do estado possvel ou no efetuar gravao. Scrath: uma fita que no contem mais dados vlidos, portanto ela esta pronta para ser reutilizada. Private: Uma fita quando contm dados vlidos considerada private, porm nada impede se estiver sendo subutilizada, ser efetuado a migrao destes dados para outra fita (move data), liberando a mesma, tornando-se scrath. Tais fitas podem ainda estar disponveis ou no para gravao, estando elas em status Scrath ou Private: Read Only: possvel alterar o status de uma fita para ser efetuada somente leitura da mesma, este procedimento feito normalmente quando no se quer salvar nada nesta fita. Read White: Este status deixa a fita disponvel para gravao, o status padro das fitas que esto scraths. 18
Figura 13 Processo das fitas magnticas [9]
4.11 - Incluindo ou excluindo arquivos:
O TSM conta com uma opo de include/exclude de arquivos e/ou diretrios, desta forma, possvel evitar salvar arquivos de pouco ou nenhuma utilidade para a organizao, como por exemplo, arquivos .avi, .mp3, .wmv, .dll, entre outros. Tal excluso de arquivos e/ou diretrios pode ser configurado no prprio TSM Server, ou ainda nos clientes, atravs do arquivo de configurao dsm.otp que pode ser encontrado no seguinte local: C:\Program Files\Tivoli\TSM\baclient\dsm.opt para Windows e no /opt/tivoli/tsm/client/ba/bin/dsm.opt para clientes Linux, que, alm da lista de excluso ou incluso, onde fica toda a configurao necessria para a comunicao entre cliente e servidor. Abaixo segue uma tabela de alguns caracteres que so utilizados nos arquivos de configurao do TSM Server e clientes: Caracter Informao ? Usado para combinar um caracter * Usado para combinar um ou mais caracters \ Usado para combinar com qualquer diretrio Windows / Usado para combinar com qualquer diretrio Linux Usado para combinar um nome que contenha caracters em branco [ ] Usado para combinar qualquer caracter dos especificados [-] Usado para combinar qualquer caracter neste intervalo Tabela 4 Caracteres reconhecidos pelo TSM
Segue alguns exemplos de um arquivo de excluso (exclude lists) que podem ser usados nos sistemas operacionais como: Macintosh, Novell Netware,Unix/Linux, Windows: 19
Este exemplo mostra uma lista de excluso para os sistemas operacionais Windows e Linux: Exemplo: Windows: exclude ?:\...\*.shs exclude ?:\...\*.tmp exclude ?:\...\386spart.par exclude.dir ?:\...\system32\config exclude.dir ?:\...\system32\dhcp exclude.dir ?:\...\system32\lserver exclude ?:\...\system32\perflib*.dat exclude.dir ?:\...\system32\wins exclude.dir ?:\...\temp exclude *:\...\*.ghs exclude *:\...\*.iso exclude *:\...\*.pqi exclude ?:\...\*.exe exclude ?:\...\*.dll exclude ?:\...\*.jar exclude ?:\...\*.com
Linux: exclude.dir /.../temp exclude.dir /.../tmp exclude /.../tmp/.../* exclude /.../*.iso exclude /.../*.pqi exclude.dir /.../trash exclude.dir /.../Trash Tambm possvel, ao invs de excluir arquivos ou diretrios, efetuar a incluso, apenas alterando a palavra exclude por include dentro do arquivo de configurao dsm.opt: Exemplo: include ?:\...\*.exe include ?:\...\*.dl include.dir ?:\...\system32\dhcp
4.12 - Clonagem de fitas:
O TSM tem uma funo que permite clonar o que foi gravado em fita. Isto interessante quando queremos mandar fitas para cofre ou fora da empresa, um procedimento importante a ser realizado, devido ao risco de ocorrer algum desastre no datacenter, como inundao, incndio. Com a clonagem das mesmas, possvel garantir que os dados sero recuperados posteriormente a um grave incidente. Basicamente, quando se faz a clonagem do pool de fitas, o TSM gera uma cpia de todos os dados vlidos que foram gravados na cpia primaria e efetua uma cpia idntica em um novo volume de fitas. A reteno dos dados permanece a mesma, ou seja, se expirou os dados na cpia primria tambm expira no clone. A parte mais importante da clonagem justamente a definio adequada do prazo de reteno. Se o prazo de reteno for insuficiente, pode ocorrer dos dados no estarem 20
disponveis quando necessrio. Se o prazo de reteno for longo demais, gasta-se mais fitas. por isso h a necessidade de um planejamento eficiente das polticas de reteno. Abaixo, segue um procedimento para a criao de um Storage Pool Clone via linha de comando: 1. Criar um storagepool do tipo copypool: define stgpool clone lto_class_1 pooltype=copy maxscratch=9999999 define stgpool stg_clone lto_class pooltype=copy description='stg para clonar fitas-cofre' maxscratch=99999999 2. Criar schedule administrativo para fazer o clone aps todos os backups do dia, este schedule executar o comando: backup stgpool lto_ts3581 clone preview=no wait=no maxprocess=1 backup stgpool ts_3200 stg_clone wait=no Obs.: necessrio adicionar os volumes (fitas scraths) ao Clone Pool, por que a mesma no utiliza o pool de fitas dos backups e archives normais (primarios). Tambm necessrio verificar se as fitas esto com status de Read/Write, podendo assim, ser utilizada sem problemas.
4.13 - Capacidade de gerar cpias simultneas de backup:
O TSM permite que seja gerado simultaneamente o backup de um ou mais servidores para mais de um volume (mesmo que, em mdias diferentes). Dessa forma, agiliza-se em muito os processos de envio de volumes para cofres, pois se tem as cpias sendo feitas simultaneamente para fitas locais e para as que iro ser enviadas para local externo, sem que haja necessidade de um processo posterior de clonagem dos dados.
Figura 14 Copias simultneas [6]
5 - Novidades da verso 6:
5.1 - Deduplication Uma das novidades que a verso 6 traz, a possibilidade de eliminar a duplicao de dados, ou seja, esta nova tcnica capaz de gerenciar a redundncia dos dados salvando apenas uma cpia. Onde h arquivos idnticos, substituindo estes por indicadores e apontando para um arquivo nico de forma transparente para o usurio. Um bom exemplo disso quando muitos usurios recebem e-mails idnticos, que ao invs de ser salvo todas as cpias de todos os usurios, salvo apenas uma e as demais apontadas para esta. Desta forma elimina-se o crescimento explosivo dos dados (principalmente quando combinado com o 21
mtodo progressivo), economizando na utilizao de discos, fitas e conseqentemente possibilita efetuar backups e restores mais rpidos.
Figura 15 Processo do deduplication [7]
5.2 - Integrao com Vmware:
Atualmente muitas organizaes esto migrando seus servidores para mquinas virtuais, buscando melhor desempenho, reduo de custos, e a mxima utilizao da mquina. Desta forma, tambm h a necessidade de garantir a segurana dos dados destas. Apartir da verso 6.1 possvel efetuar o backup Full-Image onde se faz uma cpia total da mquina virtual independente do Sistema Operacional utilizado e tambm File-Level que faz cpias a nvel de arquivos da mquina virtual, sendo possvel aplicar formas de reteno especificas (incremental, diferencial) utilizando a tecnologia VMware Consolidated Backup (VCB), que consiste em utilizar um proxy Server poupando o processamento dos hosts. O Vmware e o TSM podem ser integrado de 3 formas: Por mquina virtual Por ESX Server Utilizando VCB
Figura 16 TSM + VMware [7]
6 - Vantagens na utilizao do TSM:
22
Centralizao na realizao do backup\archive e gerenciamento; Opo de criar sites distintos duplicando os dados em tempo real; Ambiente grfico e terminais para gerenciamento do TSM (Administrative Command Line, Management Console, Integrated Solutions Console e Administration Center); Possibilidade de criar polticas de privilgios para controle e acesso; Diversos tipos de backup: full, incremental, diferencial, Snapshot; Possibilidade de restore do prprio sistema de backup (TSM) caso haja algum problema com o servidor original; Monitoramento fcil e com lista de erros elaborada; Possibilidade de excluso ou incluso de arquivos com extenses especificas e diretrios; Versionamento de backups; Deduplicao dos dados; Capacidade de incluso de proteo opcional de dados para aplicativos como Banco de dados, ERP, e-mail; Possibilidade de criptografar e compactar os dados, garantindo assim, mais segurana e o mximo de utilizao das fitas;
7 - Desvantagens na utilizao do TSM:
Complexidade para instalao e configurao e gerenciamento do mesmo at o seu real entendimento; Preo elevado das licenas; Apartir da verso 6.1 o DB2 requer mais espao de disco e memria; No possvel efetuar upgrade das verses do TSM em servidores Windows e AIX com 32 bits para servidores 64 bits; Dependendo da necessidade de backup/archive restore/retrieve de grandes quantidades de dados haver uma sobrecarga na rede, por isso onde necessita-se de grande transferncia de dados, uma boa soluo a implantao de uma rede SAN;
8 - Concluso Todos os fatores e conceitos apresentados at agora so diferenciais importantes da soluo do TSM quando trabalhadas com todos estes conceitos em conjunto. Neste trabalho procurei demonstrar a solidez e eficincia da tecnologia utilizada pelo produto, podendo oferecer segurana e disponibilidade superiores quando comparadas a outras solues corporativas de backup: 23
Figura 16 Eficiencia do TSM O futuro dos sistemas de armazenamento deve incluir o TSM como um dos melhores e mais seguros sistemas de reteno, principalmente quando existe a necessidade de guardar grandes quantidades de dados. De modo geral, as empresas devem tomar o mximo de cuidado com suas informaes, utilizando-se qualquer que seja a ferramenta j trar certo alivio caso ocorra alguma eventualidade ocasionando perdas. Porm, dependendo da empresa o gerenciamento das informaes com ferramentas bsicas podem trazer maior custos que benefcios, e ainda correr o risco de no haver a possibilidade do restore das informaes no momento necessrio, sendo que, o importante no o backup mais sim a restaurao dos mesmos.