You are on page 1of 22

TOPOLOGIA DE RED DE COMO FUNCIONA EL TSM

Como pueden observar en la siguiente imagen el robot est compuesto de una


librera TS3200 que a su vez se conecta a un Storage de discos por medio de
fibra ptica mediante un Switch que este tambin conecta a un servidor en el
cual tiene instalado un Windows 2008R2 con la aplicacin de TSM versin 7.

Luego en cada servidor de aplicacin de nuestra red sea Windows, Linux, Unix
estos se comunican al servidor mediante un agente que tiene instalado en
cada equipo del cual recibe las directivas de la poltica de backup a aplicar. Full,
Incremental, Diferencial.
Partes la Librera TS3200
Este es el rbol de opciones resumido del Men del
equipo:
Vista de la librera por dentro:

Tiene un brazo mecnico en el centro el cual toma las cintas que fueron
depositadas en la bandeja que a su vez sern montadas en el Drive para su
posterior grabacin.

El brazo cuenta con un lector de laser tipo scanner con el cual lee la ubicacin
de las cintas para tener referencia de su ubicacin y poder llevar un inventario
de las mismas.
El modelo de librera que tenemos es soporta un total de 45 cintas, (44 para
almacenamiento y 1 slot dedicado para limpieza)

Vista del drive parte trasera, pieza removible.

POOL TIPO DETALLE SCHEDULL ROTACION RESGUARD


O
BACKUP_LT Incrementa Cinta lunes- BUNKER
O l original viernes CTL
COPYPOOL Incrementa Cinta copia Todos los 6 das IRON
l das MOUNT
ARCHIVE_L Full Cinta Sbado- BUNKER
TO original Dom CTL
COPYARCH Full Cinta copia Mart-Juev 1 ao IRON
MOUNT
BASE TSM Full Cinta Todos los 6 das IRON
original das MOUNT
DVD Full Original Todos los 6 das IRON
das MOUNT

El 2do fin de semana de enero es la nica fecha en el ao en que corre el


backup Full que se enva a 10 aos.

COPYPOOL , cuando su estado se encuentre en filling / llenando se enva a 6 das de rotacin.


Cuando la cinta llega al 100% y su estado es lleno, se enva recin ah a 40 das.

Solo debe haber una sola cinta del pool copypool por da dentro del robot.

DVD : resguarda la configuracin del TSM (que es un Windows 2008 R2,) Para correrlo tenemos
que cada PC el siguiente script: C:\tsm\tsm.bat

BASE TSM: es la base del equipo, como su nombre lo indica. Es la que se encarga de llevar el
control lgico de la expiracin de datos de las cintas y tareas de mantenimiento del equipo. Sin ella
no sera posible saber en qu cinta est la informacin.

SPACE RECLAMATION -----------> proceso automtico del robot de mantenimiento, se encarga


del movimiento de datos para optimizar cintas. Esto lo hace mediante storage de disco.

EXPIRATION ---------------------> procesos automtico del robot de mantenimiento, se ocupa de


ir expirando la informacin de las cintas de forma lgica. Esto lo hace mediante storage de disco

Capacidad de las cintas

LTO5 ----> 3 TB capacidad ( terabyte)

LTO6 ----> 6 TB capacidad ( terabyte)

Cuando hay ms de 3 archive filling, la 4ta la utilizando como buffer, no


sacarla, dejarla para mover otro da.

Siempre tienen que quedar en el robot 3 archive en filling, 1 backup


en filling, 1 copypool , 3 scratch.
Algunos comandos tiles

Como deshabilitar un drive que est teniendo errores:

Update drive 3573 LTO5X online=no

Qu hacer cuando el robot muestra en la librera un rotulo incorrecto:

Antes de tomar la accin correctiva para el caso debemos asegurarnos que el robot no este
realizando ninguna tarea, esto lo verificamos con el comando q proc. Si no tiene respuesta alguna
recin en este caso podremos ejecutar el comando:

audit library 3573 checklabel=barcode

El cual se encargara de revisar todas las etiquetas / rtulos de las cintas ingresadas para hacer un re-
inventario de las mismas y corregir el error.

Ruta donde se guarda el LOG del Backup en Linux:

/opt/tivoli/tsm/client/ba/bin/dsmsched.log

Ruta donde se guarda el LOG del Backup en Windows:

c:\Program Files > Tivoli > Tsm > baclient > dsmsched.log

Inicio/Parada del servicio en Linux:

./dsmserv stop Parar TSM

./dsmserv start Iniciar TSM


Importante

-Tener abierta siempre las dos consolas, una para ingresar comandos, y la otra para visualizar el log
del equipo por si este pide alguna cinta que le carguemos o si da algn error inesperado.

-Cuando falla un backup debemos dar aviso a la guardia, o bien enviar un mail informando la falla
del mismo. Para saber podemos utilizar el comando:

q ev * * EXceptionsonly=yes

-Siempre que toman el turno lancen el siguiente comando para saber si el robot pidi una cinta
durante la madrugada y esta no fue cargada, con lo cual hizo que el backup no terminara y tengamos
que cargarla. Para saber que cinta pidi utilizamos:

select * from volumes where access='UNAVAILABLE'

-Cuando se recibe una cinta que traen de Iron Mountain antes de guardarla correr el comando

Q vol A0XXXX para saber de qu se trata y donde guardarla.

q node ----> nos va a indicar la lista de servidores a los cuales les estamos tomando backup

Comando para saber cuntas cintas scratch hay dentro del robot

select count(*) as Scratch_count from libvolumes where status='Scratch'

Tipos de errores:

1. MISSED

2. FAILED

3. SEVERED

Link de consulta para ms detalles:

https://help.it.ox.ac.uk/hfs/help/scheduledts1
Cmo verificar si una cinta tiene errores?

Utilizamos el siguiente comando:

q vol a00041 f=d

Vamos a tener por respuesta lo siguiente: (Observar lneas en color rojo)

Volume Name: A00041

Storage Pool Name: ARCHIVEN_LTO

Device Class Name: LTO3

Estimated Capacity: 1.6 T

Scaled Capacity Applied:

Pct Util: 82.9

Volume Status: Filling

Access: Read-Only

Pct. Reclaimable Space: 0.7

Scratch Volume?: Yes

In Error State?: Yes

Number of Writable Sides: 1

Number of Times Mounted: 6,571

Write Pass Number: 1

Approx. Date Last Written: 07/04/2015 02:35:33

Approx. Date Last Read: 07/21/2015 14:48:37

Date Became Pending:

Number of Write Errors: 2

more... (<ENTER> to continue, 'C' to cancel)


Number of Read Errors: 17

Volume Location:

Volume is MVS Lanfree Capable : No

Last Update by (administrator): AZORDAN

Last Update Date/Time: 07/21/2015 14:36:17

Begin Reclaim Period:

End Reclaim Period:

Drive Encryption Key Manager:

Con lo cual la cinta nos da indicios que esta inutilizable, para ello vamos a
proceder a indicarle al robot que la destruya de su base de datos:

Cmo Poner la cinta en destroyed?

upd vol a00094 acc=destroyed

Cmo ver todas las cintas con errores?

select volume_name, pct_utilized, write_errors, read_errors from


volumes where write_errors>0

TAREAS DE MANTENIMIENTO:

Borrado de cintas Full Original (archive)

1) q vol stg=archive_lto f=d

Buscar informacin de 1 ao hacia atrs a la fecha. Comenzar la bsqueda


desde la 2da semana de Febrero en adelante para no pisar las cintas anuales.

Ejemplo hoy es da 12/05/15

Pero al ver la cinta me dice:


Ultima vez que escribi 09/05/2014 Al 09/05/2015 ya pas 1 ao por ende ya
expiro y se puede borrar.

Borrado de cintas Incremental (backup)

2) q vol stg=backup_lto f=d

Ejemplo:

Ultima vez que escribi 09/03/2015 Al 09/05/2015 ya pasaron 60 das por


ende ya expiro y se puede borrar.

IMPORTANTE: NUNCA BORRAR una cinta COPYARCH. Sino esto


obligara volver a bajar informacin desde la Original (archive). El
borrado ayuda a mantener el tamao de la base.

Como retirar del robot una cinta con errores


LIMPIEZA DE DRIVES

Los comandos que tienen que ejecutar para reemplazar una cinta de limpieza
de TSM

1 q libvol f=d (muestra detalles de las cintas y podemos ver cuantos ciclos
de limpieza le quedan (Cleanings Left) , en el ejemplo nos dice que ya se
agotaron las instancias de uso. Esta el marcado en 0

2 checkout libvol 3573 CLNU64 rem=b checkl=n (descargamos la cinta del


Robot de TSM)

3 checkin libvol 3573 search=b stat=clean cleanings=40 (hacemos un


checkin de la cinta seteandole la cantidad de ciclos de limpieza que va a
tener (cleanings=40))

Limpieza de drives:

clean drive 3573 LTO5A

clean drive 3573 LTO5B

clean drive 3573 LTO5C


clean drive 3573 LTO5D

Cmo saber cundo una cinta expiro sola y esta reutilizable y esta puede
estar en Iron Mountain?

En este caso le pedimos a la gente de la cintoteca que no las envi como es


habitual, y dicha cinta podremos reutilizarla como til.

Borrado manual de Cintas:

Cuando se borra una backup, automticamente expira y borra la copypool

Cuando se borra una archive, automticamente expira y borra la copyarch

delete vol ETIQUETA_VOLUMEN discarddata=yes

Cmo buscar un error en el equipo?

q actlog

Tendremos que tomarnos el tiempo de revisar lnea por lnea hasta dar con la
falla.

Lista de cdigos de error que podra presentar el equipo:

http://publib.boulder.ibm.com/tividd/td/TSMM/SC32-9090-
01/en_US/HTML/anrcms5528.htm
Cmo cambiar nuestra contrasea?

update admin azordan nueva_contrasea

Cmo ver que persmisos tiene un usuario?

query admin azordan format=detailed

Cmo crear un Nuevo usuario para el TSM?

register admin azordan cetelem passexp=311

Cmo ver la poltica de backup? Utilizamos el comando:

q sched

Envi de cintas Clausulas:

El horario para pasar a retirar es de 9 a 13 hs.

El tiempo de espera es solo de 15 minutos.


Las cintas por contrato tienen que estar listas para las 9 am.

Cmo podemos ver que cinta se encuentra en Iron Mountain?

Ingresamos a la web:

http://www.ironmountain.com.ar/

Usuario: 5125

clave: CETElem
COMANDO ACCIN

Log de eventos que se producen en el


q actlog
servidor

q stgpool Pooll de discos (estado del DiskPool)

Peticiones pendientes (normalmente de


q req
insercin de cinta)

Listado de todos los volmenes


q vol
Cintas

Actualiza el umbral a partir del cual


update stgpool diskpool hi=%% lo=%%
copiar a cinta

q proc Procesos que se estn realizando

q sess Conexiones actuales a Tivoli

Contenido de la volumen/cinta
q content etiqueta_cinta
seleccionada

Muestra datos detallados del volumen


q vol etiqueta_cinta f=d
especificado (ocupacin, estado, ...)

cancel reply001 Cancela la tarea especificada


cancel req NUMERO Cancela una peticin

cancel proc NUMERO Cancela un proceso

update vol etiqueta_cinta


Marca un volumen como Slo lectura
access=readonly

update vol etiqueta_cinta Marca un volumen como


access=readwrite Lectura/Escritura

Comprueba el contenido del volumen


audit vol etiqueta_cinta
especificado

Muestra el volumen montado


q mount
actualmente

label libvol L_LTO etiqueta_cinta


Etiqueta una cinta NUEVA
overwrite=yes

Muestra el log de eventos del da


q actlog begindate=today-1
anterior

RUN NombreScript Ejecuta un script previamente creado

Muestra el histrico de copias de


q volhist type=dbbackup
seguridad de la BD de TSM

Muestra resultados detallados de un


COMANDO format=detail
comando

q status Muestra informacin del estado del


servidor: versin, parmetros.

q library Muestra informacin de la librera


actual.

q license Muestra datos de las licencias activas


de Tivoli Storage Manager.
show config Muestra datos de configuracin de
Tivoli Storage Manager.

q occupancy Muestra informacin del estado de las


copias de seguridad de los nodos.

Muestra informacin de utilizacin de


almacenamiento de los nodos cliente.
Por cada nodo mostrar las megas de
q auditoccupancy almacenamiento de copias de
seguridad, las megas de
almacenamiento de copias archivadas,
almacenamiento total

delete vol ETIQUETA_VOLUMEN Elimina el volumen especificado y


discarddata=yes todos los datos que contenga

Muestra todos los volmenes de tipo


"Backupset" (copia de seguridad
q backupset independiente que se puede extraer de
la librera sin que afecte al resto, se
puede restaurar independientemente)

q backupsetcontents NOMBRE_NODO Muestra el contenido del volumen de


NOMBRE_BACKUPSET.NUMERO_ID tipo backupset especificado

Muestra todos los script definidos en el


q script
servidor de TSM

Audita y sincroniza los inventarios de


volmenes en la biblioteca/librera
automatizada indicada. Si se detectan
incongruencias sern corregidas. Con
audit library NOMBRE_LIBRERIA
"checklabel=barcode" se indica a TSM
checklabel=barcode
que utilice el lector de cdigos de
barras para leer la etiqueta de
almacenamiento, con lo que el tiempo
del proceso disminuye

audit library NOMBRE_LIBRERIA Audita y sincroniza los inventarios de


volmenes en la biblioteca/librera
automatizada indicada. Si se detectan
incongruencias sern corregidas. Con
checklabel=yes
"checklabel=yes" se indica a TSM que
compruebe la etiqueta de cada volumen
para verificar la identidad del mismo

delete backupset NOMBRE_NODO Elimina el juego de copias de seguridad


NOMBRE_BACKUPSET.ID especifiado en el nodo especificado

Muestra las opciones del servidor:


formato fecha, hora, nmero, idioma,
q option
ubicacin ficheros (devcnfg.out,
volhisto.out), etc.

Muestra los drives actuales e


informacin sobre ellos: tipo de
q drive
dispositivo, nombre unidad, nombre
biblioteca, activado, etc.

Muestra informacin detallada sobre


los drives actuales e informacin sobre
ellos: tipo de dispositivo, nombre
unidad, nombre biblioteca, activado,
query drive f=d
formatos de lectura, formatos de
grabacin, estado de la unidad, nmero
de serie, fecha ltima actualizacin,
frecuencia de limpieza, etc.

audit volume stgpool=nombre_storage Audita volmenes de un pool de cintas


fix=no (sin reparar)

audit volume stgpool=nombre_storage Audita volmenes de un pool de cintas


fix=yes (reparando inconsistencias)

delete volhistory type=DBBACKUP Elimina los volmenes de copia de


todate=today-3 seguridad ms antiguos de tres das

Muestra informacin sobre los distintos


q path f=d
dispositivos instalados y su ruta
Muestra informacin sobre
configuracin del sistema, ejecuta a su
vez los comandos:

QUERY ASSOCIATION

QUERY MGMTCLASS

QUERY COPYGROUP

QUERY OPTIONS

QUERY DB

QUERY PROCESS

QUERY DBVOLUME
q system
QUERY SCHEDULE

QUERY DEVCLASS

QUERY SESSION

QUERY DOMAIN

QUERY STATUS

QUERY LOG

QUERY STGPOOL

QUERY LOGVOLUME

QUERY VOLUME