Professional Documents
Culture Documents
Gestin de la Capacidad
Visin general
La Gestin de la Capacidad es la encargada de que todos los
servicios TI se vean respaldados por una capacidad de proceso y
almacenamiento suficiente y correctamente dimensionada.
Sin una correcta Gestin de la Capacidad, los recursos no se
aprovechan
adecuadamente
y
se
realizan
inversiones
innecesarias que acarrean gastos adicionales de mantenimiento y
administracin. O an peor, los recursos son insuficientes con la
consecuente degradacin de la calidad del servicio.
Entre las responsabilidades de la Gestin de la Capacidad se
encuentran:
1.1.1.
Introduccin y Objetivos
El objetivo primordial de la Gestin de la Capacidad es
poner a disposicin de clientes, usuarios y del propio
departamento TI los recursos informticos necesarios para
desempear de una manera eficiente sus tareas y todo ello
sin incurrir en costes desproporcionados.
Para ello, la Gestin de la Capacidad debe:
Dimensionar
adecuadamente
los
servicios
y
aplicaciones alinendolos a los procesos de negocio y
necesidades reales del cliente.
Gestionar la demanda de servicios informticos
racionalizando su uso.
de una
correcta
1.1.2.
Proceso
Las principales actividades
Capacidad se resumen en:
de
la Gestin
de
la
Costes asociados
capacidad.
al
incremento
de
la
El uso de recursos.
Desviaciones
planificada.
de
la
capacidad
real
sobre
la
Introduccin y Objetivos
El
objetivo
primordial
de
la Gestin
de
la
Disponibilidad es asegurar que los servicios TI estn
disponibles y funcionen correctamente siempre que los
clientes y usuarios deseen hacer uso de ellos en el marco
de los SLAs en vigor.
Las responsabilidades de la Gestin de la Disponibilidad
incluyen:
Supervisar
el
cumplimiento
de
los OLAs y UCs acordados con proveedores internos y
externos.
en
Capacidad
de
mantenimiento:
capacidad
recuperar el servicio en caso de interrupcin.
de
1.2.2.
la Gestin
de
la
Determinar
cules
son
los requisitos
disponibilidad reales del negocio.
de
se
Mantenimiento del
servicio
en
operacin
recuperacin del mismo en caso de fallo.
Realizar
diagnsticos
peridicos
sobre
disponibilidad de los sistemas y servicios.
la
Determine
las
disponibilidad de
12/5,...).
franjas
horarias
de
los servicios TI (24/7,
Gestin
de
Mantenimiento
las
Interrupciones
de
Seguridad
Uno de los aspectos esenciales para obtener altos
niveles de fiabilidad y disponibilidad es una
correcta Gestin de la Seguridad.
Los aspectos relativos a la seguridad deben ser
tomados en cuenta en todas las etapas del proceso.
Es tan importante determinar cundo el servicio
estar disponible como el "quin y cmo" va a
utilizarlo. La disponibilidad y seguridad son
interdependientes y cualquier fallo en una de ellas
afectar gravemente a la otra.
1.2.2.4. Monitorizacin de la disponibilidad
La monitorizacin de la disponibilidad del servicio y
la elaboracin de los informes correspondientes son
dos de las principales actividades de la Gestin de la
Disponibilidad.
Desde el momento de la interrupcin del servicio
hasta su restitucin o "tiempo de parada" el
incidente pasa por distintas fases que deben ser
analizadas por separado:
Tiempo
Medio
de
Parada (Downtime o
(MTTR): que es el tiempo promedio de duracin
de una interrupcin del servicio, e incluye el
tiempo de deteccin, respuesta y resolucin.
Donde:
AST se corresponde con el tiempo acordado de
servicio, DT es el tiempo de interrupcin del servicio
durante las franjas horarias de disponibilidad
acordadas.
Por ejemplo, si el servicio es 24/7 y en el ltimo mes
el sistema ha estado cado durante 4 horas por
tareas de mantenimiento la disponibilidad real del
servicio fue:
Anlisis
del
Impacto
de
Fallo
de
Componentes
(CFIA):
El CFIA (siglas
de Component Failure Impact Analysis) es un
mtodo mediante el cual se identifica el impacto
que tiene en la disponibilidad de los servicios TI
el fallo de cada elemento de configuracin
involucrado. Es evidente que este mtodo
requiere una CMDB correctamente actualizada.
Anlisis
del
rbol
de
Fallos
(FTA):
El FTA (siglas de Failure Tree Analysis) tiene
como objetivo estudiar cmo se "propagan" los
fallos a travs de la infraestructura TI para
comprender
mejor
su
impacto
en
la
disponibilidad del servicio.
Mtodo de Gestin y Anlisis de Riesgos de
la CCTA (CRAMM): El CRAMM (siglas de CCTA
Risk Analysis and Management Method) tiene
como
objetivo
identificar
los
riesgos
y
vulnerabilidades a los que est expuesta la
infraestructura TI, con el objetivo de adoptar
contramedidas que los reduzcan o que permitan
recuperar rpidamente el servicio en caso de
interrupcin del mismo.
Anlisis de Interrupcin del Servicio (SOA):
El SOA (siglas de Service Outage Analysis) es una
tcnica cuyo objetivo consiste en analizar las
causas de los fallos detectados y proponer
soluciones a los mismos.
Se diferencia de los anteriores mtodos en que
realiza el anlisis desde el punto de vista del
cliente, haciendo especial nfasis en aspectos no
para
la
estrictamente
respondiendo.
hablando
el
sistema
termine