Professional Documents
Culture Documents
Resumo
Este white paper descreve os recursos do EMC VPLEX que so
relevantes em termos de funcionalidade para o Oracle RAC (Real
Application Clusters) e o Oracle Database. Tambm so apresentadas
as prticas recomendadas de configurao do Oracle RAC estendido
para que ele use o EMC VPLEX Metro da maneira ideal.
Setembro de 2011
ndice
Resumo executivo ................................................................................................... 4
Pblico-alvo ....................................................................................................................... 5
Introduo .............................................................................................................. 6
Viso geral dos produtos e recursos ........................................................................ 6
VPLEX ................................................................................................................................. 6
Ofertas de produtos VPLEX ............................................................................................. 7
Destaques da arquitetura VPLEX .................................................................................... 9
Consistency groups, regras de desanexao e VPLEX Witness ...................................... 11
Oracle Real Application Clusters ....................................................................................... 13
Oracle Automatic Storage Management........................................................................ 13
Oracle RAC em clusters de longa distncia ................................................................... 13
Symmetrix srie VMAX .................................................................................................. 14
Famlias de produtos Symmetrix VMAX TimeFinder ................................................... 15
Symmetrix VMAX Virtual Provisioning ........................................................................... 15
Concluso ............................................................................................................. 39
Referncias ........................................................................................................... 40
Resumo executivo
O EMC VPLEX uma tecnologia de federao de armazenamento de classe
empresarial que agrega e gerencia pools de armazenamento conectados por FC
(Fibre Channel) dentro de datacenters e entre eles. O VPLEX, que reside entre os
servidores e o armazenamento FC, apresenta volumes distribudos e locais para
os hosts. A agregao do armazenamento VPLEX permite upgrades e migraes
on-line do armazenamento sem nenhuma mudana para LUNs de host. A
tecnologia de clustering do VPLEX AccessAnywhere permite acesso de
leitura/gravao a volumes distribudos distncia nos locais em que os volumes
tm exatamente a mesma identidade de LUN SCSI. Essa tecnologia permite que os
hipervisores migrem VMs (virtual machines, mquinas virtuais) distncia e
simplifica a implementao do Oracle RAC entre datacenters
A linha de produtos VPLEX inclui o VPLEX Local (federao SAN em local nico),
volumes sncronos distribudos compatveis com o VPLEX Metro com latncia de
ida e volta de at 5 ms, e volumes assncronos distribudos compatveis com o
VPLEX Geo com ciclo de ida e volta de at 50 ms. Este paper destaca o
funcionamento do VPLEX Metro em conjunto com o Oracle RAC em clusters de
longa distncia (Oracle RAC estendido) para simplificar a infraestrutura SAN e
reduzir parte da complexidade do gerenciamento de armazenamento associada a
um modelo de implementao de RAC estendido.
O Oracle RAC permite a implementao transparente de um banco de dados nico
em um cluster de servidores, fornecendo tolerncia a falhas, alta disponibilidade e
dimensionamento. O Oracle RAC em clusters de longa distncia adota um modelo de
implementao no qual os servidores do cluster residem em locais fisicamente
separados. O Oracle RAC em clusters de longa distncia oferece uma forma de
dimensionar o desempenho, utilizar recursos de servidor e armazenamento em
mltiplos locais e, em comparao com as instalaes do Oracle RAC em local nico,
fornece maior resilincia para cenrios de falha em todo o local ou em operaes de
manuteno de datacenters sem tempo de inatividade dos aplicativos.
Principais benefcios do VPLEX Metro em um Oracle RAC estendido:
Pblico-alvo
Este white paper foi criado para administradores de banco de dados Oracle,
administradores de armazenamento e arquitetos de TI responsveis por projetar,
criar, gerenciar e usar ambientes de TI com foco em alta disponibilidade com
bancos de dados Oracle, tecnologias VPLEX e armazenamentos Symmetrix srie
VMAX. Este white paper parte do princpio de que os leitores tm alguma
familiaridade com o Oracle RAC, a tecnologia de banco de dados Oracle, o EMC
VPLEX e o storage array Symmetrix.
Introduo
O Oracle RAC estendido permite dimensionar, utilizar recursos de servidor e
armazenamento em mltiplos locais, alm de oferecer maior resilincia em cenrios de
falha e operaes de manuteno sem tempo de inatividade de aplicativos. Ele permite
que as organizaes eliminem o tempo de inatividade de banco de dados e continuem
o processo de negcio sem interrupes, mesmo em caso de falhas totais no local.
Embora o modelo de implementao do Oracle RAC em cluster estendido permita alta
disponibilidade em um banco de dados nico, a prtica recomendada implementar
uma soluo de recuperao de desastres no caso de distncias maiores, com o uso
de tecnologias como RecoverPoint, SRDF, Oracle Data Guard ou solues
semelhantes. Essas rplicas remotas podem ser teis no caso de falhas de banco de
dados (como excluso por engano de LUN ou file, corrupo de block, etc.) Alm
disso, outra prtica recomendada implementar uma estratgia de backup em fita
ou VTL (Virtual Tape Library, biblioteca de fitas virtuais), com o possvel uso da
tecnologia de clone/snapshot para liberar a produo do processo de backup.
Este white paper apresenta aos leitores a famlia EMC VPLEX, a arquitetura de
cluster do VPLEX Metro, assim como os recursos e funes relevantes para uma
implementao do Oracle RAC estendido. Ele tambm discute a resilincia da
soluo Oracle RAC estendido em vrias situaes de falha. Alm disso, este
white paper apresenta as etapas de provisionamento para o armazenamento do
VPLEX e do Symmetrix srie VMAX na plataforma Oracle RAC estendido, assim
como para a execuo de carga de trabalho OLTP (Online Transaction Processing,
processamento de transaes on-line) em um Oracle RAC estendido de quatro ns
com a tecnologia VPLEX Metro e Symmetrix VMAX.
VPLEX Local
VPLEX Metro
Oracle RAC nem com o Oracle RAC estendido e no ser detalhado neste
documento. Para obter mais informaes sobre o VPLEX Geo, visite
Descrio
Cluster VPLEX
Engine do VPLEX
Director do VPLEX
Os detalhes desta seo so baseados no VPLEX verso 5.1 e podem ser diferentes em outras verses. O guia do
produto VPLEX fornece detalhes sobre cada verso especfica.
10
11
Regras de desanexao
As regras de desanexao so regras predefinidas que determinam a semntica
de processamento de I/O para um consistency group quando a conectividade com
um cluster remoto perdida, por exemplo, no caso de particionamento de rede ou
falha de cluster remoto. Nessas situaes, at que a comunicao seja
restaurada, a maioria das cargas de trabalho exige conjuntos especficos de
volumes virtuais para continuar o I/O em um cluster e suspender o I/O no outro.
Em uma configurao VPLEX Metro, as regras de desanexao podem representar
um cluster esttico preferido por meio da definio de 2 : winner:cluster-1,
winner:cluster-2 ou No Automatic Winner (o ltimo especifica que no h um
cluster preferido). Quando o sistema implementado sem o VPLEX Witness
(discutido na prxima seo), os I/Os para os dispositivos do consistency group
continuam no cluster preferido e so suspensos no cluster no preferido.
VPLEX Witness
O VPLEX Witness, apresentado com o GeoSynchrony 5.0, um componente
necessrio para as implementaes do Oracle RAC estendido. O VPLEX Witness se
conecta com os dois clusters VPLEX Metro em uma rede IP de gerenciamento.
Reconciliando as prprias observaes com as informaes relatadas
periodicamente pelos clusters, o VPLEX Witness possibilita que os clusters
diferenciem as falhas de partio de rede das falhas de cluster, continuando o I/O
automaticamente nessas situaes no local apropriado. O VPLEX Witness afeta
apenas os volumes virtuais que so membros dos consistency groups sncronos
em uma configurao VPLEX Metro e apenas quando as regras de anexao
indicam o cluster 1 ou o cluster 2 como preferidos para o consistency group. Isso
significa que o VPLEX Witness no afeta consistency groups onde a regra No
Automatic Winner est em vigor.
Sem o VPLEX Witness, se dois clusters VPLEX perderem contato, as regras de
desanexao do consistency group em vigor definem qual cluster continua a
operao e qual suspende o I/O como explicado anteriormente. O uso de regras
de desanexao apenas para controlar qual local o vencedor pode adicionar
uma complexidade desnecessria no caso de uma falha no local, porque talvez
seja necessrio intervir manualmente para retomar o I/O no local sobrevivente. O
VPLEX Witness lida com esse evento dinmica e automaticamente, por isso esse
um requisito absolutamente necessrio para implementaes do Oracle RAC. Ele
possui os seguintes recursos:
Para que o VPLEX Witness possa distinguir corretamente entre condies de falha,
ele deve ser instalado em um domnio independente de falha a partir de cada
cluster com o uso de interfaces de rede diferentes para cada um. Isso eliminar a
possibilidade de que uma mesma falha afete o cluster e o VPLEX Witness. Por
2
Com base nas opes da GUI (Graphical User Interface, interface grfica do usurio). A CLI (Command Line Interface,
interface de linha de comando) usa termos ligeiramente diferentes para especificar as mesmas regras.
12
13
14
Dispositivos
de dados
Thin-pool
15
16
Notas adicionais
Na plataforma de servidor baseada em x86, verifique se as parties esto
alinhadas. O VPLEX requer alinhamento com deslocamento de 4 KB. Entretanto, se
o Symmetrix for usado em alinhamento com deslocamento de 64 KB (128 blocks),
que alinhado nativamente no limite de 4 KB tambm:
No Windows, pode ser usado diskpar ou diskpart. No Linux, pode ser usado
fdisk ou particionado.
A partir do Oracle 11g Release 2, o nmero de voting files do Oracle Clusterware determinado automaticamente pelo
nvel de redundncia do ASM. A redundncia Externa, por exemplo, requer um voting disk, a redundncia Normal requer
trs voting disks, e a redundncia Alta requer cinco voting disks.
17
Oracle RAC
(no estendido)
Tempo de inatividade
implcito at o host e o
aplicativo retomarem as
operaes.
O Oracle TAF
(Transparent Application
Failover) pode ser usado
para permitir o failover
automtico das sesses
em um n de cluster
sobrevivente.
18
Tempo de inatividade
implcito at o host e o
aplicativo retomarem
as operaes.
Com a instalao do
VPLEX Witness e
clusters em domnios
de falha
independentes (como
em outro prdio ou
local), ele se torna
resiliente a falhas no
local, prdio ou
laboratrio.
O cluster VPLEX no
domnio de falha no
afetado pelo desastre
continuar a exibir
I/Os para o aplicativo.
Use o Oracle TAF
(Transparent
Application Failover)
para permitir failover
automtico de
conexo de usurio
nos ns de cluster
sobreviventes.
Falha da instncia do
banco de dados ou
desconexo de rede
pblica
Tempo de inatividade
implcito at que a instncia
seja recuperada ou a rede
pblica reconectada.
Oracle RAC
(no estendido)
O Oracle RAC fornece
resilincia de banco
dados para falhas de
ns N-1 (ns com N=
ns no cluster) por meio
da recuperao
automtica da instncia
e da presena de outros
ns de cluster prontos
para conexes de
usurio.
N/D
19
Oracle RAC
(no
estendido/estendido)
Se um drive comear a
apresentar falhas, o drive hot
spare do Symmetrix copiar
os dados, e o EMC
Enginuity iniciar o Call
Home para informar o
suporte EMC imediatamente.
Componentes do
storage array, inclusive
director board (cache,
I/O)
Os componentes do
Symmetrix so totalmente
redundantes, inclusive o
cache espelhado, que
tambm persistente (usa
compartimentao no caso
de falha de energia
prolongada), fontes de
alimentao e directors
redundantes.
Os dados do Symmetrix so
protegidos pelo padro T10 DIF
(Data Integrity Field) desde que
entram no armazenamento at
sarem dele.
20
Tempo de inatividade
implcito at que a
conectividade do storage
array seja retomada.
O tempo de inatividade
implcito, a no ser
que o espelhamento
baseado em host (ASM)
seja configurado entre
arrays ou at que a
conectividade do
storage array seja
retomada.
O consistency group
sncrono do VPLEX
Metro continua a
exibir I/Os nos dois
locais, mesmo se um
dos storage arrays
no estiver
disponvel.
O Oracle Clusterware
no toma
conhecimento da
indisponibilidade do
armazenamento, j
que o cluster VPLEX
continua a atender
todos os I/Os.
Porta front-end
Oracle RAC
(no
estendido/estendido)
De forma semelhante s
portas front-end, use
conectividade de switch
redundante com portas backend do VPLEX tambm, j
que elas se conectam com o
storage array.
21
Partio de
interconexo do VPLEX
Cluster VPLEX
indisponvel
Os componentes do VPLEX
so totalmente redundantes,
inclusive o cache persistente
(usa compartimentao no
caso de falha de energia
prolongada), fontes de
alimentao e directors
redundantes.
N/D
N/D
N/D
N/D
O VPLEX Witness
permitir que o I/O
reinicie no cluster
VPLEX. Os ns do
Oracle RAC conectados
a esse cluster VPLEX
continuaro as
operaes com RTO
(Recovery Time
Objective, objetivo de
tempo de recuperao)
0.
Use o Oracle TAF
(Transparent
Application Failover)
para permitir a
reconexo automtica
do client aos ns do
Oracle RAC conectados
ao cluster VPLEX
sobrevivente
22
23
Verso
Oracle Linux Release 5 Update 4 x86_64
EMC PowerPath
Oracle
24
A separao dos grupos de discos do ASM +DATA, +LOG e +FRA permite que a
tecnologia seja usada para descarregar backups da produo. Durante o
processo de backup dinmico, os grupos de discos +DATA e +FRA so
clonados em horrios diferentes. Alm disso, replicaes remotas, como do
RecoverPoint e SRDF, criam nativamente uma rplica reinicivel do banco de
dados. Rplicas reiniciveis no acessam registros de arquivamento durante
falha ou recuperao de instncia, por isso os registros de arquivamento
(grupo de discos +FRA) no precisam fazer parte da replicao.
25
Grupo de discos
do ASM +Grid
Grupo de discos
do ASM +REDO
Banco de
dados:
Nome:
ERPFINDB
Tamanho: 1 TB
Nm LUNs: 38
+DATA: Grupo de
discos do ASM
Vinculao
de thinpools
Redo_Pool
devices
Dispositivos de
dados
5 thin LUNs de
20 GB
(15F:163)
56 RAID1 de
30 GB
Redo_Pool
5 thin LUNs de
20 GB
(164:168)
Data_Pool
25 thin LUNs
de 60 GB
(1A5:1B4)
56 RAID5 de
230 GB (3+1)
(C5:FC)
6 thin LUNs de
50 GB
(17D:182)
+TEMP: Grupo de
discos do ASM
2 thin LUNs de
50 GB
+FRA: Grupo de
discos do ASM
Metadispositivos
VPLEX
Thin
Temp_Pool
56 RAID5 de
60 GB
(3+1)
2 thin LUNs de
2 x 80 GB
(2E5:2E8)
(8D:C4)
VPLEX
VPLEX Log
2 thin LUNs de
50 GB
(2E9:2EA)
26
27
28
um tnel VPN (Virtual Private Network, rede privada virtual) seguro. necessrio
configurar o VPLEX Metro com redes Fibre Channel ou Ethernet de 10 gigabits
completamente independentes e redundantes (dual-fabric) entre os clusters para
a conexo entre os directors. Isso oferece desempenho mximo, isolamento de
falhas, tolerncia a falhas e disponibilidade. Figura 9 um exemplo de
zoneamento de conectividade da WAN entre clusters.
Address
Role
Port Status
-------
------------------
---------
A2-FC00
0x500014426011ee20
wan-com
up
A2-FC01
0x500014426011ee21
wan-com
up
A2-FC02
0x500014426011ee22
wan-com
up
A2-FC03
0x500014426011ee23
wan-com
up
-----------
/engines/engine-1-1/directors/director-1-1-B/hardware/ports:
Name
Address
Role
Port Status
-------
------------------
---------
B2-FC00
0x500014427011ee20
wan-com
up
B2-FC01
0x500014427011ee21
wan-com
up
B2-FC02
0x500014427011ee22
wan-com
up
B2-FC03
0x500014427011ee23
wan-com
up
-----------
/engines/engine-2-1/directors/director-2-1-A/hardware/ports:
Name
Address
Role
Port Status
29
------- ------------------
---------
-----------
A2-FC00
0x5000144260168220
wan-com
up
A2-FC01
0x5000144260168221
wan-com
up
A2-FC02
0x5000144260168222
wan-com
up
A2-FC03
0x5000144260168223
wan-com
up
/engines/engine-2-1/directors/director-2-1-B/hardware/ports:
Name
Address
Role
------- ------------------
Port Status
---------
-----------
B2-FC00
0x5000144270168220
wan-com
up
B2-FC01
0x5000144270168221
wan-com
up
B2-FC02
0x5000144270168222
wan-com
up
B2-FC03
0x5000144270168223
wan-com
up
---------
----------
---------
--------
------------------
------------
cluster-1
true
false
ok
ok
cluster-2
true
false
ok
ok
Islands:
Island ID
Clusters
---------
--------------------
cluster-1, cluster-2
30
A conectividade das engines do VPLEX aos storage arrays deve seguir as prticas
recomendadas para o array. Uma discusso detalhada sobre as prticas
recomendadas para a conexo do armazenamento de back-end est alm do
escopo deste paper. O livro tcnico EMC VPLEX Architecture and Deployment:
Enabling the Journey to the Private Cloud fornece mais informaes.
Administrao do VPLEX Metro
A administrao do VPLEX Metro que executa o Geosynchrony 5.1 pode ser feita
por meio do EMC Unisphere para VPLEX Management Console. Algumas funes
avanadas adicionais so fornecidas pela interface de linha de comando do
VPLEX. Ao autenticar a interface grfica do usurio segura baseada na Web, o
usurio v vrias opes de configurao na tela, listadas na ordem em que foram
concludas. A ajuda on-line do EMC Unisphere para VPLEX Management Console
fornece mais informaes sobre cada etapa do workflow. A tabela a seguir resume
as etapas que devem ser seguidas desde a deteco dos arrays at o momento
em que o armazenamento fica visvel para o host.
Etapa Ao
1
Detectar o armazenamento disponvel
O VPLEX Metro detecta automaticamente os storage arrays que esto conectados s
portas back-end. Todos os arrays conectados a cada director do cluster esto listados na
exibio Storage Arrays.
Criar extents
Crie extents para os volumes de armazenamento selecionados e especifique a capacidade.
Registre os iniciadores
Quando os iniciadores (hosts que acessam o armazenamento) esto conectados
diretamente ou por meio de um fabric Fibre Channel, o VPLEX Metro os detecta
automaticamente e preenche a exibio Iniciadores. Aps a deteco dos iniciadores,
voc deve registr-los com o VPLEX Metro para que eles possam ser adicionados a uma
exibio do armazenamento e acessar o armazenamento. O registro de um iniciador d
um nome significativo ao nome mundial da porta, que geralmente o nome do servidor
DNS, para permitir que voc identifique o host com facilidade.
31
32
33
add <key>
powermt config
powermt display
Pseudo name=emcpowerk
Invista ID=FNM00100600231
Logical device ID=6000144000000010A002636D3C679C6A
state=alive; policy=ADaptive; priority=0; queued-IOs=0
==============================================================================
---------------- Host --------------###
HW Path
I/O Paths
- Stor Interf.
-- I/O Path -
-- Stats ---
Mode
Q-IOs Errors
State
==============================================================================
1 lpfc
sdaq
08
active
alive
2 lpfc
sdbu
00
active
alive
2 lpfc
sdcy
08
active
alive
1 lpfc
sdm
00
active
alive
Depois disso, copie o arquivo para os outros hosts. Encerre qualquer aplicativo
que esteja usando dispositivos de armazenamento, desmonte qualquer file
system ou exporte qualquer volume LVM (Logical Volume Management,
gerenciamento de volumes lgicos). Em seguida, execute:
<target host> emcpadm check_mapping [-v] -f <mapping_file_name>
<target host> emcpadm import_mapping -f <mapping_file_name>
34
Reservados Incio
(63 blocks) padro da
Novo incio
da partio
64 K
64 K
[ENTER]
Boot
Start
1
End
52218
Blocks
53471168
Id System
83 Linux
35
AF
00
00
00
00
Hd Sec
1
1
0
0
0
0
0
0
Cyl
0
0
0
0
Hd Sec Cyl
63 32 1023
0
0
0
0
0
0
0
0
0
Start
128
0
0
0
Size ID
106942336 83
0 00
0 00
0 00
Aps a criao das parties, verifique se elas so reconhecidas pelos outros ns.
Talvez seja necessrio executar o comando fdisk em cada n e gravar (w) a
tabela de parties. Como alternativa, examinar o barramento SCSI ou reinicializar
a partir de um dos outros ns tambm atualizar as informaes.
Instalar o Oracle e configurar um banco de dados Oracle RAC
A tabela a seguir resume as etapas que devem ser seguidas para configurar ns
de servidor Oracle para o Oracle Grid Infrastructure e a instalao do banco de
dados ASM, de acordo com o Guia de Instalao do Grid Infrastructure para Linux
do Oracle 11g Release 2 (11.2.0.2) e o Guia de Instalao de Banco de Dados para
Linux do Oracle 11g Release 2 (11.2.0.2). O Guia de Instalao do Oracle RAC
fornece mais detalhes. Os guias detalhados de instalao do Oracle esto
disponveis aqui:
http://www.oracle.com/technetwork/documentation/index.html#database
36
Ao
2
3
4
5
6
7
8
9
10
37
Taxa de transaes
VPLEX Metro fornece ao Oracle RAC resilincia e alto desempenho de I/O para
carga de trabalho OLTP (Online Transaction Processing, processamento de
transaes on-line) quando os dois datacenters esto localizados distncia
metropolitana de 100 km. Tambm foram realizados testes com a distncia de
500 km (ciclo de ida e volta de 5 ms) que demonstraram capacidade de expanso
semelhante, embora com uma taxa de transaes relativamente mais baixa
devido ao aumento da latncia. De um modo geral, a soluo comprovou a
capacidade do VPLEX e do Oracle RAC de aumentar o desempenho de aplicativo e,
ao mesmo tempo, fornecer maior disponibilidade. Como o benchmark do OLTP foi
completamente aleatrio, no foi constatado conflito de acesso de block. Em
implementaes com carga de trabalho reais do cliente, o DBA deve prestar
ateno (como de costume) a um possvel conflito de acesso entre os ns de
cluster, principalmente entre ns remotos, porque um conflito de acesso pode
reduzir a taxa geral de transaes.
25000
20000
15000
10000
5000
0
1
Taxa de transaes
Distncia: 100 km
(ciclo de ida e volta de 1 ms)
25000
20000
15000
10000
5000
0
1
38
Concluso
O EMC VPLEX Metro, com o sistema operacional GeoSynchrony, uma tecnologia
corporativa de federao baseada em SAN que agrega e gerencia pools de storage
arrays conectados por Fibre Channel que podem estar localizados em um s
datacenter ou em vrios datacenters separados geograficamente por distncias
metropolitanas. Alm disso, com uma arquitetura exclusiva de scale-up e scaleout, a coerncia de cache distribudo e armazenamento avanado em cache de
dados do EMC VPLEX fornece resilincia de carga de trabalho, compartilhamento
automtico, bem como balanceamento e failover de domnios de armazenamento,
permitindo o acesso local e remoto aos dados com nveis de servio previsveis. O
Oracle RAC estendido distribudo em dois datacenters distncia metropolitana,
com os recursos do EMC VPLEX METRO, fornece topologias de implementao
simplificadas, administrao de armazenamento, atualizao tcnica e
capacidade de expanso de armazenamento no disruptiva. Alm disso, o EMC
VPLEX tem a capacidade de fornecer recursos para o gerenciamento de volumes e
movimentao no disruptiva de dados heterogneos em distncias sncronas,
permitindo que os clientes ofeream servios em nuvem econmicos e dinmicos
distribudos por mltiplos locais fsicos.
39
Referncias
Os documentos a seguir, que fornecem mais informaes sobre o VPLEX e o
Oracle RAC estendido, podem ser encontrados nos sites brazil.emc.com e
docs.oracle.com, assim como no Powerlink:
Livro tcnico EMC VPLEX Metro Witness Technology and High Availability
http://www.oracle.com/goto/rac
40