Professional Documents
Culture Documents
Replicao
Alunos:
Felipe Marlon de Carvalho Sales
Fernando Henrique Ferreira e Silva
Consistncia e Replicao
Dados replicados so utilizados para aprimorar a
confiabilidade ou melhorar o desempenho;
Um dos principais problemas manter as rplicas
consistentes;
Modelos de consistncia tem como premissa que
vrios processos acessam dados compartilhados;
Modelos de consistncia para dados
compartilhados costumam ser difceis de
implementar com eficincia em sistemas de
grande escala;
Gerenciamento de Rplicas
Onde, quando e por quem rplicas devem ser
posicionadas?
Posicionar servidores de rplicas;
o posicionamento de hardware: encontrar as
melhores localizaes para colocar um servidor que
pode hospedar depsito de dados (ou parte dele);
Posicionar contedo;
o posicionamento dos dados e softwares:
encontrar o melhor servidor para colocar contedo.
Gerenciamento de Rplicas
Posicionamento do servidor de rplicas
Consiste em selecionar as melhores K de N localizaes
para se instalar servidores de rplicas;
Resolvidos por heursticas baseadas na distncia
(latncia, largura de banda) entre clientes e localizaes;
Ignorar posies de clientes considerando a Internet
como um conjunto de Sistemas Autnomos (AS) e distribuir
replicaes nos AS que possuem maior nmero de enlaces;
Identificar regies para posicionamento de rplicas
contendo ns que acessam o mesmo contedo.
Necessrio determinar o tamanho das clulas, feito pela
funo
da distncia mdia entre dois ns e do nmero de rplicas
requeridas.
Gerenciamento de Rplicas
Replicao e posicionamento de contedo
So distinguidos trs tipos de rplicas organizadas logicamente:
Rplicas permanentes: conjunto inicial de rplicas que
constituem um depsito distribudo;
Servidores que esto em uma nica localizao;
Espelhamento (servidores geograficamente espalhados pela
Internet).
Rplicas iniciadas por servidor: cpias de um depsito de
dados para aprimorar desempenho e criadas por iniciativa do
(proprietrio do) depsito de dados.
Para reduzir carga do servidor;
Replicao ou migrao de arquivos para proximidade de
clientes que emitem muitas requisies;
Rplicas iniciadas por cliente;
Cache na mquina do cliente;
Cache em mquina compartilhada por clientes de uma LAN.
Gerenciamento de Rplicas
Replicao e posicionamento de contedo
Gerenciamento de Rplicas
Distribuio de contedo
O gerenciamento de rplicas tambm trata da
propagao de contedo atualizado para servidores
de rplicas relevantes, seguindo os compromissos:
Estado vs. Operaes.
Protocolos de recuperao de atualizao vs.
protocolos de envio de atualizaes.
Unicast vs. Multicast.
Protocolos de Consistncia
Protocolos baseados em
servidor-primrio
Servidor primrio-de-apoio com leitura local (remote-write):
Escritas encaminhadas e executadas no primrio;
Leitura Remota;
Atualizaes bloqueiam at terem executado em todas as
rplicas;