Professional Documents
Culture Documents
Esse material foi utilizado no curso de Recife-PE nos dias 24, 25, 26, 27 e 28 de setembro de 2012 O prximo curso ser em Belo Horizonte nos dias 10,11,12,13 e 14 de dezembro de 2012
1.0
Viso Geral sobre BGP
1. Viso geral sobre BGP 1.1 Introduo 1.2 Requisitos para se tornar um sistema autnomo 1.3 Preenchendo o formulrio do Registro.br 1.4 Quando utilizar IGP e EGP 1.5 Atributos BGP 1.6 Entendendo o processo de escolha de rotas
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
Verso do material: 2.1 ltima publicao: 08/10/2012
1.1 Introduo
Diferenas entre FIB e RIB:
Fowarding Information Base (FIB)
Quando um router recebe 2 rotas diferentes para o mesmo prefixo os critrios de escolha de rota so analisados. A rota que foi considerada melhor de acordo com os critrios BGP fica na FIB. (caso no haja uma rota de melhor metrica esttica ou recebida por outro protocolo de roteamento) Router Information Base (RIB) As rotas que no foram consideradas melhores ficaro guardadas na RIB e sero utilizadas caso a rota principal fique indisponvel. O BGP jamais anuncia uma prefixo que no esteja na FIB!
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 3
1.1 Introduo
Distncias administrativas:
Outro ponto importante a distncia administrativa, caso 2 prefixos sejam idnticos, o router analisa essa distncia, a menor sempre "ganha". Caso sejam iguais, os critrios particulares do protocolo de roteamento correspondente sero analisados:
Directamente Conectada 0 Esttica 1 eBGP 20 EIGRP (Interno) 90 IGRP 100 OSPF 110 ISIS 115 RIP 120 EGP 140 EIGRP (Externo) 170 iBGP 200 BGP Local 200 Desconhecido 255
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 4
1.1 Introduo
A verso corrente do BGP a verso 4, especificada na RFC 1771 o protocolo responsvel por fazer a internet funcionar da maneira que
1.1 Introduo
Algumas Caractersticas:
1. um protocolo do tipo vetor de caminho; 2. As tabelas completas de roteamento so trocadas entre os dois routers no incio da sesso e as atualizaes adicionais incrementais so enviadas em seguida; 3. Atualizaes adicionais so enviadas imediatamente atravs de mensagens de update; (padro) 4. Utiliza por padro a porta TCP 179;
1.1 Introduo
Mensagens BGP:
1. Open (abertura) - a primeira mensagem enviada por um router que deseja estabelecer uma sesso com outro, esse por sua vez tambm envia uma mensagem open. Aps recebidas essas mensagens, cada router envia a primeira mensagem de keep alive e a sesso estabelecida. 2. Update (atualizao) - dentro dessas mensagens que vo informaes sobre cada prefixo que est sendo anunciado, uma mensagem de update tambm pode conter informaes sobre redes que ficaram indisponveis e devem ser removidas 3. Notificao (notification message) enviada quando uma condio de erro detectada; elas so usadas para encerrar uma sesso ativa e informar a quaisquer roteadores conectados do porque do encerramento da sesso. 4. Keep-alive (ainda estou aqui) - De tempo em tempo cada router envia uma mensagem de keep-alive para que o vizinho saiba que h conectividade IP. Caso o keep-alive atrase, o router comea a contagem de hold-time e, se nesse perodo no for recebido nenhum keep-alive, a sesso finalizada. Tanto o tempo de keep-alive como o de hold-time podem ser configurados para mais ou menos tempo de acordo com o tipo de link.
1.2
Requisitos para se tornar um Sistema Autnomo
http://registro.br/provedor/numeracao/regras.html Uma organizao justifica a designao de um ASN quando apresenta uma das seguintes necessidades:
Multi Provedor: Quando a organizao est conectada a dois ou mais provedores de transito Internet distintos e independentes e necessita, portanto, fazer uso de protocolos de roteamento dinmico. Poltica nica de roteamento: Quando a organizao possui uma poltica de roteamento que distinta daquela aplicada pelo(s) provedor(es) de transito Internet.
1.3
Preenchendo o Formulrio do registro.br
10
11
1.4
12
O BGP foi desenvolvido para troca de rotas entre Sistemas Autnomos distintos, sendo assim, no h nenhum motivo para um provedor de servios utilizar BGP se esse no possuir um ASN. A finalidade do BGP permitir que os IPs do Sistema Autnomo apaream na internet. Tecnicamente nada impede de utilizar BGP com apenas uma operadora, porm um requisito para obter um ASN:
13
Caso um dos clientes do provedor tambm seja um Sistema Autnomo indispensvel a utilizao do BGP com o cliente e operadoras de trnsito.
14
1.5
Atributos BGP
15
Conhecidos obrigatrios (Well-known mandatory): Alm de obrigatrio em todas as implementaes, precisam estar em todas as mensagens de update trocadas entre os roteadores via BGP.
Conhecidos discricionrios (Well-known discretionary): Semelhantes aos obrigatrios, porm no precisam estar contidos em todas as mensagens de update.
16
Opcional transitivo (Optional transitive): No precisam ser implementatos por todos os fabricantes, e quando sim, podem ser propagados para outros neighbors atravs de mensagens de update. Opcional no-transitivo (Optional non-transitive): Semelhantes aos citados acima, porm, um router nunca propaga esses atributos para outro neighbor.
17
Uma boa descrio pode ser encontrada no livro CCNP BSCI Official Exam Certification Guide, 4th edition de Brent Steward:
18
1.6
19
Em primeiro lugar, o BGP apenas analisa os atributos para "desempatar" duas ou mais rotas para o MESMO PREFIXO. Caso haja um prefixo mais especfico esse sempre ser preferido independentemente dos seus atributos "mais favorveis".
20
1. 2. 3. 4. 5. 6. 7.
Rota com maior valor de WEIGHT (Cisco, Quagga, RouterOS, OpenBGPD) Rota com maior valor de LOCAL_PREF Rota originada localmente (bgp network) Rota com o menor AS_PATH. Rota com menor tipo de origem. IGP (i) < EGP (e) < INCOMPLETE (?) Rota com menor mtrica multi-exit discriminator (MED). Escolhe a rota recebida por (eBGP) em relao a uma (iBGP).
21
A anlise segue para o prximo critrio apenas quando h empate no critrio atual, assim, o tamanho do AS PATH s ser analisado caso o valor de weight e local preference sejam os mesmos para as duas rotas.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 22
1.6
PERGUNTAS?
23
2.0
Primeiros Passos para Aparecer na Internet
2. Primeiros Passos para Aparecer na Internet 2.1-Configurando BGP com apenas um link 2.2-Analisando as rotas recebidas 2.3-Configurando BGP com 2 links 2.4-Utilizando um Looking Glass 2.5-Fail-Over automtico 2.6-Escolhendo o melhor link 2.7-Balanceamento de links 2.8-Implementando alta disponibilidade com VRRP 2.9-BGP Timers
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
24
2.1
Configurando BGP com apenas um link
25
LAB 1-1-1
Antes de comear, vamos entender o cenrio no ponto de vista geral, onde cada aluno dono de um AS: CENARIO 1-1
26
LAB 1-1-1
Nesse LAB, cada aluno possui um Cisco 3660 com uma placa serial modelo NM-4T conectado ao AS 100 na interface s1/1 e uma fast ethernet conectada ao switch da sala do curso. O X deve ser endendido como o AS do aluno (1 at 24).
27
LAB 1-1-1
O router de cada grupo responde pelo IP X.128.0.254/9 (onde X o nmero do grupo). Para acess-lo, configurem nos seus laptops um IP dentro dessa mesma rede preferencialmente .1 e gateway padro X.128.0.254. Verifiquem a conectividade IP e em caso positivo abram uma sesso telnet com esse equipamento:
ALUNO@notebook# telnet X.128.0.254 Trying X.128.0.254... Connected to X.128.0.254. Escape character is '^]'. User Access Verification Para quem usa windows pode usar o Putty...... http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html
LAB 1-1-1
Para iniciar as configuraes precisaremos inicialmente entrar no modo privilegiado, e ser exigida uma outra senha:
G1-R1>enable Password: gXr1 GX-R1#
LAB 1-1-1
LAB 1-1-1
31
LAB 1-1-1
Verificando os anncio que recebo da minha operadora: GX-R1#show ip bgp neighbors 100.X.1.1 routes
Network *> 100.0.0.0 Next Hop 100.X.1.1 Metric LocPrf Weight Path... 0 100 i 0 100 111 55 123 i
Posteriormente veremos na prtica a diferena entre os comandos com received-routes e apenas routes no final.
32
LAB 1-1-1
Agora todos tentam ping para 123.123.123.1 a partir do seu router: Sucesso?? Agora um Traceroute!
Em seguida ping para 123.123.123.1 a partir do seu laptop Sucesso?? Agora um Traceroute!
LAB 1-1-1
Esse ponto merece uma pausa para analisar algo importante no Troubleshooting. Ao executar um traceroute um host verifica a sua tabela de roteamento, caso no haja ocorrncias os pacotes do traceroute so encaminhados pela rota padro, no sendo nada especificado no comando, o IP de origem sempre o mesmo da interface conectada ao next-hop.
Em nosso LAB qual o next-hop para 123.123.123.1 ? Provavelmente 100.X .1.1, qual IP o router vai utilizar como origem?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 34
LAB 1-1-1
O IP de origem 100.X.1.2 que por sua vez est dentro de uma rede conhecida pelo looking glass (123.123.123.1).
J o laptop no consegue alcanar o destino porque o seu IP de origem X.128.0.1, rede que no conhecida pelo looking glass j que ainda no anunciamos nada.
No se trata ento de o laptop no conseguir alcanar 123.123.123.1, na verdade os pings disparados pelo laptop chegam ao seu destino, porm o destino no sabe para quem responder.
35
LAB 1-1-1
GX-R1(config)# router bgp X !--- entra no nodo de configurao BGP GX-R1(config-router)#network X.0.0.0 mask 255.0.0.0 !--- adiciona a rede x.0.0.0 para ser anunciada a partir desse router GX-R1(config-router) auto-summary !--- permite que o BGP anuncie x.0.0.0/8 bastando com que haja qualquer !--- IP/rotaFIB dentro das redes declaradas em networks GX-R1(config-router)#end !--- volta ao modo provilegiado GX-R1# clear ip bgp 100.X.1.1 !--- reinicia a seso BGP
36
LAB 1-1-1
Auto-Summary:
Quando habilitamos o auto-summary, o BGP vai sumarizar na classe padro (classe A, B ou C) os prefixos declarados em network ou redistribute Algumas literaturas afirmam que o auto-summary no funciona com prefixos anunciados via comando network. possvel que isso ocorra em verses mais antigas do IOS, porm como podemos ver nesse LAB (IOS 12.4), temos um IP /32 em uma interface loopback, que por sua vez sumarizado e redistribudo como uma classe A importante lembrar que esse tipo de sumarizao ocorre apenas para classes PADRO, e muito dificilmente ser utilizado em produtividade.
37
LAB 1-1-1
Caso aparea algo parecido com isso, vamos testar novamente a conectividade IP com o looking glass a partir do laptop.
38
LAB 1-1-1
Sintam-se vontade para entrar no looking glass e executar testes de PING e TRACEROUTE!
39
2.1
PERGUNTAS?
40
2.2
41
Esse comando mostra todas as sesses BGP configuradas ativas e no ativas. Nesse laboratrio apenas uma sesso est configurada. Vamos entender o que cada campo significa...
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 42
100.X.1.1 4 100
Neighbor = 100.X.1.1
Esse o IP do router remoto (configurado em router BGP X).
43
100.X.1.1 4 100
V=4
Verso do BGP utilizada nessa sesso.
44
100.X.1.1 4 100
AS = 100
AS do neighbor remoto (configurado em neighbor 100.X.1.1 remote-as X).
45
100.X.1.1 4 100
46
100.X.1.1 4 100
TblVer = 22
Verso atual da tabela de rotas BGP, sempre que uma nova rota inserida ou removida o TblVer incrementado.
47
100.X.1.1 4 100
InQ = 0 OutQ = 0
Updates na fila de entrada e de sada.
48
100.X.1.1 4 100
Up/Down = 01:06:03
Contador das horas minutos e segundos desde de que a sesso foi estabelecida ou que a sesso ficou down, aps 24 horas o contador muda para 1d00h00m (dias/horas/minutos) aps uma semana 01w0d00h (semanas/dias/horas).
Antes de uma sesso estabelecer ao menos uma vez o contador fica em never.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 49
100.X.1.1 4 100
State/PfxRcd = 3
Esse campo merece uma ateno especial pois ser o mais frequentemente observado. Indica o estado da conexo BGP.
Nesse caso est contando 3 prefixos, mas existem 5 estados possveis, IDLE, CONECT, ACTIVE, OPENSENT, OPENCONFIRM e ESTABLISHED, iremos entender melhor cada um desses estados nos prximos slides.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 50
State/PfxRcd IDLE
o estado em que a sesso fica quando interrompida por uma mensagem de notificao ou interveno do administrador, esse estado, quando se prolonga por muito tempo, aponta algum possvel problema de conectividade IP ou ainda que o BGP no foi configurado corretamente do lado remoto.
51
State/PfxRcd ACTIVE
ACTIVE: O BGP tenta estabelecer comunicao com um peer inicializando uma conexo TCP. Caso esta seja bem sucedida, passa-se ao estado OPENSENT. Se esta tentativa no for bem sucedida, pelo motivo de expirao do tempo, por exemplo, o estado passa para CONNECT. Em cada interrupo pelo sistema ou pelo administrador, volta ao estado IDLE. Geralmente as transies entre o estado de CONNECT e ACTIVE refletem problemas no nvel TCP.
52
State/PfxRcd CONNECT
Neste estado o BGP aguarda pela conexo TCP, com destino na porta 179. Quando a conexo estiver estabelecida, ou seja, com o recebimento da mensagem de OPEN, passase ao estado de OPENSENT. Se a conexo nvel de transporte no for bem sucedida, o estado vai para ACTIVE. No caso do tempo de espera ter sido ultrapassado, o estado volta para CONNECT. Em qualquer outro evento o estado retorna para IDLE.
53
OPENSENT: Neste estado o BGP aguarda pela mensagem de OPEN e faz uma checagem de seu contedo. Caso seja encontrado algum erro como nmero de AS incoerente ao esperado ou a prpria verso do BGP, envia-se uma mensagem tipo NOTIFICATION e volta ao estado de IDLE. Caso no ocorram erros na checagem, inicia-se o envio de mensagens KEEPALIVE. Em seguida, acerta-se o tempo de Hold Time, sendo optado o menor tempo entre os dois peers. Depois deste acerto, compara-se o nmero AS local e o nmero AS enviado pelo peer, com o intuito de detectar se uma conexo iBGP (nmeros de AS iguais) ou eBGP (nmeros de AS diferentes). Em caso de desconexo a nvel TCP, o estado passa para ACTIVE. Para as demais situaes de erro, como expirao do Hold Time, envia-se uma mensagem de NOTIFICATION com o cdigo de erro correspondente e retorna-se ao estado de IDLE. No caso de interveno do administrador ou o prprio sistema, tambm retorna-se o estado IDLE.
54
OPENCONFIRM: Neste estado o BGP aguarda pela mensagem de KEEPALIVE e quando esta for recebida, o estado segue para ESTABLISHED e a negociao do peer finalmente concluda. Com o recebimento da mensagem de KEEPALIVE, acertado o valor negociado de Hold Time entre os peers. Se o sistema receber uma mensagem tipo NOTIFICATION, retorna-se ao estado de IDLE. O sistema tambm envia periodicamente, segundo o tempo negociado, mensagens de KEEPALIVE. No caso da ocorrncia de eventos como desconexo ou interveno do operador, retorna-se ao estado de IDLE tambm. Por fim, na ocorrncia de eventos diferentes aos citados, envia-se uma mensagem NOTIFICATION, retornando ao estado de IDLE.
55
State/PfxRcd ESTABLISHED
ESTABLISHED: Neste estado, o BGP inicia a troca de mensagens de UPDATE ou KEEPALIVE, de acordo com o Hold Time negociado. Caso seja recebida alguma mensagem tipo NOTIFICATION, retorna-se ao estado IDLE. No recebimento de cada mensagem tipo UPDATE, aplica-se uma checagem por atributos incorretos, inconsistentes, duplicados, ou mesmo faltando, caso algum erro seja detectado, envia-se uma mensagem de NOTIFICATION, retornando ao estado IDLE. Por fim, se o Hold Time expirar ou for detectada desconexo ou interveno do administrador, tambm retorna-se ao estado de IDLE.
56
State/PfxRcd 3
Esse nmero no representa a quantidade de prefixos recebidos de um neighbor, mas sim a quantidade de prefixos que foram parar na RIB aps terem passado pelos filtros. Um State/PfxRcd 0 no significa necessariamente que no estou recebendo nenhuma rota, por exemplo, pode ser que o next-hop dessas rotas seja inalcanvel pelo meu router e assim elas no aparecem. Detalharemos esses casos posteriormente.
57
Esse comando mostra todas as rotas recebidas via BGP escolhidas (FIB) e no escolhidas (RIB). Como recebemos rotas de apenas um peer, no h rotas no escolhidas.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 58
...
Essa linha mostra a verso da routing table descrita nos slides anteriores.
60
Paths significa a quantidade de neighbors que me enviaram rotas para esse mesmo prefixo, ou seja, 1 avaliable diz que apenas 1 neighbor me enviou. best #1 a rota que foi escolhida (na ordem de cima para baixo) de acordo com os critrios do BGP weigh, local_pref, etc. table Default-IP-Routing-Table significa que as rotas esto na FIB padro. Mltiplas FIB's so usadas com VRF.
61
62
...
Essa mensagem significa que esse prefixo 123.0.0.0/8 no est sendo anunciada via BGP para nenhum neighbor. Na verdade qualquer rota nesse laboratrio aparecer com essa mensagem. Esse campo ser detalhado posteriormente na sesso AS de trnsito.
63
...
AS-PATH: mostra da direita para a esquerda o AS que originou essa rota e todos os ASs no caminho. Ou seja, o AS 123 originou o anncio para o AS 55 que recebeu, considerou como melhor rota e exportou para o as 111, depois para o AS 100, o qual tambm considerou como melhor e repassou para meu AS. Um ponto importante a se observar que mesmo que um AS tenha mil caminhos para um determinado prefixo, apenas UM que ele vai escolher como BEST # e passar adiante.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 64
...
O primeiro IP dessa linha significa o next-hop(prximo salto) para esse prefixo, caso o next-hop no esteja contido em uma rota vlida da FIB, esse jamais ser eleito como BEST. O segundo IP dessa linha me diz o endereo do neighbor que me enviou essa rota via BGP. O IP (X.X.X.X) na verdade o router-ID desse neigbor descrito acima.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 65
2.2
PERGUNTAS?
66
2.3
Configurando BGP com 2 links (MULTIHOMING)
67
LAB 1-2-1
Os prximos Laboratrios (1-2-1 e 1-2-2) utilizaro esse cenrio, e dessa vez, temos link tambm com o AS 200:
68
LAB 1-2-1
Nesse LAB, receberemos mais um link (AS 200) atravs da interface s1/0: !-- lembrando que X o nmero do AS do aluno
69
LAB 1-2-1
LAB 1-2-1
O nmero de PfxRcd vai ser maior a medida que os alunos estabeleceram suas conexes.
71
LAB 1-2-1
Detalhando as rotas recebidas via BGP Em 23 dos 24 routers parte da sada desse comando aparecer parecida com isto:
G1-R1>sh ip bgp
BGP table version is 9, local router ID is 1.1.1.1 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete
Network *> 1.0.0.0 *> 2.0.0.0 * *> 55.0.0.0 * *> 100.0.0.0 * *> 111.0.0.0 * * 123.0.0.0 *> * 200.0.0.0/8 *> * 222.0.0.0/8 *>
Next Hop 0.0.0.0 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1
Metric 0
LocPrf
Weight 32768 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Path i 100 2 i 200 2 i 100 111 55 i 200 222 123 55 i 100 i 200 2 100 i 100 111 i 200 2 100 111 i 100 111 55 123 i 200 222 123 i 100 2 200 i 200 i 100 2 200 222 i 200 222 i 72
LAB 1-2-1
Detalhando as rotas recebidas via BGP Porm em 1 dos 24 routers a sada ser diferente:
G1-R1>sh ip bgp BGP table version is 9, local router ID is 1.1.1.1 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete Network *> 1.0.0.0 *> 2.0.0.0 * *> 55.0.0.0 * *> 100.0.0.0 * *> 111.0.0.0 * * 123.0.0.0 *> *> 200.0.0.0/8 *> 222.0.0.0/8 Next Hop 0.0.0.0 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 100.1.1.1 200.1.1.1 200.1.1.1 200.1.1.1 Metric 0 LocPrf Weight 32768 0 0 0 0 0 0 0 0 0 0 0 0 Path i 100 2 i 200 2 i 100 111 55 i 200 222 123 55 i 100 i 200 2 100 i 100 111 i 200 2 100 111 i 100 111 55 123 i 200 222 123 i 200 i 200 222 i 73
LAB 1-2-1
0 0 0 0
Vamos ver a FIB do felizardo?. Por enquanto o importante saber que esse router passou a ser trnsito dos AS's 200 e 222 para alcanar o AS 100,111 e todos os seus downstreams. No caso desse router ficar down, outro grupo ficar na mesma situao... vamos ver quem?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 74
LAB 1-2-1
Evitando se tornar AS de trnsito dos meus UPSTREAMS Fazer anncios faz do meu router um potencial provedor de trnsito das redes que anuncio (dependendo da origem).
GX-R1>sh ip bgp neighbors 100.X.1.1 advertised-routes
...
Metric 0
Network *> X.0.0.0 *> 2.0.0.0 *> 55.0.0.0 *> 100.0.0.0 *> 111.0.0.0 ...
Metric LocPrf Weight Path 0 32768 i 0 100 2 i 0 100 111 55 i 0 100 i 0 100 111 i
75
LAB 1-2-1
Implementando filtros de sada em meus upstreams H vrias maneiras e vamos iniciar pela mais simples: 1) Criando uma prefix-list:
GX-R1(config)#ip prefix-list MEUS-BLOCOS permit X.0.0.0/8 !--- adiciona o bloco do AS do grupo na lista MEUS-BLOCOS GX-R1(config)#router bgp X GX-R1(config-router)#neighbor 200.X.1.1 prefix-list MEUS-BLOCOS out !---aplicar o mesmo filtro na sada do AS 200 GX-R1(config-router)#neighbor 100.X.1.1 prefix-list MEUS-BLOCOS out !--- aplicar o mesmo filtro na sada do AS 100 GX-R1(config-router)#end GX-R1#clear ip bgp *
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 76
LAB 1-2-1
Agora o router anuncia para os UPSTREAMS apenas o necessrio que o prefixo /8 correspondente ao grupo:
GX-R1>sh ip bgp neighbors 100.X.1.1 advertised-routes
BGP table version is 24, local router ID is 9.9.9.9 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete
Metric 0
Metric 0
77
2.3
PERGUNTAS?
78
2.4
Utilizando um Looking Glass
79
Um looking glass nada mais do que um router com acesso pblico em algum lugar da internet, em sua maioria, a interface web para facilitar a vida do usurio, mas o mesmo que entrar nesse router e executar certos comandos como: show ip bgp x.x.x.x, ping x.x.x.x, traceroute x.x.x.x Um dos mais famosos o Hurricane Eletric... http://lg.he.net
80
81
82
Em nosso LAB o Looking glass 123.123.123.1, vamos primeiramente verificar a conectividade com esse endereo:
ALUNO@notebook:~$ traceroute 123.123.123.1 -n traceroute to 123.123.123.1 (123.123.123.1), 30 hops max, 60 byte packets 1 X.128.0.254 5.292 ms 5.655 ms 5.640 ms 2 200.X.1.1 13.807 ms 14.198 ms 100.701 ms 3 200.200.1.1 111.035 ms 86.082 ms 86.477 ms 4 222.200.10.1 92.724 ms 92.302 ms 69.351 ms 5 222.222.1.1 127.492 ms 73.505 ms 69.707 ms 6 123.222.2.1 43.309 ms 78.401 ms 66.332 ms *Clientes Windows utilizam tracert 123.123.123.1
O que podemos concluir com esse traceroute? Meus pacotes entram no AS 200, depois no AS 222 e chegam ao seu destino.
83
Qual critrio o meu router (primeiro salto) utilizou para considerar esse caminho como melhor?
Vamos entender:
GX-R1>sh ip bgp 123.123.123.1 BGP routing table entry for 123.0.0.0/8, version 7 Paths: (2 available, best #2, table Default-IP-Routing-Table) Not advertised to any peer 100 111 55 123 100.X.1.1 from 100.X.1.1 (100.100.100.1) Origin IGP, localpref 100, valid, external 200 222 123 200.X.1.1 from 200.X.1.1 (200.200.200.1) Origin IGP, localpref 100, valid, external, best
Notem que em nenhuma das rotas h qualquer valor no atributo "weight" que o primeiro critrio, em segundo verificado o "localpref" que nos dois casos est em 100 (empate), o algoritmo de seleo de rotas segue ento para o prximo "critrio de desempate" (menor AS Path) onde a rota #2 foi mais feliz.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 84
Verifique agora que o mesmo critrio (menor AS Path) fez o router decidir pelo "mesmo caminho para alcanar o notebook do aluno:
AS-123-R1>sh ip bgp X.128.0.1 BGP routing table entry for X.0.0.0/8, version 45 Paths: (2 available, best #2, table Default-IP-Routing-Table) Advertised to non peer-group peers: 123.55.2.2 55 111 100 X 123.55.2.2 from 123.55.2.2 (55.55.55.2) Origin IGP, localpref 100, valid, external 222 200 X 123.222.2.2 from 123.222.2.2 (222.222.222.2) Origin IGP, localpref 100, valid, external, best
86
2.4
PERGUNTAS?
87
2.5
Fail-Over Automtico
88
LAB 1-2-2
LAB 1-2-2
Com o AS 200 down ,os pacotes entram no AS 100, depois no AS 111, e s depois de passar no AS 55 alcanam o destino (looking glass).
90
LAB 1-2-2
Agora note que a rota alternativa (mais distante) passou a ser utilizada e o "melhor caminho" que havia no existe mais, restando apenas o "pior caminho" que dadas as circunstncias, passou a ser um "timo" caminho:
GX-R1>sh ip bgp 123.123.123.1 BGP routing table entry for 123.0.0.0/8, version 16 Paths: (1 available, best #1, table Default-IP-Routing-Table) Not advertised to any peer 100 111 55 123 100.X.1.1 from 100.X.1.1 (100.100.100.[1-3]) Origin IGP, localpref 100, valid, external, best
91
LAB 1-2-2
LAB 1-2-2
Verifiquem que o looking glass escolhe o caminho mais longo para chegar ao notebook do aluno: *agora a nica rota disponvel
AS-123-R1>sh ip bgp X.128.0.1 BGP routing table entry for 1.0.0.0/8, version 49 Paths: (1 available, best #1, table Default-IP-RoutingTable) Advertised to non peer-group peers: 123.222.2.2 55 111 100 X 123.55.2.2 from 123.55.2.2 (55.55.55.2) Origin IGP, localpref 100, valid, external, best
E essa mensagem "advertised to... 123.222.2.2" ? Nos slides anteriores era "advertised to 123.55.2.2"
Vamos ver o debug do as 123 aps um clear ip bgp Mas deixa claro que a(s) rede(s) do(s) aluno(s) esto sendo anunciadas para o as 222, e consequentemente para o AS 200 Vamos comprovar... v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 93
LAB 1-2-2
Agora alcanamos o AS 200 pelo caminho mais longo possvel, AS 100, AS 111, AS 55, AS 123, AS 222 e finalmente AS 200. Vamos analizar...
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 94
LAB 1-2-2
GX-R1>sh ip bgp 200.200.200.10 BGP routing table entry for 200.0.0.0/8, version 20 Paths: (1 available, best #1, table Default-IP-Routing-Table) Not advertised to any peer 100 111 55 123 222 200 100.X.1.1 from 100.X.1.1 (100.100.100.1) Origin incomplete, localpref 100, valid, external, best
Observe o AS Path, precisamos dar a "volta ao mundo" para alcanar o AS 200. Discutiremos solues alternativas nos prximos captulos.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 95
LAB 1-2-2
ALUNO@notebook:~$ telnet 200.200.200.10 Trying 200.200.200.10 Connected to 200.200.200.10 Escape character is '^]'. AS-200-R10>sh ip bgp X.0.0.0 BGP routing table entry for X.0.0.0/8, version 77 Paths: (1 available, best #1, table Default-IP-Routing-Table) Advertised to peer-groups: IBGP 222 123 55 111 100 X 222.200.10.1 from 222.200.10.1 (222.222.222.1) Origin IGP, localpref 100, valid, external, best
96
Porm no tem como entender certas variveis que fazem o link A ser mais vivel que o link B, ou mesmo quando precisamos somar 2 links.
Em outras palavras, se tenho contratados 100Mbs de trnsito com o AS 100 e apenas 50 com o AS 200, seria invivel ter o link do AS 200 como principal, e nesse caso precisamos "interferir" na deciso do protocolo BGP manipulando certos atributos.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 97
2.5
PERGUNTAS?
98
2.6
Escolhendo o Melhor Link
99
Considere quase toda a minha demanda de trnsito vindo sempre do AS 123 as seguintes situaes:
A negociao com o AS 100 me garantiu um preo que me permitiu dobrar a banda contratada.
Algum outro motivo que me obrigue a utilizar o AS 100 como link principal e o as 200 como backup. Como vimos anteriormente, o BGP escolhe por padro o as 200, vamos modificar essa escolha...
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 100
LAB 1-2-3
LAB 1-2-3
GX-R1#sh ip bgp 123.123.123.1 BGP routing table entry for 123.0.0.0/8, version 35 Paths: (2 available, best #2, table Default-IP-Routing-Table) Not advertised to any peer 200 222 123 200.X.1.1 from 200.1.1.1 (200.200.200.1) Origin IGP, localpref 100, valid, external 100 111 55 123 100.X.1.1 from 100.X.1.1 (100.100.100.1) Origin IGP, localpref 100, weight 10, valid, external, best
Acabamos de forar o router a escolher a rota #2, j que o primeiro critrio o atributo weight, a rota 2# foi escolhida como melhor mesmo com um as path MAIOR.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 102
LAB 1-2-3
Testando...
Caso a mudana no weight tenha sido bem sucedida os pacotes seguiram a rota pelo AS 100 ao invs do AS 200.
Porm isso resolve apenas "metade" do meu problema conforme veremos no slide seguinte...
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 103
LAB 1-2-3
Ping extendido:
GX-R1#ping Protocol [ip]: Target IP address: 123.123.123.1 Repeat count [5]: 2 Datagram size [100]: Timeout in seconds [2]: Extended commands [n]: y Source address or interface: X.128.0.254 Type of service [0]: Set DF bit in IP header? [no]: Validate reply data? [no]: Data pattern [0xABCD]: Loose, Strict, Record, Timestamp, Verbose[none]: record Number of hops [ 9 ]: Loose, Strict, Record, Timestamp, Verbose[RV]: Sweep range of sizes [n]: Type escape sequence to abort. Sending 2, 100-byte ICMP Echos to 192.168.100.1, timeout is 2 seconds: Packet sent with a source address of 172.16.32.1 Packet has IP options: Total option bytes= 39, padded length=40 Record route: <*> (0.0.0.0) (0.0.0.0) (0.0.0.0) (0.0.0.0) (...continua...)
104
LAB 1-2-3
Ping extendido:
(...continuao...) (0.0.0.0) Reply to request 0 (152 ms). Received packet has options Total option bytes= 40, padded length=40 Record route: (100.X.1.1) (100.100.1.1) (111.100.1.1) (111.111.1.1) (55.111.1.1) (55.55.1.1) (123.123.123.1) (123.222.1.1) (222.222.1.1) (222.200.1.1) (200.200.1.1) (200.X.1.1) <*> (0.0.0.0) End of list <Omited> Success rate is 100 percent (2/2), round-trip min/avg/max = 116/134/152 ms GX-R1#
105
LAB 1-2-3
Como podemos verificar, o AS 123 continua escolhendo a mesma rota, uma vez que a mudana no atributo weight, teve influncia apenas no meu UPLOAD, sendo assim, meu download continua chegando pelo AS 200 (menor AS PATH no ponto de vista do AS 123).
No tenho como pedir que o AS 123 altere os seus atributos, preciso convenc-los de outra forma a mudar de rota.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 106
LAB 1-2-3
Como mencionado anteriormente, os atributos BGP s so analisados quando h um empate de prefixo, porm quando h um prefixo MAIS ESPECFICO os atributos so ignorados.
107
LAB 1-2-3
LAB 1-2-3
LAB 1-2-3
Gx-R1#sh ip route x.0.0.0 longer-prefixes ... Gateway of last resort is not set x.0.0.0/8 is variably subnetted, 2 subnets, 2 masks C x.x.x.x/32 is directly connected, Loopback0 C x.128.0.0/9 is directly connected, FastEthernet0/0
O comando longer-prefixes mostraria rotas para qualquer sub-rede dentro do bloco /8 pesquisado, porm temos o primeiro /9 diretamente conectado f0/0 e um /32 na Loopback0.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 110
LAB 1-2-3
Precisamos primeiramente garantir que as redes que quero anunciar estejam em minha FIB:
Gx-R1#conf t Gx-R1(config)#ip route x.0.0.0 255.128.0.0 null0 !--- faremos apenas para o primeiro /9 j que o segundo est OK Gx-R1(config)#end Gx-R1# Gx-R1#sh ip route x.0.0.0 longer-prefixes ... Gateway of last resort is not set x.0.0.0/8 is variably subnetted, 3 subnets, 2 masks C x.x.x.x/32 is directly connected, Loopback0 S x.0.0.0/9 is directly connected, Null0 C x.128.0.0/9 is directly connected, FastEthernet0/0
Agora que tenho os 2 blocos /9 em minha FIB vamos verificar novamente os anncios para o AS 100...
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 111
LAB 1-2-3
Agora que tenho os 2 blocos /9 em minha FIB vamos verificar novamente os anncios para o AS 100...
Gx-R1#sh ip bgp neighbors 100.x.1.1 advertised-routes BGP table version is 11, local router ID is 2.2.2.2 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete Network *> x.0.0.0/9 *> x.128.0.0/9 Gx-R1# Next Hop 0.0.0.0 0.0.0.0 Metric LocPrf Weight Path 0 32768 i 0 32768 i
Agora estamos fazendo corretamente o anncio dos dois blocos /9 para o AS 100.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 112
LAB 1-2-3
Vamos novamente entrar no looking glass e verificar as rotas para classe A do grupo:
AS-123-R1>sh ip bgp X.0.0.0/8 longer-prefixes BGP table version is 30, local router ID is 123.123.123.1 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete Network Next Hop *> X.0.0.0/9 123.55.2.2 *> X.0.0.0 123.222.2.2 *> X.128.0.0/9 123.55.2.2 AS-123-R1> Metric LocPrf Weight Path 0 55 111 100 X i 0 222 200 X i 0 55 111 100 X i
Dessa forma, a rota em vermelho nunca usada, pois existem dois blocos mais especficos, fazendo com que o LG sempre alcance os AS's dos grupos atravs do AS 100.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 113
LAB 1-2-3
No incio foramos o upload pelo AS 100, e agora tambm o download pelo AS 100.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 114
LAB 1-2-3
Agora vamos voltar ao normal e remover o Weight 10 para todas as rotas recebidas do AS 100 GX-R1#configure terminal GX-R1(config)#router bgp X GX-R1(config-router)#no neighbor 100.X.1.1 weight 10 GX-R1(config-router)#end
!--- agora vamos efetuar um clear na sesso BGP
2.6
PERGUNTAS?
116
2.7
Balanceando os Links
117
2.7-Balanceando os links
Vamos agora considerar uma situao de necessidade de utilizar os dois links de maneira balanceada.
Anunciaremos o primeiro /9 para o AS 100 e o segundo /9 para o AS 200 fazendo com que o nosso trfego inbound seja divido em 50% para cada link.
A lgica a mesma, o que faremos diferente do lab anterior um detalhe para o fail-over.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 118
LAB 1-2-4
2.7-Balanceando os links
Vamos criar duas novas prefix-lists e adiciona-las como filtro de SADA para cada AS de trnsito:
GX-R1#conf terminal GX-R1(config)#ip prefix-list LAB-1-2-2-ANUNCIAR-AS-100 permit X.0.0.0/8 GX-R1(config)#ip prefix-list LAB-1-2-2-ANUNCIAR-AS-100 permit X.0.0.0/9 !--- adiciona 2 prefixos /9 dentro da lista ANUNCIAR-AS-100 GX-R1(config)#ip prefix-list LAB-1-2-2-ANUNCIAR-AS-200 seq 10 permit x.0.0.0/8 GX-R1(config)#ip prefix-list LAB-1-2-2-ANUNCIAR-AS-200 seq 10 permit x.0.128.0/9 !--- adiciona o classe A inteiro dentro da lista ANUNCIAR-AS-100 GX-R1(config)#router bgp X !--- adiciona 2 prefixos /9 dentro da lista ANUNCIAR-AS-100 GX-R1(config-router)#neighbor 200. X.1.1 prefix-list LAB-1-2-2-ANUNCIAR-AS-200 out !--- declara que esse anuncios de saida (out) para esse neighbor serao filtrados GX-R1(config-router)#neighbor 100. X.1.1 prefix-list LAB-1-2-2-ANUNCIAR-AS-100 out !--- declara que esse anuncios de saida (out) para esse neighbor serao filtrados GX-R1(config-router)#end GX-R1#clear ip bgp * soft
119
LAB 1-2-4
2.7-Balanceando os links
Vamos entrar no looking glass e ver o resultado:
AS-123-R1>sh ip bgp X.0.0.0/8 longer-prefixes ... Network Next Hop Metric LocPrf Weight Path *> X.0.0.0/9 123.55.2.2 0 55 111 100 X i * X.0.0.0 123.55.2.2 0 55 111 100 X i *> 123.222.2.2 0 222 200 X i *> X.128.0.0/9 123.55.2.2 0 222 200 X i AS-123-R1>
120
LAB 1-2-4
2.7-Balanceando os links
Caminho 55,111,100
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 121
LAB 1-2-4
2.7-Balanceando os links
Caminho 222,200
122
LAB 1-2-4
2.7-Balanceando os links
123
2.7-Balanceando os links
OBS: Para um balanceamento assimtrico mudaramos os anncios, quebrando para blocos cada vez mais especficos
Nunca esquecer de que o balanceamento baseado em anncios especficos depende da distribuio dos IPs dentro do meu AS.
124
2.8
Implementando Alta Disponibilidade com VRRP
125
LAB 1-2-5
O cenrio permanece o mesmo, porm com um router identico como backup. A ideia que todos os dois links continuem 100% operacional mesmo que o router principal fique totalmente fora.
126
LAB 1-2-5
Antes de configurar o router BACKUP, vamos NOVAMENTE anunciar apenas um bloco /8 para cada operadora: Criando as prefix-lists:
GX-R1(config)#router bgp X GX-R1(config-router)#neighbor 200.X.1.1 prefix-list MEUS-BLOCOS out !---mudar o filtro na sada do AS 200 GX-R1(config-router)#neighbor 100.X.1.1 prefix-list MEUS-BLOCOS out !--- mudar o filtro na sada do AS 100 GX-R1(config-router)#end GX-R1#clear ip bgp *
127
LAB 1-2-5
O segundo router responde pelo IP X.128.0.253 Verifiquem a conectividade IP e em caso positivo abram uma sesso telnet da mesma forma que fizemos com GX-R1:
ALUNO@notebook# telnet X.128.0.253 Trying X.128.0.253... Connected to X.128.0.253. Escape character is '^]'. User Access Verification
128
LAB 1-2-5
129
LAB 1-2-5
GX-R2(config)# router bgp X GX-R2(config-router)# network x.0.0.0 mask 255.0.0.0 auto-summary neighbor 100.X.2.1 remote-as 100 neighbor 100.X.2.1 description eBGP com as 100 neighbor 200.X.2.1 remote-as 200 neighbor 200.X.2.1 description eBGP com as 200
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 130
LAB 1-2-5
Criando as prefix-lists:
GX-R2(config)#ip prefix-list MEUS-BLOCOS permit X.0.0.0/8 !--- adiciona o bloco do AS do grupo na lista MEUS-BLOCOS GX-R2(config)#router bgp X GX-R2(config-router)#neighbor 200.X.2.1 prefix-list MEUS-BLOCOS out !---aplicar o mesmo filtro na sada do AS 200 GX-R2(config-router)#neighbor 100.X.2.1 prefix-list MEUS-BLOCOS out !--- aplicar o mesmo filtro na sada do AS 100 GX-R2(config-router)#end GX-R2#clear ip bgp *
131
LAB 1-2-5
4 100 4 200
O nmero de PfxRcd vai ser maior a medida que os alunos estabeleceram suas conexes.
132
LAB 1-2-5
Metric 0
Metric 0
133
O prximo passo a criao da interface virtual, mas o que VRRP afinal? Virtual Router Redundancy Protocol cria uma interface, um MAC e um ip virtual, e todos os routers do grupo VRRP conhecem essas informaes. No momento em que o router master fica fora, o primeiro candidato levanta imediatamente o IP virtual, de maneira que os hosts da rede no percebem essa comutao, e ao mesmo tempo no tem problemas com ARP, j que o MAC no muda.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 134
O prximo passo a criao da interface virtual, mas o que VRRP afinal? Vrios roteadores podem fazer parte de uma mesma VRRP. Para definir quem o router master e quem assume nas situaes de falha, alteramos o valor de priority na configurao do grupo VRRP. Vamos ao lab...
135
LAB 1-2-5
Vamos configurar uma VRRP na interface lan e garantir que GX-R1 seja o router master: GX-R1#conf t
GX-R1(config)#interface fastEthernet 0/0 GX-R1(config-if)#vrrp X ip X.128.0.252 GX-R1(config-if)#vrrp X priority 2 GX-R1(config-if)#vrrp X timers advertise 1 GX-R1(config-if)#vrrp X preempt delay minimum 120 GX-R1(config-if)#end GX-R1#debug vrrp state VRRP State debugging is on GX-R1# GX-R2#conf t GX-R2(config)#interface fastEthernet 0/0 GX-R2(config-if)#vrrp X ip X.128.0.252 GX-R2(config-if)#vrrp X priority 1 GX-R2(config-if)#vrrp X timers learn GX-R2(config-if)#vrrp X preempt delay minimum 120 GX-R2(config-if)#end GX-R2#debug vrrp state VRRP State debugging is on GX-R2# v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 136
LAB 1-2-5
137
Notem que h um tempo mdio de 4 minutos at que a comutao acontea para o router backup Por que todo esse tempo?
X
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 138
Quando o router R1 fica fora, os CPE's das operadoras passam algum tempo pensando que ele ainda est UP
Cada router envia uma mensagem keep alive a cada 60 segundos (por padro) Quando um keep alive atrasa, o CPE da operadora ativa uma contagem chamada hold time (padro 180 segundos) Se at o final do hold time no chegar um keep alive o CPE da operadora finaliza a sesso BGP com R1. Imediatamente o CPE percebe que h uma outra opo disponvel para a rede X.0.0.0/8 e instala em sua FIB Vamos alterar os valores de keep alive e hold time para 5 e 15 segundos respectivamente...
139
LAB 1-2-5
GX-R1(config)#router bgp X GX-R1(config-router)#neighbor 100.X.1.1 timers 5 15 GX-R1(config-router)#neighbor 200.X.1.1 timers 5 15 !--- muda o tempo de keep alive para 5 segundos !--- e o hold time para 15 segundos GX-R1(config-router)#end GX-R1#clear ip bgp * GX-R2(config)#router bgp X GX-R2(config-router)#neighbor 100.X.2.1 timers 5 15 GX-R2(config-router)#neighbor 200.X.2.1 timers 5 15 !--- muda o tempo de keep alive para 5 segundos !--- e o hold time para 15 segundos GX-R2(config-router)#end GX-R2#clear ip bgp * v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 140
O tempo paralizao diminuiu de cerca de 3 minutos para 15 segundos importante lembrar que nesse lab utilizamos interfaces seriais, e o bgp fast-external-fallover vem habilitado por padro e faz o BGP automaticamente finalizar a sesso quando detecta uma interface em estado down. Esse recurso foi desabilitado no intuito de simular situaes reais j qua a maioria dos links atuais so metroethernet
141
2.8
PERGUNTAS?
142
3.0
Peering e Troca de Trfego
3. Peering e Troca de trfego 3.1 Peering x Trnsito 3.2 Entendendo o funcionamento de um PIX 3.3 Formulrios de adeso 3.4 Diferenas entre acordo bilateral e multilateral 3.5 Participantes locais e remotos 3.6 Endendendo o conceito de Lan2Lan 3.7 ATM-Tratando as rotas recebidas 3.8 ATM-Anunciando corretamente 3.9 O looking glass do PTT Metro 3.10 Aplicaes de um acordo bilateral 3.11 Comprando e vendendo trnsito no PTT
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
143
3.1
Peering x Trnsito
144
Quando dois AS's tem uma quantidade de demanda comum, acaba saindo mais barato o peering.
Exemplo, eu sou AS A, e tenho uma demanda de 10Mbs de download de um certo contedo hospedado no AS B.
Para resolver isso, contrato um link de 10Mbs da operadora B e pago R$ 100,00 por cada mega, num total de R$ 1.000,00.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 145
Porem, a operadora B tambm tem uma demanda de 10Mbs de contedo hospedado no meu AS A.
No final do ms, ficaramos empatados no custo, e o melhor a se fazer estabelecer um link direto de 10Mbs sem que um cobre do outro.
LAB 1-3-1
147
LAB 1-3-1
Onde:
X= AS local Y= AS remoto
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 149
LAB 1-3-1
Onde:
X= AS local Y= AS remoto
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 150
LAB 1-3-1
Onde:
GX-R1#conf t GX-R1(config)# GX-R1(config)#router bgp X GX-R1(config-router)#neighbor X.Y.1.2 remote-as Y GX-R1(config-router)#neighbor X.Y.1.2 weight 20 !--- priorizar todas as rotas recebidas pelo peering com weight 20 GX-R1(config-router)#neighbor X.Y.1.2 prefix-list MEUS-BLOCOS out !--- filtrar anncios de sada para esse peering na respectiva prefix-list GX-R1(config-router)#exit GX-R1(config)#end GX-R1#clear ip bgp *
X= AS local Y= AS remoto
151
LAB 1-3-1
Onde:
GX-R1#conf t GX-R1(config)# GX-R1(config)#router bgp X GX-R1(config-router)#neighbor Y.X.1.1 remote-as Y GX-R1(config-router)#neighbor Y.X.1.1 weight 20 !--- priorizar todas as rotas recebidas pelo peering com weight 20 GX-R1(config-router)#neighbor Y.X.1.1 prefix-list MEUS-BLOCOS out !--- filtrar anncios de sada para esse peering na respectiva prefix-list GX-R1(config-router)#exit GX-R1(config)#end GX-R1#clear ip bgp *
X= AS local Y= AS remoto
152
LAB 1-3-1
O Next Hop 0.0.0.0 e o weight 32768 indicam que as redes foram originadas localmente ou seja, no comando: router(config-router) network x.x.x.x mask x.x.x.x
153
LAB 1-3-1
Verificando as redes recebidas do meu novo peering (utilizando o exemplo para o peering entre AS 1 e 2):
G1-R1#sh ip bgp regexp ^Y$ !--- essa consulta retorna apenas rotas que contenham o AS Y no path !--- e nada mais BGP table version is 29, local router ID is 1.1.1.1 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete Network *> Y.0.0.0 Next Hop X.Y.1.2 Metric LocPrf Weight Path 0 20 Y i
Onde:
1= AS local 2= AS remoto
154
LAB 1-3-1
O que faz dessa configurao um peering e no um trnsito? *Ao carem os links do AS200 e AS100 apenas as redes do peering continuariam funcionando, e isso o que descaracteriza um trnsito.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 155
LAB 1-3-1
Vamos simular uma falha nos AS's de trnsito e verificar a conectividade entre os 2 AS's que fazem peering...
156
3.2
Entendendo o Funcionamento de Um PIX do PTTMetro
157
158
Seu funcionamento consiste basicamente em 1 switch, 2 route-servers e um router Looking Glass (outros maiores como SP possuem dezenas de switchs em vrios PIXes).
159
160
Os Route Servers cumprem um papel fundamental dispensando a necessidade de que todos os participantes faam peering individualmente. Imaginem centenas de participantes estabelecendo peering (todos com todos).
ROUTE SERVER
161
3.3
Formulrios de Adeso
162
163
...
... Localidade ........: ASN ...............: Entidade Nome .....: URL ...............: Endereo ..........: NOC email .........: INOC-DBA ext ......: Telefone ..........: Adm-c nome ........: email .............: Telefone ..........: Peering-c nome ....: email .............: Telefone ..........: Comercial Trnsito : email .............: Telefone ..........: URL Poltica Peering .......: BGP Feed para o Looking-glass ...: Vende trnsitov4 ..: Vende trnsitov6 ..: Conexo Bandwidth .........: Media Ethernet ....:
none - Open Policy Sim [x] Sim [ ] Sim [ ] Nao [ ] No [x] No [x] 10000BaseTX [ ] 10 GigE-SR [ ]
10BaseTX [ ] 100BaseTX [ ] 1 GigE-SX [X] 1 GigE-LX [ ] PIX ...............: Registro.br IPv6 ..............: Sim [x] Nao [ ] ...
10 GigE-LR [ ]
164
3.4
Diferenas entre Acordo Bilateral e Multilateral
165
Estar no PTT por si s no significa trocar trfego! Existem participantes que optaram em no trocar trfego multilateral (todos com todos). E esse um direito do participante...
166
...
Termo de adeso ao Acordo de Troca de Trfego Multilateral (ATM) Version .........: 2008071000 Este termo de adeso trata das informaes e compromissos da entidade solicitante para a participao no acordo de troca de trfego multilateral no PTTMetro. Localidade ......: sp.ptt.br ASN .............: 22548 Entidade Nome ...: Registro.br ATM v4 ..........: Sim [x] No [ ] ATM v6 ..........: Sim [x] No [ ] ...
167
Os AS's que se conectam ao PTT mas no participam do ATM, em geral vendem trnsivo atravs de acordos bilaterais
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 168
3.5
Participantes Locais e Remotos
169
170
No h diferenas no ponto de vista tcnico entre as duas modalidades, exceto pelas consequncias do aumento de latencia, que proporcional distncia geogrfica.
171
3.6
Entendendo o Conceito de Lan2Lan
172
Para participar remotamente de um PTT, necessrio que o participante troque informaes de nvel de enlace, ou seja, alm de um IP diretamente conectado, o MAC original deve ser conhecido pelos participantes atravs de solicitaes ARP
Em outras palavras, o participante remoto deve fazer parte do mesmo domnio de broadcast que os route servers e demais participantes
173
Um Tunel layer 2 ou Lan2Lan na prtica no se parece muito com um tunel, ele pega o QUADRO ETHERNET original e encapsula no campo de dados do pacote IP
O router destinatrio desencapsula, reproduz o QUADRO ETHERNET ORIGINAL e joga na inteface correspondente.
Dessa maneira, todas as infornaes de layer 2 chegam ao outro lado, incluindo requisies ARP e broadcasts
174
3.7
ATM-Tratando as Rotas Recebidas
175
LAB 1-3-2
GX-R1#conf t GX-R1(config)#router bgp X GX-R1(config-router)#neighbor 187.16.216.253 remote-as 555 GX-R1(config-router)#neighbor 187.16.216.253 description PTT-Route_server-1 GX-R1(config-router)#neighbor 187.16.216.253 weight 15 !--- o valor 15 de weight deve ser maior do que o aplicado no IN do AS100, !--- porm menor que o aplicado no peering "20 GX-R1(config-router)#neighbor 187.16.216.253 prefix-list MEUS-BLOCOS out !--- vamos anunciar apenas o bloco /8 para o PTT e todos os outros peers GX-R1(config-router)#neighbor 187.16.216.252 remote-as 555 GX-R1(config-router)#neighbor 187.16.216.252 description PTT-Looking Glass !--- para o looking glass do PTT enviaremos todas as rotas da FIB, portando nao usaremos nenhum filtro
176
LAB 1-3-2
Agora vamos verificar quais rotas recebo do Route Server do PTT Utilizaremos o router do grupo 25 como exemplo:
G25-R1#sh ip bgp summary ... Neighbor V AS MsgRcvd MsgSent 25.26.1.2 4 10 442 443 100.25.1.1 4 100 582 441 187.16.216.252 4 555 10 44 187.16.216.253 4 555 14 8 200.25.1.1 4 200 548 441 TblVer 168 168 168 168 168 InQ 0 0 0 0 0 OutQ 0 0 0 0 0 Up/Down 07:16:05 07:14:37 00:06:02 00:02:34 07:14:26 State/PfxRcd 4 35 0 45 34
Peering Trnsito AS100 PTT Looking Glass PTT Route Server Trnsito AS200
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 177
LAB 1-3-2
LAB 1-3-2
3.8
ATM-Anunciando Corretamente
180
Utilizamos anncios da maneira mais simples possvel, porm, no mundo real, o mais recomendado anunciar blocos mais especficos para os pontos de troca. Um dos principais motivos so os participantes indiretos, digamos que o administrador do AS 44 coloca baixa prioridade para rotas recebidas pelo AS 30, ou mesmo que o BGP tenha escolhido sozinho o AS 100 como melhor rota por esta ser mais antiga.
181
Os anncios garantem trfego de download pelo PTT, porm existem outras maneiras de fazer isso, utilizando communities e as path prepend.
182
3.9
183
O Looking Glass do PTT-Metro foge um pouco do padro, quando visualizamos uma rota como best no significa que essa a rota que est sendo escolhida pelos participantes do PTT.
Ele no envia nenhuma rota, e todos os participantes devem enviar a sua tabela full.
Assim, uma ferramenta para ajudar a visualizar toda a tabela de roteamento de cada participante.
184
Digamos que quero verificar a tabela de roteamento do participante do PTT que possui o AS 9.
GX-R1>telnet 187.16.216.252 Trying 187.16.216.252 ... Open User Access Verification Password: 123
Esse comando mostraria todas as rotas BGP na FIB do AS 9 (desde que esse esteja enviando sua tabela full para o LG).
185
3.10
Aplicaes de Um Acordo Bilateral
186
Com um acordo bilateral um AS pode vender trnsito para outro AS participante dispensando os custos de ativao (estrutura e equipamentos).
Outra aplicao interessante uma parceria entre 2 AS's de cidades diferentes para interligar um cliente comum em L2.
187
LAB 1-3-3
Os grupos escolhero com quem fazer o acordo bilateral e tero uma vlan comum escolhida pelo instrutor. O objetivo semelhante ao LAB do peering, porm, um dos participantes fornecer trnsito IP para o outro que ser apenas cliente. Para isso, deve ser estabelecida uma sesso BGP entre os dois, onde o responsvel em prover trnsito dever anunciar a tabela full para o cliente ao mesmo tempo que anuncia os prefixos do cliente para suas duas operadoras AS 100 e AS 200.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 188
LAB 1-3-3
Aps decidido o ID da vlan cada participante deve inserir a tag correspondente na interface f0/1 (interface conectada ao PTT). Os IPs no importam para o PTT e devem ser combinados entre os dois participantes do acordo bilateral.
GX-R1#conf t GX-R1(config)#interface fastEthernet 0/1.XXX GX-R1(config-subif)#encapsulation dot1Q XXX GX-R1(config-subif)#ip address (combinem os endereos IP de cada lado) GX-R1(config-subif)#end GX-R1# ping Z.Z.Z.Z
XXX o nmero (ID) da vlan e Z.Z.Z.Z o endereo IP que o cliente configurou do outro lado
LAB 1-3-3
OBS: onde houver Y substituiremos pelo AS do CLIENTE, e Z.Z.Z.Z pelo IP que foi combinado previamente com o cliente e configurado do outro lado da VLAN
GX-R1#conf t GX-R1(config)#router bgp X GX-R1(config-router)#neighbor Z.Z.Z.Z remote-as Y GX-R1(config-router)#neighbor Z.Z.Z.Z description Acordo bilateral - cliente GX-R1(config-router)#neighbor Z.Z.Z.Z weight 25 !--- o valor de weight deve ser maior do todos os outros j que se trata de um cliente de trnsito GX-R1(config-router)#neighbor Z.Z.Z.Z prefix-list BLOCOS-CLIENTE-AS-Y in !--- dessa vez utilizaremos um filtro de entrada in para no haver risco de receber do cliente !--- prefixos que no sejam dele e meu trfego de output ir na direo desse cliente GX-R1(config-router)#exit GX-R1(config)#ip prefix-list BLOCOS-CLIENTE-AS- Y permit Y.0.0.0/8 !--- adiciono o classe A do cliente na prefix-list declarada como filtro de entrada GX-R1(config)#ip prefix-list MEUS-BLOCOS permit Y.0.0.0/8 !--- como j utilizamos a prefix-list MEUS-BLOCOS na sada dos AS de trnsito, !--- vamos aproveita-la e apenas adicionar mais um prefixo GX-R1(config-router)#end GX-R1#clear ip bgp * v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 190
LAB 1-3-3
OBS: onde houver Y substituiremos pelo AS que ser TRNSITO, e Z.Z.Z.Z pelo IP que est configurado do outro lado
GX-R1#conf t GX-R1(config)#router bgp X GX-R1(config-router)#neighbor Z.Z.Z.Z remote-as Y GX-R1(config-router)#neighbor Z.Z.Z.Z description Acordo bilateral-transito IP GX-R1(config-router)#neighbor Z.Z.Z.Z prefix-list MEUS-BLOCOS out !--- como cliente devemos anunciar da mesma maneira que fizemos com os ASs de trnsito !--- e j que o classe A local j est nessa lista no preciso configurar mais nada GX-R1(config-router)#end GX-R1#clear ip bgp *
191
LAB 1-3-3
DESATIVEM as interfaces s1/0 e s1/1 do AS que foi designado como CLIENTE nesse LAB. Se tudo deu certo, os ASs que no participam do PTT (55,100,111,200 e 222) conseguiro alcanar o AS do cliente atravs do AS que serviu como trnsito. O objetivo agora que AS's que no participam do PTT fiquem acessvels (trnsito IP)
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 192
3.11
PERGUNTAS?
193
4.0
Filtros Bsicos para um AS de Trnsito
4. Filtros bsicos para um AS de trnsito 4.1 eBGP com upstreams e downstreams 4.2 Configurando filtros de upstreams 4.3 Configurando filtros de downstreams 4.4 Entendendo o regexp 4.5 Enviando/recebendo partial e full-routouting 4.6 Route-map x prefix-list 4.7 AS-Path Prepend 4.8 Engenharia de trfego I
194
4.1
eBGP com Upstreams e Downstreams
195
IBGP (BGP interno): sesses BGP com routers do meu prprio AS. eBGP UPSTREAM: sesses BGP com AS's externos que prestam servio de trnsito IP para meu AS. eBGP DOWNSTREAM: sesses BGP com AS's externos aos quais meu AS presta servio de trnsito IP.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 196
Sesses entre roteadores que fazem parte do mesmo sistema autnomo Geralmente no utilizamos filtros No importa a quantidade de saltos de roteamento, no h incremento de AS-PATH O BGP identifica automaticamente sesses iBGP quando o remote-as o mesmo AS declarado em router bgp X
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 197
Geralmente recebemos todas as rotas possveis Os filtros de ENTRADA so do tipo lista negra
198
Recebemos apenas prefixos do cliente e clientes secundrios Os filtros de ENTRADA so do tipo lista branca
Enviar todos os prefixos possveis Anncio de parcial routing apenas quando solicitado
199
4.2
Configurando Filtros de Upstreams
200
No podemos anunciar nenhuma rede da qual no queremos receber DOWNLOADS, para isso utilizamos filtros em todas as nossas sadas de UPSTREAM e PTTs. Porm existem certas precaues que devem ser tomadas nos filtros de entrada de UPSTREAM:
No receber meus prprios prefixos; No receber BOGONS; No receber IPs privados; No receber rotas cujo AS PATH contenham AS(s) privado(s); Garantir que rotas de UPSTREAMS no recebam prioridade maior que rotas DOWNSTREAMS;
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 201
Por padro o BGP descarta todas as rotas que anunciei e voltaram para mim por algum motivo (multihoming por exemplo).
!--- essa regra pode ser modificada utilizando o comando !--- router(config-router)#neighbor 192.168.2.1 allowas-in
Quando isso acontece, logo verificado o meu prprio AS no path e a rota descartada automaticamente.
Porm possvel que algum anuncie por "engano", e a nica forma de garantir um filtro baseado em IP (prefix-list).
202
Precisamos configurar alguns filtros padro que evitam o recebimento de grades de IPs privados, multcast, link local, etc. Para isso vamos criar uma prefix-list chamada NAO-RECEBER e inserir nela todas as redes indesejadas.
Para facilitar, o Cisco IOS permite especificar intervalos de IPs, isso dispensa o trabalho de inserir cada sub-rede manualmente.
Antes de criar uma prefix-list precisamos ter em mente que para toda ela h um DENY implcito no final, semelhante uma lista branca, onde quem estiver na lista ser permitido, e todo o resto bloqueado, ex:
Gx-R1(config)#ip prefix-list MINHA-LISTA permit 122.36.200.0/24 Gx-R1(config)#ip prefix-list MINHA-LISTA {NEGAR TUDO}
Com essa prefix-list na ENTRADA de um protocolo de roteamento qualquer o resultado seria receber apenas 122.36.200.0/24, e qualquer outro prefixo seria descartado. Lembrem que a ltima regra de {NEGAR TUDO} jamais aparece, nem mesmo no show running-config.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 204
O que o seq ?
Ao inserir o comando:
Gx-R1(config)#ip prefix-list MINHA-LISTA permit 122.36.200.0/24
Caso adicionemos mais redes na mesma lista o nmero de seq incrementado em 5 automaticamente para cada regra:
Gx-R1(config)#ip prefix-list MINHA-LISTA permit 44.0.0.0/24 Gx-R1(config)#end Gx-R1#show running-config | begin MINHA-LISTA ip prefix-list MINHA-LISTA seq 5 permit 122.36.200.0/24 ip prefix-list MINHA-LISTA seq 10 permit 44.0.0.0/24 ! ...
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 205
O que o seq ?
A razo para o incremento de 5 em 5 a possibilidade de inserir uma regra no meio especificando um nmero de seq:
Gx-R1(config)#ip prefix-list MINHA-LISTA seq 4 permit 10.0.30.0/24
Pouco de permit
as regras so
O seq s tem relevncia quando h regras de deny e permit na mesma prefix-list e/ou utilizamos ranges com le/ge
206
Essa regra permite 192.168.0.0/24, porm no permite 192.168.0.0/25, 192.168.0.128/25, 192.168.0.16/28 ou qualquer outra sub-rede. Para incluir sub-redes utilizamos le:
Gx-R1(config)#ip prefix-list MINHA-LISTA permit 192.168.0.0/24 le 29
Com essa mudana, 192.168.0.0/25, 192.168.0.128/25, 192.168.0.16/28 ou qualquer outra sub-rede dentro comeando com 192.168.0 seria aceita, exceto redes /30, /31 e /32. Para permitir TUDO dentro do /24 incluindo /30, /31 e /32 trocaramos o le 29 por le 32.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 207
Diferente do le, o ge especifica o tamanho mnimo da mscara, seu uso mais apropriado em redes maiores.
Gx-R1(config)#ip prefix-list MINHA-LISTA permit 192.0.0.0/8 ge 18 le 26
O /8 indica os bits que sero fixos. Para esse exemplo, qualquer prefixo com os 8 primeiros bits fixos em comeando com 192 (11000000) e ainda com mscara igual ou maior que /18 e igual ou menor que /26. Caso seja declarada uma mscara /0 (192.0.0.0/0) no importariam os 8 primeiros bits e qualquer prefixo (comeando com qualquer coisa) seria aceito desde que sua mscara fosse entre /18 e /26.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 208
209
Agora que compreendemos o funcionamento, vamos continuar de onde paramos e criar uma prefix-list chamada NAO-RECEBER. Dentro dela colocaremos todos os prefixos que no desejamos receber. Por se tratar de uma lista negra no podemos esquecer de inserir uma regra que permita todo o resto no fim da hierarquia.
210
LAB 1-4-1
LAB 1-4-1
Apenas criar a lista NAO-RECEBER de nada vale se a mesma no for declarada como filtro de ENTRADA dos UPSTREAMS, PEERING e PTT.
GX-R1(config)#router bgp X GX-R1(config-router)#neighbor 100.X.1.1 prefix-list NAO-RECEBER in GX-R1(config-router)#neighbor 200.X.1.1 prefix-list NAO-RECEBER in GX-R1(config-router)#neighbor 187.16.216.253 prefix-list NAO-RECEBER in GX-R1(config-router)#neighbor (IP de peering) prefix-list NAO-RECEBER in GX-R1(config-router)#neighbor (acordo bilateral) prefix-list NAO-RECEBER in !--- Nesse caso apenas para quem CLIENTE no acordo bilateral GX-R1(config-router)#end GX-R1#clear ip bgp *
212
LAB 1-4-1
O AS 123 vai anunciar vrios IPs privados, vamos verificar se o bloqueio est acontecendo corretamente:
HARD reset:
a maneira menos recomendada de fazer um refresh nas rotas. A conexo TCP volta para o estado idle. H um pequeno intervalo antes da conexo iniciar novamente.
Router#clear ip bgp { * | A.B.C.D | peergroupname }
SOFT reset:
Realiza o route refresh mantendo a sesso ativa . Pode ser dividido em outbound refresh e inbound refresh.
Quando updates so bloqueados pelos filtros de input, esses updates so descartados pelo router, no sendo possvel verificar informaes sobre essas rotas. Habilitar o soft reconfiguration inbound para um neighbor reserva uma rea em memria para guardar informaes de todas as rotas recebidas desse neighbor, tornando possvel verificar as rotas que foram descartadas pelos filtros de input. Habilitar o soft reconfiguration inbound permitir usar o comando:
GX-R1#sh ip bgp neighbors A.B.C.D received-routes !--- exibe as rotas recebidas de A.B.C.D antes dos filtros de input !--- inclusive rotas com next-hop invlido
216
LAB 1-4-1
217
LAB 1-4-1
GX-R1#sh ip bgp neighbors 200.9.1.1 received-routes !--- todas as rotas ANTES do filtro NAO-RECEBER GX-R1#sh ip bgp neighbors 200.9.1.1 routes !--- todas as rotas APS do filtro NAO-RECEBER
Outros BOGONS
Existe outro range de IPs que no so privados, mas ainda assim devem ser bloqueados. Existem blocos pblicos de IPs que ainda no foram designados pelas organizaes responsveis. Dessa forma possvel que algum utilize essas redes com intenes suspeitas. Onde conseguir uma lista atualizada?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 219
Para solicitar esse peering preciso entrar em contato com bogonrs@cymru.com com as seguintes informaes:
Nmero de AS; Ip(s) que o cymru far peering com voc; Se o equipamento suporta autenticao MD5 para BGP; Chave pblica GPG/PGP (opcional);
220
221
GX-R1(config)#router bgp X GX-R1(config-router)#neighbor x.x.x.x remote-as 65333 GX-R1(config-router)#neighbor x.x.x.x ebgp-multihop 255 GX-R1(config-router)#neighbor x.x.x.x weight 100 GX-R1(config-router)#neighbor x.x.x.x description BOGONS CYMRU GX-R1(config-router)#neighbor x.x.x.x prefix-list SAIDA-CYMRU out GX-R1(config-router)#neighbor x.x.x.x route-map FILTRO-CYMRUBOGONS in GX-R1(config-router)#neighbor x.x.x.x password <senha cymru> GX-R1(config-router)#exit
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 222
GX-R1(config)#ip bgp-community new-format !---habilita suporte communities tipo xxxx:yyyy GX-R1(config)#ip route 192.0.2.1 255.255.255.255 null0 !---cria a rota de blackhole GX-R1(config)#ip community-list 10 permit 65333:888 !---adiciona a community 65333:888 na comm-list 10 GX-R1(config)#route-map FILTRO-CYMRUBOGONS permit 10 !---entra as opes do route-map de entrada GX-R1(config-route-map)#match community 10 !---declara o conteudo da comm-list 10 para condio de math GX-R1(config-route-map)#set ip next-hop 192.0.2.1 !---para toda rota que fizer a condio mudar o next-hop para blackhole GX-R1(config)#ip prefix-list SAIDA-CYMRU seq 5 deny 0.0.0.0/0 le 32 !---garantir que nada ser anunciado para o cymru
223
4.3
Configurando Filtros de Downstreams
224
A primeira coisa e se levar em conta a prioridade maior para os prefixos recebidos do meu downstream. Ao mesmo tempo, no podemos correr o risco de receber um fullrouting desse cliente por algum erro dele, caso isso acontea, todo meu upload passa a subir por esse cliente.
225
LAB 1-4-2
LAB: O router R2 agora ser um cliente de trnsito (downstream) com as seguintes informaes:
Cliente de trnsito:
AS: 100X Bloco CIDR: 187.X.0.0/22 IP de WAN: X.X.100.2 Interface serial 1/3
226
LAB 1-4-2
227
LAB 1-4-2
GX-R2(config)#no router bgp X !--- Primeiro preciso remover as configuraes de BGP que utilizavam o as X GX-R2(router)#router bgp 100X GX-R2(config-router)#no auto-summary GX-R2(config-router)#network 187.X.0.0 mask 255.255.252.0 GX-R2(config-router)#neighbor X.X.100.1 remote-as X !--- Configurando o BGP com UPSTREAM GX-R1(config-router)#exit GX-R1(config)#interface loopback 0 GX-R1(config-if)#ip address 187.X.0.0 255.255.252.0 !--- configura um IP na loopback para que haja a ocorrncia na FIB GX-R1#clear ip bgp *
228
LAB 1-4-2
Notem que no estgio em que chegamos, utilizar prefix-lists est se tornando dificil de escalar e debugar problemas, pois com uma determinada quantidade de dowstreams, simplesmente no conseguimos identificar a quem percentem os blocos de IP. Discutiremos posteriormente modelos mais fceis de escalar com route-map
229
4.4
Entendendo o BGP REGEXP
230
Quando temos muitos clientes de trnsito preciso estabelecer padres para que os administradores sejam capazes de entender as configuraes.
Por exemplo:
H um "range" de nmeros de AS que so de uso privado semelhantes aos IPs 192.168.x.x . Esse intervalo vai de 64512 at 65535, e no devemos receber anncios que contenham algum desses AS's no path.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 231
Imagine ter que configurar uma linha de deny para cada AS privado.
Router(config)#ip as-path access-list 1 deny 64512 Router(config)#ip as-path access-list 1 deny 64513 Router(config)#ip as-path access-list 1 deny 64514 ... ... Router(config)#ip as-path access-list 1 deny 65534 Router(config)#ip as-path access-list 1 deny 65535 Router(config)#ip as-path access-list 1 permit .*
Seria um tanto complicado! Felizmente com expresses regulares ao invs de milhares, resolvo esse problema com apenas 2, (ou uma talvez).
232
Substitui uma lista de expresses, que pode ser uma vrgula (,), chave esquerda ({), chave direita (}), o incio da seqncia de entrada (^), o fim da seqncia de entrada ($), ou um espao.
Antes vamos entender a funo dos principais caracteres nas expresses regulares:
"1" Um nmero isolado satisfaz a condio para qualquer expresso que contenha esse nmero. exemplo1: 1 "a condio de match qualquer AS no Path (podem haver vrios AS's) que contenha o nmero 1 em qualquer parte, em pelo menos um dos AS's. Satisfaz: 99199, "123 432", "999 888 777 123 998". No satisfaz: "355 3344 22334", "466", etc.
exemplo2: _1 "a condio de match qualquer AS no Path (podem haver vrios AS's) que contenha o nmero 1 no nicio de pelo menos um dos AS's e que essa ocorrncia no seja a primeira. Satisfaz: "891 12333 3445 9999", "555 123 432", "1111 2222 4444". No satisfaz: "4333 21123", "4661" "21111 912222", etc.
exemplo3: _1_ "a condio de match qualquer AS no Path (podem haver vrios AS's) que contenha o nmero 1 sozinho em pelo menos um dos AS's e essa ocorrncia pode ser a primeira e/ou a ltima. Satisfaz: "2333 1 3445 9999", "33 1", "433 4444 1 433", 1 No satisfaz: "333 222 555 12". v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 234
Exemplo: 4.5 "a condio de match qualquer nmero de 3 ou mais dgitos que tenha 4 e 5 em qualquer parte do AS PATH e com um dgito qualquer entre eles
Satisfaz: "23415", "43425", "435 3333", "445", "45587", "321 44459 345" No satisfaz: 315, 416, etc
235
$ Satisfaz a condio para o tudo que o que for terminado com o caracter (ou expresso) ao lado esquerdo de "$"
exemplo1: 12$ "a condio de match qualquer AS PATH em que os dois ltimos dgitos sejam 1 e 2 respectivamente" Satisfaz: 4912, "65012", "12312", "11112", "9932 9976 64912", "28135 17379 54312" ... No satisfaz: 13, 22, 129, 55413, 58752
exemplo2: _12$ "a condio de math qualquer AS PATH em que ltimo AS seja 12" Satisfaz: "12", "2335 12", "312 12", "111 12" No satisfaz: "444 112", "22", "12 229", "999 12 1111"
exemplo3: 1.2$ "a condio de match qualquer AS PATH em que seus ltimos 3 dgitos do ltimo AS sejam: 1, qualquer coisa e 2 respectivamente" Satisfaz: "123 45666 33 112", "444 122", "132", "1111 132", "444 65192", "60192" No satisfaz: "2333 222", 123, 112 912
236
^ Satisfaz a condio para caracteres que comecem com o caracter (ou exprsso) aps o ^
exemplo1: ^1 "a condio de match qualquer AS PATH que tenha o dgito 1 no incio do primeiro AS do PATH satisfaz: "1111 9999 55443", "12345 6776", 12222, 19999 no satisfaz: 21111, 31211, 2, 3, 43111
exemplo2: ^1.4 "a condio de match qualquer AS PATH em que os 3 primeiros dgitos do primeiro as sejam: 1, qualquer coisa e 4 respectivamente Satisfaz: "124 4321", "12444", "1449", "19455 12333", "10466 55443 9900" No satisfaz: 195, 2124, 22444, 9104
exemplo3: ^1..8$ "a condio de match um AS PATH contento apenas um AS de 4 dgitos, onde o primeiro dgito 1, o segundo e o terceiro qualquer coisa e o quarto e ltimo seja 8 respectivamente Satisfaz: 1008, 1248, 1118, 1228, 1998, 1888 No satisfaz: 10008, "1008 1008", "14448"
237
* Satisfaz a condio para qualquer caractere esquerda do "*", inclusive nenhum, por isso preciso utilizar o caracter um espao "_" branco em conjunto, pois sem espao a expresso perde o sentido, por exemplo, 1* satisfaria condio para qualquer coisa, e o padro intuitivo para "qualquer coisa/tudo" ".*" exemplo1: 1_* "a condio de match qualquer coisa que contenha o dgito 1 em qualquer parte do AS" satisfaz: "43431 9999 777 9999 8888(infinito...), 99 9991 345 666 654 5556... no satisfaz: 8872, "9987 2332", etc
Exemplo2: .* "a condio de math qualquer AS PATH de qualquer tamanho, com qualquer combinao" Satisfaz: TUDO No satisfaz: NADA
238
\ Este caracter usado quando os caracteres de condio tambm so caracteres de expresso regular, por exemplo, se precisssemos de uma expresso para dinheiro, onde a condio fosse "R$ 10,01" at "R$ 10,99", teramos um grande problema, j que a expresso necessria "R$_10,..$" Notem que o "$" precisa aparacer como "condio" ao mesmo tempo que um caracter de expresso regular. Sendo assim, no funcionaria. O caracter "\" usado para declarar que o prximo caracter dever ser interpretado como "condio", ao invs de sua funo normal. Assim, a expresso corret ficaria "R\$_10,..$" Felizmente no utilizaremos esse caracter para BGP
239
[ ] Satifaz a condio para qualquer um dos caracters dentro dos colchetes, mas apenas UM deles. H a possibilidade de utilizar intervalos entre os colchetes seguidos de hfem "-" Dentro dos colchetes o caracter "^" tem funo de negao, O intervalo funciona da mesma forma para as negaes.
exemplo1: ^9[249]5$ "a condio um AS que contenha qualquer combinao de 3 dgitos sendo o primeiro 9, o terceiro 5 e o do meio 2, 4 ou 9 Satisfaz: 925, 945, e 995 No satisfaz: 915, 955, 965, etc
exemplo2: ^9[5-7]5$ "mesma lgica do exemplo 1, porm o dgito do meio pode ser de 5 7" Satisfaz: 955, 965 e 975
exemplo3: ^9[^28]5$ "a condio de match a mesma lgica dos exemplos 1 e 2 porm o digito do meio no poder ser 2 ou 8 Satistaz: todas as possibilidades de um 9.5 " menos" 925 e 985.
exemplo4: ^9[^5-8]5$ "a condio de match segue a mesma lgica dos exemplos 2 e 3 porm o dgito do meio no pode estar no intervalo entre 5 e 8 (5,6,7 ou 8) Satisfaz: todas as possibilidades "menos" 955, 965, 975 e 985 v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 240
241
+ Satisfaz a condio para uma(pelo menos) ou mais ocorrncias do caracter (ou expresso) anterior em qualquer parte
exemplo1: ^([^ ]+)$ satisfaz: qualquer ASPATH que contenha apenas 1 AS Aplicao prtica: Filtrar para meu cliente apenas rotas que tenham um AS no path e nada mais
? Satisfaz a condio para uma ou nenhuma ou uma ocorrencia do caracter (ou expresso) anterior exemplo1: ^([^ ]+)?$ satisfaz: qualquer rota que tenha no mximo um AS no PATH ou NENHUM Aplicao prtica: Filtrar para meu cliente apenas rotas que tenham um AS no path e tambm rotas que no contenham NENHUM AS no PATH (rotas originadas localmente)
LAB 1-4-2
Agora vamos raciocinar um pouco e utilizar as expresses que aprendemos para bloquear o range dos AS's 64512 at 65535 utilizando o menor nmero possvel de regras...
243
LAB 1-4-2
244
Existem infinitas aplicaes, por exemplo, descubro que o AS 12345 est com lentido, crio polticas que diminuem a prioridade de qualquer prefixo anunciado por esse AS
router(config)#ip as-path access-list 20 permit _12345_ !--- cria a ACL 20 e diz que qualquer AS PATH contendo 12345 est nela router(config)#route-map UPSTREAM-1 permit 1 !--- Cria um route-map no topo da hierarquia router(config-route-map)#set local-preference 90 !--- especifica a ao "mudar o local pref para 90" router(config-route-map)#match as-path 20 !--- especifica quem ir receber a ao "set local pref 90" router(config-route-map)#exit router(config)#route-map UPSTREAM-1 permit 2 !--- cria um route-map em brancoque aceita todo o resto sem modificaes router(config-route-map)#exit
245
router(config)#route-map UPSTREAM-2 permit 1 !--- Cria um route-map no topo da hierarquia router(config-route-map)#set local-preference 90 !--- especifica a ao "mudar o local pref para 90" router(config-route-map)#match as-path 20 !--- especifica quem ir receber a ao "set local pref 90" router(config-route-map)#exit router(config)#route-map UPSTREAM-2 permit 2 !--- cria um route-map em brancoque aceita todo o resto sem modificaes router(config-route-map)#exit
246
As expresses regulares no servem apenas para filtrar prefixos, mas tambm para encontrar certas rotas entre as centenas de milhares de uma tabela full Por exemplo: Quero saber quais rotas na minha RIB foram originadas pelo AS 6762 (TELECOM ITALIA SPARKLE S.p.A.)
BGPD-ALOG-SP# sh ip bgp regexp _6762$ ... Network Next Hop Metric LocPrf Weight Path *> 2.16.70.0/23 201.20.36.158 0 16397 6762 i *> 2.16.140.0/23 201.20.36.158 0 16397 6762 i *> 2.16.146.0/23 201.20.36.158 0 16397 6762 i ...
247
Exemplo 2:
Quais rotas foram recebidas pela Intelig atravs do peering com Embratel?
BGPD-ALOG-SP# sh ip bgp regexp _17379 4230_ ... Network Next Hop Metric LocPrf Weight Path *> 186.205.244.0/22 201.20.36.158 0 16397 17379 4230 28573 i
Exemplo 3:
Quais ASs esto diretamente conectados (sem prepend) com o AS 4230 (EMBRATEL)?
BGPD-ALOG-SP# sh ip bgp regexp _4230 ([0-9]+)$
Network
Next Hop
*> 23.61.118.0/23 201.20.36.158 0 16397 17379 4230 28573 i *> 23.61.120.0/22 201.20.36.158 0 16397 17379 4230 28573 i ... v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 248
Network
Next Hop
201.20.36.157 201.20.36.158
249
4.5
Enviando e Recebendo Partial e Full-Routing
250
LAB 1-4-3
A lgica mesma, vamos utilizar a as-path acl "10". GX-R1(config-router)#neighbor X.X.100.2 filter-list 10 out GX-R1(config)#ip as-path access-list 10 permit ^([^ ]+)?$
!--- nesse exemplo enviaremos apenas rotas com no mximo 1 AS no AS-PATH !--- inclusive rotas com 0 AS's no path, ou seja, originadas localmente
251
LAB 1-4-3
252
LAB 1-4-3
253
LAB 1-4-3
As chaves ajudam a diminuir o as repeties de certas "palavras", por exemplo: Para enviar um parcial routing para um cliente eu poderia utilizar as seguintes expresses:
Essa expresso incompleta, pois no anunciaria prefixos originados no meu prprio AS (que no tem nenhum AS no PATH), e preciso ento fazer mais uma me deixando com 2 regras no total...
router(config)# ip as-path access-list 1 permit ^([0-9]+)$ router(config)# ip as-path access-list 1 permit ^$
(...continua)
254
LAB 1-4-3
Para aumentar para at 2 AS's eu coloco mais uma... router(config)# ip as-path access-list 1 permit ^([0-9]+ [0-9+)$ router(config)# ip as-path access-list 1 permit ^([0-9]+)$ router(config)# ip as-path access-list 1 permit ^$ Adicionar 3 regras seja um problema, mas um problema se eu quiser "visualizar" em um comando s, nesse caso fica um tanto tosco dar 3 comandos diferentes. Felizmente h a opo de facilitar com o PIPE...
router#sh ip bgp regexp ^([0-9]+ [0-9]+)$|^([0-9]+)$|^$
Dessa forma consigo ver tudo e ao mesmo tempo criar uma regra que "vale por 3"
(...continua)
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 255
LAB 1-4-3
^([0-9]+ [0-9]+)$|^([0-9]+)$|^$
Evidentemente ainda d para melhorar, trocando a expresso "qualquer nmero" [0-9]+" por "qualquer coisa q nao seja em branco" "[^ ]", logo:
de
^([0-9]+ [0-9]+)$|^([0-9]+)$|^$
(...continua)
256
LAB 1-4-3
^([0-9]+ [0-9]+)$|^([0-9]+)$|^$
Evidentemente ainda d para melhorar, trocando a expresso "qualquer nmero" [0-9]+" por "qualquer coisa q nao seja em branco" "[^ ]", logo:
de
^([0-9]+ [0-9]+)$|^([0-9]+)$|^$
(...continua)
257
LAB 1-4-3
Mesmo ficando pouco intuitivo, tivemos uma boa reduo na quantidade de caracteres e linhas... (apenas 1)
router(config)#ip as-path access-list 1 permit ^(([^ ]+ [^ ]+)|([^ ]+)|())$
Agora imagine a dificuldade de escalar em demandas de 3 ou 4 AS's para 3 => ^(([^ ]+)|([^ ]+ [^ ]+)|([^ ]+ [^ ]+ [^ ]+)|())$ para 4 => ^(([^ ]+)|([^ ]+ [^ ]+)|([^ ]+ [^ ]+ [^ ])|([^ ]+ [^ ]+ [^ ]+ [^]+)|())$
(...continua)
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 258
LAB 1-4-3
Ento as chaves ajudam a eliminar as repeties inserindo um intervalo de repeties dentro das chaves {}... Consigo diminuir essa expresso de:
^(([^ ]+)|([^ ]+ [^ ]+)|([^ ]+ [^ ]+ [^ ])|([^ ]+ [^ ]+ [^ ]+ [^ ]+)|())$
para:
^([^ ]+_){0,4}$
Ou seja, a palavra ([^ ]+_) esquerda de {0,4} pode se repetir 0 vezes, 1 vez, 2 vezes, 3 vezes ou 4 vezes.
Infelizmente, nas verses de IOS que otilizamos nesse curso as chaves simplesmente no funcionam PS: No Quagga funciona 100%.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 259
4.6
Route-Map x Prefix-List
260
261
Mas nesse caso preciso que todas as condies sejam atendidas, caso contrrio, o route-map ignorado e processado o prximo route-map na sequncia
router(config)#route-map FILTROS-DE-ENTRADA permit 10 router(config-route-map)#match ip address prefix-list MUDAR-METRIC router(config-route-map)#set metric 50 v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 262
263
264
router#sh running-config | begin TESTE route-map TESTE permit 1 set weight 10 ! route-map TESTE permit 2 match ip address BLOCOS-CLIENTE-1 set metric 10 set local-preference 350 ! route-map TESTE permit 3 match as-path 20 set local-preference 400 ! v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 265
! ip prefix-list A seq 5 permit 192.168.2.0/24 ip prefix-list A seq 10 deny 192.168.2.128/25 ! route-map TESTE deny 1 match ip address prefix-list A ! route-map TESTE permit 2 !
Nesse caso o prefixo 192.168.2.0/24 ser bloqueado , enquanto 192.168.2.128/25 ser permitido, porm inutilizado por causa da regra de cima
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com
266
4.7
AS-Path Prepend
267
Para manipular o download pra os prefixos do meu prprio AS eu posso facilmente anunciar prefixos mais ou menos especficos.
Mas como AS de trnsito no tenho como pedir aos meus clientes que modifiquem seus anncios caso eu queira usar um link especfico.
O AS PATH prepend adiciona nmeros extras de AS no AS PATH das rotas anunciadas para um determinado neighbor.
268
Exemplo1:
(Router-E1) router bgp 65000 no synchronization bgp log-neighbor-changes network 10.7.1.0 mask 255.255.255.0 neighbor 10.0.1.2 remote-as 64800 neighbor 10.0.1.6 remote-as 64800 neighbor 10.0.1.6 route-map prepend out ! route-map prepend permit 10 set as-path prepend 65000 65000 65000 (Router-R2) R2#show ip bgp BGP table version is 3, local router ID is 10.2.0.2 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal, r RIB-failure, S Stale Origin codes: i - IGP, e - EGP,? - incomplete Network Next Hop Metric LocPrf Weight Path *>i10.7.1.0/24 10.0.1.1 0 100 0 65000 i * 10.0.1.5 0 0 65000 65000 65000 65000 i
Fonte:
http://wiki.nil.com/AS-path_prepending_(technical_details)
269
Exemplo2:
(Router-R1) router bgp 64800 no synchronization bgp log-neighbor-changes neighbor 10.0.1.1 remote-as 65000 neighbor 10.0.1.1 route-map prependIn in neighbor 10.2.0.2 remote-as 64800 ! route-map prependIn permit 10 set as-path prepend last-as 2
(Router-R1) R1#show ip bgp BGP table version is 2, local router ID is 10.0.0.1 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal, r RIB-failure, S Stale Origin codes: i - IGP, e - EGP, ? - incomplete Network *> 10.7.1.0/24 Next Hop 10.0.1.1 Metric LocPrf Weight Path 0 0 65000 65000 65000 i
Fonte:
http://wiki.nil.com/AS-path_prepending_(technical_details)
270
4.8
Engenharia de Trfego I
271
LAB 1-4-4
LAB: Todos os grupos configurar Upstreams + Dowmstreams de acordo com os seguintes requisitos:
AS-123
Apenas o DOWNLOAD do CLIENTE (AS100X) dever chegar pelo AS 100, de forma que o DOWNLOAD do AS LOCAL continuar chegando pelo AS 200.
AS-100
AS-200
AS-X
272
LAB 1-4-4
Configurando:
GX-R1(config-router)#no neighbor 200.X.1.1 prefix-list ANUNCIAR-AS-200 out
!--- desconfigura a prefix list ANUNCIAR-AS-200 do filtro de saida do AS 200
273
4.8
PERGUNTAS?
274
5.0
Roteamento dentro do AS (iBGP)
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
275
5.0
Roteamento dentro do AS (iBGP)
5. Roteamento dentro do AS (iBGP) 5.1 Implementando mltiplas sadas para clientes de trnsito 5.2 Update-source 5.3 Next-hop-self 5.4 BGP Synchronization 5.5 Route-reflector 5.6 Peer groups 5.7 Local Preference x Weight no iBGP 5.8 Engenharia de Trfego II
276
5.1
Implementando Mltiplas Sadas para Clientes de Trnsito
277
Conforme discutido anteriormente, o BGP um protocolo desenvolvido para troca de rotas entre AS's distintos. Deve ser evitado dentro do AS, a menos que as extremidades precisem trocar rotas de AS's externos. Em outras palavras, se houver realmente a necessidade de entregar para um DOWNSTREAM rotas recebidas de um UPSTREAM. No exemplo abaixo no h necessidade de injetar rotas externas dentro do AS:
278
Injetar rotas externas se faz necessrio apenas quando essas precisam atravessar o AS. Em outras palavras, se houver realmente a necessidade de entregar para um DOWNSTREAM rotas recebidas de um UPSTREAM. No exemplo as rotas recebidas do AS 20 e 30 precisam chegar ao AS 50 e vice-versa.
279
280
Em nosso LAB h mltiplos caminhos, e todos os routers (exceto AS's externos) j esto configurados com OSPF:
281
Nos prximos LABs os alunos se juntaro em grupos de 3. Alunos da mesma bancada faro parte do mesmo grupo, de maneira que os grupos 1,2,3 sero o GRUPO 1 AS 1 Grupos 4, 5 e 6 sero GRUPO 2 AS 2 Grupos 7, 8 e 9 sero GRUPO 3 AS 3 Grupos 10, 11 e 12 sero GRUPO 4 AS 4 Grupos 13, 14 e 15 sero GRUPO 5 AS 5 Grupos 16, 17 e 18 sero GRUPO 6 AS 6 Grupos 19, 20 e 21 sero GRUPO 7 AS 7 Grupos 22, 23 e 24 sero GRUPO 8 AS 8
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 282
Cada membro do grupo vai configurar um IP da mesma rede em seu laptop, exemplo sugerido laptop1 X.X.100.2/24, laptop2 X.X.100.3/24 e laptop3 X.X.100.4/24. Testar conectividade IP com R3 e a partir dele acessar todos os outros routers via telnet.
283
LAB 2-1-1
LAB: Considerando que as cidades onde ficam R4 e R5 atendem clientes de trnsito (DOWNSTREAMS), e as cidades onde ficam R1 e R2 tem sada de trnsito IP (UPSTREAMS), precisaremos que R4 e R5 recebam e enviem rotas para o AS 100 (atravs de R1), e para o AS 200 atravs de R2.
Vamos estabelecer sesses eBGP entre os clientes de trnsito AS 14X com R4 e AS 15X com R5.
NOTA:
!--- No intuito de facilitar a visualizao das rotas por parte dos alunos, em !--- todos os LABS seguintes no trabalharemos com anncios mais !--- especficos que /8, (com excesso dos anncios ao PTT no lab !--- correspondente
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 284
LAB 2-1-1
LADO DA OPERADORA
AS-X-R4#conf t AS-X-R4(config)#router bgp X AS-X-R4(config-router)#bgp router-id X.0.0.4 !--- nesse LAB vamos configurar um Router-ID para facilitar a visualizao das rotas AS-X-R4(config-router)#synchronization AS-X-R4(config-router)#neighbor X.14X.4.2 remote-as 14X AS-X-R4(config-router)#neighbor X.14X.4.2 description eBGP-downstream-AS-14X AS-X-R4(config-router)#neighbor X.14X.4.2 soft-reconfiguration inbound AS-X-R4(config-router)#neighbor X.14X.4.2 prefix-list BLOCOS-AS-14X in !--- declara o filtro de entrada para rotas recebidas desse DOWNSTREAM AS-X-R4(config-router)#exit AS-X-R4(config)#ip prefix-list BLOCOS-AS-14X permit 14X.0.0.0/8 !--- adiciona os blocos CIDR do DOWNSTREAM nesa prefix-list que foi !--- declarada nas configuraes BGP
285
LAB 2-1-1
LADO DO CLIENTE
AS-14X-R1#conf t AS-14X-R1(config)#router bgp 14X AS-14X-R1(config-router)#bgp router-id 14X.0.0.1 AS-14X-R1(config-router)#no synchronization AS-14X-R1(config-router)#network 14X.0.0.0 mask 255.0.0.0 AS-14X-R1(config-router)#neighbor X.14X.4.1 remote-as X AS-14X-R1(config-router)#neighbor X.14X.4.1 description eBGP-upstream-AS-X AS-14X-R1(config-router)#neighbor X.14X.4.1 soft-reconfiguration inbound AS-14X-R1(config-router)#neighbor X.14X.4.1 prefix-list MEUS-BLOCOS out AS-14X-R1(config-router)#exit AS-14X-R1(config)#ip prefix-list MEUS-BLOCOS permit 14X.0.0.0/8 AS-14X-R1(config)#interface loopback 0 AS-14X-R1(config-if)#ip address 14X.0.0.1 255.128.0.0 AS-14X-R1(config-if)#exit AS-14X-R1(config)#ip route 14X.0.0.0 255.0.0.0 null 0 AS-14X-R1(config)#end AS-14X-R1#clear ip bgp *
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 286
LAB 2-1-1
LADO DA OPERADORA
AS-X-R5#conf t AS-X-R5(config)#router bgp X AS-X-R5(config-router)#bgp router-id X.0.0.5 !--- nesse LAB vamos configurar um Router-ID para facilitar a visualizao das rotas AS-X-R5(config-router)#synchronization AS-X-R5(config-router)#neighbor X.14X.5.2 remote-as 15X AS-X-R5(config-router)#neighbor X.14X.5.2 description eBGP-downstream-AS-15X AS-X-R5(config-router)#neighbor X.14X.5.2 soft-reconfiguration inbound AS-X-R5(config-router)#neighbor X.14X.5.2 prefix-list BLOCOS-AS-15X in !--- declara o filtro de entrada para rotas recebidas desse DOWNSTREAM AS-X-R5(config-router)#exit AS-X-R5(config)#ip prefix-list BLOCOS-AS-14X permit 15X.0.0.0/8 !--- adiciona os blocos CIDR do DOWNSTREAM nesa prefix-list que foi !--- declarada nas configuraes BGP
287
LAB 2-1-1
LADO DO CLIENTE
AS-15X-R1#conf t AS-15X-R1(config)#router bgp 15X AS-15X-R1(config-router)#bgp router-id 15X.0.0.1 AS-15X-R1(config-router)#no synchronization AS-15X-R1(config-router)#network 15X.0.0.0 mask 255.0.0.0 AS-15X-R1(config-router)#neighbor X.15X.5.1 remote-as X AS-15X-R1(config-router)#neighbor X.15X.5.1 description eBGP-upstream-AS-X AS-15X-R1(config-router)#neighbor X.15X.5.1 soft-reconfiguration inbound AS-15X-R1(config-router)#neighbor X.15X.5.1 prefix-list MEUS-BLOCOS out AS-15X-R1(config-router)#exit AS-15X-R1(config)#ip prefix-list MEUS-BLOCOS permit 15X.0.0.0/8 AS-15X-R1(config)#interface loopback 0 AS-15X-R1(config-if)#ip address 15X.0.0.1 255.128.0.0 AS-15X-R1(config-if)#exit AS-15X-R1(config)#ip route 15X.0.0.0 255.0.0.0 null 0 AS-15X-R1(config)#end AS-15X-R1#clear ip bgp *
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 288
LAB 2-1-1
5.3 Next-hop-self
289
LAB 2-1-1
5.3 Next-hop-self
290
LAB 2-1-1
5.3 Next-hop-self
291
LAB 2-1-1
5.3 Next-hop-self
LAB 2-1-1
AS-X-R4#conf t AS-X-R4(config)#router bgp X AS-X-R4(config-router)#neighbor X.0.0.1 remote-as X AS-X-R4(config-router)#neighbor X.0.0.1 description iBGP Router 1
LAB 2-1-1
AS-X-R1#conf t AS-X-R1(config)#router bgp X AS-X-R1(config-router)#bgp router-id X.0.0.1 AS-X-R1(config-router)#neighbor X.0.0.4 remote-as X AS-X-R1(config-router)#neighbor X.0.0.4 description iBGP Router 4
AS-X-R1#conf t AS-X-R1(config)#router bgp X AS-X-R1(config-router)#neighbor X.0.0.5 remote-as X AS-X-R1(config-router)#neighbor X.0.0.5 description iBGP Router 5
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 294
LAB 2-1-1
AS-X-R5#conf t AS-X-R5(config)#router bgp X AS-X-R5(config-router)#neighbor X.0.0.1 remote-as X AS-X-R5(config-router)#neighbor X.0.0.1 description iBGP Router 1
AS-X-R5#conf t AS-X-R5(config)#router bgp X AS-X-R5(config-router)#neighbor X.0.0.2 remote-as X AS-X-R5(config-router)#neighbor X.0.0.2 description iBGP Router 2
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 295
LAB 2-1-1
AS-X-R2#conf t AS-X-R2(config)#router bgp X AS-X-R2(config-router)#bgp router-id X.0.0.2 AS-X-R2(config-router)#neighbor X.0.0.4 remote-as X AS-X-R2(config-router)#neighbor X.0.0.4 description iBGP Router 4
AS-X-R2#conf t AS-X-R2(config)#router bgp X AS-X-R2(config-router)#neighbor X.0.0.5 remote-as X AS-X-R2(config-router)#neighbor X.0.0.5 description iBGP Router 5
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 296
297
5.2 - Update-source
Como decidimos estabelecer as sesses utilizando os IPs de loopback dos routers internos, nos deparamos com um problema de conexo TCP.
298
5.2 - Update-source
A menos que especifiquemos o contrrio, o IP de origem de todo pacote o IP da interface que saiu.
Em outras palavras, se a melhor rota para alcanar R4 pela serial 1/1, o IP de origem ser o IP dessa interface.
299
5.2 - Update-source
Vejamos:
AS-X-R4#sh ip route X.0.0.1 Routing entry for X.0.0.1/32 Known via "ospf 1", distance 110, metric 129, type intra area Last update from X.X.4.1 on Serial1/0, 07:43:20 ago Routing Descriptor Blocks: * X.X.4.1, from X.0.0.1, 07:43:20 ago, via Serial1/0 Route metric is 129, traffic share count is 1
Nesse caso, quando o pacote "syn" chegar ao router R1 ( X .0.0.1) para solicitar o incio da sesso BGP, o seu IP de origem desse pacote ser X .X .4.2, e j que R1 foi configurado para estabelecer BGP com X .0.0.4 (R4) ele naturalmente rejeita essa conexo.
300
5.2 - Update-source
07:42:42: BGP: X.0.0.1 open active, delay 7672ms 07:42:50: BGP: X.0.0.1 open active, local address X.X.4.2 07:42:50: BGP: X.0.0.1 open failed: Connection refused by remote host
301
LAB 2-1-2
5.2 - Update-source
Para resolver esse problema precisamos dizer ao meu router R4 que utilize o IP X .0.0.4 para estabelecer a conexo TCP-179 com R1:
AS-X-R4(config)#router bgp X AS-X-R4(config-router)#neighbor X.0.0.1 update-source loopback 0 AS-X-R4(config-router)#neighbor X.0.0.2 update-source loopback 0 !--- loopback 0 a interface que possui o IP X.0.0.4 no R4 !--- mas tambm podemos declarar um IP ao invs de uma interface
302
LAB 2-1-2
5.2 - Update-source
Analizando novamente o debug aps a mudana no updade source:
07:48:50: BGP: X.0.0.1 open active, local address X.0.0.4 07:48:50: BGP: X.0.0.1 went from Active to OpenSent 07:48:50: BGP: X.0.0.1 sending OPEN, version 4, my as: X 07:48:50: BGP: X.0.0.1 rcv message type 1, length (excl. header) 26 07:48:50: BGP: X.0.0.1 rcv OPEN, version 4 07:48:50: BGP: X.0.0.1 rcv OPEN w/ OPTION parameter len: 16 07:48:50: BGP: X.0.0.1 rcvd OPEN w/ optional parameter type 2 (Capability) len 6 07:48:50: BGP: X.0.0.1 OPEN has CAPABILITY code: 1, length 4 07:48:50: BGP: X.0.0.1 OPEN has MP_EXT CAP for afi/safi: 1/1 07:48:50: BGP: X.0.0.1 rcvd OPEN w/ optional parameter type 2 (Capability) len 2 07:48:50: BGP: X.0.0.1 OPEN has CAPABILITY code: 128, length 0 07:48:50: BGP: X.0.0.1 OPEN has ROUTE-REFRESH capability(old) for all address-families 07:48:50: BGP: X.0.0.1 rcvd OPEN w/ optional parameter type 2 (Capability) len 2 07:48:50: BGP: X.0.0.1 OPEN has CAPABILITY code: 2, length 0 07:48:50: BGP: X.0.0.1 OPEN has ROUTE-REFRESH capability(new) for all address-families 07:48:50: BGP: X.0.0.1 went from OpenSent to OpenConfirm 07:48:50: BGP: X.0.0.1 went from OpenConfirm to Established 07:48:50: %BGP-5-ADJCHANGE: neighbor X.0.0.1 Up
303
LAB 2-1-2
5.2 - Update-source
304
5.2 - Update-source
Por que o R1 responde (com a mensagem type 1) utilizando o IP destino que R4 inseriu no pacote de "OPEN" (X.0.0.1).
Na prtica preciso que apenas um dos dois routers altere o " updatesource", porm recomendvel alterar nos dois, pois isso pode fazer com que a sesso estabelea alguns segundos mais rpido numa eventual queda.
305
LAB 2-1-3
5.2 - Update-source
306
LAB 2-1-3
5.3 Next-hop-self
Notem que no estamos anunciando as redes recebidas pelos meus DOWNSTREAMS, mas apenas o classe A do AS local.
Por que?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 307
LAB 2-1-3
5.3 Next-hop-self
O primeiro critrio para o protocolo BGP anunciar algum prefixo que esse prefixo esteja vlido na FIB.
AS-X-R1#sh ip bgp ... Network Next Hop *> X.0.0.0 0.0.0.0 * i14X.0.0.0 6.116.4.2 * i15X.0.0.0 6.126.5.2 ... Metric LocPrf Weight Path 0 32768 i 0 100 0 14 X i 0 100 0 15 X i
O prefixo "X.0.0.0" est com o caractere ">", o que demonstra que esse prefixo est de fato na FIB (best). Porm no o que acontece com os prefixos recebidos dos DOWNSTREAMS. Os prefixos 14X.0.0.0 e 15X.0.0.0 esto na RIB, mas no na FIB. Por que esses prefixos no esto na FIB?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 308
LAB 2-1-3
5.3 Next-hop-self
Para que esse prefixo seja vlido na FIB necessrio que o "next-hop" correspondente tambm seja vlido, o que no ocorre. Mas esse apenas um dos problemas perceptveis na sada do ltimo comando.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 309
LAB 2-1-3
5.3 Next-hop-self
Resolvendo o primeiro problema: No recomendvel que as interfaces externas do AS participem do IGP (OSPF), portanto vamos para outra soluo. Vamos ento utilizar o comando BGP "next-hop-self" que altera o next-hop para o IP de neighbor.
AS-X-R1#conf t AS-X-R1(config)#router bgp X AS-X-R1(config-router)#neighbor X.0.0.4 next-hop-self AS-X-R1(config-router)#neighbor X.0.0.5 next-hop-self AS-X-R2#conf t AS-X-R2(config)#router bgp X AS-X-R2(config-router)#neighbor X.0.0.4 next-hop-self AS-X-R2(config-router)#neighbor X.0.0.5 next-hop-self
310
LAB 2-1-3
5.3 Next-hop-self
Continuando em R4 e R5...
LAB 2-1-4
Notem que o next-hop no se encontra mais inacessvel, porm a rota mostra uma outra mensagem: "NOT SYNCRONIZED ". Isso acontece com rotas aprendidas por iBGP, uma vez que por padro o protocolo exige a sincronizao da rota antes de anunci-la aos AS's externos. Nas verses e caixas mais novas o syncronize vem desabilitado.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 312
LAB 2-1-4
AS-X-R1#conf t AS-X-R1(config)#router bgp X AS-X-R1(config-router)#no synchronization AS-X-R1(config-router)#end AS-X-R1#clear ip bgp * AS-X-R2#conf t AS-X-R2(config)#router bgp X AS-X-R2(config-router)#no synchronization AS-X-R2(config-router)#end AS-X-R2#clear ip bgp *
313
LAB 2-1-4
Continuando em R4 e R5...
AS-X-R4#conf t AS-X-R4(config)#router bgp X AS-X-R4(config-router)#no synchronization AS-X-R4(config-router)#end AS-X-R4#clear ip bgp * AS-X-R5#conf t AS-X-R5(config)#router bgp X AS-X-R5(config-router)#no synchronization AS-X-R1(config-router)#end AS-X-R5#clear ip bgp *
314
LAB 2-1-4
Metric LocPrf Weight Path 0 32768 i 0 0 100 i 0 100 0 146 i 0 100 0 156 i
Verificando o caractere ">" podemos ter certeza dessa vez as rotas foram para FIB.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 315
LAB 2-1-4
Vamos agora ter certeza que os prefixos do meus DOWNSTREAMS esto sendo anunciados aos UPSTREAMS:
AS-X-R1#sh ip bgp 14X.0.0.0 BGP routing table entry for 14X.0.0.0/8, version 16 Paths: (1 available, best #1, table Default-IP-Routing-Table) Advertised to non peer-group peers: 100.X.1.1 11X X.0.0.4 (metric 129) from X.0.0.4 (X.0.0.4) Origin IGP, metric 0, localpref 100, valid, internal, best
Bingo!! Estamos anunciando os prefixos de DOWNSTREAMS para o AS 100. O mesmo vale para R2, R4 e R5, s conferir.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 316
LAB 2-1-4
Agora entrem no Looking Glass ( nesse LAB o IP mudou para 99.99.99.1) e testem a conectividade IP para os AS's clientes 14X e 14X,
telnet 99.99.99.1... !--executem traceroute para os IPs dos seus respectivos downstreams AS-99-R1>traceroute 14X.0.0.1 Type escape sequence to abort. Tracing the route to 14X.0.0.1 1 99.100.1.2 12 msec 16 msec 4 msec 2 100.X.1.2 [AS 100] 60 msec 28 msec 36 msec 3 * * * 4 * * * 5 * * *
Entendendo o "syncronization"...
Uma proteo natural que o BGP implementa exigir a sincronizao de uma rota aprendida por iBGP antes de inseri-la na FIB.
Quando um router recebe um prefixo de origem "internal" atravs de iBGP esse no tem como saber se os routers intermedirios tambm conhecem rota para esse prefixo.
Entendendo o syncronization...
R4 estabelece um iBGP diretamente com R1 e anuncia os prefixos recebidos do AS 14X. O problema que AS-X-R1 no tem como saber se R3 conhece rota para os prefixos do AS 14X.
O syncronization um mecanismo de proteo que evita loops de roteamento, vamos entender melhor o que aconteceu no LAB.
319
320
321
322
323
324
325
Caminho dos pacotes: agora complica um pouco, R1 conhece rota para 11X.0.0.0/8 atravs do next-hop X.0.0.4 (R4), e esse next-hop alcanvel via R3 (X.X.1.2).
326
Caminho dos pacotes: Ningum avisou para R3 qualquer coisa sobre um tal AS 11X, o que ele faz com um pacote cujo destino no conhece? (rota padro) O pacote devolvido para R1.
327
Caminho dos pacotes: Mas R1 consulta novamente sua FIB, e tem certeza que o pacote deve mesmo ser entregue para R3...
328
329
Por isso precisamos ter certeza antes de "desabilitar" o syncronization. Veremos 3 maneiras de resolver esse problema, a primeira delas com o syncronization HABILITADO e redistribuindo rotas BGP atravs do IGP (OSPF nesse caso); A segunda maneira desabilitando o syncronization e estabelecendo FULL-MESH entre todos os routers do AS; A terceira (e melhor) utilizando MPLS (sem BGP) nos routers do backbone (nesse LAB apenas R3) e que encaminham rotas aprendidas via BGP atravs de Labels. Veremos essa no captulo 8.1 (BGP atravs da nuvem MPLS); Vamos primeira!
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 330
LAB 2-1-4
LAB 2-1-4
332
LAB 2-1-4
333
LAB 2-1-4
334
LAB 2-1-4
AS-X-R1#sh ip bgp Network *> 99.0.0.0 *> 100.0.0.0 *r>i14X.0.0.0 *r>i15X.0.0.0 *> 200.0.0.0 ...
100 100
Agora podemos ver pelo ">" que a rota para 14X.0.0.0 est na FIB. Outro detalhe o "i" esquerda identifica a rota como "internal".
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 335
LAB 2-1-4
AS-X-R1#sh ip bgp 14X.0.0.0 BGP routing table entry for 14X.0.0.0/8, version 5 Paths: (1 available, best #1, table Default-IP-Routing-Table) Advertised to non peer-group peers: 100.X.1.1 11X X.0.0.4 (metric 129) from X.0.0.4 (X.0.0.4) Origin IGP, metric 0, localpref 100, valid, internal, synchronized, best
Temos agora uma rota SINCRONIZADA, VLIDA, e ANUNCIADA para 100.X.1.1 (AS 100).
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 336
337
LAB 2-1-5
Mas antes vamos desconfigurar a redistribuio de prefixos via OSPF em R1, R2, R4 e R5...
AS-X-R1#conf t AS-X-R1(config)#router ospf 1 AS-X-R1(config-router)#no redistribute bgp X AS-X-R1(config-router)#end AS-X-R1#clear ip ospf process !--- reinicia o processo OSPF Reset ALL OSPF processes? [no]: yes AS-X-R1# !--- vamos repetir o mesmo processo para R2, R4 e R5
338
LAB 2-1-5
R2
AS-X-R2#conf t AS-X-R2(config)#router ospf 1 AS-X-R2(config-router)#no redistribute bgp X AS-X-R2(config-router)#end AS-X-R2#clear ip ospf process !--- reinicia o processo OSPF Reset ALL OSPF processes? [no]: yes AS-X-R2#
339
LAB 2-1-5
R4
AS-X-R4#conf t AS-X-R4(config)#router ospf 1 AS-X-R4(config-router)#no redistribute bgp X AS-X-R4(config-router)#end AS-X-R4#clear ip ospf process !--- reinicia o processo OSPF Reset ALL OSPF processes? [no]: yes AS-X-R4#
340
LAB 2-1-5
R5
AS-X-R5#conf t AS-X-R5(config)#router ospf 1 AS-X-R5(config-router)#no redistribute bgp X AS-X-R5(config-router)#end AS-X-R5#clear ip ospf process !--- reinicia o processo OSPF Reset ALL OSPF processes? [no]: yes AS-X-R5#
341
LAB 2-1-5
Vamos alterar o esquema das sesses removendo todas as sesses iBGP... AS-X-R1(config)#router bgp X
AS-X-R1(config-router)#no syncronization AS-X-R1(config-router)#no neighbor X.0.0.4 AS-X-R1(config-router)#no neighbor X.0.0.5 !--- R1 AS-X-R2(config)#router bgp X AS-X-R2(config-router)#no syncronization AS-X-R2(config-router)#no neighbor X.0.0.4 AS-X-R2(config-router)#no neighbor X.0.0.5 !--- R2 AS-X-R4(config)#router bgp X AS-X-R4(config-router)#no syncronization AS-X-R4(config-router)#no neighbor X.0.0.1 AS-X-R4(config-router)#no neighbor X.0.0.2 !--- R4 AS-X-R5(config)#router bgp X AS-X-R5(config-router)#no syncronization AS-X-R5(config-router)#no neighbor X.0.0.1 AS-X-R5(config-router)#no neighbor X.0.0.2
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 342
LAB 2-1-5
343
LAB 2-1-5
344
LAB 2-1-5
345
LAB 2-1-5
X.0.0.3 remote-as X X.0.0.3 description iBGP R3 X.0.0.3 next-hop-self X.0.0.3 update-source loopback 0 X.0.0.3 soft-reconfiguration inbound
346
LAB 2-1-5
347
LAB 2-1-5
AS-X-R1#sh ip bgp BGP table version is 2, local router ID is X.0.0.1 Status codes: s suppressed, d damped, h history, * valid, > best, i - internal Origin codes: i - IGP, e - EGP, ? - incomplete Network *>iX.0.0.0 *> 100.0.0.0 *> 99.0.0.0 ... Next Hop X.0.0.3 100.X.1.1 100.X.1.1 Metric LocPrf Weight Path 0 100 0i 0 0 100 i 0 0 100 99 i
Ainda no temos a rota anunciada pelo DOWNSTRASM AS 14X na FIB de R1, isso porque R3 no est anunciando! Por que isso acontece?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 348
Desde o tempo do RIP, os protocolos do tipo vetor de distncia sabem que no h sentido em propagar uma rota para a mesma interface de onde aprendeu, e com o BGP parecido.
No iBGP indispensvel* que haja fullmesh de sesses BGP (todos estabelecendo com todos) e sendo assim, um router no anuncia por iBGP uma rota que foi aprendida tambm por iBGP, pois entende que aquele router que me enviou a rota j est enviando diretamente para todos os routers do iBGP.
*h um mecanismo que dispensa essa necessidade v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 349
Em resumo, um router no anuncia para outro router do mesmo AS qualquer coisa que tenha aprendido tambm via iBGP.
350
5.5
Route-Reflector
351
5.5 - Route-Reflector
Em tese, de acordo com as regras do split horizon deveramos estabelecer as seguintes sesses BGP (full mesh):
R1<->R2, R1<->R3, R1<->R4, R1<->R5 R2<->R3, R2<->R4, R1<->R5 R3<->R4, R3<->R5 R4<->R5 Total=10
O route-reflector basicamente dispensa a necessidade de iBGP full-mesh, pois remove a restrio no repasse de rotas iBGP para outro neighbor iBGP. altamente recomendado quando o nmero de routers maior que 5: *evita um nmero muito grande de sesses iBGP
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 352
5.5 - Route-Reflector
Nessa topologia de rede em particular, podemos optar por 3 modelos: 1- R1 como Route-Reflector estabelecendo com R2, R3, R4 e R5 (4 sesses).
353
5.5 - Route-Reflector
354
5.5 - Route-Reflector
355
LAB 2-1-6
5.5 - Route-Reflector
356
5.5 - Route-Reflector
importante deixar claro que diferentemente do que o nome possa sugerir, "Route-reflector" no significa "refletir a rota" e preservar o next-hop original, isso uma caracterstica do prprio iBGP. Route-Reflector significa anunciar via iBGP rotas aprendidas tambm por iBGP.
357
5.6
Peer Groups
358
R3 possui vrios neighbors com configuraes semelhantes, exigindo configuraes repetitivas e sujeitas erros.
O recurso "peer-group" me permite realizar um padro para os neighbors semelhantes diminuindo drasticamente a quantidade de linhas de configurao e "show run".
359
LAB 2-1-7
360
Com peer-group fica muito mais simples adicionar remover configuraes de neighbors para todo o grupo em apenas um comando, por exemplo:
!--- apenas exemplo, no efetue essa configurao router(config-router)#neighbor IBGP prefix-list FILTRO-GERAL-DE-ENTRADA in router(config-router)#neighbor IBGP prefix-list FILTRO-GERAL-DE-SAIDA out !--- apenas exemplo, no efetue essa configurao
Todas as sesses BGP dentro do peer-group passariam pelos mesmos filtros de entrada e de sada
!--- A mesma simplicidade acontece na hora de um "clear" (route refresh) AS-X-R3#clear ip bgp peer-group IBGP soft !--- mas vale lembrar que nada impede que seja efetuado um clear individual AS-X-R3#clear ip bgp X.0.0.1 out
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 361
LAB 2-1-7
Finalizando o LAB: Acessar o Looking Glass e verificar se esse alcana o AS do grupo e todos os seus respectivos DOWNSTREAMS
telnet 99.99.99.1 ...
362
5.7
Local Preference x Weight no iBGP
363
Caractersticas: Proprietrio Cisco (embora implementado por Mikrotik, Quagga, OpenBGPD) Primeiro critrio na escolha de rotas (maior weight) No considerado um atributo e seu valor pode ser de 0 a 65535 Os valores de weight no so transitivos (mesmo dentro do AS) Conhecido em todas as implementaes de BGP Segundo critrio depois do weight (maior local pref) Seu valor padro 100 e pode variar de 0 a 4294967295 Os valores alterados so propagados por todo o iBGP
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 364
Weight:
Local Preference:
LAB 2-1-8
Como vimos nos labs anteriores, posso atribuir um valor de weight 10 no comando "neighbor x.x.x.x weight 10" para todas as rotas recebidas, ou manualmente apenas para determinados prefixos utilizando o route-map. Vamos alterar o weight apenas de um determinado prefixo (99.0.0.0/8) e todos os seus sub-prefixos
AS-X-R1#conf t AS-X-R1(config)#ip prefix-list BLOCOS-AS-99 permit 99.0.0.0/8 le 24 !--- adiciona o classe A e sub-redes 99.0.0.0 na prefix-list BLOCOS-AS-99 AS-X-R1(config)#router bgp X AS-X-R1(config-router)#neighbor 100. X.1.1 route-map AS-100-IN in !--- declara o route-map AS-100-IN para filtrar anuncios de input do AS 100 AS-X-R1(config-router)#exit AS-X-R1(config)#route-map AS-100-IN permit 10 AS-X-R1(config-route-map)#match ip address prefix-list BLOCOS-AS-99 AS-X-R1(config-route-map)#set weight 10 !--- estabelece os prefixos da lista BLOCOS-AS-99 como condio para receber a ao permir !--- e a modificao opcional que atribui um valor 10 de weight AS-X-R1(config-route-map)#exit AS-X-R1(config)#route-map AS-100-IN permit 999 !--- no podemos esquecer de adicionar um route-map vazio no final (numero alto), caso contrrio !--- os prefixos do AS 99 reeceberiam a ao desejada, porm nenhum outro prefixo seria aceito AS-X-R1(config-route-map)#end AS-X-R1#clear ip bgp 100.X.1.1 soft v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 365
LAB 2-1-8
Conferindo a modificao:
AS-X-R1#sh ip bgp ... Network Next Hop *> 99.0.0.0 *> 100.0.0.0 *> 200.0.0.0 ... 100.X.1.1 100.X.1.1 100.X.1.1
Apenas o prefixo 99.0.0.0 recebeu weight 10 Verifiquem a mesma rota em R2, R3,R4 ou R5 o valor de weight ser 0, j que esse no propagado atravs do iBGP
366
J com o local preference diferente, o valor que configurarmos em R1 permanecer o mesmo em todos os routers do AS que receberem esse prefixo atravs de iBGP OBS: Caso algum router aplique route-map que altere o local preference do prefixo 99.0.0.0 ou de todos os prefixos recebidos, esse valor substitudo pelo atual
367
A maneira mais indicada de priorizar rotas dentro do iBGP utilizando o local preference O weight deve ser usado apenas em casos muito especficos onde no haja a inteno de que os outros routers do AS escolham essa mesma rota
368
LAB 2-1-9
LAB: utilizando os recursos vistos no curso vamos configurar os routers do AS de maneira que atenda todos os seguintes requisitos:
Todo o trfego outbound (upload) deve utilizar o link do AS 100, exceto com destino ao AS 200 e seus DOWNSTREAMS Simulando que o link do AS 100 est sobrecarregado, o trfego inbound (download) do DOWNSTREAM AS 15X (apenas) deve chegar pelo AS 200 quando a origem for o AS 99 (internet) Apenas R2 deve alcanar o AS 99 atravs do link com o AS 200
369
5.8
PERGUNTAS?
370
6.0
BGP Communities
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
371
6.0
BGP Communities
6. BGP Communities 6.1 Communities Padro 6.2 Communities Numricas 6.3 Identificando e tratando rotas de peers especficos 6.4 Manipulando trsito (nacional/internacional) com communities 6.5 Engenharia de Trfego III
372
6.1
Communities Padro
373
So um tipo de carimbo inserido nos updates em forma de string. Uma community um atributo opcional, e sendo assim nada obriga que os fabricantes implementem no BGP de suas caixas, ou mesmo que um AS replique para seus peers o mesmo valor de community recebido por um de seus clientes.
374
Os modelos mais novos suportam o "novo formato" usualmente utilizado como ASN:comunity, por exemplo: 28135:110. Porm h algumas communities padronizadas pela RFC 1997 e so padro nos routers Cisco:
NO-EXPORT por padro faz o router receptor exportar o prefixo para neighbors iBGP, mas no para eBGP. til quando fao anncios mais especficos para a operadora A e menos especficos para operadora B. Normalmente, a operadora B precisaria passar pela operadora A para chegar ao prefixo "especfico" mesmo estabelecendo BGP diretamente com meu AS. Enviando o mesmo bloco especfico, com a community NO-EXPORT operadora A, essa passaria a me alcanar diretamente, ao mesmo tempo que no exportaria esses prefixos.
376
NO-ADVERTISE por padro faz o router receptor no exportar esse prefixo para nenhum neighbor, seja ele eBGP ou iBGP.
377
NO-ADVERTISE-SUBCONFED usada para evitar que o prefixo seja exportado para AS's confederados.
378
LOCAL-AS usada para evitar que os prefixos marcados sejam exportados para fora do AS ou confederao, geralmente usado em filtros de entrada.
379
INTERNET na prtica a community padro para anncios externos, o mesmo que no haver nenhuma.
380
381
LAB 2-1-10
LAB 1: Anunciar os prefixos de um dos AS's clientes com a community NO-EXPORT para dentro do AS do grupo:
AS-14X-R1#conf t AS-14X-R1(config)#router bgp 14X AS-14X-R1(config-router)#neighbor X.14X.4.1 send-community both AS-14X-R1(config-router)#neighbor X.14X.4.1 route-map AS-X-OUT out AS-14X-R1(config-router)#exit As-14X-R1(config)#ip bgp-community new-format AS-14X-R1(config)#route-map AS-X-OUT permit 10 AS-14X-R1(config-route-map)#set community no-export
Verifiquem nos routers R1 e R2 se os prefixos marcados como "NOEXPORT" esto sendo anunciados para os AS's 100 e 200.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 382
LAB 2-1-10
Antes de iniciar os LABs desse captulo obrigatrio habilitar suporte ao envio de commuinities em TODOS os neighbors. Em seguida habilitar o formato novo formato xxx:yyy para o tratamento de communities:
router(config)#router bgp X router(config-router)#neighbor A.B.C.D send-community both router(config-router)#exit
383
384
LAB 2-1-12
LAB 3 :
Utilizar communities PADRO e fazer com que o DOWNLOAD dos AS's 14X e 15X cheguem pelo link do AS 200 quando a origem for o AS 99 (internet). Os routers do AS 100 devero alcanar os DOWNSTREAMS do grupo pelo link direto sem ter que dar a volta pelo AS 99.
385
6.2
Communities Numricas
386
muito pequena a quantidade de communities padro, podemos fazer pouqussimas coisas com elas.
Porm h uma grande quantidade communities numricas que podem ser utilizadas.
387
importante saber que essas communities numricas por padro no influenciam em nada no tratamento das rotas.
388
Tambm no h nenhum padro para essas aes (pelo menos nenhum padro RFC).
389
O conhecimento desses padres uma ferramenta chave para resolver rapidamente incidentes do dia a dia.
Vamos ver nos prximos slides uma srie de communities numricas adotadas por algumas operadoras.
6.3
Identificando e Tratando Rotas de Peers Especficos
391
Estamos substituindo todas as communities que haviam nesse prefixo. Muitas vezes, interessante adicionar mais de uma community em "pontos diferentes". Ex: Recebo prefixos dos meus downstreams e quero inserir uma community 123:123 para controle interno, utilizando o meio convencional, eu acabaria substituindo uma eventual community que meu cliente utilizou para interagir com um outro AS externo.
O que fazer?
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 392
OBS: Digitar o comando "set community" tem efeito "cumulativo" exemplo: se digitarmos a seguinte sequncia de comandos:
router#conf t router(config)#route-map teste permit 10 router(config-route-map)#set community 123:123 router(config-route-map)#exit router(config)#route-map teste permit 10 router(config-route-map)#set community 111:222 router(config-route-map)#set community 333:214 router(config-route-map)#end router# router#conf t router(config)#route-map teste permit 10 router(config-route-map)#set community 555:82
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 393
Lembrem que o "additive" no tem a ver com esse fato, mas sim com fazer com que as communities inseridas com "additive" sejam "somadas" s communities que j estavam taggeadas no(s) prefixo(s).
394
395
6.4
Manipulando Trnsito (Nacional/Internacional) com Communities
396
Brasil Telecom
8167:90 Set Local Preference 90 8167:100 Set Local Preference 100 8167:110 Set Local Preference 110 * (default Local Preference 200) 8167:3xy controle de anncios x: ao { 0 = no anuncia, 1,2,3 = insere x prepends) y: peerings { 0=demais peerings, 1=internacionais, 2=Embratel, 3=Intelig, 4=Telemar, 5=Telefnica } (exemplo: 312 = muda para 1 prepend o anncio para a Embratel) * (default anunciar sem prepends para todos os peerings) 8167:555 => no exporta fora da Brasil Telecom. 8167:557 => no anuncia para sites internacionais. 8167:666 => sero injetados no BlackHole da Brasil Telecom. 8167:777 => somente anuncia para clientes da Brasil Telecom.
397
Embratel
4230:120 - Local Preference - marcar a rota como localpreference 120 4230:10000 - Blackhole - bloqueia todo o trfego para a rede/endereco 4230:10002 - Blackhole - filtra o trfego internacional nos provedores que proveem alguma especie de blackhole. 4230:10004 - Blackhole - filtra nos roteadores da Embratel nos EUA o trafego destinado a rede/endereco anunciado
398
Global Crossing
3549:100 - set local preference 100 3549:200 - set local preference 200 3549:275 - set local preference 275 3549:300 - set local preference 300 3549:350 - set local preference 350 3549:600 - Deny inter-continental export of tagged prefix [iBGP]. 3549:666 - Deny inter-as export of tagged prefix (carry on AS 3549 only) [eBGP]
399
Uma srie de communities complexas possibilitam o tratamento do prepend para cada um dos peers da GLBX 3549:8...
ASN Peer No Export 8010 8030 8060 8250 8070 8080 8100 8120 8240 8130 8140 8150 8160 8170 8230 8190 8200 8210 8220 8290 Prepend+1 Prepend+2 Prepend+3 8011 8031 8061 8251 8071 8081 8101 8121 8241 8131 8141 8151 8161 8171 8231 8191 8201 8211 8221 8291 8012 8032 8062 8252 8072 8082 8102 8122 8242 8132 8142 8152 8162 8172 8232 8192 8202 8212 8222 8292 8013 8033 8063 8253 8073 8083 8103 8123 8243 8133 8143 8153 8163 8173 8233 8193 8203 8213 8223 8293 400 209 Qwest 701 MCI 1239 Sprint 1299 TeliaSonera 1668 AOL 2497 JPNIC 2516 KDDI 2914 NTT Verio 3257 Tiscali 3300 InfoNet Europe 3303 Swisscom 3320 T-Systems/DTAG 3356 Level 3 3561 Savvis 4134 ChinaNet 5511 OpenTransit 6461 AboveNet 6453 Teleglobe 7018 AT&T (US) 7738 Telemar
Um cliente com o AS 4111 envia um prefixo com a community "3549:8011 3549:8033 3549:8190".
O prefixo com essa marca ser anunciado da seguinte forma para os peers GLBX:
Qwest (AS 209) receber o prefixo com o AS PATH: "3549 3549 4111" MCI (AS 701) receber o prefixo com o AS PATH: "3549 3549 3549 3549 4111" OpenTransit (AS 5511) no receber o prefixo todos os outros recebero o prefixo normalmente: "3549 4111"
401
Intelig
17379:23004 - Community NO-EXPORT-INTERNACIONAL - No anuncia para peers Internacionais. 17379:23005 - Community NO-EXPORT-NACIONAL - No anuncia para peers Nacionais. No-export ? A rota no ser anunciada para nenhum peer eBGP da Intelig. 17379:60 = set local-preference 60 17379:70 = set local-preference 70 17379:80 = set local-preference 80 17379:90 = set local-preference 90 Todo anuncio feito, sem a aplicao de communities tem por default o valor 100 de local Preference.
402
6.5
403
LAB 2-1-13
200:70 = set local-preference 70 200:80 = set local-preference 80 200:90 = set local-preference 90 200:110 = set local-preference 110
A partir dos AS's clientes, utilizar as communities 200:xxx para alterar o local preference dentro do AS 200, em seguida observar que quando o mesmo forado a mudar o local preference para menos de 100, automaticamente comea a dar a volta pelo AS 99, pois acaba escolhendo rotas do AS 99 (local preference 100 padro).
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com
404
LAB 2-1-13
Soluo:
AS-14X-R1#conf t AS-14X-R1(config)#route-map AS-X-OUT permit 10 AS-14X-R1(config-route-map)#set community none !--- remove o set community do lab anterior AS-14X-R1(config-route-map)#set community 200:90 AS-14X-R1(config-route-map)#end AS-14X-R1#clear ip bgp * soft AS-15X-R1#conf t AS-15X-R1(config)#route-map AS-X-OUT permit 10 AS-15X-R1(config-route-map)#set community none AS-15X-R1(config-route-map)#set community 200:70 !--- remove o set community do lab anterior AS-15X-R1(config-route-map)#end AS-15X-R1#clear ip bgp * soft
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 405
LAB 2-1-14
LAB 2-1-14: De acordo com as polticas do AS 100 abaixo, utilize as communities apropriadas (100:xxxx) para fazer todas as aes: Fazer com que o grupo 9 alcance o AS 14X pelo AS 200; Fazer com que o grupo 1 alcance o AS 15X pelo AS 200; Fazer com que o AS 99 alcance os dois (14X e 15X) pelo AS 200;
ASN Peer Nao Anuncia 1 Grupo1 1010 2 Grupo2 1020 3 Grupo3 1030 4 Grupo4 1040 5 Grupo5 1050 6 Grupo6 1060 7 Grupo7 1070 8 Grupo8 1080 9 Grupo9 1090 99 Internacional 9910 Prepend +1 1011 1021 1031 1041 1051 1061 1071 1081 1091 9911 Prepend +2 Prepend +3 1012 1013 1022 1023 1032 1033 1042 1043 1052 1053 1062 1063 1072 1073 1082 1083 1092 1093 9912 9913
406
LAB 2-1-14
Soluo Lab 2:
!--- apagando o route map do lab anterior AS-14X-R1(config)#no route-map AS-X-OUT AS-14X-R1#conf t AS-14X-R1(config)#route-map AS-X-OUT permit 10 AS-14X-R1(config-route-map)#set community 100:1090 100:9912 AS-14X-R1(config-route-map)#end AS-14X-R1#clear ip bgp * soft !--- apagando o RM do lab anterior AS-15X-R1(config)#no route-map AS-X-OUT AS-15X-R1#conf t AS-15X-R1(config)#route-map AS-X-OUT permit 10 AS-15X-R1(config-route-map)#set community 100:1010 100:9912 AS-15X-R1(config-route-map)#end AS-15X-R1#clear ip bgp * soft
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 407
LAB 2-1-15
LAB 2-1-15:
Grupos de ASN par: Utilizar as communities da tabela para fazer o AS 100 anunciar seu prefixo com prepend 3 para os ASN's mpares e prepend 2 para o AS 99 e anunciar normalmente para todo o resto.
Grupos de ASN mpar: Utilizar as communities da tabela para fazer o AS 100 anunciar seu prefixo com prepend 3 para os ASN's pares e prepend 2 para o AS 99 e anunciar normalmente para todo o resto.
408
LAB 2-1-15
LAB 2-1-15
6.5
PERGUNTAS?
411
7.0
Filtros Avanados para Um AS de Trnsito
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
412
7.0
Filtros Avanados para Um AS de Trnsito
7. Filtros avanados para um AS de trnsito 7.1 Manipulando rotas de mltiplos PTTs 7.2 DOWNSTREAMS com multihoming 7.3 AS de trnsito no PTT parte I 7.4 Configurando um trasporte Lan2lan com xconnect/L2TP 7.5 AS de trnsito no PTT parte II 7.6 PBR Policy Based Routing
413
7.1
Manipulando Rotas com Mltiplos PTTs
414
Em alguns casos clientes de trnsito solicitam o recebimento apenas de rotas do PTT-SP, por exemplo.
415
Uma maneira simples marcar uma community especfica para rotas recebidas:
router-SP#conf t router-SP(config)#route-map PTT-SAOPAULO-IN permit 1 router-SP(config-route-map)#set community 28135:1111 additive ...
416
Se meu AS participa de mais de um PTT posso filtrar rotas de ambos e exportar para o meu cliente:
router-CampinaGrande#conf t router-CampinaGrande(config)#route-map PTT-CAMPINAGRANDE-IN permit 1 router-CampinaGrande(config-route-map)#set community 28135:2222 additive
Dado o cenrio, vamos ver quais seriam os filtros que enviariam para o cliente apenas rotas recebidas do PTT-Campina Grande e PTT-So Paulo:
Router(config)#ip community-list 70 permit 28135:1111 Router(config)#ip community-list 70 permit 28135:2222 ! router(config)#route-map CLIENTE-OUT permit 10 router(config-route-map)#match community 70
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 417
7.2
Downstreams com Multihoming
418
Como AS de trnsito, geralmente temos vrios peers, e caso um dos nossos clientes tambm tenha outros peers, um filtro baseado unicamente em prefixos pode acabar fazendo o meu AS exportar prefixos errados.
Por exemplo, sou o AS 100, meu cliente o AS 20, que por sua vez compra trnsito com o AS 200.
419
Caso o AS 20 anunciasse um bloco especfico para cada AS (100 e 200), essa seria minha FIB:
router# sh ip bgp 20.0.0.0/20 longer-prefixes ... Network Next Hop Metric LocPrf Weight Path *>i20.0.8.0/21 200.100.1.1 0 200 20 i *>i20.0.0.0/21 100.20.1.2 300 10 20 i *>i20.0.0.0/20 100.20.1.2 300 10 20 i * 200.100.1.1 0 200 20 i ...
Percebam que por ser vlido na FIB, o prefixo 20.0.8.0/21 seria exportado para todos os peers externos (menos para o AS 200 de onde "aprendemos") comeando pelo AS 100.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 420
Precisamos adicionar mais uma condio de match alm do prefix list com expresses regulares. Esse o route-map padro que j conhecemos:
router(config)#ip prefix-list BLOCOS-AS-20-ACL33 permit 20.0.0.0/8 le 24 router(config)#route-map ANUNCIAR-AS-XXX permit 10 router(config-route-map)#match ip address prefix-list BLOCOS-AS-20-ACL33 !--- Adicionamos a seguinte acl: router(config)#ip as-path access-list 33 permit ^20(_20)*$ !--- apenas se a rota tiver sido ORIGINADA pelo AS 20 !--- voltamos no mesmo route-map router(config)#route-map ANUNCIAR-AS-XXX permit 10 !--- e adicionamos a condio router(config-route-map)#match as-path 33
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 421
A nomenclatura da prefix-list com final (ACL-33) para facilitar, pois indica o nmero da ACL de as-path correspondente ao cliente.
Nos routers Cisco no h possibilidade de nomear uma ACL de as-path, podemos apenas utilizar apenas um nmero. Para quem usa Quagga possvel atribuir um nome para a ACL de aspath e community lists o que deixa tudo ainda mais fcil:
router-quagga(config)#ip prefix-list BLOCOS-AS-20 permit 20.0.0.0/8 le 24 router-quagga(config)#ip as-path access-list PATH-AS-20 permit ^(20|(20_{0,1}){1,8})$ !--- Essa expresso limita em no mximo 8 ocorrncias ...OU... router-quagga(config)#ip as-path access-list PATH-AS-20 permit ^20(_20)*$ !--- Essa expresso no limita a quantidade de prepends router-quagga(config)#route-map ANUNCIAR-AS-XXX permit 10 router-quagga(config-route-map)#match ip address prefix-list BLOCOS-AS-20 router-quagga(config-route-map)#match as-path PATH-AS-20
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 422
7.3
AS de Trnsito no PTT parte I
423
LAB 2-3-1
Vamos iniciar estabelecendo as sesses BGP de R1 com o PTT-RS1 e PTTLG, em seguida repetir o processo nos DOWNSTREAMS AS-14X-R1 e AS-15X-R1.
AS-X-R1
AS-X-R1#conf t AS-X-R1(config)#router bgp X !--- como os 2 neighbors tero as mesmas configuraes, criaremos um peer-group AS-X-R1(config-router)#neighbor PTT peer-group AS-X-R1(config-router)#neighbor PTT remote-as 555 AS-X-R1(config-router)#neighbor PTT soft-reconfiguration inbound AS-X-R1(config-router)#neighbor PTT route-map PTT-IN in AS-X-R1(config-router)#neighbor PTT route-map PTT-OUT out AS-X-R1(config-router)#neighbor PTT send-community both !--- no precisamos repetir as configuraes e apena declarar o peer-group para os dois neighbors AS-X-R1(config-router)#neighbor 187.16.216.253 peer-group PTT AS-X-R1(config-router)#neighbor 187.16.216.253 description PTT RS 1 !--- ptt-rs1 AS-X-R1(config-router)#neighbor 187.16.216.254 peer-group PTT AS-X-R1(config-router)#neighbor 187.16.216.254 description PTT RS 2 !--- ptt-rs2 AS-X-R1(config-router)#neighbor 187.16.216.252 remote-as 555 AS-X-R1(config-router)#neighbor 187.16.216.252 description LG do PTT !--- o Looking Glass do PTT no far parte do peer-group pois no defver receber nenhum filtro in-out !--- continua no prximo slide...
424
LAB 2-3-1
!--- NOTA preciso levantar o IP de participante na interface !--- conectada ao PTT AS-X-R1(config)#interface fastEthernet 0/0 AS-X-R1(config-if)#ip address 187.16.216. X 255.255.255.0 AS-X-R1(config-if)#no shutdown
!--- continuando... !--- vamos declarar em networks os prefixos mais especficos AS-X-R1(config-router)#network X.0.0.0 mask 255.128.0.0 AS-X-R1(config-router)#network X.128.0.0 mask 255.128.0.0 AS-X-R1(config-router)#exit AS-X-R1(config)#ip route X.0.0.0 255.128.0.0 null 0 AS-X-R1(config)#ip route X.128.0.0 255.128.0.0 null 0 !--- depois garantimos os dois blocos especficos (/9) na FIB AS-X-R1(config)#end AS-X-R1#clear ip bgp peer-group PTT out
425
LAB 2-3-1
(continua...)
426
LAB 2-3-1
427
LAB 2-3-1
428
LAB 2-3-1
Configurando as polticas de route-map para o AS 200 (no esquecer que agora vamos para R2) AS-X-R2
!--- apenas os filtros baseados em ASPATH ainda no foram criados AS-X-R2(config)#ip as-path access-list 10 permit ^$ AS-X-R2(config)#ip as-path access-list 20 permit ^14X(_14X)*$ AS-X-R2(config)#ip as-path access-list 30 permit ^15X(_15X)*$ AS-X-R2(config)#route-map ANUNCIAR-AS-200 permit 10 AS-X-R2(config-route-map)#match ip address prefix-list MEUS-BLOCOS AS-X-R2(config-route-map)#match as-path 10 !--- libera os blocos do AS local X AS-X-R1(config-route-map)#exit AS-X-R1(config)#route-map ANUNCIAR-AS-200 permit 20 AS-X-R1(config-route-map)#match ip address prefix-list BLOCOS-AS-14X AS-X-R1(config-route-map)#match as-path 20 !--- libera os blocos do DOWNSTREAM 1 AS-X-R1(config-route-map)#exit AS-X-R1(config)#route-map ANUNCIAR-AS-200 permit 30 AS-X-R1(config-route-map)#match ip address prefix-list BLOCOS-AS-15X AS-X-R1(config-route-map)#match as-path 30 !--- libera os blocos do DOWNSTREAM 2 AS-X-R1(config-route-map)#end AS-X-R1#clear ip bgp * soft
429
Todos esses route-maps podem deixar a configurao um pouco maior, porm vai permitir que os donos dos AS's sejam facilmente identificados no show run alm de tornar muito fcil de escalar. Imagine um dos clientes de trnsito AS 14X passar a prover trnsito IP para outro AS: ASN 88 CIDR 88.0.0.0/8
LAB 2-3-1
PS: nos LABs anteriores j configuramos as mesmas polticas para o output do AS 100, vamos apenas conferir:
AS-X-R1#show running-config | begin ANUNCIAR-AS-100 route-map ANUNCIAR-AS-100 permit 10 match ip address prefix-list MEUS-BLOCOS match as-path 10 ! route-map ANUNCIAR-AS-100 permit 20 match ip address prefix-list BLOCOS-AS-14 X match as-path 20 ! route-map ANUNCIAR-AS-100 permit 30 match ip address prefix-list BLOCOS-AS-15 X match as-path 30 !
Como podemos ver na saida do comando, as polticas de output com o AS 100 j esto configuradas. O mesmo resultado deve aparecer em R2
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 431
LAB 2-3-1
AS-14X-R1#conf t AS-14X-R1(config)#ip as-path access-list 1 permit ^$ AS-14X-R1(config)#ip route 14X.128.0.0 255.128.0.0 null 0 AS-14X-R1(config)#router bgp 14X AS-14X-R1(config-router)#network 14X.0.0.0 mask 255.128.0.0 AS-14X-R1(config-router)#network 14X.128.0.0 mask 255.128.0.0 AS-14X-R1(config-router)#neighbor PTT peer-group AS-14X-R1(config-router)#neighbor PTT remote-as 555 AS-14X-R1(config-router)#neighbor PTT soft-reconfiguration inbound AS-14X-R1(config-router)#neighbor PTT filter-list 1 out AS-14X-R1(config-router)#neighbor PTT weight 50 AS-14X-R1(config-router)#neighbor PTT send-community both AS-14X-R1(config-router)#neighbor 187.16.216.253 peer-group PTT AS-14X-R1(config-router)#neighbor 187.16.216.253 description PTT RS 1 AS-14X-R1(config-router)#neighbor 187.16.216.254 peer-group PTT AS-14X-R1(config-router)#neighbor 187.16.216.254 description PTT RS 2 AS-14X-R1(config-router)#neighbor 187.16.216.252 remote-as 555 AS-14X-R1(config-router)#neighbor 187.16.216.252 description LG do PTT AS-14X-R1(config-router)#end
432
LAB 2-3-1
AS-15X-R1#conf t AS-15X-R1(config)#ip as-path access-list 1 permit ^$ AS-15X-R1(config)#ip route 15X.128.0.0 255.128.0.0 null 0 AS-15X-R1(config)#router bgp 15X AS-15X-R1(config-router)#network 15X.0.0.0 mask 255.128.0.0 AS-15X-R1(config-router)#network 15X.128.0.0 mask 255.128.0.0 AS-15X-R1(config-router)#neighbor PTT peer-group AS-15X-R1(config-router)#neighbor PTT remote-as 555 AS-15X-R1(config-router)#neighbor PTT soft-reconfiguration inbound AS-15X-R1(config-router)#neighbor PTT filter-list 1 out AS-15X-R1(config-router)#neighbor PTT weight 50 AS-15X-R1(config-router)#neighbor PTT send-community both AS-15X-R1(config-router)#neighbor 187.16.216.253 peer-group PTT AS-15X-R1(config-router)#neighbor 187.16.216.253 description PTT RS 1 AS-15X-R1(config-router)#neighbor 187.16.216.254 peer-group PTT AS-15X-R1(config-router)#neighbor 187.16.216.254 description PTT RS 2 AS-15X-R1(config-router)#neighbor 187.16.216.252 remote-as 555 AS-15X-R1(config-router)#neighbor 187.16.216.252 description LG do PTT AS-15X-R1(config-router)#end
433
O que faltou?
434
7.4
Configurando um Transporte Lan2Lan com xconnect/L2TP
435
LAB 2-4-1
AS-X-R4(config)#l2tp-class transporte-l2 AS-X-R4(config-l2tp-class)#cookie size 4 AS-X-R4(config-l2tp-class)#exit !--- Declaramos uma class e demos o nome de transporte-l2 AS-X-R4(config)#pseudowire-class transporte-l2 AS-X-R4(config-pw-class)#encapsulation l2tpv3 AS-X-R4 (config-pw-class)#protocol none AS-X-R4 (config-pw-class)#ip local interface Loopback0 !--- Na configurao da class escolhemos o tipo de tunelamento que em nosso caso ser l2tp verso 3. AS-X-R4 (config-pw-class)#exit AS-X-R4(config)#interface f0/0 AS-X-R4(config)#no shut AS-X-R4(config-if)#xconnect X.0.0.1 14X encapsulation l2tpv3 manual pw-class transporte-l2 AS-X-R4(config-if-xconn)#l2tp id 1 1 AS-X-R4(config-if-xconn)#l2tp cookie local 4 1 AS-X-R4(config-if-xconn)# l2tp cookie remote 4 1
436
LAB 2-4-1
AS-X-R1(config)#l2tp-class transporte-l2 AS-X-R1(config-l2tp-class)#cookie size 4 AS-X-R1(config-l2tp-class)#exit !--- Declaramos uma class e demos o nome de transporte-l2 AS-X-R1(config)#pseudowire-class transporte-l2 AS-X-R1(config-pw-class)#encapsulation l2tpv3 AS-X-R1 (config-pw-class)#protocol none AS-X-R1 (config-pw-class)#ip local interface Loopback0 !--- Na configurao da class escolhemos o tipo de tunelamento que em nosso caso ser l2tp verso 3. AS-X-R1 (config-pw-class)#exit AS-X-R1(config)#interface f2/0 AS-X-R1(config)#no shut AS-X-R1(config-if)#xconnect X.0.0.4 14X encapsulation l2tpv3 manual pw-class transporte-l2 AS-X-R1(config-if-xconn)#l2tp id 1 1 AS-X-R1(config-if-xconn)#l2tp cookie local 4 1 AS-X-R1(config-if-xconn)# l2tp cookie remote 4 1
437
LAB 2-4-1
AS-X-R1#sh l2tun %No active L2F tunnels L2TP Tunnel and Session Information Total tunnels 0 sessions 1 LocID RemID TunID Username, Intf/ State Last Chg Uniq ID Vcid, Circuit 1 1 0 14X, Fa2/0 est 00:00:24 1
AS-X-R4#sh l2tun %No active L2F tunnels L2TP Tunnel and Session Information Total tunnels 0 sessions 1 LocID RemID TunID Username, Intf/ State Last Chg Uniq ID Vcid, Circuit 1 1 0 14X, Fa0/0 est 00:00:43 1
438
Notem que ao entrar no AS do GRUPO, os pacotes so encaminhados para o PTT, e no chegam ao DOWNSTREAM pelo link de trnsito.
Mesmo com um local preference maior, os prefixos que os AS's 14X e AS 15X anunciam para PTT so mais especficos do que os que anunciam para o trnsito, isso obriga o router R1 a mandar os pacotes pelo PTT (download dos DOWNSTREAMS).
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 439
O cliente pode tirar proveito disso e causar prejuzos desviando trnsito IP, obrigando AS local a trocar o trnsito IP por nada.
440
LAB 2-4-2
Para resolver isso, precisamos utilizar uma expresso regular proibindo R1 de receber qualquer anncio de participantes que tambm sejam clientes de trnsito do AS:
AS-X-R1#conf t AS-X-R1(config)#ip as-path access-list 55 seq 1 deny _14X_ AS-X-R1(config)#ip as-path access-list 55 seq 2 deny _15X_ AS-X-R1(config)#ip as-path access-list 55 seq 99 permit .* AS-X-R1(config)#route-map PTT-IN deny 5 AS-X-R1(config-route-map)#match as-path 55
Inserimos o AS de cada cliente de trnsito nessa lista. Vale lembrar que em certos casos, os filtros precisariam ser mais especficos, fazendo um route-map de deny para cada cliente, combinando uma prefix-list + as-path access-list
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 441
442
8.0
Multiprotocol Label Switching (MPLS)
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
443
8.0
Multiprotocol Label Switching (MPLS)
8. Mecanismos de Path Control 8.1 BGP atravs da nuvem MPLS 8.2 AtoM - Any Transport Over MPLS 8.3 Implementando servio VPN-L3 (VPN-Multiponto) Disponvel na verso 2.2
444
9.0
Mecanismos de Path Control
O trabalho Curso de BGP Design com Roteadores Cisco de Rinaldo Vaz foi licenciado com uma Licena Creative Commons - Atribuio 3.0 No Adaptada. Podem estar disponveis autorizaes adicionais ao mbito desta licena em rinaldopvaz@gmail.com.
445
9.0
Mecanismos de Path Control
8. Mecanismos de Path Control 8.1 PBR Policy Based Routing 8.2 IP SLA Tool
Agradecimentos especiais para Roberto Mendona, autor dos dois prximos sub-captulos
446
448
1.Quando um pacote chega uma interface de um router, este examina o endereo de destino do pacote contra a sua tabela de roteamento. 2. Se a rede destino for conhecida pelo router (ou seja, constar na tabela), o pacote encaminhado para a interface de sada indicada. 3. Se a rede destino no for conhecida e existir uma rota default, o pacote encaminhado para a interface de sada apontada por ela. 4. Se nenhum dos dois casos acima ocorrer, o router descarta o pacote.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 449
Policy-based routing quebra o processo default de roteamento, permitindo que pacotes sejam roteados baseados em polticas prdefinidas e no apenas no endereo de destino.
Para isso, ROUTE-MAPs so usados, especificando condies que devem ser examinadas e para onde os pacotes devem ser encaminhados caso estas condies sejam verificadas.
450
451
Para implementar o cenrio ilustrado anteriormente, apenas trs passos so necessrios: 1. Defina um route-map e a poltica que identificar o pacote (MATCH); 2. Defina para onde o pacote deve ir, caso um MATCH ocorra (SET);
3. Aplique o route-map na interface para anlise dos pacotes medida que entram (IN).
452
Ao criar um route-map para ser usado com PBR, existem algumas opes de MATCH escolher, por exemplo:
Match ip address (utiliza listas de acesso para checagem) Match lenght (utiliza um intervalo mnimo e mximo do tamanho do pacote, em bytes)
453
Set ip next-hop (especifica o IP de next-hop para o pacote deve ser uma subrede diretamente conectada); Set ip default next-hop (o mesmo acima, porm, o roteador tentar antes o roteamento convencional, mas no usa rota default); Set interface (especifica a interface de sada do pacote); Set default interface (mesmo acima, porm, o roteador tentar antes o roteamento convencional, mas no usa rota default).
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 454
Exemplo padro:
455
PBR para que pacotes originados pelo PC2 sigam via R3:
456
Configuraes:
R1(config)#interface F0/0 R1(config-if)#ip policy route-map PC2-via-R3 R1(config-if)#exit R1(config)#route-map PC2-via-R3 permit 10 R1(config-route-map)#match ip address 101 R1(config-route-map)#set ip next-hop 10.1.14.4 R1(config-route-map)#exit R1(config-if)#access-list 101 permit ip host 10.1.1.2 10.1.3.0 0.0.0.255 v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 457
9.1
PERGUNTAS?
458
IP SLA Tool
O oferecimento de servios gerenciados vm se consolidando como uma tendncia j h algum tempo, e alguns fabricantes disponibilizam algumas ferramentas que podem nos ajudar a melhorar uma rede e nos alertar de eventuais problemas, assim que estes aparecerem. Em um mundo em que solues de IP Telephony e vdeoconferncia IP vm se tornando parte do dia-a-dia das empresas, a ferramenta IOS IP SLA pode ser uma poderosa aliada.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 459
O IP SLA um recurso presente em algumas verses do IOS da Cisco, que permite o gerenciamento proativo das condies da rede monitorada. Basicamente, gera-se um trfego especfico de um dispositivo (transmitter) com destino a outro (responder), que responde a este trfego e medies so realizadas no decorrer do processo. Esta ferramenta torna muito mais simples tarefas como verificao do correto funcionamento das polticas de QoS, e tambm permite certificarmos-nos que estamos cumprindo os acordos de uptime assinados com o cliente, por exemplo.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 460
Para habilitar o IP SLA, necessrio configurar ao menos 2 elementos: O transmitter e o responder. A configurao do responder bastante simples (uma linha de comando, apenas). Ao iniciar a operao, o transmitter envia mensagens de controle ao responder. Estas mensagens de controle informam ao responder qual porta lgica (TCP ou UDP) deve ser usada para as requisies do transmitter. A ativao do servio responder pode nem ser necessria, se o elemento que ir responder s solicitaes do transmitter j estiver aguardando dados nas portas a serem testadas (ex. o servio HTTP j est ativado no router que agir como responder, e este o servio que queremos medir).
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 461
Este recurso funciona muito bem em diversas topologias, incluindo topologias hub & spoke (estrela). Neste caso, normalmente, voc teria o HUB como responder, e os spokes como transmitters. Uma vez que o servio SLA esteja devidamente configurado no transmissor, sua operao precisa ser agendada. As estatsticas apenas sero coletadas quando a configurao estiver operacional. As atividades de gerao de trfego e coleta podem ser agendadas para iniciar de imediato, ou em uma data / hora pr-determinadas. Podem ainda ser iniciadas sob certas condies especficas.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 462
Exemplo:
Aqui temos OSPF single-area ativado nesta rede, para garantir conectividade fim-a-fim. Vamos ativar o IP SLA neste cenrio para monitorar um determinado servio que roda na porta UDP 1234, de R1 para a interface Loopback0 de R3. Vamos comear ativando o IP SLA no responder (R3) :
463
Verificando:
R3#show ip sla responder IP SLAs Responder is: Enabled Number of Control Message received: 0 Number os errors:0 Recent Sources: Recent error sources:
464
Vamos agora configurar o R1 como transmitter, gerando o trfego que determinamos para a loopback de R3 (responder) : R1(config)#ip sla {monitor} 1
R1(config-ip-sla)#{type} udp-echo 150.1.3.3 1234 R1(config-ip-sla-udp)#frequency 30
Aqui, criamos uma operao com o ID 1 que gerar um pacote com destino porta UDP 1234 ao IP 150.1.3.3 (L0 do responder), cada 30 segundos.
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 465
466
468
Agora, vamos associar uma ao ao resultado do IP SLA... Por exemplo, uma rota esttica que apenas existe se as condies do IP SLA forem atendidas...!!
R1#conf t R1(config)#track 1 rtr 1 state R1(config-track)#exit R1(config)#ip route 123.123.123.0 255.255.255.0 192.168.12.2 track 1 R1#sh ip route static 123.0.0.0/24 is subnetted, 1 subnets S 123.123.123.0 [1/0] via 192.168.12.2 R1(config)#ip sla {monitor} 1 R1(config-ip-sla)#{type} udp-echo 123.123.123.3 1234 R1(config-ip-sla-udp)#frequency 30
469
Como nosso SLA falhou, a rota recm-criada deve sumir da tabela, j que estava associada condio do nosso SLA (track 1 rtr 1):
R3(config)#int l0 R3(config-if)#shutdown R3(config-if)# *Jul 28 00:14:11.219: %LINK-5-CHANGED: Interface Loopback0,changed state to administratively down *Jul 28 00:14:12.219: %LINEPROTO-5-UPDOWN: Line protocol on Interface Loopback0, changed state to down R1# *Jul 28 00:15:41.671: %TRACKING-5-STATE: 1 rtr 1 state Up->Down R1#sh ip sla statistics 1 Round Trip Time (RTT) for Index 1 Latest RTT: NoConnection/Busy/Timeout Latest operation start time: *00:15:23.031 UTC Mon Jul 28 2008 Latest operation return code: No connection Number of successes: 9 Number of failures: 1 Operation time to live: Forever R1#sh ip route 123.123.123.0 % Network not in table v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 470
possvel associar um PBR a uma condio testada pelo IP SLA Tool, tambm. Eis um exemplo:
set ip next-hop 10.1.14.4 !--- PBR normal, como vimos anteriormente. set ip next-hop verify-availability 10.1.14.4 1 track 1 !--- Aqui, usamos o parmetro verify availability e associamos o teste para o objeto 1.
Enquanto o estado do objeto estiver UP, o PBR funcionar conforme configurado. Se o objeto em teste mudar de estado (down), a clusula SET no ser executada.
471
9.2
PERGUNTAS?
472
MUITO OBRIGADO!!
473
Posfcio
100% desse material foi elaborado utilizando software livre, e livre para ser copiado e distribudo desde que gratuitamente. Est a verso 2.1 Para reportar erros ou solicitar a verso mais recente entre em contado por email: rinaldopvaz@gmail.com Autor: Rinaldo Vaz
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 474
Errata
Mudana no layout
Cores, fontes e grficos melhorados
Correes
Captulo 4
Mais contedo
Adicionados mais slides com figuras e exemplos de configurao de prepend de sada Adicionado um novo slide com exemplo de prepend de entrada
(...)
v2.1 | Autor: Rinaldo Vaz | rinaldopvaz@gmail.com 475
Errata
(...)
Subcaptulos:
Outras mudanas
Nmero total de slides aumentou de 434 para 485 Pequenas correes nas confguraes Foram adicinadas mais figuras Novos slides com configuraes que deveriam ser desfeitas antes de iniciar o prximo laboratrio
476
Errata
Mudana no layout
Cores, fontes e grficos melhorados
Novos sub-captulos
Engenharia de trfego, Alta Disponibilidade, Transporte L2, e outros
477
Errata
478
Errata
479
480
4.6 expresso regular de parcial, modificada para apenas uma linha, e adicionado um terceiro exemplo para parcial de 3 AS's no path:
nova expresso: ^([0-9]+|[0-9]+ [0-9]+)$
481
482
Correo: "...neighbor X.0.0.5 remote-as X" "...neighbor X.0.0.5 description iBGP Router 5
483
5.1 configurao eBGP com AS 200 (segunda rodada), corrigido endereo incorreto de neighbor:
erro: "...neighbor 200.X.1.1 remote-as 100" ...neighbor 200.X.1.1 soft-reconfiguration inbound" "...neighbor 200.X.1.1 route-map ANUNCIAR-AS-200 out"
correo: "...neighbor 200.X.2.1 remote-as 200" "...neighbor 200.X.2.1 soft-reconfiguration inbound" "...neighbor 200.X.2.1 route-map ANUNCIAR-AS-200 out"
5.1 Configurao iBGP entre R2 > R3, corrigido nmero da loopback faltando
erro: "...neighbor X.0.0.3 update-source loopback " correo: "...neighbor X.0.0.3 update-source loopback 0"
484
7.3 Corrigida expresso regular de permitir saida apenas de prefixos originados diretamente do downstream:
erro: _20$ forma correta: (20_|20$)
485