Professional Documents
Culture Documents
Curso 10/11
Horas
1 INTRODUCCIN
2 CONECTIVIDAD
3 MQUINAS MIMD
4 MQUINAS SIMD
5 SUPERESCALARES
arqAva
2 CONECTIVIDAD
1 Introduccin
Temario
Conectividad-2
2 Conceptos
1 Clasificacin de las redes
2 Caracterizacin por Grafos
3 Perfiles de comunicacin
3 Redes de medio de transmisin compartido (Buses)
4 Redes directas (estticas )
1 Encaminamiento
2 Array lineal, anillo, ..., hipercubo
5 Redes indirectas (dinmicas)
1 Crossbar, redes multietapa ()
arqAva
Introduccin
Conectividad-3
QUEREMOS MS VELOCIDAD:
A menor Grano, mayor Grado
TAREA
P1
P2
P4
P3
P5
arqAva
Introduccin
Conectividad-4
P2
Pi
Pn
RED
M1
Mj
P2
Pi
RED
Mk
Pn
arqAva
Introduccin
Conectividad-5
http://www.euroben.nl/reports/overview09.pdf
Coste
*
50
Gigabit Ethernet
0,1
10..40
arqAva
Introduccin
Conectividad-6
Sistema
Placa
ChipMulticore
LAN
WAN
arqAva
Introduccin
Conectividad-7
Sistema
27 nodos
www.sicortex.com SC5832
Placa
Chip
6
ncleos
36 placas
arqAva
Introduccin
Conectividad-8
27/Mayo/2009: Quiebra
arqAva
Introduccin
LAN/WAN Internet
Conectividad-9
Multiprocesadores
Millones de nodos
Cientos .. Miles
# Nodos dinmico
Fijo
Enlaces largos
Cortos
Red irregular
Regular
Latencia alta
Baja
arqAva
Conceptos
Conectividad-10
PERFILES DE COMUNICACIN
arqAva
Conectividad-11
Ethernet
Redes inalmbricas
P1
Buses (Backplane)
P2
M1
Token
Ring
Pi
Mj
Pn
Mk
Sncronos vs asncronos
Multiplexados
Arbitraje del bus
arqAva
Conectividad-12
P2
Acoplamiento dbil
Amplio uso en multicomputadores
P4
P3
arqAva
Conectividad-13
P2
Pi
Pn
RED
M1
Mj
Mk
Red Telefnica
Acoplamiento fuerte
Amplio uso en multiprocesadores
Encamina la propia red
arqAva
Totalmente conectadas:
Cada elemento tiene conexin
directa con los dems
Conectividad-14
Parcialmente conectadas:
conexas !
No escalable
arqAva
Conectividad-15
A1
B
D2
E3
Compromiso en el Grado
Menor conectividad => Ms latencia
Menor coste
arqAva
Conectividad-16
1, 2, 3, ......?
5? => 2, 5, 4, 8, 7, 6
4 => 2, 5, 4, 3, 6 ms corto
arqAva
Perfiles de Comunicacin
Conectividad-17
Ventanilla nica
N => N
Varias Ventanillas
N => 1
Reduccin
Bus Comn
1 => N
T.V. News
Mquinas CRCW
arqAva
P1
P2
Pi
Pn
M1
Mj
Mk
Conectividad-18
Pentium 4 a 3,8GHz
Bus de 64 bits y 800MHz
Un nico Pi satura el Bus?
$
Cachs !
98% Hit
Pn
Algunos problemas !
colisiones
P2
P1
Fallo
costoso
Soluciones ?
arqAva
Redes Medio Compartido (Bus II) Conectividad-19
Bus pipelining
Write
Read
Pedir bus
Arbitrar
Dar bus
Usar bus
1
2
3
4
5
AR ARB AG RQ ACK
1
2
3
4
AR ARB AG RQ
5
6
P RPLY
1
2
3
4
5
6
7
8 9 10 11
AR ARB AG RQ P RPL
AR ARB AG Stall Stall RQ ACK
AR ARB Stall Stall AG Stall RQ ACK
AR Stall Stall ARB Stall AG Stall RQ
AR Stall ARB Stall AG
AR Stall ARB
12 13
14
15
P RPL
RQ P RPL
AG Stall Stall RQ
16
17
P RPL
arqAva
Redes Medio Compartido (Bus III) Conectividad-20
Split transaction: Pipelining + Dividir la transaccin en dos
1
read
resp
write
ack
write
ack
read
resp
read
resp
read
resp
1
1
2
2
3
3
4
4
5
5
6
6
1
2
RqA
10
11
12 13
14
15
16
17
AR ARB AG RQ
AR ARB AG RPL
AR ARB AG RQ
Mejora ?
AR ARB AG ACK
AR ARB AG RQ
AR ARB AG ACK
AR ARB AG RQ
AR ARB AG RPL
AR ARB Stall Stall Stall Stall AG RQ
AR ARB AG RPL
AR ARB Stall Stall Stall Stall AG RQ
AR ARB AG RPL
3
7
8 9
RpA
RqB
Transacciones
variables: 1..6 ciclos
RqA
RpA
RqB
10
11
12 13
14
RpB
RqC
RpC
PCI Express
USB
RpB
RqC
RpC
arqAva
Redes Medio Compartido (Bus IV) Conectividad-21
Modo rfaga (Burst): Transacciones largas (lnea de cach)
1
2
3
4
5
6
7
8 9 10 11 12 13 14
Arb
Arb
Arb
Arb
Cmd Dir Dato Cmd Dir Dato Cmd Dir Dato Cmd Dir Dato
Normal
Arb
Cmd Dir Dato Dato Dato Dato
Inconveniente ?
Rfaga
arbitraje
mensaje A
mensaje B
1
2
3
4
5
6
7
8 9 10 11 12 13 14 15
GrA
GrB
ReA
Cmd Dir Dato Dato Dato Dato
Eti Dato Dato Dato Dato
Cmd Dir Dato
Mensaje ms
prioritario
Mensaje
continuado
arqAva
Redes Medio Compartido (Bus V) Conectividad-22
Buses jerrquicos
Buses mltiples
Concluyendo
Cachs (L1, L2 y L3)
Pipelining
Split Transaction
Modo rfaga
Buses Jerrquicos
Buses Mltiples
Muy costoso + 32P
Difusin
Serializacin
Frecuencia
Secuencial
arqAva
Redes directas
Conectividad-23
Generalidades
Encaminamiento
Menor dimetro aumentando el grado
Array lineal
Anillo simple y de grado n
Conectividad total
Compromiso grado vs dimetro y muchos nodos
rbol, Fat Tree y Estrella
Mallas y Toroides
Hipercubo con y sin ciclo
Tabla de parmetros
arqAva
Conectividad-24
MultiC ms integrado
P
IC
De otros
nodos
A otros
nodos
IC
Switch
Pn
IC
L2
Transputer
Buffers
Arbitraje
Encamina.
arqAva
Conectividad-25
arqAva
.. 10GBseg
15nseg Lat
Conectividad-26
arqAva
500MHz
2GBseg
1seg Lat
www.sicortex.com
Conectividad-27
arqAva
Conectividad-28
arqAva
Conectividad-29
19,2..25,6 GBseg
www.intel.com/technology/quickpath/introduction.pdf
arqAva
Conectividad-30
arqAva
..51,2 GBseg
arqAva
Encaminamiento (Modos)
Conectividad-32
Redes directas
Conmutacin
de circuitos
Redes indirectas
arqAva
8x8 = 64 nodos
Dimetro = 7+7=14
Numerar nodo 0..63
Encaminamiento (Algoritmo)
0,0
0,1
0,2
0,3
Conectividad-33
0,4
0,5
0,6
fila col
0..7 0..7
1,0
2,0
E datos L 5,1
3,0
Algo: MovCol+MovFila
5,0
6,0
7,0
A
C
4,0
0,7
arqAva
Encaminamiento (wormhole)
Conectividad-34
210
Buffer de
paquete
Destino
210
Los mensajes se
dividen en paquetes
(64..1024bits) y se
envan paquete a
paquete
210
Buffer de
flit
210
Destino
10
Los paquetes se
dividen en flits
(2..32 bits) y se
envan flit a flit
Similar a
IP/ATM
MPLS?
arqAva
Encaminamiento (ejemplo)
Conectividad-35
Almacena y
Reenvo
Latencia
Wormhole
Distancia
+ 7 veces
mejor
arqAva
Encaminamiento (Interbloqueo)
Conectividad-36
C
D
Interbloqueo !
C
B
A
B
C
A
arqAva
Una forma de
evitar el
interbloqueo
arqAva
Conectividad-38
ARRAY LINEAL
0
2
1
2
3
5
arqAva
Conectividad-39
N=8 n=3
Salto 2
1
Salto 3
1
1
2
2
2
3
d = 3, d = 1,71
Salto 4
1
1
2
2
3
1
2
d = 3, d = 1,71
1
2
2
1
d = 2, d = 1,57
arqAva
Conectividad-40
N = 16 n = 3
Salto 2
d = 6, d = 3,2
Salto 3
d = 5, d = 2,67
Salto 5 iguala y 7 y 8 empeoran
Salto 4
d = 4, d = 2,27
arqAva
Conectividad-41
N = 16 n = 4
Salto 3
d = 4, d = 2,13
Salto 4
d = 3, d = 2
Cmo podra ser N=32 y n=5?
Salto 5
d = 4, d = 2,13
arqAva
Conectividad-42
N = 32 n = 5
Escalable ?
d = 4, d = ???
arqAva
1
2
7
6
Conectividad-43
arqAva
Conectividad-44
70
Dimetro
60
50
Array
Anillo
Anillo "n"
Total
40
30
20
10
0
0
20
40
# Nodos
60
arqAva
Conectividad-45
RBOL BINARIO
EQUILIBRADO
Fat Tree
RBOL BINARIO
K=0
2
4
2
K=1
K=2
K=3
ESTRELLA
arqAva
Conectividad-46
MALLA 2D
K=3
K=1
K=2
O(1,1,1)
D(3,3,3)
O(2,2,1)
D(3,3,2)
Colisin!
Interbloqueos ?
Cuello de botella?
arqAva
Conectividad-47
18
18
18
18
18
18
arqAva
K=2
Conectividad-48
arqAva
Conectividad-49
Dim2
Dimetro = log2 N
Grado = log2 N
Fcil encaminar
Dim4
arqAva
Conectividad-50
1.
2.
4321
0110
1
4
0111
1111
0010
0011
1010
1000
0100
Realizar ORX ?
0101
Nodo actual
0001
0111
0110
0010
1010
1010
1010
1010
arqAva
Conectividad-51
K=3
2
3
4
4
Dimetro ?
3
3
4
4
4
5
arqAva
Conectividad-52
arqAva
Conectividad-53
14
16
3
3
5832
ncleos
T3D 8*8*6
T3D 10*10*9
11
14
6
6
arqAva
Topologa
N de nodos
Grado
Dimetro
Array lineal
N-1
Anillo
N/2
Anillo de grado n
n=log2N
n-1
rbol binario
2K-1
2*(K-1)
2K-1
2K
2*(K-1)
Estrella
N-1
Malla
nK
2*K
K*(n-1)
Toroide
nK
2*K
K* n/2
Hipercubo
2K
K*2K
2*K - 1 + K/2
arqAva
Perspectiva histrica
Introduccin-55
MIMD
HWANG (1993) IDENTIFICA TRES GENERACIONES:
1983-1987
1988-1992
1993-1997
2010?
Conexin interna?
Simil con intracluster
arqAva
Perfil N*M
P2
O (N2)
P3
Crossbar
Pn
M1
M2
M3
Mm
colisin
Muchas patas
8x8 onChip
rea 5 ncleos
Wat 2 ncleos
difusin
arqAva
crossbar
8*8
O (64)
Perfil 8*8
Latencia 1
Conectividad-57
directo
cruce
difusin
colisin
Red de
interconexin
Conjunto de
crossbar 2*2
etapa 1
etapa 2
etapa m
arqAva
Conectividad-58
000
000
001
001
010
011
100
101
001
010
001
001
010
010
110
111
Encaminamiento?
Sea de 001 a 010
010
011
100
101
110
111
Latencia
y O( ) ?
arqAva
Conectividad-59
000
000
001
001
010
011
010
011
100
100
101
101
110
111
110
111
Permite difusin !
arqAva
Latencia
Complejidad
Conmuta.
Perfil de
Comunicacin
Bus
Multietapa Crossbar
Cte
Log2N*cte
cte
2 N log2N
N2
11
NN (*)
NN
BUS
CROSSBAR
MULTIETAPA
arqAva
Configurable
Red Clos
Toro 3D
Crossbar
Crossbar
Crossbar
Crossbar multidim.
Configurable
Toro 3D y rbol
Configurable
Crossbar
Crossbar multidim.
Fat tree
Bull NovaScale
C-DAC PARAM Padma
Cray Inc. XT5
Fujitsu/Siemens M9000
Fujitsu/Siemens PRIMEQUEST
Hitachi BladeSymphony
Hitachi SR 16000
IBM eServer p575
IBM BlueGene/L&P
IBM System Cluster 1350
NEC Express5800/1000
NEC SX-9
SGI Altix 4000
intercluster
arqAva
Redes en Top500
Conectividad-62
48,4%
6,0%
41,4%
FIN