Professional Documents
Culture Documents
Conceptos fundamentales
Departamento de Arquitectura de Computadores y Automtica
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
1. Introduccin. La asignatura.
Ofimtica (MS-Office, Contaplus, D-Base) Comunicaciones (Netscape, Explorer, Mail) Di (AutoCAD, Diseo (A t CAD ...), ) Multimedia, M lti di J Juegos, etc. t FOR, WHILE, REPEAT, PROCEDURE, ... PASCAL, FORTRAN, C, COBOL, BASIC, ... MODULA C++, MODULA, C++ JAVA, JAVA ... Gestin de memoria Gestin de procesos Gestin de ficheros
Registros R0
Aplicacin
Lenguaje de alto nivel Sistema Operativo / Compilador Arquitectura del repertorio de instrucciones Organizacin Hardware del sistema Circuito Digital
R7
CPU
Fsico
Casa, auto-aprendizaje en ratos libres, Academias de informtica/ofimtica Fundamentos de Programacin Programacin, EDI Sistemas Operativos (NO compiladores)
Lenguaje de alto nivel Sistema Operativo / Compilador Arquitectura del repertorio de instrucciones Organizacin Hardware del sistema Circuito Digital Fsico
ESTRUCTURA DE COMPUTADORES,
Arquitectura de Computadores Circuitos Digitales, Tecnologa, Tecnologa F F. Computadores Instrumentacin, Diseo y Test de Circuitos Integrados
Arquitectura de computadores
Los atributos de un computador tal y como los ve un programador en lenguaje ensamblador. ensamblador La estructura conceptual y el modelo funcional (modelo de programacin). Amdahl, Blaaw, Brooks 1964 El concepto ha cambiado en el tiempo.
Hasta la mitad de los 80. El nfasis era el diseo de juego de instrucciones orientado a los LAN. Desde entonces el nfasis es el diseo de CPU, Jerarqua de memoria, sistema de I/O. Aspectos clave coste-rendimiento-tecnologa-potencia
Tres aspectos
Arquitectura del juego de instrucciones Organizacin O i i ( diferentes dif t organizaciones i i P6, P6 N Netbrust, tb t AMD) Implementacin ( PentiumIII, Celeron, Pentium4, Pentium Xeon )
Arquitecturas Load/Store
(CDC 6600, ( , Cray y 1 1963-76) )
RISC
(Mips,Sparc,HP-PA,IBM RS6000, . . .1987)
Metodologa de Diseo
Complejidad de la Implementacin
Carga de Trabajo
7
La asignatura
Entrada/salida y almacenamiento Discos, WORM, Cintas RAID Organizacin de memoria Protocolos de Bus Coherencia, Ancho de banda, Latencia Segmentacin y ILP Segmentacin, Riesgos, Superescalar, Ejecucin fuera de orden, Prediccin Especulacin Prediccin, Especulacin,
8
Jerarqua de Memoria
L2 Cache
L1 Cache VLSI
Arquitectura del Procesador
DSP
La asignatura
Que estudia la asignatura
P M P M P M P M
Memoria M i Compartida, C id Paso de Mensajes, Paralelismo de Datos Red Topologa, Routing Routing, Ancho de Banda, Latencia,
Red de interconexin
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
10
2. Perspectiva histrica
Generaciones de computadores
Generacin Primera Segunda Tercera Cuarta Quinta Fechas 1946-1957 1958-1964 1965-1971 1972-1988 1988Caractersticas Tecnolg. Tecnolg Vlvula de vaco Transistores Circuitos integrados Microprocesador Sistema basados en micro Potencia de clculo 0,04 MIPS 0,2 MIPS 1 MIPS 10 MIPS > 100 MIPS
1 Generacin (1946(1946-1957)
ENIAC (1946)
Primer computador p de propsito p p especial p Peso: 30 toneladas; Superficie: 1.400 m2; Consumo: 140 KW Potencia clculo: 5000 sumas/seg Difcil de programar. Mediante conmutadores y cables UNIVAC I y II (Eckert & Mauchly) IBM Serie 700 Programacin en lenguaje mquina
11
Mquina de Pascal
12
Mquina de Leibnitz
13
Charles Babbage
14
Ramn Verea
15
16
Colossus
Primera computadora totalmente electrnica
17
18
Perspectiva histrica
2 Generacin (1958 - 1964)
El transistor t i t
Inventado por los laboratorios Bell en 1947 Ms p pequeos, q , baratos y menor consumo que q las vlvulas de vaco Computadores de menor coste y tamao, ms fiables mayores prestaciones
Otras innovaciones
Programacin en lenguajes de alto nivel (Fortran, Cobol, ...) Canales de E/S Memoria virtual Interrupciones para la E/S
19
Transistor
IBM 7030
20
Perspectiva histrica
3 Generacin (1965 - 1971)
El circuito integrado (CI)
Integracin de mltiples componentes (transistores, resistencias, condensadores, .. ) en un mismo CI de silicio Reduce enormemente el tiempo de fabricacin, el tamao y el coste del computador Aumenta an ms la fiabilidad y las prestaciones DEC PDP PDP-8 8 IBM Series 360 y 370 UNIVAC 1108 CDC series 6600, 7800 y Cyber Microprogramacin Interrupciones con prioridades Memoria cache Controladores DMA Nuevos lenguajes de programacin (Basic, APL, Pascal) Si t Sistemas operativos ti robustos b t (MVS de d IBM, IBM VMS de d DEC)
21
Otras innovaciones
IBM 360
22
Perspectiva histrica
4 Generacin (1972 - 1988)
El microprocesador i d
Aumento constante en escala de integracin (LSI, VLSI): se duplica cada ao La escala LSI permite integrar todos los componentes de un procesador en un mismo chip
Nace el MICROPROCESADOR
Primer microprocesador: intel 4004 (procesador de 4 bits, 1971) i4004 Microsoft desarrolla el primer sistema operativo para PC: MS-DOS De 8 bits: intel 8008, 8080; Motorola 6502, 6800 De 16 bits (ao 78): intel 8086, 80286; Motorola 68000, 68010 De 32 bits (aos 85): intel 80386; Motorola 68020, 68030 MIPS R2000 (32 bits, ao 1986) Basados en tecnologa ECL Muy caros de fabricar y mantener Cray, NEC, Hitachi, Fujitsu
23
Intel 4004
24
Intel 8008
Intel 8008
Procesador P d d de 8 bits bit 3500 Transistores 16 K bytes de memoria O,5 MHz
25
4 Generacin
MITS Altair 8800 Apple II (MC6502)
26
CRAY 1
27
Perspectiva histrica
5 Generacin (1988 - ...)
Sistemas basados en microprocesador
Contina crecimiento en la escala de integracin: Ms de 15 millones de transistores por chip Se abaratan los precios de los microprocesadores y aumentan sus prestaciones Aparece el procesador superescalar, capaz de lanzar varias instrucciones por ciclo de reloj La increble relacin coste-prestaciones del microprocesador hace de ste el elemento bsico de: Computadores personales PC (i486, (i486 Pentium, P ti Pentium P ti II, II Pentium P ti III, III Pentium P ti 4, 4 Pentium P ti M) Machintosh (Motorola 68030, 40, PowerPC4) Estaciones de trabajo (Work-Stations) Sun (SuperSparc (SuperSparc, UltraSparc I I, UltraSparc II II, UltraSparc III) DEC (Alpha 21064, 21164, 21264, 21364) Silicon Graphics (MIPS R4000, R5000, R8000, R10000, R12000) IBM (RS/6000) Supercomputadores paralelos basados en microprocesadores Multicomputadores de de memoria distribuida (Cray T3E, IBM SP2) Multiprocesadores de memoria compartida (SG Origin 2000, Sun SparcServer, HP PA8000)
28
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
29
Perspectiva histrica
Evolucin del rendimiento de los computadores
30
Consumo de Potencia
31
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
32
33
Predicciones
1997 Tamao caracterstico (micras) Voltaje de alimentacin (V) Transistores por chip (M) Bits DRAM por chip (M) Tamao del dado (mm2) Dimensin mxima del chip (mm) Frecuencia de reloj local (MHz) Frecuencia de reloj global (MHz) Mxima p pot p por chip (W) 0.25 1.8-2.5 11 167 300 17.3 750 750 70 1999 0.18 1.5-1.8 21 1,070 , 340 18.4 1,250 1,200 90 2001 0.15 1.2-1.5 40 1,700 , 385 19.6 1,500 1,400 110 2003 0.13 1.2-1.5 76 4,290 , 430 20.7 2,100 1,600 130 2006 0.1 0.9-1.2 200 17,200 , 520 22.8 3,500 2,000 160 2009 0.07 0.6-0.9 520 68,700 , 620 24.9 6,000 2,500 170 2012 0.05 0.5-0.6 1,400 275,000 , 750 27.4 10,000 3,000 175
34
Rendimiento
Evolucin del rendimiento de los computadores (cont.)
Incremento del rendimiento: X 1.54 anual Incremento en la frecuencia del reloj: X 1.25 anual La diferencia entre el incremento en la frecuencia del reloj y el incremento real del rendimiento se debe a la introduccin de mejoras en el diseo y la organizacin del propio computador
Mejoras en el procesador Procesadores superescalares (lanzan varias instrucciones por ciclo) Ejecucin Ej i f fuera d de orden d y tcnicas i de d ejecucin j i especulativa l i (eliminan ( li i muchas h de d las l dependencias impuestas por el programa) Mejoras en la memoria Uso de jerarqua de memoria (memoria cache cache, memoria principal principal, memoria virtual) Mejoras en los elementos de interconexin Uso de jerarqua de buses (buses del sistema, buses de expansin, buses externos) Mejoras en la gestin de la entrada/salida Acceso directo a memoria (DMA), procesadores de E/S Mejoras en los dispositivos de entrada/salida Dispositivos de almacenamiento de alta velocidad (discos, CD-ROM, etc.) Redes R d de d alta lt velocidad l id d
35
PREDICCIONES DE LA SIA
36
PREDICCIONES DE LA SIA
Los estudios se basan en:
transistores (rea), velocidad (reduciendo tiempo de respuesta a los cambios) potencia. potencia
37
Potencia y temperatura
Potencia Esttica Hot Spots
Memoria Cache
Tamao y niveles
38
39
40
Frequency wall:
el nmero de puertas lgicas en una etapa no se puede reducir ms all de un lmite
Power wall:
ms frecuencia implica ms densidad de potencia y, por tanto, ms calor.
41
42
g p gap
43
ELPA
Arquitecturas con consumo mnimo de potencia Con el objetivo de mejorar la vida media de las bateras
44
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
45
Rendimiento
Rendimiento del procesador T CPU= N * CPI * t
N : N de Instrucciones
Compiladores y LM
Ejemplo:
ALU 1 ciclo( 50%), 50%) Load 2c(20%), 2c(20%) Store 2c(10%), 2c(10%) saltos 2c(20%) CPI = ALU 0.5, Ld 0.4, St 0.2, salto 0.4 TOTAL CPI = 1.5
Invertir recursos donde se gasta el tiempo
46
Benchmarks
La nica forma fiable es ejecutando distintos programas reales
Otros
HPC:LINPACK, SPEChpc96, Nas Parallel Benchmark Servidores: SPECweb SPECweb, SPECSFS( File servers) servers), TPC TPC-C C Graficos: SPECviewperf(OpenGL), SPECapc( aplicaciones 3D) Winbench, EEMBC
47
Rendimiento
48
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
49
Un principio simple
Un principio bsico:
Hacer rpidas las funciones frecuentes Gastar recursos donde se gasta el tiempo
Ley de Amdahl:
El l porcentaje de d mejora en el l rendimiento d de d un procesador d viene limitado l d por el porcentaje del impacto global del elemento que se quiere modificar
Permite caracterizar este principio Permite la evaluacin del speedup que se obtendr con una cierta mejora Si la mejora solo acelera la ejecucin de un fraccin F de la tarea, el tiempo de ejecucin del resto permanece sin modificacin. Por tanto es muy importante el porcentaje de la tarea que es acelerada.
50
Un principio simple
La Ley Amdahl
TEjnuevo = TEjantiguo x (1 - Fraccionmejora) + Fraccionmejora Speedupmejora Speeduptotal = TEjantiguo TEjnuevo = (1 - Fraccionmejora) + Fractionmejora ( Speedupmejora 1
Un ejemplo:
Se mejora la implementacin de la operaciones PF reduciendo su tiempo a la mitad. El 10% de las instrucciones en mi programa son PF
TEjnuevo = TEjantiguo x (0.9 + 0.1/2) = 0.95 x TEjantiguo 1 Speeduptotall = 0.9 5 = 1.053
Speedup de un 5%
51
ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo
52
Parmetros trmicos
Potencia disipada por el transistor es especialmente crtico con la temperatura Instalacin de un radiador o aleta refrigeradora
no sobrepasar valores mximos que destruyan el dispositivo
53
Disipacin de potencia
Fuentes de consumo de potencia:
Unidades U id d de d procesamiento i t Memorias Interconexiones y Comunicaciones
SINGLE CORE DUAL CORE MULTI CORE
54
Potencia esttica:
En chip proporcional al n de transistores
Potencia P i dinmica: di i
debido a la carga de capacidades durante las transiciones 01 y 10. En chip, potencia disipacin proporcional rea
Potencia cortocircuito:
Debida a breve corriente de cortocircuito durante las transiciones.
55
Pdyn y CVAf
Edisipada (E) C*VCC Icharge Isc Pdisipada C*VCC*f
Isc
Idischarge
CMOS
mejora todas caractersticas tecnolgicas aumenta capacidad d d entrada d asociada a las puertas
Desventaja:
Potencia esttica
Potencia esttica:
Corrientes C i t leakage l k Presente siempre (an inactivo) Debida a la formacin de diodos parasitarios en CMOS Ps es el producto del voltaje de la fuente de alimentacin por la corriente esttica del circuito. La corriente inversa de saturacin de los diodos crece exponencialmente con el incremento de la temperatura y disminuye el voltaje umbral. DSM (Deep Sub-Micron).(Mucha importancia diseos altas prestaciones).
Ps Ifugas.Vcc Vcc
57
Mtricas
Energa (julios/instruccin), MIPS/W SPEC/W, CV2
reduciendo d i d el l voltaje lt j alimentacin li t i o capacidad id d (transistores (t i t de d menor tamao)(aumento retardo) Reduccin de la frecuencia Formas no adecuadas de medir porque influyen en el rendimiento.
58
Bibliografa
Captulo 1 de [HePa06] Semiconductor S i d t Industry I d t A Association. i ti
http://public.itrs.net
Standard Performance Evaluation Corporation Corporation.
http://www.spec.org
Transaction Processing Council. Council
http://www.tpc.org
The Embedded Microprocessor Benchmark Consortium.
http://www.eembc.org
Historia de la Informtica y sus p pioneros
59