You are on page 1of 59

Arquitectura de Computadores Tema 1 Introduccin.

Conceptos fundamentales
Departamento de Arquitectura de Computadores y Automtica

Unversidad Complutense de Madrid (Spain)


Jos Ignacio Hidalgo hidalgo@dacya.ucm.es

Jos Ignacio Hidalgo. DACYA. UCM, AC, 2009 2009-2010

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

1. Introduccin. La asignatura.
Ofimtica (MS-Office, Contaplus, D-Base) Comunicaciones (Netscape, Explorer, Mail) Di (AutoCAD, Diseo (A t CAD ...), ) Multimedia, M lti di J Juegos, etc. t FOR, WHILE, REPEAT, PROCEDURE, ... PASCAL, FORTRAN, C, COBOL, BASIC, ... MODULA C++, MODULA, C++ JAVA, JAVA ... Gestin de memoria Gestin de procesos Gestin de ficheros
Registros R0

Aplicacin

Lenguaje de alto nivel Sistema Operativo / Compilador Arquitectura del repertorio de instrucciones Organizacin Hardware del sistema Circuito Digital

Compilacin Enlazado Ubicacin


Loop move load add sub b beq #$10, R0 R1(dir1), R2 R2, R0 #1 #1, R1 Loop


R7

Registro Estado Contador Programa

CPU

Mem Mem. Bus E/S

Fsico

Niveles de descripcin de un computador


Dnde se estudia?
Aplicacin

Casa, auto-aprendizaje en ratos libres, Academias de informtica/ofimtica Fundamentos de Programacin Programacin, EDI Sistemas Operativos (NO compiladores)

Lenguaje de alto nivel Sistema Operativo / Compilador Arquitectura del repertorio de instrucciones Organizacin Hardware del sistema Circuito Digital Fsico

ESTRUCTURA DE COMPUTADORES,
Arquitectura de Computadores Circuitos Digitales, Tecnologa, Tecnologa F F. Computadores Instrumentacin, Diseo y Test de Circuitos Integrados

Arquitectura de computadores
Los atributos de un computador tal y como los ve un programador en lenguaje ensamblador. ensamblador La estructura conceptual y el modelo funcional (modelo de programacin). Amdahl, Blaaw, Brooks 1964 El concepto ha cambiado en el tiempo.
Hasta la mitad de los 80. El nfasis era el diseo de juego de instrucciones orientado a los LAN. Desde entonces el nfasis es el diseo de CPU, Jerarqua de memoria, sistema de I/O. Aspectos clave coste-rendimiento-tecnologa-potencia

Tres aspectos
Arquitectura del juego de instrucciones Organizacin O i i ( diferentes dif t organizaciones i i P6, P6 N Netbrust, tb t AMD) Implementacin ( PentiumIII, Celeron, Pentium4, Pentium Xeon )

Evolucin de los juegos de instrucciones


Acumulador (EDSAC 1950) Acumulador + Registros ndices
(Manchester Mark I, IBM 700 series 1953)

Separacin del modelo de programacin de la implementacin

O i t d a los Orientadas l LAN


(B5000 1963)

C Concepto t d de Familia F ili


(IBM 360 1964)

Arquitecturas con Reg de propsito general Arquitecturas CISC


(Vax, Intel 432, x86 1977-80)

Arquitecturas Load/Store
(CDC 6600, ( , Cray y 1 1963-76) )

RISC
(Mips,Sparc,HP-PA,IBM RS6000, . . .1987)

Metodologa de Diseo

Complejidad de la Implementacin

E l Evaluar Sistemas Si t existentes

Benchmarks Tendencias Implementar Nuevo Sistema Simular Nuevos Diseos

Carga de Trabajo
7

La asignatura
Entrada/salida y almacenamiento Discos, WORM, Cintas RAID Organizacin de memoria Protocolos de Bus Coherencia, Ancho de banda, Latencia Segmentacin y ILP Segmentacin, Riesgos, Superescalar, Ejecucin fuera de orden, Prediccin Especulacin Prediccin, Especulacin,
8

DRAM- Memoria Central

Jerarqua de Memoria

L2 Cache

L1 Cache VLSI
Arquitectura del Procesador

DSP

La asignatura
Que estudia la asignatura
P M P M P M P M

Memoria M i Compartida, C id Paso de Mensajes, Paralelismo de Datos Red Topologa, Routing Routing, Ancho de Banda, Latencia,

Red de interconexin

Switch Procesador Memoria

Multiprocesadores Redes de Interconexin

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

10

2. Perspectiva histrica
Generaciones de computadores
Generacin Primera Segunda Tercera Cuarta Quinta Fechas 1946-1957 1958-1964 1965-1971 1972-1988 1988Caractersticas Tecnolg. Tecnolg Vlvula de vaco Transistores Circuitos integrados Microprocesador Sistema basados en micro Potencia de clculo 0,04 MIPS 0,2 MIPS 1 MIPS 10 MIPS > 100 MIPS

1 Generacin (1946(1946-1957)
ENIAC (1946)
Primer computador p de propsito p p especial p Peso: 30 toneladas; Superficie: 1.400 m2; Consumo: 140 KW Potencia clculo: 5000 sumas/seg Difcil de programar. Mediante conmutadores y cables UNIVAC I y II (Eckert & Mauchly) IBM Serie 700 Programacin en lenguaje mquina

Primeros computadores comerciales (Aos 50)


11

Mquina de Pascal

12

Mquina de Leibnitz

13

Charles Babbage

14

Ramn Verea

15

Leonardo Torres Quevedo

16

Colossus
Primera computadora totalmente electrnica

17

Primeras vlvulas de vaco


IBM RAMAC

18

Perspectiva histrica
2 Generacin (1958 - 1964)

El transistor t i t
Inventado por los laboratorios Bell en 1947 Ms p pequeos, q , baratos y menor consumo que q las vlvulas de vaco Computadores de menor coste y tamao, ms fiables mayores prestaciones

Principales computadores comerciales


DEC PDP PDP-1 1 IBM Serie 7000 UNIVAC 1100

Otras innovaciones
Programacin en lenguajes de alto nivel (Fortran, Cobol, ...) Canales de E/S Memoria virtual Interrupciones para la E/S

19

Transistor
IBM 7030

20

Perspectiva histrica
3 Generacin (1965 - 1971)
El circuito integrado (CI)
Integracin de mltiples componentes (transistores, resistencias, condensadores, .. ) en un mismo CI de silicio Reduce enormemente el tiempo de fabricacin, el tamao y el coste del computador Aumenta an ms la fiabilidad y las prestaciones DEC PDP PDP-8 8 IBM Series 360 y 370 UNIVAC 1108 CDC series 6600, 7800 y Cyber Microprogramacin Interrupciones con prioridades Memoria cache Controladores DMA Nuevos lenguajes de programacin (Basic, APL, Pascal) Si t Sistemas operativos ti robustos b t (MVS de d IBM, IBM VMS de d DEC)
21

Principales computadores comerciales


Otras innovaciones

IBM 360

22

Perspectiva histrica
4 Generacin (1972 - 1988)
El microprocesador i d
Aumento constante en escala de integracin (LSI, VLSI): se duplica cada ao La escala LSI permite integrar todos los componentes de un procesador en un mismo chip
Nace el MICROPROCESADOR

Primer microprocesador: intel 4004 (procesador de 4 bits, 1971) i4004 Microsoft desarrolla el primer sistema operativo para PC: MS-DOS De 8 bits: intel 8008, 8080; Motorola 6502, 6800 De 16 bits (ao 78): intel 8086, 80286; Motorola 68000, 68010 De 32 bits (aos 85): intel 80386; Motorola 68020, 68030 MIPS R2000 (32 bits, ao 1986) Basados en tecnologa ECL Muy caros de fabricar y mantener Cray, NEC, Hitachi, Fujitsu

Aparece el computador personal (IBM/PC)


Principales procesadores de esta generacin

Surge el procesador con conjunto reducido de instrucciones (RISC)


Supercomputadores vectoriales y paralelos

Aparecen p las redes de computadores p

23

Intel 4004

Procesador P ocesado de 4 bits 2300 Transistores 8 micras

24

Intel 8008
Intel 8008
Procesador P d d de 8 bits bit 3500 Transistores 16 K bytes de memoria O,5 MHz

25

4 Generacin
MITS Altair 8800 Apple II (MC6502)

26

CRAY 1

27

Perspectiva histrica
5 Generacin (1988 - ...)
Sistemas basados en microprocesador
Contina crecimiento en la escala de integracin: Ms de 15 millones de transistores por chip Se abaratan los precios de los microprocesadores y aumentan sus prestaciones Aparece el procesador superescalar, capaz de lanzar varias instrucciones por ciclo de reloj La increble relacin coste-prestaciones del microprocesador hace de ste el elemento bsico de: Computadores personales PC (i486, (i486 Pentium, P ti Pentium P ti II, II Pentium P ti III, III Pentium P ti 4, 4 Pentium P ti M) Machintosh (Motorola 68030, 40, PowerPC4) Estaciones de trabajo (Work-Stations) Sun (SuperSparc (SuperSparc, UltraSparc I I, UltraSparc II II, UltraSparc III) DEC (Alpha 21064, 21164, 21264, 21364) Silicon Graphics (MIPS R4000, R5000, R8000, R10000, R12000) IBM (RS/6000) Supercomputadores paralelos basados en microprocesadores Multicomputadores de de memoria distribuida (Cray T3E, IBM SP2) Multiprocesadores de memoria compartida (SG Origin 2000, Sun SparcServer, HP PA8000)
28

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

29

Perspectiva histrica
Evolucin del rendimiento de los computadores

Incremento del rendimiento: X 1.54 anual

Medida de rendimiento utilizada: nmero de veces ms rpido qu el VAX-11/780

30

Consumo de Potencia

31

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

32

Ley de Moore Segn Intel

33

Predicciones
1997 Tamao caracterstico (micras) Voltaje de alimentacin (V) Transistores por chip (M) Bits DRAM por chip (M) Tamao del dado (mm2) Dimensin mxima del chip (mm) Frecuencia de reloj local (MHz) Frecuencia de reloj global (MHz) Mxima p pot p por chip (W) 0.25 1.8-2.5 11 167 300 17.3 750 750 70 1999 0.18 1.5-1.8 21 1,070 , 340 18.4 1,250 1,200 90 2001 0.15 1.2-1.5 40 1,700 , 385 19.6 1,500 1,400 110 2003 0.13 1.2-1.5 76 4,290 , 430 20.7 2,100 1,600 130 2006 0.1 0.9-1.2 200 17,200 , 520 22.8 3,500 2,000 160 2009 0.07 0.6-0.9 520 68,700 , 620 24.9 6,000 2,500 170 2012 0.05 0.5-0.6 1,400 275,000 , 750 27.4 10,000 3,000 175

34

Rendimiento
Evolucin del rendimiento de los computadores (cont.)
Incremento del rendimiento: X 1.54 anual Incremento en la frecuencia del reloj: X 1.25 anual La diferencia entre el incremento en la frecuencia del reloj y el incremento real del rendimiento se debe a la introduccin de mejoras en el diseo y la organizacin del propio computador
Mejoras en el procesador Procesadores superescalares (lanzan varias instrucciones por ciclo) Ejecucin Ej i f fuera d de orden d y tcnicas i de d ejecucin j i especulativa l i (eliminan ( li i muchas h de d las l dependencias impuestas por el programa) Mejoras en la memoria Uso de jerarqua de memoria (memoria cache cache, memoria principal principal, memoria virtual) Mejoras en los elementos de interconexin Uso de jerarqua de buses (buses del sistema, buses de expansin, buses externos) Mejoras en la gestin de la entrada/salida Acceso directo a memoria (DMA), procesadores de E/S Mejoras en los dispositivos de entrada/salida Dispositivos de almacenamiento de alta velocidad (discos, CD-ROM, etc.) Redes R d de d alta lt velocidad l id d
35

PREDICCIONES DE LA SIA

36

PREDICCIONES DE LA SIA
Los estudios se basan en:
transistores (rea), velocidad (reduciendo tiempo de respuesta a los cambios) potencia. potencia

Las predicciones han ayudado al diseo de nuevos chips.


Problema: limitaciones de la tecnologa actual. actual

37

Procesadores de Propsito General


Claves en el diseo:
Rendimiento y velocidad
Speed-up Eficiencia

Potencia y temperatura
Potencia Esttica Hot Spots

Memoria Cache
Tamao y niveles

Nmero de threads Nmero de Cores


Actuales < 8 Futuro 100s

38

EMBEDDED PROCESSORS Y PROCESADORES Soc


Claves en el diseo
Procesadores especializados Dominan el mercado Adaptacin de sistemas y aplicaciones

39

Rendimiento, rea y Potencia

40

Consideraciones sobre el rendimiento


Limitaciones al rendimiento:
Memory wall:
ms velocidad de CPU, ms fallos de cach en un determinado tiempo. La MP no p puede trabajar j a tales velocidades.

Frequency wall:
el nmero de puertas lgicas en una etapa no se puede reducir ms all de un lmite

Power wall:
ms frecuencia implica ms densidad de potencia y, por tanto, ms calor.

41

CONSIDERACIONES SOBRE EL COSTE ( (REA) )

42

DIFERENCIA ENTRE DENSIDAD Y PRODUCTIVIDAD

g p gap

43

FUTURAS DIRECCIONES DE LA TECNOLOGA


Objetivo:
Diseos con alto rendimiento y Bajo consumo de potencia

Arquitecturas de alto rendimiento:


Ncleos mltiples Ms hilos (threads) de ejecucin por ncleo Cachs multinivel ms grandes

ELPA
Arquitecturas con consumo mnimo de potencia Con el objetivo de mejorar la vida media de las bateras

44

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

45

Rendimiento
Rendimiento del procesador T CPU= N * CPI * t
N : N de Instrucciones
Compiladores y LM

CPI : Ciclos medios por instruccin


LM, implementacin, paralelismo (TCPU * Clock Rate) / Numero de Instrucciones Ciclos / Numero de Instrucciones CPI i * F i
Fj es la frecuencia de aparicin de la instruccin J

t:t tiempo e po de de c ciclo co


implementacin, tecnologa

Ejemplo:
ALU 1 ciclo( 50%), 50%) Load 2c(20%), 2c(20%) Store 2c(10%), 2c(10%) saltos 2c(20%) CPI = ALU 0.5, Ld 0.4, St 0.2, salto 0.4 TOTAL CPI = 1.5
Invertir recursos donde se gasta el tiempo
46

Benchmarks
La nica forma fiable es ejecutando distintos programas reales

Programas de de juguete: juguete :


10~100 lneas de cdigo con resultado conocido.
Criba de Erasttenes, Puzzle, Quicksort

Programas de prueba (benchmarks) sintticos:


simulan la frecuencia de operaciones y operandos de un abanico de programas reales.
Whetstone, Dhrystone

Programas reales tpicos con cargas de trabajo fijas


Actualmente la medida ms aceptada
SPEC2000 12 programas enteros y 14 en punto flotante

Otros
HPC:LINPACK, SPEChpc96, Nas Parallel Benchmark Servidores: SPECweb SPECweb, SPECSFS( File servers) servers), TPC TPC-C C Graficos: SPECviewperf(OpenGL), SPECapc( aplicaciones 3D) Winbench, EEMBC

47

Rendimiento

48

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

49

Un principio simple
Un principio bsico:
Hacer rpidas las funciones frecuentes Gastar recursos donde se gasta el tiempo

Ley de Amdahl:
El l porcentaje de d mejora en el l rendimiento d de d un procesador d viene limitado l d por el porcentaje del impacto global del elemento que se quiere modificar
Permite caracterizar este principio Permite la evaluacin del speedup que se obtendr con una cierta mejora Si la mejora solo acelera la ejecucin de un fraccin F de la tarea, el tiempo de ejecucin del resto permanece sin modificacin. Por tanto es muy importante el porcentaje de la tarea que es acelerada.

Medidas de Mejora Aceleracin o Speed-up y Eficiencia


Speedup(E) = TEj sin M / TEj con M Eficiencia = Tiempo con N Procesadores /Tiempo con 1 procesador *N N

50

Un principio simple
La Ley Amdahl

TEjnuevo = TEjantiguo x (1 - Fraccionmejora) + Fraccionmejora Speedupmejora Speeduptotal = TEjantiguo TEjnuevo = (1 - Fraccionmejora) + Fractionmejora ( Speedupmejora 1

Un ejemplo:

Se mejora la implementacin de la operaciones PF reduciendo su tiempo a la mitad. El 10% de las instrucciones en mi programa son PF
TEjnuevo = TEjantiguo x (0.9 + 0.1/2) = 0.95 x TEjantiguo 1 Speeduptotall = 0.9 5 = 1.053

Speedup de un 5%
51

ndice
1. 2. 3. 4. 5. 6. 7. Introduccin. La asignatura Perspectiva Histrica Rendimiento, Coste y Potencia Ley de Moore, Tendencias Benchmarks Ley de Ahmdal Consumo

52

Por qu preocupacin sobre disipacin de potencia?

Parmetros trmicos
Potencia disipada por el transistor es especialmente crtico con la temperatura Instalacin de un radiador o aleta refrigeradora
no sobrepasar valores mximos que destruyan el dispositivo

Potencia disminuye a medida que aumenta la temperatura. Coste, Empaquetamientos CI

Consumo elctrico Duracin bateras

53

Disipacin de potencia
Fuentes de consumo de potencia:
Unidades U id d de d procesamiento i t Memorias Interconexiones y Comunicaciones
SINGLE CORE DUAL CORE MULTI CORE

Wafer of Pentium 4 processors

Wafer of Intel Xeon processors

Wafer of Itanium processors

Futuras tecnologas de fabricacin de Intel


(65 (65nm, 45nm 45 y 32nm), 32 ) permitirn mltiples cores manteniendo el tamao de die y el consumo dentro de los lmites actuales, proporcionando mejoras de rendimiento

54

Consumo potencia: Fundamentos


Potencia dinmica vs. Potencia esttica vs. Potencia cortocircuito
switching switching power leakage power Potencia dinmica predomina, pero la potencia esttica incremento importante

Potencia esttica:
En chip proporcional al n de transistores

Potencia P i dinmica: di i
debido a la carga de capacidades durante las transiciones 01 y 10. En chip, potencia disipacin proporcional rea

Potencia cortocircuito:
Debida a breve corriente de cortocircuito durante las transiciones.

55

Potencia dinmica CMOS

Pdyn y CVAf
Edisipada (E) C*VCC Icharge Isc Pdisipada C*VCC*f

Isc

Potencia P t i corto t circuito i it


Camino corriente directa entre VCC y GND cuando d ambos transistores NMOS y PMOS estn conduciendo conduciendo.

Idischarge

CMOS

ITRS (International technology roadmap for semiconductor)

mejora todas caractersticas tecnolgicas aumenta capacidad d d entrada d asociada a las puertas

Desventaja:

Aumento en el tiempo respuesta al cargar las salidas


56

Potencia esttica
Potencia esttica:
Corrientes C i t leakage l k Presente siempre (an inactivo) Debida a la formacin de diodos parasitarios en CMOS Ps es el producto del voltaje de la fuente de alimentacin por la corriente esttica del circuito. La corriente inversa de saturacin de los diodos crece exponencialmente con el incremento de la temperatura y disminuye el voltaje umbral. DSM (Deep Sub-Micron).(Mucha importancia diseos altas prestaciones).

Ps Ifugas.Vcc Vcc

57

Mtricas
Energa (julios/instruccin), MIPS/W SPEC/W, CV2
reduciendo d i d el l voltaje lt j alimentacin li t i o capacidad id d (transistores (t i t de d menor tamao)(aumento retardo) Reduccin de la frecuencia Formas no adecuadas de medir porque influyen en el rendimiento.

Objetivo: buscar una mtrica de consumo en base a un rendimiento dado.


Producto Retardo-Potencia (DP) (Julios) (DP=Tpropagacin*Pdisipacin) Producto Energa-retardo (EDP). (MIPS2/W, Julio/SPEC SPEC2/W)(Aumentar el rendimiento o reducir energa) Producto Energa-retardo2 (ED2P). (MIPS3/W SPEC3/W)(utilizando tecnologa mas pequea)

Tener en cuenta las corrientes de leakage y el HW adicional a la hora de evaluar mejoras.

58

Bibliografa
Captulo 1 de [HePa06] Semiconductor S i d t Industry I d t A Association. i ti

http://public.itrs.net
Standard Performance Evaluation Corporation Corporation.

http://www.spec.org
Transaction Processing Council. Council

http://www.tpc.org
The Embedded Microprocessor Benchmark Consortium.

http://www.eembc.org
Historia de la Informtica y sus p pioneros

Carlos A. Coello Coello

59

You might also like