You are on page 1of 16

Centro Universitario de los Valles. CUValles.

Materia: Arquitectura Avanzada de Computadora. Profesor: Juan Manuel Nues Maldonado. Integrantes del Equipo:
Ivn Noel Garca Lizaola. Hugo Santiago Lara Gonzlez. Luis Miguel Torres Villalobos.

Actividad:
Practica: 1 Procesador

Ingeniera en:
Mecatrnica.

ndice:
Presentacin. ndice. Introduccin Caractersticas bsicas: Tipo: Pipeline, Superescalar de N vas, VLIW. Tipo: CISC, RISC, CISC/RISC. Tamao de palabra: 32/64 bits. Frecuencia de reloj. Bancos de registros. Memorias cache: MCa1, MCa2, MCa3 Otras caractersticas. Descripcin del pipeline. Unidades funcionales (nmero y caractersticas).

* *

Tratamiento de saltos Estaciones de reserva (nmero y caractersticas). Tcnica de renombrado. Reorder buffer: caractersticas Tratamiento de Load/Store. Prestaciones (versin de mxima velocidad).

Prestaciones SPEC actualizadas (otras medidas, si no se dispone de SPEC). Potencia consumida. Bibliografa: Listado completo de referencias utilizadas: libros, artculos, pginas web, etc.

Introduccin:

Procesadores AMD Phenom


Phenom (pronunciado / fnm / , como en la palabra fenmeno ) es el AMD lnea de procesador de escritorio basado en el K10 ( no "K10h"microarquitectura), [ 1 ] o la familia de procesadores 10h, ya que AMD los llama. Triple-core versiones (con nombre en cdigo Toliman) pertenecen a la serie Phenom 8000 y quad cores (nombre en cdigo Agena) en la serie AMD Phenom X4 9000. Procesadores Phenom son de 64 bits. Diseados desde el comienzo para ofrecer verdadero rendimiento de dos cuatro y tres ncleos, los procesadores AMD Phenom trabajan a toda velocidad en complejas operaciones multitarea, productividad crtica de negocios, diseo y modelado visual avanzado, juegos extremos y medios digitales y de entretenimiento visualmente asombrosos.

Caractersticas bsicas:
Principales Caractersticas de arquitectura de los Procesadores AMD Phenom X3 de Tres Ncleos
La industria de la primera verdadera Triple-Core x86

Verdadero triple-core diseados desde cero para una mejor comunicacin entre ncleos. o Beneficio: Los ncleos pueden comunicarse a morir antes que en el paquete para un mejor rendimiento.
o

AMD64 con Arquitectura de Conexin Directa


Ayuda a mejorar el rendimiento del sistema y la eficiencia mediante la conexin directa al controlador de memoria y E / S a la CPU. Diseado para permitir simultnea de 32 - y 64-bit El controlador de memoria integrado DDR2 o Beneficios: Aumenta el rendimiento de las aplicaciones al reducir la latencia de memoria o Escalas de ancho de banda de memoria y el rendimiento para que coincida con las necesidades de clculo o La tecnologa HyperTransport proporciona hasta 16.0GB / s de ancho de banda mximo por procesador - la reduccin de I / O los cuellos de botella

o o

Hasta 33.1GB total / s del procesador al sistema de ancho de banda (bus HyperTransport + bus de memoria)

AMD Balanced Smart Cache


De cach L3 compartida Adems de los 512 K de cach L2 por ncleo, hasta 2 MB de cach L3 compartida por hasta tres ncleos. o Beneficio: acorta el tiempo de acceso a los datos muy visitada para un mejor rendimiento.
o

AMD acelerador de ancho de punto flotante


De 128-bit unidad de coma flotante (FPU) De alto rendimiento (de 128 bits ruta de datos interna) unidad de coma flotante por ncleo. o Beneficio: grandes rutas de datos para clculos de punto flotante ms rpidos y un mejor rendimiento.
o

La tecnologa HyperTransport

Un enlace de 16 bits de hasta 3600MT / s Hasta 8 GB de 0,0 / s HyperTransport de E / S de ancho de banda, hasta 16.0GB / s en modo HyperTransport de generacin 3.0 Hasta 33.1GB total / s del procesador al sistema de ancho de banda (bus HyperTransport + bus de memoria) o Beneficio: Los tiempos de rpido acceso a los recursos del sistema para un mejor rendimiento.
o

Controlador DDR2 DRAM integrado con AMD Tecnologa de la Memoria del optimizador

Un gran ancho de banda, baja latencia integrado un controlador de memoria DDR2 Soporta PC2-8500 (DDR2-1066), PC2-6400 (DDR2-800), PC2-5300 (DDR2-667), PC2-4200 (DDR2-533) o PC2-3200 (DDR2-400) sin bfer SDRAM DIMM Soporte para 64-bit de memoria DDR2 SDRAM Hasta 17.1GB / s de ancho de banda de memoria o Beneficio: Acceso rpido a la memoria del sistema para un mejor rendimiento.
o

AMD Virtualization (AMD-V ) con Rapid Virtualization Indexing

Silicio conjunto de caractersticas-mejoras diseadas para mejorar el rendimiento, fiabilidad y seguridad de los entornos de virtualizacin actuales y futuros al permitir aplicaciones virtualizadas con acceso directo y rpido a su memoria asignada. o Beneficio: Ayuda a software de virtualizacin para ejecutar de forma ms segura y eficiente que permite una mejor experiencia al tratar con los sistemas virtuales.
o

AMD PowerNow! Technology (Tecnologa Cool'n'Quiet )


Funciones mejoradas de administracin de energa que ajusta automtica e instantneamente los estados de rendimiento y caractersticas basadas en los requisitos de rendimiento del procesador Para un funcionamiento ms silencioso y reduccin de las necesidades de energa o Beneficio: Permite diseos de plataforma con menos calor y el rendimiento eficiente del ruido y el consumo de energa.

AMD CoolCore

Reduce el consumo de energa al desactivar las partes no utilizadas del procesador. Por ejemplo, el controlador de memoria puede desactivar la lgica de escritura cuando lee de la memoria, ayudando a reducir la potencia del sistema. Funciona de forma automtica sin necesidad de drivers o activacin del BIOS. El poder puede ser activada o desactivada en un solo ciclo de reloj, ahorrando energa sin comprometer el rendimiento comprometida. o Beneficio: Ayuda a los usuarios obtener un rendimiento ms eficaz activando dinmicamente o desactivando partes del procesador.
o

Dual Dynamic Power Management Permite a las capacidades de gestin de alimentacin ms granular para reducir el consumo de energa del procesador.

Separa los planos de energa para los ncleos y el controlador de memoria, por el consumo de energa y un rendimiento ptimos, la creacin de ms oportunidades de ahorro de energa dentro de los ncleos y el controlador de memoria. o Beneficio: Ayuda a mejorar la eficiencia de la plataforma proporcionando un rendimiento de la demanda de memoria mientras se sigue permitiendo la disminucin en el consumo de energa del sistema.

Principales caractersticas de la arquitectura de los procesadores AMD Phenom X4 Quad-Core


La industria el primer Quad Core x86 verdadera

Verdadero de cuatro ncleos diseados desde cero para una mejor comunicacin entre ncleos. o Beneficio: Los ncleos pueden comunicarse a morir antes que en el paquete para un mejor rendimiento

AMD64 con Arquitectura de Conexin Directa

Ayuda a mejorar el rendimiento del sistema y la eficiencia mediante la conexin directa al controlador de memoria y E / S a la CPU. Diseado para permitir simultnea de 32 - y 64-bit El controlador de memoria integrado DDR2 o Beneficios: Aumenta el rendimiento de las aplicaciones al reducir la latencia de memoria o Escalas de ancho de banda de memoria y el rendimiento para que coincida con las necesidades de clculo o La tecnologa HyperTransport proporciona hasta 16.0GB / s de ancho de banda mximo por procesador para reducir la E / S de los cuellos de botella o Hasta 33.1GB total / s del procesador al sistema de ancho de banda (bus HyperTransport + bus de memoria)

AMD Balanced Smart Cache



De cach L3 compartida Adems de los 512 K de cach L2 por ncleo, hasta 2 MB de cach L3 compartida por hasta 4 ncleos. o Beneficio: acorta el tiempo de acceso a los datos muy visitada para un mejor rendimiento.

AMD acelerador de ancho de punto flotante


La tecnologa HyperTransport

De 128-bit unidad de coma flotante (FPU) De alto rendimiento (de 128 bits ruta de datos interna) unidad de coma flotante por ncleo. o Beneficio: grandes rutas de datos para clculos de punto flotante ms rpidos y un mejor rendimiento.

Un enlace de 16 bits de hasta 4000MT / s De hasta 8,0 GB / s HyperTransport de E / S de ancho de banda, en un mximo de 16.0GB / s HyperTransport de generacin 3.0 modo de Hasta 33.1GB total / s del procesador al sistema de ancho de banda (bus HyperTransport + bus de memoria) o Beneficio: Los tiempos de rpido acceso a los recursos del sistema para un mejor rendimiento. Un gran ancho de banda, baja latencia integrado un controlador de memoria DDR2 Soporta PC2-8500 (DDR2-1066), PC2-6400 (DDR2-800), PC2-5300 (DDR2-667), PC2-4200 (DDR2-533) o PC2-3200 (DDR2-400) sin bfer SDRAM DIMM Soporte para 64-bit de memoria DDR2 SDRAM Hasta 17.1GB / s de ancho de banda de memoria o Beneficio: Acceso rpido a la memoria del sistema para un mejor rendimiento. Silicio conjunto de caractersticas-mejoras diseadas para mejorar el rendimiento, fiabilidad y seguridad de los entornos de virtualizacin actuales y futuros al permitir aplicaciones virtualizadas con acceso directo y rpido a su memoria asignada. o Beneficio: Ayuda a software de virtualizacin para ejecutar de forma ms segura y eficiente que permite una mejor experiencia al tratar con los sistemas virtuales

Controlador DDR2 DRAM integrado con AMD Tecnologa de la Memoria del optimizador

AMD Virtualization (AMD-V ) con Rapid Virtualization Indexing

AMD PowerNow! Technology (Tecnologa Cool'n'Quiet )

Funciones mejoradas de administracin de energa que ajusta automtica e instantneamente los estados de rendimiento y caractersticas basadas en los requisitos de rendimiento del procesador Para un funcionamiento ms silencioso y reduccin de las necesidades de energa o Beneficio: Permite diseos de plataforma con menos calor y el rendimiento eficiente del ruido y el consumo de energa.

AMD CoolCore

Reduce el consumo de energa al desactivar las partes no utilizadas del procesador. Por ejemplo, el controlador de memoria puede desactivar la lgica de escritura cuando lee de la memoria, ayudando a reducir la potencia del sistema. Funciona de forma automtica sin necesidad de drivers o activacin del BIOS. El poder puede ser activada o desactivada en un solo ciclo de reloj, ahorrando energa sin comprometer el rendimiento. o Beneficio: Ayuda a los usuarios obtener un rendimiento ms eficaz activando dinmicamente o desactivando partes del procesador.

Dual Dynamic Power Management



Permite a las capacidades de gestin de alimentacin ms granular para reducir el consumo de energa del procesador. Separa los planos de energa para los ncleos y el controlador de memoria, por el consumo de energa y un rendimiento ptimos, la creacin de ms oportunidades de ahorro de energa dentro de los ncleos y el controlador de memoria. o Beneficio: Ayuda a mejorar la eficiencia de la plataforma proporcionando un rendimiento de la demanda de memoria mientras se sigue permitiendo la disminucin en el consumo de energa del sistema AMD Phenom
AMD Phenom, basados en el procesador de la familia AMD K10 Escritorio Quad-core De triple ncleo De doble ncleo

Cuyo nombre en cdigo Ncleo Fecha de lanzamiento

Agena 65 nm 03 2008

Tolimn 65 nm 03 2008

Kuma 65 nm 12 2008

Lista de los microprocesadores AMD Phenom

Producido Comercializado por Diseado por Fabricante comunes (s) Max. CPUvelocidad de reloj HyperTransport velocidades Min. funcin de tamao Conjunto de instrucciones Microarquitectura Ncleos Zcalo (s)

2007 AMD AMD GlobalFoundries 1,8 GHz a 2,6 GHz 1,6 GHz a 2,0 GHz 65 nm a 45 nm MMX , SSE , SSE2 , SSE3, SSE4a , x8664 ,3DNow! K10 3y4 Socket AM2 +

Tipo: Pipeline, Superescalar de N vas, VLIW.


Segmentacin (Pipeline) Consiste en descomponer la ejecucin de cada instruccin en varias etapas para poder empezar a procesar una instruccin diferente en cada una de ellas y trabajar con varias a la vez. Ejemplo sin segmentacin: segmentacin Phenom X4 En el caso del procesador DLX podemos encontrar las siguientes etapas en una instruccin:

IF: bsqueda ID: decodificacin EX: ejecucin de unidad aritmtico lgica MEM: memoria WB: escritura

Cada una de estas etapas de la instruccin usa en exclusiva un hardware determinado del procesador, de tal forma que la ejecucin de cada una de las etapas en principio no interfiere en la ejecucin del resto. En el caso de que el procesador no pudiese ejecutar las instrucciones en etapas segmentadas, la ejecucin de la siguiente instruccin slo se podra llevar a cabo tras la finalizacin de la primera. En cambio en un procesador segmentado, salvo excepciones de dependencias de datos o uso de unidades funcionales, la siguiente instruccin podra iniciar su ejecucin tras acabar la primera etapa de la instruccin actual.

Tipo: CISC, RISC, CISC/RISC.


El cuanto al set de instrucciones incorporadas en el procesador tenemos el mismo juego incorporado en los Phenom X4, mas que nada, son la misma arquitectura, estas consisten en las ya viejas y conocidas MMX (+), las propietarias de AMD 3D Now! (+) y las instrucciones SSE (Streaming SIMD Extensions), SSE2, SSE3, x86-64 y las mas recientes SSE4A, ausentes en los AMD Athlon 64 X2 e incorporadas desde los Phenom X4.

SSE es a su vez ampliado por SSE2, que tambin extiende las instrucciones MMX y fue usada en los Pentium 4 y los Opteron y Athlon 64 y recientemente con SSE3, introducido con la Intel Core Microarchitecture. Usada en Intel Core 2 Duo y Xeon Intel y su mayor competidor AMD llegaron a un acuerdo de compatibilidad por el que ste ltimo sac al mercado microprocesadores con el juego de instrucciones MMX, los procesadores AMD_K6.Ms tarde AMD dara un paso ms, aadiendo a sus procesadores un nuevo juego de instrucciones para operaciones en coma flotante: 3DNow!.

AMD64 con Arquitectura de Conexin Directa Ayuda a mejorar el rendimiento del sistema y la eficiencia mediante la conexin directa al controlador de memoria y E / S a la CPU. Diseado para permitir simultnea de 32 - y 64-bit El controlador de memoria integrado DDR2 o Beneficios: Aumenta el rendimiento de las aplicaciones al reducir la latencia de memoria o Escalas de ancho de banda de memoria y el rendimiento para que coincida con las necesidades de clculo o La tecnologa HyperTransport proporciona hasta 16.0GB / s de ancho de banda mximo por procesador para reducir la E / S de los cuellos de botella Hasta 33.1GB total / s del procesador al sistema de ancho de banda (bus HyperTransport + bus de memoria AMD64 con Arquitectura de Conexin Directa

Ayuda a mejorar el rendimiento del sistema y la eficiencia mediante la conexin directa al controlador de memoria y E / S a la CPU. Diseado para permitir simultnea de 32 - y 64-bit El controlador de memoria integrado DDR2 o Beneficios: Aumenta el rendimiento de las aplicaciones al reducir la latencia de memoria o Escalas de ancho de banda de memoria y el rendimiento para que coincida con las necesidades de clculo o La tecnologa HyperTransport proporciona hasta 16.0GB / s de ancho de banda mximo por procesador - la reduccin de I / O los cuellos de botella o Hasta 33.1GB total / s del procesador al sistema de ancho de banda (bus HyperTransport + bus de memoria)
o

Tamao de palabra: 32/64 bits.


Procesador AMD Phenom X4 Procesador AMD Phenom X3

Modo operativo de 32 bits Modo de funcionamiento de 64 bits

S S

Modo operativo de 32 bits Modo de funcionamiento de 64 bits

S S

Frecuencia de reloj.
Procesador AMD Phenom X4 Frecuencia de reloj: 2100 a 2500 MHz

Frecuencia de reloj: Procesador AMD Phenom X3 2100 a 2500 MHz

Bancos de registros.
Caractersticas CPUID Vamos a comenzar nuestro anlisis de la nueva arquitectura de CPU de AMD con breves caractersticas de un procesador de CPUID, publicado en la Tabla 1.

Tabla 1. Phenom X4 CPUID


CPUID funcin Procesador de la firma Identificador de la marca Valor 100F22h 10000000h FF30h FF10h FF30h FF20h 40020140h 40020140h 2080H 0000h 4200h 4200h 02008140h 0010A140h 04h 03h 802009h Comentarios Familia 16, Model 2, Stepping 2 Desconocido (muestra de ingeniera) L1 D-TLB: 4 MB pginas, 24 entradas, completa asociatividad L1 I-TLB: 4 MB pginas, 8 entradas, completa asociatividad L1 D-TLB: pginas de 4 KB, 48 entradas, una completa relacin L1 I-TLB: 4 MB pginas, 32 entradas, una completa relacin L1 cache-D: 64 KB, 2-way Asociacin, la lnea de 64 bytes. L1 cache-I: 64 KB, 2-way Asociacin, de 64 bytes de lnea. L2 D-TLB : 4 MB pginas, 64 entradas, 2-way asoc. L2 I-TLB: 4 MB pginas, no es compatible L2 D-TLB: pginas de 4 KB, 512 entradas, de 4 vas asoc. L2 I-TLB: 4 -KB pginas, 512 entradas, de 4 vas asoc. cach L2: 512 KB, de 16 vas Asociacin, la lnea de 64 bytes. cach L3: 2048 KB, de 32 vas Asociacin, la lnea de 64 bytes. 4 procesadores lgicos 4 ncleos Bit 0: SSE3 Bit 3: MONITOR / MWAIT instrucciones Bit 13: CMPXCHG16B instruccin Bit 23: instruccin POPCNT Bit 26: Apoyo a las pginas de memoria de 1 GB Bit 27: instruccin RDTSCP

Cache / TLB descriptores

Nmero de procesadores lgicos Nmero de ncleos Caractersticas bsicas, ECX Caractersticas extendidas, EDX

EFD3FBFFh

Caractersticas extendidas, ECX

07FFh

Bit 0: LAHF / SAHF instrucciones Bit 1: Multi-ncleo del procesador Bit 2: SVM mejoras (Modo Virtual Segura) Bit 3: Ampliacin de espacio APIC Bit 4: MOV CR8 instruccin Bit 5: manipulacin de bits (Advanced instruccin LZCNT) Bit 6: SSE4A (EXTRQ, INSERTQ, MOVNTSS, instrucciones MOVNTSD) Bit 7: sin alinear el modo SSE Bit 8: 3DNow! prefetch instrucciones (prefetch y PREFTECHW) Bit 9: OS Solucin visible Bit 10: Muestreo de Instruccin Basada

Instruccin de tipo (tamao, Byte) NOP (1) SUB (2) XOR (2) prueba (2) XOR / ADD (2) CMP 1 (2) CMP 2 (4) CMP 3-6 (6) prefijado CMP 1-4 (8)

Decode / ejecucin de ancho de banda, bytes / ciclo (instrucciones / ciclo) Phenom L1 I-cache Cach de nivel 2 3,00 (3,00) 3,78 (1,89) 3,78 (1,89) 3,78 (1,89) 3,78 (1,89) 3,78 (1,89) 3,78 (0,95) 3,78 (0,63) 3,78 (0,47) De cach L3 1,88 (1,88) 1,99 (0,99) 1,99 (0,99) 1,99 (0,99) 1,99 (0,99) 1,99 (0,99) 1,99 (0,50) 1,99 (0,33) 1,99 (0,25) 3,00 (3,00) 6,00 (3,00) 6,00 (3,00) 6,00 (3,00) 6,00 (3,00) 6,00 (3.00) 11.99 (3.00) 17.97 (3.00) 23.22 (2.90)

Tabla 8

Memorias cache: MCa1, MCa2, MCa3 Otras caractersticas.


Procesador

Tiene cach L3 compartida para un acceso ms rpido a los datos (y as no depender tanto de la propia latencia de la RAM), adems de compatibilidad de infraestructura de los socket AM2, AM2+ y AM3 para permitir un camino de actualizacin sin sobresaltos. AMD Phenom X4 Balanced Smart Cache De cach L3 compartida Adems de los 512 K de cach L2 por ncleo, hasta 2 MB de cach L3 compartida por hasta 4 ncleos. Beneficio: acorta el tiempo de acceso a los datos muy visitada para un mejor rendimiento. AMD Balanced Smart Cache

AMD Phenom X4
Tamao del cache L1 (KB) L1 Conde cach Tamao del cache L2 (KB) Cach L2 Conde Tamao del cache L3 (KB) 128 4 512 4 2048

Procesador AMD Phenom X3 Tamao del cache L1 (KB) L1 Conde cach Tamao del cache L2 (KB) Cach L2 Conde Tamao del cache L3 (KB) 128 3 512 3 2048

De cach L3 compartida Adems de los 512 K de cach L2 por ncleo, hasta 2 MB de cach L3 compartida por hasta tres ncleos. Beneficio: acorta el tiempo de acceso a los datos muy visitada para un mejor rendimiento.

Descripcin del pipeline


. Segmentacin (Pipeline) Consiste en descomponer la ejecucin de cada instruccin en varias etapas para poder empezar a procesar una instruccin diferente en cada una de ellas y trabajar con varias a la vez. Ejemplo sin segmentacin: segmentacin Phenom X4 En el caso del procesador DLX podemos encontrar las siguientes etapas en una instruccin:

IF: bsqueda ID: decodificacin EX: ejecucin de unidad aritmtico lgica MEM: memoria WB: escritura

Cada una de estas etapas de la instruccin usa en exclusiva un hardware determinado del procesador, de tal forma que la ejecucin de cada una de las etapas en principio no interfiere en la ejecucin del resto. En el caso de que el procesador no pudiese ejecutar las instrucciones en etapas segmentadas, la ejecucin de la siguiente instruccin slo se podra llevar a cabo tras la finalizacin de la primera. En cambio en un procesador segmentado, salvo excepciones de dependencias de datos o uso de unidades funcionales, la siguiente instruccin podra iniciar su ejecucin tras acabar la primera etapa de la instruccin actual.

Unidades funcionales(nmero y caractersticas).


Mnimo de latencia D-Cache/Memory Vamos a evaluar latencias mnimas de los diferentes niveles de D-Cach. Se parece a un pedazo de la torta, pero prefetch hardware en todos los niveles hace que esta tarea mucho ms difcil.

Imagen 4. L1 mnima latencia de la cach L1 D-Cach es el caso ms sencillo, sus latencias son publicados en el Cuadro 4. Es igual a la latencia media de este nivel de cach, de 3 ciclos (ver Tabla 5).

Imagen 5. Mnimo de latencia de cach L2, un mtodo Un intento de evaluar la latencia mnima de cach de nivel 2 de la misma manera no da buenos resultados - la situacin se complica por el prefetch hardware (ver Figura 5). Se descarga la cach L2 por completo ya con cinco NOP (no hay acceso a la cach) entre dos llamadas, y su latencia se reduce prcticamente al nivel de cach L1, aproximadamente 3.3 ciclos. Pseudoaleatorios paseos requieren 16 NOP, y la latencia mnima es de aproximadamente 8.2 ciclos. Paseos aleatorios requieren no menos de 30 NOP para descargar la memoria cach, y la latencia mnima es de 11,5 ciclos - que es el ms cercano resultado de lo que esperbamos despus de leer la documentacin (9 ciclos adicionales de latencia en comparacin con L1, que es la latencia total es de 12 ciclos ).

Imagen 6. Mnimo de cach L2 de latencia, el mtodo 2 Vamos a evaluar la latencia mnima de cach L2 y obtener su valor real, utilizando el mtodo 2 (ver Figura 6). Fue desarrollado inicialmente para los procesadores con la carga de datos especulativos (Intel Pentium 4 Prescott y los productos ms antiguos). Una medida de la latencia de este mtodo es el nmero de NOP utilizado para descargar el bus (que produce una inflexin en la curva), multiplicado por su velocidad de ejecucin de la cadena depende de las instrucciones (que es una instruccin por ciclo en nuestros procesadores de bajo revisin). Inflexiones en adelante, atrs, y las curvas de pseudoaleatorios se puede ver en tres NOP, que es la latencia mnima de estos niveles es igual a L1 latencia (3 ciclos), debido a prefetch hardware. Slo camina al azar dar los valores correctos de la L2 sin latencia prefetch - la inflexin de la curva correspondiente a los 12 ciclos. Curiosamente, las cuatro curvas se cruzan en el punto de 12 NOP. Vamos a mostrar a continuacin que este punto puede ser un criterio ms fiable para llegar a la latencia real de un nivel de cach de datos dado.

Imagen 7. Mnimo de cach L3 de latencia, el mtodo 1 Vamos a tratar de evaluar la latencia mnima de cach L3 de los procesadores Phenom, por analoga con las pruebas de latencia L2. Vamos a utilizar una prueba modificada del "Minimal D L2-Cache de latencia, Mtodo 1/Method 2", al aumentar el tamao del bloque de 96 KB de 1024 KB (para llegar al L3). Los resultados de esta prueba (mtodo 1) se publican en la figura 7. De la misma manera, camina hacia adelante y hacia atrs necesidad de 24 o ms NOP para descargar de cach L3, lo que lleva a su latencia mnima efectiva de 5,0 a 5,5 ciclos. Sin embargo, el autobs prcticamente no pueden ser descargados en el caso de pseudo-aleatorios caminatas, y una latencia mnima (~ 28,2 ciclos) no difiere mucho de su valor medio (~ 32 ciclos). Lo mismo se puede decir sobre el modo de acceso aleatorio, cuando la latencia mnima es de aproximadamente 46,7 ciclos.

Imagen 8. Mnimo de cach L3 de latencia, el mtodo 2

Vamos a probar el mtodo 2 para obtener un valor ms exacto de la L3 de latencia. Sus resultados se publican en la figura 8. Como en el caso de cach L2, hardware prefetch es igual a la efectiva latencia L3 para adelante, hacia atrs, y pseudoaleatorios camina hacia L1 latencia (3 ciclos). En teora, este resultado es correcto - en el caso de prefetch hardware totalmente eficaz (y el bus de datos descargados por completo) todos los datos solicitados sern en cach L1, y la latencia efectiva ser igual a las latencias de este nivel de cach. Adems, un punto de inflexin en la curva de acceso aleatorio (cuando la eficiencia de captacin previa de hardware es cercana a cero) es bastante confuso - la curva poco a poco crece el nmero de NOP, hay un aumento en 44-48 NOP. En este mismo caso el punto de cruce de todas las curvas es un criterio ms fiable de la verdadera latencia L3, a unos 48-49 NOP. Teniendo en cuenta los datos anteriores, en promedio L3 de latencia, la latencia real de este nivel de cach es de 48 ciclos (B 1 ciclo).

Imagen 9. La latencia de memoria mnima En conclusin, vamos a evaluar la latencia de la memoria mnima de la plataforma Phenom X4. Al igual que en todos los casos antes mencionados, prefetch hardware se reduce a valores muy bajos para los paseos hacia adelante y hacia atrs (4,6 a 5,4 ns, que es slo 11-13 ciclos). Sin embargo, las latencias mnimo demostrado en caminatas pseudo-aleatorios y al azar estn prcticamente en el nivel de latencia media. Por el contrario, descargan L2-RAM de autobuses en la plataforma Athlon 64 X2 reduce la latencia de acceso aleatorio (de 86 ns a 74 ns, que es aproximadamente un 14%).

Reorder buffer: caractersticas


AMD Phenom X3 de Tres Ncleos
Controlador DDR2 DRAM integrado con AMD Tecnologa de la Memoria del optimizador Un gran ancho de banda, baja latencia integrado un controlador de memoria DDR2 Soporta PC2-8500 (DDR2-1066), PC2-6400 (DDR2-800), PC2-5300 (DDR2-667), PC2-4200 (DDR2-533) o PC2-3200 (DDR2-400) sin bfer SDRAM DIMM Soporte para 64-bit de memoria DDR2 SDRAM Hasta 17.1GB / s de ancho de banda de memoria Beneficio: Acceso rpido a la memoria del sistema para un mejor rendimiento.}

AMD Phenom X4 Quad-Core


Controlador DDR2 DRAM integrado con AMD Tecnologa de la Memoria del optimizador Un gran ancho de banda, baja latencia integrado un controlador de memoria DDR2 Soporta PC2-8500 (DDR2-1066), PC2-6400 (DDR2-800), PC2-5300 (DDR2-667), PC2-4200 (DDR2-533) o PC2-3200 (DDR2-400) sin bfer SDRAM DIMM Soporte para 64-bit de memoria DDR2 SDRAM Hasta 17.1GB / s de ancho de banda de memoria Beneficio: Acceso rpido a la memoria del sistema para un mejor rendimiento.

Tratamiento de Load/Store.
Configuraciones de banco de pruebas Banco de pruebas N 1: AMD AM2 CPU: AMD Athlon 64 X2 5200 + (2.6 GHz, CPUID 40F32h, Windsor ncleo rev F2). Chipset: NVIDIA nForce 590 SLI Placa base: Asus Crosshair, BIOS 0702 de fecha 06/20/2007 Memoria: 2x1 GB Corsair XMS2-6400 DDR2-800, 5-5-5-18 tiempos Banco de pruebas N 2: AMD AM2 + CPU: AMD Phenom X4 9700 (muestra de ingeniera, de 2,4 GHz, CPUID 100F22h, Barcelona ncleo rev B2). Chipset: AMD 790FX Placa madre: MSI K9A2 Platinum, BIOS V1.1B3 fecha 11/16/2007

Prestaciones (versin de mxima velocidad).


Procesador Modelo OPN bandeja OPN PIB Modo operativo de 32 bits Modo de funcionamiento de 64 bits Revisin Velocidad del ncleo (MHz) Voltajes Max Temps (C) Potencia AMD Virtualization Technology Tamao del cache L1 (KB) L1 Conde cach Tamao del cache L2 (KB) Cach L2 Conde Tamao del cache L3 (KB) CMOS Enchufe AMD Business Class AMD Phenom X4 9950 HD995ZXAJ4BGH HD995ZXAGHBOX S S B3 2600 1.05-1.30 61'C 125 W S 128 4 512 4 2048 65nm SOI AM2 + No

Prestaciones SPEC actualizadas (otras medidas, si no se dispone de SPEC).


Procesador AMD Phenom X4 Modelo OPN bandeja OPN PIB Modo operativo de 32 bits Modo de funcionamiento de 64 bits Revisin Velocidad del ncleo (MHz) Voltajes Max Temps (C) Potencia AMD Virtualization Technology Tamao del cache L1 (KB) L1 Conde cach Tamao del cache L2 (KB) Cach L2 Conde Tamao del cache L3 (KB) CMOS Enchufe AMD Business Class Negro Edition 9450e HD9450ODJ4BGH HD9450ODGHBOX S S B3 2100 1.0-1.125 70'C 65 W S 128 4 512 4 2048 65nm SOI AM2 + No No Modelo OPN bandeja OPN PIB Modo operativo de 32 bits Modo de funcionamiento de 64 bits Revisin Velocidad del ncleo (MHz) Voltajes Max Temps (C) Potencia AMD Virtualization Technology Tamao del cache L1 (KB) L1 Conde cach Tamao del cache L2 (KB) Cach L2 Conde Tamao del cache L3 (KB) CMOS Enchufe AMD Business Class Negro Edition Procesador AMD Phenom X3 8750 HD875ZWCJ3BGH HD875ZWCGHBOX S S B3 2400 1.05-1.25V 71 ' 95 W S 128 3 512 3 2048 65nm SOI AM2 + No S

Potencia consumida.
Procesador AMD Phenom X4 Procesador AMD Phenom X3

Potencia 65 W
Consumo de energa ( TDP ): 65, 95, 125 y 140 vatios AMD PowerNow! Technology (Tecnologa Cool'n'Quiet ) Funciones mejoradas de administracin de energa que ajusta automtica e instantneamente los estados de rendimiento y caractersticas basadas en los requisitos de rendimiento del procesadorPara un funcionamiento ms silencioso y reduccin de las necesidades de energa Beneficio: Permite diseos de plataforma con menos calor y el rendimiento eficiente del ruido y el consumo de energa. AMD CoolCore Reduce el consumo de energa al desactivar las partes no utilizadas del procesador. Por ejemplo, el controlador de memoria puede desactivar la lgica de escritura cuando lee de la memoria, ayudando a reducir la potencia del sistema.Funciona de forma automtica sin necesidad de drivers o activacin del BIOS.El

Potencia 95 W
Consumo de energa ( TDP ): 65 y 95 vatios AMD PowerNow! Technology (Tecnologa Cool'n'Quiet ) Funciones mejoradas de administracin de energa que ajusta automtica e instantneamente los estados de rendimiento y caractersticas basadas en los requisitos de rendimiento del procesador Para un funcionamiento ms silencioso y reduccin de las necesidades de energa Beneficio: Permite diseos de plataforma con menos calor y el rendimiento eficiente del ruido y el consumo de energa. AMD CoolCore Reduce el consumo de energa al desactivar las partes no utilizadas del procesador. Por ejemplo, el controlador de memoria puede desactivar la lgica de escritura cuando lee de la memoria, ayudando a reducir la potencia del sistema. Funciona de forma automtica sin necesidad de drivers o activacin del BIOS.

poder puede ser activada o desactivada en un solo ciclo El poder puede ser activada o desactivada en un solo ciclo de reloj, ahorrando energa sin comprometer el de reloj, ahorrando energa sin comprometer el rendimiento rendimiento comprometida. comprometida. Beneficio: Ayuda a los usuarios obtener un rendimiento Beneficio: Ayuda a los usuarios obtener un rendimiento ms eficaz activando dinmicamente o desactivando ms eficaz activando dinmicamente o desactivando partes partes del procesador. del procesador. Dual Dynamic Power Management Permite a las capacidades de gestin de alimentacin ms granular para reducir el consumo de energa del procesador.Separa los planos de energa para los ncleos y el controlador de memoria, por el consumo de energa y un rendimiento ptimos, la creacin de ms oportunidades de ahorro de energa dentro de los ncleos y el controlador de memoria. Beneficio: Ayuda a mejorar la eficiencia de la plataforma proporcionando un rendimiento de la demanda de memoria mientras se sigue permitiendo la disminucin en el consumo de energa del sistema.

No fue posible encontrar la siguiente informacin.

*(Tratamiento de saltos Estaciones de reserva (nmero y


caractersticas) Tcnica de renombrado)

Bibliografa: Listado completo de referencias utilizadas: libros, artculos, pginas web, etc.
http://www.zdnet.com/blog/hardware/amd-dual-core-kuma-phenom-x2-spec-in-the-wild/2458 http://www.chw.net/foro/procesadores-f34/231825-amd-athlon-x2-7750-be-kuma-users-p14.html http://en.wikipedia.org/wiki/List_of_AMD_Phenom_microprocessors http://www.google.es/search?hl=es&tbm=isch&sa=1&q=amd+phenom+X2+Kuma+12+2008&pbx=1&oq=amd+ phenom+X2+Kuma+12+2008&aq=f&aqi=&aql=&gs_sm=e&gs_upl=53942l54802l0l55067l3l3l0l0l0l0l0l0ll0l0&bav =on.2,or.r_gc.r_pw.&biw=1366&bih=677&ech=2&psi=bZVmTsvxAsWDsgLe14HRCQ.1315356815998.1&emsg=N CSR&noj=1&ei=M8BmTrKdCumFsAL7-82rCg http://www.google.es/#sclient=psy&hl=es&source=hp&q=amd+Phenom+X2+kuma+&pbx=1&oq=amd+Phenom +X2+kuma+&aq=f&aqi=&aql=&gs_sm=e&gs_upl=5039l44393l0l44626l4l4l0l0l0l0l1947l1947l81l1l0&bav=on.2,or.r _gc.r_pw.&fp=e50a1b7c477e2e8b&biw=1366&bih=641 http://en.wikipedia.org/wiki/AMD_K10 http://products.amd.com/enus/DesktopCPUDetail.aspx?id=488&f1=&f2=&f3=&f4=&f5=&f6=&f7=&f8=&f9=&f 10=&f11=&f12= http://ixbtlabs.com/articles3/cpu/rmma-phenom.html

You might also like