Professional Documents
Culture Documents
Copyright 2011, Oracle y/o sus subsidiarias. Todos los derechos reservados. Este software y la documentacin relacionada estn sujetos a un contrato de licencia que incluye restricciones de uso y revelacin, y se encuentran protegidos por la legislacin sobre la propiedad intelectual. A menos que figure explcitamente en el contrato de licencia o est permitido por la ley, no se podr utilizar, copiar, reproducir, traducir, emitir, modificar, conceder licencias, transmitir, distribuir, exhibir, representar, publicar ni mostrar ninguna parte, de ninguna forma, por ningn medio. Queda prohibida la ingeniera inversa, el desensamblaje o la descompilacin de este software, a no ser que la ley lo requiera por motivos de interoperatividad. La informacin aqu contenida est sujeta a modificaciones sin previo aviso y no se garantiza que est exenta de errores. Si detecta algn error, le agradeceremos que nos lo comunique por escrito. Si este software o la documentacin relacionada se entrega al Gobierno de EE.UU. o a cualquier entidad que adquiera licencias en nombre del Gobierno de EE.UU. se aplicar la siguiente disposicin: U.S. GOVERNMENT RIGHTS Programs, software, databases, and related documentation and technical data delivered to U.S. Government customers are "commercial computer software" or "commercial technical data" pursuant to the applicable Federal Acquisition Regulation and agency-specific supplemental regulations. As such, the use, duplication, disclosure, modification, and adaptation shall be subject to the restrictions and license terms set forth in the applicable Government contract, and, to the extent applicable by the terms of the Government contract, the additional rights set forth in FAR 52.227-19, Commercial Computer Software License (December 2007). Oracle America, Inc., 500 Oracle Parkway, Redwood City, CA 94065. Este software o hardware se ha desarrollado para uso general en diversas aplicaciones de administracin de la informacin. No se ha diseado ni est destinado para utilizarse en aplicaciones de riesgo inherente, incluidas las aplicaciones que pueden causar daos personales. Si este software o hardware se emplea en aplicaciones peligrosas, ser de su responsabilidad la toma de medidas adecuadas de recuperacin de fallos, copia de seguridad, redundancia y otras encaminadas a garantizar un uso seguro. Oracle Corporation y sus filiales rechazan cualquier responsabilidad por daos provocados por el uso de este software o hardware en aplicaciones peligrosas. Oracle y Java son marcas comerciales registradas de Oracle y/o sus filiales. Todos los dems nombres pueden ser marcas comerciales de sus respectivos propietarios. AMD, Opteron, el logotipo de AMD y el logotipo de AMD Opteron son marcas comerciales o marcas comerciales registradas de Advanced Micro Devices. Intel e Intel Xeon son marcas comerciales o marcas comerciales registradas de Intel Corporation. Todas las marcas registradas SPARC se usan bajo licencia y son marcas comerciales o marcas registradas de SPARC International, Inc. UNIX es una marca comercial registrada con licencia a travs de X/Open Company, Ltd. Este software o hardware y su documentacin pueden proporcionar acceso o informacin sobre contenidos, productos y servicios de terceros. Oracle Corporation y sus filiales no aceptan ninguna responsabilidad, ni otorgan ninguna garanta de ningn tipo con respecto a los contenidos, productos y servicios de terceros. Oracle Corporation y sus subsidiarias no se harn responsables de las prdidas, los costos o los daos en los que se incurra como consecuencia del acceso o el uso de contenidos, productos o servicios de terceros.
Contenido
vii viii 1
1.
Introduccin a las herramientas de diagnstico Acerca de las herramientas de diagnstico Estrategia de diagnstico
2 2
Procesador de servicio
3 3
Diagnsticos basados en el sistema operativo sin conexin Diagnsticos basados en el sistema operativo en lnea Herramientas de diagnstico para servidores de Oracle POST de la BIOS U-Boot Pc-Check Oracle VTS 5 6 6 7 5 5 4
iii
Uso de las herramientas de diagnstico para la solucin de problemas de un servidor 9 Situaciones de solucin de problemas Cobertura de la prueba de diagnstico 9 14 14
Informacin general sobre pruebas de inicio de diagnstico U-Boot Opciones de prueba de diagnstico de servidor en el inicio 16
16
Modos de prueba de diagnstico U-Boot: normal, quick (rpido) y extended (ampliado) 18 Notificacin de fallos de diagnstico en el inicio del servidor Ejecucin de las pruebas de diagnstico U-Boot Antes de empezar
19
21
21
Modo Extended (ampliado) de U-Boot: ejemplo de resultado de la prueba Variables de entorno del SP de ejemplo que muestran el estado de la prueba U-Boot 30 3. Utilidad de diagnstico Pc-Check 33 34
35 35
Para acceder a Pc-Check mediante la interfaz web de Oracle ILOM Para acceder a Pc-Check mediante la CLI de Oracle ILOM 38 38 37
Opciones del men System Information (informacin del sistema) Pruebas de diagnstico avanzado 40
iv
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
42
Opciones del men Immediate Burn-in Testing (pruebas de ejecucin inmediata) 44 Pruebas de todo el sistema
44 46
Para crear y guardar secuencias de comandos para las pruebas de ejecucin aplazada 47 48
Opciones del men Show Results Summary (mostrar resumen de resultados) 48 Impresin de informe de resultados Acerca de Pc-Check Salida hacia DOS ndice 51 50 50 50
Contenido
vi
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Descargas de producto en la pgina vii Documentacin y comentarios en la pgina ix Asistencia tcnica y formacin en la pgina x
Descargas de producto
Puede encontrar descargas para todos los servidores y mdulos de servidor de Oracle x86 (tarjetas modulares) en My Oracle Support (MOS). En MOS, encontrar dos tipos de descargas:
Paquetes de versiones de software especficos de un servidor montado en bastidor, un mdulo de servidor, un sistema modular (chasis con tarjetas modulares) o un mdulo Network Express (NEM). Estos paquetes de versiones de software incluyen Oracle Integrated Lights Out Manager (ILOM), el Asistente de instalacin de hardware de Oracle, as como software y firmware de otras plataformas. Software independiente que es comn en varios tipos de hardware. Este software comprende el paquete de administracin de hardware y los conectores de administracin de hardware.
vii
viii
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Documentacin y comentarios
Para obtener una descripcin del documento creado para el servidor x86 de Oracle, consulte la Gua de primeros pasos que se suministra con el servidor y que tambin est publicada en el sitio de la documentacin de producto. Entre en la URL siguiente, vaya a la pgina del producto y haga clic en la ficha Documentation (documentacin): (http://www.oracle.com/technetwork/documentation/oracle-x86servers-190077.html)
Documentacin Vnculo
Toda la documentacin de Oracle Oracle Integrated Lights Out Manager (Oracle ILOM) 3.0
(http://www.oracle.com/documentation)
(http://www.oracle.com/pls/topic/lookup?ctx=E1986001&id=homepage)
ix
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
CAPTULO
Acerca de las herramientas de diagnstico en la pgina 1 Estrategia de diagnstico en la pgina 2 Herramientas de diagnstico para servidores de Oracle en la pgina 5 Uso de las herramientas de diagnstico para la solucin de problemas de un servidor en la pgina 9
En el encendido inicial para asegurar que el servidor sea estable antes de cargar el sistema operativo (SO). Despus de la ejecucin del SO para aislar errores que puedan aparecer durante el tiempo de ejecucin o para realizar pruebas ms exhaustivas en todo el servidor que se puedan ejecutar antes de instalar un SO. Durante las pruebas en tiempo de ejecucin para supervisar el estado del servidor.
1
Estrategia de diagnstico
En esta seccin se proporcionan varias estrategias de diagnstico. Esta seccin contiene los siguientes temas:
Para diagnosticar problemas en el servidor en la pgina 2 Procesador de servicio en la pgina 2 Diagnsticos independientes basados en paquetes en la pgina 3 Diagnsticos basados en el sistema operativo sin conexin en la pgina 3 Diagnsticos basados en el sistema operativo en lnea en la pgina 4
Procesador de servicio en la pgina 2 Diagnsticos independientes basados en paquetes en la pgina 3 Diagnsticos basados en el sistema operativo sin conexin en la pgina 3 Diagnsticos basados en el sistema operativo en lnea en la pgina 4
Procesador de servicio
El SP de Oracle Integrated Lights Out Manager (Oracle ILOM) utiliza Linux. El primer cdigo ejecutado por el SP es un pequeo cargador de inicio conocido como U-Boot. El cdigo U-Boot realiza funciones similares a la autocomprobacin de encendido de la BIOS (POST), ya que inicia dispositivos, con muy pocas pruebas, e inicia el ncleo de Linux.
2 Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Captulo 1
Nota Oracle no espera que los clientes ejecuten diagnsticos del SO en lnea, porque dichos diagnsticos utilizan los recursos del equipo y tienen una eficacia limitada debido a su incapacidad para bloquear recursos. La arquitectura de administracin de errores elimina la necesidad de realizar diagnsticos en lnea.
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
POST de la BIOS en la pgina 5 U-Boot en la pgina 5 Pc-Check en la pgina 6 Oracle VTS en la pgina 6 Utilidad Snapshot en la pgina 8
POST de la BIOS
A partir del momento en que se conecta el subsistema del host y empieza a ejecutar cdigo, el cdigo de la BIOS se ejecuta. La secuencia en la que la BIOS pasa del primer punto en que se ejecuta el cdigo al punto en que se inicia el sistema operativo se conoce como POST (Power-on Self-test, autocomprobacin de encendido). El POST funciona junto con otros procesos para finalizar la inicializacin del sistema del host antes del inicio. Durante el proceso de inicializacin del host, si se producen errores, se comunican al procesador de servicio (SP) para su anlisis y registro. Para obtener ms informacin, consulte el apartado Administracin de errores de la Gua de procedimientos para la administracin diaria de Oracle Integrated Lights Out Manager (ILOM) 3.0, ubicada en: (http://download.oracle.com/docs/cd/E19860-01/index.html)
U-Boot
Al iniciar el servidor, el software de diagnstico U-Boot se inicia en el servidor y prueba aspectos del SP del servidor antes de iniciar el firmware de Oracle ILOM. Las pruebas de diagnstico U-Boot estn diseadas para probar el hardware requerido para que el SP del servidor se inicie correctamente. Entre los componentes de hardware que somete a prueba el diagnstico U-Boot se encuentran:
Captulo 1
Para obtener ms informacin sobre la finalidad y la utilizacin del software de diagnstico U-Boot, consulte el Captulo 2. Para obtener instrucciones sobre la ejecucin de U-Boot, consulte Ejecucin de las pruebas de diagnstico U-Boot en la pgina 21.
Pc-Check
Los diagnsticos del servidor pueden encontrarse en la utilidad Pc-Check basada en DOS . Puede acceder a esta utilidad desde Oracle ILOM si el servidor incluye un procesador de servicio (SP). Para algunos productos, se puede acceder a esta utilidad y ejecutarla desde el DVD de herramientas y controladores del servidor. Pc-Check prueba todos los componentes de la placa base (CPU, memoria y E/S), los puertos y las ranuras. Cuando est habilitada, esta utilidad se ejecuta al encenderse el host. La utilidad Pc-Check est inhabilitada de forma predeterminada en Oracle ILOM. Si se encuentra con algn mensaje de error relacionado con el hardware (como errores de memoria o de disco duro) en el servidor, ejecute una de las siguientes pruebas:
Prueba de diagnstico avanzado: una prueba especfica para componentes de hardware. Prueba de ejecucin inmediata: una secuencia de comandos de prueba de diagnstico de servidor.
Para obtener ms informacin sobre la finalidad y la utilizacin del software de diagnstico Pc-Check, consulte el Captulo 3. Para obtener instrucciones sobre cmo acceder al software de diagnstico Pc-Check, consulte Acceso a la utilidad de diagnstico Pc-Check en la pgina 35.
Oracle VTS
El software Oracle VTS [Oracle Validation Test Suite (conjunto de pruebas de validacin de Oracle), anteriormente conocido como SunVTS] prueba y valida el hardware de Oracle mediante la verificacin de la conectividad y la funcionalidad de los dispositivos, los controladores y los perifricos de hardware. Puede utilizar Oracle VTS para garantizar el correcto funcionamiento de todos los servidores sometidos a prueba y de su hardware subyacente. Induce, detecta e identifica los fallos de hardware y se usa tanto para la validacin del hardware como para la verificacin de la reparacin.
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Prueba de CD/DVD (cddvdtest) Prueba de CPU (cputest) Prueba criptogrfica (cryptotest) Pruebas de unidades de disco y disquete (disktest) Prueba de bfer de lista de traduccin de datos (dtlbtest) Prueba de HBA de Emulex (emlxtest) Prueba de unidad de punto flotante (fputest) Prueba de adaptador de canal de host de InfiniBand (ibhcatest) Prueba de memoria cach de datos de nivel 1 (l1dcachetest) Prueba de SRAM de nivel 2 (l2sramtest) Prueba de bucle invertido de Ethernet (netlbtest) Prueba de hardware de red (nettest) Prueba de memoria fsica (pmemtest) Prueba de adaptador de bus de host QLogic (qlctest) Prueba de RAM (ramtest) Prueba de puerto de serie (serialtest) Prueba de sistema (systest) Prueba de unidad de cinta (tapetest) Prueba para placa de serie universal (usbtest) Prueba para memoria virtual (vmemtest)
El software Oracle VTS dispone de una sofisticada interfaz grfica de usuario (GUI) que proporciona configuracin de pruebas y supervisin de estado. La interfaz de usuario se puede ejecutar en un servidor para mostrar las pruebas de Oracle VTS de otro servidor en la red. El software Oracle VTS tambin proporciona una interfaz en modo TTY para situaciones en las que sea imposible ejecutar una GUI.
Captulo 1
Utilidad Snapshot
El propsito de la utilidad Snapshot de Oracle ILOM es obtener datos para que el personal de los servicios de asistencia de Oracle pueda diagnosticar problemas. Esta utilidad le permite crear una instantnea del SP del servidor en cualquier momento.
Nota No ejecute esta utilidad a menos que lo solicite el personal de los servicios de asistencia de Oracle.
La utilidad Snapshot de Oracle ILOM obtiene datos de estado sobre el SP del servidor. La utilidad recopila archivos de registro, ejecuta varios comandos y obtiene su resultado, y enva el conjunto de datos como un archivo descargable a una ubicacin definida por el usuario.
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Situaciones de solucin de problemas en la pgina 9 Cobertura de la prueba de diagnstico en la pgina 14 Configuracin de un servidor para pruebas en la pgina 14
Situacin 1. Instalaciones iniciales tpicas del servidor: no es necesario instalar opciones del servidor. Si el servidor se ha suministrado con todas las opciones de servidor que solicit instaladas, ejecute las pruebas de diagnstico antes de poner el servidor en funcionamiento. De este modo, podr comprobar que el servidor funcionar correctamente (el servidor podra haberse daado en el envo). Si las pruebas de diagnstico indican que el servidor tiene un componente defectuoso, comunique al vendedor (Oracle o el revendedor de Oracle) que se ha detectado un error en las pruebas iniciales del servidor y que debe repararse o sustituirse. Situacin 2. Instalaciones iniciales del servidor: las opciones de servidor se han suministrado por separado y deben instalarse. Si el servidor se ha suministrado con opciones que necesita instalar, ejecute las pruebas de diagnstico antes de instalarlas. Este paso garantiza que el servidor se ha suministrado en un buen estado de funcionamiento. Instale las opciones nicamente tras constatar que el servidor funcionar correctamente. Una vez instaladas las opciones, vuelva a ejecutar las pruebas de diagnstico para asegurarse de que el servidor funcionar correctamente con las opciones instaladas. A continuacin, puede poner el servidor en funcionamiento. Si las pruebas de diagnstico indican que una opcin instalada es defectuosa, quite la opcin y devulvala para que la sustituyan. Situacin 3. Actualizacin de un servidor: ha puesto en funcionamiento un servidor y, a continuacin, recibe una actualizacin o una opcin que debe instalarse. En este caso, desactive el servidor, ejecute las pruebas de diagnstico recomendadas, instale la actualizacin y ejecute las pruebas de diagnstico antes
Captulo 1
de volver a poner en funcionamiento el servidor. Si las pruebas de diagnstico indican que la actualizacin instalada es defectuosa, quite la actualizacin y devulvala para que la sustituyan.
Situacin 4. Un servidor en funcionamiento falla: ha puesto en funcionamiento un servidor y ha funcionado correctamente durante un periodo de tiempo pero luego se ha producido un error. En este caso, desactive el servidor, realice una inspeccin visual de los componentes internos del servidor para ver si puede detectar cualquier problema obvio, por ejemplo un complemento quemado o la acumulacin de polvo que impida la ventilacin de los componentes del servidor. En caso necesario, ejecute las pruebas de diagnstico recomendadas para identificar el componente defectuoso, quite y sustituya el componente defectuoso, vuelva a ejecutar las pruebas de diagnstico para asegurarse de que el servidor ha sido reparado y, a continuacin, ponga en funcionamiento el servidor.
Procedimiento
Situacin 1: instalaciones iniciales del servidor sin necesidad de instalar opciones de servidor
Antes de poner en funcionamiento un servidor, configure el sistema operativo del servidor y utilcelo para procesar datos; a continuacin, ejecute las pruebas de diagnstico siguientes para confirmar que el servidor se ha suministrado en un buen estado de funcionamiento: U-Boot Pc-Check Pruebas no superadas: si las pruebas mencionadas arriba identifican un error en el servidor, significa que el servidor result daado en el envo. Finalice el proceso de instalacin en este punto y comunique el problema al servicio de asistencia de Oracle. La realizacin de este procedimiento le garantiza que el servidor est cubierto por la garanta. Pruebas superadas: ponga el servidor en funcionamiento. Nota - Si se detecta un problema con la conectividad de la red al poner en funcionamiento el servidor por primera vez, asegrese de que el punto de acceso a la red para el servidor est activado.
10
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Procedimiento
Situacin 2: instalaciones iniciales del servidor sin necesidad de instalar opciones de servidor
Antes de instalar las opciones de servidor que se han suministrado por separado y poner en funcionamiento el servidor, configure el sistema operativo del servidor y utilcelo para procesar datos; a continuacin, ejecute las pruebas de diagnstico siguientes para confirmar que el servidor se ha suministrado en un buen estado de funcionamiento: U-Boot Pc-Check Pruebas no superadas: si las pruebas mencionadas arriba identifican un error en el servidor, significa que el servidor result daado en el envo. Finalice el proceso de instalacin en este punto y comunique el problema al servicio de asistencia de Oracle. La realizacin de este procedimiento le garantiza que el servidor est cubierto por la garanta. Pruebas superadas: si las pruebas anteriores demuestran que el servidor se ha suministrado en un buen estado de funcionamiento, siga los pasos siguientes antes de poner en funcionamiento el servidor: Nota - Si se detecta un problema con la conectividad de la red al poner en funcionamiento el servidor por primera vez, asegrese de que el punto de acceso a la red para el servidor est activado. 1. Instale las opciones de servidor que se han suministrado por separado. 2. Ejecute las pruebas de diagnstico U-Boot. 3. Ejecute las pruebas de diagnstico Pc-Check. Antes de instalar una actualizacin de servidor (memoria, unidades de disco duro, tarjetas de E/S o fuente de alimentacin), desactive el servidor y ejecute las pruebas de diagnstico para confirmar que el servidor se ha suministrado en un buen estado de funcionamiento. Siga este procedimiento: 1. Desactive el servidor. 2. Ejecute las pruebas de diagnstico U-Boot. 3. Ejecute las pruebas de diagnstico Pc-Check. 4. Instale la actualizacin del servidor. 5. Ejecute las pruebas de diagnstico U-Boot y Pc-Check. Pruebas no superadas: las pruebas de diagnstico identifican un fallo en un componente del servidor, que una de las opciones instaladas es defectuosa o que el servidor result daado cuando instal las opciones. En cualquier caso, quite y sustituya el componente defectuoso, vuelva a ejecutar las pruebas de diagnstico para confirmar que se ha solucionado el problema y ponga en funcionamiento el servidor. Pruebas superadas: ponga el servidor en funcionamiento. Nota - Si el componente que ha dado error no se puede sustituir en la placa base del servidor, puede devolver la placa base a Oracle para su reparacin o puede solicitar la sustitucin de la placa base y el servicio de asistencia tcnica autorizado lo sustituir en la instalacin.
Captulo 1
11
Procedimiento
Situacin 4: el servidor ha estado funcionando sin problemas durante mucho tiempo (por ejemplo, meses o aos) y el LED de asistencia tcnica requerida se enciende en el panel frontal del servidor
Proceda como sigue: 1. Antes de abrir la cubierta del servidor, examine el servidor y los archivos de registro del procesador de servicio de Oracle ILOM para los mensajes de error obvios y para los LED defectuosos. 2. Examine los componentes internos del servidor para detectar problemas obvios (componentes quemados, algo que pudiera impedir la correcta ventilacin de un componente de servidor, etc.). 3. Si en la inspeccin visual no detecta ningn componente defectuoso, ejecute las pruebas U-Boot y, a continuacin, las pruebas de diagnstico Pc-Check para identificar el componente que falla. 4. Si dichas pruebas no detectan el componente defectuoso, ejecute Oracle VTS. 5. Si el componente defectuoso es una unidad reemplazable por el cliente (CRU), sustityala. Las CRU se definen en el manual de servicio del modelo de servidor en particular. 6. Si el componente defectuoso es una unidad reemplazable en la instalacin (FRU), inicie una solicitud de asistencia de Oracle. Las FRU se definen en el manual de servicio del modelo de servidor en particular. Nota - Si el componente que ha dado error no se puede sustituir en la placa base del servidor, puede devolver la placa base a Oracle para su reparacin o puede solicitar la sustitucin de la placa base y el servicio de asistencia tcnica autorizado lo sustituir en la instalacin.
Precaucin Si no dispone de un componente de sustitucin para un componente defectuoso y desea poner en funcionamiento el servidor, antes de hacerlo, reemplace el componente defectuoso con un panel de relleno. Poner en funcionamiento el servidor sin un panel de relleno en un espacio de componente vaco podra provocar que el servidor se sobrecalentase y se cerrara.
12
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Procesador de servicio CPU/Memoria Concentrador E/S Concentrador de controlador de E/S Ventiladores Fuentes de alimentacin elctrica Unidades de almacenamiento Placa de unidades de almacenamiento Interfaz de la red
S No No No No No No No No
Cobertura parcial S S S S S S S S
Captulo 1
13
14
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
CAPTULO
Opciones de prueba de diagnstico de servidor en el inicio en la pgina 16 Modos de prueba de diagnstico U-Boot: normal, quick (rpido) y extended (ampliado) en la pgina 18 Notificacin de fallos de diagnstico en el inicio del servidor en la pgina 19 Antes de empezar en la pgina 22 Para seleccionar un modo de diagnstico U-Boot para ejecutar en el inicio en la pgina 22 Modo Normal de U-Boot: ejemplo de resultado de la prueba en la pgina 23 Modo Quick (rpido) de U-Boot: ejemplo de resultado de la prueba en la pgina 25 Modo Extended (ampliado) de U-Boot: ejemplo de resultado de la prueba en la pgina 26
Variables de entorno del SP de ejemplo que muestran el estado de la prueba U-Boot en la pgina 30
15
16
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
TABLA 2-1
Componente
SP del servidor
U-Boot -Normal mode (modo normal), que es el modo predeterminado Consulte Modos de prueba de diagnstico U-Boot: normal, quick (rpido) y extended (ampliado) en la pgina 18 para obtener ms informacin. U-Boot -Quick mode (modo rpido) Consulte Modos de prueba de diagnstico U-Boot: normal, quick (rpido) y extended (ampliado) en la pgina 18 para obtener ms informacin. U-Boot -Extended mode (modo ampliado) Consulte Modos de prueba de diagnstico U-Boot: normal, quick (rpido) y extended (ampliado) en la pgina 18 para obtener ms informacin.
No
No
No
BIOS power-on self-test (POST) [(autocomprobacin de encendido de la BIOS (POST)] Para obtener informacin sobre el POST de la BIOS, consulte el manual de servicio del servidor. Prueba Pc-Check de tres o treinta minutos Si necesita informacin detallada, consulte el Captulo 3.
No
No
Captulo 2
17
Nota Si alguna de las pruebas de diagnstico U-Boot falla durante el inicio, el SP del servidor no se iniciar. Consulte Notificacin de fallos de diagnstico en el inicio del servidor en la pgina 19 si necesita informacin detallada.
En la TABLA 2-2 se describen las pruebas de diagnstico U-Boot para cada uno de los tres modos de diagnstico de funcionamiento.
TABLA 2-2
Memory Data Bus Test (prueba de bus de datos de memoria) Memory Address Bus Test (prueba de bus de direccin de memoria) Memory Data Integrity Test (prueba de integridad de datos de memoria) Flash Test (prueba de flash) WatchDog Test (prueba WatchDog) I2C Probe Tests (pruebas de sondeo I2C)* Ethernet Test (prueba Ethernet)
Comprueba si hay elementos abiertos o insuficientes en el bus de datos de la memoria. Comprueba si hay elementos abiertos o insuficientes en el bus de direccin de la memoria del SP. Comprueba la integridad de los datos en la memoria del SP. Comprueba el acceso a Flash. Comprueba la funcionalidad de WatchDog en el SP. Comprueba la conectividad con los dispositivos I2C en modo inactivo. Comprueba la capacidad de lectura desde el puerto Ethernet especificado.
No
No
No No S S
No No No S
S S S S
18
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
TABLA 2-2
Ethernet Link Test (prueba de vnculo de Ethernet) Ethernet Internal Loopback Test (prueba de bucle invertido interno de Ethernet) Real Time Clock Test (prueba de reloj en tiempo real) USB 1.1 Test (prueba de USB 1.1) USB 1.1 BIST (BIST de USB 1.1) USB 2.0 Test (prueba de USB 2.0) BIOS Flash ID Test (prueba de ID de flash de la BIOS) Serial Presence Detect (SPD) Access Test [prueba de acceso de deteccin de presencia de serie (SPD)] Power CPLD Test (prueba de CPLD de encendido)
*
S S
S No
S S
Comprueba el vnculo en el PHY especificado. Comprueba la funcionalidad de Ethernet enviando y recibiendo paquetes. Comprueba la funcionalidad del reloj en tiempo real en el SP. Comprueba la funcionalidad del USB 1.1. Ejecuta la autocomprobacin incorporada del USB 1.1. interno (BIST). Comprueba la funcionalidad del USB 2.0. Comprueba la capacidad de lectura desde el flash de la BIOS. Comprueba el acceso del SPD de DIMM con la suma de comprobacin e imprime la informacin del SPD. Comprueba la correcta revisin de encendido del dispositivo lgico programable complejo (CPLD).
S No S No S No
No No No No No No
S S S S S S
Para los servidores montados en bastidor, las pruebas I2C comprueban la conectividad con todos los dispositivos I2C instalados en el chasis. Para los sistemas Sun Blade 6000 o 6048 Chassis Modular de Oracle, las pruebas I2C solo comprueban la conectividad de los dispositivos I2C instalados en un mdulo de servidor individual (tarjeta modular).
Captulo 2
19
Nota Para la solucin de problemas, tambin se almacena en las variables de entorno del SP un estado -Failed (no superado) o -Passed (superado) de la ltima prueba U-Boot realizada en el servidor. Para ver un resultado de ejemplo de las variables de entorno que muestran el estado de la prueba U-Boot, consulte Variables de entorno del SP de ejemplo que muestran el estado de la prueba U-Boot en la pgina 30.
Cuando solucione problemas en el servidor, tenga en cuenta que los sntomas de un fallo de diagnstico pueden variar dependiendo de si los diagnsticos del inicio han dado error en el servidor o en el host. Para obtener detalles adicionales sobre cmo determinar dnde han generado un error los diagnsticos en el inicio y poder localizar informacin adicional sobre el fallo, consulte la TABLA 2-3.
TABLA 2-3 Componente
Cuando se detecta el fallo del componente en el SP del servidor, normalmente el fallo se notifica en las ubicaciones siguientes: En los resultados de la prueba U-Boot Para obtener ejemplos de los resultados de la prueba U-Boot, consulte Resultados de ejemplo de la prueba U-Boot en la pgina 23. Registro de eventos de Oracle ILOM. Para obtener detalles sobre cmo acceder a este registro, consulte la informacin sobre el registro de eventos de Oracle ILOM en la Gua de conceptos para la administracin diaria de Integrated Lights Out Manager (Oracle ILOM) 3.0 de Oracle. Ficha Fault Management (administracin de errores) en la interfaz web de Oracle ILOM Para obtener ms informacin sobre el acceso y el uso de la administracin de errores, consulte la informacin sobre la administracin de errores de Oracle ILOM en la Gua de conceptos para la administracin diaria de Integrated Lights Out Manager (Oracle ILOM) 3.0 de Oracle. Para determinar qu fallos debe eliminar manualmente del servidor, consulte la Gua para la administracin suplementaria de Oracle ILOM de la plataforma correspondiente para el servidor. Si un componente da error en el inicio. el LED de asistencia tcnica requerida en el panel frontal del servidor parpadea. Si la prueba de diagnstico U-Boot da error, el SP del servidor no se iniciar.
20
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Cuando se detecta el fallo del componente en el host del servidor, normalmente se notifica en las ubicaciones siguientes: Ficha Fault Management (administracin de errores) en la interfaz web de Oracle ILOM Para obtener ms informacin sobre el acceso y el uso de la administracin de errores, consulte la informacin sobre la administracin de errores de Oracle ILOM en la Gua de conceptos para la administracin diaria de Integrated Lights Out Manager (Oracle ILOM) 3.0 de Oracle. Para determinar qu fallos debe eliminar manualmente en el servidor, consulte la Gua suplementaria de Oracle ILOM de la plataforma correspondiente al servidor. Registro de eventos de Oracle ILOM. Para obtener detalles sobre cmo acceder a este registro, consulte la informacin sobre el registro de eventos de Oracle ILOM en la Gua de conceptos para la administracin diaria de Integrated Lights Out Manager (Oracle ILOM) 3.0 de Oracle. Si un componente da error en el inicio, el LED de asistencia tcnica requerida en el panel frontal del servidor parpadea. Si la autocomprobacin de encendido de la BIOS (POST) ha detectado un error grave, el sistema operativo del host no se iniciar.
Antes de empezar
Todas las pruebas de diagnstico U-Boot son necesarias para la ejecucin desde una conexin de serie. Debe disponer de un hiperterminal o de una consola de serie de red o local conectada al servidor.
Captulo 2
21
Para obtener informacin sobre cmo conectar una consola de serie local al puerto de serie en el servidor, consulte la gua de instalacin del servidor. Para obtener informacin sobre cmo establecer una conexin de serie de red al SP, consulte la Gua de conceptos para la administracin diaria de Oracle Integrated Lights Out Manager (ILOM) 3.0.
Escriba n para habilitar las pruebas U-Boot en modo -Normal o deje que contine la cuenta atrs para que se ejecute en modo normal. Escriba q para habilitar las pruebas U-Boot en modo -Quick (rpido). Escriba x para habilitar las pruebas U-Boot en modo -Extended (ampliado).
4. Supervise los resultados de la prueba U-Boot de la conexin de consola de serie. Si se encuentra un fallo de diagnstico, el SP no se iniciar. Consulte Notificacin de fallos de diagnstico en el inicio del servidor en la pgina 19 para obtener ms informacin.
22
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Modo Normal de U-Boot: ejemplo de resultado de la prueba en la pgina 23 Modo Quick (rpido) de U-Boot: ejemplo de resultado de la prueba en la pgina 25 Modo Extended (ampliado) de U-Boot: ejemplo de resultado de la prueba en la pgina 26
Captulo 2
23
H/W: <product_name> Service Processor; SOC: AST2100 Rev. 02 ('A3') Bus Device Address Results ============================================ 1 Temp.Sensor (VM75)(U3006) 0x90 PASSED 2 Sys FRUID (U3003) 0xA0 PASSED 2 Power CPLD (U3301) 0x4E PASSED 2 CPU0 Fault LED's (U3001) 0x40 PASSED 2 CPU1 Fault LED's (U3002) 0x42 PASSED 2 PCA9555 (Misc) (U3005) 0x44 PASSED 2 DIMM IMAX (U3102) 0x12 PASSED 6 Bank Panel Led's (U2701) 0xC6 PASSED 6 DS1338(RTC)( U803) 0xD0 PASSED PWC_SP_Broken_OD = 0; ARM restart caused by: watch-dog ExtRst# pin I2C Probe Test - Chassis (2U) PDB Board: Bus Device Address Results ============================================ 1 PCA9548 Mux (U0202) 0xE0 PASSED 1 PDB FRUID (U0203) 0xAA PASSED 1 MAX7313 (U0201) 0x40P ASSED The host is OFF(S5) (hostWantsPwr=0, powerGood=0, Power Supply 0 Bus Device Address Results ============================================ 1 0 PS 0 FRUID ( - ) 0xAC PASSED 1 0 PS 0 CTRL (-) 0x7C PASSED allowPwrOn=0|0, outOfReset=0, fatalError=0). Power Supply 1 Bus Device Address Results ============================================ 1 1 PS 1 FRUID (-) 0xAC PASSED 1 1 PS 1 CTRL ( - ) 0x7C PASSED Reset straps=0x88819180, def. H-PLL=264 MHz, CPU/AHB=2:1, boot CS0# normal speed Fan Module 1 Bus Device Address Results ============================================ 1 2 FM 1 FRUID (U0203) 0xAC PASSED 1 2 FM 1 PCA9555 (U0201) 0x42 PASSED 1 2 FM 1 ADT7462 (U0202) 0xB8 PASSED PCI w/VGA noVBIOS; DRAM clock is M-PLL: 264 MHz (DDR2-528) Fan Module 0 Bus Device Address Results ============================================ 1 3 FM 0 FRUID (U0203) 0xAC PASSED 1 3 FM 0 PCA9555 (U0201) 0x42 PASSED 1 3 FM 0 ADT7462 (U0202) 0xB8 PASSED
24
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
DRAM: 128MB data - 8MB VGA, 32-bit noECC, 2 BA 10 CA, CL=4 BL=4 ap=1, 61440 us refr 6 Disk Backplane Bus Device Address Results ============================================ 1 4 BP MAX7313 (U1801) 0x44 PASSED 1 4 BP FRUID (U2102) 0xAC PASSED Paddle Card Bus Device Address Results Custom AST2100 U-Boot 2.0 (Jan 26 2009 - 10:29:26) r41480 <DIAGS> PHY #0 R/W Test ... PASSED <DIAGS> PHY #0 Link Status ... PASSED <DIAGS> ETHERNET PHY #0, Internal Loopback Test ... PASSED <DIAGS> USB 1.1 Test ... PASSED <DIAGS>Access to BIOS Flash ... PASSED <DIAGS> Testing PowerCPLD version ... PASSED Booting linux in 3 seconds... ============================================ DRAM: 119 MB 1 4 EXP FRUID (U0401) 0xAE PASSED Flash bank 0 at 10000000 has 0x2000000 bytes in 256 sectors (chipSize 1<<25, size_ratio 1). Flash: 32 MB readonly: ethaddr=00:14:4F:CA:B5:10 readonly: eth1addr=00:14:4F:CA:B5:11
Captulo 2
25
readonly: ethaddr=00:14:4F:CA:B5:10 Custom AST2100 U-Boot 2.0 (Jan 26 2009 - 10:29:26) r41480 Board Revision - cc Net: faradaynic#0, faradaynic#1 Enter Diagnostics Mode ['q'uick/'n'ormal(default)/e'x'tended(manufacturing mode)].....0 Diagnostics Mode - QUICK <DIAGS> Memory Data Bus Test ... PASSED <DIAGS> Memory Address Bus Test ... PASSED <DIAGS> PHY #0 R/W Test ... PASSED <DIAGS> PHY #0 Link Status ... PASSED <DIAGS> Testing PowerCPLD version ... PASSED Booting linux in 3 seconds... readonly: eth1addr=00:14:4F:CA:B5:11 DRAM: 119 MB VUART1 already enabled at port 0x03f8, SerIRQ[4] rise Flash bank 0 at 10000000 has 0x2000000 bytes in 256 sectors (chipSize 1<<25, size_ratio 1). Protecting U-Boot flash sectors; monitor_base=100a0000. Negating BIOS_TOP_BLOCK_LOCK signal. H/W: <product_name> Service Processor; SOC: AST2100 Rev. 02 ('A3') PWC_SP_Broken_OD = 0; ARM restart caused by: watch-dog ExtRst# pin The host is OFF(S5) (hostWantsPwr=0, powerGood=0, allowPwrOn=0|0, outOfReset=0, fatalError=0). Reset straps=0x88819180, def. H-PLL=264 MHz, CPU/AHB=2:1, boot CS0# normal speed PCI w/VGA noVBIOS; DRAM clock is M-PLL: 264 MHz (DDR2-528) DRAM: 128MB data - 8MB VGA, 32-bit noECC, 2 BA 10 CA, CL=4 BL=4 ap=1, 61440 us refr
26
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Negating BIOS_TOP_BLOCK_LOCK signal. <DIAGS> Memory Data Bus Test ... PASSED <DIAGS> Memory Address Bus Test ... PASSED <DIAGS> Testing 0MB to 24MB (TEXT_BASE - 7 MB) ... PASSED <DIAGS> Testing 32MB (TEXT_BASE + 1MB) to 128MB ... PASSED <DIAGS> Flash ID Test - Flash Bank 1 ... PASSED <DIAGS> Testing Watchdog ... PASSED H/W: <product_name> Service Processor; SOC: AST2100 Rev. 02 ('A3') I2C Probe Test - Motherboard Bus Device Address Results ============================================ 1 Temp. Sensor(LM75) (U3006) 0x90 PASSED 2 Sys FRUID (U3003) 0xA0 PASSED 2 Power CPLD (U3301) 0x4E PASSED 2 CPU0 Fault LED's (U3001) 0x40 PASSED 2 CPU1 Fault LED's (U3002) 0x42 PASSED 2 PCA9555 (Misc) (U3005) 0x44 PASSED 2 DIMM IMAX (U3102) 0x12 PASSED 6 Bank Panel Led's (U2701) 0xC6 PASSED 6 DS1338(RTC) ( U803) 0xD0 PASSED PWC_SP_Broken_OD = 0; ARM restart caused by: watch-dog ExtRst# pin I2C Probe Test - Chassis (2U) Bus Device Address Results ============================================ PDB Board 1 PCA9548 Mux (U0202) 0xE0 PASSED 1 PDB FRUID (U0203) 0xAA PASSED 1 MAX7313 (U0201) 0x40 PASSED The host is OFF(S5) (hostWantsPwr=0, powerGood=0, Power Supply 0 Bus Device Address Results ============================================ 1 0 PS 0 FRUID ( - ) 0xAC PASSED 1 0 PS 0 CTRL ( - ) 0x7C PASSED allowPwrOn=0|0, outOfReset=0, fatalError=0). Power Supply 1 Bus Device Address Results ============================================ 1 1 PS 1 FRUID ( - ) 0xAC PASSED 1 1 PS 1 CTRL ( - ) 0x7C PASSED Reset straps=0x88819180, def. H-PLL=264 MHz, CPU/AHB=2:1, boot CS0# normal speed Fan Module 1 Bus Device Address Results ============================================ 1 1 1 2 2 2 FM 1 FRUID (U0203) 0xAC PASSED FM 1 PCA9555 (U0201) 0x42 PASSED FM 1 ADT7462 (U0202) 0xB8 PASSED
Captulo 2
27
PCI w/VGA noVBIOS; DRAM clock is M-PLL: 264 MHz (DDR2-528) Fan Module 0 Bus Device Address Results ============================================ 1 3 FM 0 FRUID (U0203) 0xAC PASSED 1 3 FM 0 PCA9555 (U0201) 0x42 PASSED 1 3 FM 0 ADT7462 (U0202) 0xB8 PASSED DRAM: 128MB data - 8MB VGA, 32-bit noECC, 2 BA 10 CA, CL=4 BL=4 ap=1, 61440 us refr 16 Disk Backplane Bus Device Address Results ============================================ 1 4 BP MAX7313 (U1801) 0x44 PASSED 1 4 BP FRUID (U2102) 0xAC PASSED Paddle Card Bus Device Address Results <DIAGS> PHY #0 R/W Test ... PASSED <DIAGS> PHY #0 Link Status ... PASSED <DIAGS> ETHERNET PHY #0, Internal Loopback Test ... PASSED <DIAGS>Testing RTC ... PASSED <DIAGS> USB 1.1 Register Test ... PASSED <DIAGS> USB2.0 Register Test ... PASSED <DIAGS> USB 1.1 Test ... PASSED <DIAGS>Access to BIOS Flash ... PASSED ============================================ CPU0 D0 ... Not Present CPU0 D1 ... Not Present CPU0 D2 ... Present 1 4 EXP FRUID (U0401) 0xAE PASSED DIAGS>Verifying DIMM SPD Checksum on CPU0 D2 ... PASSED SDRAM DEVICE DDR3 SDRAM MODULE TYPE RDIMM SDRAM SIZE 2 GB NUMBER OF ROWS & COLUMNS 14 Row x 11 Column CYCLE TIME DDR3 533Mhz clock(1066data rate) MANUFACTURER_JEDEC_ID_CODE Micron MANUFACTURED DATE Week 18 of '08 MODULE SERIAL NUMBER EA09445A MODULE_PART_NUMBER 18JSF25672PY-1G1D CPU0 D3 ... Not Present
28
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
CPU0 D4 ... Not Present <DIAGS>Verifying DIMM SPD Checksum on CPU1 D2 ... PASSED SDRAM DEVICE DDR3 SDRAM MODULE TYPE RDIMM SDRAM SIZE 2 GB NUMBER OF ROWS & COLUMNS 14 Row x 11 Column CYCLE TIME DDR3 533Mhz clock(1066data rate) MANUFACTURER_JEDEC_ID_CODE Micron MANUFACTURED DATE Week 18 of '08 MODULE SERIAL NUMBER EA09445B MODULE_PART_NUMBER 18JSF25672PY-1G1D CPU0 D5 ... Not Present CPU1 D3 ... Not Present CPU1 D4 ... Not Present CPU1 D5 ... Not Present CPU1 D6 ... Not Present CPU1 D7 ... Not Present CPU1 D8 ... Not Present CPU0 D6 ... Not Present Custom AST2100 U-Boot 2.0 (Jan 26 2009 - 10:29:26) r41480 <DIAGS> Testing PowerCPLD version ... PASSED Booting linux in 3 seconds... CPU0 D7 ... Not Present DRAM: 119 MB CPU0 D8 ... Not Present Flash bank 0 at 10000000 has 0x2000000 bytes in 256 sectors(chipSize 1<<25, size_ratio 1). CPU1 D0 ... Not Present Flash: 32 MB CPU1 D1 ... Not Present readonly: ethaddr=00:14:4F:CA:B5:10 PU1 D2 ... Present readonly: eth1addr=00:14:4F:CA:B5:11
Captulo 2
29
update_flash=protect off all; erase 100a0000 ${flash_top}; tftp 100a0000 ${bootfile}; setenv preserve_conf no; saveenv update_uboot=protect off all; erase 100a0000 100fffff; tftp 100a0000 ${ubootfile} netmask=255.255.255.0 ipaddr=10.8.185.77 serverip=129.148.40.42 gatewayip=10.8.185.254 erase_perm=protect off all; cp.b 10000000 42000000 20000; erase 10000000 1001ffff; cp.b 42000000 10000000 18000 preboot> uboot ubootfile=/tftpboot/sm158724/virgo-u-boot.bin flash_top=11ffffff ethact=faradaynic#0diags_result=Diags .. PASSEDpreserve_users=no preserve_conf=yes set_factory_defaults=no serial_is_host=0 upgrade_bios=yes baudrate=9600 ethaddr=00:14:4F:CA:16:0A eth1addr=00:14:4F:CA:16:0B stdin=serial stdout=serial stderr=serial i2c_bus=2 bootfile=nightly-virgo-rom.flash WARNING: Will reboot after 300 seconds of idle time. => showenv bootcmd=bootpkg bootdelay=10 loads_echo=1
30
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Captulo 2
31
32
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
CAPTULO
Informacin general de diagnstico de Pc-Check en la pgina 34 Acceso a la utilidad de diagnstico Pc-Check en la pgina 35 Men System Information (informacin del sistema) en la pgina 38 Pruebas de diagnstico avanzado en la pgina 40 Pruebas de ejecucin inmediata en la pgina 44 Visualizacin de resumen de los resultados en la pgina 48 Impresin de informe de resultados en la pgina 50 Acerca de Pc-Check en la pgina 50 Salida hacia DOS en la pgina 50
33
Enabled (Habilitado): seleccione este modo si desea realizar las pruebas de diagnstico Pc-Check despus de iniciarse el host. Se recomienda que ejecute este modo antes de una aplicacin importante para garantizar la calidad del servidor. Este modo ejecuta un conjunto de pruebas predefinido sin necesidad de intervencin del usuario y, tras su finalizacin, continuar iniciando el siguiente dispositivo segn la Lista de prioridad de inicio del BIOS. Este modo tambin se recomienda como prueba rpida para la instalacin en campo inicial. Extended (Ampliado): seleccione este modo si desea ejecutar la versin ampliada de las pruebas de diagnstico Pc-Check despus de iniciarse el host. Se recomienda que ejecute este modo durante la instalacin inicial del servidor. Este modo ejecuta un conjunto de pruebas completas para garantizar que el servidor se haya transportado sin sufrir daos fsicos. Este modo tambin debera ejecutarse cada vez que cambie la configuracin del servidor fsicamente para garantizar as que los nuevos componentes estn instalados correctamente antes de ejecutar las aplicaciones y los sistemas operativos de produccin. Manual (Manual): seleccione este modo si desea ejecutar determinadas pruebas de diagnstico Pc-Check una vez iniciado el host. Puede utilizar este modo para seleccionar pruebas especficas en los mens de Pc-Check, o bien para seleccionar conjuntos de pruebas predefinidos que estn disponibles a travs del men Immediate Burn-in Test (Prueba de resistencia inmediata). Estas pruebas se explican detalladamente ms adelante en este mismo documento. Disabled (inhabilitado): seleccione este modo si no desea ejecutar pruebas de diagnstico Pc-Check una vez iniciado el host. Este es el modo predeterminado del servidor. Debe configurar Pc-Check en el modo Disabled (inhabilitado) una vez finalizada la ejecucin de los diagnsticos.
34
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Para acceder a Pc-Check mediante la interfaz web de Oracle ILOM en la pgina 35 Para acceder a Pc-Check mediante la CLI de Oracle ILOM en la pgina 37
Comando CLI: el SP tiene un puerto de serie al que puede conectar un dispositivo de terminal. Si inicia sesin en el SP e introduce en la CLI el comando show /SP/network, el SP muestra la direccin IP actual. Pantalla de configuracin de la BIOS del sistema: pulse F2 durante el encendido y, a continuacin, elija Advanced (avanzado) IPMI 2.0 Configuration (configuracin IPMI 2.0) Set LAN Configuration (definir la configuracin de LAN) IP Address (direccin IP).
2. Establezca conexin con el SP de Oracle ILOM a travs del navegador web en ejecucin en un servidor remoto. Para establecer una conexin con la interfaz web del SP de Oracle ILOM, escriba la direccin IP del SP de Oracle ILOM en el cuadro localizador del navegador y pulse Intro. 3. Inicie sesin en la interfaz web de Oracle ILOM mediante su nombre de usuario y contrasea. 4. Seleccione Remote Control (control remoto) Diagnostics (diagnsticos). Aparece la pgina de diagnsticos.
Captulo 3
35
5. En la lista desplegable Run Diagnostics on Boot (ejecutar diagnstico al iniciar), seleccione una de las opciones siguientes para ejecutar durante el inicio y haga clic en Save (guardar):
6. Seleccione la ficha Remote Power Control (control de encendido remoto). Aparece la pgina Remote Power Control. 7. En la lista desplegable Select Action (seleccionar accin), seleccione Power Cycle (ciclo de encendido) y haga clic en Save (guardar) para reiniciar el servidor. Tenga en cuenta que los diagnsticos Pc-Check no se iniciarn a menos que haya seleccionado Power Cycle (ciclo de encendido). Si selecciona Reset (restablecer), los diagnsticos Pc-Check no se iniciarn. Si selecciona la opcin Enabled (habilitado), se ejecutan los diagnsticos bsicos, que tardan aproximadamente tres minutos en finalizar. Si selecciona la opcin Extended (ampliado), se ejecutan los diagnsticos detallados, que tardan aproximadamente treinta minutos en finalizar. Si selecciona la opcin Manual (manual), el servidor se inicia en el men principal de Pc-Check. Aparecen las opciones del men principal siguientes:
Men System Information (informacin del sistema) Pruebas de diagnstico avanzado Pruebas de ejecucin inmediata Pruebas de ejecucin aplazada Visualizacin de resumen de los resultados Impresin de informe de resultados Acerca de Pc-Check Salida hacia DOS
Para ejecutar una prueba de componente de hardware especfica, seleccione Advanced Diagnostics Tests (pruebas de diagnstico avanzado). Para ejecutar una de las secuencias de comandos de prueba que proporciona Oracle, seleccione Immediate Burn-in Testing (pruebas de ejecucin inmediata). Desplcese por los elementos del men pulsando las teclas de flecha para ir a una seleccin del men. Pulse la tecla Intro para elegir una seleccin del men y pulse la tecla ESC para salir del men. Las instrucciones de navegacin se muestran en la parte inferior de cada pantalla.
36
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
->set /SP/diag state=manual ->set /SP/diag state=enabled ->set /SP/diag state=extended ->set /SP/diag state=disabled
3. Apague y vuelva a encender el host. Escriba estos dos comandos: ->stop /SYS ->start /SYS Si selecciona la opcin Enabled (habilitado), se ejecutan los diagnsticos bsicos, que tardan aproximadamente tres minutos en finalizar. Si selecciona la opcin Extended (ampliado), se ejecutan los diagnsticos detallados, que tardan aproximadamente treinta minutos en finalizar. Si selecciona la opcin Manual (manual), el servidor se inicia en el men principal de Pc-Check. Aparecen las opciones del men principal siguientes:
Men System Information (informacin del sistema) Pruebas de diagnstico avanzado Pruebas de ejecucin inmediata Pruebas de ejecucin aplazada Visualizacin de resumen de los resultados Impresin de informe de resultados Acerca de Pc-Check Salida hacia DOS
Para ejecutar una prueba de componente de hardware especfica, seleccione Advanced Diagnostics Tests (pruebas de diagnstico avanzado). Para ejecutar una de las secuencias de comandos de prueba que proporciona Oracle, seleccione Immediate Burn-in Testing (pruebas de ejecucin inmediata). Desplcese por los elementos del men pulsando las teclas de flecha para ir a una seleccin del men. Pulse la tecla Intro para elegir una seleccin del men y pulse la tecla ESC para salir del men. Las instrucciones de navegacin se muestran en la parte inferior de cada pantalla.
Captulo 3
37
Incluye informacin bsica sobre el servidor, la placa base, la BIOS, el procesador, la memoria cach, las unidades, el vdeo, el mdem, la red, los buses y los puertos. Permite crear un documento que muestre informacin sobre el servidor, en el que se incluyan comparaciones entre las actualizaciones y las versiones ms recientes del servidor. XML es el formato utilizado para crear y mostrar esta informacin; no obstante, tambin puede elegir un formato de texto (.txt). Proporciona informacin obtenida del servidor sobre el tipo de BIOS, el servidor, la placa base, el contenedor, los procesadores, los mdulos de memoria, la memoria cach, las ranuras, el registro de eventos del servidor, la matriz de memoria, los dispositivos de memoria, las direcciones asignadas de los dispositivos de memoria y el inicio del servidor. Incluye datos sobre dispositivos especficos del espacio pci-config dentro del servidor, de modo similar a los que ofrece la opcin System Management Information (informacin sobre administracin de sistemas). Muestra los dispositivos maestro/esclavo en los controladores IDE primarios y secundarios.
38
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
PCMCIA/CardBus Information (informacin sobre PCMCIA/CardBus) Interrupt Vectors (vectores de interrupcin) IRQ Information (informacin sobre IRQ) Device Drivers (controladores de dispositivos) APM Information (informacin sobre APM)
Es posible que no sea importante para todos los servidores. Enumera y describe los vectores de interrupcin para dispositivos. Muestra las asignaciones de interrupcin del hardware. Muestra los controladores de dispositivos cargados en OpenDOS. Prueba las funciones de administracin avanzada de energa (APM) del servidor. Puede cambiar o ver el estado de la energa, indicar el uso de la CPU, obtener un evento de administracin de energa (PM) o cambiar el modo de interfaz. Muestra las asignaciones de puerto E/S para los dispositivos hardware en el servidor. Permite ver la memoria asignada para todo el servidor. Lee informacin de sector de los discos duros y DVD sector por sector. Prueba la velocidad del procesador. Muestra la configuracin del CMOS del servidor. Es posible que no sea importante para todos los servidores. Abre un editor de archivos de texto. Permite configurar opciones para las pruebas de diagnstico.
I/O Port Browser (navegador de puerto E/S) Memory Browser (navegador de memoria) Sector Browser (navegador de sector) CPU Frequency Monitor (monitor de frecuencia de la CPU) CMOS RAM Utilities (utilidades RAM-CMOS) SCSI Utilities (utilidades SCSI) Text File Editor (editor de archivos de texto) Start-Up Options (opciones para iniciar)
Captulo 3
39
Opcin
Processor (procesador)
Proporciona informacin sobre el procesador e incluye el men Processor Tests (pruebas del procesador) para probar el procesador en el servidor. Proporciona informacin sobre la memoria e incluye el men Memory Tests (pruebas de memoria) para probar la memoria en el servidor. Tambin enumera los tipos de memoria en el servidor, como la memoria de servidor, cach o vdeo. Proporciona informacin sobre la placa base e incluye el men Motherboard Tests (pruebas de la placa base) para probar la placa base en el servidor. Es posible que no sea importante para todos los servidores. Proporciona informacin sobre el disco duro e incluye el men Hard Disk Tests (pruebas de discos duros) para probar los discos duros en el servidor. Consulte Para probar los discos duros del servidor en la pgina 42 para obtener informacin detallada sobre las pruebas en discos duros e informacin de secuencias de comandos. Incluye el men CD-ROM/DVD para probar los dispositivos de DVD en el servidor. Proporciona informacin sobre los dispositivos conectados a los controladores IDE en el servidor que no sean un DVD o un disco duro (por ejemplo, unidades zip).
Memory (memoria)
40
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
TABLA 3-2
Opciones del men Advanced Diagnostics Tests (pruebas de diagnstico avanzado) (continuacin)
Descripcin
Opcin
TPM
Comprueba el correcto funcionamiento del chip de seguridad del mdulo de plataforma de confianza (TPM) del SP. Proporciona informacin sobre el puerto de serie e incluye el men Serial Ports Tests (pruebas en puertos de serie) para probar los puertos de serie en el servidor. Para superar la prueba en el puerto de serie, la entrada COM1 en la pantalla de configuracin de la BIOS debe estar definida en el valor "System" (sistema). Tambin es posible que sea necesario el uso de un conector de bucle de realimentacin de puerto de serie. Es posible que no sea importante para todos los servidores. Es posible que no sea importante para todos los servidores. Incluye el men de prueba de ATA (Advanced Technology Attachment). Proporciona informacin sobre los dispositivos USB del servidor e incluye el men USB Tests (pruebas en USB) para probar los USB. Es posible que no sea importante para todos los servidores. Realiza pruebas en controladores de registro de red. Ejecuta una serie de pruebas simultneas para crear una prueba de esfuerzo. La duracin est configurada en veinte minutos de forma predeterminada. Incluye el men Keyboard Tests (pruebas en teclado) con opciones para realizar varias pruebas en el teclado. Proporciona informacin sobre el ratn e incluye un men para probar el ratn en el servidor. Es posible que no sea importante para todos los servidores. Es posible que no sea importante para todos los servidores.
FireWire Network (red) System Stress Test (prueba de esfuerzo de sistema) Keyboard (teclado) Mouse (ratn) Joystick Audio
Captulo 3
41
TABLA 3-2
Opciones del men Advanced Diagnostics Tests (pruebas de diagnstico avanzado) (continuacin)
Descripcin
Opcin
Video (vdeo)
Proporciona informacin sobre la tarjeta de vdeo. Inicialmente, el monitor puede parpadear, pero, a continuacin, se abre el men Video Test Options (opciones de prueba de vdeo) que permite realizar varias pruebas de vdeo. Es posible que no sea importante para todos los servidores. Proporciona informacin sobre la interfaz avanzada configurable de energa (ACPI) e incluye el men ACPI Tests (pruebas de la ACPI) para probar la ACPI.
Select Drive (seleccionar unidad) Test Settings (configuracin de la prueba) Read Test (prueba de lectura) Read Verify Test (prueba de verificacin de lectura) Non-Destructive Write Test (prueba de escritura no destructiva) Destructive Write Test (prueba de escritura destructiva) Mechanics Stress Test (prueba de esfuerzo mecnico) Internal Cache Test (prueba de memoria cach interna) View Error Log (ver registro de errores) Utilities Menu (men de utilidades)
42
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Exit (salir) Media tests (pruebas de medios): se usan para probar los medios asociados con el hardware de unidad de disco duro, como el disco fsico. La opciones de pruebas de medios incluyen: Read Test (prueba de lectura), Read Verify Test (prueba de verificacin de lectura), Non-Destructive Write Test (prueba de escritura no destructiva) y Destructive Write Test (prueba de escritura destructiva).
Precaucin La ejecucin de la Destructive Write Test (prueba de escritura destructiva) destruye todos los datos del disco.
Device tests (pruebas de dispositivos): se usan para probar los dispositivos que no estn relacionados con los medios y que estn asociados con el hardware de unidad de disco duro, como la memoria cach interna y del extremo. Las opciones de pruebas en dispositivos incluyen la prueba Mechanics Stress Test (prueba de esfuerzo mecnico) y la prueba Internal Cache Test (prueba de memoria cach interna).
Adems de elegir las opciones de pruebas de dispositivos o medios que desee, tambin puede definir muchos parmetros de la prueba dentro de la opcin Test Settings (configuracin de la prueba). La opcin Test Settings (configuracin de la prueba) incluye:
Media Test Settings (configuracin de prueba de medios): permite seleccionar la duracin de la prueba, y el porcentaje y los sectores que se deben probar del disco duro. Device Test Settings (configuracin de prueba de dispositivos): permite seleccionar la duracin de las pruebas de los dispositivos y el nivel de la prueba. Number of Retries (nmero de reintentos): permite seleccionar el nmero de veces que desea volver a realizar la prueba en un dispositivo antes de darla por finalizada. Maximum Errors (mximo de errores): permite seleccionar el nmero de errores permitidos antes de finalizar la prueba. Check SMART First (comprobar primero SMART): la tecnologa de generacin de informes, anlisis y supervisin automtica (SMART) permite ejecutar una prueba que supervisa y genera informes de problemas del estado de la unidad del disco de forma automtica. HPA Protection (proteccin de HPA): el rea protegida del host (HPA) permite proteger el rea protegida del host de la unidad de disco. Exit (salida): permite salir del men de la opcin Test Settings (configuracin de la prueba).
Captulo 3
43
Pruebas de todo el sistema en la pgina 44 Para ejecutar pruebas de ejecucin inmediata en la pgina 46
Nota Cada una de estas secuencias prueban el estado operativo de todo el servidor. Si slo desea probar un porcentaje concreto de las unidades de disco duro, consulte Para probar los discos duros del servidor en la pgina 42 para cambiar las opciones de la prueba.
quick.tst: esta secuencia de comandos realiza una prueba de nivel superior de todos los componentes del hardware, incluidos aquellos que requieren una accin del usuario, adems de una prueba de memoria ms exhaustiva. Debe interactuar con la utilidad Pc-Check para progresar a travs de estas pruebas interactivas. Estas pruebas no se pueden ejecutar sin atencin y no contienen instalaciones de tiempo de espera. Las pruebas interactivas esperan hasta que indica la entrada correcta.
44
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
noinput.tst: esta secuencia de comandos se usa como una evaluacin de errores inicial para cualquier problema relacionado con el hardware. La secuencia de comandos realiza una prueba de nivel superior de la mayora de los componentes de hardware, excepto aquellos componentes que requieran una accin del usuario (teclado, ratn, sonido, vdeo). La prueba no requiere ninguna accin del usuario. full.tst: esta secuencia de comandos realiza una prueba ms exhaustiva y completa en todos los componentes de hardware, incluidos aquellos componentes que requieren una accin del usuario. Esta secuencia de comandos contiene una prueba de memoria ms exhaustiva que quick.tst, adems de pruebas de puerto externo (que pueden requerir conectores de bucle invertido). Debe interactuar con la utilidad de prueba para progresar a travs de estas pruebas interactivas.
Nota Las pruebas de memoria en Pc-Check detectan fallos de memoria de cdigo de correccin de errores (ECC) de bit nico y los transfieren a un mdulo de memoria individual (DIMM).
Cuando selecciona la opcin del men Immediate Burn-in Testing (pruebas de ejecucin inmediata), aparece la ventana Continuous Burn-in Testing (pruebas de ejecucin continua). La pantalla incluye la lista de opciones mostrada en la TABLA 3-3 para ejecutar las pruebas. Cuando se carga una secuencia de comandos quick.tst, noinput.tst o full.tst, los valores predeterminados indicados en la tercera columna se cargan automticamente.
TABLA 3-3
Opcin
Predeterminado General
Opciones posibles
Individual Passes (pasos individuales), Overall Passes (pasos totales) u Overall Time (tiempo total) Cualquier nmero para indicar la duracin de tiempo (en minutos) de la prueba. quick.tst, noinput.tst o full.tst
Duration (duracin)
01:00
Captulo 3
45
TABLA 3-3
Opcin
Predeterminado General
Opciones posibles
Report File (archivo de informe) Journal File (archivo de diario) Journal Options (opciones de diario)
Ninguno
Ninguno
User-defined (definido por el usuario) User-defined (definido por el usuario) Failed Tests (pruebas no superadas), All Tests (todas las pruebas), Absent Devices (dispositivos ausentes) y Test Summary (resumen de la prueba) Y (S) o N (N) Control Panel (panel de control) o Running Tests (pruebas en ejecucin) Y (S) o N (N) Y (S) o N (N) 1-9999
Ninguno
D:\noinput.jrl, D:\quick.jrl, o D:\full.jrl All Tests (todas las pruebas), Absent Devices (dispositivos ausentes) y Test Summary (resumen de la prueba)
Pause on Error (pausa N si se produce error) Screen Display (visualizacin de pantalla) POST Code (cdigo POST) Beep Codes (cdigos bip) Maximum Fails (mximo de fallos) Control Panel (panel de control)
N N Disabled (inhabilitado)
N N Disabled (inhabilitado)
46
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
Load Burn-in Script (cargar secuencia de comandos de ejecucin) Aparece un cuadro de texto. Para utilizar una prueba escrita previamente: indique una de las secuencias siguientes: quick.tst, noinput.tst o full.tst. Para utilizar una secuencia de comandos que ha creado y guardado: introduzca d:\testname.tst donde testname es el nombre de la secuencia que ha creado.
Change Options (cambiar opciones) Abre el men Burn-in Options (opciones de ejecucin), que permite modificar las distintas opciones enumeradas en la TABLA 3-3 para la secuencia de comandos de prueba cargada actualmente.
Select Tests (seleccionar pruebas) Abre una lista de las pruebas disponibles para la configuracin del servidor y la secuencia de comandos de prueba cargada actualmente.
3. Seleccione Perform Burn-in Tests (realizar pruebas de ejecucin). Ejecuta la secuencia de comandos de ejecucin de prueba cargada actualmente.
Para crear y guardar secuencias de comandos para las pruebas de ejecucin aplazada
Para crear y guardar secuencias de comandos para las pruebas de ejecucin aplazada, siga estos pasos: 1. En el men principal de Pc-Check, elija Deferred Burn-in Testing (pruebas de ejecucin aplazada). En la parte superior de la ventana se enumeran las opciones descritas en la TABLA
3-3 y en la parte inferior de la ventana se enumeran las opciones del men
Captulo 3
47
Change Options (cambiar opciones) Abre el men Burn-in Options (opciones de ejecucin), que permite modificar las distintas opciones enumeradas en la TABLA 3-3 para la secuencia de comandos de prueba cargada actualmente.
Select Tests (seleccionar pruebas) Abre una lista de todos los tipos posibles de pruebas disponibles para que pueda ejecutar la secuencia de comandos de prueba cargada actualmente.
3. Cuando haya terminado, seleccione Save Burn-in Script (guardar secuencia de comandos de ejecucin) y escriba el nombre de la nueva secuencia de comandos. Introduzca d:\test-name.tst donde test-name es el nombre de la secuencia de comandos que ha creado. 4. Para ejecutar la secuencia de comandos que acaba de crear, vaya a Immediate Burn-in Test (pruebas de ejecucin inmediata) y ejecute la secuencia de comandos. Consulte Pruebas de ejecucin inmediata en la pgina 44.
Processor (procesador)
En este apartado se muestran las pruebas realizadas en el procesador: Core Processor Tests, AMD64/Intel64 Core Tests, Math Co-Processor Tests Pentium Class FDIV y Pentium Class FIST, MMX Operation, 3DNow! Operation, SSE Instruction Set, SSE2 Instruction Set y MP Symmetry.
48
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
En este apartado se muestran las pruebas realizadas en la placa base: DMA Controller Tests, System Timer Tests, Interrupt Test, Keyboard Controller Tests, PCI Bus Tests y CMOS RAM/Clock Tests.
Memory, Cache Memory, and Video Memory (memoria, memoria cach y memoria de vdeo)
En este apartado se muestran las pruebas realizadas en los distintos tipos de memoria: Inversion Test Tree, Progressive Inversion Test, Chaotic Addressing Test y Block Rotation Test.
En este apartado se muestran las pruebas realizadas en el dispositivo de entrada: Verify Device, Keyboard Repeat y Keyboard LEDs.
Mouse (ratn)
En este apartado se muestran las pruebas realizadas en el ratn: Buttons, Ballistics, Text Mode Positioning, Text Mode Area Redefine, Graphics Mode Positions, Graphics Area Redefine y Graphics Cursor Redefine.
Video (vdeo)
En este apartado se muestran las pruebas realizadas en el vdeo: Color Purity Test, True Color Test, Alignment Test, LCD Test y Test Cord Test.
Multimedia
En este apartado se muestran las pruebas realizadas en los componentes multimedia: Internal Speaker Test, FM Synthesizer Test, PCM Sample Test, CD/DVD Drive Read Test, CD/DVD Transfer (KB/Sec), CD/DVD Transfer Rating, CD/DVD Drive Seek Test, CD/DVD Seek Time (ms), CD/DVD Test Disk Read y CD/DVD Tray Test.
En este apartado se muestran las pruebas realizadas en los dispositivos ATAPI: Linear Read Test, Non-Destructive Write y Random Read/Write Test.
En este apartado se muestran las pruebas realizadas en el disco duro: Read Test, Read Verify Test, Non-Destructive Write Test, Destructive Write Test, Mechanics Stress Test e Internal Cache Test.
USB
En este apartado se muestran las pruebas realizadas en el USB: Controller Tests y Functional Tests.
En este apartado se muestra la ID de equipo del servidor. Esta prueba no est disponible en algunos sistemas de Oracle.
Captulo 3 Utilidad de diagnstico Pc-Check 49
Acerca de Pc-Check
Puede utilizar la opcin del men About Pc-Check (acerca de Pc-Check) para ver informacin general sobre el software Pc-Check, incluidos los componentes residentes y los no residentes, como los dispositivos de ratn.
50
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011
ndice
C
CD de diagnstico, 7 configurar un servidor para pruebas, 13
M
modo Extended (ampliado), 26 modo Normal, 23 modo Quick (rpido), 25
D
descripcin, 6 diagnsticos de PC-Check, 6, 33 diagnsticos independientes basados en paquetes, 3 diagnsticos U-Boot, 15 diagnsticos U-Boot en ejecucin, 21 documentacin, 8 documentacin relacionada, ix
O
opcin de diagnstico avanzado, 40 opcin Deferred Burn-in Testing (pruebas de ejecucin aplazada), 47 opcin Immediate Burn-in Testing (pruebas de ejecucin inmediata), 44 opcin Print Results Reports (imprimir informe de resultados), 50 opcin Show Results Summary (mostrar resumen de resultados), 48 opcin Shut Down (cerrar), 50 opciones de la prueba de inicio, 16 opciones del men principal, 34 opciones del men System Information (informacin del sistema), 38 Oracle VTS, 6, 8
E
ejecutar la utilidad Snapshot, 8 en lnea, 4 estrategia, 2
F
fallos de prueba de inicio, 19
H
herramientas, 1 herramientas de diagnstico, 1 herramientas para sistemas de Oracle, 5
P
Pc-Check, 6 POST de la BIOS, 5 procesador de servicio (SP), 2 pruebas de discos duros, 42
I
informacin general sobre pruebas de inicio, 16 informacin sobre Pc-Check, 50
S
sin conexin, 3 situaciones de solucin de problemas, 9
51
U
U-Boot, 5 utilidad Snapshot, 8 utilidad Snapshot de Oracle ILOM, 8
V
variables de entorno del SP de ejemplo, 30 test modes, 17
52
Gua de diagnstico de servidores Oracle x86 para servidores que admiten Oracle ILOM 3.0.x Junio de 2011