Professional Documents
Culture Documents
ecastrom
edocastro
eduardocastrom
2
Derechos de autor
Prcticas reales: la escala del rendimiento MICROSOFT SQL Server 2008 Analysis SERVICIOS EN MICROSOFT ADCENTER
DBI407 Mejor Prcticas para la construccin 1 empresas soluciones de inteligencia empresarial de nivel con el anlisis de Microsoft SQL Server Servicios,
Adn Jorgensen
El diseo escalable y complejo Cubos servicio de anlisis, Denny Lee, Thomas Kejser
http://msdn.microsoft.com/en-us/library/dd758814 (v = SQL.100).aspx
http://technet.microsoft.com/en-us/library/cc966414.aspx
Almacenamiento de datos moderno, Minera y Visualizacin: Core Conceptos por George M. Marakas
3
Data Warehouse: Una arquitectura de varios niveles
Controlar OLAP Server
Otras Metadatos Y
fuentes Integrador
Anlisis
Operacional Extraer
Pregunta
DBs Transformar Servir Informes
Datos
Cargar La minera
Refrescar Almacn
de datos
Data Marts
4
Arquitecturas OLAP Server
5
Uso de almacenamiento de datos
6
DW Arquitectura reas Componente Clave
http://courseware.finntrack.eu/it/data/marakas_dw_ch6.ppt 7
Variedad de datos
Archivos de Hadoop (almacenamiento no relacional)
8
El almacn de datos tradicional
2
Datos en
tiempo
real
1 3
Volumenes de Nuevo datos
datos fuentes y tipos
creciente Las fuentes de datos
9
Inclusin de datos no tradicionales
2
Datos en
tiempo
real
3
1 Nuevo datos
Volumenes de fuentes y tipos
datos
creciente Las fuentes de datos Los datos no relacionales
10
El almacn de datos moderna
11
Big Data + BI tradicional = Nuevo Enfoque de Anlisis
Hadoop
010101010101010101
NoSQL
1010101010101010
01010101010101
101010101010
Tabular
OLAP Visualizacin
SQL
grandes
cantidades
de datos Polibase
12
Best Practice # 1
Modelo tridimensional
Sin normalizar
Enfoque hbrido
13
Best Practice # 2
14
Best Practice # 3
15
Disear el bus del Datawarehouse
16
Best Practice # 4
17
Best Practice # 5
18
Best Practice # 6
19
El aumento Requisitos de hardware
El uso de SSD
Tamao de bloque
ROLAP
20
DBI407 Mejores prcticas para la construccin 1 empresas soluciones de inteligencia empresarial de nivel con Microsoft SQL Server Analysis Services, Adam Jorgensen
Uso de particionamiento para DW
1 Partition per Day
31 Partitions, 1 Month of Data
Facts Database
0 1 2 3 4 5 6 7 8 9 10 11
12 13 14 15 16 17 18 19 20 21 22 23
8 Parallel Partition
Processing Jobs
Cube
Current Day Partition Set
...
WHERE [date] = CAST(CONVERT(varchar, GETDATE(), 112) AS int)
AND [hour] IN (0, 11, 17)
0 11 17 1 14 18 2 5 22 3 12 21
4 13 19 6 15 23 7 9 20 8 10 16
21
DBI407 Mejores prcticas para la construccin 1 empresas soluciones de inteligencia empresarial de nivel con Microsoft SQL Server Analysis Services, Adam Jorgensen
Concurrencia mejorar desempeo multiusuario
Escalar Analysis Services: Slo Lectura
22
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
Estudio de caso - AdCenter
23
Cubo adCenter
24
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
EMC Symmetrix VMAX
Cada servidor est conectado a una EMC Symmetrix VMAX a travs de bus
con doble adaptadores
25
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
Carga de datos diaria
26
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
Consulta de datos
27
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
Administracin
28
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
Actualizacin diaria de datos
29
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
Montaje diario por medio de clonar cubos
30
PRCTICAS REALES: prestaciones de escalado de Microsoft SQL Server 2008 Analysis Services de AT MICROSOFT ADCENTER
Centro de Produccin adCenter
adCenter Production Environment
OLAP Standby Server OLAP Processing Server Staging Data Warehouse Data Feeds
Windows Server 2003 x64 SP2 Windows Server 2003 x64 SP2 Windows Server 2003 x64 SP2 Windows Server 2003 x64 SP2
SQL Server Analysis Services SQL Server Analysis Services SQL Server Enterprise Edition SQL Server Integration Services
64GB RAM, 8 Xeon procs (16 cores) 64GB RAM, 8 Xeon procs (16 cores) 32 GB RAM, 8 Xeon procs (16 cores) Network Load Balancing
180 300GB 10K Drives 180 300GB 10K Drives 32 300GB 10K Drives
31
DBI407 Mejores prcticas para la construccin 1 empresas soluciones de inteligencia empresarial de nivel con Microsoft SQL Server Analysis Services, Adam Jorgensen
ESTUDIO DE CASO: E & D
Xbox Live
Estrategia de Particiones
Uniformemente distribuida, continuo y no se solapan
33
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
Xbox Live - SSD Performance
3000
2500
2000
1500
1000
500
0
Day Week Month Quarter 7 months
Dev SSD 14 29 101 203 506
Dev HDD 14 29 104 610 1191
UAT SAN 9 73 445 1025 2800
V2 Cube, SSD 5 10 15 31 72
V2 Cube, HDD 5 7 30 244 540
Amount of Data
DBI407 Mejores
Disear prcticas
los cubos parade
servicio la anlisis
construccin 1 empresas
escalables soluciones Denny
y complejas, de inteligencia empresarial
Lee, Thomas Kejserde nivel con Microsoft SQL Server Analysis Services, Adam Jorgensen
Concurrencia de consultas
Utilizar SSD para que cada servidor para manejar ms consultas simultneas
35
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
ESTUDIO DE CASO: YAHOO!
Cubo de 12 TB
Yahoo - Datos Masivos a gran escala
CDF Oracle 10g SSAS Cube Constructor
NAS
50 GB /hr
HW NLB
DBI407 Mejores prcticas para la construccin 1 empresas soluciones de inteligencia empresarial de nivel con Microsoft SQL Server Analysis Services, Adam Jorgensen
MOLAP conmutacin En Accin
Idea bsica:
Utilizar MOLAP para los datos histricos
Procesar ltimas particiones MOLAP ms a menudo
Latencias tpicas en minutos
Preocupaciones:
Tiempo de procesamiento de las particiones actualizadas
Manejo el bloqueo del proceso cuando necesite actualizar los datos
38
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
Particiones del cubo
39
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
Cube Flipping
40
41
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
42
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
43
Disear los cubos servicio de anlisis escalables y complejas, Denny Lee, Thomas Kejser
Resumiendo
44
DBI407 Mejores prcticas para la construccin 1 empresas soluciones de inteligencia empresarial de nivel con Microsoft SQL Server Analysis Services, Adam Jorgensen
DW Appliance
45
SQL Server Fast Track Reference Architecture
Fuente: http://www.emc.com/collateral/technical-documentation/h13566-data-warehouse-fast-track-ms-sql-2014.pdf
46
SQL Server Fast Track Reference Architecture
Fuente: http://www.emc.com/collateral/technical-documentation/h13566-data-warehouse-fast-track-ms-sql-2014.pdf
47
SQL Server Fast
Track Reference
Architecture
Fuente: http://www.emc.com/collateral/technical-
documentation/h13566-data-warehouse-fast-track-
ms-sql-2014.pdf
48
Obstculos para un almacn de datos moderna
Mantener la inversin Adquirir Big Data Comprar nuevo nivel Adquirir la inteligencia
legado solucin uno dispositivo de de negocios
hardware
Consultas integradas a travs de La eliminacin del almacn de Valor con opciones de hardware
Hadoop y PDW utilizando T-SQL datos cuellos de botella con MPP flexibles utilizando hardware
SQL Server comercial
La integracin directa con las
herramientas de BI de Microsoft, Concurrencia que ayuda rpida
como Microsoft Excel adopcin
APS listo para la empresa Hadoop con HDInsight
Manejable, asegurado, y de alta disponibilidad Hadoop integrado dentro del aparato
SQL Server
Parallel Data
warehouse Alto rendimiento y Autenticacin del
sintonizado en el usuario final con
hardware Active Directory
Polibase
Microsoft
HDInsight 100-por ciento de Administrado y Accesible ideas para
Apache Hadoop monitoreado todo el mundo con las
utilizando System herramientas de
Center Microsoft BI
Resumen hardware APS
Una regin es un contenedor lgico Carga en paralelo de HDInsight carga de trabajo
dentro de un appliance depsito de datos
Aparato
Seguridad
Medida
Prestacin de servicios Hardware
Conexin de islas de datos con polybase
Trayendo soluciones de punto de Hadoop y el almacn de datos junto a los usuarios y TI
Seleccionar Conjunto de
... resultados
Polybase
Hortonworks para Compatible con Windows Azure HDInsight para
Windows y Linux permitir escenarios hbrido de la nube
Cloudera
Microsoft Ofrece la posibilidad de consultar las distribuciones
HDInsight no Microsoft Hadoop, como Hortonworks y
Cloudera
Automatic MapReduce pushdown
SQL Server
Data Marts
Microsoft
HDInsight
SQL Server
Analysis Services
APS
Actualizar Da / Hora / Minuto
Concurrencia de datos
Gran rendimiento con cargas de trabajo mixtas
Analytics Platform System
ETL / ELT con SSIS, DQS, MDS Intra-Day CRTAS SMP SQL Server
PDW
Casi en tiempo real Real-Time
ETL / ELT con DWLoader Presentacin de informes y cubos
Almacn de columnas
ROLAP / MOLAP
DirectQuery
Polybase
Pre-configurado, Liderando el
construido, y rendimiento con
ajustado hardware
HDInsight software y comercial
hardware
Rack #2 Rack #1
InfiniBand
InfiniBand
Ethernet
HDI extension base
Hardware architecture
InfiniBand
InfiniBand
Ethernet
Networking
Master node
Failover node HST-02
Compute nodes Compute nodes IB and Ethernet
Cita:
************************
Consulta T- **********************
SQL
*********************
**********************
***********************
Scan 1B filas
Capacidad elstica