You are on page 1of 81

p  

 
 


      
   


  

   p

|
° 

‡ Presentación
‡ Buscadores
± Buscadores y GSA
± p  
     




±     p
± Arquitectura del buscador Federado
± Plataforma del Conocimiento
± Complementos del Buscador (Widgets y Gadgets)
± Novedades GSA 6.X
± Aplicaciones OneBox
‡ Geolocalización
± Google Maps
±   
± Integración con otros sistemas GIS
‡ Contenido de videos en web Públicas
± YouTube
±  
± Como crear tu propio canal en YouTube
‡ Dudas y Preguntas

˜  

‡ 

   !
± Vicedecano de la Facultad de Humanidades, Comunicación y
Documentación
± Universidad Carlos III de Madrid
‡ p     "#
± Jefe del Servicio de Difusión Electrónica y Publicaciones
± Subdirección General de Innovación y Programas de
Atención al Ciudadano, Ministerio de la Presidencia
‡ 
 
± Jefe de Área de Información y Documentación
± Sub. Gral. de Publicaciones, Información y Documentación,
Ministerio de Cultura
‡     

± Gerente de Cuenta
± Área de Soluciones Colaborativas Eptisa TI


˜  


Datos Globales Datos Unidad de Negocio

 Fundada en 1956  p 


m þ 
 Más de 50 años de experiencia m 
  

 100% capital español  Uno de los 5 primeros partners de Google en


Europa
 Más de 2000 empleados
 Premio al Mejor Partner europeo del 2007
 Más de 200 Millones de euros en
2008  Partner con mas referencias de GSA en
España
 Internacional

 Interdisciplinar


p    
 


      
   





  

  p

J
ð  

‡ Búsqueda Universal
‡ Internet Google

‡ Empresa:

Google desktop
‡ Mi Equipo


ð 



Acceso a toda Relevancia


la información

Rendimiento Presentación


 
  

‡  $ %


($) es un dispositivo que
incluye el hardware y software necesarios para indexar
información y permitir realizar búsquedas de forma  ,


 y 
  sobre la misma. La información puede
provenir de distintas fuentes entre las que se incluyen:
  , $

% , $
 
&
  y .
‡ Los resultados de búsqueda se encuentran con los mismos
criterios de  
que han hecho a   el mejor
buscador en Internet



  

 

Contenidos

: GSA busca
|: Petición de búsqueda los resultados
):Indexación
más relevantes
en el índice

Usuario

: GSA
(: Dependiendo de los parámetros de comprueba la
búsqueda, GSA devuelve un documento ': GSA Genera un
XML o un documento HTML, mediante
 
#
&
documento XML con de cada posible
la aplicación de una hoja de estilo XSLT los resultados resultado, si es
necesario

XML


 
 
 




   !
± Vicedecano de la Facultad de Humanidades,
Comunicación y Documentación
± Universidad Carlos III de Madrid

|
p 
 



 
 
!
  "#
"#

p   




 $

 % & '  (
 
   (
)

 

 

("  
( 


||
Contexto de la investigación

TECNODOC Ú
     
!

"  

 


#  
 
$$$

% 

&Dpto. de Biblioteconomía y Documentación'


 
 


 


 (
)

 




*

*

*


   


   *
 

  *


  


  
+

  



 

" $ 
 

principios del año 2009*






 
 

  




,

" p 
 
 
 *

|*

*
 -
*

J- 

|
=deas iniciales

"  

relaciones tecnológicas  


  


motores de búsqueda en =nternet +

sedes web de la
administración pública 

 

 

   



 
+

+



 

" 
relaciones*



 

 



  *



 .


  
  

 


  
 
robots.txt +*
  *



 
sitemap.xml 


)

" /

  

  
 

 

   



 
 
  
 .

 


)




 
+*

 *

 0

  

 



disibilidad de
los sitios web

|
El fichero robots.txt

" /
 
1
1

 
  


V  


 .


 
ëETA de HTë

" 
 *

 
1
 . *

 




   




)*





 
2 

 

1 



| *
The Robots
Exclusion Protocol &3 ˜'
Ú
 ))) 0  
!

"  


fichero de texto plano*



  

(4



)
+

  
 +
 
5 # 

1
( 


 
User-agent  



+

 

 
&

 



 ) '


 

V 
5 # 

1
( 


 
Disallow  



+

 



  
+
 


 

  
 

V  

" REP extendido


 
 

Allow*
disit-time*
Crawl-
delay*

|
El fichero robots.txt

" Algunos ejemplos

Ejemplo 1 Ejemplo 2 Ejemplo 2

# - 
6 # - 
6 # - 

2)
-  2)
-  +7
2)
  # - 
# - 

 2)
 7 
2)


|J
El fichero sitemap.xml

"
  

*
*
8 +
% 

 



 
Xë Sitemaps Protocol *
  *

h
*
 
 

1

 .
  





 


V 

" 2
  

Sitemaps.org Ú
 )))    
!*
9

 *


 
1
 *


 
:%/
 

  

#3/



 


 

 






última actualización*
frecuencia
de modificación 
importancia 



1
#3/


 ;

" #
 
 
  

datos concretos 


1 


*

 *


índice a distintos ficheros
sitemap &  '

|
El fichero sitemap.xml

" Sitemap básico

à °ndice de sitemaps

Ejemplo 1 Ejemplo 2
<=0   >?| ?
  >?#@A-?=B <=0   >?| ?
  >?#@A-?=B
<  0 >? )))      ?B <  0
< B 0 >? )))      ?B
<B ))) 0  <B < B
<BJ-|-|<B <B ))) 0   | 0 4<B
<  B +<  B <B -|-|@| |E<B
<  +B <  +B < B
< B < B
< B <B ))) 0    0 4<B
<BJ-|-|<B
<B ))) 0  =>| C> < B
 D)<B <  0B
<  B)7+<  B
< B
< B

<B ))) 0  =>  C>


 D )D4 <B
<B -|- <B
<  B)7+<  B
< B
< B
< B
< B

|
a investigación: obtención de datos

" Objetivo principal


 


 


  


)


  
 ,


 
 0
+




  
 4




 ) 


+

 4

 
 

" ˜  


)
060.es Ú
 )))  

!

4 


  

)


  
 ,
4108 sitios
web distintos
#
programa propio 
  

 


 
 0
+

 
 0
&+
 '


  
(4




" /
 

robots.txt   



análisis sintáctico 

 .


 

( 
Ú

 ))) 0)   7   7 


!

" 
 
sitemap.xml   
  
 


validador
Xë 
( 
Ú
    
!


a investigación: resultados obtenidos

" 2

4108 sitios web  4*


715 sitios &|* F'

  +

 
robots.txt válido*
+
  
130 sitios
 
& *|F'
  

 
1


 


sitemaps

|
a investigación: resultados obtenidos

" Sobre los ficheros robots.txt

5 /
 
  
+

   

   


a investigación: resultados obtenidos

" Sobre los ficheros robots.txt

5 2

715 ficheros*

 4
 1




1.995
irregularidades
J
  
+
|
  

" /
principales errores 
   



 

 
 


  *
 

 

+ *
( 

 

  


 

 
" /
principales advertencias  
(
  



  



 *
 

 


*
 

 


 *
 

 
 

9# -  9




 

9);
& 
  



 ) '

5



 
User-agent 

1
 


 

  

 

 *
   
 
   
 

  

  

  

 
&


2 


@ 
-  )))      0
- '

" 
 

   *


1
 
 

 
User-agent 


 
&


F'

" /


 )    

 +
0 
   
  

344
robots distintos & -F-*
-$ -|F- +
 5 *F-'

|
a investigación: resultados obtenidos

" Sobre los ficheros sitemap.xml

5 2

|

 4*
657 sitios distintos   

 



 

 


  

 


 

 (
   

 

 D 0*



de 3.145 ficheros descargados
& 0*
 4*
 0 4*
 D 0 0*
 D 0 4
+

 D 0 0 4'

5 
 *
 
 
9falsos positivos;





130  

 

 
:%/
&
  

0*


 

 
4C

 

 D 0'*
   1 
  


104 sitios distintos

5

gran mayoría de los casos*

     

ficheros
básicos*


 

  

  





 0



 

 *
 




 

índice de sitemaps
&| *F'

5
  *
escaso nivel de detalle
2*

 *
 *



G

Ayuntamiento de San Sebastián Ú
 )))     0
!


a investigación: conclusiones

" Escasa atención 


 


   


 
(





   


1

4.000 mil sitios web analizados 


17% 

  (

 
robots.txt válido &  


*

 *


1

F


# 



   '
+
  

3% 


  (

 
sitemap.xml

" 
98¶60% 


 
 
 
0 


 0
 

  

todos los motores &*'

 
 
  

 
V 
& 
 '*
 

1

 &||
'
+
-$
&J
'

" 3 


   
.


 


& |*

58¶88%'
 
4


criterio de exclusión &2)'

directorio raíz 


&

'*

 *
 


 ) 
 0

+*

 *
 
 
  




 .




 

" 
uso de sitemaps 
 

 

 4
 




)
@.
 (*


)


  
 ,
 
  

 *

3¶16% 
*


    





   *

H F


robots.txt y sitemap.xml

¡GRAC=AS POR SU ATENC=N!

Bonifacio ëartín, Tony Hernández, David Rodríguez, Daniel Peña


#  
 
$$$

% 
5 2 
ð (
+
2  


ð 
A 


‡ p     "#


± Jefe del Servicio de Difusión Electrónica y Publicaciones
± Subdirección General de Innovación y Programas de Atención al
Ciudadano
± Dirección General para el impulso de la administración electrónica
± Ministerio de la Presidencia

J
ð 
A 


‡ Acuerdo para impulsar el desarrollo de un nuevo modelo para las


relaciones entre los ciudadanos y la Administración Pública.
‡ Red 060. Resolución 19-07-05 de la Secretaría General para la
Administración Pública, Acuerdo del Consejo de Ministros del 15-07-05,
de implantación de la Red de Oficinas Integradas de Atención al
Ciudadano. (BOE 3 agosto 2005)
‡ Principios:
± El uso intensivo de la información para posibilitar instrumentos
compartidos de servicio al ciudadano.
± Asegurar una oferta creciente de servicios normalizados de atención e
información en la que participen la totalidad de ministerios y
organismos.


ð 
A 


‡ Objetivos Buscador
± Buscador federado de localización de información en la
Red 060 y otros Organismos Afiliados

± Espíritu de universalidad: convertirse en el buscador de


referencia de información sobre Administración Pública
en España

± Federación: Completa personalización e integración


para los Organismos Afiliados


ð 
A 


‡ Como conseguir los objetivos


± Un potente motor de búsqueda:
‡ Con capacidad de indexar toda la información de los portales
de las AAPP
‡ Con un interfaz sencillo y familiar
‡ Con excelente calidad de resultados
± Una plataforma de conocimiento que permita saber qué
buscan los ciudadanos, para adaptar la respuesta a sus
necesidades
± Un modelo de federación flexible y adaptable a las
necesidades de los diferentes organismos afiliados


ð 
A 


"  *+  $ %



Toda la potencia de búsqueda de Google a disposición del portal
060 y los Organismos Afiliados, completamente personalizable
‡ Calidad y ranking
‡ Resúmenes dinámicos de página
‡ Agrupación de resultados
‡ Corrector ortográfico automático
‡ Páginas almacenadas en caché
‡ Términos de consulta resaltados
‡ Visualizar como HTML
‡ Ordenar por fecha
‡ Búsqueda booleana avanzada

ð 
A 


 


& ,
‡ ³El buscador de todos, y el de cada uno´
± Posibilidad de utilizar como buscador Principal sobre Contenidos
Propios de otras AA.PP.:
‡ Personalizable
‡ Completamente integrado
‡ Con posibilidad de ofrecer resultados de otras AA.PP.

± Autonomía de decisión para enlaces patrocinados, definición de


sinónimos, y demás funciones de presentación

± Mínimo esfuerzo de integración y administración para los


Organismos Afiliados (personal técnico de Eptisa TI de apoyo
durante todo el contrato)


ð 
A 


‡ 173 portales y sedes electrónicas indexadas


‡ Organismos Afiliados:
± Ministerio de la Presidencia
± Ministerio de Política Territorial
± Ministerio de Trabajo e Inmigración
± Ministerio de Sanidad y Política Social
± Ministerio de Igualdad
± Ministerio de Defensa
± Ministerio del Interior
± Ministerio de Industria, Turismo y Comercio
± Observatorio de la Administración electrónica

|
ð 
A 


‡ Dos formas de acceder al Buscador de la AGE:


± www.060.es

± Buscador.gob.es


ð 
A 


‡ Mantenimiento Evolutivo 2010


± Mantenimiento sistema
± Afiliación de 10 nuevos organismos
± Consultor SEO para mejorar la relevancia
de los contenidos tanto en el buscador de
la AGE como en Internet


ð 
A 

-    


  


 

 

 
  

 

 

 


   
- $  

‡ Dos formas de integración con Organismos Afiliados


±  -.  $ 
 /00,,
 -.
 
1:www.060.es/buscador?q=TERMINO

4:

2: buscador.060.es/search?q=TERMINO 3: HTML

J
   
- $  

‡ Dos formas de integración con Organismos Afiliados


± $ 
 

 $ 
 

00,,
ASP
ASP.NET
1 JSP
STRUTS
PHP
«

4
2

3: XML


˜ 

  

‡ Aplicación web que permite a los


responsables del AGE y de cada
ministerio consultar el   
 y los
  
*+  realizadas por los
usuarios
" Herramienta para conocer las 
.de los
usuarios
" Permite  

& para recibir los informes directamente por
correo
" { 

 

       +
 

*+ 


˜ 

  

‡ Búsquedas más frecuentes


‡ Búsquedas sin resultado
‡ Búsquedas sin clicks
‡ Click por posición
‡ Documentos más visitados y consulta
realizada
‡ Búsquedas por Idioma
‡ Búsquedas por Categorías
‡ Búsquedas por Día
‡ Búsquedas por Hora
‡ Datos generales:
± Total consultas
± Total clicks
± Visitas a cache
± Porcentaje de búsqueda con paginación
± Porcentaje de búsquedas avanzadas

  

ð 

‡ Widgets y Gadgets que permiten integrar el buscador AGE en:


± Combo Búsqueda del
Navegador (IE, Firefox)
± Google Toolbar
± Pagina de inicio de Google
± Google Desktop
± Barra lateral del Windows
Vista
± Barra lateral Yahoo


ë  

$
 . 

 GSA 6.0 ± El mayor lanzamiento
‡ Dynamic scalability desde la original
‡ GSA-to-GSA Unification JUNIO 2009
‡ Introducing GB-9009, 30M docs in 5U form
‡ GB-7007 platform from 500k to 10M docs
1   
#
 12 Nuevas
‡ Introducing early-binding security
‡ Batch authorization on SAML API
Mejoras
‡ Collection and Node biasing
‡ Results ranking framework
‡ Search box for Google Sites and SharePoint
‡ Administrative API
{
%+ 
. %  
‡ Google suggest for Enterprise
‡ User added results & language bundles


% 

 



    -2 .
÷ Universal Login for Heterogeneous Security Systems
Support for multiple cookie domains
÷
÷ Support for multiple identities in SAML SPI 14 Nuevas
$ %   
 . Mejoras
÷ Self-learning Scorer
÷ Composite Collections
÷ Advanced Language Phrase Segmenting

p- 

.
÷ Native Integration with SharePoint
÷ Expanded File Share support (Labs)
÷ Expanded Database support (Labs)
÷ Lotus Notes (Labs)

    .


÷ 10x indexing performance improvement for SharePoint
÷ 3-5x indexing performance improvement for other ECMs
÷ GSA Mirroring for performance or high availability
÷ Real-time Diagnostics

|
% 

 :

‡ Auto aprendizaje en la relevancia (Self-Learning Scorer )


 
#     !
   
*+ 3


 
& 

  


% 

 :

‡ API de Administración
± Permite automatizar las tareas comunes para que los
usuarios puedan auto gestionar dichas tareas.
± XML-based Gdata APIs para todas las funcionalidades
administrativas
± Posibilidad de gestionar una GSA o una red de GSAs
unificadas


% 

 :

‡ Sugerencias de Búsqueda
± Basadas en las búsquedas de los usuarios y el
contenido empresarial


% 

 :

‡ GSA Mirroring: replicación del índice en tiempo real


People
Databases
Web

Real-time

J
  
I -ð0

‡ La búsqueda como punto de acceso único


‡ Permite enlazar con cualquier otra aplicación en tiempo real

Acceso a la
información de
negocio en
tiempo real


  
I ð0

‡ Ejemplos:


p    
 


      
   


*



  

  
p



% 

‡ Servicio web de Google que ofrece un mapa cartográfico, más


un conjunto de APIs y servicios para crear aplicaciones GIS



% 
5  
J)

‡ Vista panorámica de 360º y 290º a pie de calle

‡ España es el segundo país con mas cobertura 80%

J

% 
5  



‡ Calculo de rutas en coche y pie (cartografía TeleAtlas)


‡ Integrado con StreetView

J|

% 
5 I 
˜$
+
 

‡  


&

: permite obtener
las coordenadas geográficas de nuestras oficinas o recursos
sobre el mapa en base a su dirección
‡  
   
 

&
4permite obtener
tu posición actual (vía GPS, IP o Redes Wi-Fi)
‡   $ %: permite localizar negocios o servicios
situados cerca de la posición geográfica que se le indique
‡ p 
/$ 
4 servicio que nos devuelve la
elevación de un punto

J

% 
5 /
ð  
 

‡ ¿ Cómo agrego los datos de mi empresa o servicios en


Google Maps ?
‡ Utilice Local Business Center para crear tu propio directorio
de empresas y sedes.
‡ Servicio gratuito
‡ Permite añadir tus datos (dirección, horario, teléfono, web,
foto, video,«)
‡ www.google.es/localbusinesscenter

J
  


 #! #
± Jefe de Área de Información y Documentación
± Sub. Gral. de Publicaciones, Información y Documentación
± Ministerio de Cultura

J
p*
  


p    


 


       
  


*

* '

  

JJ
°K2$

" 
 0
" 3   



" 2
A  
"   

J
  

 0

"   

  
  4
" 2  
 1



  
5 % 
5  
5 ð
˜
5 ð 
 
˜  
% 


#K I
5   
 (

$K %

5 

0  *

5 L

L 

 

  
  
 


+
 
4 

J
  
   




" ˜ +

%  

  

5 I
I 


  
  


  *

  

 
 


 
&
% '
5 )))    


  
   





 


 


/4

 

 


  

˜ -


3 
 
 



 
4 

K 


 




 

 



J
  
   




 

 


M 

%  


2


  
   




J 

 
4


+
 
  




 

|
  

  

" / 4 


" ˜    
  
 
5 
% 

+
| 
% 


 ,
5 J
 
5 J 
ð
˜
5 |
 
 ,
 
˜  
% 



#K I


   

"   


  


% 


 


9 

  4;
" ,
 


1 
)

%#
" 
 

 

  

   
" $   


 
  
5 $   
 
J)
5 9
 ;
5 $  


 
  
5 L


  

"  )))    



% 
- ˜

‡ Infinitas posibilidades, algunos ejemplos:


± Mapas de situación de sedes, oficinas, recursos turísticos«
± Comunicar eventos o incidencias georeferenciadas
± Seguimiento de móviles (flotas de vehículos, trenes, aviones, equipos de
trabajo)
± Seguridad ciudadana: seguimiento de transporte de mercancías
peligrosas, localización de accidentes y recursos disponibles
± Recogida de notificaciones geoposicionadas, donde los usuarios puedan
dar de alta sobre el mapa incidencias, quejas, sugerencias, pudiendo
incluir fotos o videos . Integración perfecta con dispositivos con GPS,
cámara de fotos y video ( iPod, Android, «)
± Realidad aumentada: la combinación de dispositivos móviles con GPS
abren la puerta a servicios que añaden información en función de nuestra
posición y lo que estamos viendo (orientación)

J
$  

 

$

‡  
 de otros sistemas o servicios GIS
± Google maps permite cargar directamente datos en los
siguientes formatos
‡ KML o KMZ
‡ GeoRSS
‡ Servicios WMS

‡ Como  +  


   
GIS
± Librerías o Clientes Web (API de ArcGIS Server,
OpenLayers, Adobe Flash, etc«)
± Prácticamente todos los clientes Desktop pueden cargar la
capa de GoogleMaps (ArcGIS Desktop,«)


p    
 


      
   


+  ,  




  

  
p


8 @ 

‡ Medio que permite a personas y


organizaciones compartir y publicar videos
‡ Primer sitio de entretenimiento en Internet
‡ Cuarto sitio mas visitado en España
‡ 300 M usuarios en el último mes
‡ Muy intuitivo y usable
‡ Permite interactuar con los usuario
(valoraciones y comentarios)


8 @ 
- ð 

‡ Beneficios para la empresa:


± Reproducción de horas de video a coste cero
± Almacenaje de videos a coste cero
± Videos pueden ser embebidos en la pagina web de la empresa
± Capacidad de llegar a + 300M de usuarios
± Segmentación muy amplia (genero, edad, clase social y
habitad)
± Desarrollo de campañas de publicidad
± Distribución y sindicación a través del móvil, la web y la TV
± Permite (si se desea) el feelback de los usuarios
± Herramienta de análisis (youTube Insighy) para conocer y
adaptarse a las demandas de los usuarios
 
%#


 #! #
± Jefe de Área de Información y Documentación
± Sub. Gral. de Publicaciones, Información y Documentación
± Ministerio de Cultura


p


 - 
.

/   

p    


 


       
  


*

* '

  

|
 %#

 0

" %#
 

  
  
  
5 0  
5 I 
. 
5   
5  
   
5 &L'

" $ 





G
%#L

L



 

 
 

 


 %#
   




"  
  

8  



  
 



 
5   
5 /

  
5     
5 &L'

" I
5 2 



%  
5  
 


)
5 ˜  


 
 
 

0    


 
%#
2
  

    
+
(
 

 
&  - 
|'
 
%#
  
-
 
|
&
  '

| 

|
128
|



 99

 79
40 33 42
 26
18


        

      (
 


   

" 





% *

  


 

8  


 


9 

  4;
" 
 

%  

  




  

0   


)
" $   


    
 %#

9  (


  ;
" ˜
 


  

  
9  ;

J
 
%#

"  ))) +    


8 @ - @ 

 

‡   

± No permite personalización, ni identidad corporativa
± Incluye publicidad de terceros

‡   
 % 
± Permite personalizar el look & feel, incluido un banner
de encabezamiento con link a tu web
± Sin publicidad de terceros
± Dispones de un ³Branding box´ para mostrar tu propio
mensaje publicitario bajo el video destacado
± Paginas de visionado de videos personalizadas con tu
banner
8 @ 
5  
˜  

‡ Ejército
www.youtube.com/todosoldados

‡ Universidad Politécnica de Madrid


www.youtube.com/upm

‡ Tecnimap 2010
www.youtube.com/user/tecnimap2010
8 @ 
-  
˜  

‡ Un Canal Patrocinado no tiene ningún coste


adicional, sólo se ha de realizar una
 
&
 
 (,)))5 en Google Display Ads con el
fin de 
   durante 3 meses

‡ Esos 25.000¼ son destinados a    






.   !
  para crear una
comunidad entorno a la marca, a través de
publicidad en YouTube (en cualquiera de sus
formatos)
8 @ 
- 
 

 
 

www.youtube.com/advertise


2 
+
 

 % 
   
&

   N   


)))    

|

You might also like