Professional Documents
Culture Documents
|
°
Presentación
Buscadores
± Buscadores y GSA
± p
±
p
± Arquitectura del buscador Federado
± Plataforma del Conocimiento
± Complementos del Buscador (Widgets y Gadgets)
± Novedades GSA 6.X
± Aplicaciones OneBox
Geolocalización
± Google Maps
±
± Integración con otros sistemas GIS
Contenido de videos en web Públicas
± YouTube
±
± Como crear tu propio canal en YouTube
Dudas y Preguntas
!
± Vicedecano de la Facultad de Humanidades, Comunicación y
Documentación
± Universidad Carlos III de Madrid
p
"#
± Jefe del Servicio de Difusión Electrónica y Publicaciones
± Subdirección General de Innovación y Programas de
Atención al Ciudadano, Ministerio de la Presidencia
± Jefe de Área de Información y Documentación
± Sub. Gral. de Publicaciones, Información y Documentación,
Ministerio de Cultura
± Gerente de Cuenta
± Área de Soluciones Colaborativas Eptisa TI
Interdisciplinar
p
J
ð
Búsqueda Universal
Internet Google
Empresa:
Google desktop
Mi Equipo
ð
Rendimiento Presentación
Contenidos
: GSA busca
|: Petición de búsqueda los resultados
):Indexación
más relevantes
en el índice
Usuario
: GSA
(: Dependiendo de los parámetros de comprueba la
búsqueda, GSA devuelve un documento ': GSA Genera un
XML o un documento HTML, mediante
#
&
documento XML con de cada posible
la aplicación de una hoja de estilo XSLT los resultados resultado, si es
necesario
XML
!
± Vicedecano de la Facultad de Humanidades,
Comunicación y Documentación
± Universidad Carlos III de Madrid
|
p
!
"#
"#
$
% & ' (
(
)
("
(
||
Contexto de la investigación
TECNODOC Ú
!
"
#
$$$
%
(
)
*
*
*
*
*
+
" $
principios del año 2009*
,
" p
*
|*
*
-
*
J-
|
=deas iniciales
"
relaciones tecnológicas
motores de búsqueda en =nternet +
sedes web de la
administración pública
+
+
"
relaciones*
*
.
robots.txt +*
*
sitemap.xml
)
" /
.
)
+*
*
0
disibilidad de
los sitios web
|
El fichero robots.txt
" /
1
1
V
.
ëETA de HTë
"
*
1
. *
1
|
*
The Robots
Exclusion Protocol &3'
Ú
))) 0
!
"
fichero de texto plano*
(4
)
+
+
5 #
1
(
User-agent
+
&
) '
V
5 #
1
(
Disallow
+
+
V
# -
6 # -
6 # -
2)
- 2)
- +7
2)
# -
# -
2)
7
2)
|J
El fichero sitemap.xml
"
*
*
8 +
%
Xë Sitemaps Protocol *
*
h
*
1
.
V
" 2
Sitemaps.org Ú
)))
!*
9
*
1
*
:%/
#3/
última actualización*
frecuencia
de modificación
importancia
1
#3/
;
" #
datos concretos
1
*
*
índice a distintos ficheros
sitemap & '
|
El fichero sitemap.xml
à °ndice de sitemaps
Ejemplo 1 Ejemplo 2
<=0 >?| ?
>?#@A-?=B <=0 >?| ?
>?#@A-?=B
< 0 >?))) ?B < 0
< B 0 >?))) ?B
<B))) 0 <B <B
<BJ-|-|<B <B))) 0 | 0 4<B
< B +< B <B
-|-|@| |E<B
< +B < +B <B
< B <B
< B <B))) 0 0 4<B
<BJ-|-|<B
<B))) 0 =>|C> <B
D)<B < 0B
< B)7+< B
< B
< B
|
a investigación: obtención de datos
)
,
0
+
4
)
+
4
"
)
060.es Ú
)))
!
4
)
,
4108 sitios
web distintos
#
programa propio
0
+
0
&+
'
(4
" /
robots.txt
análisis sintáctico
.
(
Ú
"
sitemap.xml
validador
Xë
(
Ú
!
|
a investigación: resultados obtenidos
" 2
4108 sitios web 4*
715 sitios &|*
F'
+
robots.txt válido*
+
130 sitios
& *|F'
1
sitemaps
|
a investigación: resultados obtenidos
5 /
+
a investigación: resultados obtenidos
5 2
715 ficheros*
4
1
1.995
irregularidades
J
+
|
" /
principales errores
*
+ *
(
" /
principales advertencias
(
*
*
*
9# - 9
9);
&
) '
5
User-agent
1
*
&
2
@
- ))) 0
- '
"
*
1
User-agent
&
F'
" /
)
+
0
344
robots distintos & -F-*
-$ -|F- +
5 *F-'
|
a investigación: resultados obtenidos
5 2
|
4*
657 sitios distintos
(
D 0*
de 3.145 ficheros descargados
& 0*
4*
0 4*
D 0 0*
D 0 4
+
5
*
9falsos positivos;
130
:%/
&
0*
4C
D 0'*
1
5
gran mayoría de los casos*
ficheros
básicos*
0
*
índice de sitemaps
&|
*F'
5
*
escaso nivel de detalle
2*
*
*
G
Ayuntamiento de San Sebastián Ú
))) 0
!
a investigación: conclusiones
1
4.000 mil sitios web analizados
17%
(
robots.txt válido &
*
*
1
F
#
'
+
3%
(
sitemap.xml
"
98¶60%
0
0
todos los motores &*'
V
&
'*
1
&||
'
+
-$
&J
'
criterio de exclusión &2)'
directorio raíz
&
'*
*
)
0
+*
*
.
"
uso de sitemaps
4
)
@.
(*
)
,
*
3¶16%
*
*
H F
robots.txt y sitemap.xml
ð
A
J
ð
A
ð
A
Objetivos Buscador
± Buscador federado de localización de información en la
Red 060 y otros Organismos Afiliados
ð
A
ð
A
& ,
³El buscador de todos, y el de cada uno´
± Posibilidad de utilizar como buscador Principal sobre Contenidos
Propios de otras AA.PP.:
Personalizable
Completamente integrado
Con posibilidad de ofrecer resultados de otras AA.PP.
ð
A
|
ð
A
± Buscador.gob.es
ð
A
ð
A
-
- $
4:
2: buscador.060.es/search?q=TERMINO 3: HTML
J
- $
4
2
3: XML
ë
$
.
GSA 6.0 ± El mayor lanzamiento
Dynamic scalability desde la original
GSA-to-GSA Unification JUNIO 2009
Introducing GB-9009, 30M docs in 5U form
GB-7007 platform from 500k to 10M docs
1
#
12 Nuevas
Introducing early-binding security
Batch authorization on SAML API
Mejoras
Collection and Node biasing
Results ranking framework
Search box for Google Sites and SharePoint
Administrative API
{
%+
.%
Google suggest for Enterprise
User added results & language bundles
%
-2 .
÷ Universal Login for Heterogeneous Security Systems
Support for multiple cookie domains
÷
÷ Support for multiple identities in SAML SPI 14 Nuevas
$%
. Mejoras
÷ Self-learning Scorer
÷ Composite Collections
÷ Advanced Language Phrase Segmenting
p-
.
÷ Native Integration with SharePoint
÷ Expanded File Share support (Labs)
÷ Expanded Database support (Labs)
÷ Lotus Notes (Labs)
|
%
:
#
!
*+
3
&
%
:
API de Administración
± Permite automatizar las tareas comunes para que los
usuarios puedan auto gestionar dichas tareas.
± XML-based Gdata APIs para todas las funcionalidades
administrativas
± Posibilidad de gestionar una GSA o una red de GSAs
unificadas
%
:
Sugerencias de Búsqueda
± Basadas en las búsquedas de los usuarios y el
contenido empresarial
%
:
Real-time
J
I -ð0
Acceso a la
información de
negocio en
tiempo real
I ð0
Ejemplos:
p
*
p
%
%
5
J)
J
%
5
J|
%
5 I
$
+
&
: permite obtener
las coordenadas geográficas de nuestras oficinas o recursos
sobre el mapa en base a su dirección
&
4permite obtener
tu posición actual (vía GPS, IP o Redes Wi-Fi)
$%: permite localizar negocios o servicios
situados cerca de la posición geográfica que se le indique
p
/$
4 servicio que nos devuelve la
elevación de un punto
J
%
5 /
ð
J
#! #
± Jefe de Área de Información y Documentación
± Sub. Gral. de Publicaciones, Información y Documentación
± Ministerio de Cultura
J
p*
*
* '
JJ
°K2$
"
0
" 3
" 2
A
"
J
0
"
4
" 2
1
5 %
5
5 ð
5 ð
%
#KI
5
(
$K%
5
0 *
5 L
L
+
4
J
" +
%
5 I
I
*
&
%'
5 )))
J
/4
-
3
4
K
J
M
%
2
J
4
+
|
" / 4
"
5
%
+
|
%
,
5
J
5 J
ð
5
|
,
%
#KI
"
%
9
4;
" ,
1
)
%#
"
" $
5 $
J)
5 9
;
5 $
5 L
%
-
J
$
$
de otros sistemas o servicios GIS
± Google maps permite cargar directamente datos en los
siguientes formatos
KML o KMZ
GeoRSS
Servicios WMS
p
p
8 @
8 @
- ð
#! #
± Jefe de Área de Información y Documentación
± Sub. Gral. de Publicaciones, Información y Documentación
± Ministerio de Cultura
p
-
.
/
*
* '
|
%#
0
" %#
5 0
5 I
.
5
5
5 &L'
" $
G
%#L
L
%#
"
8
5
5 /
5
5 &L'
" I
5 2
%
5
)
5
0
%#
2
+
(
& -
|'
%#
-
|
&
'
|
|
128
|
99
79
40 33 42
26
18
(
"
%*
8
9
4;
"
%
0
)
" $
%#
9 (
;
"
9 ;
J
%#
8 @ - @
± No permite personalización, ni identidad corporativa
± Incluye publicidad de terceros
%
± Permite personalizar el look & feel, incluido un banner
de encabezamiento con link a tu web
± Sin publicidad de terceros
± Dispones de un ³Branding box´ para mostrar tu propio
mensaje publicitario bajo el video destacado
± Paginas de visionado de videos personalizadas con tu
banner
8 @
5
Ejército
www.youtube.com/todosoldados
Tecnimap 2010
www.youtube.com/user/tecnimap2010
8 @
-
www.youtube.com/advertise
2
+
%
&
|