Professional Documents
Culture Documents
Qu es la web 2.0?
La Web 2.0 no es ms que la evolucin de la Web en la que los usuarios
dejan de ser usuarios pasivos para convertirse en usuarios activos, que
participan y contribuyen en el contenido de la red siendo capaces de crear,
dar soporte y formar parte de una sociedad y/o comunidades tanto a nivel
local como global; que se informan, comunican y generan conocimiento y
contenido.
Caractersticas
La Web 2.0 se caracteriza principalmente por la participacin del usuario
como contribuidor activo y no solo como espectador de los contenidos de la
Web (usuario pasivo). Esto queda reflejado en aspectos como:
El auge de los blogs.
El auge de las redes sociales.
Las webs creadas por los usuarios, usando plataformas de autoedicin.
El contenido agregado por los usuarios como valor clave de la Web.
El etiquetado colectivo (folcsonoma, marcadores sociales...).
La importancia del long tail.
El beta perpetuo: la Web 2.0 se inventa permanentemente.
Software de servidor
Qu es la Deep Web?
Deep Web: La web que todos conocemos representa slo el 15% de todo lo
que existe en internet, el 85 % restante es informacin secreta, privada y
mayormente prohibida. Este
tipo de informacin la
encontramos en la Deep
Web. Conocida tambin
como Internet profunda,
Invisible Web, Dark Web o
Hidden Web es todo aquel
contenido que no forma
parte del Surface Web (que
es el internet que todos
conocemos), estas pginas
no estn indexadas en los
motores de bsqueda como Google, Bing o Yahoo.
Origen
La principal causa de la existencia de la internet profunda es la
imposibilidad de los motores de bsqueda (DuckDuckGo, Google, Yahoo,
Bing, etc.) de encontrar o indexar gran parte de la informacin existente en
internet. Si los buscadores tuvieran la capacidad para acceder a toda la
informacin entonces la magnitud de la internet profunda se reducira
casi en su totalidad. No obstante, aunque los motores de bsqueda
pudieran indexar la informacin de la internet profunda esto no significara
que esta dejar de existir, ya que siempre existirn las pginas privadas.
Los motores de bsqueda no pueden acceder a la informacin de estas
pginas y solo determinados usuarios, aquellos con contraseas o cdigos
especiales, pueden hacerlo
Tamao
La internet profunda es un conjunto de sitios web y bases de datos que
buscadores comunes no pueden encontrar ya que no estn indexadas. El
contenido que se puede hallar dentro de la internet profunda es muy
amplio.
El internet se ve dividido
en dos ramas, La internet
profunda y la superficial.
La internet superficial se
compone de pginas
estticas o fijas, mientras
que la web profunda est
compuesta de pginas
dinmicas. Las pginas
estticas no dependen de
una base de datos para
desplegar su contenido
sino que residen en un
servidor en espera de ser
recuperadas, y son
bsicamente archivos HTML cuyo contenido nunca cambia. Todos los
cambios se realizan directamente en el cdigo y la nueva versin de la
pgina se carga en el servidor. Estas pginas son menos flexibles que las
pginas dinmicas. Las pginas dinmicas se crean como resultado de una
bsqueda de base de datos. El contenido se coloca en una base de datos y
se proporciona solo cuando lo solicite el usuario.
En 2010 se estim que la informacin que se encuentra en la internet
profunda es de 7500 terabytes, lo que equivale a aproximadamente 550
billones de documentos individuales. El contenido de la internet profunda es
de 400 a 550 veces mayor de lo que se puede encontrar en la internet
superficial. En comparacin, se estima que la internet superficial contiene
solo 19 terabytes de contenido y un billn de documentos individuales.
Mtodos de profundizacin
Las araas (web crawlers)
Cuando se ingresa a un buscador y se realiza una consulta, el buscador no
recorre la totalidad de internet en busca de las posibles respuestas, sino
que busca en su propia base de datos, que ha sido generada e indexada
previamente. Se utiliza el trmino araa web (en ingls web crawler) o
robots (por software, comnmente llamados "bots") inteligentes que van
haciendo bsquedas por enlaces de hipertexto de pgina en pgina,
registrando la informacin ah disponible.
El contenido que existe dentro de la internet profunda es en muy raras
ocasiones mostrado como resultado en los motores de bsqueda, ya que las
araas no rastrean bases de datos ni los extraen. Las araas no pueden
tener acceso a pginas protegidas con contraseas, algunos desarrolladores
que no desean que sus pginas sean encontradas insertan etiquetas
especiales en el cdigo para evitar que sea indexada. Las araas son
incapaces de mostrar pginas que no estn creadas en lenguaje HTML, ni
tampoco puede leer enlaces que incluyen un signo de interrogacin. Pero
ahora sitios web no creados con HTML o con signos de interrogacin estn