martes, 16 de septiembre de 2008

Evolución de la Web hacia la Web Semántica

Últimamente se escucha hablar de la "Web Semántica", por lo que vamos a intentar explicar en qué consiste. En primer lugar hagamos un recorrido por la evolución de la Web:

- Web 1.0 : Consistía en páginas estáticas, es decir, lo que el desarrollador escribía, era lo que el usuario veía. Siempre el mismo contenido (salvo que se modificara). Podemos poner el ejemplo de una página con los teléfonos de los profesores de una universidad. Salvo que se modificara la página, siempre aparecían los mismos teléfonos.


- Web 1.5 : Aparece el contenido dinámico, es decir, dependiendo de otros factores, la información mostrada al usuario se ve modificada. Por ejemplo, la página principal de un periódico online se va actualizando con las últimas noticias. Normalmente, la página recuperará las noticias a mostrar de una base de datos. En el ejemplo anterior, los teléfonos se cogerían de la base de datos centralizada de la universidad, por ejemplo.


- Web 2.0 : El usuario participa activamente en la generación de contenidos mediante blogs, podcast, foros, etc y se relaciona con otros usuarios mediante chats ó comunidades sociales.

- Web 3.0 : Es aquí donde entra la "web semántica". Los buscadores actuales no son "inteligentes" y me explico. Si trabajo en un ayuntamiento y quiero buscar bancos para una plaza escribiré "empresa que vende bancos" y obtendré todas las páginas que contengan literalmente estas palabras (incluyendo a las entidades financieras). Las páginas que usen "asiento" en vez de "banco" no apareceran. Lo ideal sería que el buscador entendiese la búsqueda "empresa que vende objetos para descansar", pero eso actualmente no sucede.

Es decir, los buscadores buscan literalmente porque no conocen el significado de los contenidos de las páginas que analiza. Si el buscador tuviera la información "un asiento/banco es un objeto que sirve para sentarse" y "se descansa estando sentado", al realizar la búsqueda "objetos para descansar", mostraría páginas sobre asientos/bancos, aunque no se han utilizado ninguna de las dos palabras como criterios de búsqueda.

Eso es lo que intentá eliminar la web semántica. Cada página proporcionará información sobre el contenidode ella misma (lo que se conoce como metainformación). De esta manera, las páginas podrán relacionarse entre sí y los buscadores podrán realizar búsquedas más eficientes.

Por ejemplo:
En una página hablamos de Pepito Perez, que resulta ser el autor del best-seller "Escribe tu primer libro". En otra página, un blogger escribe su crítica del libro "Escribe tu primer libro" sin nombrar al autor. Si ambas páginas tienen incluida su metainformación, al realizar la búsqueda por "Pepito Perez", el buscador nos mostrará ambas páginas, aunque en la segunda no se encuentre el término que se busca.

Si existe otra página en la que se define que el tal Pepito Perez es miembro de la "Generación del Boniato", al buscar por "Generación del Boniato" saldrá la página del blogger aunque no se nombre ni al autor ni nada que tenga que ver con el Boniato.

La idea tras todo esto es que los ordenadores sepan qué información contiene una página para procesarla automáticamente. Para ello, las páginas tendrán que ser modificadas para incluirla esta metainformación. Teniendo en cuenta que existen millones de páginas, probablemente no es algo que vaya a llegar de un día para otro.

Fuente: El futuro de la web. Miguel Ángel Abián http://www.javahispano.org/contenidos/es/el_futuro_de_la_web/

No hay comentarios: