Web semántica
Web semántica
La Web semántica (del ingles semantic web) es un conjunto de
actividades desarrolladas en el seno de World Wide Web Consortium tendente a la creación de tecnologías para publicar datos legibles por
aplicaciones informáticas (máquinas en la terminología de la Web semántica).1 Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web. Esas informaciones adicionales —que describen el contenido, el significado
y la relación de los datos— se deben proporcionar de manera formal, para que
así sea posible evaluarlas automáticamente por máquinas de procesamiento. El
objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando
"agentes inteligentes". Agentes inteligentes son programas en las
computadoras que buscan información sin operadores humanos.
El precursor
de la idea, Tim Berners-Lee, intentó desde el principio incluir información
semántica en su creación, la World Wide Web, pero por diferentes causas
no fue posible.2 Por ese motivo introdujo el concepto de
semántica con la intención de recuperar dicha omisión.
¿Para qué sirve?
La Web ha cambiado profundamente la forma en la
que nos comunicamos, hacemos negocios y realizamos nuestro trabajo. La
comunicación prácticamente con todo el mundo en cualquier momento y a bajo
coste es posible hoy en día. Podemos realizar transacciones económicas a través
de Internet. Tenemos acceso a millones de recursos, independientemente de
nuestra situación geográfica e idioma. Todos estos factores han contribuido al
éxito de la Web. Sin embargo, al mismo tiempo, estos factores que han
propiciado el éxito de la Web, también han originado sus principales problemas:
sobrecarga de información y heterogeneidad de fuentes de información con el
consiguiente problema de interoperabilidad.
La Web Semántica ayuda a resolver estos dos
importantes problemas permitiendo a los usuarios delegar tareas en software.
Gracias a la semántica en la Web, el software es capaz de procesar su
contenido, razonar con este, combinarlo y realizar deducciones lógicas para
resolver problemas cotidianos automáticamente.
¿Cómo funciona?
Supongamos que la Web tiene la capacidad de
construir una base de conocimiento sobre las preferencias de los usuarios y
que, a través de una combinación entre su capacidad de conocimiento y la
información disponible en Internet, sea capaz de atender de forma exacta las
demandas de información por parte de los usuarios en relación, por ejemplo, a
reserva de hoteles, vuelos, médicos, libros, etc.
Si esto ocurriese así en la vida real, el
usuario, en su intento, por ejemplo, por encontrar todos los vuelos a Praga
para mañana por la mañana, obtendría unos resultados exactos sobre su búsqueda.
Sin embargo la realidad es otra. La figura 1 muestra los resultados inexactos
que se obtendrían con el uso de cualquier buscador actual, el cual ofrecería
información variada sobre Praga pero que no tiene nada que ver con lo que
realmente el usuario buscaba. El paso siguiente por parte del usuario es
realizar una búsqueda manual entre esas opciones que aparecen, con la
consiguiente dificultad y pérdida de tiempo. Con la incorporación de semántica
a la Web los resultados de la búsqueda serían exactos. La figura 2 muestra los
resultados obtenidos a través de un buscador semántico. Estos resultados
ofrecen al usuario la información exacta que estaba buscando. La ubicación geográfica
desde la que el usuario envía su pregunta es detectada de forma automática sin
necesidad de especificar el punto de partida, elementos de la oración como
"mañana" adquirirían significado, convirtiéndose en un día concreto
calculado en función de un "hoy". Algo semejante ocurriría con el
segundo "mañana", que sería interpretado como un momento determinado
del día. Todo ello a través de una Web en la que los datos pasan a ser
información llena de significado. El resultado final sería la obtención de
forma rápida y sencilla de todos los vuelos a Praga para mañana por la mañana.
Componentes de la Web Semántica
Arquitectura tecnológica de la Web Semántica
Los principales componentes de la Web Semántica
son los metalenguajes y los
estándares de representación XML, XML
Schema, RDF, RDF
Schema y OWL, así como el
lenguaje SPARQL para la
consulta de datos RDF.4 La OWL Web Ontology Language
Overview describe la función y relación de cada uno de
estos componentes de la Web Semántica:
- XML aporta la sintaxis superficial para los documentos estructurados, pero sin dotarles de ninguna restricción sobre el significado.
- XML Schema es un lenguaje para definir la estructura de los documentos XML.
- RDF es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos. Aporta una semántica básica para este modelo de datos que puede representarse mediante XML.
- RDF Schema es un vocabulario para describir las propiedades y las clases de los recursos RDF, con una semántica para establecer jerarquías de generalización entre dichas propiedades y clases.
- OWL es un lenguaje para definir ontologías mediante la descripción detallada de propiedades y clases: tales como relaciones entre clases (p.ej. disyunción), cardinalidad (por ejemplo "únicamente uno"), igualdad, tipologías de propiedades más complejas, caracterización de propiedades (por ejemplo simetría) o clases enumeradas.
- SPARQL es un lenguaje de consulta de conjuntos de datos RDF. Además en dicha especificación también se incluye un formato XML que detalla el modo en el que se estructuran los resultados obtenidos.
La usabilidad y
aprovechamiento de la Web y sus recursos interconectados puede aumentar con la
web semántica gracias a:
- Los documentos etiquetados con información semántica (compárese ésta con la etiqueta <meta> de HTML, usada para facilitar el trabajo de los robots). Se pretende que esta información sea interpretada por el ordenador con una capacidad comparable a la del lector humano. El etiquetado puede incluir metadatos descriptivos de otros aspectos documentales o protocolarios.
- Vocabularios comunes de metadatos (Ontología (Informática)) y mapas entre vocabularios que permitan a quienes elaboran los documentos disponer de nociones claras sobre cómo deben etiquetarlos para que los agentes automáticos puedan usar la información contenida en los metadatos (p.ej. el metadato author tenga el significado de "autor de la página" y no el del "autor del objeto descrito en la página").
- Agentes automáticos que realicen tareas para los usuarios de estos metadatos de la Web Semántica
- Servicios Web (a menudo con agentes propios) que provean de información a los agentes (por ejemplo un servicio de garantías a quien un agente pudiera consultar sobre si un comercio electrónico tiene un historial de mal servicio o de generar correo basura).
Los proveedores primarios de esta tecnología son
las URIs que identifican los recursos junto con XML y los namespaces. Si a esto se
añade un poco de lógica, mediante una RDF, u otras tecnologías como los mapas
temáticos y algo de razonamiento basado en técnicas de inteligencia artificial, Internet
podría estar cerca de alcanzar las aspiraciones iniciales de su inventor, Tim
Berners-Lee.
Web 3.0
Web 3.0 es una expresión que se utiliza para
describir la evolución del uso y la interacción de las personas en internet a través de
diferentes formas entre los que se incluyen la transformación de la red en una base
de datos, un movimiento social hacia crear contenidos
accesibles por múltiples aplicaciones non-browser, el empuje de
las tecnologías de inteligencia artificial, la web
semántica, la Web Geoespacial o la Web 3D. La expresión
es utilizada por los mercados para promocionar las mejoras respecto a la Web
2.0. Esta expresión Web 3.0 apareció por primera vez
en 2006 en un
artículo de Jeffrey Zeldman, crítico de
la Web 2.0 y asociado a tecnologías como AJAX. Actualmente
existe un debate considerable en torno a lo que significa Web 3.0, y cuál sea
la definición más adecuada.
Innovaciones
Las tecnologías de la Web 3.0, como programas
inteligentes, que utilizan datos semánticos, se han
implementado y usado a pequeña escala en compañías para conseguir una
manipulación de datos más
eficiente. En los últimos años, sin embargo, ha habido un mayor enfoque
dirigido a trasladar estas tecnologías de inteligencia semántica al público
general.
Bases de datos
El primer paso hacia la "Web 3.0" es el
nacimiento de la "Data Web", ya que los formatos en que se publica la
información en Internet son dispares,
como XML, RDF y
microformatos; el reciente crecimiento de la tecnología SPARQL, permite un
lenguaje estandarizado y API para la
búsqueda a través de bases de datos en la red. La "Data Web" permite
un nuevo nivel de integración de datos y aplicación inter-operable, haciendo
los datos tan accesibles y enlazables como las páginas web. La "Data
Web" es el primer paso hacia la completa “Web Semántica”. En la fase “Data
Web”, el objetivo es principalmente hacer que los datos estructurados sean
accesibles utilizando RDF. El escenario de la "Web Semántica"
ampliará su alcance en tanto que los datos estructurados e incluso, lo que tradicionalmente
se ha denominado contenido semi-estructurado (como páginas
web, documentos, etc.), esté disponible en los
formatos semánticos de RDF y OWL.2
Inteligencia artificial
Web 3.0 también ha sido utilizada para describir
el camino evolutivo de la red que conduce a la inteligencia artificial. Algunos escépticos lo ven como
una visión inalcanzable. Sin embargo, compañías como IBM y Google están
implementando nuevas tecnologías que cosechan información sorprendente, como el
hecho de hacer predicciones de canciones que serán un éxito, tomando como base
información de las webs de música de la Universidad. Existe también un debate
sobre si la fuerza conductora tras Web 3.0 serán los sistemas inteligentes, o
si la inteligencia vendrá de una
forma más orgánica, es decir, de sistemas de inteligencia humana, a través de
servicios colaborativos como del.icio.us, Flickr y Digg, que extraen
el sentido y el orden de la red existente y cómo la gente interactúa con ella.
Web semántica y SOA
Con relación a la dirección de la inteligencia
artificial, la Web 3.0 podría ser la realización y extensión del concepto de la
“Web semántica”. Las
investigaciones académicas están dirigidas a desarrollar programas que puedan razonar, basados en
descripciones lógicas y agentes inteligentes. Dichas aplicaciones, pueden
llevar a cabo razonamientos lógicos utilizando reglas que expresan relaciones
lógicas entre conceptos y datos en la red.3 Sramana Mitra difiere con
la idea de que la "Web Semántica" será la esencia de la nueva
generación de Internet y propone una fórmula para encapsular Web 3.04
Este tipo de evoluciones se apoyan en tecnologías
de llamadas asíncronas para recibir e incluir los datos dentro del visor de
forma independiente. También permiten la utilización en dispositivos móviles, o
diferentes dispositivos accesibles para personas con discapacidades, o con
diferentes idiomas sin transformar los datos.
- Para los visores: en la web, xHTML, JavaScript, Comet, AJAX, etc.
- Para los datos: Lenguajes de programación interpretados, Base de datos relacional y protocolos para solicitar los datos.
Evolución al 3D
Otro posible camino para la Web 3.0 es la
dirección hacia la visión 3D, liderada por
el Web3D Consortium. Esto
implicaría la transformación de la Web en una serie de espacios 3D, llevando
más lejos el concepto propuesto por Second
Life. Esto podría
abrir nuevas formas de conectar y colaborar, utilizando espacios
tridimensionales.6 Ya hoy en día
vemos que se realizan películas en 3D para el cine, que van sustituyendo al
sistema 2D.
Web Semántica y Web 3.0
Erróneamente se identifican los conceptos de Web
Semántica y Web 3.0. La Web Semántica es un conjunto de actividades, tal y como
indica el propio World Wide Web Consortium,5 al amparo de
las cuales se han desarrollado un conjunto de tecnologías que se aplican en
muchos ámbitos: redes sociales, publicación de datos, realización de
inferencias, marcado semántico de documentos convencionales, etc. Por su parte
la Web 3.0 se refiere a un entorno en el que aplicaciones y agentes de usuario6 intercambian
datos, los procesan e incluso realizan procesos de inferencias para generar
nueva información.
Referencias
No hay comentarios:
Publicar un comentario