CMS Semantico

14 07 2006

Ayer comence un nuevo proyecto: Construir un Gestor de Contenidos Semántico la idea me venia dando vueltas desde hace ya un tiempo asi que comence ayer. Hoy me he decidido que hay varias propuestas de lo mismo pero nada claro. Esto es lo que estoy utilizando:

Ingredientes:

  1. Un framework en Java para crear CMSs: Lenya
  2. Un framework en Java para la Web Semántica (crear ontologias y un motor de inferencia): Jena
  3.  Uno o varios Agentes Inteligentes: No me he decidido si me lo creo personalizado o utilizo un API como el de Agglets.

Concepto:
Lenya provee los modulos necesarios para la gestión de contenidos (autenticación, publicación, edición, gestion de permisos, etc.). Para búsqueda Lenya (y todos los demás) utiliza un agente de búsqueda en seste caso Lucene. Sin embargo, dichos agentes de búsqueda no hacen sino una categorización binaria, para la Web Semántica (Web 2.0) necesitamos crear Ontologias, al tratarse de un CMS, los dominios de conocimiento para tales ontologias serán las páginas del sitio Web creadas y editadas. Por tanto no es necesario, tener un agente inteligente que navegue por toda la Web, pero no estaria mal que el agente aumente el conocimiento del Sitio a traves de la Web. Si es necesario en cambio, un agente construya una Base de Conocimiento a partir de dichas ontologías. Por último, se necesita de un Motor de Inferencia que nos permita realizar consultas en lenguaje natural y que el sistema interprete la consulta y nos devuelva respuestas válidas. (Para más información sobre este tema referirse a Wikipedia 3.0: El fin de Google).

Para armar dicha base de Conocimiento (y por tanto las ontologías) utilizaré OWL que es, básicamente, un lenguaje XML para Ontologías. Dado que la base de conocimiento esta en XML, resulta muy conveniente que el conocimiento (contenido del sitio Web) esté tambien en XML, de aqui que Lenya sea mi elección ya que guarda todo el contenido en XML y no en esquemas propietarios de bases de datos. Jena provee un API de OWL para Java así como tambien un motor para SPARQL. Lenya debe ser capaz de comunicarse bastante bien con Jena ya que tambien es un API Java y al basarse en Cocoon, permite hacer todo tipo de transformaciones XSLT, de forma que todas las piezas encajan perfectamente.

La integración de todo el sistema es básicamente remplazar las búsquedas de Lucene por consultas de SAPRQL a la Base de Conocimiento creada por un agente a partir de las ontologias formadas sobre cada página del sitio.

Ire informando del avance de este proyecto.

Anuncios

Acciones

Information

2 responses

19 07 2006
Evolving Trends » Building the Logic Mill

[…] Versión original en español CMS Semántico […]

20 07 2006
Viral One Online Marketing Agency » Towards Intelligent Findability by Eric Noam Rodriguez

[…] By Eric Noam Rodriguez (versión original en español CMS Semántico) […]

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s




A %d blogueros les gusta esto: