Martes, 09 de agosto de 2005
IBM apuesta por la búsqueda basada en conceptos, en lugar de las tradicionales palabras clave, recuperar los datos en las redes corporativas.
El director de tecnologías de búsquedas de IBM Research, Arthur Ciccolo, resaltó la ausencia de investigación en este camino por parte de las grandes compañías de búsquedas en Internet, como Google, Yahoo y Microsoft se sigueen centradas en la Web pública, dejando a un lado la recuperación de información en la Intranets, y dado el volumen de datos que cada día generan, intercambian y almacenan las esmepresas, no debe ser, en absoluto, un tema para dejar en el olvido.
IBM, que recientemente presentó el proyecto de la nueva arquitectura de información de su Intranet, apostando por las folksonomías, pondrá a disposición del público Unstructured Information Management Architecture (UIMA), una tecnología que promete analizar textos, entre documentos y otros medios, para entender contenidos latentes, relaciones y hechos.
Por: Catuxa |Clasificado en: Recuperación de la información | Comentarios (8) | Referencias (0) | Leído 904 veces | Menéalo | Guarda este post en Del.icio.us o Furl
Etiquetado como: intranets
No se hasta que punto la búsqueda de datos sin estructurar puede ser realizada de manera más o menos lógica por una máquina (me lio mucho con estos términos la verdad), aunque en el gráfico parece que lo que hace el software es precisamente estructurar los datos "sobre la marcha" (seguramente estoy equivocado). Este proyecto de IBM me resulta bastante confuso, sobre todo porque dicen que se basa en "conceptos" y no en palabras clave. Pero no todo el mundo utiliza un concepto en el mismo sentido no? Para unificar sentidos, ¿no necesitaríamos...las palabras clave? Por otra parte, siendo un proyecto en el que está metido el Departamento de Defensa americano, seguro que se guardan lo mejor para ellos.
Guillermo | 12-08-2005 10:12:16
Hombre, el proyecto tiene muy buena pinta. He estado revisando la página de IBM y se puede descargar "algo que funciona", no sé si es todo el toolkit y una versión reducida y se guardan algo para ellos.
De todas formas, Google News es un claro ejemplo de lo que se puede llegar a hacer para obtener algo estructurado a partir de miles de fuentes, todas ellas distintas entre sí.
Fernando | 12-08-2005 13:49:10
Guillermo tan solo conozco del proyecto lo que he leído en su web y he resumido en el post, tampoco puedo comentar nadamás de la parte técnica y del intringulis de cómo funciona UIMA puesto que me faltan conocimientos técnicos y especícos de procesamiento de conceptos por medio de robots, pero Fernando creo que está trabajando en ese campo y quizás nos ilumine un poco.
Y al menos, como apunta Fernando nos permiten acceder a una demostración de su proyecto (sin duda se guardan muchas cosas para ellos!!!).
Catuxa | 12-08-2005 14:01:49
Mi comentario anterior tan sólo eran unas reflexiones hechas tras una primera lectura del artículo (no quería dar la impresión de estar en contra). Lo cierto es que yo tampoco creo tener los suficientes conocimientos técnicos sobre cómo funciona esto. Esperaremos a que Fernando nos pueda iluminar algo más porque parece interesante.
Guillermo | 12-08-2005 16:31:23
Jejeje, pues el iluminador de momento dice que ha de instalar el Java en su portátil. Sin embargo prometo comentar alguna cosilla pronto.
Fernando | 12-08-2005 19:48:30
Guillermo, entendí tu comentario como unas reflexiones, disculpa si mi constestación parecía decir otra cosa. Esperaremos al "iluminador"... seguro que logramos aprender algo del asunto, a ver esas clases, Fernando...
Catuxa | 16-08-2005 08:47:55
Pues llevo dos días pegándome con el Java en Linux y no hay forma. Le tendré que robar el ordenador a mi hermana para poder utilizarlo en Windows :S
Fernando | 18-08-2005 10:44:58
¿La tiranía de Windows? Te seguimos la pista Fernando a ver si nos puedes contar más sobre el tema :)
Catuxa | 18-08-2005 11:45:10
Cajón desastre sobre biblioteconomía y documentación, TICs y gestión del conocimiento.
Esta obra está bajo una licencia
de Creative Commons.
Basado en plantilla de Studio.st
Online gracias a Bitacoras.com