Jueves, 25 de agosto de 2005
Gilad Mishne de la Universidad de Amsterdam ha estado investigando sobre la clasificación de los post basada en el estado de ánimo y humor del autor del blog, y todo ello usando una máquina que irá aprendiendo con la retroalimentación: Experiments with Mood Classification in Blog Posts (PDF)
We present preliminary work on classifying blog text according to the mood reported by its author during the writing. Our data consists of a large collection of blog posts – online diary entries – which include an indication of the writer’s mood. We obtain modest, but consistent improvements over a baseline; our results show that further increasing the amount of available training data will lead to an additional increase in accuracy. Additionally, we show that the classification accuracy, although low, is not substantially worse than human performance on the same task. Our main finding is that mood classification is a challenging task using current text analysis methods.
Por: Catuxa |Clasificado en: Internet | Comentarios (2) | Referencias (0) | Leído 726 veces | Menéalo | Guarda este post en Del.icio.us o Furl
Etiquetado como: internet
Me parece muy complicado (y muy pretencioso) pretender clasificar textos en categorías como aburrimiento, alegría, tristeza...
Cada uno expresamos esos estados de una forma muy personal que no tiene porque entrar dentro de una categoría rígida.
Para poder hacerlo con cierto rigor, primero tendría que conocer bien la personalidad del blogger.
Sino, más que clasificar los post, este robot acabaría clasificando a los bloggers (perfil psicológico incluído): bloggers aburridos, optimistas, pesimistas, plastas...
Pero eso no hace falta que nos lo diga ninguna máquina. Ya nos damos cuenta.
Maria Elena Mateo | 25-08-2005 22:41:28
El tema es demasiado complicado como tu dices Maria Elena, pero podría ser interesante para lo que llaman Voice Tagging: Capturar las emociones que nos sugieren las primeras impresiones de los documentos (fotos, musica,...) lo que denomina "emotitags", que hemos comentado en Exprimiendo el tagging
Catuxa | 29-08-2005 08:40:33
Cajón desastre sobre biblioteconomía y documentación, TICs y gestión del conocimiento.
Esta obra está bajo una licencia
de Creative Commons.
Basado en plantilla de Studio.st
Online gracias a Bitacoras.com