Seminario 2 de mayo

Fecha de publicación: 10-abr-2012 12:14:49

El próximo día 2 de mayo la red RELISCO organizará un seminario en la Facultad de Informática de la Universidade da Coruña. Próximamente incluiremos un programa detallado con todos los participantes y los horarios correspondientes. A continuación indicamos dos de los visitantes que intervendrán y un resumen sobre el contenido de su conferencia:

Gaël Dias (University of Caen Basse-Normandi) con el título "Information Digestion".

Resumen:

The World Wide Web (WWW) is a huge information network within which searching for relevant quality contents remains an open question. The ambiguity of natural language is traditionally the main reason, which prevents search engines from retrieving information according to users' needs. However, the globalized access to the WWW via weblogs or social networks has highlighted new problems. Web documents tend to be subjective, they mainly refer to actual events to the detriment of past events and their ever growing number contributes to the well-known problem of Information Overload. In this presentation, we present our contributions to digest information in real-world heterogeneous text environments (i.e. the Web) thus leveraging users' e fforts to encounter relevant quality information. Within this context, we will specifically focus on presenting language-independent methodologies to extract implicit and explicit knowledge from real-world texts, thus allowing to reach Multilingual Information Digestion.

Luis Pérez Freire (Gradiant: Centro Tecnolóxico de Telecomunicacións de Galicia) con el título "Content-based multimedia information retrieval: current research challenges in high-level understanding"

Autores: Daniel González Jiménez, Luis Pérez Freire

Resumen:

Multimedia information retrieval is about the extraction of knowledge from all kind of multimedia contents.

Content-based multimedia information retrieval (CBMIR) is the field that addresses techniques for knowledge extraction from multimedia contents when tags or text annotations are not available. Even when text descriptions are available, CBMIR can increase accuracy and provide a deeper level of understanding. This talk will provide an overview of CBMIR techniques for audiovisual contents and the hottest research topics related to high-level understanding, mainly focusing on the analysis of human signals for inferring affective states, identity, demographics, and actions.

Milagros Fernández Gavilanes (Grupo COLE - Universidade de Vigo) "Un modelo de recuperación semántica conceptual"

Resumen:

Introducimos un entorno de adquisición y representación de información a partir de técnicas de procesamiento del lenguaje natural que permite la integración de conocimiento lingüístico en las aplicaciones de recuperación de información en base a un modelo matemático bien definido. El objetivo práctico es facilitar el mantenimiento de la aplicación resultante, así como su trazabilidad, genericidad, accesibilidad a todo tipo de usuarios y un comportamiento predecible. La interpretación matemática de la semántica descansa en la noción de grafo conceptual, que servirá de base a la indexación y posterior localización de los textos mediante un mecanismo de emparejamiento aproximado de patrones basado en la proyección y generalización de grafos.

Adrián Blanco González (Grupo COLE - Universidade de Vigo) "Evaluación del modelo de RI conceptual"

Resumen:

Habitualmente, la consideración del modelo de recuperación de información conceptual se ha justificado por la ventaja que supone en este tipo de aplicaciones la facilidad para integrar conocimiento lingüístico en base a un modelo matemático bien definido, así como su trazabilidad, genericidad, accesibilidad a todo tipo de usuarios y un comportamiento predecible. Sin embargo, también a menudo se ha argumentado que las expectativas se habrían sobrevalorado y que en la práctica el rendimiento no era el esperado, de manera que el esfuerzo requerido para su implementación no se veía compensado. En este trabajo, tratamos de disipar la duda planteada evaluando en detalle las características del modelo conceptual para demostrar que las capacidades operativas exhibidas son superiores a las de los modelos clásicos en uso o, en el peor de los casos, análogas.

Jesús Vilares Ferro (Grupo LYS - Universidade da Coruña) "Subword-Level Pseudo-Translation for CLIR Using Parallel Corpora"

Resumen:

Cross-Language Information Retrieval (CLIR) is a particular case of IR where queries and documents are in different languages, thus requiring the use of Machine Translation (MT) techniques for making matching possible. Word and phrase-level translation approaches have been commonly used in this context. However, translation at character $n-grams$ level ---or pseudo-translation, properly speaking--- appears as an alternative for retrieval purposes. This is a knowledge-light approach which avoids the need for word normalization during indexing or translation, and also dealing with out-of-vocabulary words. Moreover, since such a solution does not rely on language-specific processing, only needeing a parallel corpus as input, it can be used with languages of very different natures even when linguistic information and resources are scarce or unavailable.

Daniel Fernández González (Grupo COLE - Universidade de Vigo) "Análisis de dependencias basado en transiciones"

Resumen:

Una de las representaciones sintácticas que ha suscitado mayor interés dentro de la comunidad del procesamiento del lenguaje natural en los últimos años ha sido el análisis de dependencias. Bajo esta motivación, han surgido diferentes analizadores de dependencias entre los que destacamos los analizadores basados en transiciones. Con el fin de mejorar la precisión del análisis ofrecido por estos últimos se han abordado dos enfoques diferentes. Por un lado, desarrollar analizadores no dirigidos basados en transiciones y, por el otro, ampliar el conjunto de transiciones de los analizadores.