Transparencias de la conferencia de Éric de Villemonte, 9 de octubre

publicado a la‎(s)‎ 15 oct. 2012 1:28 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 15 oct. 2012 1:34 ]

Éric Villemonte de la Clergerie (INRIA)

Título: "Desiging and improving FRMG, a wide coverage French meta-grammar"

Archivo: Éric de Villemonte.pdf

Reunión de investigación 18 de octubre

publicado a la‎(s)‎ 2 oct. 2012 2:15 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 16 oct. 2012 7:50 ]

El día 18 de octubre la red RELISCO organizará una reunión de investigación dirigida a todos los miembros que quieran asistir que tendrá lugar a las 11.00h en la sala Carballo Calero de la facultad de filología. Nuestro conferenciante invitado, Serge Verlinde (Universidad de Lovaina), impartirá el seminario. 

Título: "Lexical error correction: yes, but how?"
Resumen:
Spelling and grammar checkers, both integrated in software or online, are well known. Language learners, however, make many lexical errors. Is it also possible to correct (automatically) these errors? Which approach do we have to choose?


Conferencia 17 de octubre

publicado a la‎(s)‎ 1 oct. 2012 3:27 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 24 oct. 2012 12:43 ]

El próximo día 17 de octubre la red RELISCO organizará una conferencia en el salón de grados de la Facultad de Filoloxía de la Universidade da Coruña, a las 13h.

Serge Verlinde
(Universidad de Lovaina) 

Título: “Interactive Language Toolbox: from old-fashioned dictionaries to state-of-the-art writing assistants


Resumen: The internet hosts many websites that provide interesting information on words. Unfortunately, many of these resources remain unknown or underused. On the Interactive Language Toolbox website, we provide a user-friendly access to a large number of sites for Dutch, English and French with specific tools for translation and reviewing (spelling, grammar and lexicon).

Conferencia 9 de octubre

publicado a la‎(s)‎ 1 oct. 2012 2:51 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 4 oct. 2012 5:17 ]

El próximo día 9 de octubre la red RELISCO organizará una conferencia en el Aula de Grados de la Facultad de Informática de la Universidade da Coruña, a las 18.00.

Éric Villemonte de la Clergerie (INRIA)

Título: "Desiging and improving FRMG, a wide coverage French meta-grammar"
Resumen:
I will present how the notion of metagrammar has been used to develop a large Tree-Adjoining Grammar (TAG) for French and focus on the description of some syntactic phenomena. The parser derived from the grammar has been tried on larger and larger corpora, and the second part of the talk will survey the long term effort that is needed to improve coverage, efficiency and accuracy. In particular, I will focus on recent experiments done to significantly improve the accuracy using machine learning techniques and existing syntactic annotations.

Transparencias de las presentaciones en la Jornada sobre Minería de Opinión

publicado a la‎(s)‎ 24 jul. 2012 5:04 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 6 nov. 2012 2:06 ]

Presentación de la red RELISCO a cargo de la coordinadora, Margarita Alonso Ramos
Archivo:
PRESENTACIÓN RED.pdf

Xosé Ramón Pichel
(Imaxin  www.imaxin.com)
Título: "COATI. Prototipo de reputación on-line multilingüe para blogs para los idiomas gallego/portugués y español".
Archivo: IMAXIN SOFTWARE.pdf

Enrique Torrejón (Bitext  www.bitext.com)
Titulo:
"NaturalOpinions y el análisis de opiniones en Twitter"

Archivo: BITEXT.pdf

Francisco Rangel (Autoritas  www.autoritas.es)

Título: "Retos de la Escucha Activa, más allá del análisis del sentimiento"

Archivo: AUTORITAS.pdf


Judith Sastre (Inbenta  www.inbenta.com)

Título: "Por una gestión semántica de las redes sociales"

Archivo: INBENTA.pdf



Diego Cobelo (Classora  es.classora.com)

Título: "Web semántica y bases de conocimiento: recursos para mejorar el análisis de contenidos"

Archivo: CLASSORA.pdf


Iván Pino (Llorente & Cuenca  www.llorenteycuenca.com)

Título: "Monitorización, Reputación y Redes"

Archivo: no disponible





Programa Jornada Universidad-Empresa 9 de julio

publicado a la‎(s)‎ 3 jul. 2012 2:40 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 4 jul. 2012 11:13 ]

Ya está disponible el programa de la jornada Universidad-Empresa sobre Minería de Opinión que tendrá lugar el 9 de julio en la Facultad de Filología de Santiago de Compostela. Las jornadas darán comienzo a las 10h con la intervención de la coordinadora de la red, Margarita Alonso Ramos, que presenterá a los diferentes grupos integrantes de ReLiSCo.

Empresas participantes en la Jornada

publicado a la‎(s)‎ 25 jun. 2012 2:29 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 4 jul. 2012 11:23 ]

En la Jornada Universidad-Empresa que tendrán lugar el lunes, 9 julio en el Salón de Grados de la USC intervendrán:

Xosé Ramón Pichel (Imaxin  www.imaxin.com)

Título: "COATI. Prototipo de reputación on-line multilingüe para blogs para los idiomas gallego/portugués y español".
Resumen:
Presentaremos un prototipo de Opinion Mining multilingüe desenvolvido por imaxin|software llamado Coati que hace un análisis de reputación online en los idiomas más usados en los blogs gallegos (gallego/portugués y español), usando técnicas de Opinion Mining. Fue un desafio poder hacer un prototipo de Opinion Mining para el gallego ya que a pesar del crecimento experimentado en los últimos años en el ámbito del Procesamiento del lenguaje natural (PLN), las investigaciones y los modelos comerciales están más focalizados en el inglés. En este trabajo, además de presentar la herramienta, propondremos una metodología semiautomática para generar recursos de Opinion Mining para el gallego aprovechando recursos del español y utilizando el portugués como variante linguística puente, que por ser por muchos considerado gallego y portugués dos variedades diferentes del mismo idioma, asegura una alta tasa de transferencia léxica con relación al galego.

Enrique Torrejón (Bitext  www.bitext.com)

Titulo: "NaturalOpinions y el análisis de opiniones en Twitter"

Resumen

Presentación en la que se expone cómo se realiza el análisis semántico de opiniones en Twitter de forma automatizada por medio software de  lingüístico desarrollado por la empresa Bitext para su servicio NaturalOpinions

Francisco Rangel (Autoritas  www.autoritas.es)

Título: "Retos de la Escucha Activa, más allá del análisis del sentimiento"

Resumen:

Hoy Internet es un inmenso recurso cargado de información susceptible de ser convertida en conocimiento útil para las organizaciones. Todo el mundo conversa en Internet, en gran variedad de canales diferentes y sobre gran variedad de temas, y en la mayoría de ellos con una característica común, la desestructuración de la información. Los retos tecnológicos a los que la escucha activa debe hacer frente se resumen en los siguientes puntos:

  • Estructuración de información desestructurada mediante tecnologías de la lengua y aprendizaje automático
  • Procesamiento en tiempo real de grandes cantidades de información (big data) mediante cloud computing
  • Análisis de relaciones e influencia mediante técnicas de análisis de red social
  • Presentación de la información mediante técnicas de visualización de datos

En su breve historia, las técnicas de estructuración de información para la escucha activa se han centrado principalmente en el análisis de la reputación (análisis del sentimiento), obviando dos cuestiones vitales para las organizaciones:

  • La reputación es sólo uno de los objetivos de la escucha activa, dentro de un marco más amplio de estrategia de comunicación online, haciendo honor a su completo significado "Active Listening, more than just paying attention" (Robertson, K.  2005)
  • Pensar que una opinión o una frase puede ser interpretada en términos de opiniones positivas, negativas o neutras, lo que se conoce como el tono de las opiniones, es una simplificación sobre la interpretación y el significado de las cosas, pues en la interpretación y en los matices está su riqueza.

Nuestro enfoque de escucha activa, implementado bajo el nombre de Cosmos y bajo el lema de "Tocamos Internet", se basa por tanto en un análisis en el continuo de las emociones, los sentimientos, los valores, proporcionando una visión confrontada de parejas de valores que denotan polaridad y que permiten al experto interpretar y extraer esos matices de significado que le aportan el valor estratégico que la organización necesita.

Judith Sastre (Inbenta  www.inbenta.com)

Título: "Por una gestión semántica de las redes sociales"

Resumen:

El sistema de Social Media Management de Inbenta permite a las compañías gestionar grandes cantidades de mensajes de usuarios procedentes de las redes sociales de una manera profesional mediante el uso de tecnologías del procesamiento del lenguaje natural y de respuestas predeterminadas.Este sistema de gestión de las redes sociales permite:
Recoger mensajes de diversas fuentes: Twitter, Facebook, foros y webs de consumidores y transformarlos en Tickets a procesar.
Análisis semántico del contenido de todos los mensajes, utilizando nuestra tecnología de búsqueda semántica. Este análisis semántico permite:
Enrutar automáticamente el mensaje (ticket) al servicio o agente correcto
Recomendar respuestas predeterminadas a los agentes para ahorrarles tiempo
Construir con el tiempo una base de datos exhaustiva de respuestas predeterminadas para facilitar el trabajo editorial del agente e identificar las principales peticiones de los usuarios.
Plataforma multi-usuario y multi-perfil y la posibilidad de crear un número ilimitado de workflows automáticos
Informes y estadísticas completos sobre la calidad de servicio y el rendimiento de los agentes

Iván Pino (Llorente & Cuenca  www.llorenteycuenca.com)

Título: "Monitorización, Reputación y Redes"

Resumen:

Las tecnologías de la lengua están abriendo un amplio abanico de posibilidades para la gestión de la reputación de las organizaciones. Internet pone a disposición de las compañías recursos y servicios que les permiten llevar a cabo las dos tareas básicas de la comunicación: escuchar y hablar. Sin embargo, la enorme complejidad que suponen ciertos factores como el volumen de información publicada, la valoración de la autoridad de las fuentes, la probabilidad de propagación de determinados contenidos o la ambigüedad de términos importantes para las empresas, está exigiendo del día a día de los profesionales que se dedican a esta labor un esfuerzo significativo para comprender estos factores y saber extraer lo mejor que ofrece el estado del arte de la tecnología en la actualidad.

Diego Cobelo (Classora  es.classora.com)

Título: "Web semántica y bases de conocimiento: recursos para mejorar el análisis de contenidos"

Resumen:

Cómo el desarrollo de la web semántica y bases de conocimiento pueden ayudar a mejorar resultados en el análisis de contenidos en facetas tales como desambigüación (como hacen los diccionarios electrónicos, tesauros y corpus) y otras posibles aplicaciones todavía por explotar.


 


Jornadas Universidad-Empresas 9 de julio

publicado a la‎(s)‎ 20 jun. 2012 5:28 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 21 jun. 2012 4:19 ]

El próximo día 9 de julio la red RELISCO organizará una jornada de empresas en el Salón de Grados de la Facultad de Filología en Santiago de Compostela. La temática de las ponencias girarán en torno a la Minería de Opiniones. Próximamente incluiremos un programa con la relación de empresas que participarán así como el contenido de las conferencias que se impartirán.

Programa Seminario 15 de junio

publicado a la‎(s)‎ 7 jun. 2012 5:22 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 7 jun. 2012 5:22 ]

Ya está disponible el programa del seminario "Parsing de dependencias" que tendrá lugar el 15 de junio en la Facultad de Informática de la UDC.

Seminario 15 de junio

publicado a la‎(s)‎ 15 may. 2012 4:53 por Rede Galega de Recursos Lingüísticos para unha Sociedade do Coñecenmento   [ actualizado el 31 may. 2012 1:02 ]

El próximo día 15 de junio la red RELISCO organizará un seminario en el aula 2.1a de la Facultad de Informática de la Universidade da Coruña. Próximamente incluiremos un programa detallado con todos los participantes y los horarios correspondientes:

Xavier Carreras (UPC)
Autores: Xavier Carreras, Michael Collins y Terry Koo
Título: "A TAG formalism for Parsing and Translation"
Resumen:

Syntactic parsing is the fundamental problem of determining the structure of natural language sentences. It is a challenging task, because syntactic structures of natural languages are recursive, and there is a significant degree of ambiguity in determining how different parts of a sentence combine together syntactically. In any computational model for parsing, the choice of grammar formalism is critical to both the representational power of the model and its computational efficiency. In this talk I will describe a variant of a Tree Adjoining Grammar (TAG) that can use a wide variety of rich features and, at the same time, has efficient algorithms. I will present two applications of our TAG. The first is a discriminative parser, a generalization of Conditional Random Fields for structured prediction that extends the framework to syntactic parsing. The second application is machine translation, where we frame the problem as a parsing task. The TAG-based translation system makes direct use of syntactic structures in modeling differences in word order between different languages, and in modeling the grammaticality of translation output. In both applications we show improvements over state-of-the-art systems.


André Martins (Carnegie Mellon University)
Autores: André Martins, Noah Smith, Mário Figueirido, Eric Xing y Pedro Aguiar
Título: "Turbo Parsing and Constrained Inference with AD^3"
Resumen:

In the first part of this talk, I will present AD^3 (Alternating Direction Dual Decomposition), a new decoding algorithm for approximate LP-MAP inference in constrained factor graphs. The LP-MAP approximation consists in ignoring global effects caused by the cycles of the graph, and can be seen as a linear relaxation of the original problem. The proposed algorithm can handle arbitrary first-order logic constraints and is suitable to massive decompositions, unlike previously proposed dual decomposition algorithms. As an intermediate step, it requires solving small quadratic programs, for which I provide closed form solutions or efficient procedures.
In the second part of the talk, I will apply this methodology to dependency syntax with rich-feature models. I will start by formulating dependency parsing as a concise integer linear program, which is relaxed for tractability. A constrained factor graph is then constructed for this problem and the relaxation is shown to be equivalent to LP-MAP inference in such graph. The resulting framework is called "turbo parsing," and includes as particular cases other parsers proposed in the literature. Finally, I will apply AD^3 for solving the relaxation. Experiments in 14 languages yield state-of-art results.


Carlos Gómez Rodríguez (Universidade da Coruña)
Autores: Carlos Gómez Rodríguez y Daniel Fernández-González.
Título: "Undirected Parsing and Buffer Transitions: Two Approaches to Improve Transition-Based Dependency Parsers"
Resumen:

A dependency parser is a system that can be used to automatically obtain the structure of natural language sentences, as expressed by directed links (dependencies) between words. One of the most widely-used types of dependency parsers are transition-based parsers, which achieve this by using a non-deterministic state machine and a model that scores transitions between its states. In this talk, I will present two different approaches to modify existing transition-based dependency parsers in order to improve their accuracy.
In the first approach, we transform the dependency parsers into variants which build an undirected graph rather than a (directed) dependency structure. The undirected graph is then converted into a directed dependency tree in a post-processing step. This technique
alleviates error propagation, as undirected parsers do not need to observe the single-head constraint.The second approach consists of enriching the parsers with simple transitions that act on buffer nodes. We define two sets of such transitions: projective buffer transitions, which create a left or right links of length one between the first two buffer nodes; and non-projective buffer transitions, which create links involving the second buffer node and the topmost stack node, allowing a limited form of non-projectivity.

Pablo Gamallo (Universidade de Santiago de Compostela)
Título: A Depurative Strategy for Dependency Parsing with Finite State Transducers

Resumen:

We describe a dependency parsing strategy based on finite state transducers, which minimizes the complexity of rules/transducers by using a technique we call /depurative/. Depurative parsing is driven by the "single-head" constraint of Dependency Grammar, and can be seen as an alternative method to the standard /constructive/ strategy. It simplifies the input string by progressively identifying and removing those words that were recognized as /dependents/ by each transducer. At the end of the depurative process, if all the dependencies in the sentence were identified, the input string should contain just one token representing the main head of the sentence. This finite-state strategy was inspired by the /Right/ and /Left Reduce/ operations used in deterministic dependency parsing.



1-10 of 22