Conferencia «Bases de conocimiento léxico y terminológico: el modelo ONTODIC»

Conferencia de la profesora Amparo Alcina Caudet, catedrática de la Universidad Jaume I.

(Introducción a ontologías, la organización del conocimiento en bases de conocimiento, e introducción y práctica para el uso del programa Protégé de la Universidad de Stanford)

Abierto a Estudiantes de Doctorado en Ciencias Sociales, Máster en Traducción y Mediación Intercultural y estudiantes de los Grados en Traducción e Interpretación

Día y hora: Martes 17 de octubre 

Lugar: Aula 2, Facultad de Traducción y Documentación, 13:00 (conferencia); Aula 14, 16:00-18:00 (taller práctico).

La conferencia se retransmitirá en línea. Se ruega a los interesados que envíen un correo de confirmación a doctorado.ccss@usal.es

Los diccionarios terminológicos constituyen un recurso fundamental para diversos ámbitos profesionales del lenguaje y para las diversas disciplinas. En un diccionario impreso, cada entrada incluye el término, su definición y otras informaciones lingüísticas, como su categoría gramatical, género o número. Los diccionarios bilingües o multilingües incluyen además equivalencias de traducción a otras lenguas. 

Con la aparición de los ordenadores, la información de los términos comenzó a almacenarse en bases de datos terminológicas. La estructura interna de estas bases se asemeja a una tabla con filas y columnas. Cada fila o registro recoge la información relativa a un elemento de información, por ejemplo, una palabra o término. Cada columna o campo recoge un tipo de información, por ejemplo, definición, categoria gramatical, género, número, equivalencia de traducción. 

Las bases de datos, sin embargo, no permiten representar adecuadamente muchos de los datos interesantes sobre los términos, por ejemplo, sus relaciones semánticas. Por ejemplo, el concepto mosaico contiene las características semánticas del concepto baldosa y añade otras más específicas, como el tamaño más pequeño; decimos entonces que mosaico tiene una relación semántica de hiponimia respecto a baldosa. 

Con el objetivo de conseguir recursos digitales que permitan superar la rigidez de las bases de datos, en el grupo de investigación Tecnolettra hemos investigado la metodología y técnicas más recientes de la Ingeniería del conocimiento, que desarrollan bases de conocimiento y ontologías. 

Utilizando el editor de ontologías Protégé (Universidad de Stanford), hemos diseñado un metamodelo ONTODIC para organizar en una base de conocimiento los datos lingüísticos, su clasificación y sus relaciones tanto semánticas como lingüísticas. Uno de los aspectos más interesantes es que el sistema, dotado de un razonador, realiza clasificaciones y deducciones automáticas a partir del modelo y los datos aportados, y comprueba la coherencia de la información representada. Si halla incoherencias, nos avisa para actuar en consecuencia, bien corrigiendo los datos o corrigiendo el modelo. 

En esta charla/taller, presentaremos los principales aspectos de las bases de conocimiento, el editor de ontologías Protégé y el modelo ONTODIC.