Descripció del projecte
El principal equipo de trabajo será SEMBU (Semantic Business Unit), un equipo dónde el principal activo es el conocimiento en temas de interoperabilidad y Web semántica. Contamos con perfiles muy especializados, pioneros en España en estos temas, y donde participamos contínuamente en proyectos de investigación de tecnologías relacionadas a nivel europeo.
Tenemos una cartera amplia de proyectos, ofreciendo al candidato un entorno dinámico, con multiplicidad de tecnologías y dominios de negocio, donde se podrá desarrollar y proveer a SEMBU de un conocimiento más valioso, con opción siempre de una posible incorporación al equipo al terminar el doctorando (o beca).
La temática, pues, de nuestros proyectos gira en torno tecnologías de desarrollo de web semántica y relacionadas con la definición de interoperabilidad (OWL, RDF, SKOS, XML, JAVA…). Además, participamos continuamente en proyectos de investigación a nivel europeo (H2020), donde se requieren dotes de investigación en nuevas tecnologías, siempre abarcando retos tecnológicos como la integración y la interoperabilidad.
A continuación presentamos 2 ejemplos de proyectos dónde se espera aplicar la colaboración everis-UPC:
1- CORDIS – Community Research and Development Information Service:
o Contexto: CORDIS es el portal de la Oficina de Publicaciones responsable de la publicación de todos los proyectos científicos financiados por la Comisión Europea.
o Objetivo: desarrollo de un “Knowledge Extraction and Enrichment Pipeline” para generar conocimientos específicos del contenido de CORDIS y poder producir Linked Open Data.
o Temas de investigación:
? Producción de datos enlazados y mantenimiento del grafo semántico
? Data curation y control de la calidad
? Extracción del conocimiento (reconocimiento de entidades específicas, extracción de relaciones, etc.)
? Enriquecimiento del conocimiento (desambiguación de las entidades, enlazar con entidades de referencia, etc.)
? Razonamiento y técnicas avanzadas para la validación semántica (intra e inter grafos semánticos)
? Escalabilidad y mantenimiento de la coherencia semántica de la base de conocimiento
2 – H2020 – Smart Editors:
o Contexto: contamos con una idea que se puede desarrollar en el contexto de un proyecto de financiación europea H2020, donde necesitamos a una persona altamente cualificada para trabajar y evolucionar la idea, en una colaboración estrecha de innovación e investigación con la UPC.
o Temas de investigación:
? Edición colaborativa de una base de conocimiento
? Validación del nivel de calidad de la base de conocimiento
? Escalabilidad y mantenimiento de la coherencia semántica de la base de conocimiento
En estos proyectos se han creado / crearán varias bases / fuentes de conocimiento en formato “knowledge graph” que representan un activo importante para la empresa y que permiten integrar e interoperar diversas fuentes de datos. Por ese motivo, es vital crear métodos y herramientas que (semi-)automaticen la monitorización de la calidad de las bases de conocimiento creadas. Eso implica: (i) medir cuantitativamente la calidad interna de las fuentes de conocimiento, (ii) así como la calidad de las relaciones expresadas entre ellas. De forma relevante, la monitorización debe adaptarse a la evolución de las fuentes de conocimiento y, idealmente, desarrollar métodos y herramientas que permitan corregir algunos problemas identificados. Como resultado, este proyecto busca facilitar el mantenimiento de fuentes de conocimiento.