Descripció del projecte
L’enteniment del contingut d’imatges i vídeos és un camp en plena expansió, on s’han produït grans avenços en els darrers anys, en gran mesura gràcies a l’existència d’una major quantitat de dades disponibles i al desenvolupament de tècniques d’aprenentatge profund, impulsades per l’increment de la capacitat de computació dels ordinadors. Aquest enteniment del contingut no podria haver-se desenvolupat sense tots aquests avenços. Tot i les grans millores que han aparegut en aquest camp recentment, els resultats obtinguts segueixen sense ser precisos.
L’objectiu d’aquesta tesi serà desenvolupar un sistema de comprensió del contingut d’imatges en vídeos utilitzant tècniques d’aprenentatge profund. Aquest sistema, combinant tècniques de detecció i caracterització d’imatges utilitzant descriptors locals i globals, permetrà millorar considerablement els resultats obtinguts per les tècniques actuals. Durant el transcurs de la tesi, el candidat haurà de llegir i entendre l’estat de l’art, ser capaç d’implementar-lo, i proposar noves idees per obtenir millores respecte les tècniques actuals. L’empresa Vilynx utilitzarà els resultats d’aquest doctorat per satisfer les necessitats dels seus clients d’entendre el contingut de les imatges en vídeos de notícies i esports.