Descripció del projecte

En aquest projecte d’investigació es participarà en el desenvolupament d’un nou model fundacional de grafs (Graph Foundational Model) que té per objectiu l’aprenentatge a gran escala dels processos biològics que tenen relació amb el càncer a partir de dades biomèdiques multi-òmiques. Aquest model fundacional permetrà aplicar tot aquest coneixement a diferents àrees d’investigació sobre el càncer, sense necessitat de reentrenar (zero-shot) o amb un mínim ajust (fine-tunning).

Entre d’altres factors, aquest projecte abordarà un problema fonamental en els conjunts de dades biomèdics, que és el problema conegut com HDLSS (High-dimension, low-sample-size). El problema HDLSS apareix quan el número de mostres (n) és molt més petit que el número d’atributs (d). Això provoca una mala generalització dels models d’aprenentatge automàtic clàssics degut al sobre-ajustament (overfitting) i a la manca de suport estadístic. Aquest és un escenari molt comú en el camp de la biomedicina, on en la majoria de casos és molt difícil recollir un gran número de mostres, però cada una d’elles és descrita amb centenars o inclús milers d’atributs. Aquesta situació fa que la representació tabular utilitzada tradicionalment no sigui la més adequada per aquest entorn.

Per demostrar la generalitat de la solució proposada, el projecte també abordarà l’aplicació d’aquesta mateixa arquitectura en altres entorns, com poden ser el de les xarxes de computadors i el de la ciberseguretat, on es presenten reptes semblants.



MÉS INFORMACIÓ

Si t’interessa l’oferta, omple el pdf amb les teves dades i envia´l a doctorats.industrials.recerca@gencat.cat