Descripció del projecte

INTRODUCCIÓ
Les solucions basades en Intel·ligència Artificial (IA) i reconeixement de veu s’han convertit en eines transformadores amb un enorme potencial per canviar molts aspectes de les operacions industrials, incloent-hi l’atenció al client, la interacció entre humans i màquines, i l’automatització de processos. Aquesta tesi doctoral industrial busca millorar les capacitats dels sistemes d’IA de reconeixement de veu per adaptar-se a les necessitats canviants dels entorns industrials. A mesura que les organitzacions adopten cada vegada més interfícies i sistemes basats en la veu, la demanda de models d’IA capaços de processar i analitzar eficaçment el llenguatge parlat en temps real està en augment.

REPTES
El desenvolupament de models d’IA robustos per a l’anàlisi de veu presenta diversos reptes, com ara la gestió de variacions en els accents, els patrons de parla i el soroll de fons. A més, és crucial assegurar l’escalabilitat i l’adaptabilitat d’aquests models a diferents contextos i entorns industrials per a la seva adopció. A més a més, el manteniment i actualització dels models també són factors clau per garantir la seva eficàcia a llarg termini. També és essencial abordar les preocupacions relacionades amb la privadesa de les dades, la seguretat i la confiança de l’usuari per facilitar la integració de les tecnologies d’IA de reconeixement de veu en els processos industrials.

OBJECTIUS
L’objectiu principal d’aquest projecte és avançar en l’estat de l’art en l’anàlisi de veu per a aplicacions industrials mitjançant el desenvolupament de tècniques i metodologies innovadores que s’adaptin a les necessitats específiques del sector.

En concret, busquem:

– Millorar la precisió i la fiabilitat dels models d’IA per a l’anàlisi de veu mitjançant l’ús d’aproximacions multimodals que incorporin informació contextual addicional de fonts de text i imatges.
– Desenvolupar algoritmes escalables i adaptatius capaços de processar el llenguatge parlat en temps real, adaptant-se a variacions en accents, dialectes i condicions ambientals.
– Abordar les consideracions ètiques i reguladores associades amb el desplegament de les tecnologies d’IA de reconeixement de veu, incloent-hi qüestions de privadesa de les dades, consentiment i accessibilitat, per garantir un ús responsable en entorns industrials.
– Contribuir al desenvolupament de solucions d’IA de reconeixement de veu que permetin a les indústries millorar la productivitat, l’eficiència i l’experiència de l’usuari en diversos àmbits.



MÉS INFORMACIÓ

Si t’interessa l’oferta, omple el pdf amb les teves dades i envia´l a doctorats.industrials.recerca@gencat.cat