Descripció del projecte
L’aprenentatge automàtic (machine learning en anglès) és una branca de la intel-ligència artificial que busca desenvolupar nous algoritmes i metodologies per extreure coneixement fruit de dades històriques o bé la interacció amb el medi. Aquest coneixement és emprat amb diferents objectius, ja sigui oferir suport a la decisió en forma de prediccions, simulacions, detecció d’estructures, classificació, o control òptim, entre d’altres.
L’aprenentatge automàtic es serveix de diverses disciplines: l’estadística per al tractament de grans dades (big data) o la construcció de models, l’optimització per al desenvolupament de solucions millorades, o la informàtica per a la implementació dels algoritmes desenvolupats.
Centrant-nos en el context industrial, aquest es troba immers en una revolució digital (Indústria 4.0), que es centra en interconnectar tots els diferents elements que participen de les diferents cadenes de valor (incloent els diferents departaments d’una empresa, processos productius en planta, així com clients i proveïdors). L’ús holístic de la informació, permet a les empreses ser més eficients, requisit indispensable en un marc socioeconòmic cada cop més globalitzat i competitiu.
Una de les línies de recerca més rellevants i amb major potencial és la de dotar als diferents processos industrials de major autonomia. Considerem autonomia com la capacitat dels diferents processos i maquinària de prendre consciència de l’entorn, i que els mateixos s’hi adaptin de forma òptima, inclòs en els casos en què no disposem d’experiència prèvia.
Per donar resposta a aquests reptes industrials usant machine learning, existeixen diferents grups d’algorismes que es poden classificar segons el tipus de problema que pretenen resoldre: l’aprenentatge supervisat, el no supervisat, i l’aprenentatge per reforç. L’aprenentatge per reforç és una aproximació computacional per entendre i automitzar l’aprenentatge orientat a objectius, així com la presa de decisions. Es diferencia d’altres aproximacions computacionals per la seva èmfasi en l’aprenantege d’un agent fruit de la seva interacció directa amb el seu entorn, sense requerir models complets de l’entorn.
El principal objectiu d’aquest projecte és proposar nous mètodes basats en aprenentage per reforç, així com avaluar-ne l’efectivitat envers altres mètodes ja més madurs en l’entorn industrial, com poden ser aproximacions de control òptim mitjançant mètodes d’optimització.