Metodi probabilistici, teoria dei grafi e reti neurali artificiali per problemi di raggruppamento, semplificazione, classificazione e previsione
Il corso presenta diversi metodi di Data Mining e Machine Learning di tipo probabilistico – dall’analisi dei cluster model-based all’analisi delle componenti principali probabilistica, dai classificatori bayesiani alle reti bayesiane – ed introduce la teoria dei grafi e le principali reti neurali artificiali di tipo supervisionato.
Obiettivi
Il Data Mining si occupa dell’analisi dei dati, con l’obiettivo di estrarvi informazioni non visibili immediatamente ma ad alto valore aggiunto; in genere si tratta di individuare “modelli” a fini descrittivi o previsionali. Molti metodi di Data Mining poggiano su algoritmi di Machine Learning, che apprendono automaticamente i loro compiti dall’esperienza. Per una lunga (ma non esaustiva!) lista di esempi di applicazioni pratiche di queste discpline, clicca il pulsante rosso:
Applicazioni del DM e ML: alcuni esempi
Il partecipante amplierà le proprie conoscenze sulle tecniche di analisi dei cluster e delle componenti principali introdotte nel corso BASE, affrontando approcci di tipo probabilistico. Tratterà poi alcuni modelli bayesiani, basati sul celebre teorema di Bayes, la teoria dei grafi che consente di risolvere alcuni problemi decisionali di ottimizzazione ed i modelli più noti di reti neurali artificiali, utili sia a scopi previsivi che di classificazione dei dati (l’argomento viene completato nel corso AVANZATO). Ci si focalizzerà sulla formulazione dei modelli, sulle ipotesi retrostanti, sui dati richiesti, sui risultati generati e sulla loro interpretazione.
Didattica
Le lezioni mixano elementi teorici essenziali con esempi ed applicazioni pratiche su dati reali, illustrative delle varie tecniche, sfruttando software open source e software a licenza piuttosto comuni come Matlab.
Destinatari
Il campo di applicazione dei metodi di Data Mining e Machine Learning è in continua crescita ed è già oggi sterminato. Il corso è quindi rivolto ad un’ampia platea di figure professionali, con competenze e seniority diverse, interessate ad utilizzare i propri database in modo efficiente, massimizzandone il potenziale informativo.
Programma
-
Analisi dei cluster
Consente di raggruppare i dati per similitudine. Verrà discusso l’approccio basato sulla mistura di densità (es. Gaussiane), nel quale si assume che ogni dato venga generato da una di n variabili casuali e che una loro combinazione generi l’intero dataset. Per la stima dei parametri si applicherà il criterio di massimizzazione della verosimiglianza, da implementare tramite algoritmo gradient descent oppure EM. [3 ore]
-
Analisi delle componenti principali
Consente di sintetizzare molte variabili che descrivono un fenomeno, attraverso poche variabili “latenti”, facili da interpretare, che spiegano il fenomeno (quasi) come le variabili originarie. Verrà introdotta la ACP probabilistica, che estende il modello standard esaminato nel corso base, permettendo di calcolare la distribuzione di probabilità delle variabili latenti e di trattare il caso di dati mancanti. Per la stima dei parametri si applicherà l’algoritmo EM. Si accennerà anche alla ACP bayesiana, per introdurre informazioni a priori sui dati e sul modello. [5 ore]
-
Modelli bayesiani
Sono modelli che sfruttano il celebre teorema di Bayes, che consente di aggiornare la probabilità di un evento quando nuove informazioni su di esso sopraggiungono. Dopo un cenno all’inferenza bayesiana, si discuteranno i classificatori bayesiani – utili quando l’assegnazione dei dati alle classi è affetta da incertezza – e le reti bayesiane – modelli decisionali per problemi caratterizzati da relazioni incerte tra le variabili in gioco, che sfruttano i dati osservati per aggiornare le probabilità rilevanti per il decisore. [5 ore]
-
Teoria dei grafi
Permette di risolvere alcuni problemi decisionali che ammettono una rappresentazione in forma grafica, ad esempio problemi di ottimizzazione della logistica o della produzione. Verranno introdotti i concetti di base della disciplina: nodi, archi, pozzi, sorgenti; grafi orientati e non orientati; walk, cammini, cicli; grafi connessi e disconnessi; foreste, alberi e foglie; memorizzazione di un grafo, matrice di connessione e lista di adiacenza; problemi di flusso su reti a costo minimo, algoritmi risolutivi. [4 ore]
-
Reti neurali artificiali
Sono modelli di auto-apprendimento che partendo da un insieme di dati input-output, riescono a individuare relazioni nascoste tra i dati, utilizzabili a fini di classificazione o previsione. Queste relazioni possono essere molto complesse, tali da sfuggire a tecniche di esplorazione più elementari. Verrà introdotto il concetto di percettrone e generalizzato nelle reti feed-forward (reti multi-layer perceptron e radial basis function); si discuterà di approssimazione quadratica e di algoritmo di back-propagation per l’addestramento delle reti. [5 ore]
Personalizzazioni
La SFA è disponibile a valutare richieste di personalizzazione del programma del corso sotto vari profili. Puoi aggiungere argomenti funzionali agli obiettivi formativi, anche in sostituzione di argomenti in programma valutati di minor interesse. Puoi aggiungere prerequisiti, qualora tu ritenga di non avere le conoscenze di base necessarie per affrontate uno o più argomenti. Possiamo anche calibrare la didattica dando maggiore attenzione agli aspetti teorici o, viceversa, a quelli operativi.
Erogazione
Il corso prevede 22 ore di lezione erogate da uno o più Tutor della SFA; si suggerisce un minimo di 3-4 ore a settimana. Gli orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze di giorni/orari dei partecipanti, entro l’orario di servizio (08:00 – 22:00, lunedì – domenica). Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si potrà anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.
Quota di partecipazione
- 1 pacchetto da 22 ore a € 735,00 (iva esclusa), acquistabile in un’unica soluzione.
- 2 pacchetti da 11 ore l’uno a € 385,00 a pacchetto (iva esclusa), acquistabili separatamente.
La quota di partecipazione può variare in caso di personalizzazione del programma e si riferisce all’erogazione ad un solo partecipante, in aula virtuale tramite la nostra piattaforma (Tutoring Room). Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti e/o in aula tradizionale.
Corsi collegati
DM e ML: una panoramica
DM e ML per il MARKETING
Metodologie di DM e ML (BASE)
Metodologie di DM e ML (AVANZATO)
Analisi delle Serie Storiche
Vuoi maggiori informazioni?
- Scrivi allo Staff: info@matematicaonvideo.it
- Contatta il Responsabile SFA, Dott. Sandro Bencini, al 339.4169342.
- Prenota un appuntamento online con un nostro consulente oppure utilizza il form Cosa devi studiare?per spiegarci le tue esigenze.