Solo pochi attimi di attesa

Posizione corrente:

Ti trovi in: Home » Scuola di Formazione Aziendale » Analisi dei dati » Metodologie di Data Mining e Machine Learning (INTERMEDIO)

Metodologie di Data Mining e Machine Learning (INTERMEDIO)

Metodi probabilistici, teoria dei grafi e reti neurali artificiali per problemi di raggruppamento, semplificazione, classificazione e previsione

Il corso presenta diversi metodi di Data Mining e Machine Learning di tipo probabilistico – dall’analisi dei cluster model-based all’analisi delle componenti principali probabilistica, dai classificatori bayesiani alle reti bayesiane – ed introduce la teoria dei grafi e le principali reti neurali artificiali di tipo supervisionato.

Obiettivi

Il Data Mining si occupa dell’analisi dei dati, con l’obiettivo di estrarvi informazioni non visibili immediatamente ma ad alto valore aggiunto; in genere si tratta di individuare “modelli” a fini descrittivi o previsionali. Molti metodi di Data Mining poggiano su algoritmi di Machine Learning, che apprendono automaticamente i loro compiti dall’esperienza. Per una lunga (ma non esaustiva!) lista di esempi di applicazioni pratiche di queste discpline, clicca il pulsante rosso:

Applicazioni del DM e ML: alcuni esempi

Il partecipante amplierà le proprie conoscenze sulle tecniche di analisi dei cluster e delle componenti principali introdotte nel corso BASE, affrontando approcci di tipo probabilistico. Tratterà poi alcuni modelli bayesiani, basati sul celebre teorema di Bayes, la teoria dei grafi che consente di risolvere alcuni problemi decisionali di ottimizzazione ed i modelli più noti di reti neurali artificiali, utili sia a scopi previsivi che di classificazione dei dati (l’argomento viene completato nel corso AVANZATO). Ci si focalizzerà sulla formulazione dei modelli, sulle ipotesi retrostanti, sui dati richiesti, sui risultati generati e sulla loro interpretazione.

Didattica

Le lezioni mixano elementi teorici essenziali con esempi ed applicazioni pratiche su dati reali, illustrative delle varie tecniche, sfruttando software open source e software a licenza piuttosto comuni come Matlab.

Destinatari

Il campo di applicazione dei metodi di Data Mining e Machine Learning è in continua crescita ed è già oggi sterminato. Il corso è quindi rivolto ad un’ampia platea di figure professionali, con competenze e seniority diverse, interessate ad utilizzare i propri database in modo efficiente, massimizzandone il potenziale informativo.

Metodi di Data Mining e Machine Learning

Programma

  1. Analisi dei cluster

    Consente di raggruppare i dati per similitudine. Verrà discusso l’approccio basato sulla mistura di densità (es. Gaussiane), nel quale si assume che ogni dato venga generato da una di n variabili casuali e che una loro combinazione generi l’intero dataset. Per la stima dei parametri si applicherà il criterio di massimizzazione della verosimiglianza, da implementare tramite algoritmo gradient descent oppure EM.  [3 ore]

  2. Analisi delle componenti principali

    Consente di sintetizzare molte variabili che descrivono un fenomeno, attraverso poche variabili “latenti”, facili da interpretare, che spiegano il fenomeno (quasi) come le variabili originarie. Verrà introdotta la ACP probabilistica, che estende il modello standard esaminato nel corso base, permettendo di calcolare la distribuzione di probabilità delle variabili latenti e di trattare il caso di dati mancanti. Per la stima dei parametri si applicherà l’algoritmo EM. Si accennerà anche alla ACP bayesiana, per introdurre informazioni a priori sui dati e sul modello. [5 ore]

  3. Modelli bayesiani

    Sono modelli che sfruttano il celebre teorema di Bayes, che consente di aggiornare la probabilità di un evento quando nuove informazioni su di esso sopraggiungono. Dopo un cenno all’inferenza bayesiana, si discuteranno i classificatori bayesiani – utili quando l’assegnazione dei dati alle classi è affetta da incertezza – e le reti bayesiane – modelli decisionali per problemi caratterizzati da relazioni incerte tra le variabili in gioco, che sfruttano i dati osservati per aggiornare le probabilità rilevanti per il decisore. [5 ore]

  4. Teoria dei grafi

    Permette di risolvere alcuni problemi decisionali che ammettono una rappresentazione in forma grafica, ad esempio problemi di ottimizzazione della logistica o della produzione. Verranno introdotti i concetti di base della disciplina: nodi, archi, pozzi, sorgenti; grafi orientati e non orientati; walk, cammini, cicli; grafi connessi e disconnessi; foreste, alberi e foglie; memorizzazione di un grafo, matrice di connessione e lista di adiacenza; problemi di flusso su reti a costo minimo, algoritmi risolutivi. [4 ore]

  5. Reti neurali artificiali

    Sono modelli di auto-apprendimento che partendo da un insieme di dati input-output, riescono a individuare relazioni nascoste tra i dati, utilizzabili a fini di classificazione o previsione. Queste relazioni possono essere molto complesse, tali da sfuggire a tecniche di esplorazione più elementari. Verrà introdotto il concetto di percettrone e generalizzato nelle reti feed-forward (reti multi-layer perceptron e radial basis function); si discuterà di approssimazione quadratica e di algoritmo di back-propagation per l’addestramento delle reti. [5 ore]

Personalizzazioni

La SFA è disponibile a valutare richieste di personalizzazione del programma del corso sotto vari profili. Puoi aggiungere argomenti funzionali agli obiettivi formativi, anche in sostituzione di argomenti in programma valutati di minor interesse. Puoi aggiungere prerequisiti, qualora tu ritenga di non avere le conoscenze di base necessarie per affrontate uno o più argomenti. Possiamo anche calibrare la didattica dando maggiore attenzione agli aspetti teorici o, viceversa, a quelli operativi.

Erogazione

Il corso prevede 22 ore di lezione erogate da uno o più Tutor della SFA; si suggerisce un minimo di 3-4 ore a settimana. Gli orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze di giorni/orari dei partecipanti, entro l’orario di servizio (08:00 – 22:00, lunedì – domenica). Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si potrà anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.

Quota di partecipazione

  • 1 pacchetto da 22 ore a € 704,00 (iva esclusa), acquistabile in un’unica soluzione.
  • 2 pacchetti da 11 ore l’uno a € 250,00 a pacchetto (iva esclusa), acquistabili separatamente.

La quota di partecipazione può variare in caso di personalizzazione del programma e si riferisce all’erogazione ad un solo partecipante, in aula virtuale tramite la nostra piattaforma (Tutoring Room). Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti e/o in aula tradizionale.

Guida alla Tutoring Room

Corsi collegati

DM e ML: una panoramica
DM e ML per il MARKETING
Metodologie di DM e ML (BASE)
Metodologie di DM e ML (AVANZATO)
Analisi delle Serie Storiche

Vuoi maggiori informazioni?

Scopri di cosa parliamo

Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam keywords.