Solo pochi attimi di attesa

Posizione corrente:

Ti trovi in: Home » Scuola di Formazione Aziendale » Analisi dei dati » Metodologie di Data Mining e Machine Learning (BASE)

Metodologie di Data Mining e Machine Learning (BASE)

Metodi e modelli di base per problemi di raggruppamento, semplificazione, classificazione, associazione e previsione

Il corso presenta diverse tecniche di Data Mining e Machine Learning di tipo algebrico – dall’analisi dei cluster distance-based al modello standard per l’analisi delle componenti principali, dai classificatori lineari e logistici agli alberi di decisione, alle regole di associazione – ed introduce la regressione lineare.

Obiettivi

Il Data Mining si occupa dell’analisi dei dati, con l’obiettivo di estrarvi informazioni non visibili immediatamente ma ad alto valore aggiunto; in genere si tratta di individuare “modelli” a fini descrittivi o previsionali. Molte tecniche di Data Mining poggiano su algoritmi di Machine Learning, che apprendono automaticamente i loro compiti dall’esperienza. Per una lunga (ma non esaustiva!) lista di esempi di applicazioni pratiche di queste discpline, clicca il pulsante rosso:

Applicazioni del DM e ML: alcuni esempi

Il partecipante imparerà alcune tecniche algebriche di analisi dei cluster – per raggruppare dati simili – e delle componenti principali – per semplificare modelli con un numero molto elevato di variabili. Affronterà quindi la regressione lineare e la classificazione lineare e logistica, utili per catalogare e prevedere un output in base ad uno o più input. Passerà poi agli alberi decisionali, che possono essere utilizzati per molteplici finalità ed infine alle regole di associazione ed alla loro principale applicazione, la Market Basket Analysis. Ci si focalizzerà sulla formulazione dei modelli, sulle ipotesi retrostanti, sui dati richiesti, sui risultati generati e sulla loro interpretazione.

Didattica

Le lezioni mixano elementi teorici essenziali con esempi ed applicazioni pratiche su dati reali, illustrative delle varie tecniche, sfruttando software open source ed software a licenza piuttosto comuni come Matlab.

Destinatari

Il campo di applicazione delle tecniche di Data Mining e Machine Learning è in continua crescita ed è già oggi sterminato. Il corso è quindi rivolto ad un’ampia platea di figure professionali, con competenze e seniority diverse, interessate ad utilizzare i propri database in modo efficiente, massimizzandone il potenziale informativo.


Data Mining e Machine Learning (corso base)

Programma

  1. Analisi dei cluster

    Consente di raggruppare i dati per similitudine. Verranno presentati gli algoritmi più comuni: quello gerarchico – che permette anche di visualizzare il processo di formazione dei cluster con il dendrogramma – ed il k-means, che determina l’appartenenza ad un gruppo in base alle distanze dalle “medie” dei vari cluster. [4 ore]

  2. Analisi delle componenti principali

    Consente di sintetizzare molte variabili che descrivono un fenomeno, attraverso poche variabili “latenti”, facili da interpretare, che spiegano il fenomeno (quasi) come le variabili originarie. Per individuare le variabili latenti verranno applicati i criteri di massimizzazione della varianza e di minimizzazione dell’errore di ricostruzione. Verrà poi introdotta la Factor Analysis, una tecnica di riduzione della dimensione dei dati con diversi punti di contatto con la PCA. [4 ore]

  3. Regressione lineare 

    Consente di stimare una relazione lineare tra una variabile di interesse ed una (regressione semplice) o più (regressione multipla) variabili che possono spiegarla. Verrà esaminato il caso in cui la relazione è affetta da errori sferici e Gaussiani; si vedrà come si stimano i suoi coefficienti e quali proprietà possiedono; si misurerà la sua capacità di spiegare i dati osservati, si vedrà come condurre test statistici sui coefficienti e come usare il modello a fini previsivi. [6 ore]

  4. Classificazione lineare e logistica

    Una procedura di classificazione assegna i dati ad una di due o più categorie o gruppi di interesse. Verranno introdotti i modelli lineari di classificazione basati su funzioni di discriminazione ed applicato l’algoritmo dei minimi quadrati per la classificazione. Verrà poi studiato l’approccio alla classificazione basato sulla regressione logistica. [4 ore]

  5. Alberi decisionali

    Sono modelli non parametrici utilizzabili sia per problemi di classificazione che di regressione. Si mostrerà come costruire l’abero (nodi, archi, foglie) basandosi sui concetti di entropia e di information gain e come limitarne la “crescita” adottando opportuni criteri di splitting e di pruning; in particolare, ci si soffermerà sull’algoritmo CART, il più popolare per la costruzione di alberi binari ed alla base di algoritimi per la costruzione di alberi più complessi. [3 ore]

  6. Market Basket Analysis

    E’ un insieme di tecniche di Data Mining utilizzate soprattutto in ambito marketing (ma non solo) per studiare i comportamenti di consumo dei clienti nella vendita al dettaglio. Si studieranno le regole di associazione tra transazioni ed item, uni e multi dimensionali, la loro implementazione tramite algoritmo Apriori ed altri algoritimi che ne migliorano l’efficienza. [3 ore]

Personalizzazioni

La SFA è disponibile a valutare richieste di personalizzazione del programma del corso sotto vari profili. Puoi aggiungere argomenti funzionali agli obiettivi formativi, anche in sostituzione di argomenti in programma valutati di minor interesse. Puoi aggiungere prerequisiti, qualora tu ritenga di non avere le conoscenze di base necessarie per affrontate uno o più argomenti. Possiamo anche calibrare la didattica dando maggiore attenzione agli aspetti teorici o, viceversa, a quelli operativi.

Erogazione

Il corso prevede 24 ore di lezione erogate da uno o più Tutor della SFA; si suggerisce un minimo di 3-4 ore a settimana. Gli orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze di giorni/orari dei partecipanti, entro l’orario di servizio (08:00 – 22:00, lunedì – domenica). Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si potrà anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.

Quota di partecipazione

  • 1 pacchetto da 24 ore a € 768,00 (iva esclusa), acquistabile in un’unica soluzione.
  • 3 pacchetti da 8 ore l’uno a € 270,00 a pacchetto (iva esclusa), acquistabili separatamente.

La quota di partecipazione può variare in caso di personalizzazione del programma e si riferisce all’erogazione ad un solo partecipante, in aula virtuale tramite la nostra piattaforma (Tutoring Room). Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti e/o in aula tradizionale.

Guida alla Tutoring Room

Corsi collegati

DM e ML: una panoramica
DM e ML per il MARKETING
Metodologie di DM e ML (INTERMEDIO)
Metodologie di DM e ML (AVANZATO)
Analisi delle Serie Storiche

Vuoi maggiori informazioni?

Scopri di cosa parliamo

Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam keywords.