Solo pochi attimi di attesa

Posizione corrente:

Ti trovi in: Home » Scuola di Formazione Aziendale » Analisi dei dati » Metodologie di Data Mining e Machine Learning (AVANZATO)

Metodologie di Data Mining e Machine Learning (AVANZATO)

Ottimizzazione, web mining, reti neurali artificiali e support vector machines per problemi di classificazione, previsione e riconoscimento

Il corso presenta diverse tecniche di Data Mining e Machine Learning relativamente avanzate – dai metodi del Web Mining e dell’Information Retrieval alle reti neurali artificiali, alle macchine a vettori di supporto – ed introduce alcuni metodi di ottimizzazione numerica che intevengono in svariati problemi decisionali.

Obiettivi

Il Data Mining si occupa dell’analisi dei dati, con l’obiettivo di estrarvi informazioni non visibili immediatamente ma ad alto valore aggiunto; in genere si tratta di individuare “modelli” a fini descrittivi o previsionali. Molte tecniche di Data Mining poggiano su algoritmi di Machine Learning, che apprendono automaticamente i loro compiti dall’esperienza. Per una lunga (ma non esaustiva!) lista di esempi di applicazioni pratiche di queste discpline, clicca il pulsante rosso:

Applicazioni del DM e ML: alcuni esempi

Il partecipante verrà introdotto ai metodi di ottimizzazione numerica per la risoluzione di problemi di massimo e minimo che non possono essere affrontati con tecniche analitiche e che emergono nell’ambito di vari algoritmi di Machine Learning. Studierà poi alcuni metodi di Web Mining e di Information Retrieval, alcune reti neurali artificiali ignorate nel corso INTERMEDIO (bayesiane, SOM ad addestramento non supervisionato e convoluzionali per il pattern recognition) e le macchine a vettori di supporto per problemi di classificazione e regressione avanzati. Ci si focalizzerà sulla formulazione dei modelli, sulle ipotesi retrostanti, sui dati richiesti, sui risultati generati e sulla loro interpretazione.

Didattica

Le lezioni mixano elementi teorici essenziali con esempi ed applicazioni pratiche su dati reali, illustrative delle varie tecniche, sfruttando software open source e software a licenza piuttosto comuni come Matlab.

Destinatari

Il campo di applicazione delle tecniche di Data Mining e Machine Learning è in continua crescita ed è già oggi sterminato. Il corso è quindi rivolto ad un’ampia platea di figure professionali, con competenze e seniority diverse, interessate ad utilizzare i propri database in modo efficiente, massimizzandone il potenziale informativo.


Data Mining e Machine Learning (corso avanzato)

Programma

  1. Ottimizzazione numerica

    Molte tecniche di Data Mining e Machine Learning richiedono la soluzione di complessi problemi di ottimo (ricerca di massimi/minimi di una funzione obiettivo). Qui si introducono alcune tecniche di ottimizzazione numerica che possono invece rivelarsi efficaci: l’algoritmo del simplesso per problemi di programmazione lineare, alcuni algoritmi differenziali (Gradient Descent e Newton-Raphson), l’algoritmo EM per la stima di massima verosimiglianza, la Simulazione Montecarlo ed infine gli algoritmi genetici, ispirati alla teoria dell’evoluzione darwiniana. [6 ore]

  2. Web Mining

    Il Web Mining è la disciplina che applica le tecniche del DM per scoprire regolarità presenti in risorse disponibili sul Web, ad esempio per classificare pagine dei siti in base al contenuto testuale. Verranno trattati i concetti di base della disciplina: analisi delle sequenze, misure di similarità, classificatori K-NN, classificatori Naïve Bayes, Markov Model, Hidden Markov Model, apprendimento per rinforzo, algoritmo PageRank, cenni ai modelli di Information Retrieval (booleani, vector space, probabilistici), cenni al Text Mining. [5 ore]

  3. Reti neurali artificiali

    Le reti discusse nel corso intermedio individuano relazioni tra i dati quando il loro addestramento è “supervisionato”, cioè basato su un insieme di dati di input-output predefiniti (training set). Qui si discutono le reti SOM (Self Organized Maps o reti di Kohonen), nelle quali l’addestramento si basa sugli input, senza necessità dei corrispondenti output (reti “non supervisionate”). Verrà poi dato spazio ad un altro tipo di rete, detta Bayesiana, che non richiede grandi training set e garantisce un addestramento continuo, man mano che nuovi dati le vengono passati. Infine, verranno trattate le reti neurali convoluzionali, all’avanguardia nel campo del riconoscimento delle immagini. [5 ore]

  4. Support Vector Machines

    Sono algoritmi di classificazione e di regressione di recente sviluppo. Le SVM per la classificazione estendono l’approccio basato sulle reti neurali monostrato perché permettono di separare i dati in modo non lineare. Migliorano inoltre l’approccio basato sulle reti multistrato grazie ad un addestramento più efficiente. Una volta definito il concetto di SVM come classe di funzioni, si introdurranno i rischi di errore di classificazione effettivo ed empirico. Si vedrà come controllare il primo tramite il secondo e la così detta dimensione VC. Si vedrà poi come addestrare una SVM che minimizzi la dimensione VC, sia nel caso lineare che in quello non lineare, mostrando che il problema di ottimizzazione si può affrontare con la teoria della dualità. Infine, si accennerà alle SVM per problemi di regressione ed agli algoritmi di decomposizione per problemi di programmazione convessa. [5 ore]

Personalizzazioni

La SFA è disponibile a valutare richieste di personalizzazione del programma del corso sotto vari profili. Puoi aggiungere argomenti funzionali agli obiettivi formativi, anche in sostituzione di argomenti in programma valutati di minor interesse. Puoi aggiungere prerequisiti, qualora tu ritenga di non avere le conoscenze di base necessarie per affrontate uno o più argomenti. Possiamo anche calibrare la didattica dando maggiore attenzione agli aspetti teorici o, viceversa, a quelli operativi.

Erogazione

Il corso prevede 21 ore di lezione erogate da uno o più Tutor della SFA; si suggerisce un minimo di 3-4 ore a settimana. Gli orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze di giorni/orari dei partecipanti, entro l’orario di servizio (08:00 – 22:00, lunedì – domenica). Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si potrà anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.

Quota di partecipazione

  • 1 pacchetto da 21 ore a € 700,00 (iva esclusa), acquistabile in un’unica soluzione.
  • 3 pacchetti da 7 ore l’uno a € 245,00 a pacchetto (iva esclusa), acquistabili separatamente.

La quota di partecipazione può variare in caso di personalizzazione del programma e si riferisce all’erogazione ad un solo partecipante, in aula virtuale tramite la nostra piattaforma (Tutoring Room). Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti e/o in aula tradizionale.

Guida alla Tutoring Room

Corsi collegati

DM e ML: una panoramica
DM e ML per il MARKETING
Metodologie di DM e ML (BASE)
Metodologie di DM e ML (INTERMEDIO)
Analisi delle Serie Storiche

Vuoi maggiori informazioni?

Scopri di cosa parliamo

Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam keywords.