Solo pochi attimi di attesa

Posizione corrente:

Ti trovi in: Home » Scuola di Formazione Aziendale » Analisi dei dati » Regression & Trees: prevedere e classificare

Regression & Trees: prevedere e classificare

Quali fattori spiegano la customer satisfaction? E il default di un’azienda? Come prevedere le vendite di un bene? E il fabbisogno di medici al PS? Introduzione alla Regressione e agli Alberi

A cosa servono la Regressione Lineare e gli Alberi Decisionali

Regressione lineare e alberi decisionali sono due dei metodi più popolari per “spiegare” una variabile target tramite un insieme di input. Se il target è quantitativo, la regressione punta a prevederlo; se è qualitativo, gli alberi puntano a classificarlo.

La regressione lineare esplicita il legame tra una variabile target quantitativa e una o più variabili input. Spesso, l’ipotesi di linearità del legame è un’approssimazione della realtà, che però ne agevola l’interpretazione: infatti, l’impatto sul target della variazione di un input, a parità del resto, è misurato dal coefficiente dell’input. Il modello lineare viene stimato su un campione di dati; molto spesso, però, interessa validarlo in un contesto più ampio, anche al di là del dataset disponibile: questo si può fare con opportune procedure di statistica inferenziale.

Il modello stimato consentirà di manipolare gli input per ottenere il target desiderato o di prevedere la risposta in un data object i cui predittori siano noti. L’interesse per queste applicazioni è sconfinato: l’ufficio marketing vorrebbe prevedere l’esito della prossima campagna pubblicitaria in funzione del budget, dei canali, del messaggio, ecc.; al customer care potrebbero interessare le caratteristiche di un servizio che più incidono sulla soddisfazione del cliente; un analista finanziario potrebbe studiare il legame tra un indice di borsa e un dato asset; un manager sanitario vorrà prevedere il fabbisogno di medici in PS in base al bacino di utenza, al numero di ospedali limitrofi, al giorno della settimana, ecc.Leggi di più

Destinatari, didattica e calendario

Il campo di applicazione del Data Science è in continua crescita ed è già oggi sterminato. L’analisi di regressione e gli alberi decisionali, in particolare, trovano applicazione in numerosi ambiti professionali, dal marketing alle vendite, dalla produzione alla qualità, dall’ingegneria al biomedicale. Il corso, di livello intermedio, è destinato a chi voglia conoscere i metodi principali, combinando aspetti concettuali e pratica operativa. Le lezioni, infatti, mixano elementi teorici con esempi e applicazioni, sfruttando software open source e software a licenza piuttosto comuni.

Sono previste 16 ore di lezione erogate da uno o più Tutor della SFA; si suggerisce un minimo di 3-4 ore a settimana. Giorni e orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze dei partecipanti, entro la finestra 8:00 – 23:00, lun – dom.

Quota di partecipazione

540,00€.

La quota di partecipazione può variare in caso di personalizzazione del programma e si riferisce all’erogazione a un solo partecipante, in aula virtuale tramite la nostra piattaforma (Tutoring Room). Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti e/o in aula tradizionale.

Attestato

Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si può anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.


Programma

  1. Regressione lineare: introduzione

    Verrà introdotto il modello di regressione lineare multipla, per valutare se tra una variabile dipendente (target, risposta) e una o più variabili indipendenti (input, predittori) esiste una relazione approssimativamente lineare e, nel caso, quali siano le sue caratteristiche. Oltre che misurare l’impatto dei predittori sulla risposta, si potrà prevedere la risposta in un nuovo data object i cui predittori siano noti.Leggi di più

  2. Regressione lineare: complementi

    Si vedrà come migliorare la qualità e ampliare il campo di applicazione del modello di regressione. In molti casi, ad esempio, il modello funziona meglio se si utilizza un sottoinsieme dei predittori disponibili, oppure se si impongono vincoli sulla loro dimensione, così da limitare la variabilità delle stime. Quando i regressori sono molti, “sintetizzarli” in un numero più piccolo può migliorare la trattabilità e l’interpretabilità del modello. Quando la risposta è di tipo binario, le variabili vanno trasformate in modo che il modello fornisca risposte nel range [0,1]. Infine, si darà uno sguardo alla regressione non lineare, con la tecnica delle spline, che consente di passare da modelli “globali” a modelli “locali”.Leggi di più

  3. Alberi di decisione e di regressione

    Verranno presentati questi popolari modelli non parametrici per risolvere problemi di classificazione, ma anche di regressione. Pur mostrando, spesso, performance non lontane da quelle di tool più complessi e onerosi sul piano computazionale, gli alberi assicurano l’interpretabilità del risultato e la trasparenza del processo di classificazione/regressione, anche se soffrono problemi di “stabilità”. Possono inoltre essere utilizzati anche per ridurre il numero di attributi, oppure a scopo di clustering guidato da un target.Leggi di più

  4. Random forest

    Verranno introdotte le random forest, un tool che rientra nella famiglia degli ensemble methods, che combinano un insieme di classificatori (o previsori) per ottenerne uno più performante dei singoli componenti. Questi vengono generalmente ottenuti applicando un qualche tool a molteplici dataset generati casualmente, campionando o i data objects, o gli attributi, o entrambi (come nel caso delle random forest, dove il tool è un albero). Il guadagno in accuratezza previsiva è spesso notevole, sebbene venga sacrificata la chiarezza interpretativa.Leggi di più

Personalizzazioni

La SFA è disponibile a valutare richieste di personalizzazione del programma del corso sotto vari profili. Puoi aggiungere argomenti funzionali agli obiettivi formativi, anche in sostituzione di argomenti in programma valutati di minor interesse. Puoi aggiungere prerequisiti, qualora tu ritenga di non avere le conoscenze di base necessarie per affrontate uno o più argomenti. Possiamo anche calibrare la didattica dando maggiore attenzione agli aspetti teorici o, viceversa, a quelli operativi.

Vuoi maggiori informazioni?

Scopri di cosa parliamo

Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam keywords.