Solo pochi attimi di attesa

Posizione corrente:

Ti trovi in: Home » Scuola di Formazione Aziendale » Analisi dei dati » Cluster Analysis: segmentare e raggruppare

Cluster Analysis: segmentare e raggruppare

Come si profila la clientela di un’azienda, l’utenza di una PA o quella di un sito web? Come si individuano aree omogenee, prodotti affini, eventi simili? Introduzione alla Cluster Analysis

A cosa serve la Cluster Analysis

La Cluster Analysis consente di raggruppare oggetti descritti da una serie di variabili, non etichettati, in base a un qualche criterio di affinità, per comprendere se e come il fenomeno di interesse si manifesta in modi diversi all’interno del dataset.

Gli oggetti possono essere di varia natura: individui, famiglie, imprese, territori, prodotti, piante, eventi, ecc. Ognuno sarà descritto da una serie di variabili: per i clienti di un’azienda saranno disponibili variabili anagrafiche, comportamentali, socio-economiche; dei pazienti di un ospedale si possono conoscere dati biomedici; delle regioni europee sono noti indicatori macroeconomici, sanitari, ambientali; sui semi-lavorati di un processo produttivo si possono misurare varie caratteristiche a vari stadi del processo; gli eventi sismici sono controllati da rilevazioni geo-fisiche; e così via.

Supponiamo di voler raggruppare gli oggetti tra loro affini. Vi sono diversi criteri operativi per definire cosa si intende per “affinità”. In ogni caso, non ci interessa valutare l’affinità in base a una particolare variabile, non c’è una variabile-target rispetto alla quale gli oggetti devono mostrarsi omogenei (per questo si dice che la Cluster Analysis opera su oggetti non etichettati). Piuttosto, ci interessa valutare l’affinità tra gli oggetti rispetto all’insieme delle variabili disponibili. Se questo è l’obiettivo, la Cluster Analysis è il mezzo per raggiungerlo!Leggi di più

Destinatari, didattica e calendario

Il campo di applicazione del Data Science è in continua crescita ed è già oggi sterminato. La Cluster Analysis, in particolare, trova applicazione in numerosi ambiti professionali, dal marketing alle vendite, dalla produzione alla qualità, dall’ingegneria al biomedicale. Il corso, di livello intermedio, è destinato a chi voglia conoscere i principali metodi di clustering, combinando aspetti concettuali e pratica operativa. Le lezioni, infatti, mixano elementi teorici con esempi e applicazioni, sfruttando software open source e software a licenza piuttosto comuni.

Sono previste 12 ore di lezione erogate da uno o più Tutor della SFA; si suggerisce un minimo di 3-4 ore a settimana. Giorni e orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze dei partecipanti, entro la finestra 8:00 – 23:00, lun – dom.

Quota di partecipazione

400,00€.

La quota di partecipazione può variare in caso di personalizzazione del programma e si riferisce all’erogazione a un solo partecipante, in aula virtuale tramite la nostra piattaforma (Tutoring Room). Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti e/o in aula tradizionale.

Attestato

Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si può anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.


Programma

  1. Clustering gerarchico

    Verranno trattati metodi che raggruppano i singoli oggetti in cluster sempre più grandi (approccio bottom-up o agglomerativo) o che frazionano l’insieme di oggetti in cluster sempre più piccoli (approccio top-down o divisivo). In entrambi i casi, si crea una gerarchia di cluster visualizzabile in una struttura ad albero che ne agevola l’interpretazione e l’utilizzo. Sono metodi applicabili solo a piccoli dataset.Leggi di più

  2. Clustering prototype-based

    Verranno discussi metodi che formano i cluster aggregando gli oggetti intorno a un certo numero di “centri”, in modo tale che la “variabilità” sia minima entro ogni cluster ma massima tra cluster diversi. In altre parole, l’obiettivo è assicurare massima compattezza nei cluster ma massima separazione tra i cluster. Sono metodi applicabili anche a grandi dataset, ma l’interpretazione dei risultati è agevole solo se i cluster hanno forma “regolare” e densità uniforme.Leggi di più

  3. Clustering model-based

    Verranno introdotti metodi che interpretano il dataset come realizzazione di un modello probabilistico che combina diverse distribuzioni di probabilità della stessa famiglia, ma caratterizzate da parametri diversi. Questi parametri, opportunamente calibrati, descrivono i cluster. Gli oggetti non vengono assegnati ai cluster in modo univoco: ogni oggetto può appartenere a un cluster qualsiasi, con una certa probabilità. Il più noto tra questi metodi fa uso della famiglia delle distribuzioni Gaussiane.Leggi di più

  4. Clustering density-based

    Verranno descritti metodi che interpretano i cluster come regioni ad alta densità di oggetti, separate da regioni dove invece la densità degli oggetti è bassa. La partizione del dataset, in genere, non sarà completa, vi saranno oggetti scartati, esclusi da ogni cluster. Sono metodi che riescono a identificare cluster di qualsiasi forma, definendo il loro numero in modo naturale; possono però essere onerosi sotto il profilo computazionale e la caratterizzazione dei cluster può risultare difficile.Leggi di più

  5. Clustering SOM-based

    Verrà introdotto un particolare tipo di rete neurale artificiale, detta Self Organized Map (SOM) o rete di Kohonen. Differisce da altre reti perché il suo addestramento non richiede dati etichettati e si basa sul competitive learning. L’idea di fondo consiste nel mappare opportunamente i dati in uno spazio discreto a bassa dimensione (la mappa, spesso una griglia rettangolare o esagonale) dove sia più semplice identificare i cluster. Le SOM sono anche utilizzate per la data visualization e la dimensionalty reduction.Leggi di più

Personalizzazioni

La SFA è disponibile a valutare richieste di personalizzazione del programma del corso sotto vari profili. Puoi aggiungere argomenti funzionali agli obiettivi formativi, anche in sostituzione di argomenti in programma valutati di minor interesse. Puoi aggiungere prerequisiti, qualora tu ritenga di non avere le conoscenze di base necessarie per affrontate uno o più argomenti. Possiamo anche calibrare la didattica dando maggiore attenzione agli aspetti teorici o, viceversa, a quelli operativi.

Vuoi maggiori informazioni?

Scopri di cosa parliamo

Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam keywords.