Cosa entra nel carrello della spesa? Come si può anticipare un guasto a un impianto? Con quali molecole si può creare un farmaco? Introduzione al Frequent Pattern Mining
A cosa serve il Frequent Pattern Mining
Il Frequent Pattern Mining consente di identificare, all’interno di un dataset, schemi e associazioni tra i dati che ricorrono con una certa frequenza: questo genere di informazioni si rivela utile in ambito commerciale, tecnologico, scientifico, ecc.
Si applica per lo più a dati transazionali e sequenziali, tipici del settore commerciale. Una delle tecniche più note, la Market Basket Analysis (MBA), indica la presenza (1) o meno (0) dei prodotti nei “carrelli della spesa” dei clienti, che vengono quindi descritti come sequenze di 1 e 0, dette transazioni. Da un insieme di transazioni, la MBA deduce quali prodotti tendono a essere acquistati insieme, un’informazione di grande utilità per progettare strategie di cross-selling in un supermercato, un e-commerce, un catalogo cartaceo, ecc.Leggi di più
Se sono disponibili altre informazioni sul cliente – come il mezzo di pagamento, il titolo di studio, l’età, ecc. – queste possono essere aggiunte ai dati transazionali, individuando associazioni non solo tra i prodotti, ma anche tra questi e le caratteristiche dei clienti.
Se poi le transazioni di un cliente vengono collegate alle date di acquisto, si ha un dato sequenziale. Il Sequential Pattern Mining identifica prodotti acquistati, tipicamente, uno dopo l’altro o a certi intervalli di tempo. Ma le applicazioni sono molte: in un impianto industriale si può scoprire quale sequenza di eventi anticipa un guasto; certe sequenze di eventi atmosferici aiutano a prevedere un temporale; una banca può indagare i comportamenti finanziari dei clienti che ne anticipano il default; e così via.
Il Subgraph Pattern Mining, invece, ricerca strutture ricorrenti in un dataset di grafi. Un grafo è un insieme di “nodi” collegati tra loro; può descrivere strutture complesse, come un sito web o una molecola: in quest’ultimo caso, i nodi corrispondono agli atomi, i collegamenti ai legami chimici. Un’azienda farmaceutica vorrà scoprire strutture chimiche ricorrenti in un insieme di molecole, per meglio distinguere quelle attive da quelle inattive rispetto a un dato obiettivo terapeutico, con notevoli risparmi nella fase pre-clinica della realizzazione di un farmaco.
Destinatari, didattica e calendario
Il campo di applicazione del Data Science è già oggi sterminato ed è in continua crescita. Il Frequent Pattern Mining, in particolare, viene utilizzato in numerosi ambiti professionali: marketing, vendite, web, bioinformatica e altri. Il corso, di livello intermedio, è destinato a chi voglia conoscere i principali metodi di pattern mining, combinando aspetti concettuali e pratica operativa. Le lezioni, infatti, mixano elementi teorici con esempi e applicazioni, sfruttando software piuttosto comuni.
Sono previste 13 ore di lezione erogate da uno o più Tutor; si suggerisce un minimo di 3-4 ore a settimana. Giorni e orari di lezione vanno concordati con i Tutor; si assicura ogni sforzo per accomodare le preferenze dei partecipanti, entro la finestra 8:00 – 23:00, lun – dom.
Quota di partecipazione
520,00€.
La quota può variare in caso di personalizzazione del programma e si riferisce all’erogazione a un solo partecipante, in aula virtuale. Contatta il nostro Staff per informazioni sul costo del corso in caso di erogazione a due o più partecipanti.
Attestato
Al termine del corso si rilascia un attestato di partecipazione riportante il programma svolto e firmato dal corpo docente. Si può anche richiedere la certificazione delle conoscenze acquisite previo superamento di una prova d’esame.
Programma
-
Market basket analysis: introduzione.
Leggi di piùVerranno introdotti i metodi di base per identificare, all’interno di grandi dataset transazionali, gruppi di oggetti che si presentano insieme con frequenza e regole che associano la presenza di certi oggetti a quella di altri. Il dominio di applicazione tipico è l’analisi del carrello della spesa, che studia i comportamenti di acquisto più ricorrenti, ad esempio tra i clienti di una GDO. Tuttavia, le applicazioni si estendono ad ambiti del tutto diversi, dalla diagnostica medica all’analisi di siti web. Inoltre, i concetti discussi costituiscono il punto di partenza per analisi più avanzate, presentate nei moduli successivi.
-
Market basket analysis: complementi.
Leggi di piùSi vedrà come affrontare alcuni problemi che i metodi discussi nel modulo precedente lasciano, in tutto o in parte, irrisolti. Ad esempio, come “sintetizzare” i risultati dell’analisi; come trattare variabili categoriche o continue; come si modificano i risultati dell’analisi al variare del livello di dettaglio con cui vengono specificati gli oggetti del dataset (ad es. computer, computer laptop, computer laptop ASUS, computer laptop ASUS RX57). Si accennerà anche a un algoritmo alternativo all’Apriori discusso nel modulo precedente.
-
Sequential pattern mining.
Leggi di piùVerranno introdotti metodi che consentono di estrarre da grandi dataset di transazioni indicizzate al tempo, gruppi di oggetti che si presentano frequentemente in successione. In sostanza, si tratterà di incorporare l’aspetto temporale nei metodi di analisi già presentati. Le informazioni ricavabili sono utili in molti contesti, dalla pianificazione di strategie di vendita alla previsione di eventi in base a segnali anticipatori.
-
Subgraph pattern mining.
Leggi di piùI metodi presentati nei moduli precedenti verranno ulteriormente estesi per andare alla ricerca dei sotto-grafi più ricorrenti all’interno di un dataset di grafi. Un grafo è un insieme di nodi collegati tra loro: può essere utilizzato per descrivere efficacemente reti di trasporto, siti web, strutture chimiche e molti altri oggetti “complessi”. L’identificazione di frammenti di grafo (sotto-grafi) ricorrenti dà informazioni su percorsi caratteristici e proprietà comuni del fenomeno studiato.
Personalizzazioni
Valutiamo diverse richieste di personalizzazione del programma: puoi aggiungere argomenti funzionali agli obiettivi formativi, o aggiungere prerequisiti, se pensi di non avere le conoscenze di base necessarie per seguire il corso; puoi richiedere di calibrare la didattica per dare più attenzione agli aspetti teorici o, viceversa, a quelli applicativi.
Vuoi maggiori informazioni?
- Scrivi allo Staff: info@matematicaonvideo.it
- Contatta il Responsabile SFA, Dott. Sandro Bencini, al 339.4169342.
- Prenota un appuntamento online con un nostro consulente per spiegarci le tue esigenze.
Parliamone online