Benvenuti nel Glossario Tecnico del corso. Qui troverete le definizioni chiave per navigare nel mondo della Data Analytics, del Marketing Digitale e dell’Ingegneria dei Dati. I termini sono organizzati in ordine alfabetico per una rapida consultazione.
A/B Testing Metodo sperimentale per confrontare due versioni di una variabile (pagina web, email, feature) per determinare quale performa meglio rispetto a un obiettivo specifico. È il gold standard per stabilire causalità. Contesto: Analisi Prodotto / Marketing Data Science
ACID (Atomicity, Consistency, Isolation, Durability) Proprietà fondamentali delle transazioni nei database relazionali (e in alcuni Data Lake moderni) che garantiscono la validità dei dati anche in caso di errori o blackout. Contesto: Data Warehousing / S3 Data Lake
Actionable Metrics Metriche che legano specifiche azioni a risultati osservabili e che aiutano a prendere decisioni concrete. Si contrappongono alle Vanity Metrics. Contesto: Gestione Data Driven
Activation Rate Percentuale di utenti che raggiungono il momento “Aha!” o completano un’azione chiave che indica che hanno ottenuto valore dal prodotto per la prima volta. Contesto: Analisi Prodotto / Marketing Analytics
ARPU (Average Revenue Per User) Metrica che indica il ricavo medio generato da ogni utente attivo in un determinato periodo. Fondamentale per calcolare il LTV. Contesto: Metriche Fondamenti / Marketing Data Science
ARR (Annual Recurring Revenue) Il valore annualizzato dei contratti ricorrenti. È la metrica principale per la valutazione delle aziende SaaS. Contesto: Metriche Fondamenti
Athena (AWS) Servizio di query serverless che permette di analizzare dati direttamente in Amazon S3 utilizzando SQL standard. Contesto: S3 Data Lake
Attribution Models Regole che determinano come il credito per una vendita o conversione viene assegnato ai vari touchpoint nel percorso di acquisto (es. Last Click, First Click, Data-Driven). Contesto: Marketing Data Science
Backpressure Meccanismo nei sistemi di streaming per gestire situazioni in cui il produttore invia dati più velocemente di quanto il consumatore riesca a processarli, rallentando il flusso per evitare crash. Contesto: Real-time Analytics / Kafka Streaming
Backward Compatibility Capacità di un sistema (o schema dati) di funzionare con input generati da versioni precedenti. Cruciale in Kafka per permettere l’evoluzione degli schemi senza rompere i consumatori esistenti. Contesto: Kafka Streaming (Schema Registry)
Bounce Rate Percentuale di visitatori che lasciano il sito dopo aver visualizzato una sola pagina. Un alto bounce rate può indicare contenuti non rilevanti o problemi tecnici. Contesto: Analisi Marketing
Broker (Kafka) Server singolo all’interno di un cluster Kafka responsabile della ricezione, archiviazione e distribuzione dei messaggi. Contesto: Kafka Streaming
CAC (Customer Acquisition Cost) Il costo totale sostenuto per acquisire un nuovo cliente pagante (spese marketing + sales / nuovi clienti). Deve essere bilanciato con il LTV. Contesto: Metriche Fondamenti / Marketing Data Science
Card Sorting Tecnica di UX Research in cui agli utenti viene chiesto di organizzare argomenti in gruppi. Utile per progettare l’architettura dell’informazione e i menu di navigazione. Contesto: Analisi Prodotto (UX Research)
CDC (Change Data Capture) Tecnica per identificare e catturare le modifiche apportate ai dati in un database (insert, update, delete) per replicarle in tempo reale verso altri sistemi (es. tramite Debezium verso Kafka). Contesto: Real-time Analytics / Data Collection
CDP (Customer Data Platform) Software che aggrega e organizza i dati dei clienti provenienti da diverse fonti (web, mobile, email, CRM) per creare un profilo utente unificato e attivabile. Contesto: Data Collection / Analisi Marketing
Churn Rate La percentuale di clienti o abbonati che smettono di utilizzare il servizio in un dato periodo. È l’opposto della Retention. Contesto: Metriche Fondamenti / Analisi Prodotto
ClickHouse Database OLAP colonnare open-source progettato per l’analisi in tempo reale su grandi volumi di dati. Famoso per la sua velocità di esecuzione delle query aggregative. Contesto: Real-time Analytics / Data Warehousing
Cohort Analysis Metodo di analisi comportamentale che raggruppa gli utenti in base a caratteristiche comuni condivise in un intervallo di tempo (es. data di iscrizione) per osservare come il loro comportamento evolve nel tempo. Contesto: Analisi Prodotto / Marketing Data Science
Columnar Storage Formato di archiviazione dati (es. Parquet, ClickHouse) che salva i dati per colonna anziché per riga. Ottimizzato per query analitiche che leggono poche colonne di molte righe. Contesto: Data Warehousing / S3 Data Lake
Consumer Group (Kafka) Gruppo di consumatori che collaborano per leggere i messaggi da un topic Kafka. Garantisce la scalabilità e la tolleranza ai guasti nella lettura dei dati. Contesto: Kafka Streaming
Conversion Rate (CR) La percentuale di utenti che completano un’azione desiderata (es. acquisto, iscrizione) rispetto al totale dei visitatori. Contesto: Analisi Marketing / Metriche Fondamenti
Data Contract Accordo formale tra produttori e consumatori di dati che definisce schema, semantica, SLA e regole di evoluzione dei dati, trattandoli come un prodotto. Contesto: Kafka Streaming / Data Engineering
Data Lake Archivio centralizzato che consente di memorizzare tutti i dati strutturati e non strutturati a qualsiasi scala. I dati vengono salvati nel formato grezzo originale. Contesto: S3 Data Lake
Data Warehouse Sistema utilizzato per il reporting e l’analisi dei dati, considerato il componente centrale della Business Intelligence. I dati sono tipicamente strutturati, puliti e ottimizzati per query SQL. Contesto: Data Warehousing
DAU/MAU Ratio Rapporto tra utenti attivi giornalieri e mensili. Misura la “stickiness” (viscosità) di un prodotto, ovvero quanto spesso gli utenti ritornano. Contesto: Metriche Fondamenti / Analisi Prodotto
Dead Letter Queue (DLQ) Coda speciale dove vengono inviati i messaggi che non possono essere processati correttamente, permettendo di analizzarli successivamente senza bloccare il flusso principale. Contesto: Kafka Streaming
Debezium Piattaforma open-source distribuita per il Change Data Capture (CDC). Converte i log delle transazioni dei database esistenti in flussi di eventi Kafka. Contesto: Real-time Analytics
Dimensioni Attributi qualitativi che descrivono i dati (es. “Paese”, “Browser”, “Categoria Prodotto”) e permettono di segmentare e filtrare le metriche. Contesto: Gestione Data Driven / Data Warehousing
ELT (Extract, Load, Transform) Variazione moderna dell’ETL dove i dati vengono caricati nel target (es. Data Warehouse o Lake) prima di essere trasformati. Sfrutta la potenza di calcolo del target (es. BigQuery, Snowflake). Contesto: Data Warehousing / Data Collection
Embeddings Rappresentazioni vettoriali di parole o concetti in uno spazio multidimensionale, usate nel Machine Learning per catturare il significato semantico e la similarità. Contesto: Marketing Data Science
ETL (Extract, Transform, Load) Processo tradizionale di integrazione dati che estrae dati dalle fonti, li trasforma in un server intermedio e li carica nel sistema di destinazione. Contesto: Data Warehousing
Event Properties
Metadati specifici associati a un singolo evento di tracciamento (es. price o product_name per l’evento Purchase).
Contesto: Data Collection / Analisi Prodotto
Exactly-Once Semantics Garanzia nei sistemi di streaming che ogni messaggio verrà processato esattamente una volta, senza duplicati e senza perdite, anche in caso di guasti. Contesto: Kafka Streaming
First-Party Data Dati raccolti direttamente dall’azienda dai propri clienti (sito web, app, CRM), di cui si possiede il consenso e la proprietà. Contesto: Analisi Marketing / Privacy
Funnel Analysis Analisi che mappa le tappe che un utente deve compiere per raggiungere un obiettivo, identificando dove avvengono gli abbandoni (drop-off). Contesto: Analisi Prodotto / Marketing Analytics
GDPR (General Data Protection Regulation) Regolamento europeo sulla protezione dei dati e della privacy che impone regole severe sulla raccolta, il consenso e la gestione dei dati personali. Contesto: Data Collection / Privacy
Gestalt Principles Principi di psicologia visiva (es. vicinanza, similarità) che spiegano come il cervello umano organizza gli elementi visivi in gruppi o forme unificate. Fondamentali per la Data Visualization. Contesto: Dashboard Visualizzazione
Glue (AWS) Servizio di integrazione dati serverless di AWS che facilita la scoperta, la preparazione e la combinazione di dati per l’analisi (include Data Catalog e ETL). Contesto: S3 Data Lake
Granularity Il livello di dettaglio dei dati archiviati. Una granularità fine (es. ogni singolo evento) permette analisi più profonde rispetto a dati aggregati. Contesto: Data Warehousing
HADI Cycles (Hypothesis, Action, Data, Insight) Ciclo iterativo utilizzato nel Growth Hacking e nell’Agile per validare ipotesi attraverso esperimenti rapidi e analisi dei dati. Contesto: Marketing Data Science / Gestione Data Driven
Heatmap (Mappa di Calore) Rappresentazione grafica dei dati dove i valori sono rappresentati da colori. Nella UX, mostra dove gli utenti cliccano, scorrono o muovono il mouse. Contesto: Analisi Prodotto (UX Research)
Hive Style Partitioning
Strategia di organizzazione dei file nel Data Lake dove i percorsi delle directory includono i nomi delle colonne di partizionamento (es. year=2023/month=05/).
Contesto: S3 Data Lake
IaC (Infrastructure as Code) Pratica di gestione e provisioning dell’infrastruttura informatica attraverso file di definizione leggibili dalla macchina (es. Terraform), piuttosto che configurazione manuale. Contesto: Infrastructure Ops
Iceberg (Apache Iceberg) Formato di tabella aperto per enormi dataset analitici che porta funzionalità SQL (transazioni, evoluzione schema) sui file nel Data Lake. Contesto: S3 Data Lake
Idempotenza Proprietà di un’operazione che può essere applicata più volte senza cambiare il risultato oltre l’applicazione iniziale. Essenziale nelle pipeline di dati per gestire i retry. Contesto: Kafka Streaming / Data Engineering
JTBD (Jobs To Be Done) Teoria secondo cui i clienti non comprano prodotti, ma li “assumono” per svolgere un lavoro specifico o risolvere un problema nella loro vita. Contesto: Analisi Prodotto / Gestione Data Driven
Kafka Connect Componente dell’ecosistema Apache Kafka per connettere Kafka con datastore esterni (database, key-value stores, search index, file system) in modo scalabile e affidabile. Contesto: Kafka Streaming
Key Result (KR) Risultato Chiave nel framework OKR. È una metrica quantitativa che misura il progresso verso l’Obiettivo (Objective). Deve essere misurabile e verificabile. Contesto: Gestione Data Driven (OKR)
KPI (Key Performance Indicator) Indicatore Chiave di Prestazione. Una metrica misurabile che dimostra quanto efficacemente un’azienda sta raggiungendo i principali obiettivi di business. Contesto: Gestione Data Driven / Metriche Fondamenti
Lagging Indicator Indicatore di risultato che guarda al passato (es. Fatturato mese scorso). Conferma un trend già avvenuto ma è difficile da influenzare direttamente. Contesto: Gestione Data Driven
Leading Indicator (Driver) Indicatore predittivo che anticipa i risultati futuri (es. Numero di demo prenotate). È influenzabile direttamente dalle azioni del team. Contesto: Gestione Data Driven
LTV (Lifetime Value) Stima del ricavo netto totale che un’azienda prevede di ottenere da un singolo cliente per tutta la durata della relazione. Contesto: Metriche Fondamenti / Marketing Data Science
Materialized View Oggetto del database che contiene i risultati pre-calcolati di una query. In ClickHouse, vengono aggiornate incrementalmente all’inserimento dei dati per performance estreme. Contesto: Real-time Analytics / Data Warehousing
MergeTree Il motore di tabelle (table engine) più potente e robusto di ClickHouse, progettato per inserire grandi volumi di dati in una singola tabella e interrogarli velocemente. Contesto: Real-time Analytics
Metrica Qualsiasi misura quantitativa utilizzata per tracciare e valutare lo stato di un processo specifico. I KPI sono un sottoinsieme selezionato di metriche. Contesto: Metriche Fondamenti
Monitoring Il processo di raccolta, aggregazione e analisi di metriche su sistemi IT per controllarne lo stato di salute e le prestazioni (es. CPU, RAM, Latenza). Contesto: Infrastructure Ops
MRR (Monthly Recurring Revenue) Ricavo mensile ricorrente normalizzato. È la misura standardizzata delle entrate prevedibili di un’azienda in abbonamento. Contesto: Metriche Fondamenti
North Star Metric La singola metrica che meglio cattura il valore fondamentale che il prodotto offre ai suoi clienti. Allinea l’intera azienda verso un obiettivo a lungo termine. Contesto: Gestione Data Driven
NPS (Net Promoter Score) Metrica che misura la fedeltà dei clienti chiedendo: “Con quale probabilità consiglieresti il nostro prodotto a un amico?”. Varia da -100 a +100. Contesto: Analisi Prodotto / Marketing Data Science
Observability Misura di quanto bene si possa capire lo stato interno di un sistema basandosi solo sui suoi output esterni (Log, Metriche, Tracce). Va oltre il semplice monitoring (“perché è rotto?”). Contesto: Infrastructure Ops
Objective (OKR) L’Obiettivo nel framework OKR. Una descrizione qualitativa, memorabile e ambiziosa di ciò che si vuole ottenere. Contesto: Gestione Data Driven
OKR (Objectives and Key Results) Framework di goal-setting utilizzato per definire obiettivi misurabili e tracciare i loro risultati. Favorisce l’allineamento e l’impegno intorno a obiettivi misurabili. Contesto: Gestione Data Driven
OLAP (Online Analytical Processing) Approccio all’elaborazione dei dati focalizzato sull’analisi multidimensionale e su query complesse di lettura (es. Data Warehouse). Contesto: Data Warehousing
OLTP (Online Transactional Processing) Approccio all’elaborazione dei dati focalizzato sull’esecuzione di un gran numero di brevi transazioni atomiche (es. Database operazionali, E-commerce). Contesto: Data Warehousing
Onboarding Il processo attraverso il quale i nuovi utenti imparano a usare il prodotto e ne percepiscono il valore iniziale. Critico per la retention. Contesto: Analisi Prodotto
Parquet Formato di file di archiviazione a colonne open source, ottimizzato per l’uso con framework di elaborazione big data. Offre compressione efficiente e schemi evolutivi. Contesto: S3 Data Lake
Partitioning Tecnica di divisione di una tabella o di un dataset in parti più piccole e gestibili (es. per data), per migliorare le prestazioni delle query. Contesto: Data Warehousing / Kafka Streaming
PII (Personally Identifiable Information) Qualsiasi dato che potrebbe potenzialmente identificare un individuo specifico (es. Nome, Email, IP, Codice Fiscale). Richiede protezione speciale sotto GDPR. Contesto: Privacy / Data Collection
PMF (Product Market Fit) Il punto in cui un prodotto soddisfa una forte domanda di mercato. Si verifica quando i clienti comprano, usano e consigliano il prodotto velocemente quanto riesci a produrlo. Contesto: Analisi Prodotto / Marketing Data Science
Precision Tracking Filosofia di tracciamento dati che prevede la definizione esplicita e pianificata degli eventi da tracciare, al contrario dell’Autotrack indiscriminato. Contesto: Data Collection
Privacy by Design Approccio all’ingegneria dei sistemi che promuove la privacy e la protezione dei dati fin dall’inizio del ciclo di progettazione. Contesto: Privacy
Product Analytics L’analisi quantitativa di come gli utenti interagiscono con un prodotto digitale, utilizzata per migliorare l’esperienza utente e guidare la roadmap. Contesto: Analisi Prodotto
Retention Rate La percentuale di utenti che continuano a utilizzare il prodotto dopo un determinato periodo di tempo. È l’indicatore principale della salute a lungo termine di un prodotto. Contesto: Analisi Prodotto / Marketing Data Science
ROAS (Return On Ad Spend) Metrica di marketing che misura l’efficacia di una campagna pubblicitaria digitale (Ricavi dalla pubblicità / Costo della pubblicità). Contesto: Metriche Fondamenti / Marketing Analytics
ROI (Return On Investment) Metrica di performance utilizzata per valutare l’efficienza di un investimento. (Guadagno dall’investimento - Costo dell’investimento) / Costo dell’investimento. Contesto: Metriche Fondamenti
S3 (Simple Storage Service) Servizio di storage di oggetti offerto da AWS che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni leader del settore. Base comune per i Data Lake. Contesto: S3 Data Lake
Schema Registry Componente che archivia e gestisce le versioni degli schemi dei dati (es. Avro) per i topic Kafka, garantendo la compatibilità tra produttori e consumatori. Contesto: Kafka Streaming
Segmentazione Il processo di divisione di un’ampia base di consumatori o aziende in sottogruppi di consumatori (segmenti) basati su caratteristiche condivise. Contesto: Gestione Data Driven / Marketing Analytics
Server-Side Tracking Metodo di raccolta dati in cui i dati vengono inviati dal server web (backend) direttamente alla piattaforma di analytics, bypassando il browser dell’utente e gli AdBlocker. Contesto: Data Collection
SLA (Service Level Agreement) Contratto tra un fornitore di servizi e un cliente che specifica, solitamente in termini misurabili, quali servizi fornirà il fornitore (es. Uptime 99.9%). Contesto: Infrastructure Ops
Snowflake Schema Modello di dati multidimensionale che è un’estensione dello Star Schema, dove le tabelle delle dimensioni sono normalizzate (suddivise in tabelle aggiuntive). Contesto: Data Warehousing
Star Schema Il modello di data warehousing più semplice, costituito da una tabella dei fatti centrale circondata da tabelle delle dimensioni denormalizzate. Contesto: Data Warehousing
Streaming Processing L’elaborazione continua di flussi di dati in tempo reale mentre vengono generati, permettendo analisi e reazioni immediate. Contesto: Real-time Analytics / Kafka Streaming
SUS (System Usability Scale) Uno strumento standardizzato (“quick and dirty”) per misurare l’usabilità di un sistema, basato su un questionario di 10 domande. Contesto: Analisi Prodotto (UX Research)
Terraform Strumento open-source di Infrastructure as Code (IaC) che permette di definire e fornire l’infrastruttura del data center utilizzando un linguaggio dichiarativo. Contesto: Infrastructure Ops
Time to Value (TTV) Il tempo necessario a un nuovo cliente per realizzare valore dal prodotto dopo l’acquisto o l’iscrizione. Ridurre il TTV è cruciale per l’attivazione. Contesto: Analisi Prodotto
Topic (Kafka) Categoria o nome del feed in cui vengono pubblicati i record in Kafka. I topic sono sempre multi-abbonato. Contesto: Kafka Streaming
Tracking Plan Documento o repository che definisce quali eventi tracciare, le loro proprietà e i trigger, fungendo da “single source of truth” per l’analytics. Contesto: Data Collection
Unit Economics L’analisi diretta dei ricavi e dei costi associati a un singolo modello di business unitario (es. un singolo cliente o prodotto). Contesto: Metriche Fondamenti / Marketing Data Science
Usability Testing Tecnica utilizzata nella progettazione dell’interazione centrata sull’utente per valutare un prodotto testandolo sugli utenti. Contesto: Analisi Prodotto (UX Research)
User Properties Attributi che descrivono segmenti della base utenti, come preferenze di lingua, posizione geografica o stato dell’abbonamento. Contesto: Data Collection / Analisi Prodotto
UX Research (User Experience Research) Lo studio sistematico degli utenti target e dei loro requisiti, per aggiungere contesti e intuizioni realistiche ai processi di progettazione. Contesto: Analisi Prodotto
Vanity Metrics Metriche che sembrano impressionanti ma non correlano necessariamente con il successo del business e non offrono indicazioni su decisioni future (es. Numero di Like, Pageviews totali). Contesto: Gestione Data Driven
Viral Coefficient (K-factor) Numero medio di nuovi utenti che ogni utente esistente riesce a convertire. Se K > 1, si ha una crescita virale esponenziale. Contesto: Metriche Fondamenti
Windowing Tecnica nello stream processing per raggruppare eventi in base al tempo (es. Tumbling window, Hopping window, Session window) per aggregazioni. Contesto: Real-time Analytics
Zookeeper Servizio centralizzato per mantenere le informazioni di configurazione, la denominazione, la sincronizzazione distribuita e i servizi di gruppo. Storicamente usato da Kafka (ora in fase di rimozione con KRaft). Contesto: Kafka Streaming
| Acronimo | Significato Completo | Area di Riferimento |
|---|---|---|
| ACID | Atomicity, Consistency, Isolation, Durability | Database |
| API | Application Programming Interface | Development |
| ARPU | Average Revenue Per User | Metriche Business |
| ARR | Annual Recurring Revenue | Metriche Business |
| AWS | Amazon Web Services | Cloud |
| CAC | Customer Acquisition Cost | Marketing |
| CDC | Change Data Capture | Data Engineering |
| CDP | Customer Data Platform | MarTech |
| CI/CD | Continuous Integration / Continuous Deployment | DevOps |
| CMP | Consent Management Platform | Privacy |
| CPC | Cost Per Click | Advertising |
| CPM | Cost Per Mille (Impressions) | Advertising |
| CRM | Customer Relationship Management | Sales/Marketing |
| CTR | Click-Through Rate | Advertising |
| DAU | Daily Active Users | Metriche Prodotto |
| DLQ | Dead Letter Queue | Data Engineering |
| DPA | Data Processing Agreement | Legal/Privacy |
| ELT | Extract, Load, Transform | Data Engineering |
| ETL | Extract, Transform, Load | Data Engineering |
| GA4 | Google Analytics 4 | Analytics |
| GDPR | General Data Protection Regulation | Legal/Privacy |
| IaC | Infrastructure as Code | DevOps |
| JSON | JavaScript Object Notation | Data Format |
| KPI | Key Performance Indicator | Strategy |
| LTV | Lifetime Value | Metriche Business |
| MAU | Monthly Active Users | Metriche Prodotto |
| MRR | Monthly Recurring Revenue | Metriche Business |
| NPS | Net Promoter Score | Metriche Prodotto |
| OKR | Objectives and Key Results | Strategy |
| OLAP | Online Analytical Processing | Database |
| OLTP | Online Transactional Processing | Database |
| PII | Personally Identifiable Information | Privacy |
| PMF | Product Market Fit | Product Strategy |
| ROAS | Return On Ad Spend | Marketing |
| ROI | Return On Investment | Business |
| S3 | Simple Storage Service | Cloud Storage |
| SLA | Service Level Agreement | Operations |
| SQL | Structured Query Language | Database |
| SUS | System Usability Scale | UX Research |
| UX | User Experience | Design |