David Hume: esperienza, abitudine mentale e scetticismo

Perché l'induzione è un'abitudine mentale, non una legge logica, e cosa significa per l'analisi dati.

Creato daAndrii Dyshkantiuk

Lezione 199 / 236Livello: AvanzatoDurata: 18 minPrerequisiti: 1

Cosa imparerai

Comprendere il problema analitico e il contesto decisionale
Applicare esempi, metriche e controlli a casi reali

Collegamenti

Aristotele e le quattro cause

David Hume: esperienza, abitudine mentale e scetticismo

Hume aiuta a tenere separate due cose che tendiamo a fondere: l’esperienza che ci è utile e la certezza che ci immaginiamo. Quando lavoriamo con i dati, è proprio questa distinzione a decidere se un pattern storico diventa un’ipotesi da mettere alla prova oppure una regola fragile che il team segue senza accorgersene.

Il problema da risolvere

Capita spesso di dare per scontato che una relazione vista nei dati storici sia una legge universale. Se ogni volta che lo sconto sale le vendite salgono, il team tratta quel legame come certo. Hume invita a fermarsi un attimo e a chiedersi se stiamo osservando una necessità reale o solo un’abitudine mentale che l’esperienza ha costruito a forza di ripetizioni. È una domanda che evita decisioni costruite su assunzioni fragili e che ci ricorda i limiti dell’induzione.

Come ragionare sul dato

flowchart LR
    A["Osservazione"]
    B["Assunzione"]
    C["Modello"]
    D["Evidenza"]
    E["Decisione"]
    A --> B
    B --> C
    C --> D
    D --> E

Il ragionamento parte dalla domanda, passa per la traduzione in unità osservabili, valuta la qualità del dato e solo alla fine arriva alla decisione. Quando si salta uno di questi passaggi il risultato è fragile e a volte fuorviante, perché manca il controllo che lo terrebbe in piedi.

Passaggio	Domanda guida	Output atteso
Framing	Quale decisione deve cambiare?	Una scelta concreta, non una curiosità
Misura	Quale segnale rappresenta il fenomeno?	Metrica, fonte e granularità
Confronto	Rispetto a quale baseline interpreto il risultato?	Benchmark o controfattuale plausibile
Azione	Che cosa faccio se il segnale supera la soglia?	Decisione, owner e prossimo controllo

I quattro elementi della misura

La lettura humeana ci spinge a guardare la relazione tra quattro elementi.

Elemento	Definizione operativa
Unità	Osservazione, ipotesi, variabile, meccanismo causale o criterio di evidenza
Segnale	Forza dell’evidenza, coerenza causale, robustezza delle assunzioni e costo dell’errore decisionale
Baseline	Spiegazione alternativa, controfattuale, gruppo comparabile o scenario senza intervento
Decisione	Accettare, rifiutare o riformulare una spiegazione prima di usarla in un contesto aziendale

La regola pratica resta semplice: una misura serve solo se riduce l’incertezza su una decisione specifica. Se non cambia una scelta è documentazione; se cambia una scelta senza essere passata da controlli è un rischio.

Un caso pratico

Durante la crisi finanziaria del 2008 molti modelli quantitativi costruiti su dati storici fallirono perché assumevano che il futuro avrebbe somigliato al passato. Goldman Sachs e altri fondi videro accadere più volte eventi che i loro modelli classificavano come estremamente rari. È l’illustrazione più netta del punto di Hume: l’induzione senza una giustificazione solida porta a errori che possono essere catastrofici.

Lo stesso vale, su scala più piccola, per un comitato che legge una crescita della retention come prova del successo di una nuova iniziativa. Anche qui serve separare osservazione, spiegazione, assunzione e decisione. Una tabella che tiene distinto ciò che si sa da ciò che si assume e dalle decisioni che ne seguono basta a rendere il ragionamento esplicito.

Evidenza	Interpretazione prudente	Decisione conseguente
Segnale positivo ma non isolato	Il fenomeno esiste, ma la causa è ancora incerta	Cercare baseline o holdout
Segmento con risposta diversa	L’effetto medio nasconde eterogeneità	Analizzare coorti o sottogruppi
Costo operativo crescente	Il risultato va valutato sul margine	Applicare soglie economiche

Esercizi per metterla in pratica

Parti dal livello base. Descrivi in poche righe una decisione reale in cui applichi lo scetticismo di Hume: obiettivo, metrica primaria, baseline, rischio principale e azione prevista.

Al livello intermedio costruisci una tabella con almeno tre segmenti o scenari. Per ognuno indica il segnale, una possibile spiegazione alternativa e il controllo da fare prima di decidere. È l’esercizio che allena a non scambiare un’abitudine osservata per una necessità.

Il livello research-grade chiede un piano di validazione: ipotesi, dati necessari, criteri di esclusione, soglia decisionale e un controllo da fare dopo aver deciso. Scrivi anche cosa ti farebbe cambiare idea, perché è la parte che Hume considererebbe decisiva.

Per i materiali vanno bene case study decisionali, metriche di prodotto, risultati di esperimenti, DAG semplici, report analitici e serie storiche simulate. Se non hai dati reali, costruisci un dataset sintetico con almeno 200 righe e colonne per tempo, segmento, metrica di outcome e variabile di esposizione.

L’errore da evitare

L’errore più comune è trattare Hume come un concetto astratto da ricordare invece che come un protocollo da applicare. Metriche senza baseline, grafici senza ipotesi, raccomandazioni che ignorano il costo dell’errore: tutte strade verso decisioni fragili. La domanda di controllo resta una: se questo risultato fosse falso o instabile, quale decisione sbaglierei? Se non sai rispondere, non hai ancora applicato la lezione.

Domande di controllo

Qual è la decisione concreta che questa lezione dovrebbe migliorare?
Quale baseline rende interpretabile il risultato?
Quale assunzione, se sbagliata, cambierebbe la conclusione?
Quale controllo minimo useresti prima di presentare la raccomandazione?

Riepilogo

Hume ci ricorda che l’esperienza e l’abitudine mentale non bastano a garantire la verità di una previsione. Tradotto nel lavoro sui dati, significa riconoscere che ogni modello è una scommessa provvisoria, che il backtesting non mette al riparo dal futuro e che la replicabilità è un indizio, non una prova. Applicare questo scetticismo vuol dire costruire modelli utili, aggiornabili e controllati sul serio, con l’unico scopo di prendere decisioni migliori.

Percorso collegato

Lezioni da leggere insieme

Questi collegamenti portano la lezione dentro il resto del corso: basi da riprendere, passaggi successivi e connessioni tematiche tra moduli.

Collegamento tematicoKafka & Event Streaming EngineeringKafka Streams: processare eventi con JavaIntroduzione a Kafka Streams per trasformazioni stateful su flussi di eventi senza cluster esterno.Collegamento tematicoReal-Time Analytics & ClickHouse SystemsMaterialized Views e Continuous AggregatesTecniche avanzate di pre-aggregazione per query real-time su enormi volumi di dati.Collegamento tematicoReal-Time Analytics & ClickHouse SystemsAlerting e anomaly detection su streamRilevare anomalie in tempo reale: pattern statistici e implementazione pratica.Collegamento tematicoAI per Analisi Dati, Data Engineering e AutoMLAI per data engineering, mapping e documentazioneAI per data engineering, mapping e documentazione su GinnyTech: decidere cosa documentare con AI e quale validazione tecnica blocca il rilascio con controlli, ownership e output revisionabili.Collegamento tematicoSignificativita Statistica, A/B Testing e Experimentation ScienceFondamenti della significativita statisticaIpotesi nulla e alternativa, distribuzione campionaria, statistica test e p-value. Dalla lezione del tè di Ronald Fisher (1925) al test A/A numerico, con limiti del testing frequentista e template di validazione operativa.Collegamento tematicoAdvanced SQL for Analytical Systems'Window functions: struttura mentale'Window functions: struttura mentale. Lezione core del modulo Advanced SQL for Analytical Systems con problema reale, modello concettuale, formalizzazione rigorosa, caso applicato, lab a 3 livelli e checkpoint finale.