Causal Relationship
4.8 Relazioni: circostanziali e causali
Ho notato sopra che cercare e spiegare relazioni interessanti è parte di ciò che facciamo nella ricerca HCI. Spesso un esperimento controllato è progettato e condotto specificamente per questo scopo, e se fatto correttamente un particolare tipo di conclusione è possibile. Possiamo spesso dire che la condizione manipolata nell’esperimento ha causato i cambiamenti nelle risposte umane che sono state osservate e misurate. Questa è una relazione causa-effetto, o semplicemente una relazione causale.
Nell’HCI, la variabile manipolata è spesso un attributo su scala nominale di un’interfaccia, come il dispositivo, il metodo di inserimento, la modalità di feedback, la tecnica di selezione, la profondità del menu, la disposizione dei pulsanti e così via. La variabile misurata è tipicamente un comportamento umano su scala di rapporto, come il tempo di completamento del compito, il tasso di errore, o il numero di clic sui pulsanti, gli eventi di scorrimento, gli spostamenti dello sguardo, ecc.
Trovare una relazione causale in un esperimento HCI produce una conclusione potente. Se la risposta umana misurata è vitale nell’HCI, come il tempo necessario per svolgere un compito comune, allora sapere che una condizione testata nell’esperimento riduce questo tempo è un risultato prezioso. Se la condizione è un’implementazione di un’idea nuova ed è stata confrontata con la pratica corrente, ci può davvero essere motivo di festeggiare. Non solo è stata trovata una relazione causale, ma la nuova idea migliora la pratica esistente. Questo è il tipo di risultato che aggiunge preziosa conoscenza alla disciplina; fa avanzare lo stato dell’arte.9 Questo è ciò che la ricerca HCI è!
Trovare una relazione non significa necessariamente che esista una relazione causale. Molte relazioni sono circostanziali. Esistono, e possono essere osservate, misurate e quantificate. Ma non sono causali, e qualsiasi tentativo di esprimere la relazione come tale è sbagliato. L’esempio classico è la relazione tra fumo e cancro. Supponiamo che uno studio di ricerca segua le abitudini e la salute di un gran numero di persone per molti anni. Questo è un esempio del metodo di ricerca correlazionale menzionato prima. Alla fine, si trova una relazione tra fumo e cancro: il cancro è più diffuso nelle persone che fumavano. È corretto concludere dallo studio che il fumo causa il cancro? No. La relazione osservata è circostanziale, non causale. Considerate questo: quando i dati vengono esaminati più da vicino, si scopre che la tendenza a sviluppare il cancro è anche legata ad altre variabili nel set di dati. Sembra che le persone che hanno sviluppato il cancro tendevano anche a bere più alcol, mangiare più cibi grassi, dormire meno, ascoltare musica rock, e così via. Forse è stato l’aumento del consumo di alcol a causare il cancro, o il consumo di cibi grassi, o qualcos’altro. La relazione è circostanziale, non causale. Questo non vuol dire che le relazioni indiziarie non siano utili. Cercare e trovare una relazione indiziaria è spesso il primo passo per ulteriori ricerche, in parte perché è relativamente facile raccogliere dati e cercare relazioni indiziarie.
Le relazioni causali emergono da esperimenti controllati. La ricerca di una relazione causale richiede uno studio in cui, tra le altre cose, i partecipanti sono selezionati a caso da una popolazione e sono assegnati casualmente alle condizioni di prova. Un’assegnazione casuale assicura che ogni gruppo di partecipanti sia lo stesso o simile in tutti gli aspetti, tranne che per le condizioni in cui ogni gruppo viene testato. Così, le differenze che emergono sono più probabilmente dovute (causate da) le condizioni del test che a circostanze ambientali o di altro tipo. A volte i partecipanti sono bilanciati in gruppi dove i partecipanti in ogni gruppo sono selezionati in modo che i gruppi siano uguali in termini di altri attributi rilevanti. Per esempio, un esperimento che testa due controller di input per i giochi potrebbe assegnare casualmente i partecipanti ai gruppi o bilanciare i gruppi per assicurare che la gamma di esperienze di gioco sia approssimativamente uguale.
Ecco un esempio di HCI simile a quello del fumo contro il cancro: Un ricercatore è interessato a confrontare il multi-tap e l’input predittivo (T9) per l’inserimento del testo su un telefono cellulare. Il ricercatore si avventura nel mondo e si avvicina agli utenti di telefoni cellulari, chiedendo cinque minuti del loro tempo. Molti accettano. Rispondono ad alcune domande sull’esperienza e le abitudini d’uso, compreso il loro metodo preferito per inserire i messaggi di testo. Vengono trovati quindici utenti che usano il multi-touch e quindici che usano il T9. Agli utenti viene chiesto di inserire una frase di testo prescritta mentre vengono cronometrati. Tornati in laboratorio, i dati vengono analizzati. Evidentemente, gli utenti T9 sono stati più veloci, inserendo un tasso di 18 parole al minuto, rispetto alle 12 parole al minuto per gli utenti multi-tap. Questo è il 50% più veloce per gli utenti T9! Qual è la conclusione? C’è una relazione tra il metodo di inserimento e la velocità di inserimento del testo; tuttavia, la relazione è circostanziale, non causale. È ragionevole riportare ciò che è stato fatto e ciò che è stato trovato, ma è sbagliato avventurarsi oltre ciò che la metodologia dà. Concludere da questo semplice studio che il T9 è più veloce del multi-tap sarebbe sbagliato. Ispezionando i dati più da vicino, si scopre che gli utenti del T9 tendevano ad essere più esperti di tecnologia: riferivano di avere molta più esperienza nell’uso dei telefoni cellulari, e riferivano anche di inviare molti più messaggi di testo al giorno rispetto agli utenti del multi-tap che, in generale, dicevano che non amavano inviare messaggi di testo e lo facevano molto di rado.10 Così la differenza osservata può essere dovuta all’esperienza precedente e alle abitudini d’uso, piuttosto che a differenze intrinseche nei metodi di immissione del testo. Se c’è un interesse reale nel determinare se un metodo di inserimento del testo è più veloce di un altro, è necessario un esperimento controllato. Questo è l’argomento del prossimo capitolo.
Un ultimo punto merita di essere menzionato. Le conclusioni di causa ed effetto non sono possibili in certi tipi di esperimenti controllati. Se la variabile manipolata è un attributo naturale dei partecipanti, allora le conclusioni di causa ed effetto non sono affidabili. Esempi di attributi naturali includono il sesso (femmina, maschio), la personalità (estroverso, introverso), la mano (sinistra, destra), la prima lingua (ad esempio, inglese, francese, spagnolo), il punto di vista politico (sinistra, destra), e così via. Questi attributi sono variabili indipendenti legittime, ma non possono essere manipolati, cioè non possono essere assegnati ai partecipanti. In questi casi, una conclusione di causa ed effetto non è valida perché non è possibile evitare le variabili confondenti (definite nel capitolo 5). Essere maschio, essere estroverso, essere mancino, e così via, porta sempre altri attributi che variano sistematicamente tra i livelli della variabile indipendente. Le conclusioni di causa ed effetto sono inaffidabili in questi casi perché non è possibile sapere se l’effetto sperimentale è dovuto alla variabile indipendente o alla variabile confondente.