Causal Relationship
4.8 Relationships: circumstantial and causal
Ich habe oben erwähnt, dass die Suche nach interessanten Beziehungen und deren Erklärung Teil unserer Arbeit in der HCI-Forschung ist. Oft wird ein kontrolliertes Experiment speziell zu diesem Zweck entworfen und durchgeführt, und wenn es richtig gemacht wird, ist eine bestimmte Art von Schlussfolgerung möglich. Wir können oft sagen, dass die im Experiment manipulierten Bedingungen die Veränderungen in den beobachteten und gemessenen menschlichen Reaktionen verursacht haben. Dies ist eine Ursache-Wirkungs-Beziehung oder einfach eine kausale Beziehung.
In der HCI ist die manipulierte Variable oft ein nominalskaliertes Attribut einer Schnittstelle, wie z.B. Gerät, Eingabemethode, Feedback-Modalität, Auswahltechnik, Menütiefe, Tastenlayout usw. Die gemessene Variable ist typischerweise ein verhältnismäßiges menschliches Verhalten, wie z.B. die Zeit für die Aufgabenerledigung, die Fehlerquote oder die Anzahl der Tastenklicks, Scrolling-Ereignisse, Blickverschiebungen usw.
Wenn man in einem HCI-Experiment eine kausale Beziehung findet, kann man eine aussagekräftige Schlussfolgerung ziehen. Wenn die gemessene menschliche Reaktion in der HCI von entscheidender Bedeutung ist, wie z. B. die Zeit, die für eine gewöhnliche Aufgabe benötigt wird, dann ist die Erkenntnis, dass eine im Experiment getestete Bedingung diese Zeit reduziert, ein wertvolles Ergebnis. Wenn es sich bei der Bedingung um die Umsetzung einer neuen Idee handelt und diese mit der derzeitigen Praxis verglichen wurde, gibt es in der Tat einen Grund zum Feiern. Es wurde nicht nur ein kausaler Zusammenhang gefunden, sondern die neue Idee verbessert auch die bestehende Praxis. Dies ist die Art von Ergebnis, die der Disziplin wertvolles Wissen hinzufügt; es bringt den Stand der Technik voran.9 Darum geht es in der HCI-Forschung!
Eine Beziehung zu finden bedeutet nicht unbedingt, dass eine kausale Beziehung besteht. Viele Beziehungen sind indiziell. Sie existieren, und sie können beobachtet, gemessen und quantifiziert werden. Aber sie sind nicht kausal, und jeder Versuch, die Beziehung als solche auszudrücken, ist falsch. Das klassische Beispiel ist der Zusammenhang zwischen Rauchen und Krebs. Nehmen wir an, eine Forschungsstudie verfolgt die Gewohnheiten und die Gesundheit einer großen Zahl von Menschen über viele Jahre hinweg. Dies ist ein Beispiel für die bereits erwähnte korrelative Forschungsmethode. Am Ende wird ein Zusammenhang zwischen Rauchen und Krebs festgestellt: Krebs tritt häufiger bei Menschen auf, die geraucht haben. Ist es richtig, aus dieser Studie zu schließen, dass Rauchen Krebs verursacht? Nein. Der beobachtete Zusammenhang ist ein Indiz, kein Kausalzusammenhang. Wenn man die Daten genauer untersucht, stellt man fest, dass die Tendenz, an Krebs zu erkranken, auch mit anderen Variablen im Datensatz zusammenhängt. Es scheint, dass die Menschen, die an Krebs erkrankten, auch dazu neigten, mehr Alkohol zu trinken, mehr fettiges Essen zu sich zu nehmen, weniger zu schlafen, Rockmusik zu hören und so weiter. Vielleicht war es der erhöhte Alkoholkonsum, der den Krebs verursachte, oder der Verzehr von fetthaltigen Lebensmitteln oder etwas anderes. Der Zusammenhang ist ein Indizienbeweis, kein Kausalzusammenhang. Damit soll nicht gesagt werden, dass Indizienbeziehungen nicht nützlich sind. Die Suche nach einem Indizienzusammenhang ist oft der erste Schritt in der weiteren Forschung, auch weil es relativ einfach ist, Daten zu sammeln und nach Indizienzusammenhängen zu suchen.
Kausale Zusammenhänge ergeben sich aus kontrollierten Experimenten. Die Suche nach einem kausalen Zusammenhang erfordert eine Studie, bei der unter anderem die Teilnehmer zufällig aus einer Population ausgewählt und nach dem Zufallsprinzip den Testbedingungen zugewiesen werden. Eine zufällige Zuweisung stellt sicher, dass jede Gruppe von Teilnehmern in jeder Hinsicht gleich oder ähnlich ist, mit Ausnahme der Bedingungen, unter denen jede Gruppe getestet wird. Daher sind die Unterschiede, die sich zeigen, eher auf die Testbedingungen zurückzuführen als auf Umwelt- oder andere Umstände. Manchmal werden die Teilnehmer in Gruppen aufgeteilt, wobei die Teilnehmer in jeder Gruppe so ausgewählt werden, dass die Gruppen in Bezug auf andere relevante Merkmale gleich sind. Bei einem Experiment, in dem zwei Eingabesteuerungen für Spiele getestet werden, könnten die Teilnehmer beispielsweise nach dem Zufallsprinzip den Gruppen zugewiesen werden, oder die Gruppen werden ausgeglichen, um sicherzustellen, dass die Bandbreite der Spielerfahrung ungefähr gleich ist.
Hier ist ein HCI-Beispiel, das dem Beispiel Rauchen versus Krebs ähnelt: Ein Forscher interessiert sich für den Vergleich von Multi-Tap und prädiktiver Eingabe (T9) für die Texteingabe auf einem Mobiltelefon. Der Forscher wagt sich in die Welt hinaus, spricht Handybenutzer an und bittet sie um fünf Minuten ihrer Zeit. Viele stimmen zu. Sie beantworten einige Fragen zu ihren Erfahrungen und Nutzungsgewohnheiten, einschließlich ihrer bevorzugten Methode zur Eingabe von Textnachrichten. Fünfzehn Multi-Tap-Nutzer und 15 T9-Nutzer werden gefunden. Die Benutzer werden gebeten, einen vorgegebenen Text einzugeben, während die Zeit gemessen wird. Zurück im Labor werden die Daten ausgewertet. Offensichtlich waren die T9-Benutzer schneller: Sie gaben 18 Wörter pro Minute ein, während die Multi-Tap-Benutzer nur 12 Wörter pro Minute eintippten. Die T9-Nutzer waren also 50 % schneller! Was ist die Schlussfolgerung? Es besteht ein Zusammenhang zwischen der Eingabemethode und der Geschwindigkeit der Texteingabe, allerdings handelt es sich dabei um Indizien, nicht um einen kausalen Zusammenhang. Es ist vernünftig, darüber zu berichten, was gemacht wurde und was herausgefunden wurde, aber es ist falsch, über das hinauszugehen, was die Methodik hergibt. Aus dieser einfachen Studie zu schließen, dass T9 schneller ist als Multi-Tap, wäre falsch. Bei näherer Betrachtung der Daten stellt sich heraus, dass die T9-Nutzer tendenziell technisch versierter waren: Sie gaben an, deutlich mehr Erfahrung im Umgang mit Mobiltelefonen zu haben und auch deutlich mehr Textnachrichten pro Tag zu verschicken als die Multi-Tap-Nutzer, die im Großen und Ganzen angaben, dass sie nicht gerne und nur sehr selten Textnachrichten verschicken.10 Der beobachtete Unterschied könnte also auf frühere Erfahrungen und Nutzungsgewohnheiten zurückzuführen sein und nicht auf inhärente Unterschiede bei den Texteingabemethoden. Wenn ein echtes Interesse daran besteht, festzustellen, ob eine Texteingabemethode schneller ist als eine andere, ist ein kontrolliertes Experiment erforderlich. Dies ist das Thema des nächsten Kapitels.
Ein letzter Punkt ist zu erwähnen. Bei bestimmten Arten von kontrollierten Experimenten sind Schlussfolgerungen über Ursache und Wirkung nicht möglich. Handelt es sich bei der manipulierten Variable um ein natürlich vorkommendes Merkmal der Teilnehmer, dann sind Kausalschlüsse unzuverlässig. Beispiele für natürlich vorkommende Merkmale sind das Geschlecht (weiblich, männlich), die Persönlichkeit (extrovertiert, introvertiert), die Händigkeit (links, rechts), die Erstsprache (z. B. Englisch, Französisch, Spanisch), der politische Standpunkt (links, rechts) usw. Diese Attribute sind legitime unabhängige Variablen, aber sie können nicht manipuliert werden, d. h. sie können den Teilnehmern nicht zugewiesen werden. In solchen Fällen ist eine kausale Schlussfolgerung nicht gültig, da es nicht möglich ist, Störvariablen (definiert in Kapitel 5) zu vermeiden. Männlich zu sein, extrovertiert zu sein, Linkshänder zu sein usw. bringt immer andere Attribute mit sich, die systematisch über die Stufen der unabhängigen Variable variieren. Schlussfolgerungen zu Ursache und Wirkung sind in diesen Fällen unzuverlässig, da man nicht wissen kann, ob der experimentelle Effekt auf die unabhängige Variable oder auf die Störvariable zurückzuführen ist.