Causal Relationship

4.8 Związki: poszlakowe i przyczynowe

Zauważyłem powyżej, że poszukiwanie i wyjaśnianie interesujących związków jest częścią tego, co robimy w badaniach HCI. Często specjalnie w tym celu projektuje się i przeprowadza kontrolowany eksperyment, a jeśli zostanie on przeprowadzony prawidłowo, możliwe jest wyciągnięcie określonego rodzaju wniosków. Często możemy powiedzieć, że warunki manipulowane w eksperymencie spowodowały zmiany w ludzkich reakcjach, które zostały zaobserwowane i zmierzone. Jest to związek przyczynowo-skutkowy, lub po prostu związek przyczynowy.

W HCI, zmienna manipulowana jest często atrybutem interfejsu w skali nominalnej, takim jak urządzenie, metoda wprowadzania, modalność informacji zwrotnej, technika wyboru, głębokość menu, układ przycisków i tak dalej. Zmienna mierzona to zazwyczaj zachowanie człowieka w skali współczynnika, takie jak czas wykonania zadania, odsetek błędów lub liczba kliknięć przycisków, zdarzeń przewijania, przesunięć spojrzenia itp.

Znalezienie związku przyczynowego w eksperymencie HCI daje potężny wniosek. Jeśli mierzona reakcja człowieka jest istotna w HCI, np. czas potrzebny na wykonanie wspólnego zadania, to wiedza, że warunek testowany w eksperymencie skraca ten czas, jest wartościowym wynikiem. Jeśli warunek jest implementacją nowatorskiego pomysłu i został porównany z obecną praktyką, to rzeczywiście może być powód do świętowania. Nie tylko znaleziono związek przyczynowy, ale nowy pomysł poprawia istniejącą praktykę. Jest to rodzaj wyniku, który wnosi cenną wiedzę do dyscypliny; posuwa stan wiedzy do przodu.9 O to właśnie chodzi w badaniach HCI!

Znalezienie związku nie musi oznaczać, że związek przyczynowy istnieje. Wiele związków ma charakter poszlakowy. Istnieją i mogą być obserwowane, mierzone i kwantyfikowane. Ale nie są one przyczynowe, a każda próba wyrażenia związku jako takiego jest błędna. Klasycznym przykładem jest związek między paleniem a rakiem. Załóżmy, że badanie naukowe śledzi nawyki i stan zdrowia dużej liczby osób przez wiele lat. Jest to przykład wspomnianej wcześniej korelacyjnej metody badawczej. W końcu okazuje się, że istnieje związek między paleniem a rakiem: rak występuje częściej u osób, które paliły. Czy na podstawie tego badania można wyciągnąć wniosek, że palenie powoduje raka? Nie. Zaobserwowany związek ma charakter poszlakowy, a nie przyczynowy. Rozważmy to: po dokładniejszym zbadaniu danych okazuje się, że tendencja do zachorowania na raka jest związana również z innymi zmiennymi w zbiorze danych. Wygląda na to, że ludzie, u których rozwinął się rak, pili więcej alkoholu, jedli więcej tłustych potraw, mniej spali, słuchali muzyki rockowej i tak dalej. Być może to zwiększone spożycie alkoholu spowodowało raka, lub spożycie tłustych pokarmów, lub coś innego. Związek jest poszlakowy, a nie przyczynowy. Nie znaczy to, że związki poszlakowe nie są użyteczne. Poszukiwanie i znalezienie związku poszlakowego jest często pierwszym krokiem w dalszych badaniach, częściowo dlatego, że stosunkowo łatwo jest zbierać dane i szukać związków poszlakowych.

Związki przyczynowe wyłaniają się z kontrolowanych eksperymentów. Poszukiwanie związku przyczynowego wymaga badania, w którym m.in. uczestnicy są wybierani losowo z populacji i losowo przydzielani do warunków badania. Losowy przydział zapewnia, że każda grupa uczestników jest taka sama lub podobna pod każdym względem z wyjątkiem warunków, w jakich każda grupa jest testowana. Tak więc różnice, które się pojawiają, są bardziej prawdopodobne z powodu (spowodowane przez) warunki testowe niż z powodu warunków środowiskowych lub innych okoliczności. Czasami uczestnicy są równoważeni w grupach, w których uczestnicy w każdej grupie są sprawdzani tak, aby grupy były równe pod względem innych istotnych atrybutów. Na przykład, eksperyment testujący dwa kontrolery wejściowe do gier może losowo przypisać uczestników do grup lub zbalansować grupy tak, aby zakres doświadczenia w grach był w przybliżeniu równy.

Przykład HCI jest podobny do przykładu z paleniem i rakiem: Badacz jest zainteresowany porównaniem wprowadzania tekstu za pomocą multi-tapu i wprowadzania predykcyjnego (T9) w telefonie komórkowym. Badacz wyrusza w świat i zwraca się do użytkowników telefonów komórkowych, prosząc o pięć minut ich czasu. Wielu z nich zgadza się. Odpowiadają na kilka pytań dotyczących doświadczenia i zwyczajów użytkowania, w tym preferowanej metody wprowadzania wiadomości tekstowych. Znaleziono piętnastu użytkowników Multi-tap i piętnastu użytkowników T9. Użytkownicy są proszeni o wpisanie określonej frazy tekstu, podczas gdy są mierzeni czasem. Po powrocie do laboratorium, dane są analizowane. Okazuje się, że użytkownicy T9 byli szybsi, wpisując 18 słów na minutę, w porównaniu do 12 słów na minutę w przypadku użytkowników multi-tap. To o 50 procent szybciej dla użytkowników T9! Jaki jest wniosek? Istnieje związek między sposobem wprowadzania tekstu a szybkością jego wprowadzania, jednak jest to związek poszlakowy, a nie przyczynowy. Rozsądne jest informowanie o tym, co zostało zrobione i co zostało znalezione, ale błędem jest wychodzenie poza to, co daje metodologia. Wyciągnięcie wniosku z tego prostego badania, że T9 jest szybsze niż multi-tap byłoby błędem. Po bliższym przyjrzeniu się danym okazuje się, że użytkownicy T9 byli bardziej obeznani z technologią: zgłosili oni znacznie większe doświadczenie w korzystaniu z telefonów komórkowych, a także zgłosili wysyłanie znacznie większej liczby wiadomości tekstowych dziennie niż użytkownicy multi-tap, którzy w większości stwierdzili, że nie lubią wysyłać wiadomości tekstowych i robią to bardzo rzadko.10 Tak więc zaobserwowana różnica może wynikać z wcześniejszego doświadczenia i nawyków użytkowania, a nie z nieodłącznych różnic w metodach wprowadzania tekstu. Jeśli istnieje rzeczywiste zainteresowanie ustaleniem, czy jedna metoda wprowadzania tekstu jest szybsza od drugiej, konieczne jest przeprowadzenie kontrolowanego eksperymentu. Jest to temat następnego rozdziału.

Jeden ostatni punkt zasługuje na wzmiankę. Wnioski przyczynowo-skutkowe nie są możliwe w niektórych rodzajach kontrolowanych eksperymentów. Jeśli zmienna, którą się manipuluje, jest naturalnie występującym atrybutem uczestników, wtedy wnioski przyczynowo-skutkowe są niewiarygodne. Przykłady naturalnie występujących cech to płeć (kobieta, mężczyzna), osobowość (ekstrawertyk, introwertyk), leworęczność (lewa, prawa), pierwszy język (np. angielski, francuski, hiszpański), poglądy polityczne (lewica, prawica) i tak dalej. Te atrybuty są prawomocnymi zmiennymi niezależnymi, ale nie można nimi manipulować, to znaczy nie można ich przypisać uczestnikom. W takich przypadkach wniosek przyczynowo-skutkowy nie jest ważny, ponieważ nie jest możliwe uniknięcie zmiennych zakłócających (zdefiniowanych w rozdziale 5). Bycie mężczyzną, bycie ekstrawertykiem, bycie leworęcznym itd. zawsze wiąże się z innymi atrybutami, które systematycznie różnią się na różnych poziomach zmiennej niezależnej. Przyczyna i skutek wnioski są niewiarygodne w tych przypadkach, ponieważ nie jest możliwe, aby wiedzieć, czy efekt eksperymentalny był ze względu na zmienną niezależną lub zmienną zakłócającą.