Causal Relationship
4.8 Relationships: circumstantial and causal
興味深い関係を探し、説明することは、HCI 研究で行うことの一部であると前述しました。 多くの場合、管理された実験がこの目的のために特別に設計され、実施され、適切に行われれば、特定のタイプの結論が可能です。 実験で操作された条件が、観察・測定された人間の反応の変化を引き起こしたと言えることが多いのです。
HCI では、操作される変数は、デバイス、入力メソッド、フィードバック モダリティ、選択テクニック、メニューの深さ、ボタンのレイアウトなど、インターフェースの名目上の属性であることが多くあります。 測定される変数は、通常、タスク完了時間、エラー率、またはボタンのクリック数、スクロール イベント、視線の移動など、比率スケールの人間の行動です。
HCI 実験で因果関係を見つけると、強力な結論を得ることができます。 測定された人間の反応が、一般的なタスクを実行するのにかかる時間など、HCI において重要である場合、実験でテストされた条件がこの時間を短縮することを知ることは、貴重な結果です。 もし、その条件が新しいアイデアの実装であり、現在の実践と比較されたのであれば、確かに喜ぶべきことかもしれない。 因果関係が明らかになっただけでなく、その新しいアイデアが既存の実践を改善したのである。 これこそ、HCI 研究のすべてです。
関係を見つけることは、必ずしも因果関係が存在することを意味しません。 多くの関係は状況的なものです。 それらは存在し、観察、測定、および定量化することができます。 しかし、それらは因果関係ではなく、そのような関係を表現しようとする試みは間違っています。 典型的な例は、喫煙と癌の関係である。 ある研究が、多数の人々の喫煙習慣と健康状態を長年にわたって追跡しているとします。 これは、先に述べた相関的研究方法の一例である。 その結果、喫煙とがんの間には、喫煙した人ほどがんが多いという関係が見いだされました。 では、この研究から「喫煙はがんの原因である」と結論づけるのは正しいのでしょうか? いいえ、この研究は状況証拠に過ぎず、因果関係があるわけではありません。 もっと詳しく調べてみると、がんになりやすいかどうかは、データセットに含まれる他の変数とも関係があることがわかるのです。 がんを発症した人は、アルコールをよく飲み、脂肪分の多い食事をし、睡眠時間が短く、ロックミュージックを聴くなどの傾向もあるようだ。 おそらく、アルコールの摂取量が増えたことが癌の原因か、脂肪分の多い食品の摂取量が増えたことが原因か、あるいは他の原因か。 この関係は状況証拠であり、因果関係ではありません。 状況的関係が有用でないとは言いません。 状況的関係を探して見つけることは、さらなる研究の第一歩となることが多く、その理由のひとつは、データを集めて状況的関係を探すのが比較的簡単だからです。
因果関係は、管理された実験から生まれます。因果関係を探すには、特に、参加者を集団から無作為に選び、試験条件に無作為に割り当てる研究が必要です。 無作為に割り当てることで、参加者の各グループは、各グループがテストされる条件以外のすべての点で、同じか類似していることが保証されます。 したがって、出現する差異は、環境その他の状況よりも、試験条件による(引き起こされる)可能性が高い。 参加者を各グループにバランスよく配置し、各グループの参加者が他の関連する属性の点で等しくなるようにスクリーニングすることもある。 たとえば、ゲーム用の 2 つの入力コントローラーをテストする実験では、参加者をランダムにグループに割り当てるか、ゲーム経験の範囲がほぼ等しくなるようにグループのバランスをとることができます。
ここで、喫煙とがんの例に似た HCI 例を紹介します。 ある研究者は、携帯電話のテキスト入力において、マルチタップと予測入力 (T9) を比較することに興味を持っています。 研究者は世界に飛び出し、携帯電話のユーザーにアプローチして、5 分間の時間をもらうよう頼みます。 多くの人が承諾してくれた。 そして、携帯電話の使用経験や使用習慣、好きな文字入力方法などについて、いくつかの質問に答えてもらう。 その結果、15人のマルチタップユーザーと15人のT9ユーザーが見つかった。 ユーザーに時間を計ってもらいながら、決められたフレーズのテキストを入力してもらう。 研究室に戻り、データを分析する。 すると、T9ユーザーは1分間に18ワード、マルチタップユーザーは1分間に12ワードと、明らかにT9ユーザーの方が入力速度が速いことがわかった。 T9の方が50%も速いのです。 結論は? 入力方法と文字入力速度には関係があるが、その関係は状況証拠的なものであり、因果関係はない。 何が行われ、何が発見されたかを報告することは合理的ですが、方法論が与えるものを超えて冒険することは間違っています。 この単純な調査から、T9がマルチタップより速いと結論づけるのは間違っています。 T9ユーザーは、携帯電話の使用経験がかなり豊富で、1日に送信するメールの数も、マルチタップユーザーに比べてかなり多いことが分かっています。10 したがって、この違いは、文字入力方法の違いによるものではなく、これまでの経験や使用習慣によるものかもしれません。 あるテキスト入力方法が他の方法よりも速いかどうかを判断することに真の関心があるのであれば、対照実験が必要である。 これは、次の章のトピックです。
最後に、言及に値する点を 1 つ挙げます。 原因と結果の結論は、ある種の対照実験では不可能です。 操作される変数が参加者の自然発生的な属性である場合、原因と結果の結論は信頼できないのです。 自然発生的な属性の例としては、性別(女性、男性)、性格(外向的、内向的)、手の大きさ(左、右)、第一言語(例:英語、フランス語、スペイン語)、政治的見解(左、右)、などである。 これらの属性は正当な独立変数であるが、操作することはできない、つまり参加者に割り当てることはできない。 このような場合、交絡変数(第5章で定義)を避けることができないため、原因と結果の結論は妥当ではありません。 男性であること、外向的であること、左利きであること、などは常に、独立変数のレベル間で系統的に変化する他の属性を引き出します。 このような場合、実験効果が独立変数によるものか、交絡変数によるものかを知ることができないため、原因と結果の結論は信頼できません。