Die Medienevaluierung der Anti-Tabak-Kampagne „Wahrheit“ in Florida: Design, Ergebnisse des ersten Jahres und Implikationen für die Planung künftiger Medienevaluierungen in den Bundesstaaten
Methodik
Design
Die Funktionen der Evaluierung zur Verfolgung, Überwachung und Zielreaktion wurden anhand von vier Erhebungen geplant. Eine Basiserhebung wurde vor dem Start der Kampagne im April 1998 durchgeführt. Dabei wurden Daten zur Bekanntheit und zur bestätigten Bekanntheit (CA) von Anti-Tabak-Werbung, Medienbotschaften, Anti-Tabak-Einstellungen, Verhaltensweisen beim Tabakkonsum sowie zusätzliche demografische, Haushalts- und Lebensstilparameter erhoben. Die zweite Erhebung – die Florida Anti-Tabak-Medienevaluierung (FAME) – wurde etwa sechs Wochen nach Beginn der Kampagne durchgeführt. Ziel dieser Erhebung war es, die anfängliche Verbreitung der Kampagnenbotschaft und die Reaktionen der Jugendlichen auf die Werbung zu messen, weshalb sie wesentlich kürzer war als die Basiserhebung. Zwei weitere Erhebungen im ersten Jahr waren für September 1998 (sechs Monate nach Beginn der Kampagne) und Mai 1999, dem Ende des ersten Jahres der Kampagne, geplant. Der in den sechs- und 12-monatigen Umfragen verwendete Fragebogen entsprach weitgehend dem der Basiserhebung. Im ersten Jahr lag die durchschnittliche Bruttowertung der Anzeigen bei etwa 1600 Punkten pro Quartal. Multipliziert man die Reichweite mit der Expositionshäufigkeit, so ergibt sich eine geplante Expositionshäufigkeit von etwa 16 pro Quartal. Es ist wichtig zu wissen, dass dieses Maß nicht angibt, wie oft eine Anzeige von einem Mitglied der Zielbevölkerung gesehen wird. Vielmehr stellt sie die Anzahl der Male dar, die alle Personen eine Anzeige sehen können, basierend auf einer Schätzung aller Zuschauer zu einem Zeitpunkt, an dem eine Anzeige ausgestrahlt wird.
Um zu beurteilen, ob die Medienkampagne die Anti-Tabak-Einstellungen/Überzeugungen und das Verhalten beim Tabakkonsum verändert hat, wurde ein quasi-experimentelles Design gewählt. Dabei wurde eine Population ermittelt, die bis auf die Exposition gegenüber der (Behandlungs-)Medienkampagne mit der Zielgruppe in Florida übereinstimmte. Nur vier Bundesstaaten (Arizona, Kalifornien, Massachusetts, Oregon) hatten organisierte, groß angelegte Anti-Tabak-Programme mit nennenswerten Medienkomponenten aufgelegt bzw. standen kurz davor. Aus einer Reihe von Studien geht hervor, dass sich Kohorten junger Menschen in den USA in ihren Einstellungen, Verhaltensweisen und Lebensstilen immer mehr ähneln4-7 , so dass als Vergleichspopulation (Kontrollgruppe) die 12- bis 17-Jährigen in den vier oben genannten Bundesstaaten gewählt wurden. Repräsentative Stichproben aus der Vergleichspopulation wurden zu Beginn und nach 12 Monaten mit Instrumenten befragt, die der FAME-Erhebung entsprachen.
Zusammengefasst umfasste das Evaluierungsdesign sechs Erhebungen: vier bei der Behandlungspopulation und zwei bei der nationalen Vergleichspopulation. Der Inhalt der FAME-Erhebungen war so konzipiert, dass die Reichweite, die Durchdringung und die Akzeptanz der Anzeigen und der Kampagnenbotschaft verfolgt und überwacht werden konnten, und dass beurteilt werden konnte, wie die Veränderungen der Reichweite, der Durchdringung und der Akzeptanz mit den Anti-Tabak-Einstellungen/Überzeugungen und dem Verhalten zusammenhängen. Die nationalen Erhebungen waren zeitlich so angelegt, dass parallele Messungen in der Kontrollbevölkerung möglich waren, die der „Wahrheit“-Kampagne nicht ausgesetzt war.
STICHPUNKTE
Eine Reihe potenzieller Stichprobenrahmen wurde in Betracht gezogen, darunter zufällige Ziffernwahlen, „bereinigte“ Listen mit Zufallszahlen und gezielte Zufallszahlen für Listen öffentlicher Schüler aus Aufzeichnungen des Bildungsministeriums, Schulverzeichnissen und Haushaltsaufzeichnungen, die vom Nationalen Zentrum für Gesundheitsstatistiken für sein laufendes Datenerhebungsprogramm geführt werden. Die Methode der Zufallsauswahl wurde frühzeitig verworfen. Die Gründe hierfür werden an anderer Stelle ausführlich erörtert8 , hängen aber mit der einzigartigen demografischen Struktur Floridas und dem Wunsch nach bevölkerungs- und nicht haushaltsbezogenen Stichproben zusammen. Andere potenzielle Stichprobenrahmen schieden aufgrund rechtlicher oder bürokratischer Beschränkungen oder aufgrund von Bedenken hinsichtlich ihrer Repräsentativität aus.
Eine weitere Möglichkeit für Stichprobenrahmen, die in Betracht gezogen wurde, war der Kauf einer von einem Anbieter erstellten Liste. Ein solcher Anbieter ist auf die Bevölkerung im Schulalter spezialisiert.8 Wir konnten feststellen, dass seine Dateien schätzungsweise die Hälfte der Personen in den anvisierten Altersgruppen in Florida enthalten. Zu den Quellen, aus denen sie ihre Informationen beziehen, gehören sowohl öffentliche und private Schulverzeichnisse und Jahrbücher als auch Lager, Clubs und gemeinnützige Organisationen, die Wohltätigkeitsdienste anbieten, sowie Abonnementlisten und andere Marktforschungsquellen. Die Dateien des Anbieters enthalten Name, Adresse, Telefonnummer, Geschlecht, ethnische Zugehörigkeit und das voraussichtliche Datum des Schulabschlusses. Anhand dieser Informationen wurde eine zufällig ausgewählte Liste von Namen erstellt, die nach Region, Geschlecht, ethnischer Zugehörigkeit und Alter repräsentativ für die Zielgruppe waren. Diese Quelle bot den zusätzlichen Vorteil, dass wir bei jedem Anruf eine bestimmte Person mit ihrem Namen ansprechen konnten. Der Anbieter unterhält in jedem Bundesstaat ein Büro, das für die Zusammenstellung der staatlichen Daten und deren Meldung an eine zentrale Stelle zuständig ist. Wir schätzten, dass der Erfassungsgrad für die einzelnen Bundesstaaten zwischen etwa 15 % und über 65 % schwankt, wobei die niedrigsten Prozentsätze in den Bundesstaaten mit der kleinsten Bevölkerung zu finden sind.8 Um dieses Problem für die nationalen Stichproben zu lösen, haben wir die Daten der Bundesstaaten zu Volkszählungsregionen aggregiert und anhand der für Florida verwendeten Parameter geschichtet. Vergleiche mit den neuesten verfügbaren Schätzungen ergaben für beide Stichproben und ihre Referenzpopulation keine signifikanten Unterschiede in einer Reihe von Dimensionen, für die keine Schichtung vorgenommen wurde, einschließlich des Prozentsatzes, der in einem Haushalt mit nur einem Elternteil/Erziehungsberechtigten lebt, und des Prozentsatzes, der eine private/öffentliche Schule besucht. Die angestrebten Stichprobengrößen betrugen 1800 für die FAME-Erhebungen und 1000 für die nationalen Erhebungen.
TELEFONVERFAHREN
Befrager waren Studenten und Lehrer, die eine sechsstündige Schulung erhielten und ein „Testinterview“ bestehen mussten. Die Interviews wurden auf Englisch oder Spanisch geführt. Die durchschnittliche Bearbeitungszeit (mit Ausnahme der kürzeren Juni-FAME) lag unter 25 Minuten. Alle Interviews begannen mit einer geskripteten Nachricht, in der namentlich nach den Eltern oder Erziehungsberechtigten des Zielkindes gefragt wurde. Es wurden bis zu fünf Rückrufe getätigt, um die Eltern zu erreichen. Die Eltern wurden über den Zweck des Anrufs informiert und darüber, dass ihr Kind für die Teilnahme an der Befragung eine Vergütung von 12,50 $ erhalten würde. Wenn die Eltern/Erziehungsberechtigten ihr Einverständnis gaben und das Kind anwesend war, sprachen wir sofort mit dem Kind. Wenn das Kind nicht anwesend war oder zu diesem Zeitpunkt nicht teilnehmen konnte, wurde ein Rückruftermin vereinbart. Es wurden bis zu fünf Rückrufe pro Kind durchgeführt. Die Befragung der Jugendlichen begann mit einer Einverständniserklärung.
Eine Analyse der Rücklaufquoten und der Merkmale der Jugendlichen nach Ablehnung durch die Eltern und die Jugendlichen wurde durchgeführt. Bei keinem der betrachteten Faktoren wurden signifikante Unterschiede zwischen den Erhebungen festgestellt.89 Die Verweigerungsquoten auf der Ebene der Eltern lagen im Durchschnitt bei unter 10 %, auf der Ebene der Kinder bei unter 6 %. Allerdings verweigerten die Eltern weiblicher Jugendlicher durchweg häufiger die Erlaubnis als alle Eltern und die Eltern männlicher Jugendlicher. Die Verweigerungsquote für diese Gruppe ist nach wie vor niedrig (unter 13 %). Nach Berücksichtigung der Rückrufe kam es bei einer von 1 397 angerufenen Nummern zu einem Interview; die durchschnittliche Antwortquote lag bei knapp 69 %. Am Ende jedes Interviews wurden die Befragten gefragt, ob sie bereit wären, erneut befragt zu werden. 98 % bejahten dies. Die Interviewer bewerteten jedes Interview anhand von drei Dimensionen selbst. Die Interviewer berichteten, dass sie bei 8,5 % der Interviews Grund zu der Annahme hatten, dass jemand in der unmittelbaren Umgebung mithörte oder anwesend war, und bei etwa 21 % dieser Interviews schien der Befragte dadurch gestört oder abgelenkt zu sein. Dies war bei Jugendlichen der Mittelstufe (12 %) wahrscheinlicher als bei Jugendlichen der Oberstufe (8 %). Es gab keine systematische Verzerrung bei den Berichten über den Tabakkonsum zwischen den Befragten, die berichteten, dass jemand zuhörte oder anwesend war, und denen, die dies nicht taten.9 Dies könnte zum Teil darauf zurückzuführen sein, dass die Fragen zum Tabakkonsum am Ende des Interviews gestellt wurden. Die Interviewer berichteten, dass weniger als 4 % der Befragten Schwierigkeiten hatten, die gestellten Fragen zu verstehen.
MASSNAHMEN
In der folgenden Analyse konzentrieren wir uns auf Kampagnen-CA und werbespezifische Bekanntheit und CA. Das Hauptaugenmerk liegt auf Fernsehwerbung, da detaillierte Analysen gezeigt haben, dass die Befragten, die TV-Werbung wahrgenommen haben, auch über Werbung in anderen Medien informiert waren. Das heißt, dass nur wenige Befragte, die angaben, Werbung zu kennen, oder die ihre Kenntnis von Werbung in anderen Medien bestätigten, dies nicht auch für Fernsehwerbung angaben und bestätigten.
Bekanntheit, Bekanntheit und Empfänglichkeit für Anti-Tabak-Werbung wurden anhand einer Reihe von Fragen zu jeder spezifischen Werbung in jeder Umfrage gemessen. Das erste Item in dieser Sequenz bezog sich auf einen einzigen „Hinweis“ im Kontext des allgemein formulierten Items: „Haben Sie kürzlich eine Anti-Raucher-Werbung gesehen, in der ‚cue‘ vorkam?“ Befragte, die eine positive Antwort auf dieses Item gaben, wurden als bewusst kodiert. Zur Messung von CA wurden den Befragten zwei zusätzliche Items gestellt. Das erste verlangte von den Befragten, Details der Werbung ohne zusätzliche Hinweise zu beschreiben. Bei der zweiten sollten die Befragten die Hauptbotschaft oder das Thema der Anzeige ohne weitere Hinweise beschreiben. Antworten, die den Hinweis wiederholten oder allgemein gehalten waren (z. B. „Rauchen Sie nicht“), wurden nicht als bestätigt kodiert. Den Befragten, die einen Werbespot kannten, wurden drei Fragen gestellt, um ihre Reaktionen darauf zu ermitteln: Hat ihnen der Spot gefallen, haben sie mit Freunden darüber gesprochen, und hat der Spot sie zum Nachdenken darüber gebracht, ob sie rauchen sollten oder nicht?
Die Florida- und die nationale Basisstudie enthielten dieselben drei Fernsehspots. Dabei handelte es sich um landesweit beliebte Public Service Announcements (PSAs), die in Arizona entwickelt worden waren, ein Entglamourisierungsthema aufwiesen und über das CDC Media Resource Centre erhältlich waren. Die nachfolgende FAME-Umfrage enthielt drei Fernsehspots. Diese hatten die Manipulation der Industrie zum Thema und wurden von dem Medienunternehmen in Florida produziert. Für die einjährige nationale Erhebung arbeiteten wir mit der CDC und ihrem Vertriebsunternehmen zusammen, um die drei im Laufe des Jahres am häufigsten bestellten Fernsehspots zu ermitteln. Diese Spots wurden in der einjährigen nationalen Erhebung verwendet. In der nachstehenden Analyse wurden die Befragten als „bewusst“ und „CA“ gezählt, wenn sie angaben, dass sie einen Werbespot in einem Flug wahrgenommen haben.
Wir geben auch Daten für vier Messgrößen der Kampagnen- und nicht der werbespezifischen CA an; zwei davon wurden aus ungestützten Items abgeleitet. Das erste Maß wurde aus zwei Items abgeleitet. Die Befragten wurden gefragt, ob sie von einer Anti-Tabak- oder Anti-Raucher-Kampagne in Florida wüssten. Wenn sie mit „Ja“ antworteten, wurden sie nach dem Hauptthema der Kampagne gefragt. Ein zweites Item diente zur Messung der „Markenbekanntheit“ der Kampagne. In der Diskussion wird dies als „Logobestätigung“ bezeichnet. Dies wurde gemessen, indem die Befragten gebeten wurden, anzugeben, woran sie denken, wenn sie das Wort „Wahrheit“ in einem Oval sehen – dem Symbol für die Kampagne. Die Befragten wurden als CA kodiert, wenn sie eines der Hauptthemen oder Schlagworte der Kampagne wiederholten, z. B. „Unsere Marke ist die Wahrheit, ihre Marke ist die Lüge“.
Das dritte Maß für die CA der Kampagne setzt sich aus der CA der Werbung zusammen. Zusätzlich zur TV-Komponente umfasste die Kampagne begrenzte Radio-, Plakat- und Display-Anzeigen sowie Werbeartikel wie Aufkleber, Schlüsselbänder, Mützen und T-Shirts. Um die Bekanntheit der einzelnen Werbemittel zu ermitteln, wurden ähnliche Fragen gestellt wie bei der Messung der Bekanntheit von Fernsehwerbung. Für jede FAME-Umfrage wurde ein zusammengesetztes Maß für die Bekanntheit einer Medienkampagne berechnet, indem jede Person, die eine dieser Fragen oder eine Fernsehwerbung bestätigte, als bekannt eingestuft wurde. Das letzte Maß der Kampagnen-CA ist der Prozentsatz der Befragten, die mindestens eine der drei oben genannten Maßnahmen bestätigten.
Daten werden auch für ausgewählte Anti-Tabak-Einstellungen/Glaubenssätze präsentiert. Jedes dieser Items wurde den Befragten in den FAME- und nationalen Erhebungen gestellt. Die Befragten wurden gebeten mitzuteilen, ob sie dem jeweiligen Item voll und ganz zustimmten, zustimmten, nicht zustimmten oder überhaupt nicht zustimmten. In der Analyse werden diese Kategorien zu „stimme zu/stimme nicht zu“ zusammengefasst. Alle Angaben zum Tabakverhalten basieren auf Selbstauskünften.
Bewertungshypothesen
Zwei Gruppen von Hypothesen wurden für die Bewertung aufgestellt. Die erste bezieht sich auf die Reichweite und Durchdringung der Zielgruppe durch das Medienprogramm und die Reaktion der Zielgruppe darauf. Die erste dieser Hypothesen wurde vertraglich festgelegt; der Medienunternehmer sollte einen Bonus erhalten, wenn die CA der Kampagne bis zum Ende des ersten Jahres 85 % erreicht. Dies war die „Tracking-Hypothese“. Eine zweite Hypothese lautete, dass die Zielgruppe für eine organisierte, auf ein zentrales Thema ausgerichtete Reihe von Werbespots empfänglicher sein würde als für PSAs. Diese Hypothese stützte sich auf die Kommunikationstheorie im Allgemeinen10-13 und auf frühere Untersuchungen, die darauf hindeuteten, dass das Thema „Manipulation durch die Industrie“ eine hohe Anziehungskraft auf Jugendliche hat.14-16 Die zweite Gruppe von Hypothesen wurde mit einem quasi-experimentellen Design getestet. Diese Hypothesen besagen, dass ein Kampagneneffekt in Florida größere Veränderungen bewirken würde als in den anderen Bundesstaaten: Bekanntheit und Akzeptanz der Werbung, größere Empfänglichkeit, stärkere Veränderung der Anti-Tabak-Einstellungen/Glaubenssätze und geringeres Tabakverhalten.