...

PISA et al.: Nutzung der PISA-Daten aus unterschiedlichen Fachperspektiven

by user

on
Category: Documents
3290

views

Report

Comments

Transcript

PISA et al.: Nutzung der PISA-Daten aus unterschiedlichen Fachperspektiven
ID: 110
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Ökonomie, Psychologie
Thematisches Cluster: Bildung im Sekundarbereich, Kompetenzdiagnostik/ Kompetenzentwicklung
Stichworte: PISA, Perspektivenvielfalt, Large-Scale Assessments
PISA et al.: Nutzung der PISA-Daten aus unterschiedlichen Fachperspektiven
Chair(s): Christine Sälzer (TUM School of Education, ZIB), Jörg-Henrik Heine (TUM School of Education, ZIB)
Diskutant(en): Kristina Reiss (TUM School of Education, ZIB)
Internationale Large-Scale Assessments liefern eine attraktive Datengrundlage für die psychologische, pädagogische und
sozialwissenschaftliche Forschung (Rammstedt & Spinath, 2013). Solche Datensätze, die beispielsweise im Rahmen von PISA
generiert und der Öffentlichkeit zur Verfügung gestellt werden, können auf unterschiedliche Weise genutzt werden und bieten
zahlreiche Anschlussmöglichkeiten für empirische Forschung. Dieses Symposium verbindet vier Perspektiven aus
unterschiedlichen Disziplinen und Forschungsfeldern mit jeweils unterschiedliche Fragen an PISA. Ausgehend von
unterschiedlichen theoretischen Ansätzen und den daraus gewonnenen Schlussfolgerungen wird der Mehrwert empirischer
Forschung mit PISA-Datensätzen aufgezeigt.
Im ersten Beitrag wird aus der Perspektive der empirischen Bildungsforschung kritisch hinterfragt, ob die in PISA gemessenen
Kompetenzen tatsächlich weitestgehend in der Schule erworben werden. Die Studie untersucht, inwieweit das absichtliche
Versäumen von Unterricht in den Fächern Deutsch, Mathematik und den Naturwissenschaften mit den jeweiligen PISAKompetenzskalen zusammenhängt. Darüber hinaus wird gezeigt, dass sich das fachspezifische Schwänzen von Unterricht auf
einer vierdimensionalen Skala abbilden lässt. Die Fächer Sport, Deutsch und Mathematik bilden dabei jeweils eine eigene
Dimension, während die naturwissenschaftlichen Fächer Biologie, Physik und Chemie eine gemeinsame Dimension darstellen
und demnach häufig alle drei geschwänzt werden.
Aus der Sicht der Measurement-Forschung sind die durch PISA gewonnenen Daten insofern begrenzt, als sie keine
längsschnittliche Modellierung der erfassten Kompetenzen und ihrer Entwicklung erlauben. Gleichzeitig fehlt bei nationalen
Längsschnittuntersuchungen wie dem NEPS in Deutschland oftmals die internationale Verankerung. Eine Verlinkung von PISA
2012 und NEPS steht davon ausgehend im Mittelpunkt des zweiten Beitrags und zeigt auf, inwieweit beispielsweise Schülerinnen
und Schüler, welche die Mindeststandards in PISA nicht erreichen bzw. die Regelstandards übertreffen, in der NEPS-Studie
längsschnittlich untersucht werden könnten.
Die bildungsökonomische Perspektive auf PISA wirft einen vertiefenden Blick auf die Effektivität und mögliche Auswirkungen von
Unterrichtsstunden auf die PISA-Ergebnisse in der Schweiz. Der Einsatz ökonometrischer Modelle erlaubt kausale
Schlussfolgerungen zur Wirkung von Schulstunden auf Schulleistungen, was im dritten Beitrag auf die Schweizer Daten von
PISA 2012 sowie einer Zusatzerhebung übertragen wird. Die signifikanten Unterschiede in den Effekten von Unterrichtsstunden
auf die PISA-Ergebnisse zwischen verschiedenen Anforderungsniveaus im Schulsystem der Schweiz werden insbesondere
hinsichtlich der Heterogenität der Schulleistungen diskutiert.
Die vierte Perspektive dieses Symposiums, Educational Policy, ist ein englischsprachiger Beitrag und widmet sich mit Shanghai
einem als „PISA-Sieger“ bekannten Bildungssystem. Es wird untersucht, welchen Mehrwert an Kompetenz dieses
Bildungssystem seinen Schülerinnen und Schüler in einem Schuljahr vermittelt. Die Ergebnisse deuten darauf hin, dass innerhalb
Shanghais wesentliche Teile des PISA-Erfolgs nicht auf das System, sondern auf die Eingangsvoraussetzungen der
Schülerschaft zurückgehen. Dieser Befund wird kritisch diskutiert.
Beiträge des Symposiums
Wie fachspezifisch ist Schulschwänzen? Analysen zum Antwortverhalten und zum Zusammenhang mit
Schülerkompetenzen in PISA 2012
Christine Sälzer, Jörg-Henrik Heine
TUM School of Education
Large-Scale Assessments wie PISA gehen in der Regel von der Annahme aus, dass die gemessenen Kompetenzen
weitestgehend in der Schule erworben werden. Gleichzeitig konzentrieren sich diese Studien meist auf kognitive Kompetenzen.
Mittlerweile kommt jedoch den Kontextfragebögen und den darin erhobenen Merkmalen der Schüler, ihrer Schule sowie ihres
Umfeldes eine immer größere Bedeutung in Large-Scale Assessments zu (OECD, 2013a; OECD, 2013b). Dass
Schülerselbstberichte oftmals die verlässlichste Datenquelle für die Wahrnehmung von Kontextmerkmalen, Einstellungen oder
auch Themen mit weitgehend ungesicherter Datenlage sind, stützt diese Entwicklung (Laing, Sawyer & Noble, 1987; Pace, 1985).
Das absichtliche, unerlaubte Versäumen von Schulunterricht (‚Schulschwänzen‘, vgl. etwa Ricking, 2006) verletzt unter
Umständen die Annahme, dass die in PISA gemessenen Schülerkompetenzen weitestgehend in der Schule erworben wurden.
Wenn Schüler absichtlich Unterricht versäumen und sich damit einer institutionellen Lerngelegenheit entziehen, so bleibt zu
klären, inwieweit Unterrichtsversäumnisse mit dem Abschneiden im PISA-Test zusammenhängen. Spezifische Fragen zum
Schulschwänzen im Schülerfragebogen zu PISA 2012 greifen diese Überlegungen auf und nutzen Schülerselbstberichte als
Grundlage für die Analyse zweier Zusammenhänge: (1) Schwänzen Schüler eher gezielt einzelne Fächer oder handelt es sich
um ein generalisiertes Verhalten? (2) Inwieweit hängt das fachspezifische Schulschwänzen mit der durchschnittlichen Kompetenz
in der entsprechenden PISA-Domäne zusammen?
Die Daten für die Analysen in diesem Aufsatz wurden im Rahmen der fünften PISA-Erhebungsrunde (PISA 2012) in Deutschland
erhoben (vgl. Prenzel et al., 2013). Die Stichprobe besteht folglich aus den an PISA 2012 beteiligten fünfzehnjährigen
Schülerinnen und Schülern (n = 5001). Die durchschnittliche Kompetenz der Jugendlichen in den drei untersuchten Domänen
Mathematik, Lesen und Naturwissenschaften wurde anhand der PISA-Kompetenztests erfasst. Alle weiteren Variablen wurden
über den Schülerfragebogen erhoben. Ergänzend zu den international vorgegebenen Fragen zum Zu-spät-Kommen oder
Schwänzen einzelner Stunden bzw. ganzer Schultage in den beiden vollständigen Schulwochen vor dem PISA-Test wurden dem
Schülerfragebogen in Deutschland vertiefende Fragen zum Schulschwänzen in einzelnen Fächern im gesamten laufenden
Schuljahr hinzugefügt.
Forschungsfrage (1) wurde in zwei Schritten untersucht. Zunächst wurde überprüft, ob sich die einzelnen Items zur Erfassung
des Schwänzens in den einzelnen Fächern auf einer eindimensionalen Skala zum Schulschwänzen abbilden lassen. Hierzu
wurden sechs fachspezifische Items zum Schulschwänzen mit Hilfe des R-Pakets pairwise (Heine, 2014) skaliert und einer
Rasch-Residual-Faktorenanalyse unterzogen (Linacre, 1998). Auf diese Weise kann gezeigt werden, ob Schülerinnen und
Schüler, die ein Fach gezielt schwänzen, auch dazu neigen, andere Fächer zu versäumen (was für ein eindimensionales
Konstrukt spräche) oder ob es sich beim Schwänzen um ein möglicherweise einzelfachspezifisches Verhalten und damit um ein
mehrdimensionales Konstrukt handelt.
Forschungsfrage (2) wurde anhand einer Regressionsanalyse zur Vorhersage der durchschnittlichen Kompetenz in Mathematik,
Lesen und Naturwissenschaften anhand einiger Kontrollvariablen sowie dem fachspezifischen Schwänzen untersucht.
Die Ergebnisse zeigen, dass es sich beim Schulschwänzen um ein vierdimensionales, fachspezifisches Konstrukt handelt. Am
häufigsten wird der Sportunterricht geschwänzt (Dimension 1), Deutsch und Mathematik als Kernfächer bilden jeweils eine
weitere Dimension. Die vierte Dimension besteht aus den drei naturwissenschaftlichen Fächern Biologie, Chemie und Physik.
Wer Sport schwänzt, schwänzt nicht zwingend auch andere Fächer, wohingegen die Positionierung der drei
naturwissenschaftlichen Fächer auf einer Dimension nahe legt, dass Schüler ihr Verhalten in Bereich Naturwissenschaften
fachübergreifend generalisieren. Ferner weisen die Ergebnisse auf substantielle Zusammenhänge zwischen dem
fachspezifischen Schulschwänzen und dem jeweils erreichten Niveau in den einzelnen Kompetenz-Domänen hin. Je weniger
Unterricht die Schüler versäumt haben, desto besser schneiden sie in der jeweiligen PISA-Domäne ab.
Mathematische Kompetenz in nationalen und internationalen Large Scale Assessments messen: Eine
Linking-Studie von PISA und dem nationalen Bildungspanel (NEPS) in Deutschland
Ann-Katrin van den Ham1, Timo Ehmke2, Christine Sälzer3, Jörg-Henrik Heine3
1
IPN Kiel, 2Leuphana Universität Lüneburg, 3TUM School of Education, ZIB
Im Rahmen der Gesamtstrategie zum Bildungsmonitoring der der Ständigen Konferenz der Kultusminister der Länder (2006)
dient PISA als wichtiges Instrument zur Erfassung und internationalen Verankerung der Leistungsfähigkeit von Schülerinnen und
Schülern am Ende der Sekundarstufe I. Mit der Perspektive von Bildung als lebenslangem Prozess, welcher als Voraussetzung
für eine aktive Partizipation als Bürger in einer demokratischen Gesellschaft gilt, ist jedoch auch die Notwendigkeit für
längsschnittliche Bildungsforschung entstanden. Um Einsicht in den Bildungsprozess und die Kompetenzentwicklung zu erhalten,
wurde in Deutschland die National Educational Panel Study (NEPS) entwickelt (Blossfeld et al., 2011).
Obwohl beide Studien u.a. die mathematische Kompetenz erfassen, lassen sich die Studienergebnisse nicht direkt in Beziehung
setzen, da sie auf unterschiedlichen Rahmenkonzeptionen und Berichtsskalen beruhen. Eine Verlinkung der Kompetenzskalen
von NEPS und des PISA bietet jedoch die Möglichkeit, die Befunde aus dem NEPS-K9-Mathematiktest in dem internationalen
Referenzrahmen von PISA zu interpretieren sowie die Testwerte des NEPS-Tests in den kriterialen Bezugsrahmen aus PISA
einzuordnen. Auf diese Weise böte eine Verlinkung zusätzliche Möglichkeiten bildungspolitisch relevanter Interpretation der
NEPS-Testwerte. So könnten durch das Multikohortendesign der NEPS-Studie die Verteilungen der Schülerinnen und Schüler
aufeinanderfolgender Kohorten auf den Kompetenzstufen miteinander verglichen und Trendaussagen hierzu getroffen werden.
Außerdem könnten je nach Stärke des Linking beispielsweise Schülerinnen und Schüler, welche die Mindeststandards nicht
erreichen bzw. die Regelstandards übertreffen, in der NEPS-Studie längsschnittlich untersucht werden und etwa geklärt werden,
welche Bedingungsfaktoren dafür verantwortlich sind. Ein solches Linking setzt nach Kolen und Brennan (2004) voraus, dass
sich die Studien hinsichtlich der (1) Schlussfolgerungen, (2) Population, (3) Messeigenschaften und -bedingungen sowie der (4)
operationalisierten Konstrukte hinreichend ähnlich sind. Diese konzeptionelle Ähnlichkeit wurde bereits als erste Voraussetzung
für eine mögliche Verortung der NEPS-Testwerte auf der mathematischen Kompetenzskala aus PISA bestätigt (van den Ham,
Nissen, Ehmke, Sälzer & Roppelt, 2014).
In diesem Vortrag soll nun die Verlinkung der Skalen des NEPS-K9-Mathematiktests und PISA Mathematiktests aus 2012
vorgestellt und die Robustheit des Linking über Subgruppen sowie die Klassifikationskorrektheit auf die Kompetenzstufen aus
PISA untersucht werden.
Dafür wurde eine Linkingstudie durchgeführt, in welcher N = 1270 Schülerinnen und Schülern der neunten Klassenstufe aus 80
Schulen in einem Single-Group-Design sowohl Mathematikaufgaben aus PISA 2012 als auch aus dem NEPS bearbeiteten.
In einem ersten Schritt wurde die statistische Vergleichbarkeit der Verteilungen der Testwerte aus dem PISA-Test und dem
NEPS-Test der Linkingstudie analysiert. Anschließend wurde das Linking mit Hilfe eines Equipercentile Equating durchgeführt
und die entstehenden Verteilungen der NEPS-Testwerte auf der PISA-Skala für die Gesamtgruppe und für die Subgruppen mit
der ursprünglichen Verteilung der Testwerte auf der PISA-Skala verglichen. Abschließend wurde die Klassifikationskorrektheit
des Linking bezüglich der Einordnung in die Kompetenzstufen analysiert. Die Ergebnisse zeigen, dass die Studien zwar mit einer
latenten Korrelation von r = .90 deutlich miteinander zusammenhängen, sie jedoch nicht untereinander austauschbar sind (keine
score interchangeability). Dennoch wird durch das Skalenlinking eine zum PISA-Test vergleichbare Verteilung der äquivalenten
Ergebniswerte erzeugt. Die mittlere Klassifikationskorrektheit des Linking auf die Kompetenzstufen beträgt PÜ = 42% und weist
auf Ungenauigkeiten in der individuellen Zuordnung hin. In Bezug auf diese Ergebnisse soll abschließend diskutiert werden,
inwiefern das Skalenlinking trotz der gefundenen Ungenauigkeiten Interpretationen der NEPS-Testwerte erweitern kann.
Die Effektivität von Schulstunden am Beispiel von PISA 2012
Stefan Wolter1, Maria A. Cattaneo2, Chantal Oggenfuss2
1
Universität Bern und SKBF, 2SKBF
Anhand der internationalen PISA Daten (2006) hat Lavy (2014) mittels ökonometrischer Modelle die kausale Wirkung von
Schulstunden auf Schulleistungen untersucht und zudem Faktoren, welche Unterschiede in der Effektivität der Schulstunden
zwischen Ländern zu erklären vermögen. Wir replizieren die Analysen von Lavy mit Schweizer Daten aus der PISA 2012
Erhebung, welche es uns erlaubt, die Heterogenität in den Schulstunden innerhalb der Schweiz für die kausale Identifikation des
Effektes von Schulstunden auf PISA-Leistungen zu gebrauchen. Dabei erweitern wir den Ansatz von Lavy, indem wir nicht nur
die von den Schülerinnen und Schülern angegebenen Schulstunden für die Analysen verwenden, sondern auch Daten zu den
offiziell vorgegebenen Schulstunden. Weiter erlaubt es uns der Schweizer Datensatz eine Anzahl potentiell wichtiger
Kontrollvariablen zu verwenden, welche darüber Auskunft geben, ob die Schülerinnen und Schüler Zusatzunterricht genossen
haben und falls ja aus welchen Gründen. Zusätzlich enthält der 2012er Datensatz auch detaillierte Angaben zu
ausserschulischem Nachhilfeunterricht aus einer Schweizer Zusatzerhebung zum PISA Test von 2012.
Nach der Replikation der Untersuchung von Lavy und einem Vergleich der Ergebnisse untersuchen wir die Effektivität der
Schulstunden getrennt nach Anforderungsniveau im mehrgliedrigen Schulsystem der Schweiz und potentielle Erklärungen für
die gefundenen, signifikanten Unterschiede der Effektivität der Schulstunden in den einzelnen Anforderungsniveaus und
diskutieren die sich daraus ergebenden Herausforderungen für das Schulsystem und die Lehrerbildung.
Zum Schluss präsentieren wir eine Ausweitung der Methode von Lavy auf den Einfluss der Schulstunden auf die Heterogenität
der Schulleistungen in einer Schule.
Does Shanghai really have the world’s ‘best schools’?
John Jerrim
University College London
The Programme for International Student Assessment (PISA) is an important cross-national study of secondary school pupils
academic achievement. Results from PISA, released every three years, are now eagerly awaited by academics, journalists and
public policymakers alike. It has been widely reported that the ‘top-performing’ education system in PISA 2009 and 2012 was the
Chinese province of Shanghai. This has led to widespread interest in how Shanghai achieves such high PISA test scores, and
what other jurisdictions can do to replicate their success.
A common explanation is that this economy simply has the ‘best’ schools and the most effective schooling system. This has led
governments, such as England’s, to visit Shanghai to try and important their teaching methods into the West. It is also a view that
has been supported by the OECD, with Andreas Schleicher reflecting upon ‘what Asian schools can teach the rest of the world’.
Yet such explanations represent a fundamental misunderstanding of the limitations of PISA, and what the data can and cannot
show. Specifically, as a cross-sectional study, PISA tells us little about how children progress during their time at school, and thus
the ‘value-added’ within any given schooling system. Consequently, PISA actually tells us very little as to which economies have
the best (and the worst) schools.
In this paper, I will present empirical evidence to illustrate this argument, using PISA 2009 and 2012 data from Shanghai. Using
a fuzzy Regression Discontinuity Design (RDD) approach, I illustrate how children within Shanghai make essentially no academic
progress during one specific school year. In other words, I demonstrate how ‘the world’s best education system’ actually adds
almost no value to children’s mathematics, reading and science test scores. I reflect upon this finding in the conclusions, noting
how the PISA study needs to further develop in order to increase its usefulness in informing educational policy.
ID: 147
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktik Mathematik
Thematisches Cluster: Mathematisch-naturwissenschaftlicher Unterricht, Trainings- und Evaluationsforschung,
Unterrichtsentwicklung/ Unterrichtsqualität
Stichworte: Interventionsstudien; Interdisziplinär; Mathematik; Unterricht
Psychologische, erziehungswissenschaftliche und fachdidaktische Interventionsansätze im Unterricht
mit Modellierungsaufgaben
Chair(s): Stanislaw Schukajlow (Universität Münster), Cornelia S. Große (Universität Bremen)
Diskutant(en): Alexander Renkl (Universität Freiburg)
Die Wissenschaftsdisziplinen Psychologie, Erziehungswissenschaft und Mathematikdidaktik beschäftigen sich u.a. mit
Forschung zu wirksamen Interventionen im Unterricht. Allerdings ist nicht abschließend bekannt, inwieweit Erkenntnisse aus
anderen Disziplinen rezipiert werden und in welchem Ausmaß die „eigene“ Wissenschaftsdisziplin an entscheidenden Stellen im
Forschungsprozess die Oberhand gewinnt. Im Symposium sollen vier Interventionsstudien präsentiert und die Gemeinsamkeiten
und Unterschiede darin diskutiert werden. Für das Symposium wurden Studien ausgewählt, die von der DFG im Rahmen
verschiedener Förderrichtlinien (DFG-Kolleg, Sachbeihilfe, Schwerpunktprogramm) finanziell unterstützt wurden. Die Studien
wurden von einer Psychologin, von einem Fachdidaktiker sowie von zwei interdisziplinären Teams beantragt. Alle diese Studien
beschäftigen sich mit der Förderung der Modellierungskompetenz im Unterricht, die im Wesentlichen in anspruchsvollen
Übersetzungsprozessen zwischen Realität und Mathematik besteht (Blum et al. 2007). Die Fokussierung auf eine zentrale
mathematische Kompetenz soll Vergleiche der Arbeitsweisen verschiedener Arbeitsgruppen erleichtern und so zu einem
wissenschaftlichen Diskurs beitragen.
Ein weiterer, spezifischer Erkenntnisgewinn des Symposiums ist durch den Austausch zu effizienten Interventionsansätzen
(Auswahloptionen, multiple Lösungen, Formatives Assessement bzw. selbsterstellte Repräsentationen) im Unterricht mit
Modellierungsaufgaben zu erwarten. Defizite von Lernenden bei der Bearbeitung von anspruchsvollen realitätsbezogenen
Problemen wurden vielfach nachgewiesen (Klieme 2010). Eine Konsolidierung der Erkenntnisse zur Förderung der
Modellierungskompetenz kann wichtige Anhaltspunkte für weitere Untersuchungen anbieten.
Der erste Beitrag greift die Möglichkeit auf, Lernenden Auswahloptionen bei der Bearbeitung von Modellierungsaufgaben
anzubieten, um Übersetzungsprozesse zwischen Mathematik und Realität zu erleichtern. Lernenden der Jahrgangsstufe 8
wurden für Übersetzung und Interpretation mehrere Varianten dargeboten, und sie sollten entscheiden, welche jeweils korrekt
waren. Auswirkungen auf subjektiven und objektiven Lernerfolg werden dargestellt und diskutiert.
Im zweiten Beitrag werden die Wirkungen der Behandlung multipler mathematischer Lösungswege auf Modellierungsleistungen
von Lernenden in der Jahrgangsstufe 9 untersucht. Hierfür wurde ein Mediationsmodell angenommen, das bereits für eine andere
Art multipler Lösungen positiv evaluiert wurde.
Der dritte Beitragbezieht sich auf die Untersuchung des Formativen Assessments im Mathematikunterricht der Sekundarstufe I.
In der durchgeführten Interventionsstudie wurden Effekte des prozessorientierten Feedbacks und Wechselwirkungen mit der
wahrgenommenen Unterrichtsqualität auf Schülerleistungen beim Modellieren analysiert.
Im vierten Beitrag wurden Lernenden der Primarstufe trainiert, verschiedene Repräsentationen zu problemhaltigen Textaufgaben
zu erstellen. Im Mittelpunkt des Forschungsinteresses standen der Einfluss eines solchen Trainings sowie die Wirkung
verschiedener Repräsentationsarten auf die Leistungen von Schülerinnen und Schüler.
Abschließend werden die Beiträge von Alexander Renkl diskutiert.
Beiträge des Symposiums
Können Auswahloptionen die Bearbeitung von Modellierungsaufgaben unterstützen?
Cornelia S. Große
Universität Bremen
Die Fähigkeit, Mathematik in Alltagssituationen zu nutzen, wird zunehmend betont, und der Erwerb von
Modellierungskompetenzen ist ein explizites Ziel des Mathematikunterrichts. Konstruktivistische Theorien betonen die Wichtigkeit
von realen Kontexten zur Unterstützung von Verstehen und Transfer und die Bedeutung von situiertem Lernen in konkreten
Kontexten (z.B. Reinmann & Mandl, 2006). Kontextgebundene Modellierungsaufgaben stellen allerdings hohe Anforderungen an
die Lernenden, da Realsituationen in mathematische Notationen übersetzt werden müssen, und nach der Durchführung von
mathematischen Berechnungen die Ergebnisse im Hinblick auf die Realsituation zu inter-pretieren sind. Häufig verlieren
Lernende dabei die Realität aus den Augen (z.B. Verschaffel, De Corte & Lasure, 1994) und haben große Schwierigkeiten,
Übergänge zwischen Realität und Mathematik zu vollziehen (Blum, 2007). Es wurden einige Versuche unternommen, den Erwerb
von Modellierungskompetenzen zu fördern; beispielsweise konnten Schukajlow und Blum (2011) positive Effekte eines auf
selbständige Schü¬lerarbeit ausgerichteten, kognitiv aktivierenden Unterrichts auf Modellierungskompetenzen nachweisen.
Aus einer pädagogisch-psychologischen Perspektive ist es aussichtsreich, Lernenden ausgearbeitete Lösungsschritte zur
Verfügung zu stellen, um Verstehen und Transfer zu fördern. Um die Lernenden einerseits von der Anforderung zu entlasten,
Übersetzungsschritte selbst zu leisten, und sie aber dennoch zu „zwingen“, sich aktiv mit Übergängen zu beschäftigen, sollten
die Lernenden im hier dargestellten Experiment aus vorgegebenen Auswahloptionen die jeweils korrekten auswählen. Es
nahmen 147 Achtklässler (Alter: M = 13.98, SD = .55; 79 Mädchen) in vier Versuchsgrup¬pen teil: In der Gruppe „mit
Übersetzungs- und Interpretationsoptionen“ sollten die Lernenden zunächst aus Auswahloptionen eine richtige Übersetzung von
der verbalen Beschreibung zur mathematischen Notation auswählen, dann waren innermathematische Berech¬nungen
selbständig durchzuführen, und zum Schluss sollte aus Auswahloptionen eine passende Interpretation ausgewählt werden. In
der Gruppe „nur mit Übersetzungsoptionen“ bekamen die Teilnehmenden Auswahloptionen nur für den Übersetzungsteil und
mussten die restlichen Schritte selbst bearbeiten. In der Gruppe „nur mit Interpretationsoptionen“ begannen die Lernenden mit
einer selbständigen Bearbeitung und erhielten Auswahloptionen für den Interpretationsschritt. In der Gruppe „ohne Optionen“
waren alle Schritte selbständig auszuführen. In einem Nachtest wurden von allen Lernenden zwei Modellierungsaufgaben ohne
Hilfestellung bearbeitet.
In Bezug auf den Erwerb von Übersetzungskompetenzen zeigte sich eine Effektivität der Übersetzungsoptionen in Aufgabe 1
(F(1, 142) = 8.99, p = .003, partial η² = .060), jedoch nicht in Aufgabe 2 (F(1, 142) = .74, p = .392). Für den Erwerb von
Interpretationskompetenzen erwiesen sich Interpretationsoptionen als nicht effektiv (in Aufgabe 1: F(1, 142) = .26, p = .611; in
Aufgabe 2: F(1, 142) = .12, p = .725). Ergänzend zu einer Analyse des objektiven Lernerfolgs wurde auch die subjektive Sicht
der Lernenden untersucht. Die alleinige Präsentation von Interpretationsoptionen wurde am positivsten bewertet, die alleinige
Präsentation von Übersetzungsoptionen am negativsten. Dabei erreichte der Haupteffekt „Übersetzungsoption“ die
Signifikanzgrenze (F(1, 141) = 5.37, p = .022, partial η² = .037); weder der Haupteffekt „Interpretationsoptionen“ noch der
Interaktionseffekt waren signifikant (F(1, 141) = 1.01, p = .316, und F(1, 141) = .30, p = .585).
In der Gesamtschau zeigt sich, dass Übersetzungsoptionen hilfreich sein können, aber von den Lernenden nicht gut akzeptiert
werden; demgegenüber werden Interpretationsoptionen zwar akzeptiert, sind aber nicht lernförderlich. Dass die Effektivität der
Übersetzungs- und Interpretationsoptionen geringer war als erwartet, und dass sich die subjektive Sicht mit der objektiven Sicht
kaum deckt, kann daran liegen, dass trotz Auswahloptionen ein hohes Maß an eigener kognitiver Aktivität erforderlich war, und
dass die Anforderungen insgesamt sehr hoch waren. Dieses Experiment zeigt, dass beim Erwerb von Modellierungskompetenzen
die Förderung von objektivem Lernerfolg und subjektiven Variablen nicht notwendigerweise deckungsgleich sind. Dies ist ein
Aspekt, der im Hinblick auf den Mathematikunterricht von großer Relevanz ist. Die Ergebnisse verdeutlichen, wie wichtig es ist,
die Diskussion um die Förderung von Modellierungskompetenzen auf eine breitere Basis zu stellen.
Der Einfluss multipler mathematischer Lösungswege beim Modellieren auf Schülerleistungen
Kay Achmetli, Stanislaw Schukajlow
Universität Münster
Theoretischer Hintergrund und Fragestellung
Die Entwicklung und der Vergleich multipler Lösungen gelten als wichtige Elemente für einen kognitiv aktivierenden Unterricht
und sind fest in den Bildungsstandards verankert (National Council of Teachers of Mathematics, 2000). Es konnten mehrheitlich
positive Effekte multipler Lösungen empirisch gezeigt werden (Große & Renkl, 2006; Rittle-Johnson & Star, 2007).
Ein wichtiges Ziel des Mathematikunterrichts ist die Entwicklung multipler Lösungen zu Aufgaben mit Realitätsbezug.
Lösungsprozessanalysen (Blum & Leiss, 2007) zeigen, dass es verschiedene Möglichkeiten gibt, multiple Lösungen zu
realitätsbezogenen Aufgaben zu entwickeln. Zum einen können multiple mathematische Lösungswege erstellt werden, indem
verschiedene mathematische Verfahren verwendet werden (bspw. Tabelle und Graph). Zum anderen können verschiedene
Annahmen zu fehlenden Angaben getroffen und die Aufgabe mit einem mathemati-schen Verfahren gelöst werden (Schukajlow
& Krug, 2014). Der Einfluss der Behandlung multipler Lösungen, die durch das Treffen unterschiedlicher Annahmen bei
Modellierungsaufgaben entstehen, auf Leistungen wurde bereits untersucht (Schukajlow, Krug, & Rakoczy, 2015). Hierbei
konnten indirekte Effekte von multiplen Lösungen auf Leistungen über die Anzahl der entwickelten Lösungen sowie das
Kompetenzerleben (Deci & Ryan, 2000) gezeigt werden. Da die Art der multiplen Lösungen eine Rolle für Leistungen spielt
(Große & Renkl, 2006), sollen die Effekte der Behandlung der multiplen mathematischen Lösungswege auf Leistungen mittels
des Mediationsmodells von Schukajlow et al. (2015) untersucht werden.
Dabei soll der folgenden Forschungsfrage nachgegangen werden:
• Gibt es indirekte Effekte der Unterrichtsbedingung auf die Leistungen im Nachtest über die Anzahl der Lösungen und das
Kompetenzerleben?
Methode
An der Studie nahmen 307 Lernende (48,26% weiblich, im Mittel 14,6 Jahre alt) aus vier Gesamtschulen teil. Die Klassen wurden
leistungs- und geschlechtsverhältnishomogen in zwei Gruppen aufgeteilt und den Unterrichtsbedingungen „multiple
mathematische Lösungswege (mmL)“ und „ein mathematischer Lösungsweg (emL) zugewiesen. Die Lernenden wurden vier
Stunden lang von geschulten Lehrkräften in separaten Räumen unterrichtet. Um den Einfluss der Lehrerpersönlichkeit in den
Bedingungen konstant zu halten, hat jede Lehrkraft die mmL und emL-Bedingungen unterrichtet. In beiden Bedingungen wurden
parallele Versionen der gleichen Aufgaben bearbeitet. In der mmL-Bedingung sollten die Lernenden zum Lösen der Aufgaben
zwei mathematische Lösungswege und in der emL-Bedingung einen mathematischen Lösungsweg verwenden. Die Analyse des
Materials zeigt eine adäquate Umsetzung des Treatment (Achmetli, Schukajlow, & Krug, 2014).
Die Leistungen im Vor- und Nachtest wurden mithilfe einer (dichotom skalierten) prozeduralen und einer (partial credit skalierten)
konzeptuellen Wissensdimension erfasst. Das Kompetenzerleben (3 Items, Cronbachs Alpha= .74) wurde mithilfe einer 5stufigen Likert-Skala (1=stimmt gar nicht, 5=stimmt genau) erhoben und die Anzahl der entwickelten Lösungen von zwei
unabhängigen Ratern mit sehr guter Übereinstimmung (Cohens Kappa >.96) kodiert.
Ergebnisse und Diskussion
Das aufgestellte Mediationsmodell weist für beide Wissensdimensionen gute fit-Indizes (prozedural: CFI=0.992, SRMR=0.04
konzeptuell: CFI=0.985, SRMR=0.05) und es können 25% der Varianz des prozeduralen Wissens sowie 17% der Varianz des
konzeptuellen Wissens im Nachtest erklärt werden. Die indirekten Effekte der Unterrichtsbedingung auf das Kompetenzerleben
lassen sich für beide Dimensionen bestätigen (β=0.26, p<.01 bzw. β=0.25, p<.01). Allerdings gibt nur in einer Dimension indirekte
Effekte der Unterrichtsbedingung auf die Nachtestleistung (β=0.03, p=.25 bzw. β=0.10, p<.05).
Die Ergebnisse von Schukajlow et al. (2015) lassen sich teilweise bestätigen. Wie in anderen Studien (Rittle-Johnson & Star,
2007) lassen sich positive Effekte multipler Lösungen auf Unterrichtswahrnehmungen und Leistungen nachweisen. Allerdings ist
die Art der entwickelten Lösungen von Bedeutung für die Effekte auf Leistungen (Große & Renkl, 2006). Ebenfalls erscheinen
die gewählten Leistungsdimensionen (konzeptuell, prozedural, Flexibilität usw.) für die Untersuchung von multiplen Lösungen
bedeutsam (Star & Rittle-Johnson, 2008).
Formatives Assessment im Unterricht zum mathematischen Modellieren - Effekte einer Intervention und
Wechselwirkungen mit der wahrgenommenen Unterrichtsqualität auf die Schülerleistung
Petra Pinger1, Katrin Rakoczy1, Michael Besser2, Eckhard Klieme1
1
DIPF, Frankfurt, 2PH Freiburg
Theoretischer Hintergrund: Formatives Assessment wird insbesondere in der anglo-amerikanischen Literatur als
vielversprechende Unterrichtspraktik beschrieben (z.B. Black & Wiliam, 2009). Neben der Diagnose des Lernstandes, stellt die
lernförderliche Rückmeldung der Assessmentinformationen ein zentrales Element dar (z.B. Black & Wiliam, 2009). Die
prozessorientierte Rückmeldung hat sich unter Laborbedingung als besonders unterstützend erwiesen (z. B. Rakoczy, Harks,
Klieme, Blum, & Hochweber, 2013). Bei dieser schriftlichen Rückmeldung erfährt der Lernende, welche für die Aufgabenlösung
erforderlichen Prozesse bereits beherrscht werden (Stärken), in Bezug auf welche Prozesse noch Defizite bestehen
(Schwächen), sowie Hilfestellungen zur Überwindung der Diskrepanz zwischen Lernstand und Lernziel (Strategien).
Für die Leistungsentwicklung von Schülerinnen und Schülern hat sich in der bisherigen Forschung jedoch weniger die eingesetzte
Unterrichtspraktik, sondern insbesondere auch die allgemeine Unterrichtsqualität als bedeutsam erwiesen (Kognitive Aktivierung,
Unterstützendes Klima und Klassenführung; Klieme, Pauli & Reusser, 2009). In Bezug auf Leistung und Motivation profitieren
Lernende von einem Unterricht, der geregelt abläuft, in dem herausfordernde Probleme gestellt werden und in dem sie konstruktiv
unterstützt werden (z. B. Lipowsky, 2009). Die Bisherige Forschung weist außerdem auf eine positive Wechselwirkung zwischen
der von Lernenden wahrgenommenen allgemeinen Unterrichtsqualität und formativem Assessment hin (Decristan et al., 2015).
Ziel der hier dargestellten Studie war es zum einen, prozessorientiertes Feedback in Form einer Intervention zum formativen
Assessment in den Mathematikunterricht zum Modellieren zu implementieren. Zum anderen wurden Effekte der Intervention, der
wahrgenommenen Unterrichtsqualität und der Wechselwirkung von Unterrichtsqualität und Intervention auf die
Leistungsentwicklung untersucht.
Methode: Für die Analysen wurden Daten aus der Interventionsstudie des Projekts „Conditions and Consequences of Classroom
Assessment (Co²CA)“ genutzt. Insgesamt haben 39 Mathematiklehrkräfte mit ihren 9. Klassen (N = 966 Schüler) an der Studie
teilgenommen. Diese wurden zufällig auf zwei Interventionsgruppen (N = 24) und eine Kontrollgruppe (N = 15) verteilt. Alle
Lehrkräfte wurden geschult, eine aus 13 Unterrichtsstunden bestehende Unterrichtseinheit durchzuführen. Ziel der
Unterrichtseinheit war es, die Schülerinnen und Schüler in vier aufeinander aufbauenden Phasen an die Bearbeitung von
Modellierungsaufgaben im Themenbereich „Satz des Pythagoras“ heranzuführen: (1) Beweis und innermathematische Probleme,
(2) „eingekleidete“ Textaufgaben, (3) Modellierungsaufgaben, (4) Konsolidierung. Die Lehrkräfte in den Interventionsgruppen
wurden darüber hinaus trainiert, zu drei Zeitpunkten (jeweils nach Phase 1-3) die Leistung der Lernenden anhand von
Diagnoseaufgaben zu erfassen und schriftliche lösungsprozessbezogene Rückmeldungen zu geben. Die Schülerleistung wurde
anhand von einem Prätest (19 Items; EAP/PV Reliabilität = .66) und einem Posttest (17 Items; EAP/PV Reliabilität = .74) erfasst.
Die Lernenden wurden darüber hinaus nach ihrer Einschätzung zu den Unterrichtsqualitätsmerkmalen „prozessorientierter
Unterricht“ (kognitive Aktivierung; 5 Items; Cronbachs α = .78), „Rückmeldepraxis“ (unterstützendes Klima; 5 Items; Cronbachs
α = .82) und „Zeitnutzung“ (Klassenführung; 4 Items; Cronbachs α = .74) befragt. Für die durchgeführten Mehrebenenanalysen
in MPlus7 wurden die Unterrichtsqualitätsskalen auf Klassenebene aggregiert.
Ergebnisse/Diskussion: Entgegen unserer Erwartungen, wurde kein Effekt der Intervention auf die Schülerleistung gefunden. Die
drei Unterrichtsmerkmale zeigten in der Kontrollgruppe die erwartete positive Wirkung. Die gefundene negative Interaktion
zwischen der Intervention und allen drei Unterrichtsmerkmalen (prozessorientierter Unterricht: β = -.3, p < .05; Rückmeldepraxis:
β = -.21, p < .05; Zeitnutzung: β = -.3, p < .05) weist darauf hin, dass die halbstandardisierte prozessorientierte Rückmeldung
unserer Intervention Effekte der Unterrichtsmerkmale kompensiert. Das bedeutet, die Intervention führt bei Lehrkräften, deren
Unterricht ursprünglich weniger prozessorientiert ist, eine ungünstigere Rückmeldepraxis aufweist oder die Unterrichtszeit
weniger effizient nutzt zu positiverer Leistungsentwicklung. Dagegen scheinen die Lernenden von Unterricht, der von ihnen
anhand der genannten Merkmale als qualitativ hochwertig wahrgenommen wird, leistungsmäßig weniger zu profitieren, wenn
zusätzlich die Intervention zu formativem Assessment durchgeführt wird. Diese Wechselwirkung kann als Hinweis interpretiert
werden, dass die klaren Vorgaben der Intervention für Lehrkräfte, deren Unterricht eine hohe Qualität aufweist, Einschränkungen
erzeugen und sich somit negativ auswirken.
Problemhaltige Textaufgaben + selbstgenerierte Repräsentationen = Lösungserfolg?
Nina Sturm, Renate Rasch, Wolfgang Schnotz
Universität Koblenz-Landau
THEORETISCHER HINTERGRUND UND FRAGESTELLUNG
Die anspruchsvolle mathematische Struktur und Komplexität von Problemaufgaben stellt für viele Grundschulkinder eine Barriere
dar, die sie nicht ohne weiteres überwinden können (Bruder & Collet, 2011; Hussy, 1993; Rasch, 2001). Solche
herausfordernden, aber lösbaren Aufgaben bewirken eine größere Anstrengungsbereitschaft, wodurch die Zone der nächsten
Entwicklung erreicht werden kann (Wygotski, 1964). Das Gelernte muss an die Aufgabensituation angepasst und dabei neu
durchdacht, umstrukturiert bzw. miteinander verknüpft werden (Rasch, 2001; Verschaffel, Greer, & De Corte, 2000). Die
Konstruktion externer Repräsentation kann helfen diese geforderten Prozesse zu vollziehen (Anderson, 1996; Duncker, 1974;
Schnotz, Baadte, Müller, & Rasch, 2011). Sie sind lösungsunterstützend, da sie das Arbeitsgedächtnis entlasten und die
Aufgabenbedingungen nicht im Kopf präsent gehalten werden müssen. Die freien Kapazitäten können für die Lösungsfindung
verwendet werden (Schnotz u. a., 2011; Sweller, 2005).
Trotz ihrer vielfältigen Vorteile greifen die wenigsten Novizen von sich aus beim Lösen von Textaufgaben auf externe
Repräsentationen zurück (Groß, 2013; Hohn, 2012; Rasch, 2001). Bevor Lernende Repräsentationen als Hilfsmittel und nicht als
Mehraufwand wahr- und annehmen, müssen sie Erfahrungen im Umgang mit ihnen sammeln, eigenständig deren Vorteile
kennenlernen und lernen wie man nach adäquaten Repräsentationen für vorliegende Probleme sucht (Rasch, 2001). Nur so
entwickelt sich ein Repertoire an externen Repräsentationen, auf welches sie bei der Bearbeitung des gerade zu lösenden
Problems zurückgreifen können (Cox, 1999; Kindfield, 1993).
Für die Unterrichtspraxis ist von Interesse, ob es bestimmte Repräsentationen gibt, die Lernenden eher helfen Probleme
erfolgreich zu bewältigen. Da die Studie einen Beitrag für den Mathematik-unterricht der Primarstufe anstrebt, ergibt sich folgende
Forschungsfrage: Welche Repräsentationen sind gute Prädiktoren, um den Erfolg beim Lösen problemhaltiger Textaufgaben
vorherzusagen?
METHODE
An der Untersuchung nahmen 366 Lernenden aus 20 dritten Jahrgangsstufen teil. Jede Klasse bearbeitete in einer
Mathematikstunde pro Woche über einen Zeitraum von 12 Wochen eine problemhaltige Textaufgabe. Die Hälfte aller Klassen
nahm an einem Repräsentationstraining teil, welches die Kinder anregte externe Repräsentationen zu generieren und für die
Lösungsfindung zu nutzen. Die restlichen 10 Klassen bearbeiteten die Aufgaben mit ihrer regulären Lehrkraft.
Insgesamt lagen der Auswertung 1071 schriftliche Bearbeitungen der Drittklässler aus dem Nachtest (3 Aufgaben) zugrunde. Die
Kodierung des Lösungserfolges einer Testaufgabe entsprach dem Aufgabenscore und erfolgte dichotom mit 0 (falsche oder keine
Lösung) und 1 (richtige Lösung). Der Lösungserfolg für den gesamten Test, der Testscore, bildet den Mittelwert aller drei
Aufgabenscores ab.
Die Kodierung der Schülerrepräsentationen basierte auf einer qualitativen und quantitativen Inhaltsanalyse (Sturm, Wahle,
Rasch, & Schnotz, 2015). Die Hauptachsenanalyse (29 Items) identifizierte vier Faktoren: Zeichnung, Rechnung, Tabelle und
Begründung (Sturm u. a., 2015). Dabei wurde schlechte (-1), mittlere (0) und hohe Qualität (1) unterschieden (s. ebd.).
Einflussfaktoren wie Sprache, Intelligenz, Textverständnis und Mathematikfähigkeiten der Lernenden wurden zusätzlich erhoben.
ERGEBNISSE UND DISKUSSION
Das aufgestellte Regressionsmodell konnte nahezu 50% der Varianz des Lösungserfolgs erklären. Dabei konnten 36% der
Varianz durch das erste Modell, die Voraussetzungen der Lernenden, und 10% der Varianz durch die Verwendung
selbstgenerierter Repräsentationen erklärt werden. Die Zeichnungen gehen als stärkster Prädiktor (ß=.239, p<.001) und die
Begründungen als schwächster Prädiktor (ß=.093, p =.030) in die Vorhersage des Lösungserfolgs ein. Aber auch die Tabellen
(ß=.196, p<.001) und Rechnungen (ß=.207, p<.001) haben einen signifikanten Einfluss auf die Vorhersage des Lösungserfolgs.
Aus unterrichtspraktischer Sicht ist es wenig überraschend, dass Zeichnungen als stärkster Prädiktor den Lösungserfolg
vorhersagen. Ihr Stellenwert im Mathematikunterricht, als heuristische Strategie des Problemlösens, wird stets betont (Franke &
Ruwisch, 2010; Winter, 1994). Rechnungen und Tabellen sind ebenso etablierte Hilfsmittel im Mathematikunterricht (Bruder &
Collet, 2011). Dass Begründungen als schwächster Prädiktor zu gelten scheinen, kann dadurch erklärt werden, dass Drittklässler
noch als Novizen des Begründens angesehen werden können und sich diese Kompetenzen erst entwickeln müssen (Reiss,
Hellmich, & Thomas, 2002).
ID: 172
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Lehrerbildung
Thematisches Cluster: Grundschulbildung, Lehrerexpertise, Schulentwicklung
Stichworte: Grundschulübergang, Übergangsempfehlung, stufenübergreifende Lehrerkooperation
Der Grundschulübergang: Herausforderung für individuelles und kooperatives Arbeiten von Lehrkräften
Chair(s): Kim Diebig (WWU Münster), Stefanie van Ophuysen (WWU Münster)
Diskutant(en): Kai Maaz (DIPF)
Der Übergang von der Grundschule zur weiterführenden Schule stellt eine entscheidende Gelenkstelle im Bildungssystem mit
weitreichenden Folgen für die individuelle Bildungslaufbahn eines jeden Schulkindes dar (Gresch, Baumert & Maaz, 2010). Doch
auch für die Arbeit von Lehrkräften an Grund- und weiterführenden Schulen bedeutet der Übergang eine zentrale
Herausforderung.
So müssen Grundschullehrkräfte bei der Formation der Übergangsempfehlung neben der Feststellung eines status quo auch
das zukünftige schulische Potential ihrer Schülerinnen und Schüler vorhersehen. Welche Kriterien sie dazu letztlich heranziehen
sollten, bleibt weitgehend offen.
Weiterhin ist die Gestaltung des Übergangs an sich bedeutsam. Hier sind auch die Lehrkräfte der weiterführenden Schule gefragt,
ihren „neuen“ Schülerinnen und Schülern einen möglichst reibungslosen Wechsel und einen guten Start zu ermöglichen. Im
Sinne des Übergangsqualitätsmodells (van Ophuysen & Harazd, 2014) ist für einen gelingenden Übergang nicht nur jede
Einzelschule mit ihren individuellen Lehrkräften entscheidend, sondern es stehen jeweils mehrere Schulen unterschiedlicher
Schulstufen gemeinsam in der Verantwortung. Obwohl entsprechend die Wichtigkeit von Lehrerkooperation im Übergang betont
wird, wird diese jedoch selten praktiziert (Schürer, Harazd & van Ophuysen, 2006; van Ophuysen, 2005).
Im Rahmen des Symposiums werden Beiträge vorgestellt und diskutiert, die sich mit dem individuellen und vernetzten Handeln
von Lehrkräften im Kontext des Grundschulübergangs beschäftigen.
Um sich den Kriterien der Übergangsempfehlung und deren Relevanz zu nähern, werden im Rahmen des Beitrags von Kim
Diebig und Stefanie van Ophuysen unterschiedliche methodische Wege kombiniert. Dabei wird die Kontextabhängigkeit des
Relevanzbegriffs berücksichtigt (Case, 2012), indem konkrete, reale Schülerinnen und Schüler, als auch vielfältige Kriterien, die
von den Lehrkräften selbst genannt werden, in den Mittelpunkt gestellt werden.
Die lehrerseitigen kognitiven Prozesse, die der Erstellung des Übergangsurteils zugrunde liegen, werden in einem Beitrag von
Ines Böhmer, Sabine Glock, Cornelia Gräsel, Sabine Krolak-Schwerdt und Thomas Hörstermann in den Blick genommen. Der
Frage, wie Lehrkräfte Informationen suchen und in welcher Reihenfolge sie diese abrufen, wird im Rahmen einer experimentellen
Studie anhand der ‚Mouselab-Methode‘ nachgegangen.
Isabella Wilmanns, Karolin Migas und Johanna Otto blicken auf die von Lehrkräften wahrgenommenen Möglichkeiten, die
stufenübergreifende Vernetzung und Hospitation für ein gelingendes Übergangsmanagement beinhalten. Basierend auf
leitfadengestützten, teilstruk-turierten Interviews mit Gymnasiallehrkräften können Ziele von Unterrichtshospitationen benannt
und Gelingensbedingungen für wechselseitige Hospitationen abgeleitet werden.
Welche Kooperationsformen im Kontext des Grundschulübergangs überhaupt genutzt werden, untersucht Katharina Sartory in
einem abschließenden Beitrag. Hierbei wird auf das Modell zur Erfassung unterrichtsbezogener Lehrerkooperation von Gräsel,
Fußangel und Pröbstel (2006) Bezug genommen und es wird überprüft, ob sich dieses auf die Lehrerkooperation am
Grundschulübergang übertragen lässt.
Beiträge des Symposiums
Forschung zur Relevanz der Kriterien für die Übergangsempfehlung – Verzahnung unterschiedlicher
methodischer Zugänge
Kim Diebig, Stefanie van Ophuysen
WWU Münster
Laut § 11 Abs. 5 des Schulgesetztes des Landes Nordrhein-Westfalen erstellt „die Grund-schule (…) mit dem Halbjahreszeugnis
der Klasse 4 auf der Grundlage des Leistungsstands, der Lernentwicklung und der Fähigkeiten der Schülerin oder des Schülers
eine zu begründende Empfehlung für die Schulform, die für die weitere schulische Förderung geeignet erscheint (…)“ (SchulG
vom 15. Februar 2005, GV. NRW. S. 102, zuletzt geändert durch Ge-setz vom 25. Juni 2015, GV. NRW. S. 499). Die
beschriebenen, grob festgelegten Bereiche lassen offen, welche Inhalte für die Erstellung der Übergangsempfehlung
berücksichtigt werden sollten. Da klar definierte Vorgaben fehlen, können keine Aussagen darüber getroffen werden, welche
Kriterien Lehrkräfte für die Empfehlung tatsächlich als relevant erachten.
Ein Merkmal kann für eine Entscheidung als relevant bezeichnet werden, wenn Unterschiede in seiner Ausprägung Unterschiede
in der Entscheidung bedingen. Relevanz ist insofern kontextabhängig (Case, 2012), als sie durch die Konstellation weiterer
Merkmalsausprägungen der zu beurteilenden Person mit beeinflusst wird. Weiterhin ist Relevanz von den subjektiven Theorien
der entscheidenden Person abhängig.
Bei der Erfassung der Relevanz von Kriterien für die Übergangsempfehlung sollten daher zwei Aspekte berücksichtigt werden:
Erstens sollten reale, individuelle Schülerinnen und Schüler im Mittelpunkt stehen und zweitens sollten vielfältige Kriterien in die
Analyse aufgenommen werden, die von den Lehrkräften selbst genannt werden.
Bisherige Studien nähern sich der Frage nach der Relevanz der Kriterien für die Übergangsempfehlung auf sehr
unterschiedlichen Wegen, wobei die beschriebene Kontextabhängigkeit bisher i.d.R. wenig Beachtung findet. In vorrangig
quantitativen Studien (zusammenfassend in Glock, Krolak-Schwerdt, Klapproth & Böhmer, 2013) wird die Relevanz
vorgegebener Kriterien indirekt über regressionsanalytische Berechnungen abgeleitet. Direkt nach der Relevanz vorgegebener
Kriterien werden Lehrkräfte in nur wenigen Studien (u.a. Dietz, 2014; Pohlmann, 2009) gefragt. Zudem ist nur eine Studie (Nölle,
Hörstermann, Krolak-Schwerdt & Gräsel, 2009) bekannt, in der Lehrkräfte für sie relevante Kriterien zu vorgegebenen Bereichen
nennen und die Relevanz über Häufigkeitsanalysen abgeleitet wird. Eine methodische Verzahnung der unterschiedlichen Wege
(direkte vs. indirekte Einschät-zung/vorgegebene vs. selbstgenannte Kriterien) findet bisher nicht statt.
Um „ein schrittweises Erweitern der Erkenntnis durch gegenseitiges Vergleichen“ (Mayring, 2001, Abs. 25) zu ermöglichen,
werden im vorliegenden Beitrag zwei unterschiedliche methodische Wege gewählt. Dabei wird die beschriebene
Kontextabhängigkeit des Relevanzbegriffs stärker als in bisherigen Studien in den Fokus gerückt.
In einem ersten Schritt wurden episodische Interviews mit 18 Grundschullehrkräften geführt, die in einer Kombination aus
Narration und Befragung jeweils zwei reale Schülerinnen und Schüler ihrer letzten vierten Klasse beschrieben, bei denen sie in
Hinblick auf die Übergangsempfehlung zwischen zwei Schulformen – nach Möglichkeit zwischen Gymnasium und Realschule –
geschwankt hatten. Um die Relevanz der anhand der qualitativen Inhalts-analyse abgeleiteten inhaltlichen Kategorien indirekt
erfassen zu können, wurden sowohl deren Nennungshäufigkeiten als auch die Reihenfolge ihres Auftretens betrachtet. In einem
zweiten Schritt wurden dieselben Lehrkräfte im Rahmen telefonischer, teil-standardisierter Nachbefragungen mit den
herausgearbeiteten Kriterien konfrontiert und um eine direkte Relevanzeinschätzung mittels fünfstufiger Ratingskala gebeten.
Um Zusammenhänge zwischen der indirekten Relevanzerfassung (Nennungshäufigkeiten bzw. Reihenfolge) und der direkten
Relevanzerfassung (Rating) zu untersuchen, werden Korrelationsanalysen berichtet. Kriterien, die besonders häufig und früh
genannt werden, werden auch in der direkten Einschätzung als besonders relevant bewertet. Bei erwartungswidrigen
Korrelationen wird explorativ nach Erklärungen gesucht, indem das qualitative Datenmaterial zu einzelnen Schülerfällen
systematisch betrachtet wird.
Abschließend wird diskutiert, inwieweit die Befunde methodische Implikationen für die weitere Forschung zur
Relevanzeinschätzung haben.
Das Übergangsurteil am Ende der Grundschulzeit – Welcher Urteilsstrategien folgen Lehrkräfte bei der
Informationssuche?
Ines Böhmer1, Sabine Glock1, Cornelia Gräsel1, Sabine Krolak-Schwerdt2, Thomas Hörstermann2
1
Bergische Universität Wuppertal, 2Universität Luxemburg
In Deutschland spielt bei der Wahl der weiterführenden Schulform am Ende der Grundschulzeit die Übergangsempfehlung bzw.
das Übergangsurteil der Grundschullehrkräfte eine bedeutende Rolle. Bei der tatsächlichen Schulformwahl folgen Eltern häufig
dem erteilten Übergangsurteil der Lehrkräfte (siehe u.a. Stubbe & Bos, 2008) und melden ihr Kind an der von den Lehrkräften
empfohlenen Schulform an. Korrigierende Schulformwechsel finden trotz der theoretisch vorhandenen Durchlässigkeit des
deutschen Schulsystems eher selten statt (Ditton, 2013). Das erteilte Lehrerurteil legt somit in vielen Fällen die weitere
Schullaufbahn, den daran anknüpfenden beruflichen Werdegang und damit auch die allgemeine spätere gesellschaftliche
Teilhabe der Kinder mit fest. Es ist daher von zentraler Bedeutung die Lehrerurteile am Ende der Grundschulzeit genauer in den
Blick zu nehmen. Vermehrt wurde in der bisherigen Forschung der Zusammenhang des Lehrerurteils mit verschiedenen
Informationen der Schüler und deren Eltern fokussiert. Zusammenfassend zeigen die Befunde auf, dass die Leistung der Schüler
einen bedeutenden Einfluss auf das Lehrerurteil hat (z.B. Bos et al., 2004). Soziale Hintergrundinformationen der Schüler, wie
der familiäre sozioökonomische Status, fließen jedoch auch direkt sowie indirekt - vermittelt über die Noten - mit in das Lehrerurteil
ein (u.a. Maaz & Nagy, 2009).
Die Frage, wie Lehrkräfte ihre Übergangsurteile erstellen, d.h. welche kognitiven Prozesse dem Urteil zugrunde liegen,
betrachtete die Forschung bislang nur vereinzelt (u.a. Böhmer, Hörstermann, Gräsel, Krolak-Schwerdt & Glock, 2015). Die
vorliegende Studie untersucht daher die Informationssuche der Lehrkräfte als einen kognitiven Teilprozess bei der Erstellung
bzw. Bildung des Lehrerurteils. Dabei wird der Frage nachgegangen, welcher Strategie der Urteilsbildung Lehrkräfte bei der
Informationssuche folgen und welche Rolle dabei die Einheitlichkeit (Konsistenz) der Schülerinformationen spielt.
Als theoretische Rahmung dienen duale Prozessmodelle der sozialen Urteilsbildung (Ferreira, Garcia-Marques, Sherman &
Sherman, 2006; Fiske & Neuberg, 1990), die im Allgemeinen zwischen automatischen (spontanen) und kontrollierten
(reflektierten) Strategien der Urteilsbildung unterscheiden. Aufgrund der Bedeutsamkeit des Lehrerurteils und des Ziels der
Lehrkräfte, eine angemessene Leistungsprognose mit dem Übergangsurteil zu erteilen, wird angenommen, dass Lehrkräfte zur
Bildung ihres Urteils weniger auf automatische, sondern eher auf kontrollierte Urteilsstrategien (regelbasierte oder
informationsintegrierende Strategie) zurückgreifen. Angenommen wird, dass einheitliche Schülerinformationen zu einer
regelbasierten Strategie führen sollen, bei der das Urteil nur auf Informationen zur Leistung (hier Noten und Arbeitsverhalten),
welche aufgrund ihrer Relevanz vermehrt und zuerst gesucht werden, und zum Sozialverhalten beruht. Widersprüchliche
Informationen sollen in einer informationsintegrierenden Strategie resultieren, die über die Informationen zur Leistung und zum
Sozialverhalten hinausgehen. Alle Informationen, auch soziale Hintergrundinformationen, werden zur Urteilsbildung verwendet.
Zur Erfassung der Informationssuche wurden 72 erfahrenen Grundschullehrkräften aus NRW anhand der ‚Mouselab-Methode‘
(Johnson, Payne, Schkade & Bettman, 1989) verschiedene Schülerfälle in Form von aufdeckbaren Informationsfeldern an einem
Computer dargeboten. Die Lehrkräfte wurden gebeten, diejenigen Informationen der einzelnen Schüler per Mouse-Klick
aufzudecken und zu betrachten, die sie zur Erstellung ihres Übergangsurteils benötigen. Die Anzahl, Art, Reihenfolge sowie die
Relevanz der betrachteten Informationen wurden als Indikatoren für die verwendete Urteilsstrategie aufgezeichnet und u.a.
varianzanalytisch ausgewertet. Zur Auswertung der Reihenfolge, mit der die Informationen von den Lehrkräften betrachtet
wurden, wurde zusätzlich ein Unfolding-Modell (Carroll, 1980) berechnet. Die Ergebnisse legen u.a. nahe, dass Lehrkräfte bei
der Urteilsbildung bei allen Schülerfällen zuerst regelbasiert vorgehen, indem sie zunächst die Leistungsinformationen gefolgt
vom Sozialverhalten abriefen. Die Informationssuche wurde bei allen Schülerfällen allerdings erst nach einem eher
informationsintegrierenden Prozess, der auch soziale Hintergrundinformationen berücksichtigt, beendet. Der auch hier
gefundene Hinweis, dass soziale Hintergrundinformationen beim Übergangsurteil der Lehrkräfte eine Rolle spielen, wird vor dem
Hintergrund eines chancengleichen Bildungserfolges diskutiert. Mögliche praxisrelevante Implikationen werden aufgezeigt.
Unterrichtshospitationen im Kontext von Übergangsmanagement: Ziele, Aufgaben und
Gelingensbedingungen
Isabella Wilmanns, Karolin Migas, Johanna Otto
TU Dortmund
An der Schnittstelle zwischen Grundschule und weiterführender Schule stehen verschiedene Bildungsakteure gemeinsam in der
Verantwortung für einen gelingenden Übergang und eine erfolgreiche Bildungslaufbahn der individuellen Schülerinnen und
Schüler. Daher wird von schulpolitischer Seite gefordert, dass dieser gemeinsamen Verantwortung durch institutionelle
Vernetzung und ein stufenübergreifendes Übergangsmanagement begegnet wird (MSW NRW 2015). Das
Übergangsqualitätsmodell von van Ophuysen und Harazd (2014) benennt entsprechend die stufenübergreifende Vernetzung von
Schulen als wichtige Handlungsebene der Qualitätssicherung im Übergang.
Der Begriff des schulischen Managements sowie damit einhergehende Prozesse für den Übergang von der Grund- zur
weiterführenden Schule sind weitestgehend ungeklärt. Aus der allgemeinen Übergangsforschung lässt sich aber eine erste
Arbeitsdefinition für den Übergang von der Grund- zur weiterführenden Schule ableiten. Demnach ist die institutionalisierte
Zusammenarbeit von Lehrkräften aller Bildungsinstitutionen und in der Folge eine kontinuierliche Begleitung von Schülerinnen
und Schülern in ihrer Bildungslaufbahn Ziel von schulischem Übergangsmanagement (Wilmanns, Migas & Otto, in Vorbereitung).
Aus den Wirtschaftswissenschaften lässt sich Bleichers (2004) Konzept des Integrierten Managements mit seinen drei Ebenen
(normativ, strategisch, operativ) für den Übergang adaptieren. In diesem Kontext würde das Management-Modell auf normativer
Ebene bedeuten, dass die Einzelschule Ziele benennt und Begründungen für geplante Maßnahmen liefert. Auf strategischer
Ebene würden diese Ziele in stufenübergreifender Zusammenarbeit konkretisiert und Konzepte für gemeinsame Maßnahmen
entwickelt. Auf operativer Ebene wäre die Umsetzung dieser Maßnahmen anzusehen.
Empirische Studien zu Übergangsgestaltungsmaßnahmen sind in Deutschland noch rar (Porsch, 2015). Der vorliegende Beitrag
soll daher eine erste Annäherung vornehmen, schulisches Übergangsmanagement am Beispiel wechselseitiger
Unterrichtshospitationen von Lehrkräften unterschiedlicher Schulstufen genauer zu betrachten, da diese bei der Frage nach
konkreten Gestaltungselementen im Übergang immer wieder erwähnt werden (z. B. BMBF, 2010; van Ophuysen, 2005). Vor
diesem Hintergrund ergeben sich folgende Forschungsfragen:
1. Inwiefern kann die gemeinsame Konzeptentwicklung und -umsetzung wechselseitiger Unterrichtshospitationen von
Lehrkräften als Element schulischen Übergangsmanagements begriffen werden?
2. Welche Ziele und Aufgaben verbinden Lehrkräfte mit einer solchen Vernetzungsmaßnahme?
3. Welche Faktoren nehmen sie als Gelingensbedingungen wahr?
Zur Beantwortung der Forschungsfragen wurde ein exploratives Forschungsdesign gewählt. In einem ersten Schritt wurden
leitfadengestützte teilstrukturierte Interviews mit drei Lehrkräften von Gymnasien aus dem Projekt Ganz In geführt, die in
Kooperation mit Grundschulen Hospitationskonzepte entwickelt und umgesetzt haben. Die Auswertung des Datenmaterials
erfolgte mithilfe der qualitativen Inhaltsanalyse (Bos & Tarnai, 1989; Mayring, 2010) mit MAXQDA. Dabei wurde für die ersten
zwei Forschungsfragen das Management-Modell von Bleicher (2004) auf den Kontext des Übergangs adaptiert. Für die dritte
Forschungsfrage wurde auf das Übergangsqualitätsmodell von van Ophuysen und Harazd (2014) zurückgegriffen.
Die Analyse der Interviews zeigt, dass bei der gemeinsamen Entwicklung und Umsetzung wechselseitiger
Unterrichtshospitationen zwischen Grundschul- und Gymnasiallehrkräften alle Ebenen schulischen Übergangsmanagements
abgedeckt werden. Die Schule agiert dabei sowohl auf der normativen als auch auf der strategischen und operativen Ebene.
Ziele liegen vornehmlich in der institutionalisierten Zusammenarbeit von Grundschulen und Gymnasien sowie der kontinuierlichen
Begleitung der Schülerinnen und Schüler. Schulische Aufgaben beziehen sich zum einen auf Aushandlungsprozesse innerhalb
der Zusammenarbeit der verschiedenen Schulformen und zum anderen auf die Entwicklung gemeinsamer Konzepte und deren
Umsetzungsplanung. Als Gelingensbedingungen werden u.a. zeitliche Aspekte und Einstellungen der Lehrkräfte wie Offenheit
und der Wille zur Zusammenarbeit auf Inputebene sowie eine gute Kommunikation bei der Zusammenarbeit auf Prozessebene
genannt. Die Befunde werden mit Blick auf eine mögliche Ausdifferenzierung und Erweiterung des Übergangsqualitätsmodells
um die Entwicklung und Umsetzung gemeinsamer Produkte und Gestaltungsmaßnahmen diskutiert. Implikationen für weitere
Forschung werden dargestellt.
Formen der Lehrerkooperation am Übergang von der Grund- zur weiterführenden Schule
Katharina Sartory
TU Dortmund
Dem Übergang von der Grund- zur weiterführenden Schule wird innerhalb der empirischen Bildungsforschung seit vielen Jahren
vermehrt Aufmerksamkeit geschenkt. Während unter dem Fokus der Reproduktion sozialer Ungleichheit schon zahlreiche
Erkenntnisse zu institutionellen Indikatoren und individuellen Merkmalen vorliegen (vgl. Maaz, Baumert, Gresch & McElvany,
2010), sind empirische Studien zur Frage der gemeinschaftlichen und systematischen Übergangsgestaltung rar. Entsprechend
bleibt diese Aufgabe für Lehrkräfte an Grundschulen und weiterführenden Schulen eine zentrale Herausforderung (Järvinen,
Otto, Sartory & Sendzik, 2012).
Auf Basis theoretischer Überlegungen haben van Ophuysen und Harazd (2014) ein integratives Rahmenmodell zur Analyse des
Übergangs entwickelt, das die Kooperationen zwischen Grundschulen und weiterführenden Schulen als ein wichtiges
Qualitätsmerkmal von Übergängen herausstellt. Der Blick auf die Forschung zur Kooperation am Übergang zeigt, dass die
schulübergreifende Kooperation am Übergang von Lehrkräften in der Tat als bedeutsam für einen gelingenden
Übergangsprozess erachtet wird (Koch, 2001; van Ophuysen, 2005). Empirische Beschreibungen zu konkreten
stufenübergreifenden Kooperationsformen bzw. –prozessen stehen bisher jedoch noch weitestgehend aus (van Ophuysen,
2008).
In der Forschung wird zur systematisierenden Beschreibung von Lehrerkooperation vielfach auf das von Gräsel et al. (2006)
entwickelte Modell zur Erfassung unterrichtsbezogener Lehrerkooperation zurückgegriffen. Dieses Modell umfasst mit
Austausch, Synchronisation und Kokonstruktion drei qualitativ unterschiedliche Formen der Lehrerkooperation. Es wurde mit
Fokus auf unterrichtsbezogene Kooperationsprozesse zwischen Lehrkräften gleicher Schulstufen entwickelt. Es stellt sich die
Frage, ob die vorgeschlagenen Kooperationsformen in gleicher Weise geeignet sind, Prozesse der stufenübergreifenden
Kooperation zu beschreiben. Mit dem vorliegenden Beitrag soll konkret untersucht werden:
1. Ist das Modell auf die Lehrerkooperation am Übergang von der Grund- zur weiterführenden Schule theoretisch übertragbar?
2. Bilden sich die Kooperationsformen empirisch vergleichbar ab?
3. Inwiefern ist eine Modellanpassung für den Übergang von der Grund- zur weiterführenden Schule nötig?
Zur Bearbeitung der Fragestellungen wurde auf Daten einer quantitativen Lehrerbefragung aus dem Projekt „Schulen im Team
– Übergänge gemeinsam gestalten“ zurückgegriffen. In dem Projekt arbeiten insgesamt 338 Lehrkräfte von Grund- sowie
weiterführenden Schulen in 29 schulübergreifenden Netzwerken gemeinsam an der Gestaltung des Übergangs. Für die Analysen
der Kooperationsformen konnte dabei auf eine Stichprobe von N = 142 zurückgegriffen werden (Grundschule n = 73;
weiterführende Schule n = 69).
Zur Erfassung der Kooperation im Kontext des Übergangs wurden die Skalen von Gräsel et al. adaptiert. Die faktorielle Struktur
wurde zunächst im Rahmen einer konfirmatorischen Faktorenanalyse überprüft. Da sich der Modellfit als unzureichend erwies,
wurden anschließend explorative Analysen berechnet.
Erste Analysen der Daten zeigen, dass sich lediglich die Dimension des Austauschs sinnhaft übertragen lässt. Die Dimensionen
der Synchronisation und Kokonstruktion finden in den Daten keine Entsprechung.
Zusammenfassend weisen die Ergebnisse darauf hin, dass eine Adaption des Modells zur unterrichtsbezogenen Kooperation
nicht ohne weiteres auf den Kontext des Übergangs von der Grund- zur weiterführenden Schule übertragbar ist. Überlegungen
zu Ursachen dieses Misfits und erste Ideen zu alternativen Kooperationsdimensionen werden vorgestellt.
ID: 190
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Sonstige Didaktiken, Lehrerbildung
Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung
Stichworte: Kompetenzmodelle, Kompetenzerfassung, Hochschulsektor, Lehramtsstudiengänge, Validität
Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor (KoKoHs II) – Analyse
von Kompetenzen bei Lehramtsstudierenden und -absolventen
Chair(s): Olga Zlatkin-Troitschanskaia (Johannes Gutenberg-Universität Mainz), Hans Anand Pant (Humboldt-Universität zu
Berlin)
Diskutant(en): Kristina Reiss (Technische Universität München), Oliver Lüdtke (Leibniz-Institut für die Pädagogik der
Naturwissenschaften und M)
Eine valide Erfassung der in der Hochschulbildung erworbenen Kompetenzen kann empirisch fundierte Kenntnisse zu den
Bedingungen, zur Entwicklung und Gestaltung sowie zu Wirkungen von akademischen Lernprozessen liefern. Dies stellt hohe
konzeptuelle und messmethodische Anforderungen an die Forschung, um eine objektive, zuverlässige und valide Messung
akademischer Kompetenzen sicherzustellen. Im Rahmen der ersten Phase der BMBF-Förderlinie „Kompetenzmodellierung und
Kompetenzerfassung im Hochschulsektor (KoKoHs I)“ (2011-2015) wurden Kompetenzmodelle sowie dazugehörige Instrumente
entwickelt und deutschlandweit empirisch erprobt. Die bisherigen Ergebnisse bieten eine solide Grundlage für künftige
vertiefende, längsschnittlich angelegte, mehrere Ebenen umfassende Analysen in (feld-)experimentellen Validierungsstudien,
wie sie im neuen Forschungsprogramm „Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor –
Validierungen und methodische Innovationen (KoKoHs II)“ (2016-2020) systematisch in den Blick genommen werden. KoKoHs
II setzt sich aus 15 Projektverbünden zusammen, die interdisziplinär, methodenintegrativ und standortübergreifend angelegt sind
und neben den erforderlichen mehrebenenanalytischen und längsschnittlichen Untersuchungsdesigns und quasiexperimentellen Validierungsstudien auch international innovative Verfahren der Kompetenzerfassung (z.B. computerbasierte
adaptive Assessments) einsetzen und weiterentwickeln. Der Fokus liegt dabei auf thematischen Schwerpunkten wie der
„Erfassung der Kompetenzentwicklungsverläufe“ und „Methodischen Innovationen“.
Vier der Projektverbünde werden an diesem Symposium teilnehmen, um Gemeinsamkeiten bei der Erfassung von Kompetenzen
bei Lehramtsstudierenden und -absolventen zu diskutieren. Das Projekt Pro-KomMa, dessen Vorläuferprojekt KomMa
Kompetenzen von frühpädagogischen Fachkräften untersuchte, treibt die Validierung der entwickelten Testverfahren weiter
voran, um Wirkungsannahmen zur Educational Effectiveness des Studiums und der Transformation der erworbenen
professionellen Kompetenz in Performanz im Kindergartenalltag zu testen. Das Projekt TEDS-Validierung erprobt, inwieweit die
drei in der internationalen Vergleichsstudie „Teacher Education and Development Study: Learning to Teach Mathematics (TEDSM)“ entwickelten Leistungstests zur Erfassung der in der Lehrerausbildung erworbenen professionellen Kompetenzen valide
Vorhersagen von qualitativem Unterricht und Schülerleistungen erlauben. Im Projekt PlanvoLL-D wird untersucht, wie
professionelles Wissen von angehenden Deutschlehrkräften, das während der ersten Ausbildungsphase an Hochschulen
erworben wurde, mit der Bewältigung der Kernanforderung „Planung von Unterricht“ in der zweiten Phase der Lehrerausbildung
(Referendariat/Vorbereitungsdienst) zusammenhängt. Im Projekt ProfiLe-P+ sollen die aus der ersten Förderperiode
vorliegenden Kompetenzmodelle und Instrumente vertiefenden Validierungsstudien unterzogen werden. Dafür wird insbesondere
untersucht, wie sich im Studium erworbene fachliche und fachdidaktische Kompetenzen in studiumsnahen beruflichen
Performanzsituationen (Praxissemester) auswirken. Alle vier Projektverbünde vereint neben den Kompetenzanalysen in der
Lehrerbildung auch messmethodische Aspekte der prognostischen Validität, die auch für den Wissenschaftstransfer in die
Hochschulpraxis besonders bedeutsam ist.
Im Rahmen dieses Symposiums werden die Modelle und Tests aus den vier Projekten vorgestellt und Ergebnisse aus bereits
durchgeführten Validitätsanalysen als Grundlage für weitere konzeptuelle und messmethodische Arbeiten diskutiert.
Beiträge des Symposiums
Von KomMa zu Pro-KomMa: Konvergente, diskriminante und prognostische Validierung von Modellen
und Instrumenten zur Professionalisierung des frühpädagogischen Studiums
Katja Eilerts1, Lars Jenßen1, Michael Eid2, Thomas Koinzer1, Corinna Schmude3, Sigrid Blömeke4
1
Humboldt-Universität zu Berlin, 2Freie Universität Berlin, 3Alice-Salomon-Hochschule Berlin, 4University of Oslo
Theoretischer Hintergrund
Grundlage des Projekts „Professionalisierung des frühpädagogischen Studiums: Konvergente, diskriminante und prognostische
Validierung der KomMa-Modelle und -Instrumente“ (Pro-KomMa) bildet der mehrdimensionale und anforderungsbezogene
Kompetenzbegriff von Weinert (2001), der von Blömeke, Gustafsson und Shavelson (2015) um die Perspektive
situationsspezifischer kognitiver Fertigkeiten erweitert wurde, die die Transformation von Kompetenz in Performanz vermitteln.
Dieses Kompetenzmodell wurde auf frühpädagogische Fachkräfte übertragen. Im Unterschied zum Vorgängerprojekt KomMa, in
dem vor allem kognitive Wissensqualitäten im Bereich Mathematik, Mathematikdidaktik und Pädagogik von angehenden
frühpädagogischen Fachkräften im Sinne von Shulman (1986) und deren Erfassung im Zentrum standen, werden in Pro-KomMa
auch situationsspezifische Fertigkeiten, z.B. mathematikbezogene Situationswahrnehmung und Handlungsplanung, und
Performanz, z.B. konkrete Aktivitäten zur Förderung mathematischer und sozialer Fähigkeiten der Kinder, fokussiert werden.
Erste Arbeiten aus KomMa liefern Hinweise, dass die Testinstrumente zur Erfassung des im Verlauf des Studiums erworbenen
Wissens im Bereich Mathematik konvergente und diskriminante Validität bezüglich allgemein-kognitiver Fähigkeiten und affektivmotivationaler Konstrukte aufweist sowie prognostische Validität bezüglich situationsspezifischer Wahrnehmungs- und
Planungsfertigkeiten (Dunekacke, Jenßen, Eilerts & Blömeke, under revision).
Fragestellung
Ziel von Pro-KomMa ist somit eine umfassende konvergente, diskriminante und prognostische Validierung der in KomMa
entwickelten Testinstrumente zu den Wissensbereichen Mathematik, Mathematikdidaktik und Pädagogik anhand des von
Blömeke, Gustafsson und Shavelson (2015) postulierten Modells. Die Validierung schließt somit zum einen die Überprüfung
theoretischer Annahmen zur Struktur und Entwicklung der Wissensbereiche im Laufe des frühpädagogischen Studiums und zum
anderen die prognostische Validität des im Studium erworbenen Wissens hinsichtlich der Performanz der frühpädagogischen
Fachkräfte in der Praxis mit ein. Stützen die Validierungsergebnisse die theoretischen Annahmen, lägen erstmals Instrumente
vor, mit denen die Effektivität des frühpädagogischen Studiums erfasst werden kann.
Methode
Für Pro-KomMa wird auf die Stichprobe aus KomMa (N=1851) zurückgegriffen, in der sowohl Fachschüler/innen und
Fachhochschüler/innen jeweils zu Beginn und am Ende ihrer Ausbildung repräsentiert sind. In Pro-KomMa wird ein Teil dieser
Stichprobe am Ende ihrer Ausbildung getestet (erwartetes n=300; längsschnittliche Erfassung der Kompetenzentwicklung
während der frühpädagogischen Ausbildung und Effekte dieser auf die Kompetenzentwicklung). Der andere Teil wird während
der Phase des Berufseinstiegs getestet (erwartetes n=50; prognostische Validierung hinsichtlich der Performanz im
Kindergartenalltag).
Neben den in KomMa entwickelten Testinstrumenten werden weitere Test- und Fragebogenverfahren zur konvergenten und
diskriminanten Validierung eingesetzt (z.B. Lerngelegenheiten, beliefs) sowie viedogestützte Testverfahren und
Beobachtungsverfahren zur Erfassung der situationsspezifischen kognitiven Fertigkeiten und der Performanz im Kindergarten.
Zusätzlich werden Kinder der betreuenden frühpädagogischen Fachkraft in der Praxis zu numerischen Kompetenzen getestet
um somit erstmals die Effekte der Kompetenzen der frühpädagogischen Fachkraft auf die Entwicklung der mathematischen
Kompetenzen der Kinder untersuchen zu können. Durch den Vergleich von Fachschulen und Fachhochschulen lässt sich die
Effektivität der Ausbildung auch auf institutioneller Ebene feststellen.
Die Datenanalysen werden auf Grundlage der Item-Response-Theorie (v.a. 2PL-Modelle zur Skalierung der Tests) und der
Klassischen Testtheorie (v.a. längsschnittliche Analysen auf Grundlage latenter Modellierungen, Multilevel-Modelle)
durchgeführt. Neben dieser quantitativen Erfassung wird eine kleinere Gruppe von frühpädagogischen Fachkräften, die bereits
in der Praxis arbeiten (erwartetes n=12), in der Praxis videographiert. Die so gewonnenen qualitativen Daten werden mit den
quantitativen Daten in Verbindung gebracht, um ein feineres Bild zur Effektivität des frühpädagogischen Studiums zu erhalten.
Ergebnisse
Im Rahmen der Präsentation werden zunächst die theoretische Konzeption des Projekts Pro-KomMa und die Instrumente aus
KomMa vorgestellt sowie die Relevanz von Pro-KomMa für die Kompetenzforschung und die frühpädagogische Ausbildung
vorgestellt. Anschließend werden aktuelle Ergebnisse der Validierung im Rahmen von KomMa dargestellt (faktorielle Validität
der Testbatterie, konvergente und diskriminante Validität zu Intelligenz und Selbstwirksamkeitserwartung und prognostische
Validität zu einer videobasierten Erfassung von mathematikbezogener Situationswahrnehmung und Handlungsplanung während
der Ausbildung).
Validierung der Instrumente aus der internationalen Vergleichsstudie TEDS-M und ihrer Follow-Up-Studie
TEDS-FU
Gabriele Kaiser1, Johannes König2, Sigrid Blömeke3
1
Universität Hamburg, 2Universität zu Köln, 3University of Oslo
Theoretischer Hintergrund
Testverfahren für die kognitiven Dimensionen der professionellen Kompetenz von Mathematiklehrkräften wurden in den
vergangenen Jahren vor allem in Deutschland und den USA entwickelt. Prominent sind die Arbeiten aus COACTIV (Kunter et
al., 2011), die für das deutsche Sekundarstufensystem empirische Belege für den Zusammenhang von Content Knowledge (CK)
und Pedagogical Content Knowledge (PCK) von Lehrkräften und den Lernfortschritten ihrer Schülerinnen und Schüler, vermittelt
über Maße zu Dimensionen der Unterrichtsqualität erbringen konnten (Baumert et al., 2010) und damit an den internationalen
Forschungsstand anschließen (u.a. Hill et al., 2005). Überdies konnten Zusammenhänge zwischen während des im Referendariat
vorliegenden pädagogischen Wissens und über Schülerbefragungen erhobenen Maßen der Klassenführung nachgewiesen
werden (Voss et al., 2014; König & Kramer, 2016).
Allerdings weist der internationale Forschungsstand noch immer erhebliche Lücken auf:
• Obgleich alle Studien grundsätzlich von einer Wirkungskette Lehrerbildung – Lehrerkompetenz – Unterrichtsqualität –
Schülerleistung ausgehen, wurde bislang noch kein Nachweis erbracht, ob die im Rahmen der Hochschulausbildung erworbenen
Kompetenzen einen Einfluss auf Unterrichtsqualität und Lernfortschritt der Lernenden haben.
• Keine der genannten Studien hat bislang das Zusammenspiel der Trias von content knowledge (CK), pedagogical content
knowledge (PCK) und general pedagogical knowledge (GPK) auf Unterrichtsqualität und Lernfortschritt der Schüler(innen)
simultan modelliert.
• Eine Kompetenzmodellierung, die sowohl kognitive Dispositionen als auch situationsspezifische Fertigkeiten (z.B. über videobasierte Instrumente) modelliert und als Prädiktoren für Unterrichtsqualität bzw. Leistungszuwachs von Lernenden analysiert, ist
bislang nur fachgebunden erfolgt (Kersting et al., 2012).
Der Beitrag stellt die KoKoHS-Studie TEDS-Validierung vor, die sich diesen Problemstellungen annimmt. Verwendet werden
Wissenstests aus der internationalen Vergleichsstudie zur Effektivität der (Mathematik-)Lehrerbildung TEDS-M sowie videobasierte Testinstrumente zur situationsnahen Erfassung der Wahrnehmung von Unterricht aus der Nachfolgestudie TEDS-FU,
um die professionelle Kompetenz von berufstätigen Mathematiklehrkräften zu erfassen und ihren Zusammenhang zur
Unterrichtsqualität und Schülerleistungen zu analysieren.
Fragestellung
Vor dem Hintergrund der Zielsetzungen des vorzustellenden Projekts fokussieren wir folgende Fragen zur prognostischen
Validität und zum messtheoretischen Ansatz, mit denen Rückschlüsse auf die Wirksamkeit der Lehrerausbildung – am Beispiel
der Mathematik – getroffen werden können:
(1) Erweisen sich die im Kontext von TEDS-M und TEDS-FU entwickelten Instrumente zur Messung der während der
universitären Lehrerausbildung vermittelten professionellen Kompetenzen als prognostisch valide für qualitativ hochwertigen und
erfolgreichen Mathematikunterricht?
(2) Trägt die Aufnahme situationsspezifischer Fähigkeiten (gemessen über video-basierte Tests) über die Effekte des in der
universitären Lehrerausbildung vermittelten Professionswissens (gemessen über Wissenstests) hinaus substanziell zur
Erklärung von Unterrichtsqualität und dem Leistungszuwachs bei Schülerinnen und Schülern bei?
Methode
Erprobte Testverfahren für kognitive Kompetenzdimensionen von Lehrkräften liegen aus der internationalen Vergleichsstudie
TEDS-M vor, in der 2008 erstmals vollständig und mit repräsentativen Länderstichproben die als zentral anzusehende Trias
MCK, MPCK und GPK bei der Zielgruppe angehender Mathematik¬lehrkräfte erhoben wurde (Blömeke et al., 2010a, b). Getestet
wurden angehende Sekundarstufenlehrkräfte und Primarstufenlehrkräfte im letzten Jahr ihrer Ausbildung
(Referendariat/Vorbereitungsdienst). Der Ansatz wurde in weiterführenden Studien auf die erste Phase der Lehrerausbildung
und andere Unterrichtsfächer übertragen. Die umfangreichen Arbeiten aus TEDS-M und den Folge- bzw. Anschlussstudien
verweisen vor allem auf Inhalts- und Konstruktvalidität der entwickelten Tests (u.a. Blömeke et al., 2010a, b; Hoth et al., 2016;
König, 2014).
In der Nachfolgestudie TEDS-FU wurden innovative Evaluationsinstrumente in Form von video-basierten Tests entwickelt, um
prozedurales Wissen abbilden zu können. Nachweislich sind auch diese Tests reliabel und valide, um eine handlungsnahe
Erfassung von situationsspezifischen Fähigkeiten zu ermöglichen. Die Tests bauen auf jenen aus TEDS-M auf, sodass sie
inhaltlich mit diesen für die Mathematikdidaktik und die Pädagogik vergleichbar sind (Busse & Kaiser, 2015; Kaiser et al., 2015).
Ergebnisse
Da die Studie erst am Anfang steht, wird zum einen ein zusammenfassender Überblick über die einzusetzenden Kompetenztests
gegeben und ihre psychometrischen Kennwerte, darüber hinaus werden die mit ihnen bisher erzielten zentralen Befunde
präsentiert. Zum anderen wird das Studiendesign von TEDS-Validierung vorgestellt und es werden Ziele und
Fragestellungen/Hypothesen referiert.
PlanvoLL-D: Die Bedeutung des professionellen Wissens angehender Deutschlehrkräfte für ihre Planung
von Unterricht
Christiane Buchholtz1, Albert Bremerich-Vos2, Johannes König3
1
Humboldt-Universität zu Berlin, 2Universität Duisburg-Essen, 3Universität zu Köln
Theoretischer Hintergrund
Aus der BMBF-geförderten Studie „Teacher Education and Development Study: Learning to Teach“ (TEDS-LT) liegen reliable
Tests zur Messung von Fachwissen Deutsch (Literatur, Linguistik), deutschdidaktischem Wissen (Literatur- und Sprachdidaktik)
und pädagogischem Wissen (Bremerich-Vos & Dämmer, 2013; König et al., 2013) vor. Dabei ist es noch eine weitgehend offene
Frage, ob die bei Lehramtsstudierenden erfassten Kompetenzen eine Bedeutung für die weitere Kompetenzentwicklung in der
zweiten Ausbildungsphase und damit für den weiteren Ausbildungsweg der angehenden Lehrkräfte besitzen, d.h. in dieser
Hinsicht prognostisch valide sind. An dieser Problemstelle setzt das vorzustellende und im Rahmen von KoKoHs vom BMBF
geförderte Projekt „Die Bedeutung des professionellen Wissens angehender Deutschlehrkräfte für ihre Planung von Unterricht:
Validierung und methodische Innovation“ (PlanvoLL-D) an: Konkret zielt es auf die Beantwortung der Frage, wie das
professionelle Wissen, das angehende Deutschlehrkräfte während der ersten Phase erworben haben, mit der Bewältigung einer
Kernanforderung in der zweiten Phase der Lehrerausbildung zusammenhängen: der Planung von Unterricht. Die
Planungskompetenz von angehenden Lehrkräften ist bislang ein völlig unbearbeitetes Feld der Kompetenzmessung und modellierung (z.B. Aufschnaiter & Blömeke, 2010). In dem vorzustellenden Projekt „PlanvoLL-D“ wird daher ein innovativer
Messansatz genutzt: Erstmalig wurde in der Studie „Planungskompetenz von Lehrerinnen und Lehrern“ (PlanvoLL; König,
Buchholtz & Dohmen, 2015; Buchholtz & König, 2015) ein standardisiertes und reliables Verfahren zur Analyse von schriftlichen
Unterrichtsplanungen (Lehrproben) entwickelt, das auf die Anforderung einer adaptiven Unterrichtsgestaltung fokussiert. Da
dieses Verfahren fächerübergreifend die didaktische Adaptivität von angehenden Lehrkräften als Aspekt ihrer
Planungskompetenz erfasst, erfolgt im Rahmen des vorzustellenden Projekts „PlanvoLL-D“ zudem eine Konkretisierung auf das
Fach Deutsch.
Fragestellungen
Im Projekt PlanvoLL-D werden zwei übergreifende Fragestellungen verfolgt:
1) Gelingt eine Konkretisierung generischer Planungskompetenz (didaktische Adaptivität) im Hinblick auf die Fachdidaktik
Deutsch (fachdidaktische Adaptivität)?
2) Lässt sich mithilfe des im Rahmen der universitären Ausbildung erworbenen Wissens Planungskompetenz bzw. die
Veränderung von Planungskompetenz vorhersagen und damit ein Beleg für dessen prognostische Validität erbringen?
Methode
Zielgruppe sind angehende Sekundarstufenlehrkräfte mit Fach Deutsch in Berlin und Nordrhein-Westfalen. Unser
Untersuchungsmodell sieht vor, das professionelle Wissen der angehenden Lehrkräfte als Outcome der ersten
Lehrerbildungsphase an Hochschulen zu verstehen. Dieses wird zu Beginn ihrer zweiten Phase mit den Tests aus TEDS-LT
erfasst. Ihre Planungskompetenz hingegen wird im Längsschnitt zu zwei Zeitpunkten erfasst, indem schriftliche
Unterrichtsplanungen (Lehrproben) zu Beginn und am Ende des Referendariats/Vorbereitungsdiensts erhoben und analysiert
werden. Dies ermöglicht uns, (a) das Wissen auf die Planungskompetenz querschnittlich (zu Beginn des Referendariats) sowie
(b) auf die Veränderung der Planungskompetenz (d.h. Zuwachs) während der zweiten Ausbildungsphase zu beziehen.
Ergebnisse
Im Vortrag wird zunächst das geplante Projekt dargestellt. Angesichts des Projektstarts in 2016 werden projektrelevante
Ergebnisse berichtet, die mit den zu verwendenden Instrumenten bislang erzielt werden konnten. Zu den Wissenstests werden
psychometrische Kennwerte vorgestellt, die u.a. ihre Reliabilität an verschiedenen Stichproben belegen. Ergebnisse zur
Konstruktvalidität der Tests berichten wir aus Prüfungen der theoretisch angenommenen dimensionalen Struktur, mit denen u.a.
das Wissen in Literaturwissenschaft, in Linguistik und in Fachdidaktik strukturell trennen ließ sowie fachdidaktisches von
pädagogischem Wissen abgegrenzt werden konnte. Curriculare Validität der Tests für die erste Lehrerausbildungsphase wird
mithilfe von Befunden aus Zusammenhangsanalysen mit Lerngelegenheiten im Studium berichtet. Zur Messung von
Planungskompetenz wird das Verfahren zur Erfassung von didaktischer Adaptivität vorgestellt, einschließlich psychometrischer
Kennwerte aus IRT-Skalierungen. Curriculare Validität wird über Ergebnisse eines Expertenreviews sowie eines
Kompetenzzuwachses aus Längsschnittanalysen während der zweiten Ausbildungsphase belegt. Konstruktvalidität sowie
prognostische Validität wird aus Analysen berichtet, die über den Einbezug externer Konstrukte erfolgten (u.a. lerntheoretische
Überzeugungen, Schülerratings zur Unterrichtsqualität).
Professionswissen in der Lehramtsausbildung Physik
Andreas Borowski1, Josef Riese2, Christoph Kulgemeyer3, Hans E. Fischer4, Peter Reinhold2, Horst Schecker3
1
Universität Potsdam, 2Universität Paderborn, 3Universität Bremen, 4Universität Duisburg-Essen
Theoretischer Hintergrund
Im Hinblick auf qualitativ hochwertigen Unterricht benötigen Lehrkräfte hohes Fachwissen und hohes Fachdidaktisches Wissen
als fundamentale Bestandteile ihrer professionellen Kompetenz (Baumert & Kunter, 2006). Large-Scale-Studien zu diesen
Wissensbereichen sind bislang jedoch weitgehend auf das Fach Mathematik beschränkt (z.B. Blömeke, Kaiser & Lehmann, 2010;
Kunter et al., 2011). Für die Physik existieren zwar einige Arbeiten zu Kompetenzmessungen (z.B. Kirschner, 2014; Kröger,
Neumann & Petersen, 2013; Riese & Reinhold, 2012), aber auch hier werden vorwiegend Gesamtscores einzelner
Wissensbereiche erhoben, die keine Analysen auf Teilskalenebene erlauben. Somit können die vorliegenden widersprüchlichen
Hinweise zum Zusammenhang des Professionswissens von Lehrkräften und ihrer Performanz (vgl. z.B. Vogelsang, 2014; Cauet,
et al., im Druck) aktuell nicht weiter aufgeklärt werden. Zudem können die vorliegenden Arbeiten keine Aussagen zur Interaktion
der o.g. Bereiche machen.
Zielsetzung
Vor diesem Hintergrund verfolgt der Forschungsverbund ProfiLe-P (vgl. Riese et al., 2015) das Ziel, ein Rahmenmodell und
entsprechende Testinstrumente zu entwickeln und zu validieren, welche zentrale Wissensbereiche angehender Physiklehrkräfte
differenzierter als bisher überprüfbar machen. Insbesondere sollen Zusammenhänge zwischen Subskalen des Fachwissens, des
Fachdidaktischen Wissens und der Perfor¬manz beim Erklären physikalischer Sachverhalte aufgeklärt werden.
Methode
Das im Forschungsverbund ProfiLe-P entwickelte Rahmenmodell des Professionswissens von Physik-Lehramtsstudierenden
(Abb. 1) unterscheidet physikalisches Fachwissen (FW), deklarative und analytische Aspekte des fachdidaktischen Wissens
(FDW) und prozedurale Aspekten des FDW beim Erklären physikalischer Sachverhalte, da letzteres eine wichtige
Standardsituation im Physikunterricht darstellt. Als normativ-präskriptive Orientierungspunkte der modellbasierten Entwicklung
der jeweiligen Messinstrumente wurden normative Setzungen (u.a. GFD, 2004; KMK, 2008; Fachprofil Physik), aber auch
Fachphysik- und Physikdidaktikcurricula bzw. Modulbeschreibungen und bisherige Arbeiten (s.o.) herangezogen. Inhaltlich
beziehen sich die Entwicklungen auf den Bereich Mechanik.
Das Modell für das FW unterscheidet die Facetten Schulwissen, vertieftes Schulwissen und universitäres Wissen (vgl. z.B. Kunter
et al., 2011). Die Schwierigkeit der Aufgaben wird über ihre Komplexität (Kauertz et al., 2010) operationalisiert. Insgesamt wurden
143 Aufgaben entwickelt. Zur Erfassung des Einflusses mathematischer Fähigkeiten beim Lösen von Physikaufgaben wurde ein
Test zur Erfassung von Rechenfähigkeiten entwickelt.
Das Modell für das FDW unterscheidet die Facetten „Instruktionsstrategien“, „Schülervorstellungen“, „Experimente und
Vermittlung eines angemessenen Wissenschaftsverständnisses“ sowie „Fachdidaktische Konzepte“. Diese werden als relevant
für die Performanz beim Erklären erachtet (vgl. Gramzow, Riese & Reinhold, 2013). Des Weiteren wurden Kognitive Aktivitäten
(vgl. Anderson & Krathwohl, 2001) modelliert. Insgesamt wurden 91 Items konzipiert.
Das verwendete Modell für die Performanz beim Erklären fokussiert auf dialogisches Erklären in unterrichtsnahen
Erklärungssituationen (vgl. Kulgemeyer & Schecker 2013). Es geht davon aus, dass Erklärungen adressatengerecht und
sachgemäß variiert werden können, indem der Mathematisierungsgrad, die gewählten Beispiele, das Sprachniveau und die
verwendeten Darstellungsformen angepasst werden. Die Performanz wird in einer standardisierten Testsituation erhoben, worin
die Probanden ein vorgegebenes physikalisches Phänomen trainierten Schülern erklären sollen.
Alle zuvor beschriebenen Instrumente wurden umfassenden Validierungsstudien unterzogen (vgl. Riese et al., 2015) und in
Quasi-Längsschnitten und echten Längsschnitten bei rund 300 Physik-Lehramtsstudierenden eingesetzt.
Abb.1: Rahmenmodell des Professionswissens bei Physiklehramtsstudierenden
Ergebnisse
Das FW der Physiklehramtsstudierenden kann empirisch fundiert in den drei o.g. Facetten gemessen werden (Chi-Quadrat-Test,
p <.001; Varianzen zwischen .98 und 1.43, EAP/PV-Reliabilitäten zwischen .78 und .83; vgl. Riese et al., 2015). Auch beim FDW
fittet ein 4D-Rasch-Modell, welches in die vier o.g. fachdidaktischen Facetten unterteilt, besser (p <.001, Chi-Quadrat-Test). Hier
liegen die Varianzen der Subskalen zwischen .50 und .60, die EAP-Reliabilitäten zwischen .55 und .73. Die Performanz beim
Erklären lässt sich in einer unterrichtsnahen Situation videobasiert mit Hilfe von Rollenspielen erheben. Die Ausprägung der
Performanz profitiert sowohl vom FW als auch vom FDW der Physik-Lehramtsstudierenden. Es zeigen sich Korrelationen mit FW
und FDW von r=0,32** bzw. r=0,39** und typenabhängige Zusammenhänge der Wissensbereiche. Der Vortrag fokussiert auf die
Darstellung und Diskussion der Ergebnisse aus der Hauptstudie und gibt einen Ausblick auf das Folgeprojekt.
ID: 191
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Wirtschafts- und Berufspädagogik
Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Methoden der empirischen
Bildungsforschung
Stichworte: Kompetenzmodelle, Kompetenzerfassung, Hochschulsektor, fachübergreifende Kompetenzen, fachbezogene
Kompetenzen
Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor (KoKoHs II) –
modellbasierte Messung und Analyse fachbezogener und fachübergreifender Kompetenzen
Chair(s): Hans Anand Pant (Humboldt-Universität zu Berlin), Olga Zlatkin-Troitschanskaia (Johannes Gutenberg-Universität
Mainz)
Diskutant(en): Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen, HU Berlin), Martin Brunner (Institut für
Schulqualität der Länder, Freie Universität Berlin)
Eine valide Erfassung der in der Hochschulbildung erworbenen Kompetenzen kann empirisch fundierte Kenntnisse zu den
Bedingungen, zur Entwicklung und Gestaltung sowie zu Wirkungen von akademischen Lernprozessen liefern. Dies stellt hohe
konzeptuelle und messmethodische Anforderungen an die Forschung, um eine objektive, zuverlässige und valide Messung
akademischer Kompetenzen sicherzustellen. Im Rahmen der ersten Phase der BMBF-Förderlinie „Kompetenzmodellierung und
Kompetenzerfassung im Hochschulsektor (KoKoHs I)“ (2011-2015) wurden Kompetenzmodelle sowie dazugehörige Instrumente
entwickelt und deutschlandweit empirisch erprobt. Die bisherigen Ergebnisse bieten eine solide Grundlage für künftige
vertiefende, längsschnittlich angelegte, mehrere Ebenen umfassende Analysen in (feld-)experimentellen Validierungsstudien, die
im neuen Forschungsprogramm „Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor –
Validierungen und methodische Innovationen (KoKoHs II)“ (2016-2020) systematisch in den Blick genommen werden. KoKoHs
II setzt sich aus 15 Projektverbünden zusammen, die interdisziplinär, methodenintegrativ und standortübergreifend angelegt sind
und neben den erforderlichen mehrebenenanalytischen und längsschnittlichen Untersuchungsdesigns sowie quasiexperimentellen Validierungsstudien auch international innovative Verfahren der Kompetenzerfassung (z.B. computerbasierte
adaptive Assessments) einsetzen und weiterentwickeln. Der Fokus liegt dabei auf thematischen Schwerpunkten wie der
„Erfassung der Kompetenzentwicklungsverläufe“ und „Methodischen Innovationen“.
Vier der Projektverbünde werden an diesem Symposium teilnehmen, um Gemeinsamkeiten bei der Erfassung hauptsächlich
fachübergreifender Kompetenzen von Studierenden sowie ihrer Abgrenzung zu fachbezogenen Kompetenzen zu diskutieren.
Dabei werden je unterschiedliche Facetten, wie epistemische Strategien, Motivationsregulation oder kommunikative Fähigkeiten
fokussiert.
Ziel des Projekts WiWiKom II ist eine objektive, reliable und valide Erfassung der Kompetenzentwicklung bei Studierenden der
Wirtschaftswissenschaften, die valide Testwertinterpretationen erlaubt und den Interessengruppen (z.B. Hochschullehrern) eine
Grundlage für diagnostische und prognostische Zwecke bieten kann. Neben fachspezifischen werden auch fachübergreifenden
Kompetenzen testbasiert erfasst und ihre Beziehung zueinander im Studienverlauf betrachtet. Im Projekt KOSWO werden
Kompetenztests zum Umgang mit wissenschaftlicher Originalliteratur in verschiedenen Fachdisziplinen weiterentwickelt und
vertiefend validiert. Dies geschieht primär durch Trainingsexperimente sowie mittels traditioneller Validitätsnachweise. Das
übergeordnete Ziel des Projekts PRO-SRL-EVA ist es, ein Modell der Kompetenzen zum selbstregulierten Lernen im
Hochschulbereich in verschiedenen Fachdisziplinen und mehrere daraus abgeleitete Messverfahren einer erweiterten
Validitätsprüfung zu unterziehen. Dazu wird eine Reihe von korrelativen und experimentellen Studien durchgeführt. Ziel der
Nachwuchsforschungsgruppe KomPrü-KomFäh ist die Entwicklung eines psychometrischen Testsettings, durch das
kommunikative Fähigkeiten von Studierenden verschiedener Fachrichtungen mit einem standardisierten Beobachtungsbogen
bewertet werden können.
Alle vier Projektverbünde vereint die Betrachtung von der Rolle fachübergreifender Kompetenzen und deren Beziehung zu
fachspezifischen Kompetenzen.
Im Rahmen dieses Symposiums werden die Modelle und Tests aus den vier Projekten vorgestellt und Ergebnisse aus bereits
durchgeführten Validitätsanalysen als Grundlage für weitere konzeptuelle und messmethodische Arbeiten diskutiert.
Beiträge des Symposiums
Die valide Erfassung der Entwicklung des wirtschaftswissenschaftlichen Fachwissens im Verlauf des
Studiums - eine quasi-experimentelle Längsschnittstudie (WiWiKom II)
Olga Zlatkin-Troitschanskaia1, Hans Anand Pant2, Manuel Förster1, Sebastian Brückner1, Dimitar Molerov2
1
Johannes Gutenberg-Universität Mainz, 2Humboldt Universität zu Berlin
Relevanz
Die nationale und internationale Befundlage zur testbasierten Erfassung des wirtschaftswissenschaftlichen (wiwi) Fachwissens
(FW) von Studierenden zeigt zwei Forschungsdefizite auf (Zlatkin-Troitschanskaia et al. 2015):
(1) Die Veränderungsmessung des wiwi FWs im Studienverlauf und die experimentell kontrollierte Betrachtung (theoretisch)
relevanter Einflussfaktoren wurde (inter)national bislang nur in allerersten Ansätzen vorgenommen (Happ et al. 2015).
(2) Keine der vorhandenen Studien nimmt eine umfassende Validierung der Modelle und Instrumente vor, wie es z.B. die aktuellen
Standards der AERA et al. (2014) vorsehen. Valide Testwertinterpretationen über die Entwicklung des Fachwissens und ihre
Einflussfaktoren sind daher bislang weder möglich noch zulässig.
Zielstellung und Validierungsaspekte
Um diesen Desiderata zu begegnen, wird im WiWiKom II das Ziel verfolgt, die Entwicklung des wiwi FWs objektiv, reliabel und
valide zu erfassen. Damit werden, aufbauend auf den Validierungsarbeiten aus WiWiKom I (Zlatkin-Troitschanskaia et al. 2014),
vertiefende Validierungsfragen verfolgt und die bislang im Querschnitt gewonnenen Befunde um eine individuelle
Veränderungsmessung im Hochschulstudium erweitert. Folgende konvergente und diskriminante Validierungsfragestellungen
werden abgeleitet:
(1) Inwieweit können Unterschiede und Veränderungen in den Testwerten durch die absolvierten Lerngelegenheiten im Studium
der WiWi erklärt werden? (konvergent längsschnittliche Validierung)
(2) Sind die allgemeinen kognitiven Fähigkeiten (AKF) zur Lösung des Fachtests weniger bedeutsam als Lerngelegenheiten im
Studium? (längsschnittlich diskriminante Validierung)
(3) Inwieweit gelingt es den Übergang in das wiwi Masterstudium durch den Fachtest besser als durch den Intelligenztest
vorherzusagen? (inkrementelle und prädiktive Validierung)
(4) Inwieweit gelingt es die Verläufe wiwi FWs der Studierenden der WiWi (Zielgruppe) von Studierenden anderer
Sozialwissenschaften (Vergleichsgruppe) abzugrenzen. (Diskriminante Validierung mittels des Known-groups-Ansatzes)
Test und Auswertungsmethoden
Im Rahmen von vier deutschlandweiten Feldstudien wurde der WiWiKom-Test (kalibrierter Itempool mit über 200 Fachaufgaben
zu den sieben Inhaltsdomänen) bei 10.217 Studierenden der WiWi an über 40 Hochschulen nach den AERA-Standards geprüft.
Im Rahmen der WiWiKom I-Studie, die auch einen Pretest und qualitative Studien einschließt (Curricula- und Lehrbuchanalysen
von 98 WiWi Studiengängen an 64 Hochschulen, 32 Experteninterviews, Online-Ratings mit 78 Dozenten, kognitive Interviews
mit 20 Studierenden), wurden Hinweise auf die valide Erfassung des wiwi FWs durch den WiWiKom-Test gewonnen. Eine
Kurzversion des WiWiKom-Tests wurde auch in der National Educational Panel Study (NEPS) eingesetzt.
WiWiKom II basiert auf dem in WiWiKom I entwickelten Fachwissensmodell und dem dort eingesetzten WiWiKom-Instrument.
Zur Überprüfung der vier Forschungsfragen werden umfangreiche Datenerhebungen und -analysen durchgeführt. Hierzu werdenanknüpfend an die Datensätze aus den bisherigen Feldstudien in WIWiKom I- in vier längsschnittlich angelegten Erhebungen an
24 Hochschulen zwischen 2016 und 2019 neben dem Fachwissenstest ein Test zur Kontrolle der AKF in Form fluider und
kristalliner Intelligenz (BEFKI) (s. Schipolowski et al., in Vorb.) eingesetzt.
Die mit diesen Instrumenten generierten Daten werden im Anschluss umfassend ausgewertet. Deskriptive Analysen geben einen
Einblick über die Entwicklungsverläufe des FWs sowie der AKF in der Ziel- und Vergleichsgruppe. Die Modellierung des FWs
wird auf Basis von IRT- und SEM-Verfahren durchgeführt. Die Möglichkeit der Gruppenvergleiche wird über
Messinvarianzanalysen im Quer- und Längsschnitt geprüft. Aufgrund der zu erwartenden Ausfallzahlen in den Daten im
Längsschnitt, werden MEM sowie Wachstumskurvenmodelle nach frequentistischen sowie bayesianischen Ansätzen geschätzt.
Zudem wird das Propensity Score Matching eingesetzt, um valide Gruppenvergleiche auch bei Gruppen mit verschiedenen
Größen und Verteilungen in den Kovariaten (z.B. verschiedene Hochschulen und verschiedene individuelle Merkmale zwischen
den Gruppen) im Quer- und Längsschnitt vornehmen zu können.
Ergebnisse
Im Rahmen der Präsentation wird neben dem theoretischen Modell, den Instrumenten v.a. ein Überblick über die bisherigen
Ergebnisse zur Erfassung des wiwi FWs von Studierenden gegeben, um daraus die Implikationen für WiWiKom II abzuleiten und
kritisch zu diskutieren.
Literaturverzeichnis
Epistemische Strategien für einen kompetenten Umgang mit wissenschaftlicher Originalliteratur
Sebastian Schmid1, Tobias Richter2, Sarah von der Mühlen2, Kirsten Berthold3
1
Universität Regensburg, 2Universität Kassel, 3Universität Bielefeld
Theoretischer Hintergrund
In nahezu allen Studienfächern wird von den Studierenden erwartet, dass sie sich mit wissenschaftlicher Originalliteratur
auseinandersetzen. Diese Auseinandersetzung geht über eine rezeptive Erarbeitung der Textinhalte hinaus. Spätestens, wenn
es darum geht, eine Abschlussarbeit zu verfassen, müssen Studierende geeignete Texte identifizieren und kritisch reflektieren.
Eine erfolgreiche wissenschaftliche Sozialisation beinhaltet daher den Erwerb zahlreicher Kompetenzen im Umgang mit
wissenschaftlicher Originalliteratur, die in Abhängigkeit vom jeweiligen Verarbeitungsziel flexibel eingesetzt werden können. Im
Vordergrund des Beitrags stehen epistemisch-systematische und epistemische-heuristische Kompetenzen im Umgang mit
wissenschaftlicher Originalliteratur. Beide Kompetenzbereiche haben gemein, dass sie der Prüfung der Wahrheit bzw.
Plausibilität der Textinhalte dienen (Richter, 2003; Richter & Schmid, 2010). Dies geschieht jedoch auf unterschiedliche Weise.
Epistemisch-systematische Kompetenzen sind nötig, um die Argumentation des Texts auf ihre Stichhaltigkeit zu prüfen. Sie
beinhalten die Identifikation der funktionalen Bestandteile der Argumente (vor allem Behauptung und Begründung, Toulmin, 1958;
Britt & Larson, 2003) und die Bewertung der Relevanz der angeführten Begründung für die Behauptung, für die argumentiert wird
(Larson, Britt & Kurby, 2009). Damit bilden epistemisch-systematische Kompetenzen eine Voraussetzung für eine rational
begründete Beurteilung des Textinhalts. Epistemisch-heuristische Kompetenzen zielen dagegen darauf ab, ein schnelles
(vorläufiges) Urteil über die Glaubwürdigkeit des Textinhalts zu fällen. Hierzu zählt die Nutzung von Quelleninformationen
(Sourcing) wie Publikationsorgan, Autor(innen) und Textgenre (z.B. Korpan, Bisanz, Bisanz & Henderson, 1997; Bromme, 2010).
Diese Prozesse sind besonders dann wichtig, wenn systematische Kompetenzen nicht angewendet werden können, weil
relevantes domänenspezifisches Vorwissen fehlt oder kognitive Ressourcen für eine weitergehende epistemisch-systematische
Verarbeitung nicht zur Verfügung stehen (Schroeder, Richter & Hoever, 2008). In zahlreichen Untersuchungen konnten Defizite
Studierender in beiden Kompetenzbereichen dokumentiert werden (z.B. Wineburg, 1991; Shaw, 1996). Wir vermuten, dass diese
Defizite auf den Einsatz unterschiedlicher Strategien bei Studierenden gegenüber Wissenschaftler(inne)n zurückgehen. Hinweise
auf derartige Strategieunterschiede könnten genutzt werden, um Trainings zur gezielten Förderung epistemischer Kompetenzen
im Studium zu entwickeln.
Fragestellung
Das Ziel der vorliegenden Untersuchungen bestand darin festzustellen, in welchen Kompetenzbereichen sich Studierende von
Wissenschaftler(inne)n unterscheiden. Protokolle lauten Denkens wurden erhoben, um darüber hinaus zu untersuchen, welche
Strategieunterschiede den Kompetenzunterschieden zugrunde liegen.
Methode
Zwanzig Erstsemesterstudierenden und 20 Wissenschaftler(innen) (8 Postgraduierte und 12 Doktorand(inn)en) bearbeiteten
Tests zu epistemisch-systematischen und epistemisch-heuristischen Kompetenzen aus dem elektronischen Testsystem
Kompetenzen Studierender im Umgang mit wissenschaftlicher Originalliteratur (KOSWO). Epistemisch-systematische
Kompetenzen wurden mit den Tests (a) Plausibilitätsbeurteilung und (b) Identifikation von Argumentbestandteilen erfasst. Im
ersten Test müssen die Teilnehmer(innen) Argumentationsfehler in zwei längeren Texten identifizieren und unterschiedlichen
Kategorien zuordnen, im zweiten Test die funktionalen Bestandteile einzelner Argumente (Behauptung, Begründung,
Schlussregel, Stützung und Ausnahmebedingung) identifizieren. Epistemisch-heuristische Kompetenzen wurden mit den Tests
(c) Glaubwürdigkeitsbeurteilung und (d) Genreidentifikation erfasst. Im diesen Tests müssen die Teilnehmer(innen) die
Glaubwürdigkeit verschiedener Texte einschätzen und sie unterschiedlichen Textgenres (z.B. Originalpublikation,
Übersichtsartikel, Lehrbuchtext, populärwissenschaftlicher Text) zuordnen. Die Tests zu heuristischen Kompetenzen wurden mit
einem Zeitlimit vorgegeben, um dem Einsatz systematischer Strategien entgegenzuwirken. Die Teilnehmer(innen) bearbeiteten
eine Parallelversion jedes Tests im Stillen und die andere unter der Instruktion, laut zu denken. Die Zuordnung der
Parallelversionen zu diesen beiden Bedingungen und die Reihenfolge der Bedingungen wurde über die Teilnehmer(innen)
ausbalanciert.
Ergebnisse
Die Wissenschaftler(innen) erzielten in allen Tests bessere Ergebnisse als die Studierenden. Um Strategieunterschiede zwischen
beiden Gruppen zu identifizieren, wurden die Protokolle lauten Denkens einer Inhaltsanalyse unterzogen. Dabei zeigte sich, dass
die Studierenden ihre Plausibilitätsurteile häufiger intuitiv fällten, während die Wissenschaftler(innen) häufiger die interne
Konsistenz der Aussagen beurteilen. Darüber hinaus scheinen die Wissenschaftler(innen) bei ihren Glaubwürdigkeitsurteilen
Quelleninformationen stärker zu berücksichtigen als Studierende. Mediatoranalysen und die Berechnung indirekter Effekte
sprechen dafür, dass die Leistungsunterschiede zwischen Wissenschaftler(inne)n und Studierenden teilweise auf diese
Strategieunterschiede zurückgeführt werden können. Die Ergebnisse liefern erste Hinweise auf Strategien, die in Trainings zur
Förderung eines kompetenten Umgangs mit wissenschaftlicher Originalliteratur zu vermitteln sind.
Erfassung der Kompetenzen zur Motivationsregulation von Studierenden anhand eines Situational
Judgement Tests
Gabriele Steuer, Tobias Engelschalk, Markus Dresel
Universität Augsburg
Kompetenzen zum selbstregulierten Lernen (SRL) sind in der tertiären Bildung erforderlich, u.a. weil von Studierenden erwartet
wird sich umfangreiche Wissensbestände eigenständig zu erarbeiten. Hierbei kommt dem Wissen darüber, wie die eigenen
Lernmotivation bei Widrigkeiten (wie etwa persönlich wenig bedeutsamen oder sehr schwierigen Lerninhalten) geschützt oder
verbessert, d.h. wie die eigene Motivation reguliert, werden kann, eine zentrale Funktion zu. Die große Bedeutung der
Motivationsregulation tritt in der Sichtweise von Studierenden und Praxisexperten zutage und spiegelt sich in theoretischen
Modellen zum SRL wider.
In bisher vorliegenden Instrumenten wird die Motivationsregulation anhand von globalen selbstberichteten
Motivationsregulationsstrategien auf Verhaltensebene erfasst. Vor dem Hintergrund der mittlerweile breiten Literatur zur
Diagnostik der Selbstregulation des eigenen Lernens scheint es allerdings nicht mehr angemessen den Strategieeinsatz lediglich
in seiner Quantität zu berücksichtigen und dabei zudem spezifische Regulationsanlässen zu vernachlässigen. Angesichts der
begrenzten Validität globaler Selbstberichte erscheint eine systematische Betrachtung der Situationsspezifität von
Motivationsregulationsstrategien angezeigt.
In diesem Beitrag werden die Konstruktion sowie erste Ergebnisse der Validierung eines Situational Judgment Tests (SJT) zur
Erfassung von Kompetenzen zur Motivationsregulation vorgestellt. Dazu werden neben diversen Vorarbeiten insbesondere zwei
Studien berichtet: Studie 1 ist eine Expertenbefragung (N = 14) in der die Eignung von Motivationsregulationsstrategien für
unterschiedliche Regulationsanlässen erfragt wurde. Anhand eines Onlinefragebogens wurden spezifische Eignungen von
Strategien in sechs verschiedenen Anforderungssituationen (beschrieben in Vignetten) erfragt. Bei der Variation der Anlässe
wurden Erwartung (subjektiv schwierige Lerninhalte) und Wert (subjektiv wenig attraktive, jedoch relevante Lerninhalte) sowie
drei unterschiedliche Handlungsphasen (präaktional, aktional, postaktional) unterschieden. In den Ergebnissen der
Expertenbefragung zeigte sich insgesamt sich nur bei wenigen Strategien hinreichender Konsens bei den Experten, sodass nur
bei einer relativ kleinen Anzahl von Strategien davon ausgegangen werden kann, dass diese personübergreifend adaptiv sind.
Studie 2 stellt die Erprobung des auf dieser Basis konstruierten SJT an einer studentischen Stichprobe (N = 188, M = 21.8 Jahre,
SD = 2.83) in den Fächern Wirtschaftswissenschaften und Mathematik dar. Die Befragung wurde in Paper-Pencil-Form realisiert
und nahm etwa 45 Minuten in Anspruch. Zunächst wurden Vignetten präsentiert, in denen der jeweilige Lernkontext („Erstellen
einer Semesterarbeit“ oder „Lernen auf eine Prüfung“) thematisiert und kurz skizziert wurde. Im Anschluss wurde der
Regulationsanlass („schwierig“ oder „langweilig“ sowie „präaktional“ oder „aktional“) spezifiziert. Durch Kombination der zwei
Lernsituationen mit zwei Regulationsanlässen in zwei Phasen der Lernhandlung ergaben sich acht verschiedene Situationen, die
in zufälliger Reihenfolge präsentiert wurden. Im Anschluss wurde zunächst der subjektive Regulationserfolg anhand von zwei
Items erfragt. Danach wurde das Wissen zum Strategieeinsatz erhoben. Im Anschluss an die situationsspezifischen Messungen
folgte eine Reihe an situationsunspezifischen Messungen. So wurde der Fragebogen von Schwinger et al. (2007) eingesetzt, der
ein globales und rein quantitatives Messkonzept nutzt, und es wurden die Anstrengung im Studium, der Wert des Studiums, das
Fähigkeitsselbstkonzept sowie Schul- und Studienleistungen erfragt.
Der finale SJT beruht auf Vergleichen der Antworten der Probanden mit Expertenurteilen. Als Ergebnis zeigte sich, dass der SJT
sowohl mit dem Fragebogen von Schwinger er al. (2007) als auch mit der Studienleistung, der Schulleistung, dem
Regulationserfolg in den einzelnen Situationen und der Anstrengung korreliert. Des Weiteren zeigte sich eine inkrementelle
Varianzaufklärung im Hinblick auf der Kriterium Anstrengung im Vergleich zu dem globalen und quantitativen Regulationsmaß
des Fragebogens von Schwinger et al.. Insgesamt weisen diese Ergebnisse darauf hin, dass es mit diesem SJT gelungen ist,
ein reliables und valides Messinstrument zur Erfassung der Kompetenzen zur Motivationsregulation zu entwickeln. Zusätzlich
können diese Ergebnisse dahingehend interpretiert werden, dass die Nutzung qualitativer Standards der Nutzung quantitativer
Standards bei der Messung von Kompetenzen zur Motivationsregulation überlegen ist. Gleichwohl stellen die Befunde von Studie
1 die Annahme einer universellen (d.h. für alle Studierenden geltenden) Eignung von Motivationsregulationsstrategien für
bestimmte Regulationsanlässe für einen Großteil der Strategien infrage.
Entwicklung eines Messverfahrens zur Erfassung kommunikativer Fähigkeiten
Edith Braun, Georgios Athanassiou, Kathleen Pollerhof
INCHER Universität Kassel
Kommunikation wird in zahlreichen Qualifikationsrahmen als einer der zentralen Lerninhalte eines Hochschulstudiums
beschrieben, unter anderem im „Qualifikationsrahmen für deutsche Hochschulabschlüsse“ der Hochschul¬rektoren¬konferenz.
Bislang liegen kaum Testverfahren vor um derartige überfachliche Fähigkeiten auf der Individualebene nach anerkannten
Gütekriterien zu erfassen. Daher ist das Ziel der hier vorgestellten Forschungsgruppe, die in der KoKoHs Förderlinie angesiedelt
ist, die Entwicklung eines Testsettings, durch das kommunikative Fähigkeiten von Studierenden bewertet werden können: Dazu
werden Rollenspiele konzipiert, und mithilfe eines standardisierten Beobachtungsbogens kann das kommunikative Verhalten von
Studierenden bewertet werden. Als Ausgangslage werden die beiden Studiengänge Wirtschaftswissenschaften und Lehramt
verwendet. Zum einen handelt es sich um ausbildungsstarke Studiengänge, in denen zusammen 25% aller Studierenden
ausgebildet werden. Zum anderen müssen die Absolvierenden der Studiengänge unterschiedlich in ihren Berufen
kommunizieren. Während in den Wirtschaftswissenschaften eher Verhandeln und Überzeugen als kommunikative Anforderungen
genannt werden, müssen Lehrer(innen) insbesondere Konflikte lösen, erziehen und lehren.
Als theoretischer Bezugsrahmen dienen die von Habermas (1981) entwickelten Typen der Kommunikation. Habermas
unterscheidet in seiner soziologischen Theorie des kommunikativen Handelns zwischen strategischer und
verständigungsorientierter Kommunikation. In strategischen Gesprächskontexten ist das Ziel ein Mittel zum Zweck und besteht
über die Gesprächssituation hinaus. Zudem kann es sein, dass das Gesprächsziel nicht direkt angesprochen wird, da dies nicht
zwangsläufig zu einer individuellen, nutzenkalkulierten Erreichung des Ziels beiträgt. In der verständigungsorientierten
Kommunikation stehen hingegen eine kooperative Problemlösung und eine gemeinsame Verständigung im Vordergrund.
Darüber hinaus wurden weitere Komponenten der Kommunikation in der Literatur identifiziert: Intention, Sachinhalt, soziale Rolle
(Gartmeier et al., 2011; Grice 1975; Hinsch und Pfingsten, 2007; Rogers, 1981; Traut-Mattausch und Frey, 2005; Hargie und
Dickson, 2004; Watzlawick, 1969).
Methode
Die Entwicklung des Testverfahrens umfasst mehrere Arbeitsschritte. 1) eine umfassende Literaturrecherche zur Identifikation
von relevanten Merkmalen einer Kommunikation; 2) ca. 10.000 Absolventen beschrieben, in welchen beruflichen Situationen sie
mit anderen Personen kommunizieren. Diese Daten wurden ausgewertet und dienen als Grundlage zur Entwicklung der
Rollenspiele. 3) die Rollenspiele werden basierend auf die ersten beiden Schritte entwickelt (aktueller Arbeitsschritt). 4) die
Rollenspiele werden in Lehrveranstaltungen (Wintersemester 2015/ 16) pilotiert, 5) die Rollenspiele werden in einer geplanten
Stichprobe von 500 Personen normiert.
Ergebnisse und weiteres Vorgehen
Die Rollenspiele wurden entlang der identifizierten Kommunikationsmerkmale systematisch variiert: so entstanden jeweils acht
Situationen in der die Intention eher eine verständigungsorientierte oder strategische Kommunikation vorsieht. Zudem wurde die
soziale Rolle fünfmal als eine schwächere, fünfmal als gleichberechtigt und sechsmal als stärkere Machtposition vorgegeben.
Die so entstandenen Rollenspiele erhalten beide Studierendengruppen. Es wird lediglich der situative Kontext an das spätere
berufliche Umfeld angepasst. Für die spätere Testdurchführung wurde eine Zufallsstichprobe aus allen Hochschulen in
Deutschland gezogen, an denen entweder Wirtschaftswissenschaften oder Lehramt studiert werden kann.
In dem Beitrag sollen die Rollenspiele dargestellt und diskutiert werden. Es handelt sich um einen laufenden Forschungsprozess,
daher liegen derzeit noch keine empirischen Daten vor.
ID: 219
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Sonstige Didaktiken
Thematisches Cluster: Lehrer(aus)bildung, Lehrerexpertise, Motivation und Emotion
Stichworte: Lehrermotivation; Berufsspanne; Veränderung; Tagebuch; Längsschnitt
Auf dem Höhepunkt ihrer Motivation? Wie sich motivationale Merkmale von Lehrkräften im Laufe des
Berufslebens entwickeln und verändern.
Chair(s): Doris Holzberger (Technische Universität München), Mareike Kunter (Goethe-Universität Frankfurt)
Diskutant(en): Ewald Terhart (Westfälische Wilhelms-Universität Münster)
Motivationale Merkmale von Lehrkräften gelten als bedeutsam für deren beruflichen Erfolg (Alexander, 2008). In der
motivationspsychologischen Grundlagenforschung werden mit dem Begriff „Motivation“ die Gründe einer Person für die
Aufnahme, Richtung, Ausdauer und Intensität eines Verhaltens beschrieben (Heckhausen & Heckhausen, 2006). Doch wodurch
werden diese Gründe für ein Verhalten bestimmt, wie stabil sind sie und wie verändern sich motivationale Merkmale von
Lehrkräften im Laufe des Berufslebens? Während in den letzten Jahren das Forschungsinteresse an motivationalen Merkmalen
von Lehrkräften als Prädiktor für deren beruflichen Erfolg stark angestiegen ist, ist bezüglich deren Determinanten, Stabilität bzw.
Variabilität und Veränderung über die Berufsspanne weit weniger bekannt (Klassen et al., 2011; Kunter & Holzberger, 2014). Die
Frage der Veränderbarkeit motivationaler Merkmale von Lehrkräften ist praktisch höchst relevant, da daraus Konsequenzen für
die Selektion oder Unterstützung von Lehrkräften ableitbar sind. Erste Hinweise existieren, dass beispielsweise die
Selbstwirksamkeit bei erfahrenen Lehrkräften höher ist als bei Berufsanfänger(innen) (Tschannen-Moran & Woolfolk Hoy, 2007;
Wolters & Daugherty, 2007), wobei Klassen und Chiu (2010) eine umgekehrt u-förmige Beziehung fanden, nach der die
Selbstwirksamkeit im hohen Berufsalter wieder abnimmt. Eine systematische Betrachtung der Determinanten und Variabilität von
motivationalen Merkmalen steht noch aus.
Ziel des Symposiums ist es, die Variabilität und die Veränderung motivationaler Merkmale von Lehrkräften in den verschiedenen
Phasen des Lehrerberufs zu untersuchen. Dabei werden – im Sinne des Tagungsthemas – individuelle und institutionelle
Faktoren untersucht, die positive wie negative Veränderungen im Laufe des Berufslebens vorhersagen. Die vier Beiträge des
Symposiums nehmen systematisch jeweils eine Phase des Lehrerberufs in den Blick. In den Beiträgen von König et al. und
Holzberger et al. werden die Veränderungen motivationaler Merkmale von Lehramtsstudierenden bzw. –anwärter(innen) im Laufe
institutioneller Lerngelegenheiten (Praxissemester bzw. Vorbereitungsdienst bis Berufseinstieg) untersucht. Aldrup & Klusmann
gehen der Frage nach, inwieweit tägliche Schwankungen im Enthusiasmus von Berufsanfänger(inne)n durch persönliche
Erlebnisse vorhergesagt werden können. Der Beitrag von Keller analysiert wie sich erfahrene Lehrkräfte bzgl. erlebtem und
gezeigtem Enthusiasmus unterscheiden.
Gemeinsames Kennzeichen aller vier Beiträge ist die spannende Frage nach der Variabilität und Veränderung. Deren
Beantwortung geschieht unter Einbezug unterschiedlicher Zeitintervalle (täglich 2-3 Wochen, 5 Monate, 2 Jahre) ebenso wie
verschiedener methodischer Zugänge (Tagebuch- und Fragebogendaten). Die Vielfalt des Symposiums zeigt sich außerdem in
der interdisziplinären Besetzung, die die Fragestellungen sowohl aus erziehungswissenschaftlicher, didaktischer und
psychologischer Perspektive beleuchtet. Die Beiträge werden durch den Diskutanten Ewald Terhart bewertet. Mit seiner Expertise
im Gebiet des Lehrerberufs und der Lehrerbildung bringt er eine optimale kritische Außenperspektive in dieses Symposium.
Beiträge des Symposiums
Veränderung motivationaler Merkmale von angehenden Lehrkräften während des Praxissemesters
Kerstin Darge, Johannes König, Charlotte Kramer, Rudy Ligtvoet
Universität zu Köln
*Theoretischer Hintergrund*
Modelle professioneller Kompetenz von (angehenden) Lehrkräften betonen explizit die Erlern- bzw. Veränderbarkeit der
berücksichtigten Merkmale (Baumert & Kunter, 2011; Kunter et al., 2011; Terhart, 2011), doch wird in empirischen Studien neben
der Entwicklung des Professionswissens die Veränderung motivationaler Orientierungen äußerst selten behandelt. Im Einzelnen
deuten die wenigen vorliegenden Befunde aus einschlägigen Untersuchungen auf Veränderungen hin (z.B. Schutz, Crowder &
White, 2001; König et al., eingereicht) und lassen motivationale Merkmale angehender Lehrkräfte nicht zwangsläufig als stabil
über den Zeitraum ihrer Ausbildung erscheinen. Aktuell lost das Praxissemester an vielen Hochschulen bundesweit die bislang
kurzen Fachpraktika ab. Unter den verschiedenen Zielsetzungen finden sich Bezuge zur motivationalen Veränderung, etwa bei
der
Berufswahlmotivationsüberprüfung
oder
der
Entwicklung
eines
„professionellen
Selbstkonzepts“
(vgl.
Lehramtszugangsverordnung NRW). Angesichts der Bedeutung, die verlängerten Praxisphasen vielfach zugeschrieben wird
(etwa Arnold et al., 2014), stellt sich die Frage nach Einflüssen auf Veränderungen motivationaler Merkmale angehender
Lehrkräfte. Entsprechende Evaluationen berichten zwar über einzelne Veränderungen, insbesondere in den
Selbstwirksamkeitserwartungen, die Befunde sind jedoch eher uneinheitlich.
*Fragestellung*
Im Mittelpunkt des Beitrags steht die Frage nach Veränderungen motivationaler Merkmale von angehenden Lehrkräften während
des Praxissemesters – am Beispiel der Ausbildungsregion Köln. Angesichts der mit dem dortigen Praxissemester verbundenen
curricularen Zielsetzungen erwarten wir im Sinne einer Lernwirksamkeit einen Zuwachs in motivationalen Variablen wie der
intrinsischen Berufswahlmotivation, den Selbstwirksamkeitserwartungen bezogen auf den Lehrerberuf sowie dem Flow-Erleben
beim Unterrichten. Weiterführend werden Indikatoren der Prozessqualität (u.a. lernprozessbezogene Tätigkeiten und mentorielle
Unterstützung im Praxissemester) als Prädiktoren zur Erklärung von motivationalen Veränderungen einbezogen. Vermutet wird,
dass die individuelle Nutzung der im Praxissemester angebotenen Lerngelegenheiten (z.B. die Planung oder Durchführung von
Unterricht) sowie die Betreuung durch Mentoren-Lehrpersonen Veränderungen in motivationalen Merkmalen positiv beeinflussen
können.
*Methode*
Der Datensatz entstammt einer Untersuchung angehender Lehrkräfte in der Ausbildungsregion Köln (n=330
Lehramtsstudierende im 2. MA-Semester), die vor (T1) und nach (T2) ihrer 5-monatigen Anwesenheit an Ausbildungsschulen
(Februar-Juni 2015) befragt wurden (Projekt „Applaus“). Sie stehen für eine Grundgesamtheit von 460 Lehramtsstudierenden,
die im Sommersemester 2015 als erste Kohorte das neu implementierte Praxissemester durchlaufen und zu diversen kognitiven
und motivational-affektiven Merkmalen sowie zu ihren Lerngelegenheiten getestet bzw. befragt wurden. Die T1-Erhebungen
wurden im Rahmen von Lehrveranstaltungen unter einheitlicher Instruktion durchgeführt, sodass eine individuelle Selbstselektion
bei der Stichprobenrekrutierung praktisch ausgeschlossen werden kann. Die T2-Erhebungen wurden auf gleiche Weise
durchgeführt, allerdings wurden in diesem Fall motivationale Merkmale aus Zeitgründen erst im Rahmen eines ergänzenden
Online-Surveys erhoben. Zur Erfassung motivationaler Merkmale kamen u.a. zum Einsatz (Cronbach’s Alpha für T1/T2):
Selbstwirksamkeit (Schwarzer & Schmitz 1999; 5 Items, ɑ = .72/74), Berufswahlmotivation (Watt & Richardson, 2008; intrinsische:
2 Items, ɑ =.59/.78; fachspezifische: 3 Items, ɑ = .88/.92) Flow-Erleben beim Unterrichten (nach Spooner, 2008; 9 Items, ɑ =
.83/.76), Überprüfung der Berufswahlmotivation (König et al., 2014, 4 Items, ɑ = .72/.84). Lerngelegenheiten wurden u.a. über
ein Instrumentarium ermittelt, das lernprozessbezogene Tätigkeiten sowie mentorielle Unterstützung berücksichtigt (König et al.,
2014).
*Ergebnisse*
Die Längsschnittanalysen über T1 und T2 weisen statistisch signifikante (jeweils p < .001) Mittelwertunterschiede (Zuwachse) für
die betrachteten motivationalen Merkmale aus, die auch praktisch bedeutsam sind (Cohen’s d): Selbstwirksamkeit (1.03),
intrinsische Berufswahlmotivation (.20), fachspezifische Berufswahlmotivation (.30), Flow-Erleben beim Unterrichten (.52),
Überprüfung der Berufswahlmotivation (.31). Zur Prüfung der Veränderung motivationaler Merkmale durch Merkmale der
Lerngelegenheiten zeigt sich in ersten schrittweisen Regressionsanalysen, dass die Durchführung pädagogischer Handlungen
sowie die mentorielle Unterstützung Zuwachse in der Selbstwirksamkeit und im Flow-Erleben beim Unterrichten statistisch
signifikant und positiv beeinflusst (standardisierte Regressionsgewichte zwischen .16 und .34). Zum Zeitpunkt der Tagung werden
Ergebnisse aus Pfadanalysen vorliegen, in denen die Modellierung der Veränderung motivationaler Merkmale und Beeinflussung
durch Lerngelegenheiten auf latenter Ebene sowie unter Kontrolle von bestimmten Hintergrundmerkmalen (u.a. Geschlecht,
Alter, Lehramt) erfolgt.
Quantität oder Qualität? Wie Veränderungen motivationaler Merkmale von Lehramtsanwärter(innen)
interpretiert werden können.
Doris Holzberger1, Tina Seidel1, Mareike Kunter2
1
Technische Universität München, 2Goethe-Universität Frankfurt
*Theoretischer Hintergrund*
Enthusiasmus für das Unterrichten (als affektiv-motivationales Merkmal) und die Selbstwirksamkeitserwartung (als
selbstbezogene Kognition) gelten als günstige motivationale Merkmale, die für den beruflichen Erfolg von Lehrkräften bedeutsam
sind (Kunter et al., 2011). Konzeptualisiert als Kompetenzaspekt wird angenommen, dass motivationale Merkmale veränderbar
sind. Bislang ist jedoch noch wenig bekannt darüber, ob und wie sich Unterrichtsenthusiasmus und Selbstwirksamkeit von
(angehenden) Lehrkräften verändern und unter welchen Bedingungen sie sich im Laufe der Ausbildung entwickeln.
Aus theoretischer Sicht gelten für die Entwicklung von Selbstwirksamkeit verschiedene Quellen als bedeutsam (Bandura, 1997),
deren Einfluss sich je nach Berufserfahrung unterscheiden kann (Tschannen-Moran & Woolfolk, 2007). Für die Entwicklung oder
Veränderung von Enthusiasmus werden theoretisch diejenigen Einflussfaktoren angenommen, die auch intrinsische Motivation
beeinflussen können, zum Beispiel das Erleben von Autonomie oder Kompetenz (Evelein et al., 2008; Kunter & Holzberger,
2014).
Unabhängig von den jeweiligen Determinanten gilt, dass (angehende) Lehrkräfte auf ausreichend Erfahrungen zurückgreifen
können müssen, um ihre Fähigkeiten (Selbstwirksamkeit) ebenso wie ihr affektives Erleben (Enthusiasmus) bei der Ausführung
einer Tätigkeit (z.B. Unterrichten) valide einschätzen zu können. So kann angenommen werden, dass zu Beginn des
Vorbereitungsdienstes die Einschätzung von Selbstwirksamkeit und Unterrichtsenthusiasmus aufgrund des Mangels an
Erfahrungen eher global und ggf. fehlerhaft erfolgt, wohingegen mit Zunahme der eigenen Erfahrungen die Konstrukte stärker
ausdifferenziert werden.
Um Aussagen darüber treffen zu können, ob und wie sich motivationale Merkmale von Lehrkräften über die Zeit hinweg
verändern, ist es entscheidend, nachzuweisen, dass die Vergleichbarkeit der Konstrukte über die Zeit hinweg gegeben ist
(Meredith, 1993). Im vorliegenden Beitrag werden somit nicht nur quantitative Veränderungen motivationaler Merkmale im
Vorbereitungsdienst analysiert, sondern auch geprüft, inwieweit qualitative Veränderungen in der Erfassung von
Unterrichtsenthusiasmus und Selbstwirksamkeit ergeben.
*Fragestellung*
Insbesondere wird der Frage nachgegangen, wie sich Selbstwirksamkeit und Unterrichtsenthusiasmus im Laufe des
Vorbereitungsdienstes bis zum Berufseinstieg verändern. Dabei werden zunächst qualitative Veränderungen in den erfassten
Konstrukten geprüft. Zeigt sich, entgegen unserer Erwartung, dass die Konstrukte gleich bleiben, kann die quantitative
Veränderung der Merkmale durch Erfahrungen im Vorbereitungsdienst untersucht werden.
*Methode*
Zur Beantwortung der Fragestellung werden Daten einer Längsschnittstichprobe von 416 Anwärter(inne)n für das Lehramt an
allgemein bildenden Schulen analysiert, die an mindestens zwei von vier Messzeitpunkten teilgenommen haben (t1 = zu Beginn,
t2 = ein Jahr nach Beginn, t3 = am Ende des Vorbereitungsdienstes und t4 = 1,5 Jahre nach dem Berufseinstieg).
Unterrichtsenthusiasmus (4 Items) und Selbstwirksamkeit (10 Items) wurden im Selbstbericht erfasst. Daten wurden mit Mplus
6.1 analysiert, fehlende Werte mittels des Full-Information-Maximum-Likelihood-Verfahrens geschätzt. Um zu überprüfen, ob die
Instrumente zu den vier Messzeitpunkten die gleichen latenten Variablen messen, wurden Invarianzanalysen gerechnet (vgl.
Meredith, 1993). Zur Analyse der Stabilität wurden anhand von Strukturgleichungsmodellen Autoregressionskoeffizienten
berechnet.
*Ergebnisse und Diskussion*
Die Ergebnisse der Invarianzanalysen unterstreichen, dass im Verlauf des Vorbereitungsdienstes bis zum Berufseinstieg
Vergleichbarkeit für Unterrichtsenthusiasmus kaum (lediglich gleiche Faktorstruktur/konfigurale Invarianz) und für
Selbstwirksamkeit nur sehr eingeschränkt (gleiche Faktorladungen/schwache faktorielle Invarianz) gegeben ist, sodass
quantitative Veränderungsanalysen nicht gerechtfertigt sind. Zwar deuten die Autoregressionskoeffizienten auf mittlere bis hohe
Stabilitäten zwischen den vier Messzeitpunkten hin (Unterrichtsenthusiasmus: .45 < β < .74 & leichte Abnahme;
Selbstwirksamkeit: .45 < β < .73 & leichte Zunahme), diese sollten jedoch nicht interpretiert werden, da die Instrumente zu den
vier Messzeitpunkten scheinbar unterschiedliche Konstrukte erfassen.
Die Befunde zeigen, dass sich das Bild von Lehramtsanwärter(innen) über sich und ihre Tätigkeit in der Phase des
Vorbereitungsdienstes bis zum Berufseinstieg entscheidend verändert und dies die Einschätzung motivationaler Merkmale
beeinflusst. Daraus lässt sich ableiten, dass motivationale Merkmale wirklich im Sinne einer Kompetenz durch bestimmte
Lerngelegenheiten formbar sind. Im Vortrag wird diskutiert, über welche Lerngelegenheiten die Konstrukte vergleichbar sind und
zu welchem Zeitpunkt Unterrichtsenthusiasmus und Selbstwirksamkeit von (angehenden) Lehrkräften valide gemessen werden
können. Dies ermöglicht, die motivationale Entwicklung durch Merkmale der Ausbildung und der Berufserfahrung vorherzusagen.
Lieben Lehrkräfte ihren Beruf jeden Tag? Eine Tagebuchstudie zum täglichen beruflichen Enthusiasmus
und seinen Einflussfaktoren
Karen Aldrup, Uta Klusmann
IPN, Kiel
*Theoretischer Hintergrund*
Beruflicher Enthusiasmus wird als wichtiges Merkmal erfolgreicher Lehrkräfte beschrieben (Long & Hoy, 2006). Zum einen kann
Enthusiasmus – das Erleben von Freude und Begeisterung für den Lehrerberuf (Kunter, Frenzel, Nagy, Baumert & Pekrun, 2011)
– als Aspekt des beruflichen Wohlbefindens verstanden werden (Kahneman, Diener & Schwarz, 1999; Waterman, 1993). Zum
anderen beeinflusst beruflicher Enthusiasmus die Unterrichtsqualität bzw. wird als Teilaspekt guten Unterrichts verstanden und
wirkt sich somit auch auf die Motivation und den Lernerfolg der Schüler/innen aus (Kunter et al., 2013; Pelletier, Séguin-Lévesque
& Legault, 2002).
Doch können Lehrkräfte jeden Tag Begeisterung für ihren Beruf empfinden? Schaufeli, Salanova, González-Romá und Bakker
(2002) beschreiben beruflichen Enthusiasmus als relativ stabiles Personenmerkmal. Dabei wird angenommen, dass Personen,
die ein hohes Ausmaß beruflicher (z. B. kollegiale Unterstützung; Klusmann, Kunter, Trautwein, Lüdtke & Baumert, 2008) und
persönlicher (z. B. Selbstwirksamkeit; Hobfoll, 2002) Ressourcen besitzen, auch in Berufen mit vielen Stressoren enthusiastisch
bleiben (Demerouti, Bakker, Nachreiner & Schaufeli, 2001; Hobfoll, 1989).
Allerdings weisen verschiedene Autor/innen darauf hin, dass beruflicher Enthusiasmus täglichen intraindividuellen
Schwankungen unterliegt (Kunter et al., 2011; Sonnentag, Dormann & Demerouti, 2010). Diese Perspektive erlaubt einen tieferen
Einblick in tägliche Einflussfaktoren, die bislang nur wenig untersucht wurden (Sonnentag et al., 2010). In der vorliegenden
Untersuchung soll der Fokus auf täglichen positiven (_uplifts_) und negativen (_hassles_) beruflichen Ereignissen liegen.
Insbesondere der Einfluss von _hassles_ auf den beruflichen Enthusiasmus ist dabei von Interesse, da bislang vornehmlich
Zusammenhänge mit _uplifts_ betrachtet wurden (Bakker & Bal, 2010; Sonnentag et al., 2010).
*Fragestellung*
Die zentrale Fragestellung der vorliegenden Studie ist, inwieweit der berufliche Enthusiasmus von Lehrkräften als ein stabiles
Merkmal angesehen werden kann. Dabei sollen erstens die Varianz des beruflichen Enthusiasmus auf täglicher Ebene sowie die
Zusammenhänge zwischen dem Enthusiasmus auf täglicher Ebene und dem Enthusiasmus als Personenmerkmal betrachtet
werden. Zweitens soll untersucht werden, ob tägliche _uplifts_ und _hassles_ tägliche Veränderungen vorhersagen. Drittens soll
analysiert werden, welche Personenmerkmale (Selbstwirksamkeit, aggregierte _hassles_ und _uplifts_) mit einem über die Tage
konstant hohen beruflichen Enthusiasmus assoziiert sind.
*Methode*
An der zweiwöchigen Tagebuchstudie nahmen 113 Lehrkräfte in den ersten vier Berufsjahren teil. In einem Präfragebogen
wurden beruflicher Enthusiasmus und Selbstwirksamkeit als Personenmerkmale erfasst. Im Tagebuch schätzten die Lehrkräfte
ihren beruflichen Enthusiasmus auf Tagesebene ein (1 = _trifft nicht zu_ bis 4 = _trifft zu_). Zudem gaben sie in einem offenen
Antwortformat Auskunft über berufliche Ereignisse. Diese bewerteten sie auf einer Skala von 1 = _sehr negativ_ bis 5 = _sehr
positiv_. Die Valenzratings dienten als Grundlage zur Einteilung in _uplifts_ und _hassles_.
*Ergebnisse*
Mit Blick auf die erste Fragestellung zeigen Intraklassenkorrelationen, dass nur ein geringer Anteil der Varianz des beruflichen
Enthusiasmus‘ auf Personenebene liegt und dass ein substantieller Anteil auf intraindividuelle Veränderungen auf Tagesebene
zurückzuführen ist (_ICC_ = .24). Allerdings schwanken die Werte selten zwischen _nicht enthusiastisch_ (Wert < 3) und
_enthusiastisch_ (Wert ≥ 3), sondern vornehmlich innerhalb eines Bereichs. Die Mehrheit der Lehrkräfte (54%) ist an mindestens
drei von vier Tagen enthusiastisch und nur 13% an höchstens jedem zweiten Tag.
Hinsichtlich der Zusammenhänge des mittleren beruflichen Enthusiasmus über die Tage und des Enthusiasmus als
Personenmerkmal zeigen sich moderate Korrelationen, wobei der Enthusiasmus auf Tagesebene statistisch signifikant geringer
eingeschätzt wird.
Wie Mehrebenen-Regressionsanalysen zeigen, steigt der Enthusiasmus an Tagen mit vielen _uplifts_ und wenigen _hassles_.
Auch tritt eine Interaktion zwischen _uplifts_ und _hassles_ auf. Es findet sich außerdem ein Effekt des Wochentages: An
Freitagen ist der Enthusiasmus höher.
Insgesamt berichten diejenigen Lehrkräfte über die Tage hinweg einen hohen Enthusiasmus, die eine hohe Selbstwirksamkeit
besitzen, viele _uplifts_ und wenige _hassles_ erleben.
Einmal enthusiastisch, immer enthusiastisch? Stundenprofile von Lehrkräften in erlebtem und gezeigtem
Enthusiasmus und deren Zusammenhang mit Schüleroutcomes
Melanie M. Keller1, Eva S. Becker2
1
Universität Salzburg, 2Universität Konstanz und Universität Zürich
*Theoretischer Hintergrund*
Lehrkräfte selbst geben an, ihren Beruf als lohnenswert zu empfinden und tatsächlich ist Freude die dominante Emotion im
Unterricht (siehe beispielsweise Keller, Frenzel, Goetz, Pekrun, & Hensley, 2014). Freude als unterrichtsbezogenes
Emotionserleben spielt auch in der Lehrerenthusiasmusforschung eine Rolle, in der zwischen empfundenem Enthusiasmus
ähnlich Freude (Kunter et al., 2008) und behavioral gezeigtem Enthusiasmus als möglicher Ausdruck dieser Freude
unterschieden wird. Beide Enthusiasmusformen sind miteinander korreliert (z.B. Frenzel, Goetz, Lüdtke, Pekrun, & Sutton, 2009),
sollten jedoch von Situation zu Situation stark schwankend sein, da Emotionen als dynamische Konstrukte gelten, die stark
kontextualisiert sind (Frenzel, Becker-Kurz, Pekrun, & Goetz, 2015) und von den Gegebenheiten einer Unterrichtsstunde
abhängen (Becker, Keller, Goetz, & Frenzel, 2015). Diese Variabilität allerdings, auch im Hinblick auf Schüleroutcomes, ist bisher
in der Forschung noch nicht untersucht.
*Fragestellung*
In der vorliegenden Studie wird untersucht, inwieweit empfundener und gezeigter Enthusiasmus auf Stundenebene, d.h. über
Situationen hinweg aber innerhalb von Lehrpersonen, variieren und inwieweit auftretende Konstellationen beider Variablen (highhigh, high-low, etc.; siehe auch Taxer & Frenzel, 2015, April) mit Freude und intrinsischer Wertüberzeugung auf Schülerseite in
der entsprechenden Unterrichtsstunde zusammenhängen.
*Methode*
Im Rahmen einer Tagebuchstudie haben 39 Mathematiklehrkräfte und deren 9./10. Gymnasialklassen über 2-3 Wochen jeweils
im Anschluss an Mathematikstunden (_N_ = 316) einen Kurzfragebogen ausgefüllt und Lehrkräfte über ihren empfundenen
Enthusiasmus (Freude; z.B. „In dieser Stunde machte mir das Unterrichten Freude.“) sowie Schüler/innen über den
wahrgenommenen Enthusiasmus („In dieser Stunde unterrichtete unser/e Lehrer/in mit Begeisterung.“) sowie ihr eigenes
Freudeerleben sowie intrinsische Wertüberzeugung berichtet. Alle Items konnten auf einer fünfstufigen Skala von (1) „stimmt gar
nicht“ bis (5) „stimmt genau“ eingeschätzt werden. Profile bezüglich empfundenem und gezeigtem Enthusiasmus wurden auf
Basis der _N_ = 316 Unterrichtsstunden mittels latenter Profilanalyse (LPA mit Mplus; Muthén & Muthén, 1998-2012) unter
Berücksichtigung der genesteten Datenstruktur extrahiert.
*Ergebnisse & Diskussion*
Lehrkräfte berichten hohe Werte in empfundenem Enthusiasmus (_M_ = 3.75), was von Schüler/innen entsprechend
wahrgenommen wird (_M_ = 3.51). Die Intraklassenkorrelationen zeigen, dass für empfundenen Enthusiasmus nur gut 20% der
Varianz zwischen den Lehrkräften liegt, für gezeigten Enthusiasmus aber etwa 70%. Beide Enthusiasmusformen hängen
innerhalb von Lehrpersonen moderat zusammen (_r_ = .29, _p_ < .001).
Unter Berücksichtigung statistischer Fit-Indizes und Interpretierbarkeit wurden vier Profile mittels LPA extrahiert, wobei
Profilgruppe 1 mit einer kleinen Gruppengröße (_N_ = 12) zunächst nicht von weiterem Interesse ist.
Profile 2 und 4 (_N_ = 70 bzw. 203) weisen ähnlich hohe Werte in gezeigtem Enthusiasmus auf (_M_ = 3.55 bzw. 3.76),
unterscheiden sich aber bezüglich empfundenem Enthusiasmus (_M_ = 2.89 bzw. 4.21): Scheint es also Lehrkräften in den
Unterrichtsstunden der Profilgruppe 4 zu gelingen, ihren empfundenen Enthusiasmus sichtbar zu zeigen (_Authentic
Enthusiasm_), so werden in Profilgruppe 2 Lehrkräfte enthusiastischer wahrgenommenen als sie es selbst angeben (_Fake
Enthusiasm_). Dies spiegelt sich auch wider in höherem Freudeerleben bzw. höheren Wertvorstellungen bei Schüler/innen in
_Authentic Enthusiasm_ verglichen mit _Fake Enthusiasm_.
Profilgruppe 3 (_N_ = 31) weist hohe Werte in empfundenem Enthusiasmus (_M_ = 4.00), aber niedrige Werte in gezeigtem
Enthusiasmus auf (_M_ = 2.40) und lässt sich dementsprechend als _Hidden Enthusiasm_ interpretieren. Im Vergleich zu
authentischem Enthusiasmus mit ähnlich hohen Werten im empfundenen Enthusiasmus, geben Schüler/innen in _Hidden
Enthusiasm_ allerdings signifikant niedrigere Werte für Freude und intrinsische Wertüberzeugung an.
Die stundenbezogenen Profile variieren innerhalb von Personen: Die Mehrheit der Lehrkräfte (_N_ = 24) weisen zwei
unterschiedliche Profile auf, 6 Personen weisen nur eines und 9 Personen drei Profile auf. Inwieweit Lehrkräfte also
Enthusiasmus erleben und im Verhalten äußern und dementsprechend von ihren Schüler/innen wahrgenommen werden, variiert
von Stunde zu Stunde. Implikationen dieser Befunde für Praxis und Forschung werden im Vortrag aufgegriffen.
ID: 233
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktiken der Naturwissenschaften und Technik
Thematisches Cluster: Lehrerexpertise, Mathematisch-naturwissenschaftlicher Unterricht, Vorschulische Bildung
Stichworte: Konzeptverständnis, Biologie, basiskonzeptorientierter Unterricht, Professionswissen
Messung und Förderung von Konzeptverständnis im Bildungsbereich Biologie
Chair(s): Christian Förtsch (LMU München), Janina Klemm (LMU München)
Diskutant(en): Thilo Kleickmann (Christian-Albrechts-Universität zu Kiel)
Ein zentrales Problem des Biologieunterrichts stellt die große Menge an isolierten Fakten dar (Wadouh et al., 2014), weshalb
2005 die drei Basiskonzepte System, Struktur und Funktion und Entwicklung im Rahmen der Bildungsstandards für das Fach
Biologie eingeführt wurden (KMK, 2005). Sie haben zum Ziel, biologische Fachinhalte zu strukturieren, miteinander zu verknüpfen
und so langfristig den Erwerb von konzeptuellem Wissen zu fördern (KMK, 2005). Basiskonzepte können dabei als grundlegende
biologische Ideen, die in verschiedenen Kontexten angewendet werden können, verstanden werden (Kauertz et al., 2010; Wood,
2008). Aus konstruktivistischer Sicht spielt das Anknüpfen an Vorwissen und Präkonzepten der Schülerinnen und Schüler (SuS)
eine entscheidende Rolle zum Aufbau von konzeptuellem Wissen (Duit, 1995; Mayer, 2004, 2009; Möller, 2002). Gemäß
theoretischer Lehr-Lern-Modelle werden sowohl der Unterricht, als auch das fachspezifische Professionswissen von Lehrkräften
als Einflussfaktor für Lernen von SuS gesehen (Helmke, 2014; Kunter et al., 2013). Erste Ansätze für die Gestaltung eines
basiskonzeptorientierten Unterrichts existieren bereits (Neuhaus et al., 2014; Schmiemann et al., 2012), wurden allerdings noch
nicht empirisch überprüft. Wadouh et al. (2014) konnten aber bereits zeigen, dass eine hohe Vernetzung im Biologieunterricht
Schülerleistung fördert. Die Relevanz des fachdidaktischen Wissens für das Lernen von SuS wurde hingegen bereits in einigen
Studien gezeigt (Fennema et al., 1996; Lange et al., 2015), wohingegen der Einfluss des Fachwissens noch empirisch
ungesichert ist (Lange et al., 2015; Ohle et al., 2011).
Dieses Symposiums fokussiert daher auf die Messung von konzeptuellem Verständnis bei SuS und Identifikation von
Einflussfaktoren auf Unterrichts- und Lehrerebene. Die enthaltenen Teilprojekte diskutieren diese Fragestellung im Hinblick auf
verschiedene Altersgruppen. Wenn auch nicht die gesamte Lebensspanne abgedeckt werden kann, so wird doch versucht, mit
Studien aus dem Vorschul-, Grundschul- und Sekundarstufenbereich einen möglichst breiten Blick auf das Thema zu
ermöglichen.
Der erste Beitrag fokussiert auf die Entwicklung biologischer Konzepte im Vorschulalter, speziell Struktur und Funktion, und
untersucht den Zusammenhang mit dem frühkindlichen Animismus. Der zweite Beitrag untersucht, ob sich das
Konzeptverständnis von Grundschülern durch basiskonzeptorientierten Heimat- und Sachunterricht fördern lässt. Die weiteren
beiden Beiträge beziehen sich auf SuS der Sekundarstufe. Während der dritte Beitrag speziell das Systemdenken der SuS und
Einflüsse des fachspezifischen Professionswissens der Lehrkraft betrachtet, beleuchtet der vierte Beitrag den Einfluss des
fachspezifischen Professionswissens auf die Konzeptorientierung im Unterricht und dessen Effekt auf die Schülerleistung.
Die Ergebnisse der Einzelbeiträge werden theoretisch eingeordnet und ihre Praxisrelevanz diskutiert. Hierbei profitiert das
Symposium von der interdisziplinären Zusammensetzung aus Biologiedidaktik, Psychologie sowie einem Diskutanten aus der
Schulpädagogik.
Beiträge des Symposiums
Biologisches Konzeptwissen von Vorschulkindern und Zusammenhang mit dem Verständnis von Leben
Janina Klemm, Beate Sodian, Lucia Kohlhauf, Birgit J. Neuhaus
LMU München
Während Chemie- und Physikunterricht häufig so gestaltet wird, dass er grundlegende Konzepte des Faches vermittelt, herrscht
in der Biologie häufig nach wie vor die Vermittlung einzelner Fakten vor. Grundlegende Konzepte werden häufig nur unzureichend
vermittelt und verstanden. Mit Einführung der Bildungsstandards für Biologie (KMK, 2005) wurde der Ruf nach einem
konzeptorientierten Biologieunterricht immer lauter. Grundlegende Konzepte sollen zum Teil bereits in der Grundschule vermittelt
werden (Bayrisches Staatsministerium für Unterricht und Kultus, 2000). Unterricht, der grundlegende Konzepte eines Faches
gemeinsam mit den Schülern entwickelt, sollte nach Möller (2002) an Vorwissen und Präkonzepte anknüpfen. Es stellt sich daher
die Frage, mit welchen grundlegenden biologischen Konzepten die Kinder bereits in die Grundschule kommen.
Piaget (1929) stellte fest, dass Kinder Probleme haben mit der Unterscheidung zwischen Belebtem und Unbelebtem, und nahm
an, dass dieser Animismus auf ein mangelndes Verständnis von Kausalzusammenhängen zurückzuführen ist. In weiteren
Unteruchungen konnte bestätigt werden, dass jüngere Kinder Probleme mit dem Zuordnen zu Lebendig/nicht lebendig haben,
insbesondere bei Pflanzen und Naturerscheinungen (Pauen, 1997). Inagaki und Hatano (2004) sprechen nicht mehr von
Animismus als falschem Verständnis, sondern vom Vitalismus als Konzept, das sich im Vorschulalter entwickelt und ein
funktionales Verständnis von körperlichen Prozessen ermöglicht. Es konnte gezeigt werden, dass das kindliche Verständnis von
Belebt-Unbelebt mit dem Verständnis von Funktionen von körperlichen Organen einhergeht (Zaitchik, Iqbal, & Carey, 2014).
Dieses Verständnis kann als eine Teilkompetenz vom Basiskonzept der Biologie Struktur und Funktion verstanden werden, deckt
dieses aber keinesfalls ganz ab, da es sich lediglich auf den menschlichen Körper bezieht. Zum Struktur-Funktions-Verständnis
von Vorschulkindern bei Tieren und Pflanzen gibt es bisher keine Untersuchungen.
Fragestellung
Haben Vorschulkinder ein allgemeines Verständnis des Basiskonzepts Struktur und Funktion? Inwieweit hängt dieses mit dem
Verständnis der Unterscheidung Belebt-Unbelebt zusammen?
Methode
In der Studie wurden 74 Kinder im letzten Kindergartenjahr aus 5 verschiedenen Kindergärten getestet. Die Stichprobe setzt sich
aus 35 weiblichen und 38 männlichen Teilnehmern, der Altersdurchschnitt lag zum Zeitpunkt der Testung bei 5;6 Jahren.
Zur Untersuchung des Verständnis für den Begriff des Lebendigen wurde ein Animismusinterview (Zaitchik, Iqbal und Carey,
2014) verwendet. In diesem beurteilen die Kinder für verschiedene Tiere, Pflanzen, Gegenstände und Naturphänomenem, ob
diese lebendig sind oder nicht und müssen manche ihrer Einschätzungen zusätzlich begründen.
Zur Untersuchung des Verständnis der Probanden für Struktur- und Funktionszusammenhänge biologischer Phänomene wurde
ein Struktur-Funktions-Wissenstest entwickelt. Dieser besteht aus neun verschiedene Problemstellungen mit Bildkarten, zu
denen je eine Multiple Choice Frage oder Zuordnungsfragen und anschließende Begründung abgefragt wurden. Inhaltlich bezieht
sich der Test auf Phänomene aus der Tier- und Pflanzenwelt, sowie auf den menschlichen Körper.
Ergebnisse
Insgesamt beantworteten die Kinder im Struktur-Funktions-Wissenstest im Mittel 49% der Fragen richtig, wobei sich die
Begründungen (29% richtige Antworten) als schwieriger erwiesen als die geschlossenen Antwortformate (68%). Die beiden
Subskalen geschlossene Antworten und Begründungen korrelieren mittelstark miteinander (r (74) = .54, p > .001).
Wenn die Kinder die Begründungsfrage falsch beantworteten, lag dies an den folgenden Arten der Antworten: keine Antwort
(14%), Wiederholung der Frage als Antwort (3%), kein Bezug zur Frage (23%), Vorwissen als Begründung (15%), affektive
Interpretation (3%), nicht ausreichend deutliche Begründung (9%).
Es konnte kein Zusammenhang zwischen dem kindlichen Verständnis der Unterscheidung belebt-unbelebt und dem StrukturFunktions-Verständnis gefunden werden (r (72) = .22, p > .05), aber mit der Subskala der Begründungen (r (72) = .28, p < .05).
Diskussion
Die Ergebnisse sprechen dafür, dass Vorschulkinder erste Präkonzepte in Richtung eines Verständnisses von StrukturFunktions-Zusammenhängen haben. Die falschen Antworten deuten dagegen darauf hin, dass Vorwissen ein hemmender Faktor
sein kann, diese zu aktivieren. Der erwartete Zusammenhang mit dem kindlichen Verständnis von Belebt-Unbelebt konnte
gefunden werden.
Biologisches Konzeptverständnis im Heimat- und Sachunterricht der Grundschule
Nina Kümpel, Birgit J. Neuhaus
LMU München
Theoretischer Hintergrund & wissenschaftliche Fragestellung
Die Basiskonzepte der Bildungsstandards für das Fach Biologie (KMK, 2005) sollen der Förderung eines Konzeptverständnisses
dienen, indem sie die fachlichen Inhalte im Sinne eines kumulativen Lernens miteinander vernetzen, das Fachwissen
strukturieren und ein konzeptuelles Wissen aufbauen (Nachreiner et al., 2015; Neuhaus et. al. 2014; Schmiemann et al., 2012).
Das Kompetenzmodell des Projekts Evaluation der Standards in den naturwissenschaftlichen Fächern der Sekundarstufe I
(ESNaS; Kauertz et al., 2010) beschreibt im Bereich der Komplexität fünf Niveaustufen: Niveau I: 1 Fakt, Niveau II: 2 Fakten,
Niveau III: 1 Zusammenhang, Niveau IV: 2 Zusammenhänge und Niveau V: übergeordnetes Konzept. Basiskonzepte lassen sich
als übergeordnete Konzepte beschreiben und der höchsten Komplexitätsstufe zuordnen. Konzeptuelles Wissen umfasst
demnach nicht nur das Wissen von Fakten, sondern vor allem auch das Wissen von Zusammenhängen und Konzepten (de Jong
& Ferguson-Hessler, 1996; Hiebert & Lefevre, 1986).
Durch den Einsatz von Kontexten in den naturwissenschaftlichen Unterricht, welche der Verknüpfung von fachlichen und nichtfachlichen Inhalten dienen (Haugwitz, 2009), soll vernetztes und anschlussfähiges Wissen aufgebaut und die Anwendbarkeit des
Wissens gefördert werden (Schmiemann et al., 2011; Van Vorst et al., 2014).
Um Konzeptverständnis schon früh anzubahnen, soll in dieser Studie basiskonzept- und kontextorientierter Heimat- und
Sachunterricht entwickelt und dessen Wirksamkeit empirisch überprüft werden. In einer Interventionsstudie soll untersucht
werden, ob der Einsatz von Basiskonzepten (_Struktur und Funktion, Entwicklung, System_) und problemorientierten Kontexten
das Konzeptverständnis der Schülerinnen und Schüler im Heimat- und Sachunterricht fördert.
Methode
Die Interventionsstudie fand in einem unvollständigem 2*2-Design statt, bei der nach Basiskonzept- und Kontextorientierung
variiert wurde. Dazu wurden drei 6-stündige basiskonzept- und kontextorientierte Unterrichtseinheiten in drei verschiedenen
Varianten (I: Kontrollgruppe, II: basiskonzeptorientierter Unterricht und III: basiskonzeptorientierter Unterricht angereichert mit
problemorientierten Kontexten) entwickelt und der Einfluss der drei verschiedenen Treatments auf das Konzeptverständnis der
Lernenden untersucht.
In der zweiten Jahrgangsstufe nahmen 350 Schülerinnen und Schüler von sechs verschiedenen Grundschulen teil (I: n=115; II:
n=116; III: n=119).
Die Leistung der Schüler wurde mittels Leistungstest im Prä-Post-Design (NPrä = 35, NPost = 42) erhoben. Beide Tests enthielten
drei Skalen zu Faktenwissen (α = 0,63), Zusammenhangswissen (α = 0,78) und Konzeptwissen (α = 0,78). Etwa zehn Prozent
der Prä- und Posttests wurden zweitkodiert (κ > 0.83).
Die Unterschiede zwischen den drei Treatments wurden mittels ANOVA mit anschließenden Post-Hoc-Tests ermittelt
(Bonferroni). Der Prätest wurde berücksichtigt, die Auswertung erfolgte mit den Residuen.
Ergebnisse und Diskussion
In der zweiten Jahrgangsstufe zeigen sich signifikante Unterschiede hinsichtlich des Zusammenhangs- und Konzeptwissens
zwischen der Kontrollgruppe und den Treatments Basiskonzept und Basiskonzept und Kontext. Sowohl bei der Skala
Zusammenhang als auch bei der Skala Konzept ist das Wissen bei Treatment II und III signifikant höher als bei der Kontrollgruppe
(Zusammenhangswissen: F (90, 348) = 60.81; p < .001; η2 = .26, Konzeptwissen: F (61, 348) = 36.67; p < .001; η2 = .17). Im
Erwerb des Faktenwissens zeigen sich keine Unterschiede zwischen den Treatments (Faktenwissen: F(0, 348) = 0.09; p = .91).
Die Unterschiede zwischen dem Treatment Basiskonzept und Basiskonzept und Kontext sind nicht signifikant
(Zusammenhangswissen: p = 1.0; Konzeptwissen: p = .34 (Bonferroni)). Der Kontext zeigt demnach keine zusätzliche Wirkung.
Die Ergebnisse der Interventionsstudie zeigen, dass sich der Einsatz von Basiskonzepten und Kontexten positiv auf das
Konzeptverständnis der Schülerinnen und Schüler auswirkt. Die Studie wurde auch in der dritten (n=355) und in der vierten
Jahrgangsstufe (n=252) durchgeführt, um die Ergebnisse zu replizieren. Weiterhin zu prüfen ist der Einfluss auf leistungsstarke
und leistungsschwache sowie auf weibliche und männliche Schülerinnen und Schüler.
Der evaluierte Unterricht stellt einen ersten Ansatz dar, wie Heimat- und Sachunterricht basiskonzept- und kontextorientiert
geplant werden kann und wo Probleme und Chancen für Lernende in der Grundschule bestehen.
Die Bedeutung des fachbezogenen Professionswissens von Lehrkräften für das konzeptuelle
Verständnis biologischer Systeme von Schülerinnen und Schülern
Daniela Mahler, Jörg Großschedl, Ute Harms
IPN Kiel
Theoretischer Hintergrund
Das fachbezogene Professionswissen der Lehrkraft wird als Bedingungsfaktor für die Instruktionsqualität und den Lernprozess
von Schülerinnen und Schülern (SuS) gesehen (z. B. Baumert et al., 2010). Das fachbezogene Professionswissen setzt sich aus
den Domänen Fachwissen (CK) und fachdidaktisches Wissen (PCK) zusammen. CK beinhaltet das Wissen über Fakten,
Konzepte und Strukturen eines Faches. PCK beschreibt das Wissen, das nötig ist, um fachliche Inhalte zu vermitteln (Shulman,
1986). Viele Studien konnten zeigen, dass das PCK relevant für das Lernen von SuS ist (z. B. Lange et al., 2015; Fennema et
al., 1996). Unklar scheint hingegen die Rolle des CK. Obwohl viele Autoren CK als Bedingungsfaktor für das Lernen beschreiben
(z. B. Hill et al., 2007; Ma, 1999), konnten empirische Studien diesen Zusammenhang nicht nachweisen (z. B. Lange et al., 2015;
Ohle, Fischer & Kauertz, 2011). Unsere Studie untersucht den Zusammenhang zwischen dem fachbezogenen Professionswissen
von Biologielehrkäften und dem Lernen von SuS. Es wird ein spezieller Bereich des Lernens betrachtet: das Systemdenken.
Systemdenken ist ein etabliertes Konstrukt in der Lehr-Lernforschung mit Bezug zum Biologieunterricht (Brandstädter, Harms &
Großschedl, 2012; Sommer & Lücken, 2010) und Geographieunterricht (z. B. Rempfler & Uphues, 2012), da in diesen Fächern
der Umgang mit Systemen elementar ist. Konkret auf den Lernprozess von SuS bezogen kann Systemdenken als konzeptuelles
Verständnis (biologischer) Systeme verstanden werden. Systemdenken beschreibt i.e.S. die Fähigkeit, Systeme als
Funktionseinheit ihrer Elemente zu begreifen sowie die Stabilität eines Systems als abhängig von den Beziehungen zwischen
seinen Elementen zu verstehen (Assaraf & Orion, 2005).
Fragestellung
Welchen Einfluss haben das CK und das PCK von Lehrkräften auf die Entwicklung des Systemdenkens seitens der SuS?
Methode
An der Studie nahmen 134 Biologielehrkräfte (Alter: M=43,7 Jahre (SD=10,3), 75,4% weiblich) teil, davon 41 Lehrkräfte mit ihren
Klassen (N=1036 SuS, Alter: M=13,5 Jahre (SD= 0,72), 49,4% weiblich). Das fachbezogene Professionswissen (CK: 19 Items,
α=,68; PCK: 9 Items, α=,79) sowie das Systemdenken (26 Items, α=,76) wurden mit Fragebögen zu einem biologischen
Inhaltsbereich (Ökosystem Wattenmeer) und zu grundlegendem Wissen über Systeme (z. B. Ursache-Wirkungs-Beziehungen)
erhoben. Zusätzlich wurde das Systemdenken mit Concept Maps erfasst. Um zu untersuchen, ob CK und PCK als eigenständige
Prädiktoren betrachtet werden können, wurde ihre empirische Separierbarkeit im Rahmen einer Rasch-Analyse überprüft. Um
zu untersuchen, ob CK und PCK prädiktiv für das Systemdenken sind, wurde ein Mehrebenen-Strukturgleichungsmodell
spezifiziert, in dem die Fähigkeit der SuS im Systemdenken nach dem Doubly-Latent Modell von Marsh et al. (2009) auf Lehrerund Schülerebene latent modelliert wurde. Als Indikatoren für diese latente Variable fungieren dabei die Ergebnisse des
Fragebogens zum Systemdenken sowie die der Concept Maps. Zusätzlich wurden die kognitiven Fähigkeiten und das Vorwissen
im Bereich Systemdenken als Kontrollvariablen auf Schülerebene eingesetzt.
Ergebnisse
Die Überprüfung der Separierbarkeit bestätigt, dass es sich bei CK und PCK um empirisch trennbare Konstrukte handelt
(eindimensionales Modell: AIC=5913,97, CAIC=6097,17, BIC=6050,17; zweidimensionales Modell: AIC=5813,22,
CAIC=6004,22, BIC=5955,22; χ²-Differenztest: χ²(2)=104,75, p<,001), die korrelieren (r=,48, p<,001). CK und PCK werden
folglich als eigenständige Prädiktoren in das Mehrebenen-Strukturgleichungsmodell eingesetzt. Die Ergebnisse zeigen keinen
signifikanten Zusammenhang zwischen CK und dem Systemdenken der SuS (β=,17, p=,36), jedoch einen signifikant positiven
Zusammenhang zwischen PCK und dem Systemdenken der SuS (β=,31, p=,04). Das PCK der Biologielehrkraft stellt also einen
Prädiktor für das Systemdenken der SuS dar.
Fazit
Die Ergebnisse unterstützen die Relevanz einer biologiedidaktischen Lehreraus- und Lehrerfortbildung bezüglich des
Systemdenkens. Die Bedeutung des PCK konnte in dieser Studie allerdings nur für dieses Konstrukt gezeigt werden.
Replikationsstudien sind in Vorbereitung.
Förderung der Schülerleistung durch einen konzeptorientierten Biologieunterricht - Einfluss des
Professionswissens
Sonja Werner, Christian Förtsch, Lena von Kotzebue, Birgit J. Neuhaus
LMU München
Theoretischer Hintergrund
Die 2005 eingeführten Bildungsstandards für die naturwissenschaftlichen Fächer beschreiben u.a. den Kompetenzbereich
Fachwissen (KMK, 2005). Innerhalb des Fachwissens wurden biologiespezifische Basiskonzepte definiert, die zur Strukturierung
des Unterricht und Förderung des konzeptuellen Wissens genutzt werden können (Beyer, 2006; Neuhaus et al., 2014).
Basiskonzepte lassen sich gemäß dem Kompetenzmodell von ESNaS in der Dimension Komplexität als übergeordnete
wissenschaftliche Ideen beschreiben (Kauertz et al., 2010; Kremer et al., 2012). Bisher existieren allerdings nur wenige Ansätze
zur Umsetzung eines konzeptorientierten Unterrichts (Neuhaus et al., 2014; Schmiemann et al., 2012). Gemäß Förtsch et al.
(eingereicht) und Nachreiner et al. (2015) bezieht sich konzeptorientierter Unterricht auf Elemente allgemein psychologischer
Theorien und biologiespezifischer Unterrichtsqualitätsmerkmale. Dabei spielt aus konstruktivistischer Sicht das Vorwissen der
Schülerinnen und Schüler (SuS) eine zentrale Rolle, da neues Wissen aktiv, basierend auf bereits Bekanntem, konstruiert wird
(Duit, 1995, Mayer, 2004, 2009). Zudem ist die Aktivierung von Vorwissen eine Bedingung für einen erfolgreichen Konzeptaufbau
basierend auf der Conceptual-Change-Theorie (Özdemir & Clark, 2007) und eine erfolgreiche Vernetzung im Unterricht (Förtsch
et al., eingereicht; Lipowsky et al., 2009; Wadouh et al., 2014). Laut dem Fragmentierungsansatz werden vorunterrichtliche
Vorstellungen als Ansammlung unverbundener Wissenselemente gesehen. Durch Aufzeigen von Beziehungen kann ein
wissenschaftlichen Konzept erreicht werden (diSessa et al., 2004). Für den Biologieunterricht konnte bereits gezeigt werden,
dass ein höherer Vernetzungsgrad die Schülerleistung fördert (Wadouh et al., 2014). Erste Ergebnisse zur Steigerung der
Schülerleistung durch einen konzeptorientierten Biologieunterricht konnten bereits von Förtsch et al. (eingereicht) gezeigt
werden. Theoretische Lehr-Lern-Modelle gehen zudem davon aus, dass die professionelle Handlungskompetenz einer Lehrkraft
die Unterrichtsqualität und folglich die Leistung ihrer SuS beeinflusst (Kunter et al., 2011; Helmke, 2014). Einen Teil der
professionellen Handlungskompetenz stellt das Professionswissen dar, welches sich u.a. in die fachspezifischen Dimensionen
Fachwissen (FW) und fachdidaktisches Wissen (FDW) unterteilen lässt (Kunter et al., 2011). Welchen Einfluss das
fachspezifische Professionswissen einer Lehrkraft auf einen konzeptorientierten Unterricht hat ist allerdings noch unklar.
Fragestellungen
Welche Rolle spielt das fachspezifische Professionswissen für einen konzeptorientieren Biologieunterricht? Welchen Einfluss hat
ein konzeptorientierter Biologieunterricht auf die Schülerleistung?
Methode
Die Studie wurde im Rahmen des BMBF-finanzierten Projekts ProwiN durchgeführt. Es nahmen 43 Biologielehrkräfte (Alter
M=35,3 Jahre, SD=8,0; 60,5% weiblich) des bayerischen Gymnasiums mit ihren Klassen der 9. Jahrgangsstufe (N=1138 SuS,
50,0% weiblich) teil. Pro Lehrkraft wurden zwei Stunden zum Themenbereich Neurobiologie videografiert (N=85 Videos). Das
fachspezifische Professionswissen der Lehrkräfte wurde mittels eines Paper-Pencil-Test mit vorwiegend offenen Fragen
gemessen (Jüttner et al., 2013) und anschließend unter Verwendung des Partial-Credit-Modells Rasch-skaliert (FW: 12 Items;
FDW: 9 Items) und wiesen zufriedenstellende fit-Werte auf (alle Infit/Outfit-MNSQ≤1,5; Personenreliabilität: 0,53 (FDW); 0,73
(FW); Itemreliabilität: 0,96 (FDW); 0,99 (FW)). Der Schülerleistungstest wurde im Prä-Post-Design eingesetzt (Prätest: 18 Items,
Posttest: 22 Items) und ebenfalls Rasch-skaliert. Die Items zeigten gute fit-Werte (alle Infit/Outfit-MNSQ≤1,3). Personen- (Prätest:
0,63; Posttest: 0,78) und Itemreliabilitäten (Prätest/Posttest: 1,00) wiesen ebenfalls zufriedenstellende Werte auf.
Unterrichtsvideos wurden mittels eines theoriebasierenden Ratingmanuals kodiert (23 Items; α=0,95; κ=0,67). Zur Beantwortung
der Fragestellungen wurden multiple lineare Regressionsmodelle, sowie Mehrebenenpfadmodelle berechnet.
Ergebnisse
FDW konnte als signifikanter Prädiktor für einen konzeptorientierten Biologieunterricht identifiziert werden (β=0,26, p=0,046,
R²=0,07). Ergebnisse des Mehrebenenpfadmodells (χ²(2)=2,52, p=0,284; CFI=0,996, RMSEA=0,018, SRMR(within)=0,000,
SRMR(between)=0,074) zeigten auf der Klassenebene einen tendenziell positiven Effekt des FDW auf einen konzeptorientieren
Unterricht (β=0,25, p=0,094, R²=0,06), welcher wiederum einen positiven Einfluss auf die Schülerleistung im Posttest aufwies
(β=0,36, p=0,020, R²=0,13). Auf Schülerebene wurden die Leistung im Prätest und die Anstrengungsbereitschaft der SuS
kontrolliert.
Fazit
Unsere Ergebnisse bestätigen erste empirische Hinweise, wonach ein konzeptorientierter Biologieunterricht zu einer höheren
Lernleistung der SuS führt. Zudem konnte gezeigt werden, dass ein höheres FDW der Lehrkraft die Konzeptorientierung im
Unterricht fördert. Daher scheint die Integration von Konzeptorientierung in die universitäre Lehrerausbildung, sowie in
Lehrerfortbildungen sinnvoll.
ID: 240
Symposium
Disziplinen-Cluster: Didaktiken der Naturwissenschaften und Technik
Thematisches Cluster: Bildung im Sekundarbereich, Kompetenzdiagnostik/ Kompetenzentwicklung, Mathematischnaturwissenschaftlicher Unterricht
Stichworte: Kontexte, Interesse, Testaufgaben, Lernaufgaben, Naturwissenschaften
Kontexteinflüsse auf die Schwierigkeit von (Test-)Aufgaben in den Naturwissenschaften
Chair(s): Maik Walpuski (Universität Duisburg-Essen)
Diskutant(en): Hans Anand Pant (Humboldt Universität zu Berlin)
Der Kompetenzbegriff ist zur Beschreibung der Ziele und Ergebnisse schulischer Bildung zentral (Klieme & Hartig, 2008).
Kompetenzen werden dabei als „kontextspezifische kognitive Leistungsdispositionen [aufgefasst], die sich funktional auf
Situationen und Anforderungen in bestimmten Domänen beziehen“ (Klieme & Leutner, 2006, S. 879).
In diesem Symposium wird aus der Perspektive der drei naturwissenschaftlichen Fächer Biologie, Chemie und Physik beleuchtet,
wie sich Kontextmerkmale auf die Leistungen von Schülerinnen und Schülern in Lern- und Testsituationen auswirken. Am Beispiel
des Fachs Chemie wird in der ersten Studie „Der Einfluss systematisch variierter Kontexte auf affektive und kognitive
Schülerfaktoren“ untersucht, inwiefern sich die drei Variablen Kontextmerkmal, Fachinhalt und Problemorientierung auf das
situationale Interesse sowie die Lernleistung und die kognitive Belastung von Lernenden auswirken.
Während im Rahmen von Lernaufgaben meist versucht wird, den positiven Einfluss interessanter Kontexte zu nutzen, wird der
Einfluss von Kontexten auf Testaufgaben häufig vernachlässigt, obwohl viele Leistungstestaufgaben kontextualisiert eingesetzt
werden. Der mögliche Einfluss solcher Kontextualisierungen wird zunächst fachspezifisch für die Fächer Biologie und Physik in
den Vorträgen „Motivationale Effekte der Kontextualisierung von Testaufgaben zum ethischen Bewerten“ und
„Kompetenzanforderungen kontextualisierter Problemlöseaufgaben“ vorgestellt. In beiden Fällen zeigt sich ein Einfluss der
Kontexte auf die Schülerleistungen. Für die Aufgaben zum ethischen Bewerten im Fach Biologie lässt sich eine unterschiedliche
Interessantheit und wahrgenommene Relevanz der Kontexte nachweisen. Eine positive Einschätzung der Kontextmerkmale ist
dabei mit der gemessenen Personenfähigkeit korreliert. Ähnliches zeigt sich für die Problemlöseaufgaben im Fach Physik. Auch
hier hängt die Kontextualisiertheit der Aufgaben positiv mit der gemessenen Schülerkompetenz zusammen.
Das vierte hier vorgestellte Forschungsprojekt strebt einen Vergleich zwischen Kompetenzbereichen (Fachwissen und
Bewertung) und zwischen Fächern (Biologie und Chemie) an. Hier wurden zu identischen Kontexten Leistungstestaufgaben
jeweils für beide Fächer und beide Kompetenzbereiche konstruiert. Weitere Aufgabenmerkmale (Aufgabenformat, Komplexität)
wurden konstant gehalten. Hier konnten innerhalb der Fächer Unterschiede in der Interessantheit der Kontexte nachgewiesen
werden, nicht aber in der Schwierigkeit. Ergebnisse aus dem Vergleich zwischen den Kompetenzbereichen und zwischen den
Fächern werden bis zur Tagung vorliegen.
Insgesamt lässt sich festhalten, dass auf Grundlage der hier untersuchten Aufgaben angenommen werden kann, dass sich
Kontextmerkmale von Aufgaben auf die Performanz von Schülerinnen und Schülern in Lern- und Leistungssituationen auswirken.
Für die Interpretation der Ergebnisse sollten daher affektive Merkmale aufgabenbezogen kontrolliert werden.
Beiträge des Symposiums
Der Einfluss systematisch variierter Kontexte auf affektive und kognitive Schülerfaktoren
Sebastian Habig, Helena van Vorst, Elke Sumfleth
Universität Duisburg-Essen
*Ausgangslage*
Die Bedeutung von Interesse für den erfolgreichen Verlauf schulischer Lernprozesse ist bereits bekannt. Deshalb ist der starke
Rückgang des Interesses im Verlauf der Schulzeit in den naturwissenschaftlichen Fächern bedenklich (Potvin & Hasni, 2014).
Um dieser Entwicklung entgegen zu wirken, werden vermehrt lebensweltliche Kontexte in den naturwissenschaftlichen Unterricht
integriert. Evaluationsergebnisse des Kontexteinsatzes belegen einen positiven Einfluss auf affektive Schülerfaktoren (Ültay &
Çalık, 2012), während die Effekte hinsichtlich kognitiver Schülermerkmale noch nicht hinreichend geklärt wurden (Bennett,
Lubben, & Hogarth, 2007). Eine nähere Betrachtung der Ergebnisse macht zudem deutlich, dass die Effekte vom verwendeten
Kontext abhängen (Fechner, 2009; Sjøberg & Schreiner, 2010).
_Kontextmerkmale_
Van Vorst und Kollegen haben aus einer Analyse der Kontextliteratur einen Vorschlag für ein Merkmalsmodell zur Klassifizierung
von Kontexten abgeleitet (van Vorst et al., 2014). Von besonderer Bedeutung für die hier vorgestellte Studie ist das Merkmal
_Alltagsbezug_, das Gegenstände oder Situationen aus der unmittelbaren Lebenswelt der Schülerinnen und Schüler meint
(Bennett, 2003; Campbell & Lubben, 2000), mit denen sie vertraut sind (Kunkel-Razum, Scholze-Stubenrecht, & Wermke, 2007).
Dem gegenüber steht das Merkmal _Besonderheit_, welches außergewöhnliche Gegenstände oder Situationen außerhalb der
unmittelbaren Lebenswelt beschreibt (Kasanda et al., 2005). Darüber hinaus können Kontexte das gegenwärtige Zeitgeschehen
aufgreifen, welches sich meist in der medialen Berichterstattung widerspiegelt, und die damit eine gewisse _Aktualität_ aufweisen
(Just, 2001).
Van Vorst (2013) hat den Einfluss der drei Kontextmerkmale _Alltagsbezug_, _Besonderheit_ und _Aktualität_ auf das
situationale Schülerinteresse untersucht. Sie ließ Schülerinnen und Schüler der Jahrgangsstufe 9 an Gymnasien ihr situationales
Interesse an Kontexten zum Inhaltsbereich Organische Chemie mithilfe eines Fragebogens bewerten. Ihre Ergebnisse zeigen,
dass besonderen Kontexten eine signifikant höhere emotionale Valenz zugeschrieben wird als alltäglichen Kontexten. Das
Merkmal _Aktualität_ hat hingegen keinen Einfluss auf die Kontextbewertung. Eine signifikant höhere wertbezogene Valenz
wurde Kontexten mit einer Kombination der Merkmale _Besonderheit_ und _Aktualität_ zugesprochen. Der Einfluss der
Kontextmerkmale auf die Lernleistung der Schülerinnen und Schüler wurde bisher nicht untersucht.
Auch der chemische Inhalt hat einen Einfluss auf den Effekt eines Kontextes (Kölbach, 2011). Kontextorientiertes Lernen geht
häufig mit einer problemorientierten Aufgabenstellung einher. Ergebnisse von Harbach (2013) legen nahe, dass dies mit höherer
kognitiver Belastung der Lernenden verbunden ist, was den Effekt kontextorientierten Lernens beeinflussen kann.
*Forschungsfragen und Methodik*
Aufgrund der beschriebenen Ausgangslage wird in der vorgestellten Studie die Frage nach dem Einfluss der drei Variablen
Kontextmerkmal, Fachinhalt und Problemorientierung auf das situationale Interesse sowie die Lernleistung und die kognitive
Belastung von Lernenden untersucht. Dazu werden die drei unabhängigen Variablen in einem 2x2x2-Design systematisch
miteinander variiert und zu jeder Kombinationsmöglichkeit gezielt Lernaufgaben konstruiert. Für jeden Aufgabentyp werden drei
45-minütige Lerneinheiten auf der Grundlage einer Experimentierbox entwickelt und ihr Effekt auf die oben genannten Faktoren
untersucht. Dazu wird eine Interventionsstudie im Prä-Post-Follow up-Design in der Jahrgangsstufe 9 mit etwa 400 Schülerinnen
und Schüler am Gymnasium durchgeführt.
In einer Vorstudie wurde die Merkmalszugehörigkeit von Kontexten zu den chemischen Inhalten Säure/Base und RedOx ermittelt,
sodass nur Kontexte mit eindeutiger Merkmalszugehörigkeit für die Hauptstudie ausgewählt wurden. Gleichzeitig wurden erste
Daten zum situationalen Interesse an diesen Kontexten erhoben.
*Ergebnisse*
Ergebnisse zu den Einflüssen der drei Variablen Merkmal, Fachinhalt und Problemorientierung auf das situationale Interesse,
die Lernleistung und kognitive Belastung werden auf der GEBF-Tagung im März präsentiert. Erste Ergebnisse der
Voruntersuchung bestätigen bereits, dass sich die wertbezogene und emotionale Valenz von Kontexten in Abhängigkeit des
zugrundeliegenden Merkmals unterscheiden.
Es kann angenommen werden, dass außergewöhnliche Kontexte eher die Neugier wecken und damit zu höherer emotionaler
Valenz führen. Alltägliche Kontexte hingegen scheinen aufgrund des lebensweltlichen Bezugs für Schülerinnen und Schüler
persönlich bedeutsamer zu sein. Unabhängig vom Kontextmerkmal bewerten Schülerinnen und Schüler die emotionale Valenz
höher als die wertbezogene Valenz.
Motivationale Effekte der Kontextualisierung von Testaufgaben zum ethischen Bewerten
Julia Schwanewedel1, Melanie Werner2, Jürgen Mayer2
1
IPN an der Universität Kiel, 2Universität Kassel
*Theoretischer Hintergrund*
Die Fähigkeit naturwissenschaftliche Sachverhalte in verschiedenen Kontexten erkennen und bewerten zu können ist ein
bedeutsames Element naturwissenschaftlicher Bildung (KMK, 2004). Entsprechende Kompetenzen werden in den
Bildungsstandards für den naturwissenschaftlichen Unterricht im Bereich „Bewertung“ beschrieben und sollen im Rahmen von
ländervergleichenden Test gemessen werden (Hostenbach, 2011).
Die entsprechenden Testausgaben sind kontextualisiert, d.h. der naturwissenschaftliche Fachinhalt (Tiefenstruktur) ist in eine
lebensweltliche Anbindung (Oberflächenstruktur) eingebettet (Löffler & Kauertz, 2014). Somit dienen die Kontexte der
Testaufgaben als Ausgangspunkte für die zu messende Bewertungskompetenz der Schülerinnen und Schüler. In der
vorliegenden Arbeit werden Bewertungskontexte in Anlehnung an Lee und Grace (2012) als Anwendungssituationen verstanden,
die biologische Themen beinhalten und zudem ethisch relevante Problemstellungen aufwerfen. Vier Kontexte mit
entsprechendem Bezug zu bioethischen Bewertungsfragen wurden ausgewählt: Tierhaltung (Tierethik), Umwelt & Nachhaltigkeit
(Umweltethik), Medizin (Medizinethik) und Gesundheit (Sozialethik).
Dabei können Kontexte zum einen ein schwierigkeitsinduzierendes Merkmal sein (Sadler & Zeidler, 2004), zum anderen können
sie auf Grund ihrer motivationalen Wirkung Testleistungen positiv beeinflussen (Drechsel et al., 2011). Um die potentiellen
motivationalen Effekte eines Kontextes zu erfassen wurden Interessantheit, Bekanntheit, die gesellschaftliche- und persönliche
Relevanz als relevante Kontext-Valenzen definiert. Diese beschreiben motivationale Relationen zwischen Person und Kontext,
die eine Handlung oder Leistung positiv (positive Valenz), negativ (negative Valenz) oder ambivalent beeinflussen können.
*Fragestellung*
Es wurden die folgenden zentralen Forschungsfragen untersucht:
(1) Welchen Einfluss haben Kontexte auf die Schwierigkeit von naturwissenschaftlichen Testaufgaben zum Kompetenzbereich
Bewerten?
(2) Unterscheiden sich unterschiedliche Kontexte im Bezug auf ihre motivationalen Anregung (Kontext-Valenzen)?
(3) Welchen Einfluss haben die Kontext-Valenzen Interessantheit, Bekanntheit, gesellschaftliche- und persönliche Relevanz auf
die Testleistung zur Bewertungskompetenz?
*Methode*
Die Bewertungskompetenz von Schülerinnen und Schülern (9./10. Jahrgang) wurde in einer Vor- und Hauptstudie (N = 252, N =
742) durch ein aufgabenbasiertes paper-pencil Testinstrument (187 Items, multi-matrix-design) erfasst. Die Aufgaben wurden
nach dem BISTA-Kompetenzmodell konstruiert (Hostenbach et al., 2011; Schwanewedel & Mayer, 2012)) und die erforderliche
Teilkompetenz, die Aufgabenkomplexität sowie die erforderlichen kognitiven Prozesse systematisch kontrolliert. Die Kontexte der
Aufgaben wurden systematisch über die vier Kontexte Tiere, Umwelt & Nachhaltigkeit, Medizin und Gesundheit variiert. Mit einem
Fragebogen wurden die Einschätzung der Kontext-Valenzen Interessantheit, Bekanntheit, gesellschaftliche- und persönliche
Relevanz erhoben (28 Items, 4-stufige Likert-Skalen). Der Fragebogen wurde nach jeder Testaufgabe eingesetzt (embedded
measurement). Das Testinstrument weist zufriedenstellende Itemkennwerte auf (.70 ≤ MNSQ ≤ 1.3; ZSTD < 2). Die
Datenauswertung erfolgt auf Basis der Item-Response-Theorie und der klassischen Testtheorie.
*Ergebnisse*
Die Ergebnisse der Hauptstudie zeigen, dass sich Aufgaben in den vier Kontextbereichen in ihrer mittleren Schwierigkeit
statistisch nicht signifikant unterscheiden (p > .05). Allerdings unterscheiden sich die Aufgaben der vier Kontexte in der
Ausprägung ihrer motivationalen Valenzen (Interessantheit, Bekanntheit, gesellschaftliche- und persönliche Relevanz).
Beispielweise werden Aufgaben zum Bereich _Tierhaltung_ als am interessantesten und Aufgaben zum Bereich _Umwelt &
Nachhaltigkeit_ als am wenigsten interessant beurteilt; Aufgaben zum Bereich _Gesundheit_ beurteilen die Lernenden als am
bekanntesten und am relevantesten für ihren persönlichen Alltag. Die Untersuchung des Einflusses der vier Kontext-Valenzen
auf die Bewertungskompetenz zeigt, dass alle Valenzen positiv mit der Personenfähigkeit korrelieren. Die höchsten
Zusammenhänge zeigen sich dabei mit der _Gesellschaftsrelevanz_ (r = .33**) und der _Bekanntheit_ (r = .26**). Die vier
Kontextvalenzen der Testaufgaben erklären 14% der Leistungsunterschiede im Kompetenzbereich Bewerten.
Kompetenzanforderungen kontextualisierter Problemlöseaufgaben
Florian Gigl, Patrick Löffler, Alexander Kauertz
Universität Koblenz-Landau
*Hintergrund*
Kontextualisiertes Problemlösen ist eine Möglichkeit, gelernte Inhalte anzuwenden. Zum anderen ist es im Sinne der
Bildungsstandards und der scientific literacy selbst Bildungsziel. Entsprechende Aufgabenstellungen bestehen meist aus einer
lebensnahen Problemgeschichte – der Surface Structure (Mestre, 2002) - und einem, dem Problem zugrunde liegenden,
abstrakten (konzeptualisierten) fachlichem Modell - der Deep Structure (Löffler & Kauertz, 2014).
Die Fähigkeit zum Problemlösen besteht aus vier Aspekten (Löffler & Kauertz, 2014): (1) Verstehen des Problems, (2) Planen
der Lösung, (3) Durchführen des Lösungswegs und (4) Reflektieren über das Ergebnis. Im ersten Schritt wird das
kontextgebundene Problem strukturiert und dabei mit der Deep Structure verbunden. Im zweiten Schritt wird die Lösung des
Problems geplant und in Schritt 3 durchgeführt. Dabei werden bekannte Fakten und Lösungsstrategien genutzt. Schritt 4 erfordert
die systematische Analyse des Lösungsversuchs. Da die Aspekte eng aufeinander bezogen sind, ist davon auszugehen, dass
die zugrundeliegende Fähigkeit eindimensional ist.
Nach Leiss et al. (2010) beeinflussen unter Anderem Fachkompetenz und Lehrerimpulse die Performanz im gesamten
Problemlöseprozess. Kognitive Fähigkeiten haben prinzipiell einen positiven Einfluss auf das Problemlösen (Heller & Hollabaugh,
1992).
*Fragestellungen*
Hieraus ergeben sich folgende Forschungsfragen:
(1) Bildet das entwickelte Instrument die Fähigkeit des Problemlösens valide ab?
(2) Welchen Einfluss haben Vorwissen über Fachinhalte und dessen zielgerichtete Einbindung auf den Problemlöseprozess?
*Methode*
Die Problemlösefähigkeit wird mit 6 Items zu einem Problem aus der Thermodynamik erfasst. Damit wurden N=211 Zehntklässler
(49,8% weiblich) an drei Gymnasien in Rheinland-Pfalz getestet. Das Problem wird dabei systematisch in den dichotomen
Variablen Transparenz, Kontextualisiertheit und Komplexität variiert (2x2x2 – Design, Löffler & Kauertz, 2015). Als Prädiktoren
werden kognitive Fähigkeiten mit Subskalen des IST 2000R (Liepmann et al., 2001) sowie konzeptuelles Vorwissen mithilfe einer
Übersetzung des „Thermal Concept Evaluation“ (TCE, Yeo, 2001) gemessen.
Die Problemlösefähigkeit wird durch ein eindimensionales Rasch-Modell (EAP-Schätzer) berechnet. Die kriteriale,
konstruktbezogene und prädiktive Validität werden diskriminant durch Korrelationen und Regressionen zu den erhobenen
Prädiktoren Intelligenz, Vorwissen berechnet. Aufgrund der Stichprobenstruktur wird zusätzlich die Kovariate Schulort
berücksichtigt.
*Ergebnisse*
Das eindimensionale Raschmodell weist eine akzeptable EAP/PV-Reliabilität von .79 auf, die mittlere latente Fähigkeit beträgt
M=-0.36 (SD=0.97).
Zur kriterialen Validierung zeigt sich ein mittlerer Zusammenhang der Performanz im Problemlöseprozess mit dem Fachwissen
(Gesamtscore TCE, r=.43, p <.001) sowie der Subskala _Ähnlichkeiten_ der verbalen Intelligenz (r=.33, p <.001). Ein großer
Zusammenhang zeigt sich mit dem Schulstandort (ρ=.57, p <.001), der Subskala _Analogien_ (r=.59, p <.001), jedoch kein
Zusammenhang zum räumlichen Vorstellungsvermögen (r=0.11, p=.11). Der Schulstandort korreliert zudem nicht mit dem Score
im TCE (ρ=.04, p=.52).
Das Fachwissen klärt rund ein Fünftel der Varianz auf (R²=.18, F(1,209)=47.02, p<.001), die verbale Intelligenz (R²=.35,
F(1,208)=56.88, p<.001) und deren Subskala _Analogien_ (R²=.34, F(1,209)=109.5, p<.001) etwa ein Drittel, die Skala
_Ähnlichkeiten_ (R²=.11, F(1,209)=25.55, p<.001) klärt weniger und das räumliche Vorstellungsvermögen keine Varianz auf.
Die weitere Zusammenhangsanalyse zeigt, dass Kontextualisiertheit (ρ=.19, p=.006) und Transparenz (ρ=.18, p=.01) die
Problemlösefähigkeit beeinflussen, die Komplexität jedoch nicht (ρ=-0.08, p=.27). Ein stark positiver Zusammenhang mit über
50% Varianzaufklärung zeigt sich zwischen dem selbstständigen Einbringen von Deep Structure Elementen in den
Problemlöseprozess und der latenten Fähigkeit (ρ=.72, p<.001, R²=.56, F(1,186)=117.3, p<.001). Gemeinsam mit der
Performanz im TCE klärt dieser Effekt 60% der Varianz auf (R²=.60, F(1,185)=93.69, p<.001).
Diskussion
Die gefundenen Zusammenhänge zeigen die Kriteriumsvalidität des Instruments und grenzen es von den Konstrukten Intelligenz
und Fachwissen ab.
Das Fachwissen und die Fähigkeit zu dessen zielgerichteter Anwendung sind ein wesentlicher Bestandteil des
Problemlöseprozesses. Der Unterschied verschiedener Schulen in der Problemlösefähigkeit spiegelt sich nicht im zugehörigen
Fachwissenstest oder den kognitiven Voraussetzungen wieder. Dieser lässt sich möglicherweise erklären durch die Rolle
prozessbezogener Kompetenzen im Problemlöseprozess (Digel et al., 2016) und deren unterschiedlicher Ausprägung.
Der Einfluss von Kontexten in Testsituationen in Biologie und Chemie
Vanessa Pupkowski1, Mariella Roesler2, Jürgen Mayer2, Elke Sumfleth1, Maik Walpuski1, Nicole Wellnitz2
1
Universität Duisburg-Essen, 2Universität Kassel
*Theoretischer Hintergrund
*Während zahlreiche Studien einen positiven Effekt auf die Ausbildung von Interesse durch den Einsatz von Kontexten in
Lernaufgaben zeigen (z. B. Fechner, 2009; Bennett, Hogarth & Lubben, 2003), ist der aufgabenbezogene Einfluss des Kontextes
und der Einfluss der damit verbundenen Interessantheit bei der Messung von Kompetenzen weitestgehend unerforscht.
Untersuchungen zum Interesse in Testsituationen zeigen, dass sich das Interesse sowie die Motivation bei der Bearbeitung von
Aufgaben insgesamt positiv auf das Ergebnis auswirken (Prenzel et al., 2007; Liu et al., 2012). Es lässt sich vermuten, dass
neben den Dimensionen _Komplexität_ und _kognitive Prozesse_ (Walpuski et al., 2010) Interesse und Motivation einen
zusätzlichen Einfluss auf die Aufgabenschwierigkeit haben.
Das Interessenskonstrukt ist in diesem Projekt nach Prenzel (1988) als Personen-Gegenstands-Beziehung definiert,
unterschieden nach situationalem Interesse als motivationaler Zustand in einer bestimmten Umgebung (Krapp & Prenzel, 1992)
und Relevanz als wertbezogene Valenz (Krapp, 1998). Bezogen auf das Motivationskonzept wird auf die Leistungsmotivation als
spezifische Form der Motivation fokussiert, die nach Wigfield & Eccles (2002) durch das Erwartungs-Wert-Modell beschrieben
wird. Die Erwartung wird ausgedrückt als die Aussicht auf Erfolg, der Wert unter anderem durch die Wichtigkeit und den Nutzen.
Empirische Untersuchungen zeigen, dass unterschiedliche Kontexte von Schülerinnen und Schülern unterschiedlich interessant
empfunden werden (z. B. Sjøberg, 2000; Hoffmann, Häußler & Lehrke, 1998). Auch gibt es Anhaltspunkte dafür, dass Aufgaben
zur Bewertung als interessanter beurteilt werden als Aufgaben zum Fachwissen (Holstermann & Bögeholz, 2008).
*Forschungsfragen*
1. Welche Bedeutung haben Kontexte in Aufgaben für die Ausprägung von Interesse und Motivation sowie für die Leistung?
2. Differieren die Zusammenhänge von kognitiven und affektiven Faktoren zwischen den Fächern Biologie und Chemie sowie
zwischen den Kontexten?
*Methode*
Zur Beantwortung der Forschungsfragen wurden zunächst 306 Aufgaben im offen und geschlossenen Aufgabenformat
entwickelt, die die Kompetenzen in den Fächern Biologie und Chemie in den Kompetenzbereichen Fachwissen und Bewertung
getrennt voneinander erfassen. Die Aufgaben wurden unter Berücksichtigung vier verschiedener Kontexte (Gesundheit, Umwelt,
Technik, Natürliche Ressourcen) parallel für beide Fächer und Kompetenzbereiche entwickelt. Jeder Kontext wurde in 2 weitere
Subkontexte gliedert, zu denen wiederum je zwei Aufgaben entwickelt wurden. Um den Einfluss der Aufgabenschwierigkeit auf
das situationale Interesse, die wahrgenommene Relevanz und die Motivation zu kontrollieren, wurden die Aufgaben auf
Grundlage des ESNaS-Modells mit mittlerer Schwierigkeit konstruiert. In einer Vorstudie wurde eine Querschnittstudie im MultiMatrix-Design (N=1235, MAlter=15.36, SD=0.77; ♂=50.3 %) durchgeführt. Das Testinstrument weist zufriedenstellende
Itemkennwerte auf (0.80<MNSQ<1.20, T<2.0).
Für die Hauptstudie wurden 272 Items ausgewählt und im Multi-Matrix-Design eingesetzt (N=1899, MAlter=15.18, SD=0.87;
♂=51.8 %). Nach jeder Aufgabe wurden zusätzliche Items eingesetzt (embedded Design), um das situationale Interesse und die
wahrgenommene Relevanz am Kontext und an der Aufgabe getrennt voneinander, sowie die Motivation (unterschieden nach
Erwartung und Wert) zu erfassen. Die Items wurden auf Basis validierter Testinstrumente ausgewählt (Boekarts, 2002; Sundre,
2007).
*Ergebnisse*
Es wurden 263 Items in die Analyse einbezogen. Ein Vergleich der Itemschwierigkeiten zeigt, dass innerhalb der Fächer die
Kontexte nicht signifikant unterschiedlich schwierig sind (FBIO(3, 135) = 2.49, p=.06, ηp2=.05; FCH(3, 120) = 0.911, p=.44,
ηp2=.02) während sich das Interesse an den Kontexten jedoch innerhalb der Fächer signifikant voneinander unterscheidet
(FI_BIO(3, 68) = 139.27, p<.001, ηp2=.86; FI_CH(3, 28) = 42.653, p<.001, ηp2=.82). Auch können innerhalb der Fächer
signifikante Unterschiede bezüglich der Motivation zwischen den Kontexten identifiziert werden (FM_BIO(3, 135.58) = 16.62,
p<.001, ηp2=.19; FM_CH(3, 220) = 5.169, p<.01, ηp2=.07).
Auf Grundlage dieser Ergebnisse lässt sich vermuten, dass Kontexte keinen direkten Einfluss auf die Aufgabenschwierigkeit in
Testsituationen haben, sehr wohl aber auf das Interesse und die Motivation. Auf der Tagung werden weitere Detailanalysen
innerhalb der Fächer präsentiert sowie der Vergleich zwischen den Fächern berichtet. Auch Mediationsanalysen auf Basis der
Interessensdaten werden durchgeführt.
ID: 249
Symposium
Disziplinen-Cluster: Psychologie, Didaktik Mathematik, Lehrerbildung
Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Methoden der empirischen
Bildungsforschung
Stichworte: Wissensstrukturmodelle, Kompetenzmodellierung, latente Variablenmodelle, Strukturgleichungsmodelle,
Mehrebenenmodelle
Neuartige methodisch-statistische Verfahrensweisen der Kompetenzmodellierung und komplexe
Prognosemodelle in der Empirischen Bildungsforschung
Chair(s): Augustin Kelava (Eberhard Karls Universität Tübingen)
Diskutant(en): Augustin Kelava (Eberhard Karls Universität Tübingen)
Das Symposium widmet sich den Fragen, wie traditionelle methodisch-statistische Verfahrensweisen der
Kompetenzmodellierung und Betrachtung von Merkmalszusammenhängen in der Empirischen Bildungsforschung verbessert
werden können oder neue Verfahrensweisen angewandt werden können, die a) eine stärker inhaltsvaldititäsbezogene Definition
und Betrachtung von Kompetenzen erlauben und b) neue Möglichkeiten zur differenzierteren Modellierung und Prognose von
individuellen Kompetenzen oder von Merkmalszusammenhängen ermöglichen.
Der erste Vortrag des Symposiums widmet sich der Lern- und Wissensraumtheorie. Die Lernraumtheorie liefert eine alternative
Zugangsweise, bspw. zur üblichen Praxis durch Item-Response-Theorie, zur Modellierung, Testung und Vermittlung von Wissen
oder Kompetenz. Im Vortrag werden die Grundbegriffe vorgestellt und die inhaltlich-konzeptuellen Möglichkeiten beschrieben
(z.B. die Formulierung einer Wissensdomäne durch repräsentative Grundmengen von Testaufgaben oder das graduelle, Itemweise Lernen von Schülerinnen und Schülern). Abgerundet wird der Vortrag durch einen Vergleich der Lern- und
Wissensraumtheorie mit angrenzenden Verfahrensklassen.
Im zweiten Vortrag wird eine Anwendung von Wissensstrukturmodellen vorgestellt, welche die Modellierung der mathematischen
Fachkompetenz von Studierenden der Naturwissenschaften vorsieht. Grundsätzlich stellt sich die Frage, welche Zustände
(Stufen) beim Kompetenzerwerb erreicht werden können und wie sich Mathematikkompetenz bei Naturwissenschaftlern
inhaltsvalide-aufgabenbezogen strukturell abbilden lässt. Unter Einbindung von FachwissenschaftlerInnen ist ein
Kompetenzmodell entstanden, dessen Überprüfung anhand von Klausurdaten von 426 Studierenden aus der Vorlesung
„Mathematik für Naturwissenschaftler“ erfolgte. Ergebnisse zeigen, dass sich die angenommenen diskreten Kompetenzstufen
sehr gut bestätigen lassen.
Der dritte Vortrag beschreibt einen neuen Ansatz (GNM-SEMM Framework; Kelava & Brandt, 2014), der verschiedene
traditionelle Ansätze wie Strukturgleichungsmodelle, Item-Response-Modelle, Mischverteilungmodelle, nicht-lineare Modelle und
Mehrebenenmodelle zu einem Rahmenmodell integriert. Der Mehrwert des Ansatzes liegt in der simultanen Möglichkeit zur
Modellierung von funktionalen Zusammenhängen über verschiedene Datenebenen hinweg und zur Berücksichtigung
unbeobachteter Heterogenität und Nicht-Normalität. Um die Nützlichkeit des Ansatzes zu beschreiben, werden
Mathematikleistungsdaten aus PISA 2009 in Abhängigkeit von diversen Maßen auf Individual- und Schulebene modelliert (z.B.
anhand von latenten Splines).
Der vierte Vortrag widmet sich dem Problem der Multikollinearität in Prognosemodellen, die insbesondere dann entsteht, wenn
viele Prädiktoren sowie deren Wechselwirkungen (Interaktionseffekte) zur Vorhersage von z.B. Kompetenzen verwendet werden.
Es wird ein neues Verfahren aus dem Bereich der Strukturgleichungsmodelle vorgestellt, das die Probleme bisheriger Verfahren
hinsichtlich der Power zur Aufdeckung von Interaktionseffekten substantiell verringert. Der neue Ansatz wird anhand von
Leseleistungsdaten von SchülerInnen aus PISA 2009 illustriert. Hierbei wird das neue Verfahren mit traditionellen SEM-Verfahren
zur Aufdeckung von Interaktionseffekten verglichen.
Die vorgetragenen inhaltlichen und methodologisch-statistischen Forschungsergebnisse beruhen auf einer fruchtbaren,
interdisziplinären Zusammenarbeit von ForscherInnen aus der mathematischen Fachwissenschaft und der mathematischen
Fachdidaktik und MethodikerInnen der Empirischen Bildungsforschung.
Beiträge des Symposiums
Wissens- und Kompetenzmodellierung durch Lernraumtheorie
Ali Ünlü
TUM School of Education
Die Lernraumtheorie interpretiert diskrete Ordnungsstrukturen im wissenspsychologischen Kontext. Diese Theorie bietet auch
kompetenzbasierte Erweiterungen und hat sich als dynamisches Forschungsfeld etabliert (Doignon & Falmagne, 1999; Falmagne
& Doignon, 2011; Ünlü et al., 2013). Jedoch ist das hohe und breite Anwendungspotenzial der Lernraumtheorie und ihrer
Erweiterungen bei weitem noch nicht ausgeschöpft, gerade auch in Hinblick auf Anwendungen in den Fachdidaktiken (bspw.
Mathematikdidaktik) oder in der Bildungsforschung. Bisher beschränken sich die Anwendungen weitgehend auf die Entwicklung
von mathematisch-psychologisch fundierten, computergestützten adaptiven Lehr-/Lernsystemen. Die Grundüberlegung der
Wissensraumtheorie orientiert sich an dem Vorgehen eines/r Lehrers/erin, bei dem die Erfahrungen und Kenntnisse über
Voraussetzungsbeziehungen zwischen Wissenseinheiten genutzt werden, um dem/der Schüler/in z.B. unterfordernde, also zu
leichte, oder überfordernde, also zu schwierige, Aufgaben zu ersparen und an der Grenze von Wissen und Nichtwissen zu
operieren.
Die Lernraumtheorie liefert eine alternative Zugangsweise, bspw. zur üblichen Praxis durch Item-Response-Theorie, zur
Modellierung, Testung und Vermittlung von Wissen oder Kompetenz. Daher werden in diesem Überblicksvortrag die Grundideen
und Hauptbegriffe der Lernraumtheorie und ihre Erweiterungen aus historischer Sicht motiviert und inhaltlich rekapituliert. Die
nicht-numerische Formalisierung einer Wissensdomäne (bspw. Rechnen mit natürlichen Zahlen) durch repräsentative
Grundmengen von Testaufgaben, mit den darin möglichen Wissenszuständen als die von den Schüler/innen beherrschten
Aufgaben der Wissensdomäne, werden diskutiert, sowie der daraus resultierende Begriff eines Lernpfades in einer
Wissensstruktur. Letzterer erlaubt die Modellierung von graduellem, d.h. Item-weisen, Lehren und Lernen. Es werden die
sogenannten äußeren und inneren Ränder des Wissenszustandes eines/einer Schülers/erin behandelt, als wichtige
Modellierungsgrößen, die all jene Probleme subsumieren, die ein Prüfling unmittelbar als nächstes aus seinem Wissenszustand
heraus lernen kann, bzw. unmittelbar zuvor als letztes gelernt hat. Sie dienen zur diagnostischen und dynamischen Navigation
des Lehr-/Lernprozesses. Ein Ausblick über probabilistische Generalisierungen dieser Ansätze durch restringierte Latent-ClassModelle runden den Vortrag ab.
Modellierung mathematischer Fachkompetenz von Studierenden der Naturwissenschaften mithilfe von
probabilistischen Wissensstrukturen
Nora Umbach, Dirk Miller, Pascal Kilian, Frank Loose, Augustin Kelava
Eberhard Karls Universität Tübignen
Sowohl in der Schule als auch an der Universität wird Mathematik oft als ein besonders großes Hindernis empfunden.
Mathematische Fähigkeiten zu erfassen und zu modellieren ist daher in vielen Gebieten der Bildungsforschung von zentraler
Bedeutung. Didaktische Konzepte zur Förderung mathematischer Kompetenzen, benötigen ein gutes Verständnis davon, welche
Zustände (Stufen) beim Kompetenzerwerb erreicht werden können und wie sich dieses Merkmal inhaltsvalide strukturell abbilden
lässt. Darüber hinaus sind z.B. im Kontext MINT-Fächer in der Hochschulbildung studiengangsspezifische Inhalte zu
berücksichtigen. Im Folgenden soll ein Modell speziell für die mathematische Kompetenz angehender Naturwissenschaftler
vorgestellt werden.
Inhalte, die in Mathematikvorlesungen für Studienanfänger von naturwissenschaftlichen Studiengänge gelehrt werden,
unterscheiden sich zum Teil deutlich von den Inhalten der Vorlesungen für Studierende der Mathematik. Während z.B. in den
Vorlesungen Analysis I und Lineare Algebra I die Mathematik axiomatisch aufgebaut und Sätze präzise ausgehend von den
Definitionen bewiesen werden, liegt der Fokus in den Mathevorlesungen für Naturwissenschaftler eher auf der Vermittlung von
Rechentechniken, die in den Naturwissenschaften relevant sind. Durch diesen Sachverhalt unterscheidet sich ein
Kompetenzmodell für solch eine Vorlesung z.B. von einem Kompetenzmodell für Vorlesungen wie Analysis I oder Lineare Algebra
I.
Für diese Art der mathematischen Kompetenz in der Hochschulbildung gibt es bisher kaum theoretisch motivierte
Kompetenzmodelle. Traditionelle Skalierungsverfahren gehen davon aus, dass es ein oder mehrere latente Kontinua der
mathematischen Kompetenz gibt. Grundsätzlich ist diskutierbar, inwiefern sich mathematische Kompetenz auf einem (latenten)
Kontinuum abbilden lässt. Darüber hinaus stellt sich die Frage nach einem mathematischen Kompetenzmodell, welches sich an
naturwissenschaftlichen Studiengängen orientiert. Angesichts der Heterogenität der zu vermittelnden Konzepte, erscheinen
latente diskrete Modelle, die Abhängigkeitsstrukturen der Inhalte abbilden können, als eine sinnvolle Alternative. Eine solche
Alternative bietet die Theorie der probabilistischen Wissensstrukturen (z.B. Falmagne, Doignon, Koppen, Villano & Johannesen,
1990; Heller, Ünlü & Albert, 2013).
Aufbauend auf der Theorie der probabilistischen Wissensstrukturen wurde gemeinsam mit Fachwissenschaftlern aus der
Mathematik ein Modell der mathematischen Kompetenz für Studierende der Naturwissenschaften entwickelt. Dieses Modell
formuliert Sets von Skills, die benötigt werden um unterschiedliche Aufgaben lösen zu können. Aus dieser Skillfunktion lässt sich
direkt eine Wissensstruktur ableiten, die hierarchisch aufgebaut ist und aus theoretischen Annahmen über das Zusammenhängen
von mathematischen Fähigkeiten entwickelt wurde. Dadurch lassen sich Abhängigkeiten zwischen Aufgaben klar definieren und
darstellen. Durch diese Abhängigkeiten können Wissenszustände der Studierenden mit nur wenigen Aufgaben erfasst werden.
Dadurch wird z.B. auch eine adaptive Diagnostik ermöglicht, die den jeweiligen individuellen Wissenszustand berücksichtigt.
Das Modell wurde an die Ergebnisse der Hauptklausuren aus dem WS 2012/13 und 2013/14 für die Vorlesung "Mathematik für
Naturwissenschaftler" angepasst. Diese Vorlesung wird von Studienanfängern der Studiengänge Chemie (B.Sc.), Biochemie
(B.Sc.), Nanoscience (B.Sc.) und Physik (Lehramt) an der Universität Tübingen besucht. Die Klausuren bestanden aus 30 bzw.
35 Teilaufgaben und wurden von insgesamt n = 235 bzw. n = 191 Personen geschrieben. Von jeder Person steht bei jeder
Teilaufgabe die erreichte Punktzahl zur Verfügung. Es wurden insgesamt 10 Teilaufgaben, die in beiden Klausuren vergleichbar
sind, ausgewählt um eine Skillfunktion aufzustellen und daraus eine Wissensstruktur abzuleiten. Die Ergebnisse zeigen, dass
sich die angenommenen diskreten Kompetenzstufen sehr gut durch die Daten abbilden lassen.
Damit wird deutlich, dass die Theorie der probabilistischen Wissensstrukturen sehr gut geeignet ist, Wissenszustände der
mathematischen Kompetenz von Studierenden der Naturwissenschaften abzubilden. Dabei wird kein zugrundeliegendes latentes
Kontinuum mathematischer Kompetenz angenommen, sondern es werden latente Stufen mathematischer Kompetenz
identifiziert. Der hierarchische Aufbau dieser latenten Wissensklassen erlaubt eine präzise und einfache Diagnostik der
mathematischen Kompetenz, ebenso wie Ansätze zu gezielten Interventionen, die auf einer belastbaren Individualdiagnostik
aufbauen. Mögliche didaktische Konzepte und Diagnoseverfahren werden diskutiert.
A general non-linear multilevel structural equation mixture model
Augustin Kelava, Holger Brandt, Nora Umbach
Eberhard Karls Universität Tübignen
Zu den am häufigsten angewandten Analyseverfahren der Empirischen Bildungsforschung zählen zwischenzeitig latente
Variablenmodelle (Strukturgleichungsmodelle, Item-Response-Modelle) und Mehrebenenmodelle. Darüber hinaus haben sich in
den vergangen Jahren sowohl Mischverteilungsmodelle als auch nicht-lineare latente Modelle zunehmend etabliert (für
Einführungen in diese Verfahren s. Bauer, 2005; Schumacker & Marcoulides, 1998). Die Kombination von Teilmengen obiger
Verfahrensklassen wurde in jüngerer Vergangenheit angestrebt (e.g., Muthén & Asparouhov, 2009; Rabe-Hesketh, Skrondal, &
Pickels, 2004), um möglichst flexible Möglichkeiten zur Modellierung von komplexen quer- und längsschnittlichen Datensätzen
mit Abhängigkeitsstrukturen zu ermöglichen. Eine vollständige Integration unter Berücksichtigung von a) nicht-normalen
Verteilungen, b) der Nicht-Linearität/Differenziertheit von funktionalen Zusammenhängen der beteiligten Variablen und c)
unbeobachteter Heterogenität auf allen Datenebenen ist zuvor nicht erfolgt.
Im Vortrag wird daher ein jüngst publizierter allgemeiner Ansatz (GNM-SEMM; „A general non-linear multilevel structural equation
mixture model“; Kelava & Brandt, 2014) vorgestellt. Der GNM-SEMM Ansatz integriert parametrische und semiparametrische
nicht-lineare latente Variablenmodelle (z.B. Kelava, Nagengast, & Brandt, 2014) sowie (latente) Mehrebenenmodelle unter
Berücksichtigung möglicher nicht-normaler Verteilungen der Daten. Er kennzeichnet sich durch eine flexible Modellierung der
Zusammenhänge auf allen Datenebenen aus (z.B. auf Schulebene oder Schülerebene), indem latente Spline-Modelle für die
Mess- und Strukturmodelle ermöglicht werden.
Eine Veranschaulichung der Möglichkeiten im GNM-SEMM Ansatz und seiner Anwendbarkeit erfolgt anhand von PISA-2009Daten (Organisation for Economic Co-Operation and Development, 2010). Dazu wird eine deutsche Stichprobe von N=1474
Schülerinnen und Schülern aus 226 Schulen zur Modellierung der Mathematikleistung herangezogen. Zusätzliche Kovariaten auf
der Individual- und Schulebene liegen vor. Es wird u.a. der Zusammenhang der Mathematikleistung und der Einstellung zum
Lesen untersucht (Ebene 1). Darüber hinaus wird die durchschnittliche Leistung der Schule und ihr Zusammenhang zu
strukturellen Problemen in der Schule sowie Umfeldvariablen der Schule beschrieben (Ebene 2). Es zeigt sich, dass auf den
unterschiedlichen Datenebenen verschiedene Modelltypen (Splines auf Ebene 1; Interaktion auf Ebene 2) die Zusammenhänge
differentiell abbilden und Heterogenität der Merkmale (latenten Mischungen, auf Ebene 2) eine differenziertere Analyse der Daten
ermöglicht und somit neue Möglichkeiten auch zur Dateninterpretation eröffnet.
Das empirische Beispiel soll nicht erschöpfend die Parametrisierungsmöglichkeiten behandeln, sondern vielmehr
veranschaulichen, dass der neue GNM-SEMM Ansatz als ein statistischer Werkzeugkasten (Framework) im Dienste
differenzierter theoretischer Überlegungen in der empirischen Bildungsforschung und angrenzenden Disziplinen stehen kann.
Vor diesem Hintergrund werden Implikationen für die Empirische Forschung und die Verfahrensentwicklung diskutiert. Nicht
zuletzt trägt auch die Flexibilität des Ansatzes zur Generierung neuer inhaltlicher Fragestellungen in komplexen Inhaltsgebieten
bei.
Analyzing interaction effects and the problem of multicollinearity: A lasso estimator as an alternative to
traditional approaches
Holger Brandt1, Nora Umbach1, Kevin Fischer2, Jenna Cambria3, Augustin Kelava1
1
Eberhard Karls Universität Tübignen, 2Goethe Universität Frankfurt, 3University of Arkansas
Substantive researchers often predict achievement in school is often conducted by including a variety of sources of information
that may influence the achievement, for example, values, beliefs, and goals (Wigfield & Cambria, 2010). Typically many assume
that in addition to the additive effects of these sources, interaction effects can also increase the predictive power of the model
(Nagengast, Marsh, Scalas, Xu, Hau, & Trautwein, 2011). By increasing number of predictor variables, these models become
increasingly complex and the power to detect effects decreases. As a consequence, researchers tend to analyze simpler models,
for example, they analyze separate models for subsets of predictors and include only single or a small number of interaction
effects. As we will show in this talk, this procedure is associated with a highly inflated Type I error rate and cannot be improved
by corrections for multiple testing (e.g., Bonferroni). Since theories focused on predicting school achievement include a variety of
sources that cannot be neglected, new latent variable methods are needed that can account for such model complexity.
In this talk, we present a new lasso estimator for structural equation models that is more efficient in revealing latent interaction
effects in situations with many latent predictors as well as in situations with increased multicollinearity. The lasso is a shrinkage
method for regression models that imposes a penalty on the regression coefficients which shrinks small effects to zero and thus
reduces problems associated with multicollinearity. The advantage of this estimator is that it can be used directly for variable
selection without comparing models or stepwise procedures, which are known to have inflated Type I error rates. Results of our
simulation study show that the estimator has a higher power than standard procedures for testing parametric structural equation
models with interaction effects (e.g., product indicator approaches or LMS in Mplus). The advantage of the lasso estimator in
comparison to other estimators increases substantially in situations with high multicollinearity, which is a common problem in
education sciences.
We illustrate the new model with a data set from the Program for International Student Assessment 2009 (Organisation for
Economic Co-Operation and Development, 2010) with Austrian students who took part in a reading test (N=1092). We predict
the pupils reading skill by a large set of predictors and apply the new model to the data. We show the pitfalls of analyzing subsets
of the relevant predictors and the resulting artificial effects.
Finally, we discuss possible guidelines for the appropriate application of the lasso estimator and its limitations.
ID: 251
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Sonderpädagogik
Thematisches Cluster: Bildung im Sekundarbereich, Grundschulbildung, Inklusion
Stichworte: Sonderpädagogischer Förderbedarf, Large-Scale-Assessments, Gütekriterien, Bildungsdisparitäten
Inklusion von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf in bundesweiten
Schulleistungserhebungen
Chair(s): Cornelia Gresch (Institut zur Qualitätsentwicklung im Bildungswesen), Poldi Kuhl (Institut zur Qualitätsentwicklung
im Bildungswesen (IQB)), Katharina Müller (Technische Universität München (TUM))
Diskutant(en): Michael Grosche (Bergische Universität Wuppertal)
Im Zuge der im Jahr 2008 in Kraft getretenen UN-Behindertenrechtskonvention zeichnet sich in Deutschland zum einen eine
Zunahme inklusiver Beschulung von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf (SPF) an Regelschulen
ab, zum anderen ist das Thema Inklusion auch in den Blickpunkt der empirischen Bildungsforschung gerückt. So beziehen
nationale und internationale Schulleistungsvergleichsstudien wie z.B. PISA, TIMSS, das NEPS oder die IQB-Ländervergleiche
Schülerinnen und Schüler mit SPF in die Erhebungen ein, stehen dabei jedoch vor besonderen Herausforderungen: Zum einen
unterscheiden sich die Rahmenbedingungen und Prozesse inklusiver Beschulung zwischen den Bundesländern, wodurch bereits
die länderübergreifend einheitliche Identifikation der Schülergruppe eine Schwierigkeit darstellt (vgl. Gresch & Piezunka, 2015).
Zum anderen werden Schülerinnen und Schüler mit und ohne SPF oftmals gemeinsam und anhand standardisierter Verfahren
untersucht. Dabei sind vielfältige methodische Fragen bezüglich der Güte der Messung, der Vergleichbarkeit der Schülergruppen
oder des Einsatzes von Akkommodation noch weitgehend ungeklärt (vgl. Heydrich et al. 2014).
Um sich diesen Herausforderungen der Einbeziehung von Schülerinnen und Schülern mit SPF in Large-Scale-Assessments
(LSAs) gemeinschaftlich zu stellen, hat sich 2012 eine Gruppe von Kolleginnen und Kollegen, die im Kontext nationaler bzw.
internationaler Schulleistungsvergleichsuntersuchungen mit dieser Schülerschaft befasst ist, zum Netzwerk NELSEN (Network
of Large-Scale-Studies including Students with Special Educational Needs) zusammengeschlossen. In dem Symposium werden
vier aktuelle Arbeiten aus dem NELSEN-Netzwerk vorgestellt und diskutiert: Das Symposium beginnt in einem ersten Beitrag mit
einer methodischen Auseinandersetzung auf der Grundlage von Daten des IQB-Ländervergleichs in der Sekundarstufe I zu der
Frage, inwieweit die mathematische Kompetenz bei Kindern mit SPF valide erfasst wird. In dem anschließenden zweiten Beitrag
wird anhand von Daten einer PISA-Zusatzstudie gezeigt, welche schulischen Kompetenzen die an Förderschulen unterrichteten
Schülerinnen und Schülern mit SPF am Ende der Pflichtschulzeit in den PISA-Tests erzielen und diskutiert welche Limitationen
sich bei der Interpretation der Befunde aufgrund der psychometrischen Eigenschaften des Tests ergeben. Mit den Folgen des
Beschulungsortes setzt sich der dritte Beitrag auseinander, der auf Datenbasis des NEPS prüft, inwiefern das akademische
Selbstkonzept der Kinder mit SPF vom mittleren Kompetenzniveau einer Klasse geprägt ist (Big-Fish-Little-Pond-Effekt) und ob
hier Unterschiede zwischen segregierten und inklusiven Schulsettings vorliegen. Im vierten Beitrag liegt der Fokus auf
zuwanderungsbedingten Disparitäten. Der Beitrag geht auf der Datengrundlage des IQB-Ländervergleichs in der Grundschule
der Frage nach, inwiefern über die schulischen Leistungen und den sozialen Hintergrund hinaus der Zuwanderungshintergrund
mit der Zuweisung eines SPF im Bereich Lernen zusammenhängt. Die Beiträge werden anschließend von Michael Grosche aus
Perspektive der Sonderpädagogik diskutiert.
Beiträge des Symposiums
Aspekte der Testgüte bei der Erfassung mathematischer Kompetenzen bei Schülerinnen und Schülern
mit sonderpädagogischem Förderbedarf in der Sekundarstufe I
Nicole Haag, Aleksander Kocaj
Institut zur Qualitätsentwicklung im Bildungswesen (IQB)
Large-Scale-Assessments (LSA) im Bildungsbereich sind vor die Herausforderung gestellt, schulische Kompetenzen in
heterogenen Schülergruppen vergleichbar und valide zu erfassen. Insbesondere die Gruppe der Schülerinnen und Schüler mit
sonderpädagogischem Förderbedarf (SPF) wird hierbei in den letzten Jahren verstärkt in den Fokus genommen. Die zur
Kompetenzmessung verwendeten Aufgaben wurden jedoch ursprünglich für Schülerinnen und Schüler ohne SPF entwickelt,
sodass die Testgüte für Schülerinnen und Schüler mit SPF untersucht werden muss.
Der Beitrag prüft ausgewählte Aspekte der Testgüte der Mathematikaufgaben des in der 9. Klassenstufe durchgeführten IQBLändervergleichs 2012 (Pant, Stanat, Schroeders, Roppelt, Siegle & Pöhlmann, 2013). Der Beitrag knüpft inhaltlich und
methodisch an vorangegangene Untersuchungen zur Testgüte für Schülerinnen und Schüler mit SPF in LSAs wie NEPS
(Südkamp, Pohl, Hardt, Jordan & Duchhard, 2015) und dem IQB-Ländervergleich der Primarstufe 2011 (Kocaj, Haag, Weirich,
Kuhl, Pant & Stanat, eingereicht) an und prüft, ob sich die Testbearbeitung von Schülerinnen und Schülern mit SPF bedeutsam
von Schülerinnen und Schülern ohne SPF unterscheidet. Hierbei wird ein Fokus auf Schülerinnen und Schüler in Förderschulen
gelegt, deren Testbearbeitung mit zwei nach angestrebtem Abschluss differenzierten Teilgruppen von Schülerinnen und Schülern
an nicht-gymnasialen Schulformen verglichen wird. Es wurden drei Gruppen von Schülerinnen und Schülern betrachtet: (1)
Schülerinnen und Schüler an Förderschulen mit den Förderschwerpunkten _Lernen_, _Sprache_, oder _emotionale und soziale
Entwicklung_ (_N_ = 482), (2) Schülerinnen und Schüler an nicht-gymnasialen Schulformen, die einen Hauptschulabschluss
(HSA) anstreben (_N_ = 3955) und (3) Schülerinnen und Schüler an nicht-gymnasialen Schulformen, die einen Mittleren
Schulabschluss (MSA) anstreben (_N_ = 11781). Die Testdauer betrug für jede der drei Gruppen 120 Minuten. Die an
Förderschulen eingesetzten Testhefte enthielten jedoch um ein Drittel weniger Items, sodass Schülerinnen und Schüler an
Förderschulen pro Item eine längere Bearbeitungszeit zur Verfügung gestellt bekamen.
Es zeigte sich erwartungsgemäß, dass die Items von Förderschülerinnen und -schülern deutlich seltener gelöst wurden als von
Schülerinnen und Schülern ohne SPF. Die Analysen der fehlenden Werte zeigten, dass Schülerinnen und Schüler an
Förderschulen insgesamt ca. 17% der ihnen vorgelegten Items nicht beantworten. Für Schülerinnen und Schüler, die einen HSA
anstreben, lag dieser Wert mit 24% sogar noch etwas höher. Schülerinnen und Schüler, die einen MSA anstreben, bearbeiten
hingegen lediglich 15% der Items nicht. Auslassungen einzelner Items bildeten in allen drei Gruppen den größten Anteil fehlender
Werte, wohingegen der Anteil fehlender Werte am Ende des Testhefts ebenfalls übereinstimmend eher gering ausgeprägt war.
Ferner wurde festgestellt, dass für Schülerinnen und Schüler an Förderschulen im Vergleich zu Schülerinnen und Schülern, die
einen HSA anstreben, ca. 35% der Items moderates und 6% der Items substanzielles differenzielles Itemfunktionieren (DIF)
aufwiesen. Zwischen Schülerinnen und Schülern, die einen HSA anstreben und Schülerinnen und Schülern, die einen MSA
anstreben, bestand ein vergleichbar hoher Anteil an moderatem DIF (32%), wohingegen der Anteil an Items mit substanziellem
DIF sogar etwas höher lag (10%).
Die Befunde deuten darauf hin, dass der verwendete Test mit Einschränkungen dazu geeignet ist, die Leistungen von
Schülerinnen und Schülern an Förderschulen vergleichbar zu Schülerinnen und Schülern an nicht-gymnasialen Schulformen zu
erfassen. In weiterführenden Analysen soll geprüft werden, ob sich die Unterschiede in der Itembearbeitung zwischen den
betrachteten Gruppen durch Eigenschaften der Items oder durch soziodemografische und motivationale Merkmale der Personen
erklären lassen.
Wie schneiden Schülerinnen und Schüler an Förderschulen bei PISA ab - Ergebnisse aus der PISA 2012Zusatzerhebung zu Jugendlichen mit sonderpädagogischem Förderbedarf
Katharina Müller, Manfred Prenzel, Christine Sälzer, Julia Mang, Markus Gebhardt
Technische Universität München (TUM)
Der in Deutschland zunehmend virulent geführten Debatte zum Beschulungsort Förderschule steht ein auffallender Mangel an
empirischen Befunden zum Wissen und Können der dort unterrichteten Schülerinnen und Schüler gegenüber. Die bislang
vorliegenden Untersuchungen in der Sekundarstufe sind meist regional oder auf Landesebene begrenzt und vergleichen
Schülerinnen und Schüler aus Förderschulen mit SPF mit einer jüngeren Schülergruppe ohne SPF. Ein
bundesländerübergreifendes Bildungsmonitoring mit vergleichenden Analysen zwischen den an Förderschulen der
Sekundarstufe unterrichten Schülerinnen und Schülern mit SPF und Gleichaltrigen ohne SPF befindet sich bislang - nicht zuletzt
aufgrund der mit einer reliablen und validen Testung dieser Schülergruppe verbundenen Herausforderungen (etwa Heydrich,
Weinert, Nusser, Artelt, & Carstensen, 2013; Pohl & Carstensen, 2013; Südkamp, Pohl & Weinert, 2015) - noch in den Anfängen.
In PISA gehen Schülerinnen und Schüler mit SPF als Teilstichprobe in alle Analysen der Gesamtstichprobe ein, um die
Zielpopulation repräsentativ abzubilden. Allerdings war die Größe der Teilstichprobe bislang zu klein, um auf die Grundgesamtheit
der Fünfzehnjährigen schließen zu können, die an Förderschulen unterrichtet wird. Ziel der vorliegenden Studie war es daher,
die Teilstichprobe Fünfzehnjähriger, die an Förderschulen in Deutschland unterrichtet wird und die PISA-Teilnahmekriterien
(OECD, 2014) erfüllt, für eine PISA-Testung so zu erweitern, dass für diese Gruppe ebenfalls Aussagen zum Kompetenzniveau
getroffen werden kann. Dabei sollten die in der Zusatzerhebung getesteten Schülerinnen und Schüler an Förderschulen mit den
an regulären Sekundarschulen unterrichteten aus der PISA-Haupterhebung verglichen werden. Im Vordergrund der hier
vorgestellten Analysen stehen folgende Forschungsfragen:
- Wie hoch ist das durchschnittliche Kompetenzniveau in den PISA-Tests für Mathematik, Lesen und Naturwissenschaften bei
den an Förderschulen unterrichteten Fünfzehnjährigen mit SPF in Deutschland?
- Wie groß sind die Unterschiede im PISA-Kompetenzniveau zwischen den an Förderschulen unterrichteten Fünfzehnjährigen
mit SPF und den an den übrigen allgemeinbildenden Sekundarschularten unterrichteten (ohne SPF)?
Beleuchtet werden dabei auch die zur Beantwortung der Fragen relevanten Merkmale der Testgüte.
Die Stichprobe bestand aus _N_ = 61 Förderschulen und darin unterrichteten _N_ = 691 Fünfzehnjährigen (40.6% weiblich). Das
Vorgehen bei der Skalierung in der Zusatzerhebung entsprach dem der PISA 2012-Hauptstudie mit den in PISA üblichen
Schätzprozeduren auf Basis der Item Response Theory (Adams & Wu, 2007; Adams, Wilson & Wang, 1997). Unter Anwendung
desselben Hintergrundmodells wie in der PISA 2012-Hauptstudie (OECD, 2014) und der dort berechneten Itemparameter wurden
in der Zusatzstichprobe Plausible Values zur Bestimmung der Populationsparameter für die Kompetenzbereiche ermittelt. Zur
Beurteilung der psychometrischen Eigenschaften wurden EAP/PV-Reliabilitäten berechnet, der Umfang fehlender Werte
analysiert, Item- und Personenfitstatistiken herangezogen und Unterschiede in den Itemschwierigkeiten zwischen Haupt- und
Förderschule mittels Differential Item Functioning (_DIF_) geprüft. Neben einer deskriptiven Darstellung der Befunde wurden
Unterschiede zwischen den Schularten getestet (zweiseitige _t_-Tests für unabhängige Stichproben) und Effektstärken
(Cohens _d_) berichtet.
Bei den Fünfzehnjährigen an Förderschulen zeigte sich im Vergleich zu den an den übrigen allgemeinbildenden Schularten
unterrichteten Jugendlichen ohne SPF erwartungsgemäß ein deutlich niedrigeres Kompetenzniveau (Mathematik _M_ = 340;
Nawi _M_ = 341; Lesen _M_ = 332). Der größte Anteil der Jugendlichen in der Zusatzerhebung liegt bei den in PISA verwendeten
Kompetenzstufen auf oder unter Stufe I. Damit ist in der Gruppe der an Förderschulen unterrichteten Fünfzehnjährigen mit einem
erheblichen Anteil zu rechnen, der in allen drei Domänen nicht über grundlegende Kompetenzen verfügt. Bei der Skalierung und
Prüfung des dreidimensionalen Modells zeigte sich, dass die Aufgaben für die Schülerinnen und Schüler mit SPF vergleichsweise
schwer sind und diese Gruppe in den Personen-Fit-Statistiken einen leichten Overfit (_Outfit MNSQ_ = .746) aufwies. Ferner
wurde deutlich, dass bei rund 10% der zum Einsatz kommenden Items substantielle Unterschiede in den Itemschwierigkeiten
vorliegen, die z.T. mit geringer Itemdiskrimination (_wMNSQ_ ≥ 1.20) einhergehen. Die Befunde werden vorbehaltlich dieser
Limitationen dargestellt und kritisch diskutiert.
There's plenty more fish in the sea. Das akademische Selbstkonzept von Schülerinnen und Schülern mit
sonderpädagogischem Förderbedarf. Lernen in integrativen und segregierten Schulsettings
Ilka Wolter1, Lena Nusser2, Cordula Artelt2, Sabine Weinert2
1
Leibniz Institut für Bildungsverläufe, 2Universität Bamberg
In empirischen Arbeiten zur Leistungsentwicklung und den Selbstkonzepten von Kindern mit sonderpädagogischem Förderbedarf
(SPF) sind vergleichende Forschungsarbeiten über Lernende in Förderschulen und integrativen Settings in Regelschulen von
steigendem Interesse. Kinder in Regelschulen weisen im Mittel bessere Leistungen in standardisierten Test auf als Kinder mit
einem sonderpädagogischen Förderbedarf Lernen (SPF-L) in Förderschulen (Kocaj, Kuhl, Kroth, Pant & Stanat, 2014). Allerdings
unterscheiden sich die Selbstkonzepte von Kindern mit SPF-L in Förderschulen von denen in Integrationsklassen teilweise
deutlich und in umgekehrter Richtung. Als ein Mechanismus dieses Effekts werden die unterschiedlichen Vergleichskontexte in
segregierten und inklusiven Klassen diskutiert (vgl. Möller, 2013). Der vielfach nachgewiesene Big-Fish-Little-Pond-Effekt
(BFLPE; z. B. Marsh, 2005) beschreibt, dass das akademische Selbstkonzept von Lernenden nicht nur durch die eigene
Leistungen geformt, sondern auch negativ von den Leistungen der Klassengemeinschaft beeinflusst wird.
In dieser Studie gehen wir der Frage nach, ob der BFLPE in der Domäne Mathematik für Lernende mit sonderpädagogischem
Förderbedarf Lernen in segregierten und inklusiven Settings gleichermaßen aufzuzeigen ist. Wir nehmen hierbei zunächst an,
dass die Mechanismen des sozialen Vergleiches auch in segregierten Schulsettings ihre Wirkung entfalten und sich ein negativer
Effekt des mittleren Leistungsniveaus der Klasse auf das individuelle akademische Selbstkonzept nachweisen lässt. Da es sich
allerdings bei integrativen Klassen für die Kinder mit einem sonderpädagogischen Förderbedarf Lernen um einen vergleichsweise
leistungsstärkeren Kontext handeln sollte, wird weiterhin angenommen, dass der negative Effekt auf das akademische
Selbstkonzept für Integrationskinder in Regelschulen stärker ausfällt als für Lernende an Förderschulen.
In einer Stichprobe von Schülerinnen und Schülern der 5. Klasse in Förderschulen Lernen (_n_ = 587 in 91 Klassen) sowie in
Integrationsklassen in Regelschulen (_n_ = 148 in 103 Klassen), die im Rahmen des Nationalen Bildungspanels (NEPS;
Blossfeld, Roßbach & von Maurice, 2011) untersucht wurden, wurden das akademische Selbstkonzept im Fach Mathematik
sowie die Noten im letzten Zeugnis für das Fach Mathematik erhoben. Zur Überprüfung differenzieller Effekte unserer Ergebnisse
wurde dieser Effekt auch in der Stichprobe von Kindern ohne SPF-L in den 103 Integrationsklassen (_n_ = 1250) überprüft.
In Mehrebenenanalysen zeigte sich, dass entgegen unserer Erwartungen in Förderschulklassen das mittlere Leistungsniveau
der Klasse (d. h. Notendurchschnitt der Klasse) unter Berücksichtigung der individuellen Leistung keinen Einfluss auf das
akademische Selbstkonzept hatte, während in Integrationsklassen ein deutlicher Kontexteffekt in erwarteter Richtung zu finden
war. Es zeigte sich, dass der BFLPE in Integrationsklassen für die Kinder mit SPF-L sehr hoch ausfiel (BFLPE = 1.207, _p_<.001),
tendenziell auch höher als für die Kinder ohne SPF-L (BFLPE = 0.803, _p_<.001) in diesen Klassen.
Der ausbleibende BFLPE in Förderschulklassen lässt vermuten, dass der Mechanismus sozialer Vergleiche bezogen auf die
erreichten Noten in Mathematik keine bedeutsame Rolle bei der Ausprägung des akademischen Selbstkonzeptes von Kindern
mit SPF-L in Förderschulen spielt. Eher deuten unsere Ergebnisse darauf hin, dass individuelle Leistungen herangezogen
werden, um das Selbstkonzept zu etablieren (vgl. Valentine, DuBois & Cooper, 2004). Im Vergleich dazu spielt für Schülerinnen
und Schüler mit SPF-L, die eine Integrationsklasse an einer Regelschule besuchen, der Kontext eine weitaus größere Rolle. Die
stärkere Klassengemeinschaft dieser Schülergruppe führt zu einem geringer ausgeprägten akademischen Selbstkonzept für das
Fach Mathematik (siehe hierzu Bos, Müller & Stubbe, 2010). Es werden pädagogische Implikationen der Berücksichtigung
solcher Referenzgruppeneffekte und damit einhergehende Einflüsse auf das Interesse und den Wissenszuwachs von Lernenden
diskutiert, vor allem vor dem Hintergrund der aktuellen Debatte um die integrative Beschulung von Kindern mit
sonderpädagogischem Förderbedarf.
Zuwanderungsbedingte Disparitäten bei Grundschüler/innen mit sonderpädagogischem Förderbedarf im
Schwerpunkt Lernen – Die Rolle des sozioökonomischen Hintergrunds sowie kognitiver und schulischer
Kompetenzen
Jenny Kölm, Cornelia Gresch, Poldi Kuhl
Institut zur Qualitätsentwicklung im Bildungswesen (IQB)
Kinder mit einer ausländischen Staatsbürgerschaft sind an Förderschulen häufig überrepräsentiert und werden auch an
Regelschulen häufiger sonderpädagogisch gefördert als Kinder mit deutscher Staatsbürgerschaft (KMK, 2014). Dies betrifft
insbesondere den Förderschwerpunkt Lernen (ebd.). Die Interpretation der amtlichen Statistik auf Bundesebene birgt jedoch
Schwierigkeiten: Zum einen liegen diesbezüglich nicht für alle Länder belastbare Informationen vor, zum anderen werden in den
einzelnen Ländern verschiedene Kriterien zur Erfassung von sonderpädagogischer Förderung herangezogen (vgl. Malecki,
2013). Darüber hinaus wird über die Staatsbürgerschaft als Kriterium nur ein Teil der Kinder erfasst, die einen
Zuwanderungshintergrund aufweisen (vgl. Gresch & Kristen, 2011). Nicht zuletzt erlaubt die amtliche Statistik keine vertiefenden
Analysen zu möglichen Ursachen des Befundmusters, dass Kinder mit ausländischer Staatsbürgerschaft häufiger einen
sonderpädagogischen Förderbedarf (SPF) aufweisen als Kinder mit deutscher Staatsbürgerschaft. Eine mögliche Erklärung für
die Überrepräsentation könnte in einer systematischen Benachteiligung von Schüler/innen mit Zuwanderungshintergrund bei der
Feststellung eines SPF liegen (z. B. Gomolla & Radtke, 2009). Obwohl gerade im Förderschwerpunkt Lernen vor allem die
schulischen Kompetenzen dafür ausschlaggebend sein sollten, ob ein Kind die Diagnose eines SPF erhält, ist nicht
auszuschließen, dass über die Leistung hinaus weitere Kontextfaktoren wirksam werden. Bislang ebenfalls ungeklärt ist, inwiefern
mögliche Benachteiligungen von Kindern mit Zuwanderungshintergrund auf den in dieser Gruppe häufig niedrigeren
sozioökonomischen Status zurückgeführt werden können oder ob zuwanderungsspezifische Ursachen zugrunde liegen.
Die vorliegende Untersuchung geht diese offenen Fragen auf der Datengrundlage des IQB-Ländervergleichs 2011 in der
Primarstufe am Ende der vierten Klasse (_N_ = 27.081) an. In die Analysen einbezogen werden Kinder mit einem
Förderschwerpunkt Lernen an Regel- und an Förderschulen (_N_ = 726). Zunächst wird gezeigt, dass sich der Befund der
Überrepräsentation von Kindern mit ausländischer Staatsbürgerschaft unter den Kindern im Förderschwerpunkt Lernen
replizieren lässt. Bei abweichender Operationalisierung des Zuwanderungshintergrunds, beispielsweise über die Herkunft der
Eltern, ergeben sich jedoch veränderte Befundmuster. Weiterhin wird untersucht, inwiefern über die schulischen Leistungen und
kognitiven Grundfähigkeiten hinaus ein Zusammenhang des Zuwanderungshintergrunds mit der Zuweisung eines SPF Lernen
besteht. Anhand schrittweiser logistischer Regressionsmodelle wird geprüft, ob Kinder mit Zuwanderungshintergrund bei
vergleichbaren kognitiven und schulischen Kompetenzen und unter Kontrolle des sozioökonomischen Status häufiger einen
diagnostizierten SPF im Schwerpunkt Lernen aufweisen als Kinder ohne Zuwanderungshintergrund. Erste Analysen deuten
darauf hin, dass der Zuwanderungshintergrund für sich genommen nicht mit der Zuweisung eines SPF im Lernen
zusammenhängt. Nach Kontrolle der kognitiven und schulischen Kompetenzen des Kindes sowie des sozioökonomischem
Hintergrundes der Familie weisen jedoch Kinder mit einem Zuwanderungshintergrund seltener einen diagnostizierten SPF Lernen
auf als Kinder ohne Zuwanderungshintergrund. Die Ergebnisse werden abschließend vor dem Hintergrund ethnischer
Ungleichheiten und der Chancengerechtigkeit im deutschen Bildungssystem diskutiert.
ID: 260
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung
Thematisches Cluster: Bildung im Sekundarbereich, Kompetenzdiagnostik/ Kompetenzentwicklung, Trainings- und
Evaluationsforschung
Stichworte: Reformen, G8, Oberstufe, Implementation, Evaluation
Reformen im Bildungswesen: Aktuelle Befunde und Perspektiven
Chair(s): Nicolas Hübner (Universität Tübingen), Ulrich Trautwein (Universität Tübingen)
Diskutant(en): Marko Neumann (Deutsches Institut für Internationale Pädagogische Forschung)
Die Implementation von Bildungsreformen ist ein zentrales Instrument bildungspolitischen Handelns, und kaum ein Jahr vergeht
ohne neue Reformbestrebungen. Trotz der großen Bedeutung bildungspolitischer Reformen ist bisher nur wenig zu konkreten
Wirkungsweisen im Bildungssystem bekannt. Dies lässt sich auch auf die hohen Anforderungen an Studiendesigns und
statistische Methoden zurückführen, derer es bedarf, um Reformeffekte hinreichend klar zu isolieren und zu quantifizieren. Das
vorliegende Symposium bietet einen Überblick zu aktuellen Ergebnissen zentraler Reformstudien des letzten Jahrzehnts,
namentlich der G8-Reform und der großen Oberstufenreform. Dabei findet neben den strukturellen Änderungen auch die
Relevanz weiterer Variablengruppen bzw. Akteure (z.B. die Lehrerschaft) einige Beachtung.
Hierzu werden im ersten Beitrag die Wirksamkeit der G8-Reform im Hinblick auf das Alter beim Erwerb des Abschlusses sowie
Klassenwiederholungs- und Abschlussquoten untersucht. Hierbei zeigt sich, dass die Schulzeitverkürzung im Mittel zu einer
Reduktion des Abschlussalters von rund 10 Monaten führt. Eine mögliche Erklärung hierfür sind Anstiege in den
Wiederholungsquoten um 21% (Beitrag 1). Im zweiten Beitrag werden die jüngsten Befunde zur G8-Reform in BadenWürttemberg dargestellt. Hier finden sich Leistungsunterschiede in den Bereichen Englisch-Lesen und Biologie, während
Schülerinnen und Schüler aus G8- und G9-Jahrgängen in den Bereichen Mathematik und Physik gleich gut abschneiden. In den
untersuchten Bereichen zum Wohlbefinden zeigen sich Unterschiede zuungunsten der G8-Schülerinnen und Schüler (Beitrag 2).
Anschließend rückt ein dritter Beitrag die Akteursgruppe der Lehrer näher in den Fokus. Konkret wird untersucht, wie Lehrkräfte
und Schulleitungen von Gymnasien die Einführung des achtjährigen Bildungsgangs in NRW erlebt haben und welche
Herausforderungen und Handlungsstrategien eingesetzt worden sind. Hierbei zeigt sich, dass insbesondere die Verkürzung der
Sekundarstufe I unter Beibehaltung einer dreijährigen Oberstufe als zentrale Herausforderung wahrgenommen worden ist
(Beitrag 3). Abschließend werden Befunde zur Oberstufenreform in Thüringen vorgestellt. Dieser Beitrag zeigt zunächst, dass
sich insgesamt wenige Leistungsunterschiede vor und nach der Reform finden lassen. Gleichzeitigt legt er nahe, dass sich
Unterschiede in der Leistung der Schülerinnen und Schüler durch Schulunterschiede erklären lassen (Beitrag 4).
Beiträge des Symposiums
The impact of compressing instructional time on graduation age, grade repetitions and graduation rates
Mathias Hübener1, Jan Marcus2
1
DIW Berlin, 2DIW Berlin; Universität Hamburg
*Background*
Policy-makers face a trade-off choosing the optimal length of schooling. While more years of education entail monetary and nonmonetary advantages for individuals and for society (Card, 1999; Grossman, 2006; Lochner, 2011), they also delay labour force
participation (Brugiavini & Peracchi, 2005). This trade-off is particularly crucial given ageing populations in industrialised countries.
Earlier labour market entries could mitigate consequences of demographic ageing (Börsch-Supan et al., 2014). Several
industrialised countries try to achieve this by lowering the school starting age. Similarly, the current Europe-wide harmonisation
of university systems (Bologna process) aims at reducing the time spent in formal education (Bologna Declaration, 1999).
Between 2001 and 2007, 13 out of 16 German federal states passed laws for a novel policy approach that reduces the length of
the Gymnasium track by one year, while redistributing the same instructional time over the remaining fewer school years.
*Literature & Research Hypotheses*
This so-called G8-reform is a controversial and highly debated policy in Germany. The first G8 evaluations are based on a survey
of the double graduation cohort in one specific state (Meyer & Thomsen, 2012; Thiel et al., 2014; Büttner & Thomsen, 2015).
Only few evaluation studies use the regional and temporal variations in the reform implementation for the identification of
treatment effects (for a review of the existing evidence, see Huebener & Marcus, 2015).
We examine indicators of the overall effectiveness of the G8-reform by looking at the impact of the reform on the high school
graduation age, grade repetitions and graduation rates. Increased learning intensity imposes higher requirements on students to
follow class material. Some students may need to repeat a school year, or may consequently even be unable to cope with the
new conditions and drop out from Gymnasium. The overall reform benefits would be lowered. Our analysis also aim at constituting
an important grounding for other G8-studies that focus on comparisons of specific cohorts, as increased grade repetition rates
may lead to compositional changes between cohorts and may severely bias reform effect estimates.
*Data and Research Design*
We employ administrative data from the Federal Statistical Office, covering all students from the graduation cohorts 2002-2013
in Germany. We exploit the regional and temporal variations in the reform implementation with a difference-in-differences
approach (Borjas, 2007). We carefully examine the crucial common trend assumption through graphical inspections of pretreatment trends and several placebo regressions. We also conduct extensive sensitivity tests, including different sample
restrictions, econometric model specifications and standard error adjustments.
*Results*
We find that the G8-reform reduces the mean graduation age by about 10 months, suggesting that the reform falls short of its
potential of one full year. One possible explanation are increased grade repetitions, which go up by 21 percent (3 percentage
points). However, there is no evidence of adverse effect of the reform on the share of students attending the Gymnasium track
and on the share of students graduating from high school with university entrance qualifications. Our results show that grade
repetitions increase more for boys and occur mainly in the final years at high school.
Summing up, compressing instructional time into fewer years of schooling can decrease the school leaving age without adverse
effects on the high school graduation share. Most students graduate more quickly, though some cope with the increased learning
intensity by repeating a grade. Our results are important for countries in which ageing populations trigger the trade-off between
high education levels and early labour market entries. They are also important for the interpretation of G8-studies that compare
specific cohorts, especially when reform effects on grade repetitions are neglected.
Die G8-Reform in Baden-Württemberg: Unterschiede in der Leistung und dem Wohlbefinden vor und
nach der Reform
Wolfgang Wagner, Nicolas Hübner, Jochen Kramer, Benjamin Nagengast, Ulrich Trautwein
Universität Tübingen
_Theoretischer Hintergrund_. Im letzten Jahrzehnt fand in vielen Bundesländern eine Schulzeitverkürzung im Gymnasium um
ein Jahr bei gleichzeitiger Erhöhung der Schülerwochenstunden statt (Trautwein & Neumann, 2008), die als G8-Reform breite
Aufmerksamkeit auf sich zog und nicht unumstritten war und ist. Dies zeigt sich beispielsweise daran, dass Niedersachsen mit
dem Schuljahr 2015/2016 flächendeckend zum G9 zurückkehrt (KMK, 2014). Die Diskussion der G8-Reform wird noch immer
auf einer überschaubaren empirischen Basis geführt. Der wissenschaftliche Forschungsstand zu den intendierten und nichtintendierten Reformeffekten der Schulzeitverkürzung kann derzeit als unbefriedigend bezeichnet werden (vgl. Kühn, van
Ackeren, Bellenberg, Reintjes & im Brahm, 2013). Eine häufig geäußerte Kritik am achtjährigen Gymnasium bezieht sich auf
erwartete negative Effekte im Hinblick auf die Leistungsentwicklung und in Bezug auf das Wohlbefinden der Schülerinnen und
Schüler (vgl. Kühn et al., 2013). In ersten empirischen Studien zeigten sich diesbezüglich keine oder geringfügige Unterschiede
zuungunsten der G8-Schülerinnen und Schüler (Büttner & Thomsen, 2015; Böhm-Kasper & Weißhaupt, 2002; Milde-Busch, et
al. 2010).
_Fragestellung_. Der Beitrag behandelt die Frage, ob sich Leistungsunterschiede für Schülerinnen und Schüler aus G8- und G9Jahrgängen in Baden-Württemberg im Hinblick auf die Domänen Mathematik, Englisch (Lesekompetenz), Biologie und Physik
ergeben. Diesbezüglich wurden auf Basis von Daten des Nationalen Bildungspanels (NEPS Zusatzstudie Baden-Württemberg;
Blossfeld, Rossbach & Maurice, 2011; Wagner et al., 2011) drei Abschlussjahrgänge eingehend miteinander verglichen.
Zusätzlich wurde untersucht, ob sich Unterschiede in Bezug auf die Bereiche des Beanspruchungserlebens und des
gesundheitlichen Wohlbefindens zeigen.
_Methode_. Bei den untersuchten Kohorten handelt es sich um den letzten G9-Abschlussjahrgang aus dem Jahr 2011, den aus
G8- und G9-Schülerinnen und Schülern bestehenden Abschlussjahrgang („Doppeljahrgang“) aus dem Jahr 2012 sowie den
ersten ausschließlichen G8-Abschlussjahrgang aus dem Jahr 2013. Berücksichtigt wurden Daten von insgesamt _N_ = 5210
Schülerinnen und Schülern aus 48 Schulen. Zur Auswertung der Daten wurden verschiedene mehrdimensionale MehrgruppenIRT-Modelle mit und ohne Adjustierung für relevante Hintergrundmerkmale spezifiziert. Die hierarchische Struktur der Daten
sowie fehlende Werte wurden bei den Analysen durch Verwendung von robusten Schätzverfahren sowie Full-InformationMaximum-Likelihood-(FIML-)Verfahren berücksichtigt. Zusätzlich wurden Stichprobengewichte verwendet, um das Sampling
Design adäquat zu berücksichtigen.
_Ergebnisse_. In den Bereichen Englisch-Lesen und Biologie zeigten sich geringfügige Leistungsvorteile für die G9-Schülerinnen
und Schüler. Für die Domänen Mathematik und Physik fanden sich hingegen keine Unterschiede. In Bezug auf das
Beanspruchungserleben und das gesundheitliche Wohlbefinden ergaben sich je nach Vergleichsgruppe teilweise deutliche
Unterschiede zuungunsten von Schülerinnen und Schülern aus G8-Jahrgängen. Die Ergebnisse werden vor dem Hintergrund
der Rahmenbedingungen der G8-Reform diskutiert.
„Wir machen erst mal gar nichts.“ – Eine prozessorientierte Betrachtung der Schulzeitreform am
Gymnasium aus Sicht der Implementationsforschung
Mirko Krüger, Svenja Kühn, Isabell van Ackeren
Universität Duisburg-Essen
*Theoretischer Hintergrund und Fragestellungen*
Kaum ein anderes bildungspolitisches Thema wurde und wird in der Öffentlichkeit so anhaltend und intensiv diskutiert wie die
Einführung des achtjährigen Bildungsgangs am Gymnasium. In Anlehnung an Altrichter und Wiesinger (2004) sowie Zapf (1994)
kann sie als eine Neuerung betrachtet werden, die in ihrer Anlage auf mehreren Ebenen des Bildungssystems Veränderungen
vorsieht. So intendiert sie z.B. auf Einzelschulebene im Kontext der erforderlichen curricularen Entwicklungsarbeit eine auf
Unterrichtsebene anzubahnende veränderte Handlungspraxis der Lehrkräfte (z.B. Anbahnung von Kompetenzen auf der
Grundlage neuer Lehrwerke). Damit verschränkt sind Veränderungen in der Dimension Wissen und Einstellungen (z.B. im
Hinblick auf neu zu implementierende Lernkonzepte) und materielle Aspekte (z.B. neue schulinterne Lehrpläne). Zugleich ist im
Zuge der Einführung der Reform potenziell von Veränderungen in den sozialen und organisationalen Strukturen der Gymnasien
auszugehen (z.B. bei der Gestaltung des Ganztages).
Unter Bezugnahme auf Ansätze der schulbezogenen Implementationsforschung (z.B. Fullan, 2001; Gräsel, 2010; Hasselhorn et
al., 2014; Euler & Sloane, 1998) muss angenommen werden, dass die tatsächliche Umsetzung der Schulzeitreform divergieren
und zu differenziellen Wirkungen bei verschiedenen Akteursgruppen auf unterschiedlichen Ebenen des Bildungssystems führen
kann. Inwiefern in diesem Kontext reformkonformes Handeln zu beobachten ist, ist noch ungeklärt. Bisherige Studien verfolgen
einen wirkungsorientierten Ansatz (zusammenfassend Kühn et al., 2013; Huebener & Marcus, 2015). Es fehlen jedoch Hinweise
auf die den Wirkungen zugrunde liegenden reformbezogenen Sichtweisen der an der Umsetzung beteiligten Akteure. Außerdem
liegen derzeit keine Erkenntnisse über die damit verbundenen Interpretationen und Übersetzungsprozesse auf Einzelschulebene
vor. Demnach sind in dieser Studie folgende Forschungsfragen handlungsleitend:
(1) Wie haben Lehrkräfte und Schulleitungen von Gymnasien mit achtjährigem Bildungsgang dessen Einführung erlebt?
(2) Welche schulischen Herausforderungen traten in diesem Kontext auf und welche Handlungsstrategien kamen bei deren
Bewältigung zum Tragen?
*Methode*
Es wurden Interviews mit Schulleitungen (17 Schulleitungen und stellvertretende Schulleitungen) und Lehrkräften (67 Lehrkräfte)
aus dreizehn Gymnasien mit unterschiedlichen schulischen (z.B. Schulgröße) und kontextuellen Merkmalen (z.B. soziale Lage)
in Nordrhein-Westfalen durchgeführt. An den Interviews nahmen Lehrkräfte beiden Geschlechts mit unterschiedlichen
Fächerkombinationen, schulischen Funktionen und Lehrdeputaten in der Einführungsphase, Mittel- und Oberstufe teil. In den
Gesprächen wurde nach dem Verfahren des problemzentrierten Interviews nach Witzel (2000) vorgegangen. Die Auswertung
der Transkripte erfolgte mit Hilfe der zusammenfassenden Inhaltsanalyse nach Mayring (2015), um Argumentations- und
Deutungsmuster zu den angesprochenen Themenbereichen identifizieren zu können.
*Ergebnisse*
Die Befragten haben weniger pädagogische Erwägungen als vielmehr ökonomische Gründe, auch als Reaktion auf aktuelle
demografische Entwicklungen in Deutschland, sowie politische Profilierungsabsichten als maßgeblich für die Einführung des
achtjährigen Bildungsgangs in Nordrhein-Westfalen wahrgenommen. Sowohl die befragten Lehrkräfte als auch die interviewten
Schulleitungen erachten die Reform in der Rückschau als nicht durchdacht und übereilt eingeführt.
Vor diesem Hintergrund berichten die schulischen Akteure von mehreren schulischen Herausforderungen bei der Umsetzung der
im Zuge des achtjährigen Bildungsgangs erforderlichen Entwicklungsaufgaben. Als besonders herausfordernd wird die
Verkürzung der Sekundarstufe I unter Beibehaltung einer dreijährigen Oberstufe erachtet, da sich diese nach Ansicht der
Interviewten negativ auf die Entwicklung während der Pubertät der Schülerinnen und Schüler niederschlage. Weiterhin wird die
unzureichende materielle, personelle und ideelle Unterstützung durch die Schulaufsicht bei den Entwicklungsaufgaben
thematisiert. Dabei berichten die Befragten insbesondere von den mit der Erstellung kompetenzorientierter schulinterner
Lehrpläne verbundenen Schwierigkeiten. Diese ergaben sich durch die den Schulen zu Beginn der Reform noch nicht
vorliegenden ministeriellen Vorgaben, eine so wahrgenommene unzureichende Einführung und Begleitung im curricularen
Entwicklungsprozess sowie ein mangelndes Verständnis über das den neuen Kernlehrplänen zugrunde liegende
Unterrichtsprinzip der Kompetenzorientierung. Insgesamt lassen sich vier verschiedene Handlungsstrategien im Umgang mit den
Herausforderungen der Schulzeitverkürzung identifizieren. In ihnen kommen unterschiedliche Reaktionen und Aktivitätsgrade im
Zusammenhang mit den durch die Einführung des achtjährigen Bildungsgangs bedingten Entwicklungsaufgaben zum Vorschein.
Die Oberstufenreform in Thüringen: Leistungsunterschiede und Einflussfaktoren auf die Leistung auf
Kurs- und Schulebene vor und nach der Reform
Nicolas Hübner, Wolfgang Wagner, Benjamin Nagengast, Ulrich Trautwein
Universität Tübingen
_Theoretischer Hintergrund_. In der ersten Dekade des 21. Jahrhunderts ließ sich in zahlreichen Bundesländern ein
bildungspolitischer Trend verzeichnen, der sich u.a. in einer Umstrukturierung der gymnasialen Oberstufe ausdrückte (Trautwein,
Neumann, Nagy, Lüdtke & Maaz, 2010). Der gymnasialen Oberstufe kann eine besondere Bedeutung als Gelenkstelle zwischen
der schulischen Ausbildung und einem Studium zugesprochen werden (Trautwein & Neumann, 2008). Grundlage der
Veränderung der gymnasialen Oberstufe bildeten die von der KMK 1999 verabschiedeten Husumer Beschlüsse, die eine
Erweiterung der Anzahl der Prüfungsfächer im Abitur auf maximal fünf Fächer ermöglichten. Im Anschluss an die Beschlüsse
reformierten zahlreiche Bundesländer ihre gymnasiale Oberstufe, beginnend mit Baden-Württemberg im Jahr 2002. In Thüringen
trat die Oberstufenreform 2009 in Kraft. Vor der Oberstufenreform waren zwei Leistungsfächer, jeweils sechsstündig zu belegen
sowie zwei Grundfächer, davon ein schriftliches Grundfach vierstündig und ein mündliches Grundfach drei-stündig
(Kultusministerium Thüringen, 2007). Nach der Reform mussten Schülerinnen und Schüler insgesamt fünf vierstündige
Abiturfächer belegen, davon zwei Kernfächer (Mathematik und Deutsch) sowie drei weitere Fächer mit erhöhtem
Anforderungsniveau. (Kultusministerium Thüringen, 2008). Ein zentrales Ziel der Veränderung war eine Vereinheitlichung der
Abiturprüfung (Trautwein & Neumann, 2008), die im Wesentlichen durch eine obligatorische Belegung der Fächer Deutsch und
Mathematik auf erhöhtem Anforderungsniveau umgesetzt wurde.
_Fragestellung_. Der vorliegende Beitrag untersucht die Frage, ob sich Unterschiede zwischen Schülerinnen und Schülern vor
und nach der Oberstufenreform in Thüringen in Bezug auf die Leistungen in den Domänen Mathematik, Englisch
(Lesekompetenz), Biologie und Physik finden lassen. Anschließend wird für die Bereiche Englisch und Mathematik – die (nahezu)
durchgängig belegt wurden – untersucht, inwieweit sich Unterschiede zwischen den Leistungen der Schülerinnen und Schüler
auf Kurs- und Schulebene zeigen und ob sich diese Unterschiede durch (aggregierte) Lehrermerkmale erklären lassen.
_Methode_. Zur Beantwortung der vorliegenden Fragestellung wurde auf Daten des Nationalen Bildungspanels (NEPS) der
Zusatzstudie Thüringen zurückgegriffen (Blossfeld, Rossbach & Maurice, 2011; Wagner et al., 2011). In diesem Datensatz liegen
Informationen aus insgesamt 32 Schulen des letzten Jahrgangs vor der Reform und aus 31 Schulen nach der Reform vor, die im
Rahmen eines Kohorten-Kontroll-Designs erhoben wurden (Shadish, Cook & Campbell, 2002). Zur Analyse der Daten wurde ein
mehrschrittiges Vorgehen gewählt: Zunächst erfolgte die Untersuchung von Leistungsunterschieden vor und nach der Reform
auf Basis von Mehrgruppen-IRT-Modellen. Hierbei wurden unadjustierte Modelle ohne Kovariaten und adjustierte Modelle mit
Kovariaten (z.B. dem Geschlecht, Sozioökonomischen Status, etc.) berechnet. Darüber hinaus wurden mögliche Interaktionen
des Geschlechts mit der Reform untersucht. Eine Berücksichtigung des Sampling Designs erfolgte durch die Schätzung robuster
Standardfehler und die Verwendung von Stichprobengewichten. Fehlende Werte wurden mit der Full Information Maximum
Likelihood-Methode (FIML) behandelt. Zur Beantwortung der zweiten Teilfragestellung wurden Mehrebenenmodelle eingesetzt,
mit deren Hilfe separate Effekte auf unterschiedlichen Ebenen untersucht wurden.
_Ergebnisse_. Für die untersuchten Leistungsbereiche zeigten sich mit Ausnahme der Englisch-Lesekompetenz zunächst keine
statistisch signifikanten Unterschiede zwischen den beiden Kohorten in Modellen ohne Kontrolle weiterer Kovariaten. In den
adjustierten Modellen wurde auch der Unterschied in der Englisch-Lesekompetenz nicht mehr statistisch signifikant. Darüber
hinaus fanden sich Hinweise auf Geschlechterunterschiede: So schnitten Schülerinnen vor der Reform in den Bereichen
Mathematik und Physik schlechter ab, während sie in Englisch-Lesen bessere Leistungen erzielten als Schüler. Nach der Reform
fand sich ein ähnliches Bild, wobei hier der Unterschied zwischen Schülerinnen und Schülern in der Englischleistung signifikant
geringer ausfiel. Erste Analysen im Rahmen der Mehrebenenmodelle legen nahe, dass sich Unterschiede in der Leistung der
Schülerinnen und Schüler durch Schulunterschiede erklären lassen.
ID: 274
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung
Thematisches Cluster: Gesundheit/ Stress/ Belastung, Motivation und Emotion, Unterrichtsentwicklung/ Unterrichtsqualität
Stichworte: Professionelle Kompetenz von Lehrkräften; Wohlbefinden; Burnout; Unterrichtsqualität
Professionelle Kompetenz und berufliches Wohlbefinden von Lehrkräften: "Beating the Odds"
Chair(s): Anna Katharina Praetorius (Deutsches Institut für Internationale Pädagogische Forschung), Fani Lauermann
(Rheinische Friedrich-Wilhelms-Universität Bonn)
Diskutant(en): Detlev Leutner (Universität Duisburg-Essen)
Der Lehrberuf gilt als äußerst herausfordernd, da Lehrkräfte viele verschiedene Aufgaben – und dies zum Teil zeitgleich –
bewältigen müssen (Doyle, 1977). Aufgrund dieser vielfältigen Herausforderungen sowie aufgrund der sozialen Orientierung des
Lehrberufs gelten Lehrkräfte als besonders anfällig für chronischen Stress, psychische Beeinträchtigungen und Burnout
(Aktionsrat Bildung [ARB], 2014; Maslach, 2003). Dies ist problematisch: Das berufliche Wohlbefinden von Lehrkräften—deren
Erleben von Stress und Burnout, aber auch Berufszufriedenheit—hat weitreichende Konsequenzen nicht nur für Lehrkräfte,
sondern auch für ihre Schülerinnen und Schüler. Burnout ist unter anderem negativ mit der Unterrichtsqualität von Lehrkräften
assoziiert (Butler & Shibaz, 2015; Klusmann, Kunter, Trautwein, & Baumert, 2006) und steht in positivem Zusammenhang mit
unerwünschten Erscheinungen wie Frührente, Fehlzeiten sowie somatischen und psychischen Problemen (ARB, 2014).
Vor diesem Hintergrund stellt sich die Frage: Welche Faktoren können Lehrkräfte dabei unterstützen, mit Berufsbelastungen
produktiv umzugehen, um ihr berufliches Wohlbefinden zu stärken und somit zu ihrem beruflichen Erfolg beizutragen? Die vier
Beiträge des Symposiums nutzen verschiedene Herangehensweisen, um diese Frage zu beantworten. Die Vortragenden
demonstrieren, dass Elemente des beruflichen Wohlbefindens von Lehrkräften wie Burnout (Beiträge 1-2) und
Berufszufriedenheit (Beiträge 3-4), aber auch deren Unterrichtsqualität (Beiträge 3-4), in einem Zusammenhang stehen mit
persönlichen Ressourcen wie pädagogisch-psychologischem Wissen (Beiträge 1-2), berufsrelevanten Überzeugungen und
motivationalen Orientierungen (Beiträge 1-4), Selbstregulationsfähigkeiten (Beitrag 1) sowie Persönlichkeitsmerkmalen wie
Perfektionismus (Beitrag 3). Von besonderem Interesse sind mögliche Wirkmechanismen, durch die die professionelle
Kompetenz von Lehrkräften (deren Wissen, Motivation und Selbstregulationsfähigkeiten) und Persönlichkeitsmerkmale
(Perfektionismus) mit dem beruflichen Wohlbefinden und der Unterrichtsqualität von Lehrkräften verknüpft sind (z. B. direkte vs.
indirekte Effekte sowie mögliche Moderationseffekte). Methodenartefakte, die die Schätzung dieser Zusammenhänge
beeinflussen können, werden im Symposium ebenfalls berücksichtigt und diskutiert (Beitrag 4).
Die einzelnen Beiträge nutzen diverse methodische Herangehensweisen und Studiendesigns: (a) längsschnittlich (Beitrag 1) und
querschnittlich erhobene Daten (Beiträge 1-4), (b) verschiedene Datenquellen wie Wissenstests (Beiträge 1-2),
Lehrerselbstberichte (Beiträge 1-4) und Schülereinschätzungen der Lehrkräfte (Beitrag 3), (c) Stichproben mit angehenden
(Beitrag 1) und erfahrenen (Beiträge 3-4) Lehrkräften sowie (d) nationale (Beiträge 1-3) und internationale (Beitrag 4) Datensätze.
Zusammenfassend stellen die AutorInnen fest, dass die professionelle Kompetenz von Lehrkräften eine vielversprechende
Grundlage für weitere Forschung zur Stärkung des beruflichen Wohlbefindens und Erfolgs von Lehrkräften darstellt und somit
eine Grundlage für „Beating the Odds“ gegen Stress, Belastungen, Burnout und beruflichen Misserfolg darstellt.
Beiträge des Symposiums
Mehr Wissen = weniger Stress? Professionelle Kompetenz und Beanspruchungserleben von Lehrkräften
im Vorbereitungsdienst
Uta Klusmann1, Oliver Lüdtke2, Thamar Voss3, Mareike Kunter4
1
IPN Kiel, 2IPN Kiel; ZIB, 3Eberhard-Karls-Universität Tübingen, 4Goethe-Universität Frankfurt am Main
Theoretischer Hintergrund
Der Beginn der beruflichen Praxis stellt für viele Lehrkräfte eine große Herausforderung dar und wird häufig auch als
„Praxisschock“ bezeichnet (Goddard, O’Brien & Goddard, 2006). Entsprechende empirische Arbeiten weisen auf erhöhte
Beanspruchung insbesondere im ersten Jahr der beruflichen Praxis hin (Klusmann et al., 2012). Vor dem Hintergrund klassischer
Stress-Modelle ist anzunehmen, dass neben Umweltmerkmalen auch Merkmale der Lehrkräfte eine Rolle für das
Beanspruchungserleben spielen (Lazarus & Folkman, 1984). Die bisherige Forschung untersucht als personale Einflussgrößen
überwiegend situationsübergreifende Persönlichkeitseigenschaften wie Neurotizismus (Rothland & Klusmann, 2012). Dabei kann
angenommen werden, dass auch situationsspezifische Kompetenzen dafür relevant sein können, ob berufliche Anforderungen
als bedrohlich erlebt werden (Lazarus & Folkman, 1984).
Die professionelle Kompetenz von Lehrkräften beschreibt die Voraussetzungen für die erfolgreiche Bewältigung der
Anforderungen im Lehrerberuf (Kunter et al., 2011). Neben dem Professionswissen von Lehrkräften (fachlich, fachdidaktisch und
pädagogisch-psychologisch) werden auch motivationale Orientierungen und berufliche Selbstregulation als Kompetenzaspekte
postuliert. Insbesondere die Fähigkeit zur beruflichen Selbstregulation wird als zentral für die Vermeidung beruflicher
Beanspruchung angesehen (Klusmann et al., 2008).
In der aktuellen Studie wird untersucht, inwieweit die professionelle Kompetenz beim Einstieg in die berufliche Praxis das
Beanspruchungserleben von Lehrkräften vorhersagen kann. Zur Beantwortung dieser Frage kombinieren wir einen 1-Jahres
Längsschnitt im ersten Jahr des Vorbereitungsdiensts mit den Daten einer Tagebuchstudie, in welcher die angehenden Lehrkräfte
ihre täglichen positiven (uplifts) und negativen Ereignisse (hassles) bei ihren beruflichen Tätigkeiten beschreiben.
Fragestellungen
1) Kann die professionelle Kompetenz zu Beginn der praktischen Tätigkeit das Beanspruchungserleben zum Ende des ersten
Jahres im Vorbereitungsdienst vorhersagen?
2) Wird der Zusammenhang zwischen professioneller Kompetenz und Beanspruchungserleben durch das Erleben von positiven
(uplifts) und negativen (hassles) Ereignissen im beruflichen Alltag mediiert?
Methode
Die Datengrundlage für die vorliegende Untersuchung bildet die Studie COACTIV-Referendariat (COACTIV-R; Kunter et al.,
2011). Die aktuellen Analysen berücksichtigen die Lehramtskandidaten, die sich im ersten Jahr des Vorbereitungsdienstes
befanden und zu Beginn (T1) und am Ende (T2) des ersten Schuljahres befragt wurden. Zusätzlich fand in der Mitte des
Schuljahrs eine zweiwöchige Tagebuchstudie statt, in welcher die Teilnehmer jeden Abend über ihre täglichen positiven und
negativen Ereignisse berichteten. Die verwendete Teilstichprobe besteht aus N = 239 angehenden Lehrkräften, die alle als ein
Fach Mathematik haben.
Beanspruchungserleben wurde mittels emotionaler Erschöpfung operationalisiert und zu T1 und T2 erfragt (Baumert et al., 2009).
Professionelle Kompetenz. Es wurden vier Kompetenzaspekte berücksichtigt, die zu T1 erfasst wurden: das fachdidaktische
Wissen in Mathematik (Testverfahren; Krauss et al., 2008), das Pädagogisch-Psychologische Wissen (Testverfahren, Voss et
al., 2011), die Selbstwirksamkeit (Schwarzer & Jerusalem, 1999) und die berufliche Selbstregulation (Schaarschmidt und Fischer,
1996).
Hassles und uplifts. Es konnten in der Tagebuchstudie mittels eines offenen Antwortformats täglich bis zu 10 positive (uplifts)
und negative (hassles) berufliche Ereignisse genannt werden. Die Anzahl der Hassles und uplifts einer Person wurde pro Tag
aufsummiert.
Ergebnisse
Aufgrund der hierarchischen Datenstruktur (Messungen der Tagebuchstudie geschachtelt innerhalb von Lehrkräften) wurden
Mehrebenen-Pfadanalysen durchgeführt (Bolger & Laurenceau, 2013). Die Ergebnisse zeigten, dass - unter Kontrolle der
emotionalen Erschöpfung zu T1 - Lehrkräfte, mit einem höheren pädagogisch-psychologischen Wissen und einer adaptiven
Selbstregulation zu Beginn des Schuljahres, geringere emotionale Erschöpfung zum Ende des ersten Schuljahres aufwiesen.
Dieser Zusammenhang wurde durch die täglichen hassles und uplifts mediiert, d.h. Personen mit höheren Kompetenzwerten
berichteten in ihrem beruflichen Alltag weniger hassles als uplifts. Keine signifikanten Effekte zeigten sich für das Fachdidaktische
Wissen.
Die Studie verdeutlicht, dass die professionelle Kompetenz der Lehrkräfte nicht nur für das Lernen der Schüler (Kunter et al.,
2013), sondern auch für die Lehrkräfte selbst Relevanz hat. Die Tatsache, dass neben den Fähigkeiten zur Selbstregulation das
pädagogisch-psychologische Wissen die Güte der Bewältigung alltäglicher beruflicher Ereignisse vorhersagen kann, weist auf
die Bedeutsamkeit einer guten theoretischen Grundlage für das erfolgreiche Handeln im Lehrerberuf.
Professionelle Kompetenzen und Wohlbefinden von Lehrkräften: Eine Analyse der Zusammenhänge
zwischen Pädagogisch-Psychologischem Wissen, Selbstwirksamkeit und Burnout
Fani Lauermann1, Johannes König2
1
Rheinische Friedrich-Wilhelms-Universität Bonn, 2Universität zu Köln
Theoretischer Hintergrund
Burnout von Lehrkräften—das Erleben emotionaler Erschöpfung, Depersonalisierung von Schülerinnen und Schülern und die
Wahrnehmung reduzierter Leistungsfähigkeit—hat gravierende Konsequenzen für den beruflichen Erfolg und das Wohlbefinden
von Lehrkräften (e.g., Butler & Shibaz, 2015; Klusmann, Kunter, Trautwein, Lüdtke, & Baumert, 2008; Maslach, 2003). Burnout
hängt mit unerwünschten Ergebnissen zusammen wie Fehlzeiten, Frührente, unzureichenden beruflichen Leistungen und
Depression (ARB, 2014; Swider & Zimmerman, 2010). Eine wesentliche Ursache für Burnout ist die chronische Belastung, die
zum Beispiel aus dem Missverhältnis zwischen Arbeitsanforderungen und den persönlichen Ressourcen, die für die Erfüllung
dieser Anforderungen benötigt werden, resultiert (Maslach, 2003). Lehrkräfte mit stärker ausgeprägten persönlichen
Ressourcen—z.B. hohe Selbstwirksamkeit (Vertrauen in die eigenen Fähigkeiten), adaptive Problembewältigungsstrategien und
pädagogisch-psychologisches Wissen—sind eher in der Lage die Anforderungen des Lehrerberufs zu erfüllen; es ist daher auch
weniger wahrscheinlich, dass sie Burnout erleiden (Durr, Chang, & Carson, 2014).
Nur wenige Studien haben jedoch bisher die kombinierten prädiktiven Effekte von persönlichen Ressourcen wie pädagogischpsychologisches Wissen (general pedagogical-psychological knowledge, GPK) und Selbstwirksamkeit von Lehrkräften auf das
Erleben von Burnout untersucht, wobei diese sich weitgehend auf angehende Lehrkräfte und auf lediglich eine Burnoutdimension,
nämlich emotionale Erschöpfung, beschränken (Dicke et al., 2015; Klusmann, Kunter, Voss, & Baumert, 2012). Aufbauend auf
diese Evidenz fokussiert sich die vorliegende Studie dagegen auf erfahrene Lehrkrafte und auf drei Burnoutdimensionen:
emotionale Erschöpfung, reduzierte Leistungsfähigkeit und Depersonalisierung. Mögliche Geschlechtsunterschiede und die Rolle
von Lehrerfahrung werden ebenfalls berücksichtigt, da solche persönlichen Merkmale oft mit den Überzeugungen und dem
Wissen von Lehrkräften zusammenhängen (z.B. Klassen & Chiu, 2010; König et al., 2014).
Fragestellungen
Die folgenden Zusammenhänge werden untersucht: (F#1) die Beziehungen zwischen Geschlecht und Lehrerfahrung auf der
einen Seite und GPK, Selbstwirksamkeit und Burnout auf der anderen Seite; (F#2) die Beziehungen zwischen GPK und
lehrerspezifischer versus allgemeiner Selbstwirksamkeit; und (F#3) die direkten und indirekten prädiktiven Effekte von GPK auf
Burnout, die eventuell über Lehrerselbstwirksamkeit vermittelt werden.
Methode
Daten von 119 Lehrkräften wurden mittels Pfadanalysen ausgewertet (König, 2015). GPK wurde mit einer IRT-skalierten
Testbatterie aus der TEDS-M Studie gemessen (König, Blömeke, Paine, Schmidt, & Hsieh, 2011). Allgemeine Selbstwirksamkeit
wurde mit einer 10-Item-Skala nach Schwarzer and Jerusalem (1995) erfasst, und Lehrerselbstwirksamkeit wurde mit einer 10Item-Skala nach Schwarzer und KollegInnen erfasst (Schwarzer & Hallum, 2008). Burnout wurde mit dem Maslach Burnout
Inventory erfasst (Maslach, Jackson, & Leiter, 1996).
Ergebnisse
Zu F#1. Pfadanalysen zeigten keine signifikanten Geschlechtsunterschiede; Lehrkräfte mit mehr Lehrerfahrung berichteten
jedoch geringere allgemeine und lehrspezifische Selbstwirksamkeit. Darüber hinaus gab es einen kurvilinearen Zusammenhang
zwischen Lehrerfahrung und GPK; wenig und hoch erfahrene Lehrkräfte hatten geringere GPK-Werte als Lehrkräfte mit mittlerem
Niveau an Erfahrung. Zwischen Lehrerfahrung und Burnout wurde kein signifikanter Zusammenhang festgestellt.
Zu F#2. Erwartungsgemäß war GPK positiv mit Lehrerselbstwirksamkeit assoziiert, aber nicht mit allgemeiner Selbstwirksamkeit,
was darauf hindeutet, dass dieser Effekt berufsspezifisch ist.
Zu F#3. GPK hatte außerdem negative indirekte (über Lehrerselbstwirksamkeit vermittelt) prädiktive Effekte auf alle drei
Burnoutdimensionen. Weiterhin hatte GPK einen direkten negativen prädiktiven Effekt auf Depersonalisierung.
Die vorliegende Studie trägt somit zu einem expandierenden Forschungbereich bei, der darauf hindeutet, dass GPK nicht nur
auf die Unterrichtsqualität von Lehrkräften (Pflanzl, Thomas, & Matischek-Jauk, 2013; Voss, Kunter, & Baumert, 2011), sondern
auch auf ihr berufliches Wohlbefinden eine positive Auswirkung haben kann (Dicke et al., 2015; Klusmann et al., 2012). Dieser
Effekt bezieht sich nicht nur auf angehende (vgl. Dicke et al., 2015), sondern auch auf erfahrene Lehrkräfte. Darüber hinaus
indizieren die Ergebnisse dieser Studie, dass GPK unter anderem dadurch positive Auswirkungen auf das berufliche
Wohlbefinden von Lehrkräften haben kann, dass GPK positiv mit Lehrerselbstwirksamkeit assoziiert ist. Somit haben beide
Konstrukte—GPK und Selbstwirksamkeit—eine hohe Relevanz für die weitere Interventionsforschung zur Burnoutprävention.
Zusammenhänge funktionaler und dysfunktionaler Komponenten des Perfektionismus mit
motivationalen Aspekten, Unterrichtsqualität und Belastungserleben bei Lehrkräften
Gerlinde Lenske1, Anna-Katharina Praetorius2, Katharina Drexler3, Oliver Dickhäuser4, Markus Dresel3
1
Universität Koblenz-Landau, 2Deutsches Institut für Internationale Pädagogische Forschung, 3Universität Augsburg,
4
Universität Mannheim
Theoretischer Hintergrund
Perfektionismus gilt als ein wichtiger Einflussfaktor für die Gesundheit von Menschen (z. B. Dunkley, Zuroff & Blankstein, 2003).
Während Einigkeit über die Mehrdimensionalität von Perfektionismus besteht, finden sich unterschiedliche Konzeptualisierungen
in der Fachliteratur, wobei zwischen dysfunktionalen und funktionalen Facetten unterschieden wird (z. B. Frost, Marten, Lahart &
Rosenblate, 1990; Hewitt & Flett, 1991; Slaney, Rice, Mobley, Trippi & Ashbey, 2001). Als funktionale Facetten gelten hohe
selbstbezogene Standards sowie die Wertschätzung von Ordnung und Struktur, als dysfunktional eine ausgeprägte
Fehlersensibilität, Zweifel an der eigenen Leistungsfähigkeit, wahrgenommene Diskrepanzen zwischen den eigenen Standards
und dem Erreichten sowie die Wahrnehmung, dass die hohen Standards fremdgesetzt sind (Altstötter-Gleich & Bergemann,
2006). Während funktionaler Perfektionismus mit adäquaten Copingstrategien, höherem Selbstwertgefühl und höherer
Leistungsmotivation einhergeht und daher als präventiv in Bezug auf Stresserleben, Depression und Belastungserleben sowie
als leistungsförderlich beschrieben wird (z. B. Accordino, Accordino & Slaney, 2000; Ashby & Rice, 2002; Dunkley et al., 2003;
Slaney et al., 2001; Stoeber & Rennert, 2008), erweist sich dysfunktionaler Perfektionismus als gesundheitsgefährdend (z. B.
Bieling, Israeli & Antony, 2004; Edington, 2014; Smyth, 2002; Stumpf & Parker, 2000; Dunkley et al., 2003; Sumi & Kanda, 2002
). Auch für Lehrkräfte liegen bereits erste theoriekonforme Befunde zur Bedeutsamkeit von Perfektionismus hinsichtlich
Stresserleben und Burnout vor (Stoeber & Rennert, 2008; Gordon, Hewitt, Hallett; 1995). Über Zusammenhänge von
Perfektionismus und Unterrichtsqualität von Lehrkräften ist bislang jedoch nichts bekannt. In Bezug auf die leistungsförderliche
Wirkung der funktionalen Komponente sind positive Zusammenhänge denkbar. Unklar sind zudem vermittelnde Mechanismen
zwischen Perfektionismus und dem Erleben und Verhalten von Lehrkräften. Ein solcher möglicher Mechanismus stellt die
Motivation von Lehrkräften dar, die im Gegensatz zu Perfektionismus als relativ stabilem Konstrukt der Persönlichkeit (Rice &
Aldea, 2006) kontextspezifischer ist (Dresel & Lämmle, 2011).
Fragestellung
In der vorliegenden Studie wird der Frage nach den Zusammenhängen der funktionalen und dysfunktionalen Komponenten von
Perfektionismus mit Aspekten der Lehrermotivation, Unterrichtsqualität und dem Belastungserleben nachgegangen.
Methode
Insgesamt wurden 43 Lehrkräfte (62% weiblich, Berufserfahrung M = 12.65 Jahre, SD = 7.56) sowie deren 43 Schulklassen
einbezogen. Funktionale und dysfunktionale Perfektionismuskomponenten wurden mit der deutschen Übersetzung der
multidimensionalen Perfektionismusskala von Frost und Kollegen erfasst (Altstötter-Gleich & Bergemann, 2006), wobei sich auf
die von den Autoren als konstruktvalide eingestuften drei Facetten hohe Standards, Fehlersensibilität und leistungsbezogene
Zweifel beschränkt wurde. Belastungserleben wurde mit der Skala von Maslach & Jackson (1986), Zielorientierungen mit den
Skalen von Nitsche und Kollegen (2011) und unterrichtsbezogene Selbstwirksamkeit mit den Skalen von Pfitzner-Eden, Thiel &
Horsley (2014) erhoben. Unterrichtsqualität wurde anhand von Schülerratings bezogen auf die drei Basisdimensionen nach
Klieme und Kollegen (2001; 2006) erfasst, wobei bei der Dimension unterstützendes Klima auf den Umgang mit Fehlern fokussiert
wurde (Fehlerklima: Steuer, Rosentritt-Brunn & Dresel, 2013; Klassenführung und kognitive Aktivierung: COACTIV). Analysiert
wurden die Daten unter Anwendung von Bootstrapping in Mplus 7mittels Korrelationsanalysen sowie Mediationsmodellen.
Ergebnisse
In Bezug auf die funktionale Komponente von Perfektionismus zeigten sich erwartungsgemäß mittlere positive Zusammenhänge
mit der Lernzielorientierung, der Selbstwirksamkeit, der kognitiven Aktivierung und dem Fehlerklima sowie schwach negative
Zusammenhänge mit dem Belastungserleben. Zur Klassenführung ergaben sich keine signifikanten Zusammenhänge. Der
dysfunktionale Perfektionismus wies erwartungsgemäß mittlere bis hohe Zusammenhänge zur Annäherungsleistungs-, der
Vermeidungsleistungszielorientierung und der Arbeitsvermeidung auf. Zur Selbstwirksamkeit bestand ein mittlerer negativer
Zusammenhang. Darüber hinaus ergaben sich – ebenfalls erwartungskonform –hohe positive Zusammenhänge mit dem
Belastungserleben. Ein indirekter Effekt über motivationale Aspekte ließ sich weder bezogen auf die Unterrichtsqualität noch auf
das Belastungserleben nachweisen.
Die gefundenen Zusammenhänge machen deutlich, dass auch im Lehrberuf Perfektionismus eine wesentliche Rolle spielt und
hinsichtlich der funktionalen und dysfunktionalen Komponenten differenziert betrachtet werden sollte. Die Befunde lassen
vermuten, dass Perfektionismus nicht nur in Bezug auf die Lehrergesundheit, sondern auch hinsichtlich der Unterrichtsqualität
bedeutsam ist.
Schein oder Sein? Zur Vorhersagbarkeit des Zusammenhangs von Lehrerselbstwirksamkeit,
Berufszufriedenheit und selbstberichteter Unterrichtsqualität durch Methodenartefakte
Anna-Katharina Praetorius1, Fani Lauermann2, Doris Holzberger3
1
Deutsches Institut für Internationale Pädagogische Forschung, 2Rheinische Friedrich-Wilhelms-Universität Bonn, 3Technische
Universität München
Theoretischer Hintergrund
Die Selbstwirksamkeit von Lehrkräften gilt als bedeutsamer Prädiktor für die Berufszufriedenheit sowie die Unterrichtsqualität
von Lehrkräften (zsf. siehe Klassen, Tze, Betts & Gordon, 2011). Der Großteil der diesbezüglichen empirischen Evidenz basiert
jedoch auf Lehrerselbstberichten. Dies wird in letzter Zeit vermehrt kritisiert (z. B. Holzberger, Philipp & Kunter, 2013; Klassen &
Tze, 2014): Da zur Messung aller interessierenden Variablen dieselbe Methode verwendet wurde, könnten die gefundenen
Zusammenhänge nicht nur inhaltlich, sondern auch durch einen sogenannten „common method bias“ bedingt sein.
Eine empirische Überprüfung inwiefern dies der Fall ist, ermöglicht der latente Markervariablen-Ansatz von Williams, Hartman
und Cavazotte (2010). Dabei wird zunächst die Art der Verzerrung von Prädiktor sowie Kriterium festgelegt (z.B. soziale
Erwünschtheit, Ja-Sage-Tendenz und andere Antworttendenzen); nur bei einer Verzerrung beider Variablen handelt es sich um
einen common method bias. In einem zweiten Schritt wird dann eine Variable identifiziert, die in keinem theoretischen
Zusammenhang zu den interessierenden Variablen steht, gleichzeitig aber ebenfalls durch die zuvor bestimmten Verzerrungen
beeinflusst wird. In einem dritten Schritt wird der Einfluss von Methodenartefakten mittels konfirmatorischer Faktorenanalysen
empirisch geschätzt.
Fragestellung
Im vorliegenden Beitrag gehen wir der Frage nach, in welchem Ausmaß der Zusammenhang von Lehrerselbstwirksamkeit,
Berufszufriedenheit und selbstberichteter Unterrichtsqualität durch common method bias beeinflusst wird.
Methode
Dazu wurden Daten der internationalen TALIS-Studie 2013 (OECD, 2014) analysiert. Für die Analysen des Zusammenhangs
zwischen Selbstwirksamkeit und Berufszufriedenheit wurden Daten von 120652 Lehrkräften aus 34 Ländern einbezogen, die an
regulären Sekundarschulen unterrichten. Für die Analysen des Zusammenhangs zwischen Selbstwirksamkeit und
Unterrichtsqualität wurden Daten von 3798 Lehrkräften in acht Ländern einbezogen, da die Unterrichtsqualität-Items zum Teil
nur in einem TALIS-Zusatzmodul erfasst wurden. Zur Messung von Selbstwirksamkeit wurden drei Subskalen eingesetzt
(Instructional Strategies, Classroom Management, Student Engagement), zur Erfassung der Berufszufriedenheit vier Items und
zur Erfassung von Unterrichtsqualität drei Skalen (Klassenführung, kognitive Aktivierung, konstruktive Unterstützung). Die
verwendeten Skalen wiesen hinreichende interne Konsistenzen sowie metrische Invarianz zwischen Ländern auf. Als
Markervariable wurden zwei Items gewählt, die sich auf Hindernisse bezüglich der Teilnahme an Fortbildungen beziehen (keine
Anreize; zu hohe Kosten), unter der Annahme, dass diese Items in keinem theoretischen Zusammenhang mit den
interessierenden Variablen stehen, aber dennoch von ähnlichen Antworttendenzen verzerrt sein könnten. Fünf konfirmatorische
Faktorenanalysen mit verschiedenen Ladungs- und Korrelationsrestriktionen wurden durchgeführt, durch deren Vergleich die
Effekte von Methodenartefakten bestimmt werden können (siehe Williams et al., 2010).
Ergebnisse
In Bezug auf den Zusammenhang zwischen Selbstwirksamkeit und Berufszufriedenheit zeigten sich lediglich Ladungen der Items
von Berufszufriedenheit auf dem Methodenfaktor (.16 ≤ λ ≤ .31), nicht jedoch bei den Subskalen der Lehrerselbstwirksamkeit
(.04 ≤ λ ≤ .08). Dementsprechend wurde auch der Zusammenhang zwischen Berufszufriedenheit und Selbstwirksamkeit nur um
r = .02 verschätzt (r = .24 anstelle r = .22). Für die Modelle bezüglich Selbstwirksamkeit und Unterrichtsqualität fand sich eine
signifikante Ladung der Subskalen von Selbstwirksamkeit (.06 ≤ λ ≤ .15), keine signifikanten Ladungen bei kognitiver Aktivierung
(-.04 ≤ λ ≤ .01) und teilweise signifikante Ladungen bei Klassenführung (.10 ≤ λ ≤ .18) und konstruktiver Unterstützung (.03 ≤ λ ≤
.12). Der Zusammenhang zwischen Unterrichtsqualität und Selbstwirksamkeit wurde dementsprechend lediglich bei
Klassenführung verschätzt, und auch hier wiederum um nur r = .02 (r = .39 anstelle r = .37).
Die Befunde deuten darauf hin, dass die Problematik eines common method bias bei der Untersuchung des Zusammenhangs
von Lehrerselbstwirksamkeit und Berufszufriedenheit sowie Unterrichtsqualität unter Umständen nicht so gravierend ist wie
oftmals angenommen. Einschränkend muss jedoch gesagt werden, dass die Befunde sich nur auf solche Verzerrungen beziehen,
die über die gewählte Markervariable erfasst wurden. Dabei bleibt zum einen offen, in welchem Ausmaß die Markervariable
tatsächlich die intendierten Verzerrungen abbilden kann und zum anderen, inwiefern andere Verzerrungen die Zusammenhänge
zwischen den interessierenden Variablen beeinflussen. Weitere Studien zur Überprüfung der Robustheit der Befunde sind daher
notwendig.
ID: 276
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Sonstige Didaktiken, Lehrerbildung
Thematisches Cluster: Bildungsgerechtigkeit/ Migration, Lehrer(aus)bildung, Lese- und Sprachförderung
Stichworte: Mehrsprachigkeit, Deutsch als Zweitsprache, Lerngelegenheiten, Einstellungen, linguistically responsive teaching
Umgang mit Mehrsprachigkeit im Unterricht – Die Bedeutung von Lerngelegenheiten im
Lehramtsstudium und in der Lehrerfortbildung
Chair(s): Timo Ehmke (Leuphana Universität Lüneburg)
Diskutant(en): Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen (IQB))
Der Umgang mit mehrsprachigen Schülerinnen und Schülern ist eine zentrale Herausforderung an die Schulen in Deutschland,
aber auch in anderen Staaten. Lehrkräften kommt damit die wichtige Aufgabe zu, diese Schülerinnen und Schüler mit Deutsch
als Zweitsprache gezielt durch eine sprachlich-sensitive Unterrichtsgestaltung zu fördern. Überlegungen dazu, welche
Kompetenzen und Einstellungen Lehrkräften hinsichtlich des „linguistically responsive teaching“ erreichen sollten, wurden etwa
von Lucas & Grinberg (2008), Lucas (2011) oder Bunch (2013) vorgeschlagen. In einigen Bundesländern Deutschlands (z.B.
NRW, Berlin) sehen die Lehrerausbildungsgesetze daher mittlerweile vor, dass angehende Lehrerinnen und Lehrer aller
Unterrichtsfächer eine Ausbildung im Bereich Deutsch als Zweitsprache (DaZ) zusätzlich zu ihrem fachlichen, fachdidaktischen
und bildungswissenschaftlichen Studium durchlaufen. Es liegen bisher aber keine systematischen empirischen
Forschungsarbeiten über die dazu notwendigen professionellen Kompetenzen von Lehrkräften und damit auch keine empirisch
abgesicherten Hinweise auf die Ausgestaltung von Lerngelegenheiten in der universitären Lehrerausbildung vor.
Vor diesem Hintergrund sollen in dem Symposium vier Beiträge präsentiert werden, die sich mit Kompetenzen und Einstellungen
von angehenden und praktizierenden Lehrkräften hinsichtlich des Umgangs mit DaZ-Schülerinnen und Schülern bzw. multilingual
learners (MLL) befassen und dabei insbesondere die Bedeutung von Lerngelegenheiten herausarbeiten.
Der erste Beitrag von Hammer, Fischer und Ehmke stellt Ergebnisse einer Studie an Lehramtsstudierenden vor, die hinsichtlich
ihrer DaZ-Kompetenz und ihren Einstellungen gegenüber Mehrsprachigkeit im Unterricht getestet und befragt worden sind. Die
Ergebnisse zeigen, dass die DaZ-Kompetenz und die Einstellungen gegenüber Mehrsprachigkeit im Unterricht von
Lehramtsstudierenden im positiven Zusammenhang mit der Nutzung von universitären Lerngelegenheiten stehen.
In dem zweiten Beitrag von Wagner, Paetsch und Darsow steht die DaZ-Kompetenz von Lehramtsstudierenden an Berliner
Universitäten im Mittelpunkt. In dieser Studie wird untersucht, inwieweit diese durch universitäre Lerngelegenheiten im Bereich
DaZ gefördert werden kann. Erste Ergebnisse bestätigen die Bedeutung von Lerngelegenheiten insbesondere zu den Themen
Linguistik, Migration, Mehrsprachigkeit und Scaffolding.
Der dritte Beitrag berichtet Ergebnisse einer Studie durchgeführt von einer Arbeitsgruppe an der Universität in Turku, Finnland,
über das Wissen von Lehrkräften hinsichtlich sprachsensiblen Unterrichts. Dazu wurden die Daten aus mehreren online-basierten
Lehrerfortbildungsmaßnahmen zum „linguistically and culturally responsive teaching“ ausgewertet. Ergebnisse zeigen, dass
bereits kurze Fortbildungsmaßnahmen die Sensitivität von Lehrkräften hinsichtlich eines sprachförderlichen Unterrichts
verbessern können.
Der vierte Beitrag berichtet über die Ergebnisse einer Studie von Viesca von der University of Denver, Colorado, USA. In einer
Dokumentenanalyse von Lernmaterialien, die im Rahmen von online-basierten Lehrerfortbildungen zum linguistically responsive
teaching erhoben wurden, konnte gezeigt werden, dass sich Einstellungen von Lehrkräften hinsichtlich Mehrsprachigkeit im
Unterricht positiv durch die Lehrerfortbildungsmaßnahme entwickeln konnten.
Beiträge des Symposiums
Zusammenhänge zwischen Deutsch als Zweitsprache Kompetenz und Einstellungen zu Mehrsprachigkeit
Svenja Hammer, Nele Fischer, Timo Ehmke
Leuphana Universität Lüneburg
Zahlreiche Schulleistungsstudien haben signifikante Unterschiede zwischen Schülerinnen und Schülern mit und ohne
Migrationshintergrund in schulischen Leistungen aufgezeigt (OECD, 2013; Blossfeld et al., 2007). Dass ein Zusammenhang
zwischen Schulerfolg und ausreichender Kompetenz in der Unterrichtssprache Deutsch sowie anderen Faktoren wie dem
sozioökonomischen Hintergrund besteht, kann daher als unbestritten gelten. Um Schülerinnen und Schülern nichtdeutscher
Herkunftssprachen größere Erfolgschancen im Bildungssystem zu verschaffen, ist deren Förderung, vor allem im sprachlichen
Bereich, daher nötig. Um diese Aufgabe wahrnehmen zu können, bedürfen Lehrkräfte entsprechender Kompetenzen, die sie
größtenteils bislang nicht in ihrem Studium erwerben konnten und sich dementsprechend nicht angemessen auf diese Aufgabe
vorbereitet fühlen. Darüber hinaus fühlen sich viele Lehrkräfte nicht zuständig für die Sprachförderung ihrer Schülerinnen und
Schüler (Becker-Mrotzek et al., 2012). Daher müssen bereits im Lehramtsstudium Lerngelegenheiten geschaffen werden, die
sowohl die nötigen Kompetenzen vermitteln als auch eine Auseinandersetzung mit den eigenen Einstellungen zu
Mehrsprachigkeit ermöglicht.
Dies wirft die folgenden Fragen auf:
(1) Welches DaZ-Kompetenzniveau weisen Lehramtsstudierende in Bezug auf Mindest- und Regelstandards auf?
(2) Welche Einstellungen zu Mehrsprachigkeit zeigen Lehramtsstudierende für die Bereiche Sprachsensibilität im Fachunterricht,
Zuständigkeit für Sprachförderung und Wertschätzung von Mehrsprachigkeit?
(3) Welche Zusammenhänge lassen sich zwischen DaZ-Kompetenz und Einstellungen zu Mehrsprachigkeit zeigen?
Zur Erfassung der DaZ-Kompetenz sowie der Einstellungen zu Mehrsprachigkeit wurde im Projekt DaZKom ein theoretisches
Modell für Deutsch-als-Zweitsprache Kompetenz angehender Lehrkräfte mit den drei Dimensionen (1) Fachregister, (2)
Mehrsprachigkeit und (3) Didaktik (Köker et al., 2015) entwickelt. Basierend auf diesem Modell steht nun ein paper-pencil-Test
mit 51 Items zur Verfügung, der es ermöglicht, differenzierte Aussagen über die Kompetenz Studierender im Bereich Deutsch
als Zweitsprache zu treffen (Hammer et al., 2015). Anhand eines Standardsettings wurden für DaZ-Kompetenz Niveaustufen
beschrieben, die sich aufgliedern in Mindest- und Regelstandards. Neben diesem Instrument wurde eine Skala mit 31 Items (EAP
Reliabilität = 0.84) für die Erfassung von Überzeugungen zu Mehrsprachigkeit entwickelt, die die inhaltlichen Bereiche (a)
Sprachsensibilität im Fachunterricht, (b) Zuständigkeit für Sprachförderung und (c) Wertschätzung von Mehrsprachigkeit umfasst.
Diese wurde anhand einer 4-stufigen Likert-Skala erfasst.
An einer Stichprobe von N = 427 Lehramtsstudierenden von 12 deutschen Universitäten wurden sowohl die DaZ-Kompetenz als
auch die Einstellungen zu Mehrsprachigkeit erhoben.
Die Item- und Skalenanalysen wurden auf der Basis des Raschmodells mit dem Programm ConQuest durchgeführt (Adams, Wu,
& Wilson, 2012).
Die Ergebnisse der Analysen zeigen, dass sich 27,2% der Lehramtsstudierenden unterhalb des Mindeststandards für DaZKompetenz befinden und nicht sensibilisiert sind für die sprachlichen Belange ihrer Schülerinnen und Schüler. 59,4% der
Studierenden erreichen den Mindeststandard an DaZ-Kompetenz und nur 13,4% gehören zu den informierten Studierenden, die
aus Expertensicht ein wünschenswertes Niveau an DaZ-Kompetenz aufweisen.
Die Ergebnisse zu den Einstellungen weisen darauf hin, dass 75% der befragten Studierenden sprachsensible Überzeugungen
in Bezug auf Fachunterricht haben. 82% der Studierenden fühlen sich zuständig für Sprachförderung, wohingegen nur 58% der
Studierenden Wertschätzung für die Herkunftssprachen der Schülerinnen und Schüler zeigt.
Betrachtet man nun den Zusammenhang zwischen den Einstellungen zu Mehrsprachigkeit der Studierenden und der DaZKompetenz, so zeigt sich, dass Studierende, die den Mindeststandard erreichen über positivere Einstellungen zu
Mehrsprachigkeit verfügen als Studierende, die unter dem Mindeststandard bleiben.
In weiteren Schritten muss nun noch analysiert werden, welche Lerngelegenheiten sich besonders eignen, um die Standards zu
erreichen.
Universitäre Lerngelegenheiten und Kompetenzen von angehenden Lehrkräften im Bereich Deutsch als
Zweitsprache
Fränze Sophie Wagner, Jennifer Paetsch, Annkathrin Darsow
Humboldt-Universität zu Berlin
Da neben dem sozioökonomischen Status der Familie und dem Bildungshintergrund der Eltern auch unzureichende
Zweitsprachkenntnisse für den durchschnittlich geringeren Bildungserfolg von Schülerinnen und Schülern aus zugewanderten
Familien verantwortlich gemacht werden (Stanat, Rauch, Segeritz 2010), wird der Sprachbildung in Kita und Schule ein hoher
Stellenwert beigemessen. Universitäten stehen deshalb vor der Herausforderung, die angehenden Lehrkräfte in den Bereichen
Sprachbildung und Deutsch als Zweitsprache (DaZ) auszubilden. In Deutschland sind noch nicht in allen Bundesländern
universitäre Lerngelegenheiten in den Bereichen Sprachbildung und DaZ fester Bestandteil der Lehrkräfteausbildung. Wie eine
aktuelle Studie zeigt, unterscheiden sich die Ausbildungselemente sehr stark zwischen den Bundesländern und auch zwischen
einzelnen Universitäten (Baumann & Becker-Mrotzek, 2014). Dies überrascht kaum, denn auch wenn unumstritten ist, dass alle
Lehramtsstudierenden in diesen Bereichen qualifiziert werden müssen, stehen die theoretische Modellierung und empirische
Überprüfung von Kompetenzen im Bereich DaZ noch am Anfang.
In Anlehnung an Befunde der Unterrichtsforschung wird auch in der Lehrerbildungsforschung angenommen, dass der
Kompetenzerwerb angehender Lehrkräfte durch den Umfang an universitären Lerngelegenheiten beeinflusst wird (z.B.
Kleickmann & Anders 2011; König, Blömeke & Kaiser, 2010). So konnten Blömeke et al. (2010) in ihrer international
vergleichenden Untersuchung für das Fach Mathematik zeigen, dass der Umfang an Lerngelegenheiten signifikant positiv sowohl
mit dem fachlichen Wissen als auch mit dem didaktischen Wissen der angehenden Lehrkräfte zusammenhängt. Bei Betrachtung
von Lerngelegenheiten lässt sich eine Unterscheidung nach dem inhaltlichen Umfang, der ein Hinweis auf die Breite der
Ausbildung ist, und dem zeitlichen Umfang, der ein Hinweis auf die Tiefe der Ausbildung ist, treffen. Dabei wird angenommen,
dass diese beiden Merkmale in einem engen Zusammenhang stehen (Blömeke et al., 2010): Wenn mehr Zeit für die Ausbildung
in einem Themenbereich zur Verfügung steht können hier auch mehr Inhalte vermittelt werden.
Zum Zusammenhang von universitären Lerngelegenheiten mit Kompetenzen von Lehramtsstudie-renden im Bereich DaZ liegen
bisher keine belastbaren empirischen Ergebnisse vor. Ziel dieses Bei-trags ist es deshalb, den Zusammenhang der DaZKompetenzen der Studierenden mit ihren universitären Lerngelegenheiten im Bereich DaZ näher zu untersuchen. Dabei wird
erwartet, dass Kompetenzunterschiede zwischen Bachelor- und Master-Studierenden aufgrund der Unterschiede im Umfang der
besuchten Lehrveranstaltungen in den DaZ-Modulen festzustellen sind. Zudem wird untersucht, inwieweit der von den
Studierenden selbst angegebene Umfang an Lerngelegenheiten zu bestimmten DaZ-Themen mit ihren Leistungen
zusammenhängt.
Die Daten wurden in 2015 im Rahmen des Projektes Sprachen-Bilden-Chancen: Innovationen für das Berliner Lehramt erhoben.
Das DaZ-Modul der Berliner Universitäten vermittelt Basiskenntnisse sowie fachspezifische Kompetenzen bei einem Umfang von
je 3 ECTS im Bachelor mit Lehramtsoption und im Master of Education.
Die DaZ-Kompetenzen der Studierenden (N=134) wurden mit dem standardisierten Test „DaZKom“ (Köker et al., in Druck)
erfasst. Zudem wurde ein Fragebogen zur Erfassung der themenspezifischen Lerngelegenheiten und der Zufriedenheit mit dem
DaZ-Modul eingesetzt. Die untersuchte Stichprobe setzt sich aus 60 Bachelor- und 70 Masterstudierenden unterschiedlicher
Lehramtsstudiengänge aus drei Berliner Universitäten zusammen. Das mittlere Alter liegt bei 27,3 Jahren (SD=4,4). Eine RaschSkalierung der Tests erfolgte auf Grundlage der Daten der Gesamtstichprobe. Als Schätzer für die Fähigkeitsparameter wurden
Warm's Mean Weighted Likelihood Estimates (WLE) gebildet. Die Reliabilität (Kuder-Richardson-Formula 20) des DaZKomTestes beträgt r = .84.
Erste Ergebnisse zeigen, dass sich die Bachelor- und Masterstudierenden in den DaZ-Kompetenzen nicht unterscheiden. Es
ließen sich jedoch Zusammenhänge zwischen den von den Studierenden selbst berichteten Lerngelegenheiten (z.B. zu den
Themen Linguistik, Migration und Mehrsprachig-keit, Scaffolding) und ihren Leistungen im DaZKom-Test feststellen. In
weitergehenden Analysen sollen zusätzlich die berichteten außeruniversitären Lerngelegenheiten und die Zufriedenheit der
Studierenden mit der Lehre im DaZ-Modul als Kontrollvariablen einbezogen werden.
Finnish Teachers’ Knowledge about Linguistically and Culturally Responsive Teaching
Emmanuel O. Acquah1, Jenni Alisaari1, Tuija Niemi1, Nancy Commins2
1
Department of Teacher Education, University of Turku, 2University of Colorado Denver and University of Turku
Objectives:
Examine notions of diversity and diverse learners among practicing and beginning teachers in 3 contexts in Finland: an ethnically
& culturally diverse teacher training school, 5 other schools in the municipality; and teacher trainees at the beginning of their
studies, and responses of a smaller group of trainees who participated in an interactive 6 week on line module on second language
acquisition developed in the U.S.. This paper will compare and contrast the patterns in the data among the three groups and
relate them to the learning of module participants.
Theoretical Framework:
Finland’s education system is viewed as highly effective, based on the level of student performance in international comparisons
(PISA, 2003, 2006), as well as parity in achievement in terms of sex, domicile, and socio-economic background (Kivirauma &
Ruoho, 2007). Soilamo (2008) however found that Finnish teachers do not have the appropriate knowledge base and strategies
to address the needs of multilingual learners. Itkonen and Jahnukainen, (2007) suggest that increasing diversity is resulting in
growing gaps in achievement between immigrants and native Finnish students. To address these gaps Finnish teachers need a
grounding in both linguistically (Lucas & Villegas, 2013) and culturally responsive practices (Gay, 2010).
Methods and Data Sources:
In three different contexts, 400 participants completed questionnaires with both open and closed ended questions regarding their
awareness of and ability to use strategies for teaching students learning content and literacy through their second (or third)
languages. Informants were asked to rate their levels of knowledge and skill on a six-point Likert-type scale as follows: 1=
extremely low to 6= extremely high. Open-ended question solicited teachers’ understanding of how to support multilingual learners
and in what areas they felt they would need support. Quantitative data were analyzed using SPSS Statistics for descriptive
statistics and frequencies. Multilevel analysis including MANOVA and Cluster analysis were used to identify profiles of teachers
and examine associations between awareness of diversity and strategies for teaching. Qualitative data were analyzed by coding
and creating categories based on participants’ responses (Corbin & Strauss, 2008). On-line postings of 5 teacher trainees who
participated in the second language acquisition module were analyzed qualitatively by focusing on the categories found in the
analysis of the open-ended questions in questionnaires.
Results:
Data from the teacher training school suggest that most teachers were highly aware that academic outcomes of their diverse
learners were influenced by factors related to language, culture, race, and ethnicity. However even veteran teachers did not have
in-depth knowledge about strategies that could help them work successfully with this population. In particular, they were unfamiliar
with ways to use learners’ prior knowledge and experiences as well as their linguistic resources. Results from teachers in the
broader municipality suggest that they had comparatively lower awareness and less knowledge of specific strategies. Beginning
teachers reported the lowest levels of awareness despite having what appeared to be a positive attitude toward culturally
responsive pedagogy. Initial findings from the online course suggest that even short term interventions can help build beginning
teachers’ awareness of linguistically and culturally responsive teaching.
Scholarly Significance: The findings provide insight into aspects of teachers’ knowledge about both the linguistic and cultural
needs of their students, as well as what constitutes a repertoire of approaches and strategies to assure students’ academic
success. These findings supports the development of the Competency Based model and can be used to frame the studies of preservice teachers, as well as the professional development of practicing teachers in nations facing demographic shifts and
increasing student diversity.
Teacher Ideologies and Perspectives on Multilingual Learners (MLLs) and Multilingualism Expressed in
Online Professional Development
Kara Viesca
University of Colorado Denver, USA
Pettit (2011) conducted a comprehensive review of the literature regarding teacher’s beliefs about MLLs in mainstream
classrooms and suggested that teachers of MLLs in content classrooms should have beliefs that include high expectations for
MLLs, personal responsibility for MLL learning, value of home languages for both home and school, acceptance of the time
second language acquisition requires, particularly for academic language, and motivation to continue professional learning
regarding working with MLLs. Pettit also called for future research focused on changing teachers’ beliefs and the association
between beliefs and practices.
This study seeks to identify teacher beliefs and attitudes in relation to those defined as necessary in the literature as well as any
changes to those beliefs and attitudes that occur through participating in online professional learning. Grounded in the theory of
holistic bilingualism (Grosjean, 1989) that argues that bilingualism/multilingualism exists as a unified whole within individuals
rather than something that can be de-composed into two (or more) separate parts and building off of the more recent work
representing the multilingual turn in second language acquisition and languaging/translanguaging (e.g. García, 2009; García &
Wei, 2014; Ortega, 2013), this study examined teacher ideologies and perspectives. Frame analysis (Goffman, 1974; Oliver &
Johnston, 2000) and e-ethnography (Poynter, 2010) were utilized through a document analysis drawing from the work of
qualitative media researchers Altheide and Schneider (2013).
This study identified the frames, messages, and imbued ideologies within and across the teacher created digital documents to
understand both the ideologies and perspectives demonstrated through the engagement with online professional learning as well
as the changes that did (or did not) occur. The digital documents that were analyzed include the online postings within threaded
discussion as well as learning artifacts related to the learning content of the professional learning module submitted by teacher
participants. Across ten different modules that strive to promote similar learning outcomes, from Spring 2013-Summer 2015, 24
groups of teachers participated (n = 160) and contributed digital documents for analysis (~600 digital documents).
The findings suggest that changes did appear to occur within the course of the online professional learning related to teacher
perceptions of bilingualism and the value of home languages in home and school. Teachers appear to have largely started the
professional learning already motivated to advance their professional learning as well as feeling responsible for MLL learning in
their classes. However, the instances of little to no change in ideologies or perspectives towards desired attitudes and beliefs
often were grounded in frames supported by staunch assimilationist and standard language ideologies. Due to the changes that
were seen in the data, this study suggests that the online professional learning does offer positive opportunities to impact teacher
ideologies and perspectives regarding multilingual learners and multilingualism. However, due to the changes that were also not
seen in the data, further research is necessary to examine the relationship of teacher held assimilationist and standard language
ideologies on the learning opportunities of multilingual students as well as the ability for those ideologies to be shifted.
ID: 287
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie
Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Motivation und Emotion, Vorschulische Bildung
Stichworte: frühe Kindheit, Jugendalter, häusliche Lernumwelt, soziale Kompetenzen, Lern- und Leistungszielorientierung
Langfristige Effekte kindlicher Entwicklungen und Bildungserfahrungen - aktuelle Befunde der
Längsschnittstudien BiKSplus[3-13] und [8-18]
Chair(s): Simone Lehrl (Otto-Friedrich-Universität Bamberg)
Diskutant(en): Marcus Hasselhorn (DIPF Frankfurt)
Wie entwickeln sich schulrelevante Kompetenzen und welche Rolle spielen dabei Elternhaus, Kindergarten und Schule? Diese
Fragestellungen waren Ausgangspunkt der 2005 ins Leben gerufenen Längsschnittstudien Bildungsprozesse,
Kompetenzentwicklungen und Selektionsentscheidungen im Vorschul- und Schulalter 3-10 und 8-14. Bislang konnte z.B. gezeigt
werden, dass soziale Disparitäten des Kompetenzerwerbs schon im Alter von 3 Jahren nachweisbar sind (Weinert et al., 2010),
dass die Erfahrungen von Kindern in den Lernumwelten Familie, Kindergarten und Grundschule hinsichtlich ihrer Qualität der
Interaktionen stark variieren (Kuger & Kluczniok, 2008; Lehrl, 2013; Große et al., 2015), dass die Qualität in Kindergarten und
Familie im Alter zwischen 3 und 6 Jahren eine bedeutende Rolle bei der Erklärung von Kompetenzunterschieden im
mathematischen und sprachlichen Bereich spielt (Anders et al., 2012; Ebert et al., 2013) und Effekte der Kindergartenqualität für
den mathematischen Bereich sogar noch am Ende der Grundschulzeit nachweisbar sind (Lehrl et al., 2015). Darüber hinaus
konnte für den Altersbereich zwischen Grund- und Sekundarschule gezeigt werden, dass sich Lesekompetenzen im
mehrgliedrigen Schulsystem differentiell entwickeln und den individuellen Eingangsvoraussetzungen aus der Grundschulzeit
dabei eine bedeutsame Rolle zukommt (Pfost et al., 2010). Im Fokus der Studien standen dabei nicht nur akademische
Kompetenzen, sondern auch soziale, emotionale und motivationale Aspekte (Schurz et al., 2014; von Maurice et al., 2013; Richter
& Lehrl, in Druck; Rose et al., in Druck). Offene Fragen der beiden Längsschnittstudien betreffen insbesondere die langfristigen
Effekte früher Kompetenzen und Bildungserfahrungen, die Frage nach kumulativen Lernumwelterfahrungen sowie das
Zusammenspiel akademischer und sozial-emotionaler Kompetenzen. Hier setzt das vorliegende Symposium an und stellt
Arbeiten aus den beiden Anschlussprojekten BiKSplus[3-13] und [8-18] vor.
Die ersten drei Beiträge beruhen auf Daten der Längsschnittstudie BiKSplus [3-13]. Rose, Lehrl und Weinert untersuchen das
Zusammenspiel sprachlicher und sozialer Kompetenzen im Alter zwischen 4 und 8 Jahren und die Bedeutung der häuslichen
Lernumwelt in diesem Gefüge. Der Beitrag von Lehrl, Mursin und Roßbach thematisiert die Bedeutsamkeit der frühen
Lernumwelten Kindergarten und Familie für die mathematischen Kompetenzen im Alter von 12 Jahren. Blaurock, Große und
Roßbach, untersuchen die Erfahrungen von Kindern im Alter zwischen 3 und 12 Jahren in außerschulischen Lernorten. Dabei
wird der Frage nachgegangen, inwiefern sich bei den Kindern spezifische Aktivitätenprofile zeigen und wie sich diese über die
Zeit ändern.
Auf Grundlage der Daten der Längsschnittstudie BiKSplus[8-18] untersuchen Becker, Schiefer und Artelt die Entwicklung von
Zielorientierungen nach dem Übergang ins duale Ausbildungssystem und die Bedeutung früherer Leistungszielorientierungen zu
Beginn der Sekundarschulzeit.
Abschließend werden die Beiträge von Marcus Hasselhorn diskutiert.
Beiträge des Symposiums
Die Bedeutung der häuslichen Lernumwelt für das Zusammenspiel zwischen sprachlicher und sozialemotionaler Entwicklung vom vierten bis zum achten Lebensjahr
Elisabeth Rose, Simone Lehrl, Sabine Weinert
Otto-Friedrich-Universität Bamberg
Sprachliche Kompetenzen bilden eine wichtige Grundlage für die Sozialentwicklung. Diese Annahme wird empirisch durch
Zusammenhänge zwischen Defiziten in der Sprachentwicklung und negativ auffallendem Sozialverhalten der Kinder gestützt
(Stowe, Arnold & Ortiz, 2000). Beispielsweise gehen geringere sprachliche Kompetenzen mit geringeren Fremdeinschätzungen
des prosozialen Verhaltens einher (Cassidy, Werner, Rouke & Zubernis, 2003), bilden einen Risikofaktor für aggressives
Verhalten (Brownlie et al., 2004) und führen zu einer schlechteren Einbindung in die Peer-Group (Durkin & Conti-Ramsden,
2007). Im längsschnittlichen Entwicklungsverlauf findet sich dabei ein gerichteter Wirkzusammenhang: Im Alter zwischen drei
und sieben Jahren sind die frühen sprachlichen Kompetenzen kurz nach Eintritt in den Kindergarten prädiktiv für die
Veränderungen im kooperativen Umgang, im aggressiven Verhalten sowie der emotionalen Selbstregulation, nicht aber
umgekehrt (Rose, Ebert & Weinert, in Druck).
Bei der Frage nach Erklärungsmechanismen, die dem Zusammenspiel zwischen sprachlichen und sozial-emotionalen
Kompetenzen zugrunde liegen, liegt – neben direkten Zusammenhängen über sprachliche Kommunikationsprozesse – auch als
vermittelnde Drittvariable die Rolle der Eltern als primäre Sozialisationsinstanz auf der Hand: Es wird immer wieder betont, dass
sich domänenübergreifende Prozessmerkmale der Familie, wie das Familienklima oder die sprachliche Anregung durch die Eltern
– oft zusammengefasst als häusliche Lernumwelt – sowohl auf die soziale als auch auf die sprachliche Entwicklung des Kindes
auswirken. Beispielsweise zeigten Foster und Kollegen (2005), dass regelmäßiges gemeinsames Vorlesen nicht nur den
Sprachzuwachs der Kinder begünstigt, sondern auch deren Sozialverhalten positiv beeinflusst.
Dennoch wurde bis dato kaum erforscht, ob und inwiefern sich die häusliche Lernumwelt auf den Zusammenhang zwischen
frühen sprachlichen Kompetenzen und verschiedenen Facetten späterer sozial-emotionaler Kompetenzen auswirkt. Auf
Grundlage der Längsschnittstudie BiKS-3-10 wird das genaue Zusammenspiel zwischen der häuslichen Lernumwelt,
operationalisiert anhand eines Globalindikators, der sowohl ein Beobachtungsmaß der sprachlichen Interaktion als auch
Interview-Fragen zum Zugang zu Büchern beinhaltet, den frühen sprachlichen Kompetenzen zu Beginn des Kindergartenbesuchs
sowie der Entwicklung von drei Facetten sozial-emotionaler Kompetenzen – dem kooperativen Umgang mit andern Kindern, der
emotionalen Selbstregulation sowie des aggressiven Verhaltens – über den Zeitraum von vier Jahren analysiert.
Vorläufige Befunde zeigen, dass die häusliche Lernumwelt prädiktiv für die sprachlichen, nicht aber für die sozialen Kompetenzen
im Alter von drei Jahren ist. Allerdings moderiert die häusliche Lernumwelt den Zusammenhang zwischen frühen sprachlichen
Kompetenzen und der Entwicklung der sozial-emotionalen Kompetenzen über den Zeitraum von vier Jahren, selbst wenn
relevante Kontrollvariablen (wie z. B. der sozio-ökonomische Hintergrund oder die non-verbalen kognitiven Fähigkeiten)
berücksichtigt werden.
Dabei zeigt sich, dass der Zusammenhang zwischen Sprache und sozio-emotionaler Entwicklung bei den Kindern, die eine
bessere häusliche Lernumwelt erfahren, stärker ausfällt. Die Ergebnisse werden mit Blick auf mögliche Wirkzusammenhänge
und praktische Implikationen diskutiert.
Effekte früher Lernumwelten in Kindergarten und Familie auf mathematische Kompetenzen im
Jugendalter
Simone Lehrl1, Katharina Mursin1, Hans-Günther Roßbach2
1
Otto-Friedrich-Universität Bamberg, 2Leibniz-Institut für Bildungsverlaufforschung
Relevanz und theoretischer Hintergrund:
Schon vor dem Schuleintritt machen Kinder umfassende Erfahrungen mit mathematischen Inhalten. Dazu gehören z.B. das
Abzählen von Gegenständen, der Vergleich von Mengen, Wiegen und Messen unterschiedlicher Gegenstände oder Personen
sowie einfache Rechenoperationen. Je nach Häufigkeit dieser Aktivitäten in den Lernumwelten Familie und Kindergarten machen
Kinder somit ganz unterschiedliche Erfahrungen mit mathematischen Inhalten bereits vor der Einschulung. Dass diese
Unterschiede bedeutsam bei der Vorhersage mathematischer Kompetenzen im Vorschulalter und teilweise darüber hinaus bis
zum Ende der Grundschulzeit sind, konnte in einigen Studien gezeigt werden (Niklas & Schneider, 2014; Anders et al., 2012;
Lehrl et al., 2015). In einer der wenigen, über die Grundschulzeit hinausreichenden Studien, konnte auf Grundlage der Daten der
NICHD-Studie gezeigt werden, dass Effekte der Kindergartenqualität, vermittelt über frühe Kompetenzen im Kindergarten- und
Grundschulalter, noch im Alter von 15 Jahren nachweisbar sind (Vandell et al., 2010). Auf ähnliche Zusammenhänge deuten die
Befunde der EPPSE-Studie aus England (Sylva et al., 2014). Für eine deutsche Stichprobe wurden über einen ähnlich langen
Zeitraum bislang keine Daten gesammelt.
Die Befunde zur frühen häuslichen Lernumwelt deuten eher in die Richtung, dass diese die Kompetenzen der Kinder schon sehr
früh beeinflussen und darüber hinaus keine Effekte mehr zeigen (Sylva et al., 2014; Anders et al., 2012), gleichwohl auch Befunde
bestehen, die darauf deuten, dass die häusliche Lernumwelt nicht nur den Entwicklungsstand in mathematischen Kompetenzen
zu einem frühen Zeitpunkt, sondern auch dessen Entwicklungsverlauf bis in die Grundschulzeit vorhersagt (Niklas & Schneider,
2014).
Damit ist die Befundlage für den deutschsprachigen Raum nicht nur insgesamt unzureichend sondern auch heterogen. Darüber
hinaus besteht wenig empirische Evidenz zum Zusammenspiel der verschiedenen, über die Altersspanne von Kindergarten zum
Jugendalter durchlaufenen Lernumwelten bei der Vorhersage mathematischer Kompetenzen im Jugendalter.
Fragestellung: Im vorliegenden Beitrag wird daher der Frage nachgegangen, inwiefern Qualitätserfahrungen in den
Lernumwelten Familie und Kindergarten im Kindergartenalter für mathematische Kompetenzen im Jugendalter relevant sind und
welche Rolle dabei die mathematischen Kompetenzen im Vorschul- und Grundschulalter spielen. Darüber hinaus wird geprüft,
ob subgruppenspezifische Effekte (z.B. Kinder mit Migrationshintergrund) vorliegen.
Methode: Datengrundlage ist die Längsschnittstudie BiKS 3-10 und die Anschlussstudie BiKSplus[3-13], welche (ursprünglich)
554 Kinder aus 97 Kindergärten in Bayern und Hessen im Alterszeitraum von 3 – 13 Jahren begleitet.
Die mathematischen Kompetenzen wurden im Alter von 12 Jahren mittels eines erstmals für NEPS entwickelten standardisierten
Tests in einer Einzeltestung erfasst. Der Indikator für die häusliche Lernumwelt beinhaltet Angaben der Eltern z.B. zum
Buchbesitz, Häufigkeit des gemeinsamen Vorlesens und Vorhandensein von Spielmaterial sowie Aspekte der Qualität der ElternKind-Interaktion, erfasst während der Beobachtung einer halbstandardisierten Vorlesesituation zwischen dem Elternteil und dem
Kind. Die Qualität des Kindergartens wird in der vorliegenden Studie mit der Skala „Mathematik“ der KES-E berücksichtigt. Hierbei
handelt es sich um ein Rating-Verfahren, welches während einer mehrstündigen Beobachtung in den Kindergärten zum Einsatz
kam.
Ergebnisse: Mit Hilfe von Pfadmodellen kann gezeigt werden, dass die Kindergartenqualität unter Kontrolle von familiären
Hintergrundmerkmalen die mathematischen Kompetenzen im Alter von 12 Jahren vorhersagt. Diese Effekte werden teilweise
durch die mathematischen Kompetenzen im Grundschulalter mediiert. Darüber hinaus zeigen sich der Migrationshintergrund des
Kindes als auch die mütterliche Bildung in der Richtung als prädiktiv für die mathematischen Kompetenzen im Alter von 12 Jahren,
dass Kinder mit Migrationshintergrund und geringerer mütterlicher Bildung auch unter Kontrolle der frühen mathematischen
Kompetenzen, schlechtere Werte aufweisen.
Die frühe häusliche Lernumwelt ist nicht bedeutsam mit den mathematischen Kompetenzen assoziiert.
Die Ergebnisse werden vor dem Hintergrund der Bedeutung früher, qualitativ hochwertiger institutioneller Betreuung und
unterschiedlicher Bildungschancen diskutiert.
Kumulative Erfahrungen in außerschulischen Lernumwelten von der frühen Kindheit bis ins frühe
Jugendalter
Sabine Blaurock1, Christiane Große1, Hans-Günther Roßbach2
1
Otto-Friedrich-Universität Bamberg, 2Leibniz-Institut für Bildungsverlaufforschung
Die Jugend der Gegenwart bewerkstelligt nicht nur „schulbezogene Laufbahnen und Abschlüsse“ (Zinnecker, 1991, 10), sondern
parallel auch „außerschulische Karrieren“ (ebd., 10). Die ‚neue‘ Jugendphase zeichnet sich demnach durch den Erwerb von
Bildungstiteln im Besonderen und von kulturellem Kapital (Bourdieu) im Allgemeinen aus, welche eine gute Ausgangslage für die
spätere berufliche Position (Stecher, 2005) und gesellschaftliche Teilhabe begünstigen sollen. Für die spezifische und
ausgedehnte Phase des Bildungserwerbs prägte Zinnecker (Zinnecker, 1991; Zinnecker & Stecher, 1996) die Begrifflichkeit
„Jugend als Bildungsmoratorium“. Vor diesem Hintergrund weitet sich die bildungspolitische Diskussion um eine ungleiche
Inanspruchnahme von Bildungsangeboten zunehmend auch auf außerschulische Lerngelegenheiten, in- und außerhalb der
Familie, aus. Nach Bourdieus theoretischem Ansatz (Bourdieu, 1982) spiegelt sich das in einer Familie kumulierte Kapital in
schichtspezifischen Bildungs- und Erziehungsstrategien wider und wird generationenübergreifend weitergegeben. Insbesondere
das Kulturkapital wird durch familiale Alltagspraxen vermittelt (Becker, 2010; Klein & Biedinger, 2009), wobei diese oftmals nicht
intentional bildungsorientiert ablaufen (Büchner & Brake 2006). Gezielte bildungsbezogenen Anstrengungen von Eltern werden
hingegen unter dem Begriff „concerted cultivation“ zusammengefasst (Lareau 2003; von der Hagen-Demszky 2011), worunter
z.B. Bemühungen von Eltern verstanden, die Inanspruchnahme von Freizeit- und Förderangeboten ihrer Kinder zu organisieren.
Ergebnisse der BiKS-Studie haben bereits gezeigt, dass der familiale Hintergrund nur geringfügig mit der Intensität
außerschulischer Aktivitäten zusammenhängt (Mudiappa & Kluczniok 2012; Blaurock, 2015). Außerschulische
Lerngelegenheiten stellen somit ein kompensatorisches Potenzial für Kinder dar, die geringere Anregungen im Familien- oder
Schulkontext erfahren. Einige Studien heben die Relevanz des Typs der Aktivität (z. B. Eccles et al., 2003) und der
unterschiedlichen Teilnahmeprofile hinsichtlich der einzelnen Angebote hervor (Fischer & Theis, 2014), die möglicherweise eine
differenzielle akademische und non-kognitive Entwicklung fördern. Insgesamt ist die Befundlage der über die Lebensspanne
kumulativ gewonnenen außerschulischen Erfahrungen jedoch relativ schmal.
Der vorliegende Beitrag geht daher den Fragen nach,
- ob verschiedene Kindheitsprofile in Bezug auf non-formale und informelle außerschulische Bildungserfahrungen über die
Kindergarten- und Grundschulzeit hinweg identifiziert werden können.
- welche Profile im Sinne des „Bildungsmoratoriums“ wiederum häufige außerschulische Erfahrungen im frühen Jugendalter
vorhersagen können.
Datengrundlage ist die Längsschnittstudie BiKS 3-10 und die Anschlussstudie BiKSplus[3-13].
Die Häufigkeit der außerschulischen Aktivitäten wurde über die gesamte Kindergarten- und Grundschulzeit jährlich in der
Elternbefragung, in der 7. Klassenstufe mit dem SchülerInnen-Fragebogen erfasst. Erfragt wurden einerseits informelle, kulturelle
Aktivitäten innerhalb der Familie (der Besuch von Theater, Museum, Bücherei und Zoo), andererseits non-formale, organisierten
Aktivitäten außerhalb der Familie (z. B. Mitgliedschaft im Sportverein, Musikunterricht).
Erste Ergebnisse der Klassenanalysen zeigen für informelle und non-formale Aktivitäten unterschiedliche Kindheitsprofile.
Häufige informelle Aktivitäten im Jugendalter scheinen unabhängig von der Häufigkeit der Aktivitäten im Kindergartenalter zu
sein, sofern in der Grundschulzeit häufig informelle, kulturelle Aktivitäten wahrgenommen werden. Jugendliche des Profils mit
der höchsten Aktivitätenhäufigkeit nehmen noch zu Beginn der Kindergartenzeit vergleichsweise selten non-formale Aktivitäten
wahr, wobei diese kontinuierlich über die Grundschulzeit ansteigen. Im Vergleich üben die Jugendlichen des Profils mit der
höchsten Aktivitätenhäufigkeit im Kindergartenalter, weniger Aktivitäten im Grundschulalter und Jugendalter aus. Die
Kindheitsprofile unterscheiden sich in der Intensität außerschulischer Erfahrungen im Jugendalter sowohl bei non-formalen,
organisierten Aktivitäten außerhalb der Familie (F(2,101)=7.551, p=.001) als auch bei informelle, kulturellen Aktivitäten innerhalb
der Familie (F(2,84)=9.009, p=.000) signifikant voneinander. Anhand der Ergebnisse wird deutlich, dass eine Differenzierung
sowohl zwischen den Aktivitäten als auch zwischen den unterschiedlichen Kindheitsprofilen im Zeitverlauf sinnvoll ist, um den
Stand der kulturellen Bildung und gesellschaftlichen Teilhabe im Jugendalter zu ermitteln.
Laufende latente Transitions-Analysen und Pfadanalysen sollen differenzierteren Aufschluss darüber geben, wie sich die
Kindheitsprofile im Kindergarten, - Grundschul- und Jugendalter zusammensetzen und warum sie sich aus längsschnittlicher
Perspektive möglicherweise neu formieren.
Entwicklung von Zielorientierungen nach dem Übergang ins duale Ausbildungssystem
Sarah Becker, Irene Schiefer, Cordula Artelt
Otto-Friedrich-Universität Bamberg
Zielorientierungen, im Sinne von Lern- und Leistungszielen, sind wichtige motivationale Determinanten bezogen auf das Lernund Leistungsverhalten von Kindern und Jugendlichen im Schulalltag (Harackiewicz, Barron, Carter, Lehto, & Elliot, 1997;
Wolters, 2004). Lernzielorientierung meint dabei die Erweiterung eigener Kompetenzen, wohingegen Leistungszielorientierung
mit dem Präsentieren eigener Fähigkeiten assoziiert ist. Weitere Studien zeigen, dass sich besonders eine hohe
Lernzielorientierung positiv auf motivationale und emotionale Konstrukte wie z.B. intrinsische Motivation (Spinath & Steinmayr,
2012), positive Affekte (Huang, 2011) und höheres Interesse bezogen auf den Lerngegenstand (Hulleman, Durik, Schweigert, &
Harackiewicz, 2008) auswirkt. Studien zu Zielorientierungen finden häufig im Kontext von Schule oder Studium statt. Inwiefern
sich Zielorientierungen bei Jugendlichen nach dem Übergang vom allgemeinbildenden Schul- ins duale Ausbildungssystem
verhalten, wurde hingegen kaum untersucht. Auch der Vergleich der Zielorientierungen von gleichaltrigen Jugendlichen, die sich
entweder im Ausbildungssystem oder in den höheren Klassen des allgemeinbildenden Schulsystems befinden, wird selten
berichtet. Der Übergang vom allgemeinbildenden Schulsystem in das duale Ausbildungssystem ist mit vielen Veränderungen
verbunden. Unter anderem haben Jugendliche nun die Chance, ihren weiteren beruflichen Weg entsprechend ihrer Kompetenzen
und Interessen selbst zu wählen. Innerhalb der beruflichen Ausbildung ist es Ziel, die eigenen Kompetenzen bezogen auf den zu
erlernenden Beruf weiter zu entwickeln. Altersgenossen, die weiterhin das allgemeinbildende Schulsystem besuchen, mit dem
Ziel das (Fach-)Abitur zu erreichen, haben hingegen deutlich weniger interessens- und kompetenzorientierte Wahlmöglichkeiten,
da sie an die vorgegebene Fächerauswahl gebunden sind. Der Fokus liegt hier vorrangig auf dem Erbringen von Leistungen, um
einen guten Abschluss zu erreichen. Der Vergleich der beiden Ausbildungssituationen führt zu der Frage, ob Jugendliche im
Ausbildungssystem höhere Lernzielorientierungen und ihre Altersgenossen im allgemeinbildenden Schulsystem höhere
Leistungszielorientierungen zeigen.
Im vorliegenden Beitrag werden Lern- und Leistungsziele in Abhängigkeit der momentanen Ausbildungssituation
(Allgemeinbildendes Schulsystem vs. Ausbildung) verglichen. Als Grundlage dafür dient die Stichprobe der längsschnittlichen
BiKS-Studie[8-14] bzw. BiKSplus[8-18]-Studie. Im Rahmen der BiKS-Studie wurden jährlich Daten von Schülerinnen und
Schülern seit der 3. Klasse zu Bildungsprozessen, Kompetenzentwicklung und Selektionsentscheidungen in den Bundesländern
Bayern und Hessen erhoben. Für den vorliegenden Beitrag wurden Daten von N = 943 Schülerinnen und Schülern, bzw.
Auszubildenden zu drei Messzeitpunkten in den Klassen 5 (Messzeitpunkt 4), 6 (Messzeitpunkt 5) und 11 bzw. im ersten
Ausbildungsjahr (Messzeitpunkt 9) analysiert. Verglichen wurden die Daten von N=139 Azubis und N=804 Schülerinnen und
Schülern im allgemeinbildenden Schulsystem (Gesamtschulen, Gymnasien, Fachoberschulen, berufliche Gymnasien).
Zielorientierungen wurden mit Hilfe der Skalen zur Erfassung der Lern- und Leistungsmotivation „SELLMO“ (Spinath,
Stiensmeier-Pelster, Schöne, & Dickhäuser, 2012) erfasst.
Eine Varianzanalyse zeigt signifikante Unterschiede der Lern- und Leistungszielorientierung zum neunten Messzeitpunkt in den
Gruppen der Auszubildenden und der gleichaltrigen Studienteilnehmer, die sich noch im allgemeinbildenden Schulsystem
befinden. Dabei zeigen Auszubildende deutliche höhere Werte sowohl bei Lern- (F(1,943) =19,07, p < .00), als auch bei
Leistungszielen (F(1,943) = 40,63, p < .00). Betrachtet man die Lern- und Leistungszielorientierungen beider Gruppen zu den
Messzeitpunkten in den Klassen 5 und 6 lassen sich hingegen keine signifikanten Unterschiede zeigen. Weitere Analysen der
Zielorientierungen innerhalb der Gruppe der Auszubildenden zeigen, dass sich keine signifikanten Unterschiede bezogen auf die
Schulform finden lassen, die die Jugendlichen vor dem Wechsel ins duale Ausbildungssystem besucht haben. Des Weiteren
lassen sich positive Zusammenhänge der Lernzielorientierung mit soziopsychologischen Konzepten wie Lebenszufriedenheit,
Selbstwirksamkeit und Zielbindung bezogen auf die berufliche Zukunft finden. Der Eintritt in das Ausbildungssystem scheint also
generell mit einer Motivationssteigerung, sowohl bezogen auf Lern- als auch auf Leistungsziele, einherzugehen.
ID: 289
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie
Thematisches Cluster: Bildungsgerechtigkeit/ Migration
Stichworte: migrant children, academic adjustment, well-being, protective factors
The Academic and Psychosocial Adjustment of Children of Migrant Background: Family and Classroom
Protective Factors
Chair(s): Linda Juang (University of Potsdam)
Diskutant(en): Bernhard Nauck (Technical University of Chemnitz)
Children of migrant and refugee background comprise an increasing proportion of the population in Germany and worldwide.
Undoubtedly, the success of these children in education, work, and society is crucial not only for them as individuals, but for
society as a whole (Masten, Liebkind, & Hernandez, 2012, OECD, 2012). This symposium brings together four presentations that
address both the academic and psychosocial adjustment of children of migrant background. Our aim is to emphasize the variation
in adjustment of migrant children (not all of them do poorly) and focus on protective factors that can contribute to positive
adjustment.
Collectively, we adopt an ecological perspective to child development by considering key contexts—family, classroom, school,
and culture. The first paper sets the stage by offering an overview of how the acculturation process contributes to the school
adjustment of children of migrant backgrounds. The review of studies shows that their school success depends, in part, on how
well they can negotiate the acculturation demands of both the family and school. The second presentation focuses on classroom
diversity climate among migrant and non-migrant background German school children. The findings show that the messages of
cultural diversity that schools promote are linked to students’ attitudes towards one another and, importantly, to students’
perceived discrimination. The third presentation focuses on Chinese American adolescents and perceived discrimination. The
study shows that greater family cohesion can buffer (and family conflict can exacerbate) the negative effects of discrimination on
adolescent loneliness and somatization, but not grades. The fourth presentation examines father involvement for Turkish and
German children who are transitioning into the first grade. The results show that more father involvement predicts greater wellbeing for children, but only for those whose fathers reported higher fathering self-efficacy. Finally, the discussant, a leading
sociologist and acculturation researcher, will situate the four studies in the larger societal and global contexts and provide
directions for future research for understanding how children of migrant backgrounds can do well.
Our symposium brings together presenters of different disciplines from education, psychology, and sociology. We also showcase
studies of children of migrant background from Europe and the United States, allowing for a cultural contrast. Two of the
presentations use longitudinal data and all four presentations emphasize the important links between family, classroom, school,
and cultural contexts to better understand the academic and psychosocial adjustment of children of migrant backgrounds.
Beiträge des Symposiums
Minority youths’ acculturation and their school adjustment: Successful ways to bridge an acculturation
gap
Elena Makarova1, Dina Birman2, Judith Gilde1
1
University of Vienna, 2University of Miami
Introduction: The discourse on the school failure of immigrant youth and their high risk of school dropout is a pressing topic on
researchers’ agendas in many countries (e.g. Lamb, & Markussen, 2011). The academic achievement and psychological
adjustment of minority youths is closely linked to the process of their acculturation in the host country (e.g. Garcia-Coll & Marks,
2011). The contextual perspective in research on acculturation has highlighted the importance of addressing youths’ acculturation
in particular life domains (Birman, 2011; Trickett & Birman, 2005; Birman et al., 2007; Birman et al., 2013). In the school context,
studies have shown discrepancies between teachers’ and minority youths’ acculturation preferences (Makarova & Herzog, 2011;
2013). Within the family context they have revealed the existence of an acculturation gap between immigrant parents and their
children (Birman, 2006). Moreover, based on the ecological framework of human development (Bronfenbrenner, 1977), a study
by Birman and Espino (2007) highlighted the importance of addressing immigrant youths’ adaptation across family and school
life domains as the expectations on youths’ acculturation at home and at school are frequently divergent, making it challenging
for youth to manage the conflict between the two.
Focus of the study: The increasing number of publications on minority youths’ acculturation is evidence for the rising interest of
scholars in this topic. However, there is a lack of systematic review of empirical research with respect to the impact of
“acculturative press” (Trickett & Birman, 2005) across school and family domains on youth’s acculturation and school adjustment
in the host country. Thus, this study aims to systematize and integrate findings on the effects of teachers’ and parents’
expectations on minority youths’ school adjustment reported in empirical research on minority youths’ acculturation. The study is
important to the field as it is the first to provide such a review.
Methods: For purposes of this study 348 articles published between 2000 and 2013 in peer-reviewed journals on youths’
acculturation in the database of the Education Resources Information Centre were selected according to inclusion criteria
postulated for this study. The articles were analysed by applying the method of qualitative content analysis, using MAXQDA
software. The findings presented in the selected articles were analysed and integrated according to a deductively developed and
inductively enriched category system.
Results: The results of our study indicate that among 72 articles reporting on quantitative research only 2.8% addressed issues
of minority youths’ academic achievement and/or their psychological adjustment in relation to teachers’ expectations, while 13.9%
did so in relation to parental expectations. In contrast, of the 74 articles reporting on qualitative research, 35.1% addressed issues
of minority youths’ academic achievement and/or their psychological adjustment in relation to teachers’ expectations, and 25.7%
in relation to parental expectations. These are the focus of the study. Overall, content analysis of the two categories of teachers’
expectations and parents’ expectations addressed in qualitative studies has indicated various ways in which teachers’ and
parents’ support or hamper minority youth’ school adjustment. Our results have also shown that youths’ school adjustment is
often embedded in an acculturation dilemma shaped by the specific requirements of the family and school domain. Finally, our
findings have indicated successful strategies applied by minority youth in order to bridge an acculturation gap between family and
school life domains.
Two sides of the same coin? Diversity effects on interethnic attitudes and discrimination in multiethnic
classrooms
Miriam Schwarzenthal1, Maja Schachner1, Fons J. R. van de Vijver2, Linda Juang1
1
University of Potsdam, 2University of Tilburg
In 2013, 1 in 3 students in German schools had a migration background (Statistisches Bundesamt, 2014). As this year Germany
has welcomed an unprecedented number of refugees, this number will further increase. In order to sustain a peaceful and
harmonious society, it is essential to build good intergroup relations between students from diverse cultural groups from an early
age.
Previous research assessing the impact of structural diversity at school on intergroup relations has produced diverging results
(Thijs & Verkuyten, 2014). In order to find out under what conditions positive intergroup relations can be achieved in schools, one
needs to look beyond structural diversity and examine how schools deal with this diversity. Two types of cultural diversity climate
have been distinguished at school (Schachner, Noack, Van de Vijver, & Eckstein, 2015) – equality and inclusion and cultural
pluralism. Equality and inclusion is based on intergroup contact theory (Allport, 1954). Schools pursuing an equality and inclusion
approach promote equal treatment of students from different ethnic backgrounds and try to reduce discrimination. However, a
mere emphasis on reducing prejudice by promoting equality between cultural groups has been criticized as being “colour-blind”,
i.e. neglecting cultural differences, if not complemented by an appreciation of cultural pluralism (Park & Judd, 2005). Cultural
pluralism goes beyond the prevention of prejudice and discrimination by valuing diversity as an asset and a resource that can
enrich students’ learning.
This study goes beyond previous research on the impact of structural diversity and diversity climate on intergroup relations in the
following ways: (1) While previous studies have usually focused on either structural diversity or diversity climate, and have not
differentiated between equality and cultural pluralism, we include indicators of structural diversity as well as measures of the two
types of diversity norms. (2) The impact of context diversity on intergroup outcomes has often been studied separately for majority
and minority members, the former focusing on intergroup attitudes, the latter on perceived discrimination as an outcome. In this
study, we simultaneously investigate the relation between diversity at school and these two intergroup outcomes in adolescents
of immigrant background and ethnic German adolescents.
Our sample consists of 1591 6th graders, of whom 965 students had an immigrant background (at least one parent born in a
different country, 83 countries of origin). Data were collected as part of a questionnaire study in culturally diverse secondary
schools in Baden-Württemberg. The average age of the students was 11.5 years.
We applied a multilevel framework, including individual perceptions of diversity norms on level 1, as well as the classroomaggregated perceptions of these norms on level 2. In order to investigate whether relations differ between ethnic German students
and students of immigrant background, we treated immigrant background as a moderator.
Our results showed that a higher proportion of students of immigrant background was associated with a higher outgroup
orientation. As expected, stronger perceived equality norms were associated with higher outgroup orientation. Both perceived
equality norms as well as the aggregated equality climate were associated with lower perceived discrimination. Stronger
perceived pluralism norms were also associated with a higher outgroup orientation but at the same time more perceived
discrimination.
Compared to students of immigrant background, ethnic Germans showed higher increases in perceived discrimination, but also
in outgroup orientation, when the proportion of adolescents of immigrant background in a classroom was higher. Perceived
equality norms were more strongly associated with outgroup orientation for ethnic Germans, whereas they were associated more
strongly with lower perceived discrimination for students of immigrant background. The results are discussed with regard to
implications for educational research and practitioners.
Family as a protective factor for Chinese American adolescents experiencing discrimination
Linda Juang1, Alvin Alvarez2
1
University of Potsdam, 2San Francisco State University
In the United States, Asian Americans are one of the fastest growing populations, with Chinese Americans comprising the largest
portion of this group (Pew Research Social and Demographic Trends, 2012). Cultural/ethnic discrimination is one of the most
significant stressors facing adolescents of migrant families, especially those who are ethnic minorities. Berry et al.’s (2006) largescale, cross-national study of migrant adolescents from 13 countries showed that perceived discrimination was by far the
strongest predictor of adjustment. Greater perceived discrimination related to poorer psychological (e.g., life satisfaction, selfesteem, psychological distress) and sociocultural (e.g. school adjustment, behavior problems) adaptation. Subsequently, studies
of discrimination are vital to understanding migrant adolescent adaptation and integration into the larger society (European Union
Agency of Fundamental Rights, 2010) and their more immediate social contexts such as school.
Studies of Asian American adolescents show that they report higher levels of peer discrimination compared to their African
American and Latino counterparts (Greene, Way, & Pahl, 2006; Rosenbloom & Way, 2004). Thus, this study focuses on the
discrimination experiences of Chinese American adolescents. We examine how discrimination is linked to academic adjustment
(grade point average, GPA) and psychosocial adjustment (i.e., loneliness and symptomatic distress) and test whether family
relations can buffer or exacerbate these links. The sample included 181 Chinese American adolescents and parents (87%
mothers) recruited from San Francisco, California. The adolescents’ mean age was 14.8 years (SD = .74), ranged from 13 to 17
years, and 63% were female. A majority (66%) of the adolescents were U.S. born while 29% percent were foreign-born.
Descriptives showed that the sample did well academically with a mean grade point average of 3.26 (SD = .52, range 1 to 4 with
4 being the best score). Preliminary analyses also showed that age, migration status, and parent education was related to
perceived discrimination. Adolescents who were older perceived greater discrimination (r = .18, p = .01), U.S. born adolescents
(M = 1.74, SD = .63) reported less discrimination than foreign-born adolescents (M = 2.10, SD = .72, t (178) = 3.48, p = .001),
and parents with higher education had adolescents who reported less discrimination (r = -.20, p = .007).
For the main analyses we used hierarchical multiple regression and controlled for adolescent’s age, gender, migrant status, and
parent education. The results showed that greater perceived discrimination was related to poorer adjustment in terms of loneliness
and symptomatic distress. Discrimination, however, was not related to grade point average. The relations between discrimination
and psychosocial adjustment were either exacerbated or buffered by family conflict and cohesion. More specifically, greater family
conflict exacerbated the negative effects of discrimination, acting as a vulnerability factor. In contrast, greater family cohesion
buffered the negative effects of discrimination, acting as a protective factor. Importantly, at higher levels of discrimination, family
interactions matter.
Findings highlight the importance of identifying moderators such as family-level characteristics to help adolescents and their
families best deal with experiences of discrimination. Doing so moves us beyond targeting only individual-level characteristics
(such as developing a stronger ethnic identity or personal coping strategies) in helping adolescents deal with discrimination.
Although discrimination at any point of life is hurtful, adolescents may be particularly vulnerable because of the developmental
issues that define adolescence (e.g., emerging sense of identity, self-esteem, importance of peers). To effectively address
discrimination in the schools, both inside and outside school factors should be considered.
Turkish immigrant families: Paternal involvement fosters mothers’ marital satisfaction and children’s
well-being
Birgit Leyendecker, Alexandru Agache
Ruhr Universität Bochum
Research on parenting is often focused only on mothers, whereas the role of fathers is often ignored. This is especially true for
research on fathers in the context of immigration. Immigrant fathers are often either completely neglected or the focus is on a
deficit perspective, e.g., on the loss of social status or other risk factors (Strier & Roer-Strier, 2010). In our project, we were
interested in understanding how paternal involvement can promote family cohesion and children’s well-being. Specifically, we
examined paternal involvement in parenting, the association between parents’ perception of mutual support, and the relation to
their children’s well-being before (T1) and after the transition to first grade (T2). Participants were first and second generation
immigrant families from Turkey (n = 135). In addition, German families (n= 45) were included for the comparison of paternal
involvement. The percentage of highly involved fathers was higher in the German sample (52%) than the Turkish sample (36%),
but we found no influence of parents’ education, household income, employment status, or children’s gender. First generation
fathers were more likely to be highly involved than second generation fathers. Analyses of the longitudinal data revealed that
mothers with highly involved fathers were more likely to report higher marital support. This pattern was less clear for fathers.
Children with highly involved fathers reported significantly higher well-being at T1. For T2, a moderator analysis revealed a
positive effect on children’s well-being only for those fathers who were both highly involved and reported the highest fathering
self-efficacy. Among other variables, we controlled for children’s well-being at T1, their health status, fathers’ work hours and
mothers’ marital satisfaction.
ID: 294
Symposium
Disziplinen-Cluster: Erziehungswissenschaft
Thematisches Cluster: Schulentwicklung, Trainings- und Evaluationsforschung, Unterrichtsentwicklung/ Unterrichtsqualität
Stichworte: Schulinspektion, Qualität, Wirkung
Qualität von Schulinspektion
Chair(s): Holger Gärtner (Freie Universität Berlin)
Diskutant(en): Hans Anand Pant (Humboldt Universität zu Berlin)
Schulinspektion entwickelt sich zunehmend zum europäischen Standardverfahren der externen Evaluation von Schulen (Ehren,
Perryman & Shackleton, 2014). ). Inspektionen sollen die Qualität von Schulen objektiv feststellen und durch die Rückmeldung
ihrer Ergebnisse an verschiedene Akteure Entwicklungsaktivitäten auslösen (Ehren, Altrichter, McNamara & O’Hara, 2013).
Schwerpunkte aktueller Inspektionsforschung sind zum einen Fragen von Wirkung und Nebenwirkungen sowie Fragen zur
Qualität von Schulinspektionen als diagnostischem Verfahren (Gärtner & Pant, 2011). Im vorliegenden Symposium werden
unterschiedliche Aspekte der Qualität von Schulinspektion als diagnostischem Verfahren untersucht.
Der erste Beitrag von Kemethofer und Altrichter untersucht die Effekte von Schulinspektion in Abhängigkeit der
Rahmenbedingungen, unter denen sie arbeitet. Hierzu nutzen sie Daten einer europäischen Längsschnittstudie. Ihre Ergebnisse
deuten darauf hin, dass mit Zunahme des Rechenschaftsdrucks, der innerhalb eines Landes existiert, Schulleitungen nach
Inspektionen verstärkt Entwicklungsaktivitäten einleiten, aber auch verstärkt von negativen Nebenwirkungen berichten. Der
zweite Beitrag von Vaccaro und Lankes untersucht die einer Schulinspektion zugrundeliegenden Datenquellen. Konkret geht es
um die Wahrnehmungen von Lehrkräften, Eltern und Schülerinnen und Schülern ihrer Schule und in wie fern diese
Wahrnehmungen übereinstimmen. Erste Ergebnisse belegen eine deutliche Perspektivenabhängigkeit der Wahrnehmung von
Schulqualität. Die Beiträge Drei und Vier gehen anhand von Inspektionsdaten Fragen der Schuleffektivitätsforschung nach. Diese
Analysen untersuchen neben einer inhaltlichen Fragestellung auch, ob Inspektionsdaten die Qualität aufweisen, um
Fragestellungen der Schulqualitäts- bzw. Effektivitätsforschung zu untersuchen. Pietsch und Kollegen untersuchen im dritten
Beitrag, ob es einen Zusammenhang zwischen der Effektivität einer Schule (im Sinne der Lernentwicklung der Schülerinnen und
Schüler) und dem Führungsstil der Schulleitung (gemessen im Rahmen der Schulinspektion) gibt. Hierzu bilden Sie durch ein
propensity-score-matching Paare von Schulen, die zwar unter gleichen Rahmenbedingungen arbeiten, sich jedoch hinsichtlich
ihrer Effektivität unterscheiden. Gärtner untersucht im abschließenden Beitrag, ob es einen Zusammenhang zwischen
Organisationsmerkmalen wie Schulmanagement, Kooperation oder Personalentwicklung und der Qualität des Unterrichts gibt.
Etliche Modelle von Schulqualität formulieren diesen positiven Zusammenhang zwischen Organisationsmerkmalen und
Unterrichtsqualität. Anhand von Brandenburger Inspektionsdaten wird dieser Zusammenhang überprüft. Vorliegende Ergebnisse
deuten darauf hin, dass 1) nur wenige Organisationsmerkmale die Qualität des Unterrichts erklären können (u.a.
Personalentwicklung und Schulmanagement) und 2) sich die erklärenden Merkmale zwischen den Schulformen unterscheiden.
Die vorliegenden Beiträge repräsentieren unterschiedliche Strömungen aktueller Inspektionsforschung und liefern Hinweise zur
Qualität von Schulinspektion als diagnostischem Verfahren (Einflüsse auf die Wirksamkeit des Verfahrens) als auch Hinweise
darauf, welchen Nutzen Inspektionsdaten für die Schulqualitäts- und Schuleffektivitätsforschung haben.
Beiträge des Symposiums
Der Einfluss der Schulinspektion auf die Gestaltung von Lehr-Lernbedingungen
David Kemethofer1, Herbert Altrichter2
1
BIFIE Salzburg, 2Johannes Kepler Universität Linz
In den vergangenen Jahren wurde die Schulinspektion in vielen europäischen Ländern als Verfahren schulischer
Qualitätsentwicklung und –sicherung eingeführt bzw. bereits bestehende Verfahren an die Anforderungen eines evidenzbasierten
Steuerungsregimes angepasst. Schulinspektionen sollen zum einen schulische Qualitätsentwicklung unterstützen und begleiten,
zum anderen stellt die Schulinspektion auch ein Instrument der Rechenschaftslegung von Schulen dar. Im internationalen Kontext
ist das Verhältnis zwischen Kontrolle und Qualitätsentwicklung keinesfalls einheitlich, vielmehr werden in der bildungspolitischen
Praxis unterschiedliche Schwerpunkte gesetzt (vgl. z.B. Dedering, 2012). Ehren, Altrichter, McNamara und O‘Hara (2013) werten
die Programme von Inspektionsverfahren in sechs europäischen Ländern aus und kommen zu dem Schluss, dass sich diese in
einer Reihe von Charakteristika (z. B. Konsequenzen, Berichterstattung) unterscheiden. Ein Fallvergleich verdeutlicht aber auch,
dass die verschiedenen Inspektorate offenbar systemübergreifend gemeinsame Mechanismen annehmen, die den Prozess
schulischer Qualitätsentwicklung stimulieren sollen.
Die bisherige empirische Forschung zu den Wirkungen der Schulinspektion konzentriert sich fast ausschließlich auf jeweils ein
spezifisches Verfahren, das dann im Querschnitt untersucht wird. Sowohl die Analyse von Längsschnittdaten als auch
vergleichende Untersuchungen stellen derzeit Forschungsdesiderate dar. Der geplante Beitrag setzt an diesen Lücken an und
untersucht den Zusammenhang zwischen Schulinspektion und Aktivitäten der Schulentwicklung (1) in vergleichender Perspektive
am Beispiel von Österreich und Schweden sowie (2) in der Perspektive eines dreijährigen Längsschnitts. Dabei wird auf die
Arbeit von Ehren et al. (2015) aufgebaut, die unterschiedliche Folgemaßnahmen nach Schulinspektionen entsprechend
unterschiedlicher Inspektionscharakteristika nachweisen konnten. Weiters wird auf die Studie von Altrichter und Kemethofer
(2015) aufgebaut, die zeigen konnten, dass die Schulinspektion in Österreich als klassisches Low-Stakes-Verfahren ohne
Sanktionen oder Schwellenwerte einzuschätzen ist. Demgegenüber greift die Schulinspektion in Schweden auf ein differenziertes
Inspektionsmodell mit Sanktionen und einer Veröffentlichung der Ergebnisse zurück und repräsentiert damit ein Medium bis HighStakes-System. Die beiden divergierenden Ansätze spiegeln sich in einer unterschiedlichen Wahrnehmung von
Inspektionsverfahren durch Schulleitungen in Schweden und Österreich wider.
In dem hier vorgeschlagenen Beitrag kann die Effektivität von Schulinspektionen im Sinne der Fragestellung geprüft werden,
welchen Einfluss die Schulinspektion auf die Gestaltung von Lehr-Lernbedingungen in Österreich und Schweden in einer
Längsschnittperspektive hat. Von Interesse ist, ob die Entwicklungsaktivitäten mittel- bis längerfristig nachhaltig sind und ob in
beiden Ländern dieselben Mechanismen Entwicklungsaktivitäten stimulieren. Die Daten stammen aus dem EU-Projekt „Impact
of School Inspection on Teaching and Learning“ (ISI-TL; Ehren et al., 2013) und bieten die Möglichkeit aufzuzeigen, ob und wie
die Schulinspektion unter Berücksichtigung unterschiedlicher bildungspolitischer Rahmenbedingungen die Qualitätsentwicklung
an Schulen beeinflusst. In den Schuljahren 2010/11, 2011/12 und 2012/13 wurden Schulleitungen in Österreich und Schweden
aus dem Primar- und Sekundarbereich mittels standardisiertem Fragebogen zu ihren Erfahrungen mit Schulinspektionen und
den an ihren Schulen stattgefundenen Entwicklungsaktivitäten befragt. Innerhalb des Befragungszeitraumes wurden die Schulen
zu unterschiedlichen Zeitpunkten inspiziert, was eine Analyse der Effekte der Schulinspektion mittels Längsschnittdesign erlaubt.
Kontrollierend existiert eine Subgruppe von Schulen, welche während des Zeitraums der Untersuchung keine Schulinspektion
hatte.
Erste Ergebnisse deuten an, dass von der Schulinspektion kurzfristige direkte Effekte auf die Kenntnisse und Handlungen von
Bezugsgruppen und die Akzeptanz von Feedback ausgehen. Beide Mechanismen beeinflussen die Entwicklungsaktivitäten an
Schulen positiv. Mittel- bis langfristige Effekte scheinen indirekt durch die Erwartungshalten der Schulinspektion aufzutreten, ein
direkter Zusammenhang mit dem Inspektionsbesuch ist in unseren ersten Auswertungen nicht zu erkennen. Bisherige Analysen
zeigen ebenfalls den systemischen Einfluss, der durch Rechenschaftsdruck auf die Schulen ausgeübt wird. Demnach scheint
der wahrgenommene Druck, den Schulleitungen durch die Inspektion verspüren, sowohl mit Entwicklungsaktivitäten als auch mit
nicht-intendierten Konsequenzen assoziiert.
Zielgruppenspezifische Perspektiven der Schulqualität: fehlende Übereinstimmung der
Bewertungstendenzen von Lehrkräften, Eltern sowie Schülerinnen und Schülern im Kontext von externer
Evaluation
Didier Vaccaro, Eva-Maria Lankes
Bayerisches Staatsinstitut für Schulqualität und Bildungsforschu
Bei der Schulinspektion werden zur Bewertung der Qualität meist unterschiedliche Quellen berücksichtigt, neben
Befragungsergebnissen von Schülerinnen und Schülern etwa auch die von Lehrkräften (Sanders & Beywl, 2000).
Untersuchungen aus der Schuleffektivitätsforschung finden jedoch teilweise nur geringe Übereinstimmungen der Einschätzungen
unterschiedlicher Zielgruppen (Feldmann, 1989). Angesichts dieses Mangels an Konvergenz stellt sich die Frage nach der
Validität eines solchen multiperspektivischen Qualitätskonstruktes. Wie Clausen (2002) feststellt, erfassen die Items zu den
einzelnen Qualitätskriterien u. U. andere Aspekte, je nachdem, welche Zielgruppe befragt wird. Die fehlende
perspektivenübergreifende Konvergenz der Daten wäre demnach auf inhaltliche Unterschiede auf Konstruktebene
zurückzuführen. Dies setzt jedoch voraus, dass unabhängig von der jeweiligen Faktorstruktur der Daten perspektivenspezifische
Verzerrungstendenzen weitgehend ausgeschlossen werden können (z.B. Benton & Cashin, 2011). D.h. in der Einschätzung der
Qualitätskriterien durch Schüler/-innen, Lehrkräften und Eltern sollten sich keine perspektivenabhängigen Antwortmuster zeigen
(z.B. Positiv-Bias bei Lehrkräften). Eine perspektivenunabhängige Faktorstruktur in Kombination mit perspektivenabhängigen
Antwortmustern spräche demnach für mangelnde Validität des multiperspektivischen Qualitätskonstrukts. Umgekehrt wäre eine
perspektivenabhängige Faktorstruktur bei Vorliegen perspektivenunabhängiger Qualitätsprofile ein Hinweis dafür, dass die
Informationen aus den verschiedenen Quellen wechselseitig ergänzend interpretiert werden können.
In vorliegender Studie wurde untersucht, (a) ob die Items zur Erfassung von Qualitätskriterien bei Befragung verschiedener
Zielgruppen (Schüler/-innen, Lehrkräfte und Eltern) perspektivenspezifische Konstrukte repräsentieren, die inhaltlich voneinander
abgrenzbare Aspekte abbilden. Und (b) in wieweit in den Daten Antwortmuster identifizierbar sind, die sich als
perspektivenunabhängige Qualitätsprofile (vs. Verzerrungsprofile) interpretieren lassen. Grundlage für die Analyse waren die
Befragungsergebnisse von 117.326 Eltern, 105.566 Schüler/-innen und 12.304 Lehrkräften, welche im Rahmen der externen
Evaluation bayerischer Schulen von 2010/11 bis Ende 2014 befragt wurden. Jeder Datensatz wurde getrennt nach Zielgruppe
einer Faktorenanalyse mit obliquer Rotation (promax) unterzogen. Für die resultierenden Skalen wurden Faktorwerte berechnet
und skalenweise auf Schulebene aggregiert, so dass für jede Zielgruppe mehrere Skalenmittelwerte pro Schule vorlagen. Die so
aufbereiteten Daten wurden über die Schulnummer miteinander verknüpft (insgesamt 791 vollständige Datensätze). Die
Skalenmittelwerte wurden anschließend durch Trichotomisierung (Einteilung des Range der Skalenmittelwerte in gleichgroße
Wertebereiche) in diskrete Werte überführt (1 = niedrige Skalenmittelwerte, 2 = mittlere Skalenmittelwerte, 3 = hohe
Skalenmittelwerte) und einer Latent Class Analyse unterzogen.
Die Ergebnisse weisen darauf hin, dass in Übereinstimmung mit Clausen (2002) die Befragungsergebnisse zu den einzelnen
Qualitätskriterien je nach Zielgruppe inhaltlich weitgehend unterschiedliche Konstrukte abbilden (5-6 Skalen pro Gruppe,
Alphawerte zwischen .58 und .91). Die Latent Class Analyse legt aufgrund des BIC-Wertes 7 latente Klassen (typische
Antwortmuster) nahe, welche als quellenunabhängige Qualitätsprofile interpretierbar sind. Die Ergebnisse stellen erneut die
Bedeutung der Perspektivenabhängigkeit von Daten für die Interpretation von Fragebogenergebnissen im Evaluationskontext
heraus. Die Analyse verweisen zudem darauf, dass perspektivenübergreifende Widersprüche nicht unbedingt als mangelnde
Validität zu interpretieren sind. Interessanterweise verlaufen bei vorliegender Studie die Einschätzungstendenzen auf
verschiedene Skalen innerhalb einer Quelle bzw. Zielgruppe meist konstant, was Clausens (2002) Befund bestätigt, dass
Beurteilungen tendenziell einem globalen Schema folgen. Außerdem zeigt sich ein Zusammenhang zwischen Schulart und
Auftretenswahrscheinlichkeit einer latenten Klasse, was möglicherweise auf schulartspezifische Qualitätsprofile verweist.
Schulleitungshandeln an hochperformanten Schulen
Marcus Pietsch1, Markus Lücken2, Franziska Thonke2, Stefan Klitsche2
1
Universität Lüneburg/ifbq Hamburg, 2ifbq Hamburg
Schulinspektionen in Deutschland evaluieren schulische und unterrichtliche Prozessmerkmale. Die zu evaluierenden
Prozessstandards sind in der Regel in Qualitätsrahmen oder –tableaus dokumentiert, die wiederum als Grundlage für die
Entwicklung von Qualitätsindikatoren und Messinstrumenten herangezogen werden. Wenn auch häufig nicht explizit benannt,
rekurrieren die dort beschriebenen Aspekte von Schulqualität auf Befunde aus der Forschung zur Effektivität von Schule und
Unterricht (School- und Teacher-Effectiveness-Research, vgl. Ehren & Scheerens, 2015). Es wird somit angenommen, dass ein
Zusammenhang zwischen den im Rahmen von Schulinspektionen gemessenen und berichteten Prozessmerkmalen und
Schülerleistungen besteht. Eine Annahme, die sowohl international als auch im Rahmen deutscher Schulinspektionen bislang
kaum untersucht, geschweige denn bestätigt wurde.
Der Beitrag geht daher der Frage nach, ob sich ein Zusammenhang von Schülerleistungen und Prozessmerkmalen nachweisen
lässt. Als Analysegrundlage dienen Daten, die in den Jahren 2012 bis 2015 systematisch an Schulen in Hamburg erhoben wurde.
In einem ersten Schritt werden anhand von Daten der längsschnittlich angelegten und alljährlich mit jeder Schülerkohorte neu
durchgeführten Studie KErmit (Kompetenzen Ermitteln) Schulen identifiziert, deren Schülerschaft im Rahmen der Untersuchung
regelmäßig und wiederholt (d.h. über verschiedene Untersuchungskohorten) auffallend hohe Lernzuwächse in Mathematik und
Lesen erzielt haben. Diese Schulen werden mithilfe eines Propensity-Score-Matching mit Schulen verglichen, die unter ähnlichen
Bedingungen arbeiten (Kontrolle: Sozialer Hintergrund der Schülerschaft, Schulgröße etc.), deren Schülerschaft jedoch
vergleichsweise geringere Lernzuwächse erzielt.
In einem zweiten Schritt wird geprüft, ob sich Treatment- und Kontrollgruppe mit Blick auf das Schulleiterhandeln, dass sich im
Rahmen der Schulinspektion Hamburg dezidiert an den Konzepten der Schuleffektivitätsforschung orientiert, unterscheiden.
Schulleitungen, die zum Bildungserfolg der Schülerinnen und Schüler an ihren Schulen beitragen, sollten der
Schuleffektivitätsforschung zufolge die Schwerpunkte ihrer Arbeit vor allem darauf legen, 1) den Schulbeteiligten Wege und Ziele
vorzugeben, 2) Mitarbeiterinnen und Mitarbeiter (weiter) zu entwickeln, 3) die Schule (neu) zu gestalten und 4) das Lernen und
Lehren an der Schule aktiv zu steuern (vgl. Leithwood & Jantzi, 2008).
Die Schuleffektivitätsforschung unterscheidet hier zwei Konzepte voneinander: instruktionale und transformationale Führung (vgl.
Hallinger, 2003). Pädagogische Führung umfasst vor allem Managementaspekte, erfolgt primär aufgaben- und produktorientiert,
zielt auf die Optimierung vorhandener Strukturen und Prozesse ab und führt im Idealfall zu einer Verbesserung bereits
vorhandener Prozesse und Mechanismen. Die Schulleitung kontrolliert und koordiniert entsprechend gezielt Aspekte des Schul‐
und Unterrichtsgeschehens, die den Lernfortschritt der Schülerinnen und Schüler betreffen, und nimmt direkten Einfluss auf den
Unterricht und das Curriculum, z.B. durch die aktive Anleitung von Lehrkräften mittels Zielvorgaben, abgestimmten
Fortbildungsmaßnahmen und der Evaluation von Schülerleistungen.
Transformationale Führung hingegen umfasst in der Regel Führungsaspekte, erfolgt meist mitarbeiterorientiert und zielt auf die
nachhaltige Veränderung der schulischen Lern- und Arbeitskultur ab. Dieser Führungsstil soll daher primär zu innerschulischen
Innovationen und Veränderungen führen und ist maßgeblich dadurch geprägt, dass die Schulleitung eine sinnstiftende
Zukunftsvision für die Schule entwickelt, Lehrkräfte inspiriert und motiviert, einzelne Lehrerinnen und Lehrer gezielt unterstützt
und fördert sowie ihnen intellektuelle Herausforderungen bietet.
Ein besonders relevanter Aspekt von Führung an Schulen ist darüber hinaus die kooperative bzw. partizipative Führung, die auf
Beteiligung und Empowerment von Lehrkräften abzielt (vgl. Harris, 2013, Huber, Ahlgrimm, Hader-Popp, 2012). Kooperative
Führung zeichnet sich dadurch aus, dass Schulleitung und Lehrkräfte eng zusammenarbeiten und sich in ihren Kompetenzen
ergänzen. Verantwortlichkeiten und Aufgaben werden aufgeteilt.
Die Analysen zeigen, dass sich stabil hoch performante Schulen vor allem durch eine ausgeprägte instruktionale Führung
auszeichnen (Cohen’s d=0.46), wobei für eine passiv-vermeidende Führung negative Zusammenhänge nachweisbar sind
(Cohen’s d=-0.26). Auch für alle weiteren Führungsstile und Praktiken lassen sich bedeutsame Zusammenhänge feststellen
(Cohen’s d für Transformationale Führung=0.21, für Transaktionale Führung=0.26 und für partizipative Führung=0.37). In der
Konsequenz zeigt sich, dass stabile und hohe Leistungszuwächse vor allem an Schulen zu erwarten sind, an denen sich
Schulleitungen aktiv in das Schul- und Unterrichtsgeschehen einbringen.
Welche schulischen Merkmale beeinflussen die Unterrichtsqualität? Sekundäranalysen auf Grundlage
von Schulinspektionsdaten
Holger Gärtner
Institut für Schulqualität Berlin-Brandenburg an der FU Berlin
Schulinspektion als europäisches Standardverfahren der externen Evaluation von Schulen (Ehren, Perryman & Shackleton,
2014) eignet sich aufgrund umfänglicher Diagnostik, um Modelle von Schulqualität empirisch zu überprüfen (Wurster & Gärtner,
2013). Modelle von Schulqualität (u.a. Ditton, 2007; Slavin, 1995; Scheerens & Bosker, 1997) postulieren, dass bestimmte
Merkmale der Organisation Schule wie z.B. das Schulmanagement, die Personalentwicklung oder die Kooperationsstrukturen im
Kollegium die Qualität der Lehr-Lern-Prozesse im Unterricht beeinflussen. Im vorliegenden Beitrag wird untersucht, ob
Schulinspektionsdaten Erkenntnisse über den Zusammenhang zwischen Qualitätsmerkmalen auf der Organisationsebene und
der Unterrichtsqualität liefern können.
Durchgeführt wird eine Sekundäranalyse Brandenburger Schulinspektionsdaten. Abhängige Variablen sind die Wahrnehmungen
der Unterrichtsqualität aus Sicht der Inspektion sowie aus Schülersicht. Beide Perspektiven erfassen fünf Bereiche von
Unterrichtsqualität: Klassenmanagement, Schüleraktivierung, Strukturiertheit, Klassenklima und Differenzierung. Da die
Beurteilungen der Inspektorinnen und Inspektoren (.57 < r < .75) bzw. die Wahrnehmungen der Schülerinnen und Schüler (.69 <
r < .89) der einzelnen Teilaspekte hoch interkorrelieren, kann jeweils ein Globalfaktor Unterrichtsqualität gebildet werden.
Unabhängige Variablen sind die auf Schulebene beurteilten Qualitätsaspekte (u.a. Partizipationsmöglichkeiten,
Schulmanagement, Unterrichtsorganisation, Qualitätsentwicklung,…) aus Sicht der Inspektion, aus Sicht der Eltern sowie aus
Sicht der Lehrkräfte. Diese Informationen liegen für Grundschulen (N=384), Oberschulen (N=116), Gesamtschulen (N=21) und
Gymnasien (N=77) vor. Erfasst sind nahezu alle öffentlichen Schulen dieser Schulformen in Brandenburg. Alle Daten lagen von
vornherein auf Schulebene vor oder wurden auf Schulebene aggregiert (Unterrichtsbeobachtungen, Fragebogen). Die
Wahrnehmungen der Schülerinnen und Schüler zum Unterricht sind auf Schulebene äußerst reliabel (ICC2 > .90), die
Beobachtungsdaten aufgrund der relativ geringen Anzahl an Beobachtungen pro Schule weniger (.50 < ICC2 < .79) (Wurster &
Gärtner, 2013).
Erste Analysen zeigen, dass die Wahrnehmung der Unterrichtsqualität von Inspektoren und Schülerinnen und Schülern positiv
zusammenhängt (.36 < r < .54). Nur wenige der auf Schulebene beurteilten Qualitätsaspekte können jedoch Unterschiede in der
Unterrichtsqualität erklären, zudem fällt diese Erklärung perspektiven- als auch schulformspezifisch aus. Unterschiede in den
Bewertungen der Unterrichtsqualität können durchschnittlich zu 26% durch Schulmerkmale erklärt werden, wobei je nach
Schulform andere Merkmale zur Varianzaufklärung beitragen. In Grundschulen können z.B. die Ausprägung von 1)
Förderangeboten, 2) der Teamentwicklung im Kollegium, 3) der Partizipationsmöglichkeiten sowie die 4) Strategien der
Qualitätsverbesserung Unterschiede in der Unterrichtsqualität erklären (insgesamt 27%). In Gymnasien trifft dies auf die Qualität
der schulinternen Curricula, der Ausprägung der Teamentwicklung und der Transparenz über Leistungsanforderungen, kontrollen und –bewertungen zu (R² = 30%). Die Aufklärung von Unterschieden in der Schülerwahrnehmung durch
Schulmerkmale ist in derselben Größenordnung möglich (ja nach Schulform zwischen 12 und 28%); auch hier gilt, dass je nach
Schulform unterschiedliche Merkmale zur Varianzaufklärung beitragen. Im Gegensatz zu den Beurteilungen der Inspektoren
stehen die Eltern- und Lehrerwahrnehmungen von Organisationsmerkmalen in viel stärkerem Zusammenhang zur
Schülerwahrnehmung des Unterrichts. Obwohl Eltern nur wenige Aspekte von Schulqualität aus ihrer Sicht heraus beantworten,
kann die Elternwahrnehmung 52% der Unterschiede in der Schülerwahrnehmung des Unterrichts erklären, die
Lehrerwahrnehmung zu 44%. Weit weniger Erklärungskraft haben diese beiden Perspektiven zur Erklärung von Unterschieden
in den Unterrichtsbewertungen der Inspektoren (35% bzw. 14%).
Die explorativen Analysen deuten darauf hin, dass sich unter den Beteiligten an einer Schule (Eltern, Lehrkräften und
Schülerinnen und Schülern) gemeinsame Eindrücke der Schulrealität manifestieren und die Wahrnehmungen von Externen wie
Inspektorinnen und Inspektoren sich deutlicher davon unterscheiden. Zum anderen unterstützen die Ergebnisse bisherige
Erkenntnisse der Schulqualitätsforschung über relevante Qualitätsmerkale auf Schulebene, z.B. Ditton (2007), dessen Modell
ebenfalls die Relevanz von Personalentwicklung und Schulmanagement unterstreicht. Im Gegensatz zu den bekannten Modellen
von Schulqualität deuten die bisherigen Ergebnisse jedoch auf einen starken Einfluss der Schulform hin, d.h. möglicherweise
sind je nach Schulform andere Merkmale der Organisation wichtig, um einen qualitätsvollen Unterricht realisieren zu unterstützen.
ID: 295
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Soziologie
Thematisches Cluster: Schulentwicklung, Unterrichtsentwicklung/ Unterrichtsqualität
Stichworte: Ganztagsschule, Leseverstehen, Hausaufgabenbetreuung, Angebotsqualität
Potenziale und Wirkungen ganztagsschulischer Bildung – empirische Befunde aus der Studie zur
Entwicklung von Ganztagsschulen (StEG)
Chair(s): Eckhard Klieme (Deutsches Institut für Internationale Pädagogische Forschung)
Diskutant(en): Oliver Böhm-Kasper (Universität Bielefeld)
Der bundesweite Ausbau von Ganztagsschulen erfolgte vor allem mit den Zielen, die Vereinbarkeit von Beruf und Familie zu
verbessern und Schülerinnen und Schüler stärker individuell zu fördern (KMK, 2002). Ganztagsschulen bieten hierfür durch
erweiterte (vgl. time on task; Carroll, 1963) und flexiblere Zeitstrukturen, Angebote zu Hausaufgaben und Lernzeiten sowie die
Verknüpfung verschiedener Lernformen von Unterricht und extracurricularen Angeboten günstige Voraussetzungen. Damit ist u.
a. die Erwartung verknüpft, dass zentrale schulische und gesellschaftliche Bildungsziele gefördert werden, und dass auch soziale
Ungleichheit und damit einhergehende unterschiedliche Möglichkeiten, auf Ressourcen der Gesellschaft zuzugreifen, verringert
werden (Willems & Becker, 2015). Darüber hinaus zeigen Befunde aus der anglo-amerikanischen Forschung, dass die in
außerunterrichtlichen Angeboten erworbenen Kompetenzen auch eine Ressource für den weiteren Bildungsverlauf sein können
(Feldman & Majasko, 2005). Aktuelle Befunde der Ganztagsschulforschung weisen zudem die Angebotsqualität als ein wichtiges
Forschungs- und Handlungsfeld aus (z. B. Fischer et al., 2011). Hierbei wird theoretisch und empirisch an Befunde der aktuellen
Unterrichtsforschung angeknüpft (Klieme, Pauli & Reusser, 2009).
Im Symposium werden die genannten aktuellen Forschungsfelder systematisch anhand der vier Teilstudien der Studie zur
Entwicklung von Ganztagsschulen (StEG) aufgegriffen. Im Kern der Beiträge steht die Frage nach den Wirkungen der Teilnahme
an Ganztagsschule und der Qualität ganztagsschulischer Angebote. Dazu werden Befunde vorgestellt, die sich auf verschiedene
Abschnitte im schulischen Bildungsverlauf beziehen. Im ersten Beitrag wird auf Basis einer multiperspektivischen,
längsschnittlichen Fallstudie in der Primarstufe untersucht, wie sich Qualität eines ausgewählten Hausaufgabenangebots durch
die Implementation einer didaktisch-konzeptionellen Neuerung – genauer gesagt: eines Wochenplans – in der Primarstufe
verändern. Der zweite Beitrag aus der Primarstufe analysiert im Längsschnitt, welche Wirkungen einer Teilnahme an
Ganztagsangeboten sich auf das Leseverstehen zeigen und ob sich differenzielle Bildungserfolge identifizieren lassen. Der dritte
Beitrag aus der Sekundarstufe prüft, welche Effekte sowohl die Teilnahme als auch die pädagogische Qualität der Angebote auf
das Leseverstehen nach dem Übergang in die Sekundarschule I aufweisen. Im letzten Beitrag wird für Schülerinnen und Schüler
am Ende der Pflichtschulzeit untersucht, welchen Einfluss die retrospektiv erhobene Ganztagsbiografie von Nicht-Gymnasiasten
auf die Bewältigung des Übergangs hat.
Die über die Lebensspanne hinweg betrachteten Fragestellungen werden unter Nutzung quantitativer und qualitativrekonstruktiver Forschungsmethoden von einem interdisziplinär zusammengesetzten Team aus Erziehungswissenschaft,
Schulpädagogik, Soziologie und Psychologie bearbeitet.
Beiträge des Symposiums
Hausaufgaben- und Lernzeiten an Ganztagsschulen. Eine längsschnittliche Fallstudie zur Implementation
selbstbestimmter und schüleraktiver Hausaufgabenpraktiken
Johanna M. Gaiser, Stephan Kielblock, Ludwig Stecher
Justus-Liebig-Universität Gießen
Der erweiterte Zeitrahmen von Ganztagsschulen macht eine konzeptionelle Überarbeitung der konventionellen
Hausaufgabenpraktiken – als Aufgaben, die nach der Schule zu Hause von den Schüler/ innen erledigt werden – notwendig.
Dass mehr als die Hälfte der Schulen in Deutschland bereits als Ganztagsschulen zu bezeichnen sind, und der Ausbautrend
weiter anzuhalten scheint (Kielblock & Stecher, 2014), macht das Thema Hausaufgabenpraktiken an Ganztagsschulen (zur
Übersicht vgl. z. B. Höhmann & Schaper, 2008; Rabenstein, 2015) besonders relevant, um erfolgreiches Lernen zu ermöglichen
und zu fördern.
Theoretischer Hintergrund
Literatur. Bundesweit repräsentative Zahlen von Ganztagsschulleitungen belegen, dass an gut 90 Prozent der Ganztagsschulen
im Primar- und Gymnasialbereich und gut 80 Prozent der nichtgymnasialen Sekundarschulen Hausaufgabenbetreuung ein
Bestandteil des Ganztagsprogramms ist (StEG Konsortium, 2013). Die Hausaufgabenpraktiken an Ganztagsschulen scheinen in
einigen Fällen denen an Halbtagsschulen ähnlich zu sein, lediglich sind sie teilweise zu Schulaufgaben geworden (Markert, 2011;
Zepp, 2009), wobei die praktischen Routinen in manchen Fällen deutlich ‚unterrichtliche‘ – im Sinne von: fremdbestimmte und
reglementierte – Züge aufweisen (Kielblock, im Druck; Nordt & Röhner, 2008). Teils scheint das ‚Mehr an Zeit‘ in dieser Weise
eher als ‚time on task‘ gesehen zu werden, was beispielsweise zu Lasten der Autonomie der Schüler/ innen gehen kann
(Rabenstein & Podubrin, 2015). Neben didaktischen Konzepten (Knapp, 2007; Rütz, 2004, 2006; Wolf, 2008), finden sich in der
Literatur zu Hausaufgabenpraktiken an Ganztagsschulen zudem (multiprofessionelle) Kooperation (Haenisch, 2009; Höhmann
& Schaper, 2008), Erziehungspartnerschaften zwischen Eltern, Lehrer/ innen und Kooperationspartnern (Wild, 2009; Wild &
Gerber, 2007), Einblicke von Lehrkräfte in den nicht-unterrichtlichen Bereich (Haenisch, 2009) sowie die Beziehungsqualität
(Kaufmann, 2013) als zentrale Aspekte.
Es zeigen sich Forschungsdesidarate. Eines liegt in der Erforschung längerfristiger Prozesse von Hausaufgabenbetreuungen
bzw. in der prozessualen Begleitung von Implementationsprozessen neuer Praktiken. Zudem scheint der Übergang von
konventionellen Hausaufgabenpraktiken zu selbstbestimmten, schüleraktiven Formen (Rütz, 2006; Standop, 2013) besonderer
Aufmerksamkeit zu bedürfen.
Theoretischer Rahmen. Das hier Verwendung findende Rahmenmodell von Kielblock (im Druck) beschreibt ablaufende Prozesse
dieser Art im Hinblick auf Schüler/ innen. Besonders betont die Modellvorstellung die individuelle Wahrnehmung der Schüler/
innen, sowie ihre individuellen Bildungs- und Lernpraktiken.
Fragestellung
An einer ausgewählten Schule (im Sek. I Bereich) wird in einem ausgewählten Hausaufgabenangebot die Implementation eines
Wochenplans (Knapp, 2007; Rütz, 2004, 2006) über einen Zeitraum von eineinhalb Jahren multiperspektivisch rekonstruiert.
Damit stellt sich die Frage: Wie verändert sich die Qualität und Wirkung des Hausaufgabenangebots durch die Implementation
des Wochenplans? Diese Fragestellung ist für die Schul- und Ganztagsschulforschung wichtig, um die ablaufenden Prozesse
bei der Implementation selbstverantwortlicher und selbstgesteuerter Hausaufgaben- und Lernangebote besser zu verstehen. Von
ersten Hinweisen auf Gelingens- und Misslingensbedingungen für die Implementation könnte insbesondere auch die
Ganztagsschulpraxis profitieren.
Methode
Die zugrunde liegende Fragestellung wird mit empirischem Material aus dem Gießener Teilprojekt der Studie zur Entwicklung
von Ganztagsschulen (StEG-Q) bearbeitet. Die Daten enthalten Interviews mit Schüler/ innen sowie mit Lehrer/ innen und
Personen des weiteren pädagogisch tätigen Personals. Zudem wurden an der ausgewählten Schule Gruppendiskussionen mit
Schüler/ innen geführt, die die Hausaufgabenpraxis thematisieren. Und es wurden teilnehmende Beobachtungen in dem
Hausaufgabenangebot durchgeführt. All diese Methoden wurden in drei Feldphasen mit halbjährlichem Abstand eingesetzt,
sodass sich das Potenzial für eine multiperspektivische, längsschnittliche Fallstudie (vgl. Stake, 1995; Yin, 1984) ergibt.
Ergebnisse
Erste Analysen deuten an, dass die Implementation des Wochenplans den zuvor gesetzten (Hausaufgaben-)Alltag in Frage stellt
und sogar stört. Die Einführung des Wochenplans scheint nicht ‚ad hoc‘ zu funktionieren. Ablaufende Prozesse werden – unter
Nutzung des theoretischen Rahmenmodells – analysiert und beschrieben. Es werden Gelingens- und Misslingensbedingungen
herausgearbeitet und vor dem Hintergrund des Wissens über besondere Dynamiken der Implementation aus der
Implementationsforschung (vgl. z. B. Hall, 2010) diskutiert.
Wirkungen der Schülerteilnahme an Leseangeboten in Ganztagsschulen auf die Kompetenzentwicklung
von Grundschulkindern? Analysen zu differenziellen Effekten auf die Leseleistung
Heinz Günter Holtappels1, Karin Lossen1, Ariane S. Willems2, Janine Hannemann1, Lea Spillebeen1, Katja Tillmann1,
Wolfram Rollett3
1
Institut für Schulentwicklungsforschung, TU Dortmund, 2Georg-August-Universität Göttingen, 3Pädagogische Hochschule
Freiburg
Mit der Beschulung von Grundschulkindern in Ganztagsschulen werden vor allem Ziele in der Lernförderung und der
Verbesserung sozialer Chancengleichheit verfolgt (Holtappels, 2006). Belege für leistungswirksame Vorteile von
Ganztagsschulen gegenüber Halbtagsschulen sind ebenso rar, wie im Vergleich von Ganztagsteilnehmern und Nichtteilnehmern.
Die Schweizer Studie EduCare konnte für die ersten drei Grundschuljahre einen stärkerer Zuwachs der sprachlichen und
mathematischen Kompetenzen bei Tagesschulkindern gegenüber Halbtagsschulkindern belegen (Schüpbach, Herzog &
Ignaczewska, 2013; Schüpbach, 2012). Holtappels, Radisch, Rollett und Kowoll (2010) belegen in ihren Sekundäranalysen zu
IGLU 2006, dass die Leseleistungen der Schülerschaften an Ganztagsgrundschulen querschnittlich betrachtet schwächer
ausfallen als an Halbtagsgrundschulen. Allerdings lässt sich dieser Unterschied größtenteils durch Unterschiede in den
Hintergrundvariablen der Schüler/innen erklären. Eine neue Auswertung der Daten aus IGLU 2006 und TIMSS 2007 in
Grundschulen stellt in einer, allerdings wiederum nur querschnittlichen, Vergleichsanalyse von Halb- und Ganztagsschüler/-innen
fest, dass es bei nach sozialer Herkunft vergleichbaren Gruppen keinen Effekt der Ganztagsschulteilnahme zum
Erhebungszeitpunkt auf die Schülerleistung gibt (vbw, 2013).
Dass über die Ganztagsschulteilnahme Fördereffekte erreicht werden können, zeigen die Ergebnisse der Längsschnittstudie
„Ganztagsorganisation im Grundschulbereich“ (GO) vor allem für die Lernentwicklung von Kindern mit Sprachrückständen (Bellin
& Wegner 2010; Merkens, Schründer-Lenzen & Bellin 2010). Die Befunde zur Leseentwicklung in den ersten beiden
Grundschuljahren zeigen einen schwachen Effekt der generellen Teilnahme am Ganztagsbetrieb auf die Kompetenzentwicklung;
Lernrückstände aufgrund sozialer Herkunftsbedingungen werden zwar nicht ausgeglichen, allerdings nehmen Schüler/-innen mit
nichtdeutscher Herkunftssprache eine etwas bessere Entwicklung in ihren Leseleistungen, wenn sie am Ganztagsangebot ihrer
Schulen teilnehmen (Bellin & Tamke, 2010).
Diese Befundlage macht deutlich, dass weitere empirische Untersuchungen zur Wirkung des Besuchs vor allem fachbezogener
Ganztagsangebote, auf die Kompetenzentwicklung und die Chancengleich-heitsgewinne für Kinder aus sozioökonomisch
benachteiligten Familien und niedrigem Bildungs-hintergrund erforderlich sind.
Aus diesem Grund wird in diesem Beitrag untersucht, inwieweit die Teilnahme an lesethematisch ausgerichteten extracurricularen
Angeboten Einfluss auf die Lesekompetenzentwicklung von Grundschulkindern hat und welche Rolle individuelle
Hintergrundvariablen (Geschlecht, Migrations-hintergrund, sozioökonomischer Status und Schulbildung in der Familie) für den
Effekt der Angebotsteilnahme auf die Lesekompetenz spielen.
Diesen Fragen wird anhand der Längsschnittdaten der Studie StEG-P, die über eineinhalb Jahre (Mitte Klasse 3 bis Ende Klasse
4) bei 2.149 Schüler/-innen an 67 Ganztagsgrundschulen erhoben wurden, nachgegangen. Die Lesekompetenz wurde mit
standardisierten Leistungstestaufgaben aus IGLU zu Beginn und zum Ende der Studie erfasst. Außerdem haben die
teilnehmenden Schüler/-innen zu jedem Schulhalbjahresende Angaben zu den von ihnen besuchten Angeboten gemacht. Um
verschiedene mögliche Teilnahmemuster abzubilden wurden Variablen zur generellen Teilnahme an Leseangeboten und zur
Intensität der Teilnahme gebildet sowie die Angebote zu Lesen in fachlich gerichtete (Leseförderung, Lesen macht Spaß, etc.)
und unspezifische Leseangebote (Theater, Schülerzeitung, etc.) unterteilt. Mittels multipler Regressionsanalysen wurde der
Einfluss dieser Angebotsteilnahmevariablen allein sowie unter Berücksichtigung individueller Hintergrundvariablen (Geschlecht,
Migrationshintergrund, Familiensprache, Schulbildung in der Familie und HISEI) auf die Lesekompetenzentwicklung überprüft.
Deskriptiv zeigt sich, dass über alle drei Messzeitpunkte lediglich 534 der untersuchten Kinder an Angeboten im Bereich Lesen
teilnehmen. Die Teilnahme von Schüler/-innen an lesespezifischen Angeboten, die die Primarstufenschulen in ihrem
Ganztagsbetrieb gestalten, ergibt für die untersuchte Stichprobe nicht die erwarteten Effekte auf die Entwicklung der
Lesekompetenz. Diese Befundlage ändert sich auch nicht wenn Hintergrundvariablen berücksichtigt werden (Ausgangsleistung,
Geschlecht, sozialer Hintergrund, Familiensprache, Migrationshintergrund) oder die Intensität bzw. die Persistenz der Teilnahme
kontrolliert wird.
Das Fehlen der erwarteten Wirksamkeit des Besuchs von Leseangeboten könnte zum einen an Schwächen im didaktischen
Konzept beziehungsweise der Qualität der Angebote liegen, zum anderen beziehen sich die verwendeten Kompetenztests zu
wenig auf das realisierte Curriculum. Zudem zeigt sich, dass Lernende mit höherer Leseausgangskompetenz signifikant häufiger
lesespezifische Angebote besuchen, was Leistungszuwächse begrenzen könnte. Man kann dies auch dahingehend
interpretieren, dass eine neigungsbestimmte Auswahl der Angebote dazu führen könnte, dass das Förderpotenzial von
Ganztagsangeboten nicht ausgeschöpft wird.
Potenziale von Ganztagsangeboten zur Förderung des Leseverstehens
Markus Sauerwein1, Désirée Theis1, Natalie Fischer2, Anett Wolgast1, Katrin Heyl1
1
Deutsches Institut für Internationale Pädagogische Forschung, 2Universität Kassel
Lesen gilt sowohl als notwendige Kompetenz für eine spätere Erwerbstätigkeit als auch als Vorrausetzung für die Teilhabe am
gesellschaftlichen Leben (Friebertshäuser, 2008). Es wird davon ausgegangen, dass der Schriftspracherwerb maßgeblich im
Deutschunterricht der Grundschule erfolgt. Dementsprechend liegt der Fokus in der Sekundarstufe in der Regel nicht auf dem
Erwerb von Lese- bzw. Textverstehens-Kompetenzen, obwohl ein Teil der Schüler/-innen in diesen Bereichen noch Defizite
aufweist (Artelt et al., 2007). Die Einführung von Ganztagsschulen ist u. a. mit der Hoffnung verbunden, dass durch den
erweiterten Zeitrahmen Schüler/-innen besser gefördert und Leistungsdefizite kompensiert werden können (Stecher et al., 2009;
Palentin, 2007; Rauschenbach & Otto, 2008). Ganztagsangebote, die das Leseverstehen explizit fördern sollen, oder in denen
Leseverstehenskompetenzen informell angeeignet werden können, sollen Schüler/-innen zusätzliche Bildungsgelegenheiten
bieten. Voraussetzung hierfür ist erstens, dass (leistungsschwächere) Schüler/-innen auch tatsächlich an entsprechenden
Ganztagsangeboten teilnehmen, sowie zweitens, dass sie die Lehrprozesse in den Leseangeboten nutzen, um ihre
Kompetenzen zu erhöhen.
Basierend auf dem Angebots-Nutzungs-Modell (Fend, 1981; Helmke & Weinert 1997) kann zwischen der Qualität des Angebots
und der Qualität der Nutzung unterschieden werden. Nach Seidel (2014) werden im Angebots-Nutzungs-Modell
Forschungsansätze1, die auf das Lehren fokussieren, mit Forschungsansätzen des Lernens zusammengeführt. Lehrprozesse
im Unterricht können als Angebot an die Schüler/-innen verstanden werden, welches von den individuellen Schüler/-innen
„genutzt“ werden muss, um Lernerfolg zu erzielen. In Bezug auf Ganztagsangebote darf von einem doppelten AngebotsNutzungs-Modell ausgegangen werden. So muss zunächst ein entsprechendes Angebot bereitgehalten werden (Angebot), dass
die Schüler/-innen auch besuchen (Nutzung). In dem Angebot selbst müssen die Schüler/-innen die Lehrprozesse der
Angebotsleiter/-innen (Angebot) für sich individuell nutzen und in Lernprozesse transferieren.
Um die Qualität in Ganztagsangeboten empirisch zu erfassen, wurde ein erweitertes Qualitätskonzept zugrunde gelegt, welches
neben den Basisdimensionen guten Unterrichts (Zeitnutzung, kognitive Aktivierung, Motivationsunterstützung) auch
Qualitätsaspekte der außerschulischen Bildung beinhaltet wie Partizipationsmöglichkeiten, Lebensweltorientierung sowie die
Anerkennung der Betreuer/-innen (Sauerwein, in Begutachtung). Damit soll der Eigenheit der pädagogischen Gattung
Ganztagsangebot Rechnung getragen werden, die weder Schulunterricht noch außerschulisches Bildungsangebot ist, sondern
eine Mischform aus beidem.
Ziel dieses Beitrags ist es, zu untersuchen, inwiefern Schüler/-innen von Ganztagsangeboten profitieren, die gezielt die
Lesekompetenz fördern sollen (z. B. Lesetrainings) und Angebote, in den Lesekompetenzen informell entwickelt werden sollen
(z.B. Theater-AG). Hierfür wird erstens deskriptiv betrachtet, welche Schüler/-innen an diesen zwei Angebotsarten partizipieren.
Darauf aufbauend wird der Frage nachgegangen, ob die Teilnahme in diesen Angeboten einen Effekt auf das Leseverstehen der
Schüler/-innen hat. Zudem werden Effekte der wahrgenommenen Qualität des Angebots auf das Leseverstehen betrachtet.
Diese Frage wird mit einer Teilstudie, der Studie zur Entwicklung von Ganztagsschulen, beantwortet. Die Stichprobe umfasst
2105 Schüler/-innen aus 66 Schulen der fünften Jahrgangsstufe. Diese wurden von Beginn bis Ende des Schuljahres 2013/14
drei Mal computerbasiert u. a. zur Angebotsnutzung und Prozessqualität in Ganztagsangeboten befragt.
Ein deskriptiver Vergleich der Teilnehmer/-innen in den Ganztagsangeboten der Kategorien Lesen und Medien mit der
Gesamtstichprobe zeigt, dass insgesamt nur wenige Schüler/-innen an Ganztagsangeboten der Kategorie Medien (142) oder
Lesen (115) teilnehmen. Schüler/-innen, die zu Beginn der fünften Klasse eine schlechtere Leseleistung aufweisen nehmen
häufiger an Leseangeboten teil, Schüler/-innen mit besseren Leseleistungen in Medienangeboten. Regressionsanalysen zeigen
jedoch, dass eine reine Teilnahme an den Ganztagsangeboten keinen Effekt auf die Leseleistung der Schüler/-innen hat. Darüber
hinaus scheinen lediglich Partizipationsmöglichkeiten in Medienangeboten positiv mit der Leseleistung zusammenzuhängen.
Nur wenige Schüler/-innen an den untersuchten Ganztagsschulen nehmen an Medien- oder Leseangeboten teil. Zudem scheinen
die Schüler/-innen die Qualität der Angebote nicht in erfolgreiche Lernprozesse hinsichtlich einer Verbesserung ihrer
Lesekompetenzen transferieren zu können. Dies scheint dafür zu sprechen, dass Ganztagsangebote nicht die in sie gesetzten
Erwartungen erfüllen und konkrete Kompetenzen jenseits des Unterrichts fördern.
Zur Relevanz der Ganztagsteilnahme bei der Bewältigung kritischer Passagen am Ende der
Schullaufbahn
Bettina Arnoldt, Peter Furthmüller, Christine Steiner
Deutsches Jugendinstitut
Außerhalb des Unterrichts stattfindende Bildungsangebote werden inzwischen als vielversprechende Gelegenheiten des
Kompetenzerwerbs von Kindern und Jugendlichen angesehen. Vorliegende Befunde zeigen, dass die Inanspruchnahme
außerunterrichtlicher Angebote schulische Bildungsprozesse unterstützen (Fischer u.a. 2011). US-amerikanische Forschungen
lassen vermuten, dass die mit der Inanspruchnahme von außerunterrichtlichen Angeboten vermittelten Kompetenzen,
Fähigkeiten oder auch Erfahrungen durchaus auch zu relevanten Ressourcen für den weiteren Bildungsverlauf werden können
(Feldman & Matjasko 2005).
In theoretischer Hinsicht lässt sich hier an die Kapitaltheorie von Pierre Bourdieu (1979, 1983) anknüpfen. Bourdieu zeigte, dass
kulturelle Güter nicht nur den Handlungsspielraum von Personen erweitern, sondern auch verwertet, d.h. in Abschlüsse aber
auch in ökonomische Vorteile wie bessere Berufschancen umgesetzt werden können (dazu auch Baumert, Watermann &
Schümer, 2003, S. 54ff.). Inwieweit dies auf die Nutzung von außerunterrichtlichen und ganztägigen Angeboten zutrifft, wurde im
deutschsprachigen Raum bisher noch nicht untersucht.
Ziel des am DJI angesiedelten Teilprojekts „Stabilisierung von Bildungsverläufen durch die Ganztagsschule“ des StEGVerbundes ist es, diese Forschungslücke zu schließen. Dazu wurden zwischen 2013 und 2014 insgesamt drei Befragungen von
Schüler/-innen in Abschlussklassen nichtgymnasialer Schulen der Sekundarstufe I durchgeführt, um vor allem benachteiligte
Schüler/-innen zu erreichen. Auf Basis dieser in Teilen retrospektiv angelegten Befragungen ist es möglich, die Schullaufbahn
sowie die Beteiligung an non-formalen schulischen und außerschulischen Angeboten detailliert nachzuzeichnen und den
Zusammenhang mit den Bildungsaspirationen und dem tatsächlichen Verbleib der Jugendlichen im Anschluss an die
Sekundarstufe I zu analysieren.
Im geplanten Vortrag wird der Frage nachgegangen, welchen Einfluss die Ganztagsbiografie auf die Bewältigung des Übergangs
am Ende der Schulzeit hat. Hierfür liegen die Daten von 1901 Schüler/-innen aus der ersten Welle vor sowie Längsschnittdaten
von 413 Schüler/-innen über zwei Wellen bzw. 319 Schüler/-innen über drei Wellen vor. Auf Basis der retrospektiv erhobenen
Angaben wurden mithilfe von Sequenzmusteranalysen zunächst Cluster der Angebotsteilnahme gebildet, die thematische
Schwerpunkte und Dauern der Teilnahme miteinander verbinden. Diese Cluster werden als Indikator der Ganztagsbiografie
herangezogen. Anhand von schrittweisen logistischen Regressionsanalysen wird gezeigt, welchen Einfluss die Cluster der
Angebotsteilnahme unter Kontrolle individueller, schulbezogener und regionaler Merkmale auf die Bildungspläne und den
weiteren tatsächlichen Bildungsverlauf haben.
Dabei zeigt sich, dass die Zugehörigkeit zu den Clustern der Angebotsteilnahme sozial selektiv ist, wobei Leistungsmerkmale
und das Geschlecht vorherrschend sind. In Bezug auf den Einfluss der Ganztagsbiografie beim Übergang wird deutlich, dass die
reine Teilnahme bzw. die Dauer der Teilnahme allein nicht entscheidend ist, sondern insbesondere die Inhalte der genutzten
Angebote. So geht die verstärkte Teilnahme an musisch-kulturellen Angeboten und fachnahen Zusatzangeboten mit dem Erwerb
eines höherwertigen Schulabschlusses einher. Im Vergleich dazu haben Jugendliche, die eine Ausbildung begonnen haben,
deutlich weniger solcher Angebote besucht.
ID: 296
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie
Thematisches Cluster: Genderforschung
Stichworte: Geschlechtsunterschiede, Schulleistung, Determinanten der Schulleistung
Geschlechtsunterschiede in Schulleistung und Schulleistungsdeterminanten
Chair(s): Sebastian Bergold (TU Dortmund), Anke Heyder (FU Berlin)
Diskutant(en): Jörn Sparfeldt (Universität des Saarlandes)
Geschlechtsunterschiede im Bildungserfolg gehören zu den meistdiskutierten Themen der Bildungsforschung. Unser Symposium
vereint vier aktuelle erziehungswissenschaftliche und psychologische Forschungsarbeiten, die aus unterschiedlichen
theoretischen Perspektiven und mit verschiedenen Forschungsdesigns Geschlechtsunterschiede in Schulleistungen und ihren
kognitiven und motivationalen Determinanten untersuchen. Übergreifendes Ziel unseres Symposiums ist, durch das
Zusammenbringen dieser Perspektiven neue Erkenntnisse zur Entstehung schulerfolgsbezogener Geschlechtsunterschiede zu
gewinnen.
Im ersten Beitrag (Lazarides, Rubach & Ittel) wird auf Basis von Längsschnittdaten von 475 Jugendlichen untersucht, inwiefern
wahrgenommene mathematikbezogene Wertüberzeugungen der Eltern und der Jugendlichen mathematikbezogene
Berufswünsche der Jugendlichen beeinflussen. Mädchen zeigen geringere mathematikbezogene Berufswünsche und
Wertüberzeugungen als Jungen und nehmen auch bei ihren Eltern eine geringere Wertschätzung der Mathematik wahr. Die
wahrgenommenen Wertüberzeugungen der Eltern sagen die Wertüberzeugungen von Jungen vorher, jedoch nicht die der
Mädchen. Die Wertüberzeugungen der Jugendlichen haben wiederum bei beiden Geschlechtern einen positiven Effekt auf die
mathematikbezogenen Berufswünsche.
Heyder und Kessels untersuchen in einer experimentellen Studie mit 216 Neuntklässler/-innen, ob Jungen beim Lernen
Wiederholungsstrategien eher einsetzen, wenn diese mit einer männlich konnotierten Metapher gelabelt sind, als wenn diese mit
einer weiblich konnotierten Metapher gelabelt sind. Konfigurationsfrequenzanalysen zeigen, dass Jungen in einer diagnostischen
Situation und weiblich konnotiertem Labeling Wiederholungsstrategien seltener wählen, als bei Unabhängigkeit der Merkmale
Geschlecht, Bedrohungsgrad, Labeling und Strategiewahl zu erwarten wäre. Dies ist nicht der Fall, wenn die
Wiederholungsstrategien männlich gelabelt sind.
Im dritten Beitrag untersuchen Steinmayr und Spinath mit zwei experimentellen Studien mit 666 bzw. 542 Jugendlichen, ob und
über welche Prozessvariablen vermittelt Zeitrestriktionen Mädchen beim Abruf ihres Leistungspotentials in numerischen
Intelligenztests behindern und somit Geschlechtsunterschiede in der Messung zugunsten von Jungen vergrößern. Ohne
Zeitrestriktion zeigen sich geringere Geschlechtsunterschiede im numerischen Reasoning als mit Zeitrestriktion. Dieses Ergebnis
wird in der zweiten Studie mit einem Within-subject-Design repliziert, insbesondere bei Mädchen mit mittlerer und hoher
Leistungsfähigkeit. Deckeneffekte bei den Jungen können als Alternativerklärung ausgeschlossen werden. Der Effekt wird
teilweise durch motivationale und emotionale Variablen erklärt.
Bergold, Kasper, Wendt und Steinmayr untersuchen im vierten Beitrag auf der Basis von 74.868 Viertklässlern aus 17
europäischen Ländern, wie sich die Leistungstestergebnisse zu Lesen, Mathematik und Naturwissenschaften aus den
gemeinsamen TIMSS- und PIRLS-Erhebungen von 2011 zu Profilen zusammenfassen lassen. Latente Profilanalysen zeigen,
dass sich die Profile ausschließlich nach domänenübergreifendem Fähigkeitsniveau und nicht nach domänenspezifischen
Stärken und Schwächen unterscheiden lassen. Im leistungsstärksten Profil sind Jungen in 14 der 17 Länder überrepräsentiert.
Über alle Länder hinweg betrachtet kommen hier auf ein Mädchen durchschnittlich 1,24 Jungen.
Die Beiträge werden von Jörn Sparfeldt diskutiert.
Beiträge des Symposiums
Motivation und Berufswünsche von Mädchen und Jungen in Mathematik: Welche Rolle spielen
wahrgenommene Überzeugungen der Eltern zum Fach und karrierebezogene Eltern-Kind Gespräche?
Rebecca Lazarides, Charlott Rubach, Angela Ittel
TU Berlin
Die aktuelle empirische Befundlage verdeutlicht persistierende Geschlechterunterschiede im Mathematikinteresse (Watt, 2004),
im wahrgenommenen Nutzen von Mathematik (Steinmayr & Spinath, 2010) sowie in den mathematikbezogenen Berufswünschen
Jugendlicher (Watt, 2006). Basierend auf dem Eccles et al. model of parent socialization (Eccles, 1993) zeigen
Forschungsarbeiten, dass in der häufig als männlich stereotypisierten Domäne Mathematik geringere elterliche
Leistungserwartungen und Wertüberzeugungen zur geringeren Motivation von Mädchen in Mathematik beitragen, die wiederum
ihre Wahl mathematikbezogener Berufe prägt (Lazarides, Harackiewicz, Pesu, & Viljaranta, 2015). Nur wenige Studien widmen
sich dabei bislang der Frage nach reziproken Effekten in solchen intergenerationalen Transmissionsprozessen (Simpkins,
Fredricks, & Eccles, 2015). Auch wird bislang eher selten untersucht, inwieweit die Relationen zwischen elterlichen
Wertüberzeugungen und den fachbezogenen Werten zwischen Mädchen und Jungen im Jugendalter variieren (Taskinen,
Dietrich, & Kracke, 2015).
Die Studie geht der Frage nach, inwieweit die von Jugendlichen wahrgenommenen elterlichen mathematikbezogenen
Wertüberzeugungen, karrierebezogene Gespräche mit den Eltern und die mathematikbezogenen Wertüberzeugungen der
Jugendlichen sich wechselseitig beeinflussen und durch diese Prozesse die mathematikbezogenen Berufswünsche der
Jugendlichen prägen. Neben der Frage nach Geschlechtsunterschieden in den mathematikbezogenen Wertüberzeugungen und
Berufswünschen wurde auch analysiert, inwieweit die Zusammenhänge zwischen Mädchen und Jungen variieren.
In der Studie wurden Fragebogendaten einer Teilstichprobe der Berliner BeBest Studie zur Berufs- und Studienorientierung von
475 Jugendlichen aus der elften und zwölften Jahrgangsstufe ausgewertet (Mädchen: 50.3 %; Alter in Jahren: M = 16.77, SD =
0.97). Die Jugendlichen aus 31 Schulklassen nahmen an zwei Messzeitpunkten (Schuljahresbeginn; Mitte des Schuljahres) an
der Studie teil. Zur Auswertung der Fragestellungen wurden längsschnittliche Strukturgleichungsmodelle und Multiple
Gruppenanalysen durchgeführt.
Der Vergleich latenter Mittelwerte zeigte signifikant geringere mathematikbezogene intrinsischer Werte (Mädchen: M = 2.69, SE
= 0.11; Jungen: M = 3.09, SE = 0.16, z = -0.374, p = .01) und Nutzenwerte (Mädchen: M = 2.46, SE = 0.08; Jungen: M = 2.79,
SE = 0.14, z = -0.381, p < .01) Mädchen nahmen geringere mathematikbezogene Nutzenüberzeugungen ihrer Eltern wahr
(Mädchen: M = 2.08, SE = 0.10; M = 2.49, SE = 0.08, z = -.460, p <.001). Des Weiteren berichteten Mädchen signifikant geringere
mathematikbezogene Berufswünsche als Jungen (Mädchen: M = 51.96, SE = 2.51; Jungen: M = 61.85, SE = 2.03, t = 2.97, p <
.001).
Wahrgenommene elterliche mathematikbezogene Nutzenüberzeugungen zu T1 hatten einen signifikanten Effekt auf den
Nutzenwert der Jugendlichen zu T2 (β = .129, SE = .06, p < .05). Der mathematikbezogene Nutzenwert zu T2 stand in
signifikantem Zusammenhang zu mathematikbezogenen Karriereplänen zu T2 (β = .401, SE = .10, p < .001). Mädchen
berichteten einen geringeren Nutzenwert zu T1 – indirekt wirkte über diesen Effekt das Geschlecht der Jugendlichen auch auf
den Nutzenwert zu T2 (βind = -.073, SE = .04, p < .05 [90% CI = -.13 - -.02]). Der Nutzenwert zu T1 wirkte indirekt auf die
mathematikbezogenen Karrierepläne zu T2 durch den Nutzenwert zu T2 (βind = .192, SE = .06, p = .001 [90% CI = .10 – 2.87]).
Das Modell erklärte u.a. signifikante Varianzanteile der Karrierepläne (R² = .29), des intrinsischen Wertes (T2: R² = .63) und des
Nutzenwertes (T2: R² = .49).
Nur bei Jungen hatte die wahrgenommene elterliche Nutzenüberzeugung zu T1 einen Effekt auf den mathematikbezogenen
Nutzenwert zu T2 (Δχ² (1) = 4.89). Nur bei Jungen hatte der mathematikbezogene intrinsische Wert zu T1 einen signifikanten
Effekt auf die wahrgenommenen karrierebezogenen Gespräche mit Vätern zu T2 (Δχ² (1) = 4.09).
Training macht den Meister. Geschlechtsspezifische Labeling-Effekte auf die Lernstrategiepräferenzen
von Jugendlichen
Anke Heyder, Ursula Kessels
FU Berlin
Die gegenwärtig besseren Noten von Mädchen im Vergleich zu denen von Jungen können zu einem bedeutenden Teil darauf
zurückgeführt werden, dass Mädchen sich in der Schule stärker engagieren und mehr lernförderliches Verhalten zeigen. Diese
Geschlechtsunterschiede im Lernverhalten werden z.B. damit erklärt, dass Jungen solche lernförderlichen Verhaltensweisen wie
Fleiß und Anstrengung ablehnen, weil sie diese als typisch weiblich und damit nicht zu ihrem maskulinen Selbstbild passend
ansehen (Kessels, Heyder, Latsch & Hannover, 2014).
Eine Geschlechtstypisierung liegt auch im Bereich der Lernstrategien vor: Mädchen geben in Befragungen an, häufiger
Wiederholungs- und Kontrollstrategien zu nutzen als Jungen, welche wiederum nach eigenen Angaben häufiger
Elaborationsstrategien anwenden (z.B. Artelt, Naumann & Schneider, 2010). In einer Vorstudie konnten wir zudem belegen, dass
insbesondere Wiederholungs- und Kontrollstrategien (wie z.B. etwas fleißig auswendig lernen) unter Jugendlichen als typisch für
Mädchen gelten.
Unsere Studie untersucht, ob schon die Benennung der Wiederholungsstrategie (Labeling) beeinflusst, ob Jungen diese Strategie
wählen. Basierend auf der großen Wichtigkeit von Sport für Jungen (Lampert, Mensink, Romahn & Woll, 2007) und der
maskulinen Konnotation des Faches Sport (Hannover & Kessels, 2002) nahmen wir an, dass Jungen eher eine (gemäß
bevorstehender Testsituation zielführende) Wiederholungsstrategie wählen werden, wenn diese mit der Metapher des
„Trainierens“ beschrieben wird als wenn diese mit dem weiblich konnotierten „Fleiß“ bezeichnet wird. Konkret erwarteten wir,
dass Jungen es in einer selbstwertbedrohlichen, als diagnostisch bezeichneten Lernsituation ablehnen, Inhalte „fleißig auswendig
zu lernen“ (und stattdessen die in diesem Kontext riskantere Elaborationsstrategie „nachdenken, bis ich es richtig verstanden
habe“ präferieren), wohingegen sie häufiger die Wiederholungsstrategie wählen sollten, wenn diese als „konsequent trainieren“
bezeichnet wird. In einer Bedingung mit niedriger Selbstwertbedrohung ohne Ankündigung eines diagnostischen Tests sollten
Jungen sich immer häufiger für „nachdenken“ entscheiden, unabhängig davon, ob „auswendig lernen“ oder „trainieren“ die
Alternative darstellt. Bei Mädchen sollte sich dieses differentielle Muster nicht zeigen.
In einem 2 (between: Geschlecht männlich vs. weiblich) x 2 (between: diagnostischer Test ja vs. nein) x 2 (between: Labeling der
Wiederholungsstrategie „auswendig lernen“ vs. „trainieren“)–faktoriellen Experiment wurde die Wirkung des Labelings der
Wiederholungsstrategie auf die Lernstrategiewahlen von Jungen und Mädchen in einer selbstwertbedrohlichen und in einer nichtselbstwertbedrohlichen Situation untersucht. Den teilnehmenden 216 Jugendlichen der 9. Jahrgangsstufe zweier Gymnasien
wurde in einem Fragebogen zunächst eine Aufgabe angekündigt, welche entweder dazu diene, die Fähigkeiten der Person zu
messen (Bedrohung durch diagnostischen Test) oder die Qualität des Lernmaterials zu bewerten (keine Bedrohung). Zur
Vorbereitung auf die Aufgabe wurden ihnen zwei Lernstrategien zur Auswahl gestellt (entweder „nachdenken“ versus „auswendig
lernen“ oder „nachdenken“ versus „trainieren“), von denen die Jugendlichen eine Lernstrategie auswählen mussten.
Die Jugendlichen wählten in allen Bedingungen häufiger „nachdenken“ als die Wiederholungsstrategie. Mithilfe einer
Konfigurationsfrequenzanalyse wurde geprüft, ob das Labeling und die Testsituation die Strategiewahl von Jungen und Mädchen
beeinflussten. Wie erwartet, wählten Jungen in der Bedrohungssituation signifikant häufiger die Strategie „nachdenken“, wenn
die Alternative „auswendig lernen“ lautete, als bei vollständiger Unabhängigkeit der Merkmale Geschlecht, Bedrohung, Labeling
und Strategiewahl zu erwarten gewesen wäre. Unserer Hypothese entsprechend bestand dieser Zusammenhang nicht, wenn
die Alternative zu „nachdenken“ als „trainieren“ bezeichnet worden war. Auf die Strategiewahl der Mädchen hatten das Labeling
der Wiederholungsstrategie und die Bedrohung keinen Einfluss.
Unsere Ergebnisse zeigen zusammengefasst, dass durch die Vermeidung weiblich stereotypisierter Bezeichnungen für
Lernverhalten dieses für Jungen attraktiver wird, ohne dass es von Mädchen als weniger attraktiv wahrgenommen wird. In
weiteren Studien gilt es zu prüfen, ob sich die hier gezeigten Veränderungen der Präferenzen von Jungen auch in
entsprechenden Veränderungen im tatsächlich gezeigten Lernverhalten und Lernerfolg manifestieren.
Zeitrestriktionen vergrößern Geschlechtsunterschiede in numerischen Intelligenztests
Ricarda Steinmayr1, Birgit Spinath2
1
TU Dortmund, 2Universität Heidelberg
Die Größe von Geschlechtsunterschieden in mathematischen Fähigkeiten hängt wesentlich von der Erfassungsmethode ab. So
treten z. B. größere Geschlechtsunterschiede zugunsten von Jungen in numerischen Intelligenztests als in mathematischen
Schulleistungstests auf. Ein wesentlicher Grund hierfür könnten Zeitrestriktionen in numerischen Intelligenztests sein. So fanden
Tsui und Maziocco (2007) bei hochbegabten Schülerinnen und Schülern, dass sich die Leistung von Mädchen, nicht jedoch von
Jungen, in einer Power-Version eines mathematischen Leistungstests gegenüber einer Version mit zusätzlicher SpeedKomponente verbesserte. Dies könnte zumindest teilweise durch motivationale und emotionale Faktoren erklärt werden. Studien
haben bereits gezeigt, dass Variablen wie Leistungsängstlichkeit, Fähigkeitsselbstkonzept oder intrinsische Werte den
Zusammenhang zwischen Geschlecht und numerischen Testleistungen mediieren (z. B. Ganley & Vasilyeva, 2014; Steinmayr,
Wirthwein & Schöne, 2014). Insbesondere leistungsängstliche Testteilnehmer/innen werden durch Zeitrestriktionen in ihrer
Leistung gehemmt (Hill & Wigfield, 1984).
In zwei experimentellen Studien untersuchten wir daher, ob und über welche vermittelnden Variablen Zeitrestriktionen Mädchen
beim Abruf ihres Leistungspotenzials in numerischen Intelligenztests behindern und somit Geschlechtsunterschiede in der
Messung zugunsten von Jungen vergrößern. Zudem überprüften wir, ob insbesondere Mädchen mit hoher Leistungsfähigkeit
durch Zeitrestriktionen benachteiligt werden und ob sich Effekte der Zeitrestriktion auch in anderen Testinhalten zeigen.
In Studie 1 bearbeiteten N = 666 Elft- und Zwölftklässler/innen (333 Mädchen; Alter: M = 17.06, SD = 0.88) aus sechs zufällig
ausgewählten Gymnasien die verbalen, numerischen und figuralen Reasoning-Skalen des Grundmoduls des Intelligenz-StrukturTests 2000 R (IST 2000 R; Liepmann, Beauducel, Brocke & Amthauer, 2007). Die Teilnehmer/innen wurden randomisiert einer
Bedingung ohne Zeitveränderung (n = 365; verbal: 21 Min.; numerisch: 30 Min.; figural: 27 Min.; „Speed“-Bedingung) oder einer
Bedingung mit Zeitveränderung (n = 301; verbal: 10.5 Min.; numerisch: 40 Min.; figural: 37 Min.; „Power“-Bedingung) zugewiesen
(Between-subject-Design). Die Auswertung geschah mit einer 2x2 MANOVA und nachfolgenden ANOVAs. Unabhängige
Variablen (UVn) waren das Geschlecht und die Zeitrestriktionsbedingung, abhängige Variablen (AVn) waren verbales,
numerisches und figurales Reasoning.
In der Power-Bedingung zeigten sich geringere Geschlechtsunterschiede zugunsten der Jungen im numerischen Reasoning als
in der Speed-Bedingung (Zeitrestriktion x Geschlecht: F(1, 662) = 7.52, p = .006, η² = .01; dPower = 0.48, dSpeed = 0.89). Im
verbalen und im figuralen Reasoning zeigte sich kein signifikanter Interaktionseffekt. Dieses Ergebnis steht in Einklang mit der
Hypothese, dass Zeitrestriktionen Mädchen daran hindern, ihr Leistungsmaximum abzurufen.
Um Deckeneffekte bei den Jungen als Alternativerklärung für den gefundenen Effekt ausschließen zu können und mögliche
Mediationen durch motivationale und emotionale Variablen zu untersuchen, bearbeiteten in Studie 2 weitere N = 542 Elft- und
Zwölftklässler/innen (283 Mädchen; Alter: M = 17.60, SD = 1.05) in randomisierter Reihenfolge Parallelversionen der numerischen
Reasoning-Skala aus dem IST 2000 R ohne (30 Min.) und mit (51 Min.) Zeitzugabe (Within-subject-Design). Zudem füllten sie
Fragebögen zu verschiedenen motivationalen und emotionalen Konstrukten aus (mathematisches Fähigkeitsselbstkonzept,
Leistungsängstlichkeit in Mathematik, selbsteingeschätzte numerische Intelligenz, Leistungsmotiv, intrinsischer Wert von
Mathematik sowie Erfolgserwartung). Die Auswertung erfolgte durch eine 2x2x2 AN(C)OVA mit Messwiederholung (Withinsubject-Bedingung: Speed- vs. Power-Test; UVn: Geschlecht, Testreihenfolge; AV: numerisches Reasoning; Kovariaten:
motivationale und emotionale Variablen).
In der Power-Bedingung verbesserten die Teilnehmer/innen ihre Leistung, Mädchen jedoch stärker als Jungen, so dass wie in
Studie 1 die Geschlechtsunterschiede in der Power-Bedingung geringer ausfielen als in der Speed-Bedingung (Zeitrestriktion x
Geschlecht: F(1, 538) = 31.23, p < .001, η² = .06; dPower = 0.43/0.48 vs. dSpeed = 0.59/0.74). Dies traf insbesondere auf
Mädchen im mittleren und oberen Leistungsbereich zu, so dass Deckeneffekte bei den Jungen als Alternativerklärung für die
gefundenen Effekte ausgeschlossen werden können. Der Effekt konnte teilweise durch motivationale und emotionale Faktoren
erklärt werden.
Aus diesen Ergebnissen kann geschlossen werden, dass eine hohe Speed-Komponente in numerischen Intelligenztests
Mädchen (insbesondere solche mit hoher Fähigkeit), teilweise vermittelt über motivationale und emotionale Variablen, daran
hindert, ihr volles Leistungspotential zu demonstrieren.
Geschlechtsunterschiede im oberen Bereich schulischer Leistungsfähigkeit: Eine personenzentrierte
Analyse
Sebastian Bergold, Daniel Kasper, Heike Wendt, Ricarda Steinmayr
TU Dortmund
Studien zeigen, dass Jungen im oberen Intelligenzbereich überrepräsentiert sind (z. B. Deary, Thorpe, Wilson, Starr & Whalley,
2003; Rost, 1993; Strand, Deary & Smith, 2006). Dies ist auch bereits für einzelne schulische Kompetenzen wie mathematische
und naturwissenschaftliche Fähigkeiten gezeigt worden (z. B. Guiso, Monte, Sapienza & Zingales, 2008; Hedges & Nowell, 1995;
Reilly, 2012). Bei Lesefähigkeit zeigte sich eine Überrepräsentation von Mädchen im oberen Leistungsbereich (z. B. Nowell &
Hedges, 1998; Machin & Pekkarinen, 2008).
Bislang wurden diese schulischen Kompetenzen jedoch meist getrennt voneinander untersucht, womit implizit angenommen
wird, dass sie nicht miteinander korreliert sind und schulische Kompetenztests ausschließlich die jeweils angezielte Kompetenz
erfassen. Diese Annahmen entsprechen jedoch nicht den Befunden und aktuellen Modellen der Intelligenzforschung, die von
einer hierarchischen Organisation kognitiver Fähigkeiten ausgehen (z. B. Carroll, 1993; s. auch Neisser et al., 1996). Zudem
haben internationale Schulleistungsstudien bereits gezeigt, dass verschiedene schulische Kompetenztests substanziell
interkorreliert sind (vgl. z. B. Bos et al., 2012; Reilly, 2012). Schulische Kompetenzen existieren somit nicht voneinander isoliert,
sondern Schülerinnen und Schüler vereinen mehrere schulische Kompetenzen in sich. Somit erscheint eine personenzentrierte
Analyse als vielversprechender Zugang zur genaueren Untersuchung von Geschlechtsunterschieden in schulischen
Kompetenzen.
Wir untersuchten daher, inwiefern sich mathematische, naturwissenschaftliche und Lesekompetenzen zu Profilen
zusammenfassen lassen. Die Annahme war, dass sich die Profile allein im Gesamtfähigkeitsniveau der zugehörigen
Schülerinnen und Schüler unterscheiden und nicht in domänenspezifischen Stärken und Schwächen. Wir untersuchten
außerdem das Geschlechterverhältnis im leistungsstärksten Profil mit der Erwartung, dass sich analog zu den Ergebnissen aus
der Intelligenzforschung ein Geschlechterverhältnis zugunsten der Jungen zeigt.
Zu diesem Zweck analysierten wir repräsentative Daten von N = 74.868 Viertklässlern (36.655 Mädchen, 38.213 Jungen) von
2704 Schulen aus 17 europäischen Ländern, die an den im Jahr 2011 gemeinsam durchgeführten Erhebungen der TIMS-Studie
und der PIRL-Studie teilgenommen hatten. Wir führten latente Profilanalysen (LPA) auf Basis der Testleistungen in Lesen,
Mathematik und Naturwissenschaften durch. Zunächst wurde auf Basis aller Daten das Modell mit dem besten Fit (indiziert durch
CAIC und BIC) ausgewählt (internationales Modell; Modell 1). Anschließend wurden die Anzahl der Profile von Modell 1 und ihre
konditionalen Mittelwerte fixiert (Modell 2) und der Fit für jedes einzelne Land separat inspiziert, um die Gültigkeit des
internationalen Modells für jedes Land zu überprüfen. Im letzten Schritt wurden die konditionalen Mittelwerte wieder frei geschätzt
und das Geschlecht als zusätzliche Variable aufgenommen (Modell 3), um das Geschlechterverhältnis in den einzelnen Profilen
in jedem Land zu ermitteln.
Die LPA ergab die beste Lösung für ein internationales Modell mit sieben Profilen. Dieses erwies sich ebenfalls als hinreichend
valide (Klassifikationsfehlerrate < 25%) für 15 der 17 Länder. Die Leistungen in allen drei Kompetenztests stiegen von Profil 1 zu
Profil 7 kontinuierlich und konsistent an. Es konnten keine weiteren systematischen Muster beobachtet werden. Somit
unterschieden sich die Profile wie angenommen ausschließlich im domänenübergreifenden Leistungsniveau. Über alle Länder
gemittelt gehörten 4,4% aller Schülerinnen und Schüler zum leistungsstärksten Profil (Profil 7) ihres jeweiligen Landes. Jungen
waren in 14 der 17 Länder in diesem Profil überrepräsentiert. Das Geschlechterverhältnis bewegte sich in diesen Ländern
zwischen 1,14 (Finnland) und 1,67 (Tschechien) Jungen für jedes Mädchen. In nur zwei Ländern (Nordirland und Schweden)
zeigten sich keine Unterschiede, und in einem Land (Irland) zeigte sich ein leichter Unterschied zugunsten von Mädchen (0,96).
Das mittlere Geschlechterverhältnis über alle Länder hinweg lag bei 1,24 zugunsten der Jungen.
ID: 310
Symposium
Disziplinen-Cluster: Wirtschafts- und Berufspädagogik, Didaktik Mathematik, Didaktiken der Naturwissenschaften und Technik
Thematisches Cluster: Lehrerexpertise, Methoden der empirischen Bildungsforschung, Unterrichtsentwicklung/
Unterrichtsqualität
Stichworte: Professionswissen, Pedagogical Content Knowledge, Entwicklung und Effekte von Lehrerkompetenzen
Determinanten und Effekte des Lehrerwissens - Studien zur fachlichen, fachdidaktischen und
pädagogischen Kompetenz von Lehrpersonen unterschiedlicher Disziplinen
Chair(s): Christoph Helm (Johannes Kepler Universität Linz)
Diskutant(en): Eveline Wuttke (Goethe-Universität Frankfurt am Main)
Das Symposium stellt vier Beiträge vor, die die Bedeutung der Lehrerkompetenzen für den Unterricht in den Disziplinen
Mathematik, Naturwissenschaft sowie politische und kaufmännische Bildung erforschen: Welche Rolle spielt die
Lehrerkompetenz für die kognitive Aktivierung im Unterricht und die Entwicklung der Schülerkompetenzen? Wodurch ist die
Entwicklung der Lehrerkompetenzen determiniert?
Insbesondere jüngere Forschung (COACTIV, TEDS-M, EMW, …) belegt die hohe Bedeutung kompetenter Lehrpersonen für die
Entwicklung der Lernenden. Es ist daher unbestritten, dass dieses Forschungsfeld einen zentralen Beitrag zum Wissen über die
Entstehung von Bildungserfolgen leistet. Im Besonderen hervorzuheben ist die Interdisziplinarität des Symposiums, das erstmals
allgemeinbildende und berufsbildende Domänen in diesem Forschungsfeld vereint.
Beitrag 1 widmet sich der Identifikation von Prädiktoren des fachspezifischen und pädagogischen Wissens angehender
Lehrkräfte im Fach Mathematik. Mit Hilfe von hierarchischen Modellen wird anhand der deutschen TEDS-M-Stichprobe
untersucht, ob sich die in der Schulforschung erforschten Beziehungsmuster – zwischen den individuellen (z.B. Vorwissen) und
institutionellen Merkmalen (z.B. Lerngelegenheiten) einerseits und dem fachlichen, fachdidaktischen und pädagogischen Wissen
der künftigen Mathematiklehrer/innen andererseits – auf die Lehrerausbildung übertragen lassen.
Ökonomische Bildung als Teil der Allgemeinbildung sollte den notwendigen Raum in der Schule erhalten und zudem nicht durch
Defizite in der Ausbildung der dafür vorgesehenen Lehrpersonen beeinträchtigt werden. Bislang ist diese sehr heterogen und
teilweise ausgesprochen defizitär. Ergebnisse einer Interventionsstudie in Beitrag 2 zeigen einen ersten Schritt zu mehr Raum
für ökonomische Bildung.
In Beitrag 3 diskutieren die Autor/inn/en Probleme, die sich bei der Untersuchung der Zusammenhänge zwischen dem
Professionswissen von Lehrkräften und ihrer realisierten Unterrichtsqualität in den Fächern Biologie, Chemie und Physik ergeben.
Im Rahmen der ProwiN-Studie (23 Gymnasiallehrkräfte und -klassen aus NRW wurden getestet und videografiert) wird der Frage
nachgegangen, ob das CK und das PCK – über die kognitiven Fähigkeiten hinaus – die Entwicklung der Schülerleistungen
vorhersagen. Die Ergebnisse werden vor dem Hintergrund der Herausforderungen derartiger Studien diskutiert.
Vergleichbare Fragen werden in Beitrag 4 für das Fach Rechnungswesen präsentiert. Es interessiert, inwiefern die
fachdidaktische Expertise von Lehrkräften dieses Faches mit der kognitiven Aktivierung und der Kompetenzentwicklung der
Schüler/innen berufsbildender Schulen in Österreich zusammenhängt. Dazu wurden im Rahmen einer Studie 20 Schulklassen
dreimal (jeweils am Schuljahresende) befragt bzw. getestet. Zusätzlich wurde die Fachdidaktikkompetenz der Lehrpersonen nach
dem Modell von Berger et al. (2013) erfasst. Die Ergebnisse werden entlang domänespezifischer Merkmale des
Rechnungswesenunterrichts diskutiert.
Eveline Wuttke reflektiert abschließend alle vier Beiträge, indem sie sowohl inhalts- als auch forschungskritisch Bezug auf die
Studien nimmt.
Beiträge des Symposiums
Individuelle und institutionelle Prädiktoren des fachspezifischen und pädagogischen Wissens
angehender Mathematiklehrkräfte für die Sekundarstufe I in Deutschland
Christin Laschke1, Sigrid Blömeke2
1
Humboldt-Universität zu Berlin, 2University of Oslo
Theoretischer Hintergrund
Lehrkräfte stehen vor der Herausforderung, den Erwerb fachlichen Wissens bei Schülerinnen und Schülern mit adäquaten
Methoden anzuregen und zu unterstützen. Dies muss unter unterschiedlichen Rahmenbedingungen geschehen können. Insofern
ist es wichtig, dass Lehrkräfte nicht nur Experten ihrer Fächer, sondern auch fachdidaktisch und pädagogisch befähigt sind. Der
Lehrerausbildung kommt die Aufgabe zu, zukünftige Lehrkräfte mit entsprechender Expertise auszustatten und die dazu
notwendigen Lerngelegenheiten in Form geeigneter Lehr-Lernmethoden zu bieten. Dies ist eine wichtige Voraussetzung für das
Handeln der Lehrkräfte in der Schule (Blömeke et al., 2014).
Um sich der Frage zu nähern, welche Faktoren den Kompetenzerwerb im Rahmen der Lehrerausbildung bedingen, geben
Befunde aus der Schulforschung Hinweise. Demzufolge sind Leistungen von Lernenden abhängig von einem komplexen Gefüge
von individuellen Merkmalen der Lernenden und institutionellen Rahmenbedingungen. So beeinflussen individuelle Merkmale,
wie Geschlecht, soziale und kulturelle Herkunft, Motivation und Vorwissen, die Leistungen von Schülerinnen und Schülern.
Darüber hinaus sind institutionelle Faktoren wie Lerngelegenheiten und die Zusammensetzung von Lerngruppen
ausschlaggebend für Schulleistungen in Deutschland (Ehmke & Jude, 2010; Stanat, Rauch & Segeritz, 2010; Helmke & Schrader,
2006; Möller, 2008; Helmke, 2004). Entsprechend bisheriger Befunde basierend auf den Daten der Teacher Education and
Development Study-Learning to Teach Mathematics (TEDS-M, Tatto 2008) gilt dies auch für den Wissensstand angehender
Primar- und Sekundarlehrkräfte über alle TEDS-M-Länder hinweg (Blömeke, Suhl, Kaiser & Döhrmann, 2012; Blömeke, Kaiser
& Döhrmann, 2011). Sowohl institutionelle Merkmale wie die Lerngelegenheit als auch individuelle kognitive und affektive
Merkmale sowie im Fall der Primarlehrkräfte der sozio-demographische Hintergrund erklären Unterschiede im Wissensniveau.
Fragestellung
Inwiefern sich Beziehungsmuster, die im schulischen Kontext und für die Mathematiklehrerausbildung über alle TEDS-M-Länder
hinweg gelten, auf die Mathematiklehramtsausbildung in Deutschland übertragen lassen, wurde bisher nicht untersucht. Vor
diesem Hintergrund wird der Frage nachgegangen, inwieweit fachliches, fachdidaktisches und pädagogisches Wissen, die als
wesentliche Facetten des Professionswissens von Lehrkräften zu verstehen sind (Weinert, 1999), abhängig von individuellen
Merkmalen der angehenden Lehrkräfte ist und welche Rolle institutionelle Rahmenbedingungen spielen.
Methode
Auf Basis der deutschen TEDS-M-Stichprobe für angehengende Lehrkräfte für die Sekundarstufe I wird mit Hilfe von
hierarchischen linearen Modellen untersucht, inwieweit das fachliche, fachdidaktische und allgemein-pädagogische Wissen
abhängig ist von den individuellen Merkmalen Geschlecht, Bildungshintergrund und Sprachgebrauch sowie den Motiven für die
Aufnahme des Studiums, dem allgemeinen und fachspezifischen Vorwissens sowie den Studienumständen in Bezug auf familiäre
und finanzielle Hinderungsgründe. Darüber hinaus wird die Bedeutung institutioneller Merkmale in den Blick genommen. Dabei
wird neben dem Studiengang, den Lerngelegenheiten und den erfahrenen Lehr-Lernmethoden auch die Komposition der
Studierendenschaft in Bezug auf ihr Vorwissen berücksichtigt.
Ergebnisse
Zentrale Befunde lassen sich wie folgt zusammenfassen. In allen drei Domänen geht ein höheres generisches Vorwissen mit
besseren Leistungen am Ende des Studiums einher. Darüber hinaus zeigen sich Vorteile in Bezug auf das mathematische und
mathematikdidaktische Wissen für diejenigen, die vor Eintritt in die Lehrerausbildung einen Leistungskurs Mathematik besucht
haben. Dies gilt auch für angehende Lehrkräfte, die das Studium aufgrund einer starken fachbezogenen Motivation ergriffen
haben. Zudem zeigen sich Unterschiede im Wissensniveau nach Geschlecht. Männer schneiden im Mathematiktest besser ab,
Frauen im Pädagogiktest. Als hinderlich empfundene familiäre und finanzielle Verpflichtungen gehen sowohl mit geringerem
Mathematikwissen als auch mit geringerem Pädagogikwissen einher.
In Bezug auf die institutionellen Rahmenbedingungen hat sich insbesondere gezeigt, dass wesentliche Unterschiede im
fachbezogenen Wissensniveau nach Studiengängen bestehen. Angehende Lehrkräfte mit Lehrberechtigung für die gymnasiale
Oberstufe zeichnen sich durch umfangreicheres Wissen in Mathematik und Mathematikdidaktik aus als Lehrkräfte ohne
Gymnasialberechtigung. Dies begründet sich v. a. dadurch, dass den angehenden Gymnasiallehrkräften ein größerer Umfang
an fachbezogenen Lerngelegenheiten geboten wird.
Die Ergebnisse replizieren Befunde aus der Schulforschung und der Studien von Blömeke et al. (2011, 2012), wonach u. a.
Motivation, Vorwissen und Lerngelegenheiten wichtige Prädiktoren für das Wissensniveau sind.
Evaluation professionellen ökonomischen Lehrerwissens
Christin Siegfried
Goethe-Universität Frankfurt am Main
Theorie
Das aktive Interesse an politischen wie wirtschaftlichen Themen ist eine unabdingbare Prämisse für das nachhaltige Wirken einer
Gesellschaft und die Bewältigung des täglichen Lebens des Individuums (z.B. Kaminski & Eggert 2008).
Im Rahmen des Faches „Politik und Wirtschaft“ wurde diese Prämisse in die Curricula allgemeinbildender Schulen aufgenommen
und damit ein Anfang für den angestrebten Bildungserfolg im Bereich ökonomischer Kompetenz geschaffen. Dennoch zeigen die
Ergebnisse verschiedene Studien eher ökonomische „Inkompetenz“ von jungen Erwachsenen (z.B. Schumann et al., 2010,
Retzmann, Seber, Remmele & Jongebloed 2012). Unter Berücksichtigung der Wirkungskette zwischen professionellem
Lehrerwissen, welches sich insbesondere in den Komponenten Fachwissen und fachdidaktisches Wissen (Shulman, 1986)
äußert, und dem Lernerfolg von Schülerinnen und Schülern (z.B. Baumert & Kunter, 2011) lassen solche Befunde vermuten,
dass das professionellen Lehrerwissen möglicherweise unzureichend ist.
Verschiedene Studien wie COACTIV (Kunter et al., 2009) oder auch TEDS-M (Biedermann & Oser, 2001) nehme sich
international die Wirksamkeit der Lehrerausbildung in den Blick, allerdings für den allgemeinbildenden Bereich. Die
Übertragbarkeit der geleisteten Beiträge auf andere Unterrichtsfächer wie den Politik- und Wirtschaftsunterricht ist zu prüfen. Die
vorliegende Studie nimmt deshalb in einem ersten Schritt das professionelle Lehrerwissen in Ökonomie in den Blick. Während
für das wirtschaftliche Fachwissen bereits ausreichend erprobte Messinstrumente zur Verfügung stehen (Wirtschaftskundlicher
Bildungstest (WBT): Beck et al., 1998, OEKOMA: Schumann et al., 2010) fehlen Instrumente für die Messung
wirtschaftsdidaktischer Fähigkeiten im allgemeinbildenden Bereich. Die Entwicklung eines solchen fachdidaktischen Tests soll
diese Lücke schließen und damit detaillierteren Aufschluss über das professionelle ökonomische Lehrerwissen bieten.
Fragestellung
Wie ist das Fachwissen von Lehramtsstudierenden in Politik und Wirtschaft ausgeprägt?
Wie lässt sich Fachdidaktisches Wissen zur Vermittlung ökonomischer Inhalte im Rahmen der Allgemeinbildung
operationalisieren?
Methode
Für die Analyse des Fachwissens als einer wichtigen Voraussetzung für fachdidaktisches Handeln wurde in einem ersten Schritt
eine Studie sowohl mit Lehramtsstudierenden des Faches Politik und Wirtschaft (N=42), als auch Lehramtsstudierenden anderer
Fächerkombination wie Biologie und Mathematik (N=15) durchgeführt. Die Ergebnisse zeigen keinen signifikanten Unterschied
im Wirtschaftswissen zwischen den beiden Gruppen (t(55)= 1.582, p=119). In einem zweiten Schritt wurde deshalb ein
wirtschaftswissenschaftliches Training für angehende Lehrpersonen des Faches „Politik und Wirtschaft“ entwickelt und
durchgeführt. Um das Lehrangebot zu evaluieren, wurde eine Interventionsstudie mit Lehramtsstudierenden dieses Faches an
der Goethe Universität Frankfurt im quasiexperimentellen Design mit einer Interventionsgruppe (N=61) und einer Kontrollgruppe
(N=38) unter Verwendung des WBT (Beck et al., 1998) und OEKOMA (Schumann et al., 2010) realisiert.
In einem zweiten Schritt soll nun das fachdidaktische Wirtschaftswissen mithilfe eines selbstentwickelten Fragebogens erfasst
werden. Die Items wurden auf der Basis curricularer Vorgaben (die festlegen, was Lehrpersonen vermitteln können müssen)
vorgenommen (Hessisches Kultusministerium, 2010). Die didaktische Rahmenkonstruktion fand unter Anwendung des Berliner
Modells und dessen Kernstück, die Strukturanalyse statt (Jank & Meyer, 2002).
Ergebnisse
Die Ergebnisse für das Fachwissenstraining zeigen einen signifikanten Anstieg des wirtschaftlichen Wissens in die
Interventionsgruppe (F (1,97) = 15.747, p < .001, η2 = .140). Was allerdings nicht über den Fakt hinweg täuschen darf, dass die
durchschnittlich erreichte Punktzahl z.B. im WBT von möglichen 46 bei lediglich M=24.52 (SD=6.61) Punkten lag
(Interventionsgruppe: M=26.03, SD=6.43, Kontrollgruppe: M=22.13, SD=6.24) und damit dem Wert Ihrer zukünftigen Schüler
entspricht (M=24.9, SD=6.6; Beck et al., 1998).
Wenn man Fachwissen als notwendige Voraussetzung für fachdidaktisches Wissen betrachtet (Baumert & Kunter, 2006), legen
diese Befunde ähnliche Defizite für das fachdidaktische Wissen nahe. Erste Erhebungen zur Erfassung der Güte des entwickelten
fachdidaktischen Tests finden im Oktober 2015 statt, die Befunde werden in der Präsentation vorgestellt.
Schwierigkeiten bei der Untersuchung von Zusammenhängen zwischen Professionswissen,
Unterrichtsqualität und Unterrichtserfolg
Eva Cauet1, Andreas Borowski2, Hans E. Fischer1
1
Universität Duisburg-Essen, 2Universität Potsdam
In den vergangenen Jahren wurden in verschiedenen Fachdisziplinen Tests zur Erhebung des Professionswissens von
Lehrkräften entwickelt (z.B. Brovelli, Bölsterli, Rehm & Wilhelm, 2013; Krauss et al., 2008; Kröger, Neumann & Petersen, 2015;
Riese, 2009; Schmelzing, 2010), das seit Langem als wichtige Voraussetzung für gutes und erfolgreiches Unterrichten diskutiert
wird (vergl. z.B. Abell, 2007). Obwohl die Handlungsrelevanz des explizierbaren Professionswissens nicht empirisch abgesichert
ist, werden derartige Testinstrumente oft mit dem Ziel eingesetzt, Aussagen über die Wirksamkeit der Lehrerausbildung zu treffen
(vergl. z.B. Blömeke, Kaiser, Döhrmann und Lehmann, 2010). Bevor die prädiktive Validität dieser Testinstrumente für gutes oder
erfolgreiches Unterrichten nicht nachgewiesen wird, können diesbezüglich allerdings keine validen Aussagen getroffen werden.
Bisher existieren wenige Studien, die Zusammenhänge zwischen Professionswissen, Unterrichtsqualität und Unterrichtserfolg
untersuchen. Außerdem liefern diese Studien heterogene Ergebnisse, deren Interpretation mit zahlreichen Unsicherheiten
verbunden ist (vergl. Baumert et al., 2010; Ohle, 2010; Ergönenç, Neumann & Fischer, 2014; Vogelsang, 2014, Sadler, Sonnert,
Coyle, Cook-Smith & Miller, 2013). Im vorliegenden Beitrag werden am Beispiel einer Teilstudie der zweiten Phase des Projektes
„Professionswissen in den Naturwissenschaften“ (ProwiN) (Borowski et al., 2010) die Probleme dargestellt, die sich bei der
Untersuchung der Zusammenhänge zwischen Professionswissen und gutem und erfolgreichem Unterrichten ergeben. In
Rahmen von ProwiN wurden Testinstrumente zur Erfassung des Fachwissens (CK), fachdidaktischen (PCK) und pädagogischen
Wissens (PK) von Biologie-, Chemie- und Physiklehrkräften entwickelt und validiert (zur Physik: Kirschner, 2013). Die
fachspezifischen Professionswissenstests für Physiklehrkräfte wurden in einer quasiexperimentellen Feldstudie in einer
Teilstichprobe von 23 Gymnasiallehrkräften aus NRW (35% weiblich, MAlter=44 Jahre, SDAlter=12 Jahre) und ihren Klassen der
Jahrgangsstufe 8/9 (N=610 Lernende, 57% weiblich, MAlter=14 Jahre, SDAlter=1 Jahr) eingesetzt. Das CK und PCK der
Lehrkräfte wurde in Bezug zu ihrem Unterrichtserfolg (Schülerfachwissen am Ende einer mehrmonatigen Unterrichtseinheit zur
Mechanik unter Kontrolle des Vorwissens) gesetzt und mit der Qualität des Unterrichts (beurteilt über die kognitiv aktivierende
Gestaltung von zwei videographierten Unterrichtsstunden) korreliert. Die kognitive Aktivierung wurde mit einem Ratingmanual
(adaptiert nach Vogelsang, 2014) über die Bewertung von 29 Handlungsindikatoren in 7 Subskalen auf einer 3-stufigen
Likertskala eingeschätzt (αC,1.Stunde/2.Stunde=.91/.87). Die Professionswissenstests beinhalteten offene und Multiple-Choice
Aufgaben (CK: 11 Aufgaben zum Schulwissen/vertieften Schulwissen in Mechanik, Rasch Personen Rel.=.73; PCK: 10 Aufgaben
zu Schülervorstellungen, Umgang mit Experimenten und Konzepten in der Mechanik, Rasch Personen Rel.=.59). Der
Schülerfachwissentest bestand aus 34 Multiple-Choice Aufgaben zur Mechanik (Rasch Personen Rel. Prä-/Post-Test=.51/.61).
Zur Untersuchung der Zusammenhänge zwischen Professionswissen und Unterrichtserfolg wurden Mehrebenenmodelle für die
Post-Testwerte der Lernenden gerechnet. Der Anteil der zwischen den Klassen liegenden Varianz an der Gesamtvarianz der
Post-Testwerte betrug (10±3)%. Kontrollvariablen auf Schülerebene (Vorwissen, kognitive Fähigkeiten, Geschlecht und Sprache)
erklärten R2=(34±3)% (p1-seitig <.001) der Varianz im Post-Test auf Schülerebene. Die Länge der Unterrichtseinheit (Dauer
zwischen 10-44 Wochen) erklärte R2=(65±18)% (p1-seitig<.001) der Varianz auf Klassenebene. Weder CK noch PCK waren
signifikante Prädiktoren für die Post-Testwerte der Lernenden (γStand.,CK=0.07±0.19, p1-seitig=.363; γStand.,PCK=-0.15±0.16,
p1-seitig=.158). Korrelationsanalysen für die Zusammenhänge zwischen Professionswissen und Unterrichtsqualität zeigten
signifikante Korrelationen zwischen CK und kognitiver Aktivierung (r=.36±0.19, p1-seitig=.044), aber nicht zwischen PCK und
kognitiver Aktivierung (r=.21±0.19, p1-seitig =.165). Bei der Interpretation dieser Ergebnisse ergeben sich folgende Probleme:
Bei den Lehrkräften handelt es sich um eine Positivauswahl, was zu einer Unterschätzung von Zusammenhängen führen kann.
Zudem ist die Teststärke aufgrund der Stichprobengröße gering. Darüber hinaus können die zum Teil niedrigen Reliabilitäten der
Testinstrumente zu Verzerrungen der Ergebnisse führen und mögliche Einflüsse konfundierender Variablen, wie z.B.
Klassenführung, nicht ausgeschlossen werden. Eindeutige Aussagen über die Handlungsrelevanz des mit den ProwiN-Tests
gemessenen Wissens können deshalb auf Basis der Ergebnisse nicht getroffen werden. Die beschriebenen Probleme werden in
vielen Studien als Einschränkungen genannt, ihre Auswirkungen werden allerdings selten im Detail diskutiert. Um die
Aussagekraft dieser Studien zu erhöhen, sollte versucht werden, deren Ergebnisse systematisch zu replizieren.
Effekte von Aspekten der fachdidaktischen Lehrerexpertise auf die Entwicklung der Schülerkompetenzen
– Befunde aus der Domäne Rechnungswesen
Christoph Helm
Johannes Kepler Universität Linz
Theorie
In allgemeinbildenden Domänen konnte in empirischen Studien (Mathematik: Baumert et al. 2010; Naturwissenschaften: Cauet
et al. 2015) bereits gezeigt werden, dass das Professionswissen von Lehrkräften eine wichtige Voraussetzung für
Qualitätsmerkmale von Unterricht (v.a. kognitives Aktivierungspotential) und die Entwicklung von Schülerleistungen darstellt.
Vergleichbare Studien im berufsbildenden, v.a. kaufmännischen Bereich fehlen bislang, sind aber bspw. für den
Rechnungswesenunterricht (RW) bereits in Vorbereitung (Wuttke et al. 2015). Während aktuelle, videobasierte Studien (z.B.
ProwiN, Pythagoras, …) das Professionswissen und Unterrichtsqualitätsmerkmale eng gekoppelt an bestimmte
Curriculuminhalte (Mechanik, Satz des Pythagoras, …) erfassen, nimmt die vorliegende Studie – ähnlich der COACTIV-Studie –
den Einfluss von Lehrerwissen (über unterschiedliche Curriculuminhalte) auf Schülerleistungen bei Jahresstoffüberprüfungen in
der Domäne Rechnungswesen in den Blick. Dabei stützen sich die Analysen auf das Modell zur fachdidaktischen
Lehrerkompetenz (PCK) von Berger et al. (2013), das für das Fach Rechnungswesen die drei Aspekte „Wissen über
Schülerkognitionen, das Zugänglichmachen von Inhalten und das Aktivierungspotential von Aufgaben“ als relevant erachtet.
Darauf aufbauend wird angenommen, dass RW-Lehrer/innen, die über höheres Professionswissen in diesen drei Bereichen
verfügen, stärker kognitiv aktivierenden Unterricht anbieten, der wiederum zu stärkeren Entwicklungen von Schülerleistungen im
Rechnungswesen führt.
Fragestellung
Lassen sich mittels Onlinebefragung die drei Aspekte der RW-PCK nach Berger et al. (2013) erfassen? Falls ja, stehen diese
RW-PCK-Aspekte im Zusammenhang mit dem kognitiven Aktivierungspotential des RW-Unterrichts und mit der Entwicklung der
Schülerleistungen im RW (kontrolliert für die Mathematikfähigkeit der Schüler/innen)?
Methode
Um die RW-PCK-Facetten zu erfassen, wurden nahezu alle österreichischen Kommerzialisten (= Lehrer/innen, die
Wirtschaftsfächer unterrichten, N = 524) eingeladen an einem Onlinefragebogen mit Selbsteinschätzungs- und Testaufgaben
teilzunehmen. Die insgesamt elf Fragenblöcke (68 Items: davon 36 Performance-Items und fünf offene Fragen) zur
fachdidaktischen Expertise wurden von 89 Lehrpersonen (67 % weiblich, AlterM = 47, AlterSD = 9) beantwortet (Rücklaufquote:
17 %). Die Fragenblöcke decken den Umgang mit Schülerfehlvorstellungen, die Diagnosefähigkeit von Aufgaben- und
Lernschwierigkeiten sowie zentralen Gedankenschritten beim Lösen von Aufgaben, die Flexibilität in Hinblick auf alternative
Erklärungs- bzw. Darstellungsformen, das Wissen über das kognitive Aktivierungspotential von Aufgaben, das Wissen über
(fach)didaktische Modelle und das selbsteingeschätzte didaktische Handeln in Hinblick auf kompetenzorientierten Unterricht ab.
20 der getesteten Lehrpersonen stammen aus der LOTUS-Studie (Helm 2015a), in der jeweils eine RW-Schulklasse dieser
Lehrer/innen von der 9. bis zur 11. Schulstufe jährlich mit einem RW-Kompetenztest (Helm 2015b) getestet als auch mit einem
Onlinefragebogen zur kognitiven Aktivierung im Unterricht (Skala: DaQS, o.J.) befragt wurde (N9. Stufe = 702, AlterM = 14.4,
AlterSD = 0.74). Die so ermittelten Lehrer- sowie Schülerkompetenzen und Unterrichtseinschätzungen wurden in ein
Mehrebenenpfadmodell überführt, um die oben dargestellte Wirkungskette zu prüfen.
Erste deskriptive Ergebnisse
Erste Analysen zeigen, dass die erhobenen RW-PCK-Facetten nur moderat bis mittel miteinander korrelieren, sodass eine
eindimensionale PCK-Kompetenzstruktur für das Fach RW unwahrscheinlich ist. Bspw. korreliert die Fähigkeit zur Diagnose
zentraler Gedankenschritte von Schüler/inne/n beim Erstellen der Skontoverbuchung zwischen r = .278* und r = .333* mit dem
didaktischen Handeln im kompetenzorientierten Unterricht. Darüber hinaus hängt die Diagnosefähigkeit in Hinblick auf
Aufgabenschwierigkeiten mit der Anzahl der jährlich besuchten fachdidaktischen Fortbildung zusammen (r = .273*).
Werden die RW-PCK-Facetten in korrelativer Beziehung zu den Schülerleistungen und der von den Schüler/innen
wahrgenommen kognitiven Aktivierung gesetzt, so ergibt sich folgendes Bild: Während die von den Lehrpersonen berichtete
Kompetenzorientierung negativ im Zusammenhang mit den Schülerleistungen in RW stehen (r = - .275, aufgrund des N nicht
signifikant), hängt die Diagnosefähigkeit (Gedankenschritte) stark positiv mit den Schülerleistungen zusammen (r = .579*). Beide
PCK-Facetten sowie das Wissen über didaktische Modelle und über unterschiedliche Strategien des Zugänglichmachens von
RW-Konzepten korrelieren ebenfalls stark positiv mit der von den Schüler/inne/n erlebten kognitiven Aktivierung im RW-Unterricht
(r = .490*-.702**), sodass diesbezügliche Mediationseffekt in einem Pfadmodell analysiert werden müssen.
Die Ergebnisse werden vor dem Hintergrund der eingesetzten Messinstrumente kritisch diskutiert. Implikationen für
Folgeforschungen und die wirtschaftspädagogische Aus- und Fortbildung in Österreich werden aufgezeigt.
ID: 323
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktik Deutsch
Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Lese- und Sprachförderung
Stichworte: Schreibkompetenz, Beurteilungsverfahren, Validität, Textbeurteilung, Literalität
Schreibkompetenz messen und beurteilen
Chair(s): Thomas Canz (FernUniversität in Hagen), Michael Krelle (Universität Vechta)
Diskutant(en): Michael Krelle (Universität Vechta)
In modernen Gesellschaften steigt aufgrund der zunehmenden räumlichen und zeitlichen Distanz der in einer
Kommunikationssituation beteiligten Partner auch der Grad an Literalität der Gesellschaft und die Anforderungen an die Leseund Schreibkompetenz der Mitglieder dieser Gesellschaft. Daher ist es ein zentrales Ziel, diese Kompetenzen im Rahmen der
Schulbildung erfolgreich zu vermitteln; die Überprüfung des Erfolgs dieser Vermittlung ist eine zentrale Aufgabe sowohl des
schulischen Unterrichts als auch des wissenschaftlichen Bildungsmonitorings.
Das Symposium fokussiert die produktive literale Kompetenz des Schreibens und greift hierbei einige Probleme und
Fragestellungen heraus, die mit einer systematischen Erfassung von Schreibkompetenz verbunden sind. Das Symposium
betrachtet Schreibkompetenz hierbei aus inter- und multidisziplinären Sicht und integriert Blickwinkel der Fachdidaktik, der
Fachwissenschaft (Germanistik, Linguistik), der Psychologie und der Empirischen Bildungsforschung.
Der erste Beitrag von Jost, Becker-Mrotzek, Grabowski, Brinkhaus, Hennecke & Wilmsmeier widmet sich einer zentralen
Fragestellung bei der Messung von Schreibkompetenz, i. e. wie die Bewertung von Texten als Schreibprodukten in geeigneter
Weise erfolgen sollte, anhand analytischer Bewertungskriterien oder anhand holistischer Beurteilungsskalen. Im Rahmen einer
kritischen Auseinandersetzung werden ökonomische und Validitätsaspekte fokussiert betrachtet.
Auch der zweite Beitrag von Canz und Böhme widmet sich einem Validitäsaspekt bei der Messung von Schreibkompetenz. Die
Autoren untersuchen, inwiefern bei einer standardisierten Erfassung des Konstrukts aufgrund der textuellen Präsentation der
Aufgabeninstruktionen die ermittelten Schreibleistungswerte durch Lesekompetenzanteile verzerrt sind.
Der dritte Beitrag fokussiert ebenfalls einen möglichen die Validität der Schreibkompetenzmessung einschränkenden Aspekt,
vorliegend auf Beurteilungsebene. Hoffmann und Canz gehen der Frage nach, inwieweit die Beurteilung von Schülertexten,
anhand derer auf Schreibkompetenzen rückgeschlossen wird, durch die Handschriftlichkeit der Texte und durch die Qualität der
Handschrift beeinflusst ist.
Afra Sturm nimmt schließlich im Rahmen des vierten Beitrages einen anderen Blickwinkel auf Schreibkompetenz ein und
fokussiert den Schreibprozess und die Teilfähigkeit des Formulierens. Die Autorin befasst sich hierbei mit Fragen der
Dimensionalität des Konstrukts Formulieren sowie dessen Messbarkeit.
Abschließend diskutiert und integriert Michael Krelle die präsentierten Ergebnisse und stellt sie in einem größeren
Zusammenhang dar.
Beiträge des Symposiums
Analytische und holistische Ratingverfahren zur Bestimmung von Textqualität als Indikator für
Schreibkompetenz
Jörg Jost1, Michael Becker-Mrotzek1, Joachim Grabowski2, Moti Brinkhaus2, Vera Hennecke2, Sabine Wilmsmeier1
1
Universität zu Köln, 2Leibniz Universität Hannover
Das Verfassen eines Textes erfordert Fähigkeiten auf verschiedenen Prozessebenen (Hayes & Flower 1980, Hayes 2012).
Prozessiert werden beim Schreiben neben der motorischen Ausführung, Planung, Formulierung und Überarbeitungen. Dabei
werden verschiedene Arten von Wissen wie prozedurales Wissen, Problemlösewissen oder metakognitives Wissen aktiviert
(Becker-Mrotzek & Schindler 2007; Becker-Mrotzek i.V.). Im Allgemeinen zeigen sich Kompetenzen im Schreiben auf den
verschiedenen Ebenen in der Produktion kommunikativ funktionierender Texte. Zur Schreibkompetenz gehört damit wesentlich
die Fähigkeit, in kommunikativer Absicht für andere zu schreiben. Es gehört weiterhin zur Schreibkompetenz, dass geschriebene
Texte eine kohärenzstiftende Struktur aufweisen; Kohärenz ist ein, wenn nicht das zentrale Merkmal von Texten (Starke 2001).
Auf dieser theoretischen Grundlage wird im zugrundeliegenden BMBF-Projekt „Schreibkompetenz“ nach den Teilkomponenten
„Perspektivenübernahme und Adressatenorientierung“ und „Kohärenzherstellung im Text“ bei Schüler/innen der 5. und 9. Klasse
gefragt. Erfasst wurden die Teilfähigkeiten isoliert (d. h. entkoppelt von der Produktion von Texten) sowie integriert beim
Schreiben eines Textes. Letzteres verlangte von den Schreiber/innen die Produktion eines Berichtes, einer Instruktion und einer
Argumentation. Alle Aufgaben waren profiliert (Bachmann & Becker-Mrotzek 2010) und basierten auf einem Bildimpuls.
Realisierungen der Texte auf verschiedenen Ebenen (Informationsgehalt, Struktur und Kohärenz, sprachliche Realisierung) und
damit Ausprägungen von Textqualität (Nussbaumer 1991) wurden als Indikatoren für Schreibkompetenz gewertet (BeckerMrotzek et al. 2014). Die Textqualität wurde über Ratingverfahren (holistisch und analytisch) ermittelt. Für das holistische Rating
wurden NAEP-Ratingskalen zugrunde gelegt. Das analytische Rating wurde auf der Grundlage des Züricher Textanalyserasters
(Nussbaumer 1991) entwickelt und bildete Informationsgehalt, Struktur und Kohärenz sowie sprachliche Realisierung ab.
Im Vortrag wird die Möglichkeit der Adaption des Züricher Textanalyserasters für die Bearbeitung unterschiedlicher
Schreibaufgaben (Instruktion, Bericht, Argumentation) und Forschungsfragen (Teilfähigkeiten Adressatenorientierung und
Kohärenz) thematisiert. Es wird gefragt, ob über Ratingverfahren ermittelte Skalen (z.B. zu „Informationsgehalt“, „Kohärenz“)
einen quantifizierbaren Zugang zu Textqualität erlauben.
Die Ergebnisse zeigen u.a., dass die interne Konsistenz der Skalen (Cronbach’s α) einzelner theoretisch postulierter Kriterien
von Textqualität absolut variiert, aber auch zwischen verschiedenen Textsorten unterschiedlich ausfallen kann, z.B. für die Skala
„Informationsgehalt (= Vollständigkeit von Informationen)“ .46 für die Textsorte Instruktionen und .71 für die Textsorte Bericht;
aber für die Skala „Sprachliche Realisierung“ .62 für die Textsorte Instruktion und .64 für die Textsorte Bericht. Die an konkreten
Schreibaufgaben dekomponierten und konkretisierten Beurteilungsaspekte des Züricher Textanalyserasters bilden empirisch
also nicht (oder in unterschiedlichem Ausmaß) die im Modell angenommenen Aspekte ab und können auch nicht als generell
über Textsorten hinweg gelten.
Die Validität, aber auch die Ökonomie des im Projekt eingesetzten analytischen Ratingverfahrens wird kritisch im Vergleich zu
holistischen Verfahren diskutiert. Damit wird eine zentrale Fragestellung im Zusammenhang mit der Erfassung von
Schreibkompetenzen thematisiert.
Der Stellenwert der Lesekompetenz bei der Messung von Schreibkompetenz im Rahmen großer
Schulleistungsstudien
Canz Thomas1, Katrin Böhme2
1
FernUniversität in Hagen, 2Universität Potsdam
Bei der Messung psychologischer Konstrukte kann die Validität durch konstrukt-irrelevante Varianzanteile gemindert sein
(Messick 1990, 1996). In einem solchen Fall fließen in die Messung Aspekte ein, die einem anderen als dem intendierten
Konstrukt zuzuordnen sind. Für eine valide Schreibkompetenzmessung ist es daher geboten, den Einfluss anderer sprachlicher
und nichtsprachlicher Kompetenzanteile zu vermeiden bzw. zu minimieren.
Vor besonderen Herausforderungen stehen hierbei standardisierte Schreibkompetenzmessungen im Large-Scale-Bereich in
Bezug auf die Miterfassung von Lesekompetenzanteilen. Um eine reliable Beurteilung der Texte hinsichtlich der demonstrierten
Schreibkompetenz zu gewährleisten, ist es notwendig, eine Engführung der Schreibaufgaben vorzunehmen, da nur auf diese
Weise standardisierte Beurteilungsmanuale zum Einsatz kommen können. Diese Engführung der Schreibaufgaben erfolgt durch
eine – teilweise detaillierte – Instruktion und in der Regel durch die Vorgabe eines Stimulus (Wort- und/oder Bildmaterial), welcher
als referentielle Grundlage für den Arbeitsauftrag fungiert.
Aufgrund des Einsatzes textueller Instruktionen und Stimuli im Rahmen von Schreibaufgaben stellt sich die Frage, inwiefern die
auf Basis der Bearbeitungen solcher Aufgaben gewonnenen Einschätzungen der Schreibkompetenz durch die Lesekompetenz
der Schreibenden verzerrt sind.
Da sprachliche Fähigkeiten wie das Lesen und das Schreiben aufgrund gemeinsamer zugrundliegender kognitiver Prozesse und
Ressourcen hoch miteinander assoziiert sind (Bremerich-Vos, Böhme & Robitzsch, 2009; Engelkamp, 1995; Heller, 1999; Jude,
2008; Smith, 2009), steht die Beantwortung der obigen Frage vor der besonderen methodischen Herausforderung, dass die
Betrachtung einfacher Zusammenhänge zwischen Lese- und Schreibkompetenz nicht hinreichend ist, vielmehr muss das Ziel
sein, schreibaufgabenspezifische Einflüsse der Lesekompetenz zu ermitteln, welche über den allgemeinen Zusammenhang
zwischen den Konstrukten hinausgehen.
Eine Möglichkeit, dieser Herausforderung zu begegnen, ist es, die Instruktions- und Stimulustexte der Schreibaufgaben anhand
leseschwierigkeitsbestimmender Merkmalen zu klassifizieren (Freedle & Kostin, 1993; Köster, 2005; Nold & Rossa, 2007; Nunan
& Koebke, 1995; Schweitzer, 2006). Mit diesen Merkmalen lässt sich die spezifische textbezogene Anforderung an die
Lesekompetenz quantifizieren.
Unter Berücksichtigung dieser leseschwierigkeitsbestimmenden Merkmale kann obige Fragestellung präzisiert werden als
„Inwiefern variiert der Zusammenhang zwischen Lese- und Schreibkompetenz in Abhängigkeit von der
schreibaufgabenspezifischen Anforderung an die Lesekompetenz?“.
Untersucht wurde diese Fragestellung im Rahmen einer Pilotierungsstudie zur Erprobung von Aufgaben in den
Kompetenzbereichen Lesen (19 Aufgaben) und Schreiben (7 Aufgaben) unter Beteiligung von 1726 Schülerinnen und Schülern
der achten Jahrgangsstufe aller Schulformen des allgemeinbildenden Schulsystems der Bundesrepublik Deutschland.
Im Rahmen von Zwei-Ebenen-Moderator-Analysen wurde untersucht, inwiefern der Zusammenhang zwischen der
aufgabenspezifischen Schreibleistung und der Lesekompetenz (Ebene 1) durch die leseschwierigkeitsbestimmenden Merkmale
der Schreibaufgaben bzw. deren Stimulus- und Instruktionstexte (Ebene 2) moderiert wird. Als mögliche Moderatoren wurden
insgesamt zwölf sprachliche Merkmale untersucht, welche sich den Kategorien Textmenge/Textlänge, sprachliche Komplexität,
lexikalisches Niveau sowie Kombinationsmaße zur Erfassung der Leseschwierigkeit zuordnen lassen.
Es zeigte sich in Übereinstimmung mit Ergebnissen vorheriger Studien ein hoher Basiszusammenhang zwischen Lese- und
Schreibkompetenz (u. a. Bremerich-Vos et al., 2009; Jude, 2008; Smith, 2009). Dieser Zusammenhang wird durch zwei der zwölf
untersuchten Variablen statistisch bedeutsam moderiert: syntaktische Komplexität und durchschnittliche Häufigkeit/Seltenheit
der verwendeten Wörter. Insgesamt entfielen jedoch nur 3.8 % der Gesamtleistungsvarianz auf aufgabenspezifische Effekte, nur
1.6 % auf lesekompetenzrelatierte Effekte.
Die Miterfassung von Lesefähigkeiten bei der Messung von Schreibkompetenz kann in der vorliegenden Studie somit als
praktisch irrelevant angesehen werden. Die Generalisierbarkeit dieser Befunde unterliegt jedoch einigen Einschränkungen,
welche abschließend diskutiert werden.
Welche Effekte hat die Schrift auf die Beurteilung von Schülertexten im Rahmen von
Schulleistungsstudien und anderen empirischen Untersuchungen zur Schreibkompetenz?
Lars Hoffmann1, Thomas Canz2
1
Humboldt-Universität zu Berlin, 2FernUniversität in Hagen
Theoretischer Hintergrund
Eine bedeutsame Fehlerquelle bei der Beurteilung von Schülertexten stellen Urteilsverzerrungen dar, die, soziokognitiven
Theorien wie dem „Heuristisch-systematischen Modell“ (Chen & Chaiken, 1999) oder dem „Kontinuum-Modell der
Eindrucksbildung“ (Fiske & Neuberg, 1990) zufolge, aus einer heuristischen bzw. kategoriengeleiteten Informationsverarbeitung
resultieren. Im Rahmen von Schulleistungsstudien oder anderen empirischen Untersuchungen zur Schreibkompetenz von
Schülerinnen und Schülern werden die meisten dieser Verzerrungen durch eine anonymisierte Auswertung ausgeschlossen,
sodass z. B. das Geschlecht, der sozioökonomischen Status oder der Zuwanderungshintergrund der Verfasser der zu
beurteilenden Texte nicht bekannt sind. Zumeist nicht experimentell kontrolliert wird hingegen ein möglicher Halo-Effekt der
Kovariablen Schrift, deren verzerrender Einfluss mehrfach empirisch belegt wurde. So konnte gezeigt werden, dass die
Beurteilung von Schülertexten weniger positiv ausfällt, wenn diese Texte in einer schlecht lesbaren, unsauberen Handschrift
verfasst sind (z. B. Chase, 1968; Hughes, Keeling & Tuck, 1983; Sprouse & Webb, 1994; Klein & Taub, 2005; Greifeneder et al.,
2012). Des Weiteren wurde ermittelt, dass handschriftlich verfasste Texte tendenziell positiver bewertet werden als Texte, die
mit einer Schreibmaschine oder einem Computer abgeschrieben wurden (z. B. Powers, Fowles, Farnum & Ramsey, 1994).
Weitgehend offen ist, inwiefern die Befunde zum Einfluss der Schrift auf die Beurteilung von Schülertexten auch auf
Schulleistungsstudien oder auf vergleichbare empirische Schreibkompetenzuntersuchungen übertragbar sind. Während die oben
skizzierten Effekte an Stichproben aus Lehrkräften oder Lehramtsstudenten ermittelt wurden, werden Schülertexte im Rahmen
solcher Studien in der Regel von mehrfach geschulten Kodierern auf der Grundlage eines Kodiermanuals beurteilt. Die
Beurteilung der Schülertexte sollte dementsprechend nicht auf heuristisch-kategoriengeleiteten, sondern vielmehr auf
merkmalsgeleiteten Informationsverarbeitungsprozessen basieren und dementsprechend robust gegenüber Urteilsverzerrungen
sein (vgl. Chen & Chaiken, 1999; Fiske & Neuberg, 1990).
Fragestellung
Im Beitrag wird der Frage nachgegangen, inwieweit sich ein verzerrender Einfluss der Schrift auch dann zeigt, wenn die
Kodierung von Schülertexten durch geschulte Kodierer erfolgt. Hierfür wurden zum einen Zusammenhänge zwischen der
Lesbarkeit der Handschrift und den Texturteilen untersucht. Zum anderen wurde geprüft, inwieweit das Medium (handschriftlicher
Text vs. am Computer abgeschrieben) einen Effekt auf die Textbeurteilung hat.
Methode
Die Datengrundlage des Beitrags umfasst 430 Texte von Schülerinnen und Schülern der neunten und zehnten Jahrgangsstufe,
die zu insgesamt sechs Schreibaufgaben verfasst wurden, die jeweils auf argumentatives, informierendes oder narratives
Schreiben zielen. Die Texte entstanden im Rahmen einer Normierungsstudie des Instituts zur Qualitätsentwicklung im
Bildungswesen, die der Entwicklung eines Kompetenzstufenmodells zu den Bildungsstandards im Fach Deutsch für den Mittleren
Schulabschluss im Kompetenzbereich Schreiben diente (KMK, 2004, 2014). Die Texte wurden von geschulten Kodierern in zwei
unterschiedlichen Varianten – als Scan des handschriftlichen Originals und in einer am Computer abgetippten Variante – kodiert.
Die Qualität der Schülertexte wurde global mithilfe einer fünfstufigen Skala beurteilt, zusätzlich wurden die Teilaspekte Inhalt, Stil
und sprachliche Richtigkeit kodiert. Die Lesbarkeit der Handschrift, in der die Schülertexte verfasst waren, wurde nachträglich,
sowohl holistisch als auch analytisch, beurteilt. Die Bearbeitung der oben genannten Fragestellungen erfolgte vornehmlich unter
Verwendung von regressions- und varianzanalytischen Verfahren.
Ergebnisse
Zwischen den Texturteilen und der Lesbarkeit der Handschrift fanden sich lediglich geringe korrelative Zusammenhänge. Aus
den Ergebnissen einer multiplen Regression des Globalurteils auf die Urteile zu Inhalt, Stil, sprachlicher Richtigkeit und
Handschrift wurde zunächst gefolgert, dass die Lesbarkeit keinen Effekt auf die Texturteile hat. Hingegen wurde ein Haupteffekt
des Mediums gefunden, wobei Inhalt und Stil der Schülertexte, im Kontrast zu anderen Studien (vgl. Powers et al., 1994), in der
am Computer abgeschriebenen Variante signifikant positiver beurteilt wurden. Zusätzlich wurden einzelne Hinweise identifiziert,
die darauf schließen lassen, dass die Differenzen von Inhalts- und Stilurteilen zwischen Computer- und Handschriftvarianten der
Schülertexte von der Lesbarkeit der Handschrift moderiert sein könnten. In weiterführenden Analysen der kriterialen Schrifturteile
soll daher exploriert werden, inwieweit bestimmte Charakteristika der Lesbarkeit der Handschrift hierbei von besonderer
Bedeutung sind.
Basale Schreibfähigkeiten an der Schnittstelle zu hierarchiehöheren Schreibfähigkeiten
Afra Sturm
Pädagogische Hochschule FHNW
Das adressatengerechte Formulieren eines Briefes gelingt ca. 29% der Schüler/-innen nicht, wie die DESI-Studie zeigt, vielmehr
sind deren Texte von einer niedrigen sprachlichen Qualität, indem sie u.a. nur begrenztes Wortmaterial aufweisen (Neumann &
Lehmann, 2008). Ein großer Leistungsunterschied zeigt sich außerdem in Bezug auf den sprachlichen Hintergrund: Mehrsprachig
Aufwachsende und v.a. Jugendliche mit nicht deutscher L1 zeigen deutlich tiefere Leistungen als SuS mit Deutsch als L1.
Formulieren als hierarchiehöherer Prozess ist der Teilprozess, der am stärksten von sprachlicher Erfahrung beeinflusst ist
(Hayes, 2012). Entsprechend kann gezeigt werden, dass sich Schreibflüssigkeit – gemessen in Wörtern pro Minute – mit
zunehmender sprachlicher Erfahrung steigert und dass die durchschnittlichen Schreibportionen – gemessen als durchschnittliche
Anzahl Wörter, die ohne Unterbruch geschrieben werden (sog. bursts) – ebenfalls größer werden (Chenoweth & Hayes, 2001).
Schreibflüssigkeit korreliert dabei mit der Textqualität, wobei der Zusammenhang auf höheren Klassenstufen zunehmend an
Bedeutung verliert (Amato & Watkins, 2011).
Im Vergleich zu anderen hierarchiehöheren Prozessen wie Planen oder Überarbeiten geht Formulieren mit der Transkription –
verstanden als das Überführen von sprachlicher Repräsentation in Schrift (Hayes, 2012) – eine enge Verbindung ein: Formulieren
und Transkription zusammen stellen im Hinblick auf die verfügbaren kognitiven Ressourcen eine Art Nadelöhr dar, da beide den
Schreibprozess spürbar verlangsamen können. Es kann deshalb davon ausgegangen werden, dass Formulieren eher als
bidirektionaler kognitiv-sprachlicher Transformationsprozess zu denken ist (Alves, 2012) und damit eine Art Zwischenstelle
einnimmt.
In diesem Beitrag wird zum einen Formulieren als mehrdimensionales Konstrukt ausgeführt, und zwar basierend auf den
theoretischen Vorarbeiten im Rahmen folgender Studie:
a) Die Interventionsstudie «Basale Schreibfähigkeiten (BASCH)» (2015–2017), in der bei 4.-KlässlerInnen mit Deutsch als L1
und L2 untersucht wird, ob sich ein Ansatz zur Förderung von flüssigem Formulieren positiv auf die sprachliche Qualität der Texte
auswirkt.
Zum anderen wird auch diskutiert, wie solche Fähigkeiten erfasst werden können. Dazu wird folgende Studie beigezogen:
b) «Literalität in Alltag und Beruf (LAB)» (2009–2013) zu literal schwachen Erwachsenen (n=235) und BerufsschülerInnen
(n=361), bei denen u.a. untersucht wurde, über welche basalen Lese- und Schreibfähigkeiten sie verfügen.
In der Studie b) wurde zur Erfassung der Leseflüssigkeit der Stolperwörtertest von Metze (2003) eingesetzt. Basierend auf
Benson & Campbell (2009) wurde zudem ein Test zur Erfassung der Schreibflüssigkeit entwickelt (Sturm, 2014). Da das
Deutsche andere orthografische wie auch sprachsystematische Regularitäten aufweist, können die fürs Englische entwickelten
Verfahren nicht ohne Weiteres aufs Deutsche übertragen werden. Insbesondere erwies sich die Grundgröße Wort fürs Deutsche
als nicht geeignet, weshalb von der Silbe als Grundgröße ausgegangen wurde. Erfasst werden mit einem Schreibflüssigkeitstest
schreibproduktabhängige (absolute) Maße – dazu zählen Anzahl Silben, Anzahl korrekte Silben oder sog. Worteinheiten (zwei
nebeneinander liegende korrekt verschriftete Wörter) – sowie auch schreibproduktunabhängige (relative) Maße wie der
prozentuale Anteil korrekter Silben etc.
Für beide Verfahren beträgt die reine Testzeit für Berufsschüler/-innen (=B-Gruppe) und literal schwache Erwachsene (=EGruppe) 3 Minuten. Ca. ein Fünftel der Schreibflüssigkeitstexte aus der B-Gruppe wurde von zwei unabhängigen Ratern
ausgewertet. Die Interrater-Reliabilität wurde mit dem Pearson-Korrelationskoeffizienten berechnet und beträgt für alle
Kennwerte zwischen .93 und .99.
Ausgewählte Befunde sind folgende:
– Durchschnittlich liest die B-Gruppe in 3 Minuten 37,5 Sätze korrekt (SD=3,2), während die E-Gruppe nur 18,6 Sätze korrekt
liest (SD=3,2). Der Unterschied zwischen den beiden Gruppen ist mit d=1.97 beträchtlich.
– Während die B-Gruppe in 3 Minuten durchschnittlich 87,4 Silben schreibt, sind es für die E-Gruppe 63,4 Silben (d=.99).
– In Bezug auf die E-Gruppe zeigen sich deutlich stärkere Zusammenhänge zwischen basalen Lese- und Schreibfähigkeiten als
bei der B-Gruppe. So korrelieren Anzahl Silben mit der Anzahl korrekt gelesener Silben bei der E-Gruppe mit r=.57 (p<.01) und
bei der B-Gruppe mit r=.17 (p<.01).
In einem Ausblick wird dargelegt, wie Schreibflüssigkeit bei 4.-KlässlerInnen erfasst werden kann. Dazu werden Befunde aus
einem Pretest präsentiert.
ID: 325
Symposium
Disziplinen-Cluster: Psychologie
Thematisches Cluster: Motivation und Emotion
Stichworte: Motivation, Zielorientierungen, Spezifität, Stabilität
Lern- und Leistungsmotivation: Aspekte von Spezifität und Stabilität
Chair(s): Birgit Spinath (Universität Heidelberg), Katharina Kriegbaum (Universität Heidelberg)
Diskutant(en): Markus Dresel (Universität Augsburg)
Motivation ist eine zentrale Determinante von Lern- und Leistungsverhalten. In diesem Symposium wird es um Aspekte der
Spezifität (vs. Breite) und Stabilität (vs. Veränderung) motivationaler Konstrukte gehen. Im Fokus stehen zwei Konzeptionen von
motivationalen Wertzuschreibungen, nämlich Zielorientierungen und Interesse. Zum einen wird die Bedeutung der Spezifität bzw.
Breite der Erfassung von Zielorientierungen für die Vorhersage lern- und leistungsbezogener Variablen beleuchtet. Daran
anschließend wird die Frage gestellt, wie sich aus der Berücksichtigung unterschiedlicher Levels an Spezifität bei der Erfassung
von Zielorientierungen Erklärungen für deren transsituationale Konsistenz ableiten lassen. Die Betrachtung der Stabilität über
Situationen wird durch die Betrachtung der zeitlichen Veränderung ergänzt, wobei die Veränderung von Zielorientierungen und
Interesse über Schülergenerationen hinweg sowie im Längsschnitt betrachtet wird. Die Zusammenstellung der Beiträge bietet
neue Einsichten bezüglich der Erfassung und Veränderung von Lern- und Leistungsmotivation.
Die Beiträge von Sparfeldt et al. sowie Janke und Dickhäuser beleuchten, dass sich Personen sehr unterschiedlich breite Ziele
setzen können, begonnen mit Lebenszielen bis hinzu schulfachspezifischen Zielorientierungen. Sparfeldt et al. gehen in ihrem
Beitrag der Frage nach, ob Zielorientierungen schulfachübergreifend oder schulfachspezifisch operationalisiert werden sollten.
Bei der Vorhersage von Fachzensuren erwiesen sich fachspezifische Zielorientierungen als stärkere Prädiktoren, während bei
der Vorhersage einer schulfachübergreifenden Leistung die schulfachübergreifenden Zielorientierungen erklärungsmächtiger
waren. Inwiefern die Spezifität der gesetzten Ziele eine Erklärung für die transsituationale Konsistenz von Zielorientierungen
bietet, wird im Beitrag von Janke und Dickhäuser untersucht. Anhand einer Studierenden- sowie Lehrerstichprobe konnte gezeigt
werden, dass moderat positive Zusammenhänge zwischen intrinsischen Lebenszielen und einer Lernzielorientierung einerseits
sowie extrinsischen Lebenszielen und einer Leistungszielorientierung andererseits bestehen.
Die Beiträge von Kriegbaum et al. sowie von Retelsdorf et al. beleuchten, wie sich Motivation im Schulkontext über die Zeit
hinweg verändert. Dabei untersuchen Kriegbaum et al. die Veränderungen der Zielorientierungen über Schülergenerationen
hinweg, in dem sie die im Abstand von 10 Jahren erhobenen Normstichproben für die Skalen zur Erfassung der Lern- und
Leistungsmotivation (SELLMO) miteinander vergleichen. Erwartungskonform zeigten sich für drei der vier Skalen der
Zielorientierungen negative Veränderungen über die Zeit. Der Beitrag von Retelsdorf et al. untersucht, inwiefern sich aktuelle und
habituelle Lesemotivation bei Schülerinnen und Schülern von der fünften bis zur neunten Klasse verändern, und ob diese
Veränderungen miteinander zusammenhängen. Es zeigte sich, dass sowohl das aktuelle als auch habituelle Leseinteresse über
den untersuchten Zeitraum abnahm und diese Veränderungen moderat korrelierten.
Die Beiträge werden diskutiert von Prof. Markus Dresel.
Beiträge des Symposiums
Lernen als Lebensziel: Wie intrinsische und extrinsische Aspirationen mit Zielorientierungen
zusammenhängen
Stefan Janke, Oliver Dickhäuser
Universität Mannheim
Lernzielorientierungen (der Wunsch, in Bildungssituationen möglichst viel hinzuzulernen) und Leistungszielorientierungen (der
Wunsch, in Bildungssituationen möglichst kompetent zu erscheinen) haben sich als zumindest partiell situationsübergreifend
stabil erwiesen (Fryer & Elliot, 2007). Diese Stabilität wurde in der Vergangenheit häufig durch zeitstabile Determinanten, etwa
dem Leistungsmotiv erklärt (u.a. Elliot & Church, 1997). Nicht beachtet wurde hingegen, dass Zielorientierungen auch von
Aspirationen beeinflusst werden, die nicht auf Lern- und Leistungssituationen beschränkt sind. Dies verwundert, da speziell die
Literatur zur Selbstbestimmungstheorie (Deci & Ryan, 2000) klare Definitionen für höher aggregierten Aspirationen liefert, die
sich theoretisch auch auf Zielorientierungen auswirken könnten. Diese hoch aggregierten Aspirationen sind Lebensziele, die sich
in intrinsische und extrinsische Aspirationen unterteilen lassen (Vansteenkiste, Lens & Deci, 2006). Intrinsische Aspirationen
bezeichnen einen übergreifenden Fokus auf Selbstverwirklichung. Im Fokus extrinsischer Aspirationen steht das Streben nach
Ruhm, Reichtum und Ansehen. Bezogen auf Lern- und Leistungssituationen ist zu vermuten, dass übergreifende intrinsische
Aspirationen mit dem Ausmaß der Lernzielorientierung zusammenhängen, also dem Streben nach Kompetenzerweiterung und
damit persönlichem Wachstum. Umgekehrt können extrinsische Aspirationen in unserer Leistungsgesellschaft voraussichtlich
vor allem dann erreicht werden, wenn das Individuum auch eine starke Leistungszielorientierung entfaltet. In dem vorliegenden
Beitrag prüfen wir, ob die Stärke intrinsischer Aspirationen tatsächlich in positivem Zusammenhang zu dem Ausmaß einer
Lernzielorientierung steht, und ob extrinsische Aspirationen positiv prädiktiv für das Ausmaß der Leistungszielorientierung sind.
Intrinsische und extrinsische Aspirationen sollten dabei transsituative Determinanten der Zielorientierungen sein. Entsprechend
sollten sich die Zusammenhänge zwischen übergeordneten Aspirationen und Zielorientierungen auch in verschiedenen
Bildungskontexten zeigen lassen. Wir überprüften unsere Annahme in zwei Online-Befragungsstudien einerseits an Studierenden
an deutschen Universitäten (n = 321) und andererseits an Lehrkräften an deutschen Schulen (n = 294). Zur Erfassung von
Lebenszielen verwendeten wir in beiden Befragungsstudien die deutsche Fassung des Aspiration Index (Klusmann, Trautwein &
Lüdtke, 2005). Für die Erfassung der Zielorientierung verwendeten wir bei den Studierenden die etablierten Skalen zur Erfassung
der Lern- und Leistungsmotivation (Spinath, Stiensmeier-Pelster, Schöne & Dickhäuser, 2002) und bei den Lehrkräften eine gut
validierte Skala zur Erfassung der Zielorientierungen von Lehrkräften (Nitsche, Dickhäuser, Fasching & Dresel, 2011). Mittels
Strukturgleichungsmodellierung wurden Generalfaktoren für intrinsische und extrinsische Aspirationen aus den Subskalen des
Aspiration Index extrahiert. Diese Generalfaktoren wurden im nächsten Schritt in Beziehung zu Inhaltsfaktoren gesetzt, welche
Lern- und Leistungszieleorientierungen repräsentierten. Die von uns verwendeten Instrumente differenzierten Zielorientierungen
auf der Inhaltsebene (Lern- versus Leistungszielorientierungen) und Leistungszielorientierung auch hinsichtlich der Zielvalenz
(Annäherungs- versus Vermeidungsleistungszielorientierungen). Um unsere Hypothesen hinsichtlich Zielinhalten zu testen,
bereinigten wir die Varianz des Leistungszielorientierungsfaktors um die Varianz der Zielvalenz mit Hilfe von Correlated-TraitCorrelated-Method(-1)-Modellen (für mehr Details zu diesem Verfahren siehe Eid, 2000). In beiden Stichproben ließen sich
erwartungsgemäße positive Pfadkoeffizienten von intrinsischen Aspirationen auf das Ausmaß der Lernzielorientierung und von
extrinsischen Aspirationen auf das Ausmaß der Leistungszielorientierung nachweisen. Die Varianzaufklärung der Aspirationen
war in beiden Stichproben in Bezug auf beide Zielorientierungen substantiell (R² = .32 - .45). Die Ergebnisse beider Studien
verdeutlichen, dass Zielorientierungen in engem Zusammenhang zu intrinsischen und extrinsischen Aspirationen stehen. Dieser
Zusammenhang erwies sich als Kontextstabil: Er konnte in zwei verschiedenen Gruppen und mit Hilfe verschiedener
Zielorientierungsfragebögen nachgewiesen werden. Eine mögliche Schlussfolgerung aus diesem Ergebnismuster ist, dass ein
Teil der situationsübergreifenden Stabilität von Zielorientierungen dadurch erklärt werden kann, dass Ziele hierarchisch
organisiert sind. Es wäre somit anzunehmen, dass sich höher aggregierte Lebensziele indirekt über Zielorientierungen auf das
Erleben und Verhalten in Bildungskontexten auswirken. Es wäre spannend, in zukünftige Forschung diesem Mechanismus
genauer auf den Grund zu gehen und im Rahmen von Längsschnittsstudien verstärkt die Rolle von Lebenszielen für die
Entwicklung von Lern- und Leistungszielorientierungen und nachfolgenden Erleben und Verhalten in Bildungskontexten in den
Blick nehmen.
Zielorientierungen: schulfachübergreifend oder schulfachspezifisch?
Jörn Sparfeldt1, Johannes Schult1, Linda Wirthwein2, Susanne Buch3, Nicole Brunnemann4, Detlef Rost5
1
Universität des Saarlandes, 2TU Dortmund, 3Bergische Universität Wuppertal, 4Universität Konstanz, 5Universität Marburg
Zielorientierungen gelten als bedeutsame motivationale Korrelate und Prädiktoren schulischen Lern- und Leistungsverhaltens,
auch wenn die in Metaanalysen berichteten mittleren Zusammenhänge mit Leistungs- und weiteren relevanten outcomeVariablen – bei substantieller Variabilität – häufig eher gering ausfallen (z. B. Wirthwein et al., 2013). Seit Beginn der
Zielorientierungsforschung werden Lernziele (Ziel ist, eigene Kompetenzen und Fähigkeiten zu erweitern) von Leistungszielen
abgegrenzt, bei denen zwischenzeitlich Annäherungs-Leistungsziele (Ziel ist, eigene Kompetenzen zu zeigen) und VermeidungsLeistungsziele (Ziel ist, eigene Inkompetenzen zu verbergen) unterschieden werden. Des Weiteren fassen einige Autoren
Arbeitsvermeidung (als Ziel, schulbezogene Arbeit zu minimieren bzw. zu vermeiden) als weitere Zielorientierung. Lange wurden
Zielorientierungen theoretisch-konzeptuell und in den jeweiligen Operationalisierungen ohne Bezug zum jeweils spezifischen
Inhalt betrachtet; ungeklärt ist zudem die Frage nach dem jeweils angemessen Spezifitätsniveau (z. B. auf die Schule insgesamt
oder auf einzelne Schulfächer bezogen). Im Sinne des Symmetrieprinzips lassen sich bei einander entsprechenden
Spezifitätsniveaus engere Zusammenhänge mit Drittvariablen erwarten (doch vgl. für teilweise widersprüchliche Befunde Baranik
et al., 2010). Zudem dürfte die Schulfachspezifität für die genannten Zielorientierungen differieren; theoretisch lässt sich eine
höhere Schulfachspezifität insbesondere für Lernziele vermuten (z. B. Sparfeldt et al., 2007).
Zur Klärung der (teilweise widersprüchlichen) Befundlage beantworteten Schülerinnen und Schüler der 7. bis 10. Klassenstufe
(N = 1210) einen Fragebogen, in dem die genannten vier Zielorientierungen mit den Skalen zur Erfassung der Lern- und
Leistungsmotivation (SELLMO; Spinath et al., 2002) erfasst wurden – und zwar einerseits auf die Schule im Allgemeinen und
andererseits auf sechs Schulfächer bezogen. Darüber hinaus wurden weitere Variablen (u. a. Zensuren als
Schulleistungsindikatoren und schulische Selbstkonzepte) gleichermaßen schulfachübergreifend und schulfachspezifisch
erfasst. Mittels Korrelationsanalysen wurde – unter Berücksichtigung der hierarchischen Datenstruktur – der Frage nach
(bezogen auf die vier Zielorientierungen: differentiellen) Zusammenhängen der Zielorientierungen über die sieben Inhaltsbereiche
(schulfachübergreifend, 6 Schulfächer) nachgegangen; hierarchische Regressionsanalysen prüften die statistischen
Prädiktionsfragen bei einander entsprechenden / nicht entsprechenden Spezifikationsniveaus (Kriterien: u.a.
schulfachübergreifende bzw. schulfachspezifische Selbstkonzepte und Schulleistungen; Prädiktoren: (a) zuerst allgemeine und
dann die jeweils korrespondierende schulfachspezifische Zielorientierung, (b) zuerst die jeweils korrespondierende
schulfachspezifische Zielorientierung und dann die allgemeine Zielorientierung).
Im Sinne der Erwartungen zeigten sich geringere mittlere Interkorrelationen der sechs schulfachspezifischen Lernziele als der
entsprechenden Annäherungs-Leistungsziele, der Arbeitsvermeidungen und der Vermeidungs-Leistungsziele. Bezogen auf die
statistische Vorhersage der Fachzensuren klärten schulfachspezifische Lernziele – unabhängig davon, ob die jeweils
korrespondierende schulfachspezifische Lernzielorientierung als erster Prädiktor und die schulfachübergreifende
Lernzielorientierung als zweiter Prädiktor oder ob beide Prädiktoren in umgekehrter Reihenfolge in den Regressionsanalysen
berücksichtigt wurden – deutlich mehr Kriteriumsvarianz als die schulfachübergreifende Lernzielorientierung auf. Ein gleichartiges
Befundmuster resultierte für Annäherungsleistungsziele und Arbeitsvermeidung (nicht jedoch für Vermeidungs-Leistungsziele).
Bei der statistischen Vorhersage der schulfachübergreifenden Schulleistungen ergaben sich zumeist höhere (bzw. maximal
vergleichbare) Anteile aufgeklärter Kriteriumsvarianz durch die schulfachübergreifenden als die schulfachspezifischen
Zielorientierungen. Ein im Wesentlichen vergleichbares Befundmuster resultierte zudem bei der Betrachtung der statistischen
Vorhersage schulfachübergreifender und schulfachspezifischer Selbstkonzepte.
Die – bezogen sowohl auf das Zusammenhangsmuster als auch die statistischen Prädiktionen – differentiellen Befunde werden
einerseits theoretisch in ihrer Relevanz für die Frage des angemessenen Spezifikationsniveaus von Zielorientierungen und
andererseits deren Erfassung diskutiert. Darüber hinaus wird die pädagogische und pädagogisch-psychologische Bedeutsamkeit
einer differentiellen Betrachtung erörtert.
Negative Veränderungen der Zielorientierungen von Schülerinnen und Schülern über eine Dekade:
Vergleich der SELLMO-Normstichproben 2002 und 2012
Kriegbaum Katharina1, Birgit Spinath1, Joachim Stiensmeier-Pelster2, Claudia Schöne2, Oliver Dickhäuser3
1
Universität Heidelberg, 2Universität Gießen, 3Universität Mannheim
Es gibt Evidenz dafür, dass Lehrkräfte ein Absinken der Lern- und Leistungsmotivation über Schülergenerationen hinweg
wahrnehmen (Cocodia et al., 2003; Howard, 2001). Bislang mangelt es an Studien, welche die tatsächliche Veränderung der
Motivation über Schülergenerationen hinweg empirisch untersucht haben. In der hier vorgelegten Studie wurde untersucht,
inwiefern sich tatsächlich ein Absinken der schulbezogenen Motivation über Schülergenerationen hinweg feststellen lässt. Erste
Evidenz dazu liegt aus PISA-Daten vor, anhand derer gezeigt werden konnte, dass die Lesemotivation im OECD-Durchschnitt
signifikant abnahm. Der Anteil der Schülerinnen und Schüler (SuS), die angaben, zum Vergnügen zu lesen, verringerte sich von
2000 zu 2009 um rund 5%. Hingegen zeigte sich für die Freude beim Lesen eine positive Entwicklung für Deutschland über diese
neun Jahre (Artelt, Naumann & Schneider, 2009). Diese inkonsistente Befundlage unterstreicht die Notwendigkeit, die
Veränderungen verschiedener motivationaler Variablen über Schülergenerationen hinweg zu untersuchen.
Die Skalen zur Erfassung der Lern- und Leistungsmotivation (SELLMO; Spinath, Stiensmeier-Pelster, Schöne & Dickhäuser,
2002, 2012) stellen ein etabliertes Instrument zur Erfassung der Zielorientierungen dar und wurden im Jahr 2012 neunormiert.
Da für die beiden im Abstand von zehn Jahren durchgeführten Eichungen für das deutsche Schulsystem repräsentative
Stichproben zugrunde gelegt wurden, bieten diese Daten eine gute Grundlage, um Veränderungen der Zielorientierungen über
Schülergenerationen hinweg zu untersuchen. Wenn SuS im Jahr 2012 im Vergleich zu SuS im Jahr 2002 schlechtere
motivationale Voraussetzungen gehabt hätten, würde sich dies in einer geringeren Lernzielorientierung, einer höheren
Vermeidungs-Leistungszielorientierung sowie einer höheren Tendenz zur Arbeitsvermeidung zeigen. Da hinsichtlich der
Annäherungs-Leistungsziele weniger klar ist, ob diese in Bezug auf schulisches Lernen als positiv oder negativ anzusehen sind,
wurde keine Hypothese über deren Veränderung formuliert.
Die Eichstichprobe aus dem Jahr 2002 beinhaltete N = 3.326 SuS (51% weiblich) und die Eichstichprobe aus dem Jahr 2012 N
= 3.057 SuS (50.9% weiblich) der Klassenstufen 4 bis 10 aller Regelschulformen aus verschiedenen Bundesländern
Deutschlands. Um zu überprüfen, ob sich die Zielorientierungen in den beiden Stichproben voneinander unterschieden, wurde
zunächst eine multivariate Varianzanalyse (MANOVA) mit den vier Zielorientierungen als abhängige Variablen und den Faktoren
Stichprobe (2002 oder 2012), Geschlecht, Klassenstufe und Schulform gerechnet. Um die Effekte genauer zu analysieren,
wurden anschließend für jeden Faktor und jede abhängige Variable univariate Varianzanalysen berechnet.
Die Ergebnisse der MANOVA zeigten signifikante Mittelwertunterschiede für die beiden Stichproben in Bezug auf die vier
Zielorientierungen, wobei sich auch signifikante Effekte für die Klassenstufe und Schulform, nicht aber für das Geschlecht zeigten.
Im Einklang mit der vermuteten Verschlechterung der Motivation war für die Lernziele über die zehn Jahre ein signifikanter Abfall
zu beobachten (η2 = .01). Erwartungsgemäß zeigten sich für die Vermeidungs-Leistungsziele und Arbeitsvermeidung jeweils
signifikante Anstiege (η2 = .01). Für Annäherungs-Leistungsziele ergab sich keine signifikante Veränderung. Auffallend ist, dass
der Abfall der Lernziele vor allem auf die Klassenstufen 4 (η2 = .02) und 6 (η2 = .01) sowie auf die Grundschule und das
Gymnasium (η2 = .01) zurückgingen, der Anstieg der Vermeidungs-Leistungsziele vor allem auf die Klassenstufen 7 bis 10 sowie
das Gymnasium und die Hauptschule (η2 = .02) und der Anstieg der Arbeitsvermeidung hauptsächlich auf Klassenstufe 4 (η2 =
.04) und somit die Grundschule.
Über einen Zeitraum von 10 Jahren zeigte sich demnach eine negative Veränderung der schulbezogenen Motivation über
Schülergenerationen hinweg. Die berichteten Befunde stehen somit im Einklang mit der Wahrnehmung von Lehrkräften, der
zufolge Motivation über Schülergenerationen absinkt. Zur Einordnung der Stärke der hier berichteten Effekte sei darauf
verwiesen, dass die aufgezeigte Veränderung der Zielorientierungen in derselben Größenordnung wie der Flynn-Effekt liegt
(Anstieg der Intelligenz um 3 IQ-Punkte pro Dekade; Flynn, 1987; Pietschnig & Voracek, 2015). Mögliche Ursachen für das
Absinken der schulbezogenen Motivation werden diskutiert.
Veränderungen und Zusammenhänge aktueller und habitueller Lesemotivation im Verlauf der
Sekundarstufe I
Jan Retelsdorf1, Olaf Köller1, Jens Möller2, Gabriel Nagy1
1
Leibniz-Institut für die Pädagogik der Naturwissenschaften und M, 2Christian-Albrechts-Universität zu Kiel
Theoretischer Hintergrund
In der Forschung zur Lesemotivation wird neben qualitativ unterschiedlichen Formen der Lesemotivation auch eine
Unterscheidung zwischen aktueller und habitueller Lesemotivation getroffen (z.B. Guthrie, Hoa, Wigfield, Tonks & Perencevich,
2006; Möller & Schiefele, 2004; Schiefele, Schaffner, Möller & Wigfield, 2012). Aktuelle Lesemotivation bezieht sich auf die
Motivation einen konkreten Text in einer konkreten Situation zu lesen. Habituelle Lesemotivation resultiert, wenn eine Person
wiederholt einen Zustand aktueller Lesemotivation erreicht. Während habituelle Lesemotivation als eine relativ stabile
Bereitschaft zu lesen verstanden wird, ist aktuelle Motivation situationsspezifisch definiert. Zwar ist die längsschnittliche
Entwicklung habitueller Formen der Lesemotivation vergleichsweise gut untersucht (z.B. McElvany, Kortenbruck & Becker, 2008),
Entwicklungstrends der aktuellen Lesemotivation sind bisher aber kaum betrachtet worden. Hier stellt sich die Frage inwieweit
Entwicklungsverläufe habitueller und aktueller Formen der Lesemotivation miteinander kovariieren (für erste empirische Hinweise
s. Guthrie et al., 2006).
Fragestellung
In unserem Beitrag untersuchen wir Entwicklungstrends der aktuellen und habituellen Lesemotivation von der 5. bis zur 9. Klasse.
Im Fokus stehen drei Komponenten der Motivationsentwicklung, nämlich das Interesseniveau, der Interessentrend und die
zeitspezifischen Interessenstates (d.h. Abweichungen vom zugrundeliegenden Trend). Diese werden für zwei Formen der
habituellen Motivation (Lesen aus Interesse und Leselust) und die aktuelle Lesemotivation (Interesse an vorgegebenen
Textpassagen) untersucht.
Methode
Zu vier Messzeitpunkten (5. bis 9. Klasse) wurden N = 1508 Schülerinnen und Schüler zu ihrer Lesemotivation befragt. Zu jedem
Messzeitpunkt wurden Lesetests bearbeitet, die aus mehreren Texten bestanden. Als Maß aktueller Lesemotivation dienten
jeweils zwei Items zur Motivation beim Lesen eines Texts (z.B. „Ich fand den Text interessant“). Die habituelle Lesemotivation
wurde mit den Subskalen Leselust und Lesen aus Interesse aus dem Fragebogen zur habituellen Lesemotivation erfasst (Möller
& Bonerad, 2007).
Die Auswertungen erfolgten mittels Curve-of-Factors-Modellen. In diesen wurden die messzeitpunktspezifischen
Konstruktausprägungen mittels latenter Variablen erfasst, die wiederum als Indikatoren der konstruktspezifischen
Motivationsniveaus und dem Motivationstrends dienten. Das verwendete Modell ermöglicht nicht nur die Erfassung von
konstruktübergreifenden Zusammenhängen zwischen Niveaus und Trends, sondern erlaubt auch die Erfassung von
messfehlerbereinigten zeitspezifischen Statekovarianzen.
Ergebnisse und Diskussion
Die Güte des getesteten Modells war akzeptabel: χ²(1623) = 3282.39, CFI = .946, TLI = .943, RMSEA = .026, SRMR = .052. Es
zeigte sich, dass in allen drei Lesemotivationen ein signifikanter Rückgang der Mittelwerte zu verzeichnen war. In Tabelle 1 sind
die konstruktübergreifenden Korrelationen dargestellt. Alle Korrelationen sind signifikant und positiv. Die Korrelationen zwischen
States, Niveaus und Trends zwischen den beiden habituellen Motivationsarten waren am höchsten ausgeprägt, während die
Verlaufskomponente der aktuellen Lesemotivation vergleichsweise moderat mit beiden korrelierte. Die Befunde zeigen, dass die
Entwicklung der aktuellen Lesemotivation zwar mit der Entwicklung habitueller Motivationsformen zusammenhängt, dass beide
Motivationsformen empirisch jedoch nicht gleichgesetzt werden können.
ID: 328
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung
Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung, Trainings- und Evaluationsforschung
Stichworte: Bildungswissenschaftliche Evidenz, Kompetenzmodellierung, Evidenzbasierte Praxis, Validierung,
Interventionsstudien
Evidenzbasierung in der Lehrerbildung: Analyse und Förderung der Nutzung wissenschaftlichen
Wissens bei Lehramtsstudierenden
Chair(s): Martin Klein (Universität des Saarlandes), Andreas Hetmanek (LMU München)
Diskutant(en): Alexander Renkl (Universität Freiburg)
Hintergrund
Evidenzbasierung als Nutzung aktueller Theorien und Evidenz zur Absicherung professionsrelevanter Entscheidungen hat in den
vergangenen Jahren auch im Bereich der Bildungsforschung an Bedeutung gewonnen (Bromme, Prenzel & Jäger, 2014). Obwohl
Kompetenzen in diesem Bereich als grundlegend für guten Unterricht gelten (Kunina-Habenicht et al., 2013), steht ihre
systematische Analyse und Förderung in der universitären Ausbildung noch am Anfang. Dieses Symposium beleuchtet das
Thema Evidenzbasierung in der universitären Lehrerbildung aus verschiedenen Perspektiven. In vier empirischen Studien
werden Modellierung und Messung der erforderlichen Kompetenzen untersucht und Ansätze zur Förderung vorgestellt.
Forschungsfrage
Wie können verschiedene Aspekte der Kompetenzen im Umgang mit bildungswissenschaftlicher Evidenz bei Studierenden im
Bildungsbereich erfasst und gefördert werden?
Übersicht
Hetmanek und Kollegen vergleichen im Rahmen einer experimentellen Studie Leistungen beim evidenzbasierten Argumentieren
im Bereich der Medizin als „Mutterdomäne“ der evidenzbasierten Praxis und dem Bildungsbereich. Studierende der Medizin und
der Bildungswissenschaften bearbeiteten szenariobasierte Tests zum evidenzbasierten Argumentieren in der eigenen sowie der
fremden Domäne. Im Beitrag werden Analysen zu Leistungsunterschieden sowie Ansätze zur Aufklärung dieser Befunde
vorgestellt und mit Blick auf die Vergleichbarkeit der beiden Domänen diskutiert.
Heininger und Kollegen untersuchen, wie Lehramtsstudierende sowie aktive Lehrkräfte die Qualität professionsrelevanter
Evidenz bewerten, um in einem weiteren Schritt darauf aufbauend die gewonnenen Erkenntnisse für den Berufsalltag nutzen zu
können. Dazu wurde ein eigenes Instrument entwickelt und dessen Eignung im Rahmen der Studie untersucht.
Klein und Kollegen fokussieren die Anwendung bildungswissenschaftlicher Theorien zur Erklärung komplexer schulischer
Situationen. Typische Fehler bei der Theorieanwendung werden dabei an korrekten Lösungsbeispielen kontrastiert und so der
Umgang mit wissenschaftlichen Theorien in Anwendungssituationen gefördert. Es werden Ergebnisse aus einer Trainingsstudie
vorgestellt, in der Maßnahmen zur instruktionalen Unterstützung und zur Integration in das Curriculum erprobt wurden.
Behrmann und Kollegen präsentieren eine Studie an der WWU Münster, bei der Lehramtsstudierende im Rahmen des
Praxissemesters „forschend lernen“, also Fragestellungen aus dem Schulalltag ableiten und mittels eigener empirischer Daten
beantworten. Die resultierenden Erkenntnisse ermöglichen perspektivisch eine Professionalisierung des beruflichen Handelns.
Es wird evaluiert, inwiefern durch die vorbereitende Methodenveranstaltung, die systematisch wissens- und
anwendungsbezogene Anteile verknüpft, Wissen und positive Überzeugungen als Voraussetzung forschenden Lernens vermittelt
werden.
Zur Diskussion wurde Rainer Bromme angefragt.
Der in diesem Symposium untersuchte kompetente Umgang mit Theorien und Evidenz durch Studierende im Bildungsbereich
stellt ein wichtiges Thema mit hoher Praxisrelevanz dar. Innerhalb des Symposiums wird das Thema mit Beiträgen aus der
empirischen Bildungsforschung sowie der Pädagogischen Psychologie aus unterschiedlichen Perspektiven betrachtet. Die
perspektivische Heterogenität wird die Diskussion bereichern.
Beiträge des Symposiums
Evidenzbasiertes Argumentieren: Leistungen von Studierenden der Medizin und der
Bildungswissenschaften
Andreas Hetmanek1, Jan Kiesewetter1, Christof Wecker1, Kati Trempler2, Mia Wermelt1, Cornelia Gräsel2, Frank
Fischer1, Martin Fischer1
1
LMU München, 2Bergische Universität Wuppertal
Theoretischer Hintergrund
Der Aufbau von Kompetenzen im evidenzbasierten Argumentieren gilt als wichtiger Teil der Professionalisierung. In dieser
experimentellen Studie wird ein Vergleich vorgenommen zwischen der Medizin als „Mutterdomäne“ der evidenzbasierten Praxis
(EBMWG, 1992; Montori & Guyatt, 2008) und dem Bildungsbereich, in dem der Ansatz aktuell verstärkt diskutiert wird (KMK,
2004; Bromme, Prenzel & Jäger, 2014). Das Einbeziehen von wissenschaftlicher Evidenz beim Treffen von
Praxisentscheidungen stellt vielfältige Anforderungen an Praktiker. Zentrale Komponenten sind (1) die Suche nach relevanten
und qualitativ hochwertigen wissenschaftlichen Studien, (2) die kriterienbasierte Auswahl zu berücksichtigender Studien (BrandGruwel, et al., 2005), (3) die systematische Prüfung der ausgewählten Studien hinsichtlich Relevanz und Qualität (Harden et al.
1999, Trempler et al. 2015), und (4) die Integration der Studienergebnisse in Bezug auf eine Entscheidung in der Praxis (Goldman
et al., 2012; Spohn, 2008). In diesem Beitrag vergleichen wir Medizin und Bildungsbereich:
Wie unterscheiden sich Studierende der Medizin von Studierenden der Bildungswissenschaften in ihren Leistungen beim
evidenzbasierten Argumentieren in der eigenen und der jeweils fremden Domäne?
Methode
Aufgabenstellung. Es wurde ein szenario-basiertes Instrument aus dem Projekt KOMPARE eingesetzt. Im
bildungswissenschaftlichen Testfall hatten die Probanden eine Entscheidung zwischen Gruppenpuzzle und Lehrervortrag zu
treffen (Trempler et al., 2015; Hetmanek, 2014). Komplett analog wurde Testfall zu der Entscheidung konstruiert, die
Pockenimpfung mit zwei bzw. mit elf Jahren zu empfehlen. Durch Hintergrundinformationen wurde das nötige fallbezogene
Wissen sichergestellt.
Stichprobe. An der Studie nahmen insgesamt 282 Studierende von zwei Universitäten freiwillig teil: 165 Medizinstudierende im
klinischen Studienabschnitt und 117 Masterstudierende der Bildungswissenschaften.
Design. In einem Messwiederholungsdesign bearbeitete jede Versuchsperson je einen Testfall im eigenen und im fremden
Fachbereich. Die Bearbeitungsreihenfolge wurde ausbalanciert.
Ablauf. Alle Teilnehmenden füllten vor der Testsitzung im Labor einen online-Fragebogen aus, in dem u.a. allgemeine kognitive
Fähigkeiten erfasst wurden. In der Testsitzung wurden dann das medizinische und das bildungswissenschaftliche Fachwissen
gemessen und die entsprechenden Testfälle bearbeitet.
Messung der Variablen. Jeweils vier Teilkompetenzen des evidenzbasierten Argumentierens wurden in beiden Fachbereichen
erhoben: Die Suche von Studien wurde mit zehn Items, die Auswahl von Studien mit sechs, die Bewertung von Studien mit 36
und das Ranking von Studien mit vier Ratingitems erfasst, für die jeweils die Übereinstimmung mit einer Experten-Musterlösung
ermittelt wurde. Die allgemeinen kognitiven Fähigkeiten wurden mit zwei Teilskalen mit verbalen und figuralen Analogien
gemessen. Das bereichsspezifische Wissen in Medizin bzw. im Bildungsbereich wurde mit je acht Multiple-Choice-Aufgaben
erfasst.
Ergebnisse und Diskussion
Beide Studierendengruppen wiesen in ihrer Domäne signifikant höheres Fachwissen auf als die jeweils andere
Studierendengruppe. Bezüglich der allgemeinen kognitiven Fähigkeiten waren die Medizinstudierenden den Studierenden der
Bildungswissenschaften statistisch signifikant überlegen.
Beim evidenzbasierten Argumentieren zeigten Medizinstudierende bei der Bearbeitung des medizinischen Testfalls in allen
Teilkompetenzen bessere Leistungen als die Studierenden der Bildungswissenschaften. In ANCOVA-Analysen konnten diese
Unterschiede weitestgehend durch medizinisches Fachwissen und allgemeine kognitive Fähigkeiten erklärt werden (Ausnahme
Auswahl von Studien). Modellvergleiche der Regressionsmodelle ergaben, dass sich die Modelle in den Gruppen nicht
unterscheiden: Allgemeine kognitive Fähigkeiten und Fachwissen spielten demnach eine vergleichbare Rolle – auch in
unterschiedlichen Leistungsniveaus. Im bildungswissenschaftlichen Testfall ergaben sich mit Ausnahme der Teilkompetenz
Suche von Studien (zum Vorteil der Medizinstudierenden) keine signifikanten Leistungsunterschiede zwischen den Gruppen.
Dieses Befundmuster bleibt auch nach Kontrolle für Fachwissen und allgemeine kognitive Fähigkeiten bestehen. Weitere
Analysen zur Absicherung (Bayesanalysen) und Regressionsanalysen und Modellvergleiche zur Erklärung dieser Befunde durch
Prüfung der Zusammenhänge der Leistungen im evidenzbasierten Argumentieren mit allgemeinen kognitiven Fähigkeiten und
Fachwissen werden auf der Konferenz präsentiert.
Diese vorläufigen Ergebnisse liefern erste Aufschlüsse zum Zusammenspiel von Domänenwissen, allgemeinen kognitiven
Fähigkeiten und Fertigkeitskomponenten beim evidenzbasierten Argumentieren in unterschiedlichen Domänen.
Einschränkungen in Bezug auf die Vergleichbarkeit der Domänen Medizin und Bildungsbereich sowie Anschlussfragen für
zukünftige Forschungsvorhaben werden diskutiert.
Literatur
Brand-Gruwel, S., Wopereis, I., & Vermetten, Y. (2005). Information problem solving by experts and novices: Analysis of a
complex cognitive skill. Computers in Human Behavior, 21(3), 487–508.
Bromme, R., Prenzel, M., & Jäger, M. (2014). Empirische Bildungsforschung und evidenzbasierte Bildungspolitik. Zeitschrift Für
Erziehungswissenschaft, 17(S4), 3–54.
Evidence Based Medicine Working Group, (1992). Evidence-based medicine. A new approach to teaching the practice of
medicine. JAMA, 268(17), 2420–2425.
Goldman, S. R., Lawless, K. A., Pellegrino, J., Manning, F., Braasch, J. L. G., & Gomez, K. (2012). A technology for assessing
multiple source comprehension: An essential skill of the 21st century. In M. C. Mayrath, J. Clarke-Midura, D. H. Robinson, & G.
Schraw (Eds.), Technology-based assessments for 21st century skills: Theoretical and practical implications from modern
research (pp. 173–209). Charlotte, NC US: Information Age Publishing.
Harden, R. M., Grant, J., Buckley, G., & Hart, I. R. (1999). BEME Guide No.1: Best Evidence Medical Education. Medical Teacher,
21(6), 553–562.
Konferenz der Kultusminister der Länder der Bundesrepublik Deutschland. (2004). Standards für die Lehrerbildung:
Bildungswissenschaften. Beschluss der Kultusministerkonferenz.
Montori, V. M., & Guyatt, G. H. (2008). Progress in Evidence-Based Medicine. JAMA, 300(15), 1814–1816.
Sackett, D. L., Rosenberg, W. M. C., Gray, J. A. M., Haynes, R. B., Richardson, W. S., & Ham, C. (1996). Evidence based
medicine: what it is and what it isn’t. BMJ, 312(7023), 71–72.
Spohn, W. (2008). A survey of ranking theory. In F. Huber & C. Schmidt-Petri (Eds.), Degrees of Belief. An Anthology (pp. 185–
228). Oxford: Oxford University Press.
Trempler, K., Hetmanek, A., Wecker, C., Kiesewetter, J., Fischer, F., Fischer, M. R., & Gräsel, C. (2015). Nutzung von Evidenz
im Bildungsbereich – Validierung eines Instruments zur Erfassung von Kompetenzen der Informationsauswahl und Bewertung
von Studien. Zeitschrift Für Pädagogik, 61(61. Beiheft), 144–166.
Lehrkräfte bewerten Evidenz – Entwicklung einer heuristisch orientierten Skala zur Bewertung
bildungswissenschaftlicher Evidenz
Susanne Heininger, Johannes Bauer, Sandra Wenglein, Manfred Prenzel
TUM München
Theoretischer Hintergrund
Der Umgang mit Evidenz und damit die Fähigkeit, bildungswissenschaftliche Evidenz hinsichtlich der Qualität kritisch bewerten
zu können, werden bereits seit Längerem als grundlegende Kompetenz für eine zeitgemäße Umsetzung des am besten
verfügbaren Wissens in das Lehrerhandeln betrachtet (KMK, 2004; OECD, 2005). Dennoch sind erst in den letzten Jahren einige
wenige Projekte zur Untersuchung der Kompetenz von Lehrkräften zum Umgang mit Evidenz im weiteren Sinne und zur
Bewertung bildungswissenschaftlicher Evidenz im Speziellen entstanden (zB. Hefter et al., 2014, Hetmanek et al., 2015, Matic-
Strametz et al., 2013; Trempler et al., 2015). Die Bewertung von Evidenz wird als Prozess der systematischen Beurteilung der
vorliegenden Forschungsarbeiten hinsichtlich der Glaubwürdigkeit, des Nutzens sowie der Relevanz für einen speziellen Kontext
beschrieben (Burls, 2009). Diese Definition aus dem medizinischen Kontext, dem Ursprung der evidenzbasierten Praxis (Sackett
et al., 1996), kann auch für die Bildungsforschung angewendet werden. Obwohl für medizinische Studien zahlreiche Skalen zur
qualitativen Bewertung von Evidenz als Entscheidungshilfen für medizinisch Tätige vorliegen, sind diese wegen ihrer hohen
Differenzierung nach Studiendesigns nur teilweise auf die Domäne der Bildungsforschung übertragbar. Lehrkräfte benötigen
professionsspezifische Bewertungsskalen, die der Arbeitslast im Berufsalltag angepasst sind und mit eingängiger heuristischer
Struktur zeiteffizient zu einem Bewertungsergebnis leiten.
Forschungsfrage
Ziel der vorliegenden Studie war es, zu überprüfen, inwiefern eine im Projekt E4teach entwickelte Bewertungsskala gängigen
psychometrischen Gütekriterien in angemessener Weise entspricht. Hierfür sollte in einem ersten Zugang mit einer Stichprobe
Lehramtsstudierender die Skalenkonformität mit dem dichotomen Rasch Model geprüft werden.
Methode
Zur Erfassung der Kompetenz der Bewertung bildungswissenschaftlicher Qualität wurde ein Erhebungsinstrument entwickelt,
welches mit Hilfe von Text-Vignetten möglichst authentische Problemstellung aus dem Arbeitsalltag von Lehrkräften präsentiert.
Zur Beantwortung der jeweils aufgeworfenen Problemstellung werden verschiedene Evidenzquellen angeboten, die von den
Testpersonen mit Hilfe einer Bewertungsskala (10 Items) bezüglich der Qualität kritisch eingeschätzt werden sollen.
Zwischen Oktober 2014 und Mai 2015 konnten N=222 Lehramtsstudierende zur Bearbeitung des Erhebungsinstrumentes
gewonnen werden. Die Testpersonen hatten jeweils neunzig Minuten Zeit, um sechs bildungswissenschaftliche Artikel zu lesen,
diese jeweils anhand der heuristisch orientierten Bewertungsskala zur Einschätzung der Qualität bildungswissenschaftlicher
Evidenz zu bewerten und anschließend ein Statement zur aufgeworfenen Fragestellung zu verfassen. Die Bewertungsurteile der
Testpersonen wurden anschließend mit Expertenurteilen in Beziehung gesetzt. Die Expertenurteile wurden mit Hilfe von neun
BildungswissenschaftlerInnen in einer vorhergehenden Studie definiert. Die Bewertungsurteile der Testpersonen wurden nach
„Expertenurteil (nicht) getroffen“ 0/1-kodiert.
Zur Überprüfung der Eindimensionalität der Bewertungsskala wurden die Daten auf Konformität zum dichotomen Rasch Model
getestet. Weiterhin wurde die Modelkonformität über die Unabhängigkeit der Itemparameter geprüft. Es wurden drei Split-Kriterien
verwendet: Rohscore-Median (zur Aufteilung in zwei Leistungsgruppen), Geschlecht (Kubinger, 2005) sowie der Einfluss des
Studiums mindestens eines MINT-Fachs, wegen einer vermuteten Erfahrung im Umgang mit wissenschaftlicher Evidenz. Zur
Überprüfung der Item-Konformität wurde der Andersen’s Likelihood Ratio Test (LRT; Andersen, 1973) eingesetzt. Zur
Bestimmung der Model-Fit-Indices wurde der Waldtest (Fischer & Scheiblechner, 1970) herangezogen. Alle Analysen wurden
mit der Software R (R Core Team, 2013) und dem eRm-Package (Mair et al., 2012) zur Schätzung der Itemparameter und
Berechnung der Model-Fit-Indices sowie dem PP-Package (Reif, 2012) zur Schätzung der Personenparameter durchgeführt.
Ergebnisse
Tabelle 1 zeigt die vorläufigen statistischen Werte. Die Andersen Likelihood Ratio Tests (für α=.01) sind nicht signifikant für die
finale Selektion der Items, was eine Konformität mit dem dichotomen Rasch Model nahelegt.
Tabelle 1: Statistische Werte für das Rasch Model
Split Kriterium LRT Chi² df Chi² α=0.01 p Items entfernt
Rohscore-Median 80.64 56 83.51 .017 3
Geschlecht 70.41 56 79.84 .029 3
MINT-Fach 57.50 53 79.84 .313 0
Diese und weitere Analysen werden aktuell nochmals mit einer größeren Stichprobe durchgeführt. Finales Ziel ist es, Aussagen
zur Kompetenz Lehramtsstudierender und aktiver Lehrkräfte treffen zu können. Ergebnisse werden zum Zeitpunkt der Konferenz
vorliegen.
Literatur
Andersen, E.B. (1973). A goodness of fit test for the Rasch model. Psychometrika, 38(1), 123-140.
Burls,
A.
(2009).
What
is
critical
appraisal?
(2nd
ed.).
haywardpublishing.co.uk/index.php?route=product/product&path=61&product_id=481
Retrieved
from
http://webstore.
Fischer, G.H., & Scheiblechner, H.H. (1970). Algorithmen und Programme für das probabilistische Testmodel von Rasch.
Psychologische Beiträge, 12, 23-51.
Hefter, M. H., Berthold, K., Renkl, A., Rieß, W., Schmid, S., & Fries, S. (2014). Effects of a training intervention to foster
argumentation skills while processing conflicting scientific positions. Instructional Science, 42(6), 929-947.
Hetmanek, A., Wecker, C., Kiesewetter, J., Trempler, K., Fischer, M. R., Gräsel, C., & Fischer, F. (2015). Wozu nutzen Lehrkräfte
welche Ressourcen? Eine Interviewstudie zur Schnittstelle zwischen bildungswissenschaftlicher Forschung und professionellem
Handeln im Bildungsbereich. Unterrichtswissenschaft, 43(3), (Beiheft), 193-208.
KMK (2004). Standards für die Lehrerbildung: Bildungswissenschaften (Beschluss der KMK vom 16.12.2004). Bonn: KMK.
Kubinger, K.D. (2005). Psychological test calibration using the Rasch model – Some critical suggestions on traditional
approaches. International Journal of Testing, 5(4), 377-394.
Mair, P., Hatzinger, R., & Maier, M.J. (2012). eRm: Extended Rasch Modeling. R package version 0.15-1.
Matic-Strametz, M., Strametz, R., Bohrt, K., Ochsendorf, F., & Weberschock, T. (2013). Evaluation eines Lehrkonzepts in EbM
für Lehramtsstudierende der Biologie - eine kontrollierte Phase-II-Studie (NCT01567267). Zeitschrift für Evidenz, Fortbildung und
Qualität im Gesundheitswesen, 107 (1),53–61.
OECD (2005). Teachers Matter. Attracting, developing and retaining effective teachers. Retrieved from OECD Publishing website:
http://www.oecd.org/edu/school/34990905.pdf
R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing: Vienna,
Austria.
Reif, M. (2012). PP: Person Parameter estimation. R package version 0.2.
Sackett, D. L., Rosenberg, W. M. C., Gray, J. A. M., Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine. What
it is and what it isn't. BMJ 312 (7023), 71–72.
Trempler, K., Hetmanek, A., Wecker, C, Kiesewetter, J., Fischer, F., Fischer, M., & Gräsel, C. (2015). Nutzung von Evidenz im
Bildungsbereich – Validierung eines Instruments zur Erfassung von Kompetenzen der Informationsauswahl und Bewertung von
Studien. Zeitschrift für Pädagogik, 61 (61. Beiheft), 144 – 166.
Förderung anwendbaren bildungswissenschaftlichen Wissens bei Lehramtsstudierenden durch
fehlerbasiertes Lernen: Effekte einer erweiterten Seminarkonzeption zur Implementation des Trainings in
das Lehramtscurriculum
Martin Klein, Kai Wagner, Eric Klopp, Robin Stark
Universität des Saarlandes
Theoretischer Hintergrund
Die Nutzung bildungswissenschaftlichen Wissens im Sinne reflektierter pädagogischer Praxis ist eine der Grundlagen effektiven
Lehrerhandelns im Schulalltag (Meier, 2006). Vor diesem Hintergrund hat das Konzept der Evidenzbasierung im Bildungsbereich
an Bedeutung gewonnen (Bromme, Prenzel & Jäger, 2014). Darunter versteht man die Berücksichtigung aktueller
wissenschaftlicher Befunde und bewährter Theorien bei professionellen Entscheidungen und Handlungen. Dies umfasst auch
die Erklärung komplexer schulischer Situationen anhand bildungswissenschaftlichen Wissens (vgl. rückschauendes Begreifen,
Beck & Krapp, 2006). Dabei zeigen sich jedoch verschiedene Probleme. Lehramtskandidaten weisen unrealistische Erwartungen
und negative Einstellungen gegenüber Theorien auf (Gordon & O'Brien, 2007; Stark, Herzmann & Krause, 2010). Bei der
Anwendung bildungswissenschaftlichen Wissens machen Studierende zahlreiche Fehler, etwa die Erklärung komplexer
schulischer Situationen anhand von Alltagswissen oder nicht adäquater Umgang mit empirischer Evidenz (Stark, 2005). Um diese
Fehler als Lerngelegenheiten zu nutzen, wurde eine auf advokatorischen Fehlern (Oser, 2007) basierende integrierte
Lernumgebung (Reinmann & Mandl, 2006) zum Einsatz in Seminaren des Lehramtsstudiums entwickelt. Die Studierenden
bearbeiten schulische Problemszenarien, bei denen die typische Fehler bei der Theorieanwendung dargestellt werden. Anhand
des Kontrasts an korrekten Lösungsbeispielen wird der Umgang mit wissenschaftlichen Theorien in Anwendungssituationen
gefördert.Die Effektivität dieser Lernumgebung zur Förderung verschiedener Wissensdimensionen nach DeJong und FergusonHessler (1996) wurde in früheren Studien belegt (Klein, Wagner, Klopp & Stark, 2015; Wagner, Klein, Klopp & Stark, 2015).
Forschungsfrage
Die vorliegende Studie untersucht die Effekte einer auf der Bearbeitung der Lernumgebung (Phase 1) aufbauenden zweiten
Seminarphase, anhand derer die Lernumgebung in das Curriculum integriert werden soll, sowie Effekte instruktionaler
Unterstützung während der Testphase auf anwendbares bildungswissenschaftliches Wissen zur Erklärung komplexer schulischer
Problemstellungen. Als Moderator wird außerdem der Einfluss der Einstellungen Studierender gegenüber Theorien überprüft.
Methode
N = 124 Studierende bearbeiteten die oben beschriebene Lernumgebung im Rahmen regulärer Seminare des Lehramtsstudiums.
Variiert wurde anschließend die Konzeption der auf die Bearbeitung der Lernumgebung folgenden Seminarphase. Eine
systematisch auf der Struktur der Lernumgebung aufbauende erweiterte Seminarkonzeption wurde anhand von Blended
Learning und adaptiver instruktionaler Unterstützung umgesetzt und mit einer regulären Seminarkonzeption verglichen. Dabei
konstruierten die Studierenden eigene Szenarien nach dem Muster der Lernumgebung. Dies schloss auch den Kontrast zwischen
einer inkorrekten und korrekten Erklärung ein. Erhoben wurden die Qualitäten (Automatisierungsgrad, Strukturiertheit und
Verarbeitungstiefe) anwendbaren Wissens nach DeJong und Ferguson-Hessler (1996) anhand von Tests zur eigenständigen
Erstellung theoriebasierter Erklärungen für komplexe schulische Problemstellungen (Erklärungswissen, s. Klein et al., 2015).
Dabei erfolgte die zweite Variation in Form instruktionaler Unterstützung anhand eines Glossars in der Testphase. Zusätzlich
wurden Veränderungen der Einstellungen gegenüber Theorien durch die Lernumgebung anhand einer Skala mit 16 Items sowie
ihr Einfluss auf die Lernerfolgsmaße erhoben.
Ergebnisse
Die erweiterte Seminarkonzeption verbesserte wie erwartet den Automatisierungsgrad, die Strukturiertheit und die
Verarbeitungstiefe anwendbaren Wissens gegenüber einer Kontrollgruppe. Die instruktionale Unterstützungsmaßnahme hatte
hypothesenkonform ebenfalls einen positiven Effekt auf diese Variablen, wider Erwarten zeigte sich jedoch kein Interaktionseffekt.
Das Training anhand der Lernumgebung erbrachte einen schwachen positiven Effekt auf die Einstellungen gegenüber Theorien.
Ein Einfluss der Einstellungen auf die Lernerfolgsmaße konnte nicht festgestellt werden.
Die Curriculumimplementation anhand einer erweiterten Seminarkonzeption erscheint also vielversprechend. Damit wird im
Sinne einer stärkeren Evidenzbasierung ein Beitrag zur systematischen Förderung von Theorienutzungskompetenzen im
Lehramtsstudium geleistet.
Literatur
Beck, K. & Krapp, A. (2006). Wissenschaftstheoretische Grundfragen der Pädagogischen Psychologie. In A. Krapp & B.
Weidenmann (Hrsg.), Pädagogische Psychologie (S. 33-73). Weinheim: Beltz PVU.
Bromme, R., Prenzel, M. & Jäger, M. (2014). Empirische Bildungsforschung und evidenzbasierte Bildungspolitik. Eine Analyse
von Anforderungen an die Darstellung, Interpretation und Rezeption empirischer Befunde. Zeitschrift für Erziehungswissenschaft
(S. 3 - 54). Wiesbaden: VS Springer.
De Jong, T. & Ferguson-Hessler, M. G. (1996). Types and qualities of knowledge. Education-al Psychologist, 31, 105-113
Gordon, M. & O'Brien, T. (2007). Introduction. In: M. Gordon, T.V. O'Brien & E.R. Smith (Hrsg.), Bridging Theory and Practice in
Teacher Education. Education Faculty Book and Media Gallery. (xi-xvi). Book 30. http://digitalcommons.fairfield.edu/educationbooks/30 [24.04.2015]
Klein, M., Wagner, K., Klopp, E. & Stark, R. (2015). Förderung anwendbaren bildungswissenschaftlichen Wissens bei
Lehramtsstudierenden anhand fehlerbasierten kollaborativen Lernens: Eine Studie zur Replikation bisheriger Befunde sowie zur
Nachhaltigkeit und Erweiterung der Trainingsmaßnahmen. Unterrichtswissenschaft. 43, 3, S. 225 - 244.
Meier, A. (2006). Theorienutzungskompetenz als Schlüsselqualifikation von Lehrkräften. In: Y.M. Nakamura, C. Böckelmann &
D. Tröhler (Eds.). Theorie versus Praxis? (p. 89-106) Verlag Pestalozzianum: Zürich.
Oser, F. (2007). Aus Fehlern lernen. In: M. Göhlich, Ch. Wulf & J. Zirfas (Eds.): Pädagogische Theorien des Lernens (p. 203212). Weinheim und Basel: Beltz Verlag.
Reinmann, G. & Mandl, H. (2006). Unterrichten und Lernumgebungen gestalten (S. 601-646). Weinheim: BeltzPVU.
Stark, R. (2005). Constructing arguments in educational discourses. In H. Gruber, C. Harteis, R. Mulder & M. Rehrl (eds.), Bridging
individual, organisational, and cultural aspects of professional learning (S. 64–71). Regensburg: S. Roderer.
Stark, R., Herzmann, P. & Krause, U.-M. (2010). Effekte integrierter Lernumgebungen – Vergleich problembasierter und
instruktionsorientierter Seminarkonzeptionen in der Lehrerbildung. Zeitschrift für Pädagogik, 56, 548-563
Wagner, K., Klein, M., Klopp, E. & Stark, R. (2014). Instruktionale Unterstützung beim Lernen aus advokatorischen Fehlern in
der Lehramtsausbildung: Effekte auf die Anwendung wissenschaftlichen Wissens. Psychologie in Erziehung und Unterricht.
Angenommen.
Wie lernt man „forschendes Lernen“? – Die Konzeption der Methodenausbildung für
Lehramtsstudierende an der WWU Münster und erste Evaluationsergebnisse
Lars Behrmann, Martina Homt, Jennifer Schmidt, Stefanie van Ophuysen
Westfälische Wilhelms-Universität Münster
Das nordrhein-westfälische Lehrerausbildungsgesetz (LABG 2009) sieht verpflichtende Praxisphasen bereits während der
universitären Lehramtsausbildung vor. Aus diesem Grund müssen alle Lehramtsstudierenden in NRW über die Dauer eines
halben Schuljahres ein Praxissemester absolvieren. Kern des Praxissemesters soll hierbei jedoch nicht der klassische Erwerb
von Handlungsroutinen bilden, sondern es soll ein Prozess „forschenden Lernens“ (vgl. Wildt, 2009) initiiert werden. Unter
forschendem Lernen wird dabei ein Professionalisierungsprozess verstanden, bei dem die Studierenden ausgehend von
theoretischen Vorüberlegungen oder eigenen Erfahrungen schulpraktische Fragestellungen ableiten, die mittels
bildungswissenschaftlicher Forschungsmethoden beantwortet werden. Das forschende Lernen beschreibt also einen mittel- bis
langfristig angelegten Professionalisierungsprozess, durch den angehende Lehrkräfte auf Basis eigenständig gewonnener
objektiver Erkenntnisse nach und nach ihren Unterricht kontinuierlich effektiver und effizienter gestalten.
Um diesen Entwicklungsprozess während des Praxissemesters anstoßen zu können, müssen die Lehramtsstudierenden
zunächst methodisches Grundlagenwissen erwerben. Dieses allein reicht aller Voraussicht nach jedoch nicht aus, dass
Lehrkräfte empirische Forschungsmethoden aus eigenem Antrieb heraus in der schulischen Praxis einsetzen. Nach der Theorie
des geplanten Verhaltens (vgl. Ajzen, 2011) kann davon ausgegangen werden, dass angehende Lehrkräfte erst dann „forschend
lernen“ werden, wenn sie davon überzeugt sind, dass sie 1) die hierzu notwendigen methodischen Kompetenzen auch besitzen
(Kontrollüberzeugung) und 2) dass eine methodische Herangehensweise an Fragestellungen des Schulalltags auch
wünschenswerte Konsequenzen nach sich zieht (positive Einstellung gegenüber dem Verhalten).
Aus diesem Grund werden in einer auf das Praxissemester vorbereitenden Lehrveranstaltung sowohl forschungsmethodisches
Wissen als auch diesbezügliche Überzeugungen der Studierenden adressiert: An acht Vorlesungsterminen werden basale
Methodenkenntnisse vermittelt, die zur Durchführung eigener empirischer Untersuchungen unmittelbar benötigt werden (bspw.
Wissen über Untersuchungsdesigns, Erhebungsinstrumente, Auswertung und Interpretation von Daten). In der Veranstaltung
werden dabei kontinuierlich die Vorzüge einer empirisch-wissenschaftlichen Beantwortung von Fragestellungen im Vergleich zu
alltagspsychologischen Erklärungen betont, die auf subjektiven Alltagstheorien beruhen. Im Anschluss an die acht
Vorlesungstermine werden weitere sieben Tutoriumssitzungen angeboten. Innerhalb dieser werden die methodischen Inhalte
aus der Lehrveranstaltung aufgegriffen und deren praktischer Einsatz mittels entsprechender Aufgaben intensiv eingeübt.
Ziel dieser Untersuchung ist es zu überprüfen, ob in der Veranstaltung die Grundlagen gelegt werden, die nach der Theorie des
geplanten Verhaltens (Ajzen, 2011) ein eigenständiges forschendes Lernen von Lehrkräften ermöglichen. Zunächst wurden zu
diesem Zweck entsprechende Erhebungsinstrumente konstruiert, deren Gütekriterien anhand der Daten von 136 Studierenden
aus dem WS 14/15 abgesichert wurden. Mit diesen Instrumenten wurden dann 112 Studierende aus dem Sommersemester 2015
jeweils vor und nach der Veranstaltung im Hinblick auf ihr methodenbezogenes Anwendungswissen, ihr Fähigkeitsselbstkonzept
sowie ihre Intention, forschend zu handeln, überprüft.
Es zeigte sich diesbezüglich, dass sich das methodische Anwendungswissen der Studierenden über den Veranstaltungszeitraum
signifikant verbessert hat (d = .27, p < .05). Ebenso konnte ein signifikanter Anstieg im Fähigkeitsselbstkonzept nachgewiesen
werden (d = .75, p < .001). Im Hinblick auf die Intention der Studierenden, eigenständig forschend zu handeln, wurde das 5%Signifikanzniveau jedoch knapp verfehlt (d =.19, p = .078).
Die resultierenden Befunde zeigen, dass die Veranstaltung offenbar dazu beitragen kann, Wissen und Überzeugungen zu
prägen, die Voraussetzung für eigenständiges „forschendes Lernen“ in der Schulpraxis sind. Die Untersuchung wird derzeit
weitergeführt, damit die bislang gefundenen Ergebnisse nach dem Wintersemester 2015/16 auf ihre Replizierbarkeit hin überprüft
werden können. Weitere Forschungsdesiderata (z.B. die Entwicklung der Studierenden nach dem Praxissemester, Auswirkungen
methodischer Kompetenzen auf didaktische Handlungen) werden aufgezeigt.
Literatur
Ajzen, I. (2011). The Theory of Planned Behavior. In P.A.M. van Lange, A.W. Kruglanski & E.T. Higgins (Hrsg.), Handbook of
Theories of Social Psychology, 438-459.
Wildt, J. (2009). Forschendes Lernen: Lernen im „Format “der Forschung. journal hochschuldidaktik, 20(2), 4-7.
ID: 343
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Lehrerbildung
Thematisches Cluster: Lehrer(aus)bildung
Stichworte: Peer Coaching; Praxisphasen; Handlungskompetenz;
Peer Coaching als Lernumgebung im Lehramtsstudium
Chair(s): Stefanie Schnebel (Pädagogische Hochschule Weingarten), Annelies Kreis (Universität Zürich)
Diskutant(en): Alexander Gröschner (Universität Paderborn)
Die Entwicklung professioneller Handlungskompetenz ist eine zentrale Aufgabe der Lehrerausbildung. Welche
Lerngelegenheiten für deren Entwicklung geeignet sind, ist jedoch noch wenig erforscht (Baumert & Kunter, 2011). Um
universitäres theoriebasiertes Lernen mit unterrichtsbezogenen Handlungssituationen zu verknüpfen, gelten Reflexion,
Austausch und Kooperation als entscheidende Mediatoren (zusammenfassend Cochran-Smith & Zeichner, 2006). Eine
Möglichkeit, praxisbezogene Lerngelegenheiten anzureichern, besteht in der wechselseitigen Unterstützung von Studierenden
in Formen von Peer Coaching oder Peer Kooperation. Peer Settings können die Kompetenzentwicklung in der
Lehrpersonenausbildung fördern (Britton & Anderson 2010; Lu 2010; Thurlings & den Brok, 2015). Zu erwarten ist, dass sie über
positive Kooperationserfahrungen auch dazu beitragen, Kooperation als bedeutsames Moment lebenslanger professioneller
Entwicklung zu etablieren. Im Zuge der Einführung von Praxissemestern bzw. der Erweiterung von Praxisphasen im
deutschsprachigen Raum werden verschiedene Konzepte erprobt, um evidenzbasiert Lernen in Praktikumskontexten mit
Peerunterstützung zu fördern. Welche Prozesse in solchen Lerngelegenheiten ablaufen und welche Effekte erzielt werden
können, soll im Rahmen des Symposiums in vier Forschungsbeiträgen diskutiert werden.
Beitrag 1 berichtet Ergebnisse einer quantitativen Studie der TU München, die ein Online-Tool zur Dokumentation von
Praktikumserfahrungen etabliert und damit Coaching- und Mentoringprozesse im Praktikum abbildbar macht. In
Regressionsanalysen kann die Bedeutung von Austauschprozessen mit Mentoren und Peers für die Entwicklung der Motivation
im Praktikum aufgezeigt werden. Beitrag 2 zeigt in einem qualitativen Design auf, wie Studierende die Unterstützung durch PeerCoaching in der Planung, Durchführung und Reflexion von Microteaching-Sequenzen wahrnehmen. Die Studie analysiert Daten
aus Gruppendiskussionen, die mit Studierenden im Rahmen eines Zertifikatskurses der Universität Münster durchgeführt und
inhaltsanalytisch ausgewertet wurden. Die Ergebnisse verweisen darauf, dass durch die Peerunterstützung Reflexion und die
Einschätzung eigener Lehrfähigkeit positiv beeinflusst werden können. Die Beiträge 3 und 4 beziehen sich auf das binationale
Projekt „Kollegiales Unterrichtscoaching und Entwicklung von experimenteller Kompetenz“ (KubeX) (Schnebel & Kreis 2014). In
einem quasi-experimentellen Interventionsdesign wird untersucht, welche Effekte die Einführung Kollegialen
Unterrichtscoachings (Kreis & Staub, 2013) auf Inhalte und Prozesse videografierter Planungsgespräche in einem reziproken
Coaching zwischen Studierenden erzeugt. Beitrag 3 fokussiert die Einschätzung verschiedener Aspekte von Planungskompetenz
aus einer standardisierten Prä-Post-Befragung sowie aus Analysen videografierter Planungsgespräche im Hinblick auf die
bearbeiteten Inhalte. Beitrag 4 zeigt auf, inwiefern die in der Intervention vermittelten Coachingmoves durch die Studierenden
umgesetzt werden und in welchem Zusammenhang dies mit dem Auftreten dialogischer Elaboration der Planungsskizzen steht.
Beitrag 3 und 4 zeigen Unterschiede zwischen zwei Gruppen mit/ohne Training in Kollegialem Unterrichtscoaching.
Beiträge des Symposiums
„Track your Practicum“ Experiences Sampling als Methode um Praxiserfahrung bei
Lehramtsstudierenden sichtbar zu machen
Kathleen Stürmer, Ann-Kathrin Schindler
TU München
Nach wie vor stellt es für die universitäre Lehrerausbildung eine zentrale Herausforderung dar, schulpraktische Erfahrungen von
Studierenden in handlungsrelevante professionelle Lernprozesse zu überführen (Wubbels, 1992). Praktische Erfahrungen
werden als wichtige Ressource informeller Lernprozesse verstanden. Eine wichtige Rolle für ihre gelingende In-tegration in
evidenzbasiertes, handlungsrelevantes Lernen wird dabei den verschiedenen Institutionen (Universität, Schule), Aktivitäten (z.B.
Hospitationen, eigene Unterrichtversuche) aber auch Akteuren, die Reflexionsprozesse begleiten und anleiten (z.B. Peers,
Dozenten, betreuende Lehrpersonen), zugesprochen. Bisher ist die Bedeutung der einzelnen Komponenten in ihrem
Zusammenspiel mit Blick auf die Frage, was tatsächlich eine Ressource für die professionelle Entwicklung angehender
Lehrpersonen darstellt, weitaus unbeleuchtet. Um interpersonale Momente im praxisbezogenen Lernen zu identifizieren
(Grossman, 1992), auf welchen aufbauend Reflexionsprozesse zum Beispiel in Form von Peer Coaching angeleitet werden
können, braucht es Ansätze, die es erlauben praktische Erfahrungen von Studierenden in ihrer Gesamtheit, aber dennoch
differenziert abzubilden. Gegenwärtige Zugänge (z.B. Schreiben von Lerntagebüchern, Portfolios) setzen voraus, dass die
Studierende relevante Ereignisse in ihrer Relation zu ihren praxisbasierten Lernprozessen wahrnehmen, selektieren, erinnern
und in der Lage sind diese in einer nachvollziehbaren Art und Weise explizieren zu können. Sie erlauben keinen Ad hoc Aufgriff,
da sie retroperspektiv von dem eigentlichen Handlungskontext sind. Nicht selten stoßen sie zudem auf wenig Akzeptanz. In
diesem Bei-trag wird ein neuartiger Zugang vorgestellt, der zum Ziel hat, die einzelnen Komponenten praktischer Erfahrungen
von Studierenden an der Schule transparent, mit Blick auf die Bedeutung professioneller Lernprozesse empirisch erfassbar und
somit an die Akteure rückspielbar zu machen.
„Track your Practicum“ ist ein online Tool, in dem Studierende ihre Aktivitäten an der Schule, ihren Erfahrungsaustausch mit ihren
Peers, (betreuenden) Lehrpersonen sowie ihre Lernmotivation über eine Smartphone-Anwendung dokumentieren. Vor dem
Hintergrund der zunehmend bedeutenden Rolle technologiebasierten Lernens stellt die Integration digitaler Medien in die
universitäre Ausbildung zukünftiger Lehrpersonen einen innovativen Ansatz dar (Könings & Gijselaers, 2015). In dieser Studie
untersuchen wir, inwiefern durch das Tool (1) intra-individuell Praxiserfahrungen auf der Aktions-, Akteurs- und
Lernprozessebene transparent gemacht und (2) Ressourcen für das praxisbasierte Lernen identifiziert werden können.
Grundlage sind die Erfahrungen von N = 42 (weiblich 50%, 2. Semester, Alter = 20.07, SD = 2.22) Studierende, die in Triaden
eine 15-tägige universitär begleiteten Praxis-phase durchliefen. Über die Methode des Experience Samplings (Kubey et al., 1996)
wurden täglich ihre Aktivitäten (z.B. „Heute habe ich Unterricht hospitiert“ ja/nein), ihr Erfahrungs-austausch mit ihren Peers sowie
betreuenden Lehrpersonen (z.B. „Heute habe ich mich mit anderen Studierenden über Unterrichts ausgetauscht.“ ja/nein) und
ihre Lernmotivation auf einer fünf-stufigen Skala von ‚1’ nie bis ‚6’ sehr häufig (Prenzel & Drechsel, 1996) erhoben.
Multilevel-analytische Auswertungen zeigen, dass die Aktivitäten in ihrem Verlauf, Austauschbeziehungen sowie
Lernmotivationsbewegungen über die Tage nachgezeichnet werden. Es zeigt sich, dass Unterrichtshospitationen über die
Studierenden hinweg den größten Anteil an Aktivitäten in der Schule darstellen (M = 0.77, SD = 0.26), durchgehend ein hoher
Austausch mit der Peergruppe sowie mit den betreuenden Lehrpersonen stattfindet (M = 0.80, SD = 0.26) und die Lernmotivation
über die Praxisphase stabil günstig ausgeprägt ist (z.B. intrinsisch M = 5.15, SD = .64). Mit Blick auf die Identifikation von
praxisbasierten Lernressourcen wird allerdings deutlich, dass einzig der Austausch mit der betreuenden Lehrperson an der
Schule eine günstige Lernmotivation positiv vorhergesagt (z.B. intrinsisch R2 = .20; β = .49, p = .001).
Die Ergebnisse verdeutlichen, die hohe Bedeutung der Austauschbeziehungen an der Schule für Studierende. Im Vortrag werden
Möglichkeiten diskutiert, wie die gewonnenen Daten an die Akteure professioneller Reflexionsprozesse zurückgespielt werden
können sowie Perspektiven aufgezeigt, das Tool zur Unterstützung von Peer Coaching, aber auch Selbstreflexion oder MentorenBetreuung zu nutzen.
Begleitung von universitären Praxiselementen durch Peer-Coaching
Anna Grabosch, Stephanie van Ophuysen
Universität Münster
Praxisphasen sind mittlerweile fester Bestandteil in der universitären Lehrerbildung und zu-nehmend Gegenstand von
Forschungsaktivitäten (vgl. Gröschner/Seidel 2012). Bisherige Forschungsergebnisse zeigen, dass insbesondere die
Betreuungsqualität von Praxisphasen sich als besonders wichtig für den Lernerfolg der Studierenden herausstellt (Schnebel
2009, Gröschner/Schmitt 2011, Hascher/Moser 2001, Kreis/Staub 2011). Untersucht wurde dabei die Betreuungsbeziehung
zwischen Studierenden und MentorInnen oder Studierenden und DozentInnen der Hochschulen. Keine Beachtung finden PeerCoaching Konzepte, in denen Studierende andere Studierende begleiten. Bislang wurden Praxisphasen in Form von Prak-tika
oder des Praxissemesters in den Blick genommen. Denkbar sind allerdings auch prakti-sche Elemente innerhalb der Universität,
um den Handlungskompetenzerwerb von Studie-renden zu fördern. Denn, „der Praxisbezug der universitären Praxisphasen
richtet sich […] nicht auf die Vermittlung von Handlungsroutinen im Unterricht und im Schulbetrieb, sondern auf die theoretischkonzeptionelle Durchdringung und Analyse beobachtbarer oder selbster-fahrener Praxis“ (Baumert u.a. 2007, S. 8). Daher stellt
sich die Frage, wie der Handlungs-kompetenzerwerb angehender LehrerInnen auch innerhalb der Universität gefördert werden
kann und inwiefern Peer-Coaching diesen Prozess unterschützen kann. Die Erziehungswis-senschaftliche Lehr-und
Forschungswerkstatt (ELF) der Universität Münster bietet Studie-renden dazu verschiedene handlungsorientierte Angebote.
Darunter fallen u.a. die Kollegiale Fallberatung, Kompetenztrainings und Portfolioarbeit, die, in Kombination absolviert, zu einem
Zertifikat führen. Im Rahmen der Angebote agieren die teilnehmenden Studierenden in Leitungsfunktionen, lernen ihr Handeln
zu reflektieren und theoretisch zu begründen, um so ihre Handlungskompetenz zu erweitern. Der gesamte Prozess wird von
geschulten Studie-renden (Peers) begleitet und Lernziele und –ergebnisse werden gemeinsam reflektiert und festgehalten. Im
Rahmen eines Forschungsprojektes wird auf Basis von zwei nicht-standardisierten Gruppendiskussionen der Prozess des
Handlungskompetenzerwerbs der Studierenden während des Zertifikatserwerbs rekonstruiert und aufgezeigt, welche Bedeutung
dabei dem Peer-Coaching zukommt. Zur Erfassung der kollektiven Erfahrungen der ZertifikatsabsolventInnen wurden zwei
Gruppen á 5 und á 7 TeilnehmerInnen befragt, die das Zertifikat zu unterschiedlichen Zeitpunkten erworben haben: Die erste
Gruppe hat das Zertifikat seit mindestens einem Jahr abgeschlossen, die zweite seit weniger als drei Wochen. Die
inhaltsanalytische Auswertung nach Kuckartz erfolgt durch zwei unabhängige Rater. Die Interrater-Reliabilität erweist sich als
gut. In den Ergebnissen zeigt sich, dass die AbsolventInnen trotz der unterschiedlichen Erwerbszeiträume des Zertifikats von
gemeinsa-men Lernergebnisse berichten. Unterschiede zeigen sich darin, dass die erste Gruppe von weiteren Erkenntnissen
nach längerer Reflexionsphase – die der zweiten Gruppe noch bevor steht – berichten. Hinsichtlich des Peer-Coachings wird
sichtbar, dass die Zertifikatsabsol-ventInnen die Peers als kompetent und daher als Vorbild wahrnehmen. Die Peer-Coaches sind
nach Angabe der AbsolventInnen in der Lage, einen geschützten Raum aufzubauen, Ängste zu nehmen und die AbsolventInnen
durch Feedback zu stärken. Dies führt weiterhin dazu, dass die AbsolventInnen sich selbst und ihr Handeln aufgrund der
gemeinsamen Re-flexion besser verstehen und einschätzen können und sich systematisch auf die eigene Lei-tungstätigkeit
vorbereitet fühlen. Die Bedeutung der Begleitung von Praxisphasen kann auch in diesem Kontext bestätigt werden. Zusätzlich
kann gezeigt werden, dass auch Peers in der Lage sind, die Begleitung erfolgreich durchzuführen. Abschließend werden die
Möglichkeiten und Grenzen der Implementation von Praxiselementen in der Hochschullehre sowie die Be-gleitung durch Peers
diskutiert.
Selbsteinschätzungen zur Planungskompetenz und inhaltliche Schwerpunkte in Gesprächen über
Unterrichtsplanung – Ergebnisse einer Interventionsstudie zu Planungsgesprächen unter Peers im
Rahmen des Projekts KUBeX
Stefanie Schnebel1, Stephanie Musow1, Sandra Wagner2, Annelies Kreis3
1
Pädagogische Hochschule Weingarten, 2PH Thurgau, 3Universität Zürich
Die Planungskompetenz stellt eine wesentliche Voraussetzung dar, um Unterricht professionell vorzubereiten, durchzuführen
und zu evaluieren (Kiper, 2012). Blömeke, Kaiser und Lehmann (2011) betrachten die Entwicklung professioneller
Handlungskompetenz als Wechselspiel von Lerngelegenheiten und kognitiven Aspekte wie Wissen und Überzeugungen.
Lerngelegenheiten in den praxisbezogenen Bausteinen der Lehrerausbildung lassen sich durch Formen von Mentoring und
Coaching anreichern (Goker, 2006). Um Unterricht erfolgreich zu planen, müssen Studierende lernen, verschiedene allgemeinund fachdidaktische Dimensionen in die Planung einzubeziehen (Bach, 2013). Wie Studien zu Unterrichtsbesprechungen mit
betreuenden Lehrpersonen zeigen, findet jedoch eine Fokussierung auf Fragen der methodischen Gestaltung und des
Klassenmanagements statt (Schüpbach, 2007; Schnebel, 2011). Ein vielversprechender und für erfahrene Lehrpersonen
empirisch validierter Ansatz zur Gestaltung von Lerngelegenheiten im Kontext von Praktika stellt das Kollegiale
Unterrichtscoaching (Kreis & Staub, 2013) dar. Neben der Modellierung von Coachingprozessen stellt es mit den sogenannten
Kernperspektiven ein Tool bereit, das die Coaches unterstützt, vielfältige didaktische Perspektiven in die Gespräche
einzubeziehen (Staub, 2014). Im diesem Beitrag zugrundeliegenden Projekt KUBeX wurde eine Intervention entwickelt, in
welcher Studierende ein Training zu Kollegialem Unterrichtscoaching erhalten und sich jeweils in Tandems gegenseitig in der
Unterrichtsplanung unterstützen. Erste Befunde zu Peer Coaching in praxisbezogenen Elementen der Lehrerausbildung zeigen
positive Effekte (Lu, 2010). Insgesamt ist jedoch noch wenig geklärt, welche Inhalte in solchen Peer Coachings verhandelt werden
und welchen Beitrag ein solches Coaching zum Aufbau von Unterrichtsplanungskompetenz leisten kann.
Vor diesem Hintergrund wird in diesem Beitrag der Fragestellung nachgegangen, inwiefern die Intervention zum Kollegialen
Unterrichtscoaching bei den beteiligten Lehramtsstudierenden eine Veränderung in der Kompetenzeinschätzung zur
Unterrichtsplanung bewirkt und Unterschiede zwischen Interventions- und Kontrollgruppe bezüglich bearbeiteter Inhalte erzeugt.
Die Studie wurde mit einem quasi-experimentellen mixed-methods Design durchgeführt. Studierende des Faches Biologie
(n=119) erhielten einen fachdidaktischen Input (2x90‘). Die Interventionsgruppe (n=65) wurde in Kollegiales Unterrichtscoaching
eingeführt und trainiert (2x90‘), die Kontrollgruppe (n=59) erfuhr einen unabhängigen pädagogischen Input. Beide Gruppen
führten in Tandems Planungsgespräche, die IG anhand des Konzepts des Kollegialen Unterrichtscoachings, die KG kooperierte
frei. Wissen und Überzeugungen wurden über eine Prä-Post-Befragung erfasst, die Planungsgespräche videografiert.
In der standardisierten Befragung wurden u.a. die Skalen: Strukturiertheit von Unterrichtsplanung (5 Items, α=.66) (Gröschner &
Schmitt, 2009) und Einschätzung eigener Planungskompetenz (16 Items, α=.82) eingesetzt. Die Items zur Einschätzung der
Planungskompetenz greifen die Elemente der Kernperspektiven wie z.B. (Schülervoraussetzungen, Lernziele, kognitiv
anregende Aufgaben etc. ) auf (Schnebel & Kreis, 2014). Zur Analyse der Videos bezüglich der Gesprächsinhalte wurde
inhaltsanalytisch ein Codierverfahren entwickelt, welches fach- und allgemeindidaktische Dimensionen abbildet. Das
Codierschema umfasst 29 Codes in 10 Dimensionen (Unterrichtsgegenstand, Unterrichtsgestaltung, Lernziele,
Klassenmanagement, Motivierung, Schülervoraussetzungen, Kontext, Werkzeuge für Unterrichtsplanung, Metaebene, Notizen).
Die Intercoderreliabiltät auf Codeebene beträgt S-Lotus= .88 (min=.71; max=1). Die Bestimmung der Analyseeinheiten erfolgte
entlang semantischer Einheiten (Kreis et al., 2012).
Die Ergebnisse der Fragebogenerhebung zeigen in einer einfaktoriellen Varianzanalyse mit Messwiederholung einen
signifikanten Unterschied der Einschätzung der Planungskompetenz über die Zeit (time: F=9.372; p=.003), aber keine
signifikanten Gruppenunterschiede über die Zeit (time * group: F=1.444; p=.232). Im Hinblick auf die Strukturiertheit der Planung
ergeben sich weder für den Faktor Zeit noch den Faktor Gruppe signifikanten Unterschiede (time: F=.14; p>.05; time * group:
F=.1.68; p>.05; group: F=.43; p>.05). Die Analyse der Planungsgespräche zeigt eine breite Differenzierung der besprochenen
Inhalte, wobei prozentual bezogen auf alle Codierungen „Unterrichtsgestaltung“ (M = 10.73; SD = 7.87), „Gestalten von
Experimentieren“ (M = 20.89; SD = 9.97) und „Medien“ (M = 14.66; SD = 7.45) am häufigsten bearbeitet werden. Signifikante
Unterschiede zwischen den Gruppen treten u.a. in den Codes „Unterrichtsgestaltung“ (U = -3.208; p = .000), „Medien“ (U= 1.637; p = .050) „Differenzierung“ (U = -2.606; p = .009) und „Thematisieren der Kernperspektiven“ (U = -2.162; p = .031) jeweils
mit höheren Werten der IG auf.
Unterstützendes Gesprächshandeln in Planungsdialogen zwischen Lehrstudierenden – Ergebnisse einer
Interventionsstudie zu Kollegialem Unterrichtscoaching
Annelies Kreis1, Eva Engeli2, Stephanie Musow3, Stefanie Schnebel3, Sandra Wagner4
1
Universität Zürich, 2Pädagogische Hochschule Thurgau, PH Schaffhausen, 3Pädagogische Hochschule Weingarten, 4PH
Thurgau
Mit der Studie KUBeX werden Effekte einer Intervention zu Kollegialem Unterrichtscoaching (Kreis & Staub, 2013) auf die
gemeinsame Planung von Unterricht zwischen zukünftigen Lehrpersonen untersucht. Die wenigen bisherigen Studien über
reziprokes Coaching zwischen angehenden Lehrpersonen in Praktika legen dessen positiven Einfluss auf verschiedene Aspekte
der Kompetenzentwicklung nahe (Thurlings & den Brok, 2015). In der vorliegenden Teilstudie stehen Planungsgespräche von
Studierendendyaden der Interventions- und Kontrollgruppe im Fokus. Beide Gruppen erhielten einen Impuls zu Fachdidaktik
(Experimentieren als Erkenntnismethode der Biologie). Die Interventionsgruppe nahm zusätzlich an einem Training zu
Kollegialem Unterrichtscoaching teil (2*90’). Es wurden zentrale Elemente des Ansatzes (Rollen als Coach oder Coachee,
dialogische Elaboration einer Unterrichtsskizze mit Hilfe sogenannter Kernperspektiven) vermittelt und gecoachte
Planungsgespräche trainiert. Anschliessend wurden zwei Planungsgespräche pro Dyade videografiert (NIG = 42; NKG = 51).
Die Studierenden wurden angewiesen, sich nacheinander im Tandem mit verteilten Rollen bei der Ausarbeitung einer
mitgebrachten Unterrichtsskizze zu unterstützen (S1 bringt Skizze mit, S2 leitet Gespräch zur Elaboration). Die Planung erfolgte
hinsichtlich eines standardisierten Inhalts (Experimentieren zu visueller Wahrnehmung) für eine mittels Vignette beschriebene 8.
Klasse.
Der Interventionsansatz schlägt spezifische Coachingmoves vor, welche die dialogische Weiterentwicklung der eingebrachten
Unterrichtsplanung unterstützen sollen (Kreis & Staub, 2013; Staub, West & Bickel, 2003). Mit diesem Beitrag wird untersucht,
ob Studierende basierend auf einer relativ knappen aber ökologisch validen Intervention in der Lage sind, grundlegende Elemente
des Kollegialen Unterrichtscoachings umzusetzen und inwiefern sie sich dabei von Kommiliton/innen einer Kontrollgruppe
unterscheiden. Dafür werden die Videoaufzeichnungen dahingehend analysiert, welche Unterschiede sich in der Häufigkeit der
durch die Coaches angewendeten Gesprächsmoves sowie in der Dauer dialogischer Elaboration zeigen.
Die Analyse der Planungsgespräche erfolgt eventbasiert mittels pragma-linguistischer Gesprächsanalyse (Kreis, 2012) anhand
eines Kategoriensystems zur Erfassung (a) der Dauer dialogischer Elaboration sowie (b) des individuellen Gesprächshandelns
der Interaktant/innen (Moves gemäss Kollegialem Unterrichtscoaching). Letzteres beinhaltet die Codes ‘Einladung’ (short und
long answer questions; vgl. Graesser & Person, 1994), ‘Hinweise zur Unterrichtsgestaltung’, ‘Verständnissicherung’,
‘Problematisieren’, ‘Unsicherheit’ (VanLehn et al., 2003) und ‘positive Bewertung’ (Interraterübereinstimmung S-Lotus = .81).
Die Besprechungen der Interventionsgruppe dauerten signifikant länger als jene der Kontrollgruppe (MIG=27’, sIG= 10; MKG=17’,
sKG=8.8; p=.000**) und enthielten signifikant längere Sequenzen dialogischer Elaboration der Unterrichtsplanung (MIG=15.2’,
sIG= 9.5; MKG=5.2’, sKG=5.1; p=.000**).
Für die Studierenden S2 mit unterstützender Rolle mit Abstand am häufigsten codiert wurden ‘Hinweise zur Unterrichtsgestaltung’
(M=12.6, s=10.7), gefolgt von ‘Einladung’ (M=4.8, s=4), ‘Verständnissicherung’ (M=2.8, s=3) und ‘Problematisieren’ (M=1.7, s=2).
Alle Moves werden von den Studierenden S2 der Interventionsgruppe (Coaches) hoch sign. häufiger angewendet als von jenen
der Kontrollgruppe. Die Studierenden S1, deren Unterrichtsskizzen weiterentwickelt werden sollen, wenden am häufigsten die
Moves ‘Einladung’ (M=1.7, s=2.6) und ‘Problematisieren’ (M=1.7, s=2.4) an, gefolgt von ‘Unsicherheit’ (M=1.2, s=1.6) und
‘Verständnissicherung’ (M=0.5, s=1). Auch hier ist der Unterschied in der Häufigkeit des Auftretens zwischen IG und KG
durchwegs hoch signifikant. Offensichtlich ist, dass die fokussierten Moves deutlich häufiger von S2 als S1 angewendet werden.
Eine lineare Regressionsanalyse zeigt, dass dialogische Elaboration vor allem durch die Moves ‘Hinweis’, ‘long answer-question’
und ‘Unsicherheit’ seitens S2 sowie durch ‘long answer-questions’ und ‘problematisierende’ Äusserungen seitens S1 erklärt
werden können.
Die Ergebnisse zeigen, dass sich das Gesprächshandeln in gemeinsamen Planungsgesprächen zwischen Studierenden durch
eine ökologisch valide Intervention in erwünschter Richtung beeinflussen lassen. Sowohl die trainierten Gesprächsmoves
gemäss Kollegialem Unterrichtscoaching als auch die angestrebte dialogische Elaboration einer eingebrachten
Unterrichtsplanung sind in den Planungsgesprächen der Interventionsgruppe häufiger bzw. länger zu beobachten als in der
Kontrollgruppe. Zudem zeigt sich, welche Moves besonders geeignet zu sein scheinen, um das Auftreten von Sequenzen
dialogischer Elaboration zu prognostizieren. Weitere Analysen werden zeigen, wie die Coachinggespräche und die im Peersetting
weiterentwickelten Unterrichtsplanungen aus fachdidaktischer Sicht eingeschätzt werden.
ID: 348
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie
Thematisches Cluster: Methoden der empirischen Bildungsforschung
Stichworte: Kausale Effekte, Propensity Score Matching, Complier-Average-Causal-Effects, Quasi-experimentelle Designs
Analyse kausaler Effekte in der Empirischen Bildungsforschung – Anwendungen und methodische
Fortschritte
Chair(s): Benjamin Nagengast (Universität Tübingen)
Viele Fragestellungen der Empirischen Bildungsforschung (z.B. nach Effekten von institutionellen Lernumgebungen) können
nicht mit randomisierten Untersuchungsplänen beantwortet werden. Das Interesse an der Schätzung kausaler Effekte in quasiexperimentellen Designs hat daher in der Empirischen Bildungsforschung in den letzten Jahren deutlich zugenommen. Dabei
wird häufig auf das Modell kausaler Effekte (Rubin, 1974, 2005) zurückgegriffen. Propensity Score Verfahren, die auf diesem
Modell aufbauen, sind häufig eingesetzte Methoden zur Kontrolle von Selektionseffekten in quasi-experimentellen Designs. Hier
hat sich inzwischen ein hoher methodischer Standard etabliert. Bei typischen Studiendesigns der Empirischen Bildungsforschung
stellt sich dennoch oft die Frage wie mit messfehlerbehafteten Kovariaten und der Mehrebenenstruktur umgegangen werden
kann. Mit dem steigenden Interesse an der experimentellen Evaluation von Interventionen im Schulkontext werden Ansätze zur
Analyse spezifischer kausaler Effekte auch in diesem Bereich relevanter. Während der durchschnittliche Effekt für alle Probanden
in experimentellen Designs leicht zu identifizieren ist, stellt die Berücksichtigung der Compliance mit Instruktionen bei der
Schätzung von Effekten eine Herausforderung dar, die trotz Randomisierung nicht einfach gelöst werden kann. Neuere
methodische Entwicklungen auf der Grundlage der Theorie kausaler Effekte erlauben hier weitergehende Analysen, werden aber
bisher in der Empirischen Bildungsforschung nur selten eingesetzt.
Das Symposium verbindet Beiträge zur Anwendungen von Verfahren zur Analyse kausaler Effekte auf Fragestellungen der
Empirischen Bildungsforschung mit Beiträgen, die methodische Entwicklungen vorstellen und illustrieren. Die ersten beiden
Beiträge zeigen beispielhaft den Einsatz von state-of-the-art Propensity Score Verfahren zur Analyse der Effekte von
Lernumgebungen: Der Beitrag von Golle et al. untersucht die Effekte der beruflichen Ausbildung (im Vergleich zum Besuch des
beruflichen Gymnasiums) auf die Entwicklung von Persönlichkeit und Motivation. Guill et al. stellen Analysen zu den Effekten des
Besuchs des Gymnasiums auf die Intelligenzentwicklung vor. Drei eher methodisch ausgerichtete Beiträge beleuchten
Entwicklungen in der Analyse kausaler Effekte, die für die Empirische Bildungsforschung besonders relevant sind: Sengewald
und Pohl greifen das Problem unreliabel erfasster Kovariaten auf, die potentiell zu einer verfälschten Schätzung von kausalen
Effekten führen können. Ihr Beitrag zeigt, dass die Aufnahme weiterer Kovariaten sich je nach Datenkonstellation unterschiedlich
auf den Bias der Effektschätzung auswirken kann. Der Beitrag von Mayer stellt ein neues, bootstrap-basiertes Verfahren zur
Schätzung von kausalen Effekten in quasi-experimentellen Mehrebenendesigns vor, die für die Empirische Bildungsforschung
typisch sind. Nagengast et al. beschließen das Symposium mit einem Beitrag zur Analyse von Complier-Average-Causal-Effects
in Interventionsstudien mit randomisierter Zuweisung auf Klassenebene und illustrieren die Methode mit Daten aus einer
Intervention zur Förderung der Motivation im Fach Mathematik.
Beiträge des Symposiums
Welchen Einfluss haben unterschiedliche Bildungsgänge auf Persönlichkeit, Selbstkonzept und
berufliche Interessen?
Jessika Golle, Nicolas Hübner, Sven Rieger, Ulrich Trautwein, Benjamin Nagengast
Universität Tübingen
*Hintergrund und Fragestellung*: Aktuell gibt es nur wenige gesicherte Befunde zu den Effekten unterschiedlicher institutioneller
Umgebungen auf die Entwicklung von bildungsrelevanten Persönlichkeitseigenschaften. Bisherige Studien konzentrierten sich
vor allem auf den Einfluss der Arbeit bzw. derer Charakteristika auf die Persönlichkeitsentwicklung (vgl. Roberts, Caspi & Moffitt,
2003). Roberts und Kollegen berichten u.a., dass junge Erwachsene in einem Beruf mit hohem Status im Vergleich zu einem
Beruf mit geringerem Status weniger ängstlich und selbstzerstörerisch, glücklicher und selbstbewusster waren. Bisher
unbeantwortet bleibt die Frage welchen Einfluss unterschiedliche Institutionen (Schule vs. Beruf) auf die Entwicklung
verschiedener Persönlichkeitsaspekte haben. Die vorliegende Arbeit knüpft an dieser Stelle an und widmet sich der Frage: Wie
entwickeln sich Realschulabsolventinnen und –absolventen im Anschluss an die 10. Klasse in Abhängigkeit von ihren
Übergangsentscheidungen? Von besonderem Interesse ist dabei die Wirkung des Besuchs eines Beruflichen Gymnasiums (BG)
auf die Persönlichkeit, das Selbstkonzept und die beruflichen Interessen im Vergleich zu Absolventinnen und Absolventen, die
sich im Anschluss an die 10. Klasse nicht für den Besuch eines BG, sondern für eine Ausbildung, Fachschule/Berufsschule oder
ein Berufskolleg entschieden.
*Methode*: Im Rahmen einer Untersuchung von Übergangsentscheidungen und Ausbildungsverläufen wurden
Realschulabsolventinnen und –absolventen am Ende der 10. Klasse hinsichtlich ihrer kognitiven Fähigkeiten, Persönlichkeit,
beruflicher Interessen, Selbstkonzept und angestrebter Ausbildung befragt (TOSCA-10; vgl. Trautwein, Nagy & Maaz 2011).
Sechs Jahre später wurden die Studienteilnehmer erneut kontaktiert und gebeten einen Fragebogen auszufüllen. Dabei wurden
die tatsächlichen Ausbildungs- und Berufsbiografien der letzten 6 Jahre detailliert erhoben und zusätzlich Persönlichkeit,
berufliche Interessen und Selbstkonzept wiederholt erfasst. Anhand einer Stichprobe von 382 Schülerinnen und Schülern wurde
der Effekt des BG-Besuchs auf die Entwicklung von Persönlichkeit, beruflichen Interessen und Selbstkonzept untersucht. 212
Jugendliche besuchten das Berufliche Gymnasium und 170 Jugendliche entschieden sich für eine Berufsausbildung,
Fachschule/Berufsschule oder ein Berufskolleg. Aufgrund systematischer Eingangsunterschiede (_selection bias_) zwischen den
Gruppen konnte der Effekt des BG nicht unverfälscht mittels einfacher Mittelwertsvergleiche zum zweiten Messzeitpunkt
geschätzt werden. Um mögliche Unterschiede zum ersten Messzeitpunkt kontrollieren zu können, wurden die Teilnehmer der
Gruppen mittels _propensity score matching_ (_nearest neighbor_ 1:1, 1:N ohne _caliper_, 1:N _caliper_ = 0.2, 1:N _caliper_ =
0.1; _full matching_) einander so zugeordnet, dass sie sich hinsichtlich der Verteilung der Variablen, die für den Übergang in ein
BG und die Vorhersage der Variablen zum zweiten Messzeitpunkt relevant sind, so wenig wie möglich voneinander unterschieden
(Rosenbaum & Rubin, 1983). Dabei wurden folgende Maße berücksichtigt: Noten, kognitive Fähigkeiten, Ergebnisse mehrerer
Leistungstests, Persönlichkeit, akademische Interessen, Selbstkonzept, Risikoverhalten, Lebenszufriedenheit und sozialer
Hintergrund (auf Individual- und Klassenebene).
Um den Effekt des Besuchs des BG auf die Persönlichkeit, akademische Interessen und den Selbstwert zum zweiten
Messzeitpunkt schätzen zu können, wurden im Anschluss an das _matching_ Regressionsanalysen berechnet und alle Variablen,
die bereits beim _matching_ verwendet wurden erneut mitberücksichtigt (_doubly robust_, vgl. Ho, Imai, King & Stuart, 2007;
Kretschmann, Vock & Lüdke, 2014; Park, Lubinski & Benbow, 2013; Schafer & Kang, 2008).
*Ergebnisse*: Im Folgenden werden die vorläufigen Ergebnisse basierend auf der full matching Stichprobe berichtet, in der die
Kovariatenverteilung nach dem Matching am besten balanciert war. Die Teilnehmer, die ein BG besuchten, waren 6 Jahre nach
ihrem Realschulabschluss weniger gewissenhaft, besaßen ein geringeres sprachliches und intellektuelles Selbstkonzept und
interessierten sich mehr für intellektuell-forschende, soziale, unternehmerische und konventionelle Tätigkeiten als
Absolventinnen und Absolventen, die sich für eine Ausbildung, Fachschule/Berufsschule oder ein Berufskolleg entschieden
hatten. Diese Befunde legen nahe, dass die jeweils gewählten Bildungsgänge tatsächlich - jenseits der bekannten Effekte auf
Leistungsvariablen (z.B. Baumert, Trautwein & Artelt, 2013; Becker, Lüdke, Trautwein & Baumert, 2006; Köller & Baumert, 2001)
und Intelligenz (Becker, Lüdtke, Trautwein, Köller & Baumert, 2012) - auch Effekte auf bildungsrelevante
Persönlichkeitseigenschaften haben.
Steht der Besuch des Gymnasiums im Zusammenhang mit einer Zunahme der Intelligenz der
Schülerinnen und Schüler?
Karin Guill1, Oliver Lüdtke2, Olaf Köller1
1
IPN Kiel, 2IPN Kiel und Zentrum für internationale Bildungsvergleichsstudie
Schulen sind unterschiedlich effektiv darin, Lesen, Mathematik oder Naturwissenschaften zu vermitteln – darin ist die
Schuleffektivitätsforschung sich weitgehend einig (Reynolds et al., 2014). Nicht abschließend geklärt ist jedoch, ob die
Unterschiede in der Schulqualität groß genug sind, um auch die kognitiven Grundfähigkeiten der Schülerinnen und Schüler
differenziell zu beeinflussen. Gegliederte Schulsysteme wie in Deutschlang bieten gute Voraussetzungen zur Untersuchung
dieser Fragestellung. Dabei wird aufgrund von Kompositions- und Institutionseffekten in der Regel von einem Vorteil des
Gymnasialbesuchs gegenüber dem Besuch anderer Schulformen ausgegangen (Maaz, Trautwein, Lüdtke & Baumert, 2008).
Kompositionseffekte meinen die hinsichtlich leistungsbezogener und sozialer Merkmale positive selegierte Schülerschaft am
Gymnasium, die eine anspruchsvolle und damit förderliche Interaktion der Schülerin und Schüler ermöglicht. Institutionseffekte
umfassen z.B. die curricular höheren Anforderungen am Gymnasium, die fachlich und fachdidaktisch besser qualifizierten
Lehrkräfte und den infolgedessen kognitiv stärker aktivierenden Unterricht. Aktuelle Forschungsarbeiten belegen einen positiven
Effekt des Besuchs des Gymnasiums im Vergleich zu nicht-gymnasialen Schulformen auf die Intelligenztestleistung (Becker,
Lüdtke, Trautwein, Köller & Baumert, 2012) und sollen hier mit einem umfassenderen Intelligenzmaß, in einer größeren und
heterogeneren Stichprobe und unter Einbeziehung einer weiteren Schulform, nämlich der Integrierten Gesamtschule, als
Vergleichsgruppe fortgeführt werden. Im Fokus stehen die folgenden beiden Forschungsfragen:
- Weisen Schülerinnen und Schüler nach vierjährigem Gymnasialbesuch höhere Intelligenztestwerte auf als vergleichbare
Schülerinnen und Schüler der Haupt- und Realschule?
- Weisen Schülerinnen und Schüler nach vierjährigem Gymnasialbesuch höhere Intelligenztestwerte auf als vergleichbare
Schülerinnen und Schüler der Integrierten Gesamtschule?
Für die Analysen wurden Daten der Hamburger Längsschnitt- und Schulleistungsstudie LAU (Aspekte der Lernausgangslage
und Lernentwicklung; Behörde für Schule und Berufsbildung, 2011) genutzt. Hier wurde am Beginn von Jahrgangsstufe 5 und
von Jahrgangsstufe 9 der CFT 20 (Cattell, 1960; Weiß, 1987), ein Maß fluider Intelligenz, von den Schülerinnen und Schülern
bearbeitet. Es konnte eine längsschnittliche Stichprobe von _N_ = 8,628 Schülerinnen und Schüler genutzt werden, die in dieser
Zeit konstant eine Schulform besuchten. Intelligenztest- und Schulleistungstestdaten, Noten und Angaben zum sozialen
Hintergrund zum ersten Messzeitpunkt am Beginn der Sekundarschulzeit wurden genutzt, um mittels _propensity score
matching_ (Ho, Imai, King & Stuart, 2007) vergleichbare Gruppen von Schülerinnen und Schülern zu bilden, die einerseits das
Gymnasium und andererseits entweder die Haupt- und Realschule oder die Integrierte Gesamtschule besuchten. Fehlende Werte
wurden zuvor durch multiple Imputation ersetzt. Zur Überprüfung der Stabilität der Befunde wurden verschiedene MatchingAlgorithmen (1:1 und 1:_k nearest neighbor matching, full matching_) verwendet. Der Effekt des Gymnasialbesuchs auf die
Intelligenztestleistung am Beginn der neunten Jahrgangsstufe wurde innerhalb der gematchten Stichproben mittels linearer
Regressionsanalysen unter nochmaliger Kontrolle aller Kovariaten aus dem Matching-Verfahren (_double robust check_; Ho et
al, 2007) bestimmt.
Insgesamt konnte für alle Gruppenvergleiche und alle verwendeten Matching-Algorithmen eine gute Ausbalancierung der
Stichproben erreicht werden. Nach vierjährigem Besuch des Gymnasiums wiesen die Schülerinnen und Schüler höhere
Intelligenztestwerte auf als eine vergleichbare Stichprobe an der Haupt- und Realschule. Die Effektstärke betrug konsistent über
die verschiedenen Matching-Algorithmen hinweg _d_ = 0.40. Die Intelligenztestwerte der Gymnasiastinnen und Gymnasiasten
fielen auch höher als die der vergleichbaren Stichprobe an der Integrierten Gesamtschule aus, wobei die Effektstärke in
Abhängigkeit vom Matching-Algorithmus zwischen _d_ = 0.17 und _d_ = 0.28 variierte. Die Ergebnisse unterstreichen die
Bedeutung einer kognitiv stimulierenden Lernumgebung für die Entwicklung der Intelligenz von Jugendlichen.
Kovariatenselektion in nicht-randomisierten Studien mit unreliablen Kovariaten
Marie-Ann Sengewald1, Steffi Pohl2
1
Friedrich-Schiller-Universität Jena, 2Freie Universität Berlin
Häufig ist man in den Bildungswissenschaften daran interessiert den kausalen Effekt einer Maßnahme zu untersuchen, kann
jedoch aufgrund ethischer oder praktischer Gründe kein randomisiertes Experiment durchführen. In nicht-randomisierten Studien
liefert die Mittelwertsdifferenz auf der abhängigen Variable zwischen einer Behandlungs- und einer Kontrollgruppe im
Allgemeinen eine verfälschte Schätzung des durchschnittlichen, kausalen Behandlungseffektes. Für die Reduktion des
Selektionsbias werden in der Regel Kovariaten erhoben und adjustierte Behandlungseffekte in einer Kovarianzanalyse
(ANCOVA) oder mit Propensity-Score Methoden geschätzt. Ob damit der kausale Effekt unverfälscht geschätzt werden kann,
hängt von der Wahl der Kovariaten und deren Modellierung ab. Häufig wird dabei vernachlässigt, dass Kovariaten
messfehlerbehaftet sein können. Bisherige Untersuchungen zeigen, dass messfehlerbereinigte latente Kovariaten mehr
Selektionsbias reduzieren können als manifeste Kovariaten. Dies ist dann der Fall, wenn die latenten Kovariaten relevant für die
Adjustierung sind. Allerdings ist die Modellierung latenter Kovariaten aufgrund von Zeitbegrenzung in der Erhebung oder
Sekundär-Datenanalysen nicht immer möglich. In den bisherigen Forschungsarbeiten zum Einfluss von Messfehlern in
Kovariaten auf die Schätzung kausaler Effekte liegt der Fokus auf den unreliablen Kovariaten selbst. Es gibt jedoch Hinweise
darauf, dass zusätzliche, korrelierte Kovariaten für die Unreliabilität relevanter Kovariaten kompensieren können.
In einer Simulationsstudie evaluierten wir für dieses Setting den Einfluss einer zusätzlichen Kovariate auf die Schätzung des
durchschnittlichen kausalen Behandlungseffektes, wenn eine relevante Kovariate nur als messfehlerbehaftet Variable vorliegt. In
der Simulation haben wir die Korrelationsstruktur aller Variablen im Modell (Kovariaten, Behandlungsgruppenvariable, abhängige
Variable) sowie die Reliabilität der relevanten Kovariate systematisch variiert. Die generierten Daten wurden mit _EffectLiteR_
(Mayer, 2015) analysiert, welches die Berücksichtigung latenter Kovariaten erlaubt. Dabei wurde die relevante Kovariate nur als
manifeste messfehlerbehaftete Kovariate in die Analyse aufgenommen.
Es zeigen sich mehrere Bedingungen in denen die Effektschätzung durch die zusätzliche Kovariate verbessert wird; in einigen
Bedingen kann diese jedoch die Effektschätzung auch verschlechtern. Die zusätzliche Kovariate verbessert die Schätzung
bereits, wenn diese nur mit der relevanten Kovariate, nicht jedoch mit der Behandllungsvariable oder der abhängigen Variable
zusammenhängt. Bei einer Korrelation von 0.4 zwischen der relevanten und zusätzlichen Kovariate, werden bereits bis zu 15%
der Verfälschung, die aufgrund der Messfehlerbehaftetheit der relevanten Kovariate entsteht, reduziert. Die Reduktion der
Verfälschung erhöht sich substantiell, wenn die zusätzliche Kovariate zudem die Behandlung oder die abhängige Variable
determiniert. Die zusätzliche Kovariate führt zu einer Verstärkung der Verfälschung, wenn diese unkorreliert ist mit der relevanten
Kovariate, jedoch mit der Behandlungsvariable zusammenhängt.
Auch wenn zusätzliche Kovariaten den verfälschenden Einfluss von Messfehlern in relevanten Kovariaten verringern können,
können diese die Verfälschung nicht vollständig kompensieren. Es lohnt sich also dennoch zu überlegen relevante,
möglicherweise messfehlerbehaftete Kovariaten mit mehreren Indikatoren zu messen, um diese als latente Variable in die
Adjustierung aufnehmen zu können. Implikationen für die Auswahl von Kovariaten in empirischen Anwendungen mit unreliablen
Kovariaten werden diskutiert.
Ein nichtparametrischer Bootstrapping-Ansatz zur Analyse kausaler Effekte von Interventionen in
komplexen Survey Designs
Axel Mayer
Ghent University
*Theoretischer Hintergrund*
Die Analyse der differentiellen Wirksamkeit von Interventionen ist nicht nur im Bildungskontext von zentralem Interesse. Bei
Mehrebenendesigns mit zwei oder mehr Interventionsgruppen unterscheidet man in der Regel zwischen Designs mit
randomisierter versus nicht randomisierter Zuweisung zur Intervention und zwischen Designs mit Zuweisung auf Individualebene
versus Zuweisung auf Clusterebene (Plewis & Hurry, 1998). Im vorliegenden Beitrag beschäftigen wir uns vor allem mit der
Analyse von durchschnittlichen und bedingten kausalen Effekten in Designs mit nicht randomisierter Zuweisung zur Intervention
auf Clusterebene (e.g., Mayer et al., 2014).
In solchen Designs gilt es verschiedene Herausforderungen für die kausale Effektanalyse zu berücksichtigen. Ein entscheidender
Punkt ist konfundierende Variablen auf der Individualebene und der Clusterebene zu messen und statistisch zu kontrollieren, da
ansonsten Mittelwertsunterschiede zwischen Interventionsgruppen nicht kausal interpretiert werden können (Shadish, Cook, &
Campbell, 2002). Für die Analyse durchschnittlicher und bedingter Effekte ist es wichtig die statistische Unsicherheit bei der
Schätzung von Erwartungswerten von manifesten und latenten Kovariaten zu berücksichtigen (e.g., Kröhne, 2009). Das betrifft
nicht nur die Schätzung unbedingter Erwartungswerte, sondern zum Beispiel auch die Schätzung von bedingten
Erwartungswerten von Kovariaten in der Kontrollgruppe und der Interventionsgruppe, aber auch die Schätzung von
clusterspezifischen Erwartungswerten von stochastischen Kovariaten (Lüdtke et al., 2008). Weitere praktische
Herausforderungen für die kausale Effektanalyse bestehen häufig in der Mehrebenenstruktur der Daten, den komplexen
Stichprobenziehungsdesigns und der Verletzung von Verteilungsannahmen für Residuen und/oder Random Effects.
*Fragestellung*
Der vorliegende Beitrag beschäftigt sich mit einem nichtparametrischen Bootstrapping-Ansatz zur Analyse kausaler Effekte.
Aufbauend auf dem _EffectLiteR_-Ansatz zur Analyse von bedingten und durchschnittlichen Effekten (Mayer et al., 2015), wird
dabei der Frage nachgegangen, ob ein Clusterbootstrapping-Verfahren (e.g., Davison & Hinkley, 1997) unverfälschte
Punktschätzungen und Konfidenzintervalle für kausale Effekte in komplexen Survey Designs liefert und dabei die im
theoretischen Teil genannten Herausforderungen adäquat berücksichtigen kann.
*Methode*
Zur Beantwortung der Fragestellung wurde mit simulierten Daten untersucht, wie gut die Schätzungen der kausalen Effekte mit
dem Bootstrapping-Ansatz sind. Dazu wurden zunächst 1000 möglichst realistische Datensätze generiert, die aus einer quasiexperimentellen Studie mit Vortest Leseleistung, Intervention auf Klassenebene (z.B. neue Lehrmethode versus alte
Lehrmethode) und Nachtest Leseleistung stammen könnten. Für jeden der 1000 simulierten Datensätze wurden wiederum jeweils
200 Bootstrapping-Samples mit einem Clusterbootstrapping-Verfahren gezogen. Beim Clusterbootstrapping-Verfahren werden
zunächst Level 2 Einheiten (Klassen) zufällig mit Zurücklegen gezogen und dann werden innerhalb jeder Klasse Level 1 Einheiten
(Schülerinnen und Schüler) zufällig mit (oder ohne) Zurücklegen gezogen. In komplexen Survey Designs ist es besonders wichtig,
dass das ursprüngliche Design bei der Erstellung der Bootstrap-Samples möglichst genau implementiert wird. Für jedes
Bootstrap-Sample wurden dann mittels des _EffectLiteR_ Modells die interessierenden kausalen Effekte berechnet,
abgespeichert und mit den wahren Effekten verglichen.
*Ergebnisse*
In einer solchen Studie können verschiedene kausale Effekte von Interesse sein. Im vorliegenden Beispiel wurden sowohl der
durchschnittliche Effekt der Intervention berechnet, als auch der bedingte Effekt für diejeningen, die die neue Lehrmethode
gewählt haben, und bedingte Effekte in Abhängigkeit von der mittleren klassenspezifischen Ausgangsleseleistung. Es konnte
gezeigt werden, dass man mit dem neuen Verfahren unverfälschte Punktschätzungen und Konfindenzintervalle erhält, wenn das
Sampling-Design adäquat berücksichtigt wird und dass man verfälschte Schätzungen bekommt, wenn das Mehrebenendesign
nicht entsprechend berücksichtigt wird.
Zum Abschluss werden Vor- und Nachteile des Clusterbootstrapping-Verfahrens im Vergleich zu anderen Alternativen wie
hierarchischen linearen Modellen, Mehrebenen-Strukturgleichungsmodelle und Korrekturen für Standardfehler von traditionellen
Strukturgleichungsmodellen diskutiert.
Schätzung von _Complier-Average-Causal-Effects_ in Mehrebenen-Interventionsstudien: Ein Beispiel aus
der Motivationsforschung
Benjamin Nagengast1, Brigitte Brisson1, Holger Brandt1, Chris S. Hulleman2, Hanna Gaspard1, Isabelle Häfner1,
Augustin Kelava1, Ulrich Trautwein1
1
Universität Tübingen, 2University of Virginia
Bei der Auswertung von randomisierten Interventionsstudien wird häufig nur der _Intent-To-Treat_ Effekt berichtet, der
Unterschiede in der Bearbeitungsgüte (der _Treatment Fidelity_ oder _Compliance_) vernachlässigt. Für ein besseres
Verständnis von Wirkfaktoren sind jedoch auch Effektmaße interessant, die die Bearbeitungsgüte der Intervention
berücksichtigen. Ein solches Maß ist der _Complier-Average-Causal-Effect_ (CACE) - der Effekt der Intervention für Personen,
die den Instruktionen tatsächlich gefolgt sind. Praktisch müssen zur Schätzung des CACE weitere Annahmen getroffen werden
(siehe z.B. Angrist et al., 1996): In der Regel wird davon ausgegangen, dass es keine Personen gibt, die die Intervention
unabhängig von ihrer Zuweisung zur Behandlungs- oder Kontrollgruppe immer bekommen würden (_Monotonicity Assumption_)
und dass die Intervention auf Personen, die nicht den Anweisungen folgen, keinen Effekt hat (_Exclusion Restriction_).
Für Interventionsstudien im Klassenkontext weisen die Modelle zur Schätzung des CACE jedoch einige Beschränkungen auf.
Die Annahme der _Exclusion Restriction_ ist häufig unrealistisch: Es ist wahrscheinlich, dass Schülerinnen und Schüler sich nicht
vollständig der Intervention entziehen können, wenn diese im Klassenkontext durchgeführt wird, wohl aber einzelne Elemente
der Intervention verweigert werden können. Außerdem werden die Mehrebenenstruktur und ihre Effekte auf die Bearbeitungsgüte
nicht berücksichtigt. Dies kann zu Verzerrungen bei der Schätzung von Varianzkomponenten und Standardfehlern der
geschätzten Effekte führen. Neuere methodische Entwicklungen erlauben es durch Verwendung von Kovariaten die Exclusion
Restriction zu liberalisieren und damit CACEs und _Non-Complier-Average-Causal-Effects_ (NCACEs) zu identifizieren (Jo,
2002; Jo et al., 2008). Auch die Mehrebenenstruktur kann explizit berücksichtigt werden. Im Beitrag werden diese Modelle
vorgestellt und anhand eines Beispiels illustriert.
In der Studie „Motivationsförderung in Mathematikunterricht“ (MoMa, Gaspard et al., 2015) sollte die Effektivität von zwei
Interventionen zur Förderungen der wahrgenommenen Nützlichkeit von Mathematik überprüft werden. Dazu wurden 1978
Schülerinnen und Schüler der neunten Klasse von 25 Gymnasien in Baden-Württemberg zufällig auf Klassenebene zwei
Interventions- bzw. einer Kontrollbedingung zugewiesen. In den Interventionsbedingungen erhielten die Schülerinnen und
Schüler zunächst einen psychoedukativen Vortrag zur Bedeutung der Mathematik für verschiedene Studienfächer und zu
Erkenntnissen der Motivationsforschung. Anschließend verfassten die Schüler entweder einen kurzen Essay über die Bedeutung
der Mathematik für ihr eigenes Leben (Textbedingung) oder bearbeiteten Zitate von Studierenden und anderen Personen über
die Bedeutung von Mathematik (Zitatebedingung). Zur Bestimmung der Bearbeitungsgüte wurde die Qualität der Antworten der
Schülerinnen und Schüler auf vier Dimensionen bewertet (Vollständigkeit, Argumentation für Nützlichkeit der Mathematik,
persönlicher Bezug und innovative Argumentation) und in einen gemeinsamen Index verrechnet. Eine dichotomisierte Version
dieses Index diente in den CACE-Modellen als Indikator für die Bearbeitungsgüte der Intervention.
Zur Analyse wurden CACE-Modelle für randomisierte Designs mit Gruppenzuweisung auf der Klassenebene (Jo et al., 2008) als
bayesianische Mehrebenen-Mischverteilungsmodelle in _OpenBugs_ implementiert. Damit konnten CACEs und NCACEs für die
Nützlichkeitswahrnehmungen, den intrinsischen Wert und das akademische Fähigkeitsselbstkonzept jeweils in Mathematik
geschätzt werden. Die abhängigen Variablen waren jeweils an zwei Zeitpunkten nach der Intervention (6 Wochen, _T2_, bzw. 5
Monate, _T3_) erhoben worden. Zur Identifikation wurden zahlreiche vor der Intervention erhobene Kovariaten auf Individualund Klassenebene berücksichtigt, die sowohl die Bearbeitungsgüte als auch die abhängigen Variablen vorhersagten.
Die Analysen ergaben positive CACEs in der Zitatebedingung: Schülerinnen und Schüler, die die Aufgaben in hoher Qualität
bearbeiteten, berichteten unter Kontrolle der Ausgangsvoraussetzungen höhere Nützlichkeitsüberzeugungen (_T2_ und _T3_)
und ein positiveres akademisches Fähigkeitsselbstkonzept (_T3_). In der Textbedingung zeigten sich keine Effekte der
Intervention bei Personen, die die Aufgaben wie von der Instruktion erfordert bearbeiteten. Allerdings gab es Hinweise auf
negative Effekte der Intervention für das akademische Selbstkonzept in Mathematik (_T3_) und den intrinsischen Wert der
Mathematik (_T2_) bei Personen, die nur eine geringe Bearbeitungsgüte zeigten. Die Ergebnisse unterstreichen die Bedeutung
der Berücksichtigung der Bearbeitungsgüte bei der Schätzung von kausalen Effekten in Interventionsstudien mit Randomisierung
auf der Klassenebene.
ID: 349
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung
Thematisches Cluster: Bildung im Sekundarbereich, Gesundheit/ Stress/ Belastung
Stichworte: Stress, Resilienzfaktoren, Sekundarschüler/-innen
Mindert Stress den Bildungserfolg bei Jugendlichen? Eine interdisziplinäre Analyse zu potentiellen
Resilienzfaktoren
Chair(s): Frances Hoferichter (Freie Universität Berlin)
Diskutant(en): Diana Raufelder (Universität Greifswald)
Die letzten Jahrzehnte wurden als „the age of stress“ tituliert und ein weiterer steiler Anstieg wird unter allen
Bevölkerungsschichten und Altersgruppen prognostiziert (Jackson, 2013). Tatsächlich beklagen mittlerweile nicht nur
Erwachsene gestresst zu sein, sondern bereits Kinder und Jugendliche verzeichnen ein erhöhtes Stresslevel. Die Gründe dafür
sind vielseitig und schließen unter anderem einen hohen Erwartungs- und Leistungsdruck (Rice & Van Arsdale, 2010; Kaplan,
Liu, & Kaplan, 2005), einen vollen Stundenplan und/oder stressvolle Lebensumstände mit ein (Brown, Nobiling, Teufel, & Birch,
2011; Schraml, Perski, Grossi, & Simonsson-Sarnecki, 2011).
Ein dauerhaft erhöhtes Stresslevel kann zu physischen und psychologischen Beeinträchtigungen wie Kopfschmerzen,
Bauchschmerzen (Alfven, Östberg, & Hjern, 2008) als auch zu einem erhöhten Alkohol- und Tabakkonsum führen (Ng & Jeffery,
2003). Dabei sind Depression, Angststörungen und kardiovaskuläre Erkrankungen keine Seltenheit bei Menschen, die an Stress
erkranken (Wang et al., 2008).
Um diesem prognostizierten Trend insbesondere bei Schülern/-innen entgegenzuwirken, ist es notwendig, Resilienzfaktoren zu
identifizieren, welche den Abbau von Stress unterstützen und der Entstehung von Stress präventiv entgegenwirken. Das
interdisziplinäre Symposium hat sich dieser Aufgabe angenommen und untersucht aus psychologischer,
erziehungswissenschaftlicher und neurowissenschaftlicher Perspektive Resilienzfaktoren bei Adoleszenten. Um sich der
Fragestellung zu nähern, wurden verschiedene Methoden angewandt, z.B. quantitative Analysen von Querschnitts- und
Längsschnittsdaten als auch bildgebende Verfahren im fMRT.
Der erste Beitrag des Symposiums widmet sich dem Zusammenhang von Stresserleben, Selbstbestimmung und
Schulengagement bei jugendlichen Schüler/-innen, wobei Autonomie, Kompetenz und soziale Eingebundenheit in Anlehnung an
die Selbstbestimmungstheorie (Deci & Ryan, 1990) als mögliche Mediatoren im Zusammenspiel von Stresserleben und
Schulengagement getestet wurden. Im zweiten Beitrag wird der Einfluss von Stress auf die sozio-motivationale Lehrer-Schüler
Beziehung sowie auf die schulische Leistung adoleszenter Schüler-/innen im Verlauf von zwei Schuljahren thematisiert. Der dritte
Beitrag beschäftigt sich mit dem neuronalen Stresserleben von Jugendlichen unter Berücksichtigung von so genannten
Respondern und Non-Respondern, also denjenigen Schüler-/innen, die auf einen Stressor im bildgebenen Verfahren einer fMRT
Studie sichtlich reagieren oder nicht reagieren. Im abschließenden Beitrag des Symposiums wird der Frage nachgegangen,
welche Rolle sozio-motivationale schulische Beziehungen für das Wechselspiel von Stress, Neurotizismus und Prüfungsangst
bei Jugendlichen spielen, mit dem Ziel, gestresste und neurotizistische Schüler-/innen beim Abbau von Prüfungsangst zu
unterstützen. Die gewonnenen Einsichten der unterschiedlichen Studien werden im Symposium diskutiert, wobei mögliche
Implikationen und Präventionsansätze für gestresste Schüler und Schülerinnen im Fokus stehen.
Beiträge des Symposiums
Das Zusammenspiel von wahrgenommenem Stress, Selbstbestimmung und Schulengagement in der
Adoleszenz
Alexander Lätsch
Universität Greifswald
Theoretischer Bezugsrahmen
Das 21. Jahrhundert und insbesondere die westlichen Wissens- und Industriegesellschaften sind durch zunehmenden Stress in
vielen Bereichen geprägt. So verwundert es auch nicht, dass bereits Kinder und Jugendliche immer häufiger erhöhte Stresslevel
berichten und darunter leiden (Beyer & Lohaus, 2006; Lohaus, Domsch, & Fridrici, 2007; Murberg & Bru, 2007; Ravens-Sieberer,
Thomas, & Erhart, 2003). Einer Studie des Deutschen Kinderschutzbundes (2012) zufolge, berichtet ein Drittel aller
Grundschüler/-innen hohes – teil chronisches - Stresserleben in Verbindung mit der Schule. Dieses Stresserleben nimmt dann
im Zuge der Adoleszenz mit den wachsenden schulischen Anforderungen, die an den Einzelnen gestellt werden, aber auch in
Verbindung mit den internalen und externalen Veränderungen, mit denen sich der Jugendliche konfrontiert sieht, zu. Dem
Stressmodell von Lazarus zufolge entsteht Stress in einem dynamischen Prozess als Zusammenspiel zwischen verschiedenen
Umwelt-, situativen und personellen Faktoren (Lazarus & Folkman, 1984). Bislang gibt es allerdings kaum Studien, die dieses
Zusammenspiel im Schulkontext Jugendlicher untersucht haben. Dieses Forschungsdesiderat aufgreifend, hatte die vorliegende
Studie zum Ziel, das Zusammenspiel zwischen Stresserleben und dem schulischen Engagement Jugendlicher zu untersuchen.
Basierend auf der Selbstbestimmungstheorie von Deci und Ryan (1985) wurde dabei das Selbstbestimmungerleben in den drei
Grundbedürfnissen Autonomie, Kompetenz und soziales Eingebundensein als mögliche Mediatoren im Sinne möglicher
Ansatzpunkte für Prävention- und Interventionsmaßnahmen getestet.
Fragestellung
Folgende Hypothese galt es im Detail zu prüfen:
(1) Wahrgenommener Stress, Selbstbestimmung und Schulengagement stehen insofern in Zusammenhang, dass erlebter Stress
und Schulengagement, sowie Stress und Selbstbestimmung negativ miteinander korrelieren – während Selbstbestimmung und
Schulengagement positiv korrelieren.
Darüber hinaus wird angenommen, dass (2) der Zusammenhang zwischen wahrgenommenem Stress und (behavioralem und
emotionalem) Schulengagement durch die Selbstbestimmung (Autonomie, Kompetenz und soziale Eingebundenheit) mediiert
wird.
Methode
Die empirische Grundlage der Studie bildet eine Fragebogenstudie an Sekundarschulen in Brandenburg mit 1088 Schülern/innen der 7ten und 8ten Klasse (Mage = 13.70; SD = 0.53; 54% Mädchen). Nach Einholen der Genehmigung des
brandenburgischen Ministeriums für Bildung, Jugend und Sport, der Schulen, Eltern und teilnehmenden Schüler/-innen wurden
diese 2011 zu ihrem Stresserleben, Schulengagement und ihrer Selbstbestimmung befragt. Neben der bivariaten
Korrelationsanalyse zur Prüfung des postulierten Zusammenhangs der hier verwendeten Variablen (Stress, Schulengagement,
Selbstbestimmungserleben), wurden – zur Überprüfung der Mediation – latente Strukturgleichungsmodelle in Mplus konzipiert,
wobei die genestete Struktur der Daten (1088 Schüler/-innen in 71 Schulklassen) berücksichtigt wurde.
Ergebnisse
Die Ergebnisse dieser Untersuchung konnten Hypothese I bestätigen, insofern ein signifikanter Zusammenhang zwischen
Stresserleben, Selbstbestimmung und Schulengagement bei den Schülern/-innen der Stichprobe eruiert werden konnte. Wie
angenommen stehen Stress und Schulengagement dabei in negativem Zusammenhang, was bisherige Studienbefunde ergänzt,
die zeigen konnten, dass erlebter Stress mit passivem Verhalten (gelangweilt sein, schnelles Aufgeben) und negativen
Emotionen, wie bspw. Frust, in Zusammenhang steht (vgl. Skinner & Belmont, 1993). Darüber hinaus konnte gezeigt werden,
dass erlebter Stress negativ mit der Selbstbestimmung der Schüler/-innen in Zusammenhang steht und vice versa. Im Gegensatz
dazu konnte ein positiver Zusammenhang zwischen den Subskalen der Selbstbestimmung (Autonomie, Fähigkeiten und die
Beziehung zu anderen) sowie emotionalem und behavioralem Schulengagement konstatiert werden, was im Einklang mit
bisherigen Studien (vgl. Reeve, Jang, Carrell, Jeon, & Barch, 2004; Ryan & Deci, 2009) steht. Auch Hypothese II konnte bestätigt
werden, insofern die drei Aspekte des Selbstbestimmungserlebens den negativen Zusammenhang zwischen Stress und
behavioralen und emotionalen Schulengagement vollständig mediieren. Demnach kann davon ausgegangen werden, dass das
Selbstbestimmungserleben der Schüler/-innen ein guter Ausgangspunkt für mögliche Intervention- und Präventionsansätze
darstellt, was im Rahmen des Symposiums in Hinblick auf schulpraktische Implikationen diskutiert werden soll.
Das reziproke Zusammenspiel von Stresserleben, Lehrer-Schüler-Beziehung und schulischer Leistung
im Verlauf von früher zu mittlerer Adoleszenz
Luisa Grützmacher1, Diana Raufelder2
1
Universität Potsdam, 2Universität Greifswald
Theoretischer Bezugsrahmen
In der Adoleszenz und im Zuge der wachsenden schulischen Anforderungen nimmt das Stresserleben der Jugendlichen zu.
Unter psychologischem Stress versteht man dem relationalen Stresskonzept von Lazarus zufolge „eine Beziehung mit der
Umwelt, die vom Individuum im Hinblick auf sein Wohlergehen als bedeutsam bewertet wird, aber zugleich Anforderungen an
das Individuum stellt, die dessen Bewältigungsmöglichkeiten beanspruchen oder überfordern“ (Lazarus & Folkman 1986, S. 63).
Speziell auf die Schule bezogen berichten SchülerInnen häufig, dass sie den Leistungsdruck, schlechte schulische Leistungen,
Prüfungen, die ständige Leistungsbewertung, das Gefühl des Gehetztseins, Schwierigkeiten beim Umgang mit Lehrkräften und
Peers als stressreich empfinden (Kouzma & Kennedy 2004; Jacobs & Strittmatter 1979; Rieder 1990; Pekrun & Helmke 1991;
Ulich, 2001; Seiffge-Krenke 2006; Seiffge-Krenke 2008). Darüber hinaus wurde belegt, dass das Stresserleben von Jugendlichen
in negativem Zusammenhang mit emotionalen und behavioralen Schulengagement steht (Raufelder et al. 2014), was bedeutet,
je mehr Stress Jugendliche empfinden, desto negativer sind die Einstellungen zur Schule und desto geringer ist die Beteiligung
an schulischen, sozialen und außerschulischen Aktivitäten, welche eine Voraussetzung für das Erreichen positiver schulischer
Leistung darstellt (Fredricks 2004; Raufelder et al. 2014; Connell et al. 1994; Finn 1993; Skinner et al. 1990).
Die Lehrer-Schüler-Beziehung ist für Jugendliche aber nicht nur ein möglicher Stressfaktor, sondern kann auch eine wichtige
Unterstützung sowohl auf interpersonaler Ebene (Lehrer-Schüle-Verhältnis) als auch auf institutioneller Ebene (LehrerInnen als
positive Motivatoren) für den erfolgreichen Lernprozess darstellen (Pianta, Hamre, & Stuhlman 2003; Raufelder & Mohr 2011).
D.h., die Lehrer-Schüler-Beziehung stellt somit gleichzeitig eine wichtige Ressource im Stressbewältigungsprozess dar. Darüber
hinaus ist die Beziehung zwischen SchülernInnen und LehrernInnen eine bedeutende Determinante für die Lern- und
Leistungsmotivation der SchülerInnen (Becker & Luthar, 2002; Pianta, Hamre, & Stuhlman 2003; Stipek 2004) und die schulische
Leistung der Adoleszenten (Flanagan, Erath & Bierman 2008; Raufelder & Mohr 2011; Wentzel 1998). Nehmen SchülerInnen
ihre LehrerInnen als positive Motivatoren wahr, tendieren sie zu höheren Leistungen, zu höheren Lernzielen, streben nach
schulischem Erfolg und der Vermeidung von schulischem Misserfolg (Raufelder, Drury, Jagenow, Hoferichter & Bukowski 2013).
Allerdings gibt es bislang keine Studien, die explizit das reziproke Zusammenspiel von Stresserleben, Lehrer-Schüler-Beziehung
und schulischer Leistung im Verlauf von früher zu mittlerer Adoleszenz untersucht haben. Dieses Forschungsdesiderat
aufgreifend, untersucht die vorliegende Studie folgende Fragestellung:
Fragestellung
Es gibt einen längsschnittlichen Effekt zwischen...
(1) ...dem Stresserleben in der frühen Adoleszenz und dem Stresserleben, dem Lehrer-Schüler-Verhältnis, der Wahrnehmung
der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz.
(2) ...dem Lehrer-Schüler-Verhältnis in der frühen Adoleszenz und dem Stresserleben, dem Lehrer-Schüler-Verhältnis, der
Wahrnehmung der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz.
(3) ...der Wahrnehmung der Lehrers als positive Motivatoren in der frühen Adoleszenz und dem Stresserleben, dem LehrerSchüler-Verhältnis, der Wahrnehmung der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz.
(4) ...schulischer Leistung in der frühen Adoleszenz und dem Stresserleben, dem Lehrer-Schüler-Verhältnis, der Wahrnehmung
der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz.
Methode
Die vorliegende Untersuchung basiert auf den Längsschnittdaten einer Fragebogenerhebung an 23 Sekundarschulen in
Brandenburg. An der Studie nahmen 1088 SchülerInnen teil, die zum 1. Messzeitpunkt (2011) die 7te und 8te Klasse (Mage =
13.70, SD = 0.53) und zum 2. Messzeitpunkt (2013) 1.5 Jahre später die 9te Klasse (Mage = 14.86, SE = .57) besuchten. Die
aufgestellten Hypothesen wurden mittels linearem Strukturgleichungsmodell, das im Cross-Lagged-Panel-Design angelegt ist, in
Mplus 7.0 getestet.
Ergebnisse
Die Ergebnisse der Cross-Lagged-Panel-Untersuchung zeigen, dass die Hypothesen nur teilweise bestätigt werden können.
Neben den signifikanten Effekten der gleichen Variable über die Zeit, konnte ein längsschnittlicher cross-lagged Effekt von
Stresserleben auf die Wahrnehmung der LehrerInnen als positive Motivatoren eruiert werden, insofern Stress als positiver
Prädiktor der Wahrnehmung von LehrerInnen als positive Motivatoren fungiert (obwohl zum ersten Erhebungszeitpunkt kein
signifikanter Zusammenhang zwischen dem Stresserleben und der Wahrnehmung der LehrerInnen als positiven Motivatoren
konstatiert werden konnte). Es ist folglich denkbar, dass im Stressbewältigungsprozess im Laufe der Adoleszenz auf die
motivationale Unterstützung der LehrerInnen zurückgegriffen wird, was wiederum – entsprechend bisheriger Forschungsbefunde
– den Stress möglicherweise abfedert bei einer gleichzeitig motivierenden Wirkung auf die SchülerInnen, was wiederum der
schulischen Leistung zugutekommt. Die Ergebnisse zeigen zudem, dass die schulische Leistung in der frühen Adoleszenz die
Qualität des Lehrer-Schüler-Verhältnis 1,5 Jahre später voraussagt. D.h. je besser die schulische Leistung, desto besser ist das
Lehrer-Schüler-Verhältnis bzw. je schlechter die schulische Leistung, desto schlechter wird das Lehrer-Schüler-Verhältnis zwei
Jahre später erlebt. Schulpraktische Implikationen zur Minimierung des Stresserlebens und zur Steigerung der Qualität der
Lehrer-Schüler-Beziehung in der Adoleszenz mit dem Ziel die schulische Leistung zu optimieren werden im Rahmen des
Symposiums diskutiert.
Psychosozialer Leistungsstress im Jugendalter – Zusammenhänge zwischen neuronaler, hormoneller
und subjektiver Stressreaktion
Tobias Gleich, Sabrina Golde
Charité Berlin
Einleitung
Ein gelungener Umgang mit Stress stellt eine immer größere Herausforderung für die gesunde und erfolgreiche Entwicklung in
Leistungsgesellschaften dar. Stress wiederum erhöht erheblich das Risiko für spätere physische (v.a. kardio-vaskuläre
Erkrankungen) und psychische Erkrankungen (Sapolsky, 2004). Im Jugendalter ist das Gehirn besonders anfällig für negative
Effekte von psychosozialem Stress (Lupien, McEwen, Gunnar, & Heim, 2009). Veränderungen aufgrund der körperlichen und
psychischen Entwicklung in der Pubertät, gesteigerte akademische Anforderungen sowie psychosoziale Veränderungen im
Rahmen von Familie und Peers stellen typische Stressfaktoren in dieser Zeit dar.
Dem Stresshormon Cortisol kommt eine tragende Rolle in der biologischen Stressregulation zu. Aktuelle Studien zeigen, dass
sich die Cortisolantwort unter Stress bei Erwachsenen in zwei Antwortmuster gliedern lassen: Eines, bei dem Stresssituationen
von rapidem Cortisolanstieg begleitet sind (Gruppe der “Responder”) und eines, bei dem dieser Anstieg fehlt (Gruppe der “NonResponder”) (Miller, Plessow, Kirschbaum, & Stalder, 2013). Weiterhin gibt es Hinweise, dass sich diese Gruppen im Hinblick
auf ihre Stressvulnerabilität unterscheiden (z.B. Kunz-Ebrecht, Mohamed-Ali, Feldman, Kirschbaum, & Steptoe, 2003). Im Gehirn
werden insbesondere der Hippocampus und der Präfrontale Kortex (PFC) mit der Regulation von Stress in Verbindung gebracht
(Pruessner et al., 2010; Zschucke, Renneberg, Dimeo, Wüstenberg, & Ströhle, 2015).
In der hier vorgestellten Studie wurde die Interaktion zwischen psychischem Stress- und Anspannungsempfinden, Cortisol
(gemessen im Speichel) und neuronaler Aktivierung während einer stressauslösenden fMRT-Aufgabe bei Jugendlichen im
Rahmen der „Responder-“ und „Non-Responder-“ Kriterien untersucht.
Methode
Es wurden 47 Jugendliche zwischen 14 und 17 Jahren (M = 15.7 ±.59, 22 Mädchen) aus Sekundarschulen in Berlin und
Brandenburg rekrutiert. Eine adaptierte Version der „Montreal Imaging Stress Task“ (MIST) wurde verwendet, um die
Teilnehmer/Innen unterschiedlichen Intensitäten von Stress auszusetzen (Dedovic et al., 2005; Zschucke et al., 2015). Die Task
beinhaltet Mathematikaufgaben, bei denen Zeitdruck und Aufgabenschwierigkeit individuell angepasst werden, um die Leistung
niedrig zu halten. Eine fingierte Vergleichsstichprobe, sowie negatives soziales Feedback erhöhten den sozialen Druck
zusätzlich. Vor und nach der Stressinduktion wurden subjektive Stress- und Anspannungswerte erhoben und Veränderungen der
Cortisolkonzentration erfasst.
Ergebnisse
Erste Ergebnisse in der Gesamtgruppe zeigen, dass ansteigender Stress durch neuronale Aktivierungsanstiege in Bereichen des
PFC, der Inselrinde, des temporoparietalen Übergangs (TPJ) und dem Hippocampus gekennzeichnet sind. Die neuronale
Aktivität des orbitofrontalen Cortex (OFC) und des ventralen Striatums nahm hingegen unter psychosozialem Stress ab.
Sowohl bei Respondern, als auch bei Non-Respondern gab es einen Zusammenhang zwischen den neuronalen
Aktivierungszunahmen der Insula und TPJ bei Stress und subjektivem Stress- und Anspannungsempfinden. Jedoch nur bei
Respondern hing der Aktivierungsanstieg des Hippocampus unter Stress sowohl mit subjektivem Stress- und
Anspannungsempfinden, als auch mit Cortisolanstieg im Speichel zusammen.
Diskussion
Die beobachteten Aktivierungsunterschiede in PFC und Hippocampus bestätigen aktuelle Studien und zeigen zudem, dass
diesen Regionen auch bei Adoleszenten eine wichtige Rolle bei der Stressregulation zukommt. In Übereinstimmung mit der Rolle
des OFC und ventralem Striatums für die Verarbeitung von sozialer Belohnung bzw. Bestrafung zeigte sich eine verringerte
neuronale Aktivität in der erhöhten psychosozialen Stressbedingung (McClure, York, & Montague, 2004). Weiterhin bestand ein
positiver Zusammenhang zwischen subjektivem Stresserleben und neuronaler Aktivierung der Inselrinde und TPJ, Strukturen
entscheidend für soziale Wahrnehmung und Salienz (Fiske & Taylor, 2013). Dies bestätigt die Bedeutung von sozialen Faktoren
bei der Entstehung von erlebtem Stress in der Jugend auf neuronaler Ebene. Die Tatsache, dass wir nur bei Respondern eine
Verbindung zwischen Hippocampus-Aktivität und sowohl Stress- und Anspannungssempfinden, also auch Cortisolanstieg,
gefunden haben, deutet auf eine besondere physiologische und neuronale Dynamik der Stressverarbeitung in dieser Gruppe hin.
Die ambivalente Rolle sozio-motivationaler Beziehungen im Zusammenhang mit Stress, Neurotizismus
und Prüfungsangst bei Sekundarschülern/-innen
Frances Hoferichter
Freie Universität Berlin
Theoretischer Bezugsrahmen
Laut einer Studie, die 11.000 Schulkinder im Alter von 9 bis 14 Jahre befragte, fühlen sich fast ein Viertel aller Kinder regelmäßig
gestresst (LBS Kinderbarometer 2009). Einer Tagebuch-Studie zufolge, gehören schulische Stressoren wie Leistungsdruck,
Nervosität vor Tests und die Angst vor schlechten Noten zu den häufigsten Alltagsbelastungen von Kindern und Jugendlichen
(Seiffge-Krenke, 1995). In welchem Maße jedoch diese Stressoren zu einer Stressreaktion führen, hängt unter anderem auch
von Persönlichkeitsfacetten ab. Basierend auf dem trait-state model, besteht beispielsweise eine Wechselwirkung zwischen dem
Persönlichkeitsmerkmal Neurotizismus und Stress als auch Prüfungsangst (Murberg & Bru, 2007; Szabó, 2011; Spielberger,
1966). Das bedeutet, dass Schüler/-innen mit der Prädisposition ängstlich zu sein im Vergleich zu ihren Klassenkameraden/-innn
stärker an Prüfungsangst leiden und ihre Umwelt eher als stressig wahrnehmen. Nach der social connectedness theory (Twenge,
2000) dienen soziale Netzwerke als Stabilisatoren für Persönlichkeit, psychosomatische Befindlichkeiten und beugen Ängsten
vor. Bislang gibt es jedoch keine Studien, die Stress und Persönlichkeitskomponenten unter Einbeziehung von sozialen
Beziehungen in Bezug auf Prüfungsangst im Schulkontext analysiert haben.
Fragestellung
Mit dem Ziel diese Forschungslücke zu schließen, wurde in der vorliegenden Studie der Zusammenhang von Stress,
Neurotizismus, Prüfungsangst und sozio-motivationalen Beziehungen bei Sekundarschülern/-innen untersucht. Dabei wurde
angenommen, dass eine positive Schüler-Schüler-Beziehung (SSB) als auch Lehrer-Schüler Beziehung (LSB) den
Zusammenhang von Stress und Neurotizismus mit Prüfungsangst mediiert (Hypothese 1). Es wurde weiterhin angenommen,
dass Peers als positive Motivatoren (PPM) und Lehrer als positive Motivatoren (LPM) den Zusammenhang von Stress und
Neurotizismus mit Prüfungsangst mediieren (Hypothese 2). Insgesamt wurde dabei erwartet, dass die postulierten Mediatoren
Prüfungsängste insbesondere für gestresste und neurotizistische Schüler/-innen abschwächen.
Methode
Insgesamt nahmen 1.088 Sekundarschülern/-innen der siebten und achten Klasse aus Brandenburg (587 Mädchen, MAlter
=13,7; SD = 0,5; Altersspanne, 12–15 Jahre) an der Fragebogenstudie teil. Nachdem das Ministerium für Bildung, Jugend und
Sport, Schulen, Schüler/-innen und Eltern der Teilnahme an der Studie zustimmten, wurden die Schüler/-innen 2011 zu ihren
sozio-motivationalen Beziehungen, Persönlichkeit, Stress und Prüfungsangst befragt. Um die Hypothesen zu testen, wurden
latente Strukturgleichungsmodelle im Statistikprogramm Mplus konzipiert (Muthén & Muthén, 1998-2013).
Ergebnisse
Die Ergebnisse der Studie konnten Hypothese 1 teilweise bestätigen und zeigen, dass eine positive SSB den Zusammenhang
von Neurotizismus und Prüfungsangst mediiert, jedoch nicht den Zusammenhang von Stress und Prüfungsangst. Eine gute LSB
konnte hingegen nicht als Mediator im konzipierten Modell nachgewiesen werden. Des Weiteren zeigen die Ergebnisse, dass
PPM und LPM die Beziehung von sowohl Neurotizismus als auch Stress mit Prüfungsangst mediieren. Damit konnte Hypothese
2 vollständig bestätigt werden. Interessanterweise und entgegen unserer Annahme, intensivieren PPM und LPM jedoch das
Empfinden von Prüfungsangst bei neurotizistischen und gestressten Schülern/-innen. Zusammenfassend kann man sagen, dass
eine positive SSB helfen kann, Prüfungsängste abzubauen, wohingegen die motivationale Orientierung zu Peers und Lehrern
Prüfungsangst – aufgrund einer möglichen Abhängigkeitsbeziehung – verstärkt. Damit unterstreicht die Studie die ambivalente
Rolle sozio-motivationaler Beziehungen, die im Symposium eingehend diskutiert werden soll.
ID: 351
Symposium
Disziplinen-Cluster: Erziehungswissenschaft
Thematisches Cluster: Bildung im Sekundarbereich, Genderforschung, Motivation und Emotion
Stichworte: Soziale Unterstützung, Schüler-Schüler-Verhältnis, Lehrer-Schüler-Verhältnis, Prüfungsangst, Schulengagement,
Eltern
Kann soziale Unterstützung ungünstigen Bildungstendenzen entgegenwirken?
Chair(s): Olga Bakadorova (Ernst-Moritz-Arndt-Universität Greifswald)
Diskutant(en): Frances Hoferichter (Freie Universität Berlin)
Eine übergeordnete Ängstlichkeitsdisposition, die im 5-Faktoren-Modell der Persönlichkeit als Neurotizismus bekannt ist
(Chamorro-Premuzic, Ahmetoglu, & Furnham, 2008) und häufig mit erhöhter Prüfungsängstlichkeit (Hodapp et al., 2011) und
Stress (Murberg & Bru, 2007) einher geht, aber auch ein niedriges schulisches Selbstkonzept können als Determinanten
ungünstiger Bildungstendenzen betrachtet werden, insofern sie sich negativ auf schulische Lern- und Motivationsprozesse und
auch Leistung auswirken, was im schlimmsten Fall zu einem vorzeitigen Schulabbruch führen kann (Cortina, 2008; Rumberger
& Rotermund, 2012). Das ist besonders in der Adoleszenz essenziell, wenn die Heranwachsenden neben den Veränderungen
durch den Schulwechsel vielfache physische, psychische und kognitive Veränderungsprozesse bewältigen müssen. So haben
Langzeitstudien mit SchülerInnen verschiedener Altersstufen gezeigt, dass negative emotionale Zustände ihren
Prävalenzhöhepunkt in der Adoleszenz haben (Compas, Hinden, & Gerhardt, 1995; Petersen et al., 1993). Im Vergleich zu
Erwachsenen tendieren Adoleszente zu stärkeren, intensiveren und extremeren emotionalen Reaktionen (Arnett, 1999;
Buchanan, Eccles, & Becker, 1992). Diese Veränderungen führen bei vielen adoleszenten SchülerInnen zu einer Abnahme der
schulischen Motivation und Leistung sowie des Schulengagements (Harter, 1996; Wigfield, & Eccles, 2001), deren Tiefpunkt in
der neunten Klasse zu verzeichnen ist (Harter, 1996). Um dieses negative Zusammenspiel zwischen negativen
Persönlichkeitsdispositionen, niedrigem schulischen Selbstkonzept, sowie erhöhtem Stresserleben als ungünstige
Bildungstendenzen und schulischen Motivations- und Lernprozessen zu durchbrechen, wird im Rahmen dieses Symposiums
soziale Unterstützung – wie sie in positiven Beziehungen mit Mitschüler/-innen (Peers) und Lehrer/-innen, aber auch in positiven
Beziehungen mit den Eltern erlebt wird – als möglicher Ansatzpunkt für Präventions- und Interventionsstrategien untersucht und
diskutiert. Dabei ist das Symposium interdisziplinär (Erziehungswissenschaft, Psychologie und Neurowissenschaft), sowie
methodenplural (Quantitative Fragebogenstudien, qualitative Interviews und bildgebende Verfahren im fMRT) ausgerichtet: im
ersten Beitrag steht die Rolle elterlicher Unterstützung bzw. Druck im Zusammenspiel von Prüfungsangst und Schulengagement
im Fokus der statistischen Untersuchung einer großen Stichprobe (N = 1088) von Sekundarschüler/-innen aus Brandenburg. Als
zweiter Beitrag wird eine fMRT-gestützte Studie vorgestellt, in der die neuronale Verarbeitung von Freunden und Lehrern
verglichen und Zusammenhänge mit dem Selbstkonzept analysiert werden. Im dritten Beitrag wird mittels thematischer Analyse
qualitativer Interviews der Frage nachgegangen, ob Schüler/-innen mit einem hohen (N = 18) vs. niedrigen schulischen
Selbstkonzept (N = 18) soziale Unterstützung von Peers und Lehrkräften in Bezug auf Motivation und Lernverhalten
gleichermaßen erleben. Im letzten Beitrag wird anhand der Fragebogendaten einer großen Stichprobe (N = 513) von
Sekundarschüler/-innen aus Berlin untersucht, ob soziale Unterstützung in Form eines positiv erlebten Schüler-SchülerVerhältnisses und Lehrer-Schüler-Verhältnisses den Zusammenhang zwischen Neurotizismus und Prüfungsangst mediiert,
wobei mögliche Geschlechterunterschiede berücksichtigt werden. Die Ergebnisse der interdisziplinären Beiträge werden
abschließend in Hinblick auf mögliche schulpraktische Implikationen diskutiert.
Beiträge des Symposiums
Die Rolle von wahrgenommener elterlicher Unterstützung und Druck für das Zusammenspiel von
Prüfungsangst und Schulengagement: Geschlechtsspezifische Effekte bei Jugendlichen
Nicola Regner1, Tobias Ringeisen2
1
UCL Institute of Education, 2Hochschule Merseburg
Theoretischer Hintergrund: Das sozio-kontextuelle Modell zu schulischer Leistung und leistungsbezogenen Emotionen
(SoKoMoLE; Eccles, 2007; Jacobs & Eccles, 1992; Simpkins, Fredricks, & Eccles, 2012) postuliert geschlechtsspezifische Pfade
zwischen schulbezogenem Elternverhalten, Leistung und Engagement sowie leistungsbezogenen Emotionen bei Jugendlichen.
Eccles und Kollegen nehmen an, dass das geschlechtsbezogene (Rollen-)Verhalten von Mutter und Vater differenziell mit der
Prüfungsangst bei Jungen und Mädchen assoziiert ist und sich auf Mitarbeit, Engagement und Leistung in der Schule auswirkt.
Empirische Belege fehlen weitgehend, da bisherige Studien den kombinierten Einfluss von Mutter und Vater gemessen und/oder
die Facetten von Prüfungsangst nicht differenziert haben (Bögels & Phares, 2008; Brand & Klimes-Dougan, 2010).
Fragestellung: Im Einklang mit den Annahmen des SoKoMoLE wurde in der aktuellen Studie untersucht, ob
geschlechtsspezifische Pfade zwischen (hemmender und aktivierender) Prüfungsangst bei jugendlichen Schülerinnen und
Schülern und dem Schulengagement bestehen und ob dieses Zusammenspiel durch das wahrgenommene schulbezogenem
Elternverhalten (Unterstützung und Druck) mediiert wird.
Methode: Eine Schülerstichprobe der Jahrgangsstufen 7 und 8 (N = 1088; 587 Mädchen, 501 Jungen; Mage = 13.70; SD = 0.53)
füllten Fragebögen zur wahrgenommenen elterlichen Unterstützung und zum elterlichen Druck (separat für Mutter und Vater;
Reitzle, Metzke & Steinhausen, 2001), zum Schulengagement (emotionale und behaviorale Facetten; Skinner, Furrer, Marchand
&Kindermann, 2008), sowie zur hemmenden und aktivierenden Prüfungsangst (Petermann & Winkel, 2007) aus. Die Schüler
stammten aus 23 Sekundarschulen (11 Oberschulen und 12 Gymnasien), die zufällig aus den insgesamt 124 Sekundarschulen
in Brandenburg ausgewählt worden waren. Auf Basis eines Multigruppenvergleichs wurden anhand von
Strukturgleichungsmodellen mögliche Geschlechtsunterschiede im Zusammenhangsmuster der Variablen untersucht.
Ergebnisse: Es zeigten sich Geschlechtsunterschiede im Zusammenspiel von Prüfungsangst, wahrgenommener elterlicher
Unterstützung und elterlichem Druck sowie schulischem Engagement. Bei Mädchen fungierte mütterlicher Druck als Mediator
zwischen hemmender Prüfungsangst und emotionalem Schulengagement, während mütterliche Unterstützung nur teilweise den
Zusammenhang zwischen aktivierender Prüfungsangst und emotionalem sowie behavorialem Schulengagement mediierte. Bei
Jungen fungierte mütterliche Unterstützung als vollständiger Mediator zwischen hemmender Prüfungsangst und behavorialem
Schulengagement, während väterliche Unterstützung partiell die Assoziation zwischen aktivierender Prüfungsangst und
emotionalem Schulengagement mediierte. Die Ergebnisse legen nahe, dass bei Mädchen das schulisches Engagement eher
vom Verhalten der Mutter abhängt, während bei Jungen beide Elternteile eine essentielle Rolle für das Zusammenwirken von
Prüfungsangst und schulischem Engagements spielen. Implikationen für die weitere Forschung zur Bedeutung von elterlichem
Verhalten für Leistung und Engagement sowie die Nutzbarmachung dieser Ergebnisse für den schulischen Kontext werden
diskutiert.
Die Bedeutung von Freunden für die Entwicklung eines kohärenten Selbstkonzepts – eine fMRT-Studie
Sabrina Golde
Charite Berlin
Einleitung
Die mittlere Adoleszenz ist einerseits eine Zeit der steigenden Autonomie und eine kritische Phase für die Bildung eines
kohärenten Selbstkonzepts (Harter, 2012) Andererseits ist es eine Phase der sozialen Re-Orientierung (Nelson, Leibenluft,
McClure, & Pine, 2005) und dabei auch der gesteigerten sozialen Abhängigkeit und Sensibilität gegenüber Peers (Peake,
Dishion, Stormshak, Moore, & Pfeifer, 2013). Um dem oft berichteten, gesteigerten Risikoverhalten und der sinkenden
akademischen Motivation in dieser Lebensphase entgegenzuwirken, ist soziale Unterstützung durch Lehrer und Freunde
entscheidend (Dahl, 2004). Ziel dieser interdisziplinären Untersuchung war es daher zu analysieren und zu vergleichen, inwiefern
sich die Relevanz von Freunden und Lehrern in dieser Zeit auch auf neuronaler Ebene zeigt. Konkret haben wir untersucht,
inwiefern neuronale Strukturen der Verarbeitung des selbstrelevanter Inhalte bei Jugendlichen auch bei der Verarbeitung von
freunden- und lehrerbezogenen Aspekten im Vordergrund stehen. Zudem hat uns interessiert, wie Unterschiede in der
Involvierung dieser neuronalen Strukturen bei der Verarbeitung von Freunden und Lehrern mit der gefühlten Einsamkeit und dem
akademischen Selbstkonzept in Verbindung stehen.
Methoden
41 Adoleszente beurteilten im Magnetresonanztomographen, ob verschiedene Persönlichkeitseigenschaften auf sie
(Selbstreferenz), ihre Freunde, Lehrer oder Politiker zutreffen. Im Anschluss wurden Zusammenhänge zwischen Unterschieden
in der Aktivierung neuronaler Strukturen der selbstreferenziellen Verarbeitung, insbesondere des ventralen medialen
Präfrontalkortex, und berichteter Einsamkeit sowie akademischen Selbstkonzept analysiert.
Ergebnisse
Selbstbeurteilungen und die Beurteilungen von Freunden wurden in stark überlappenden Regionen des Gehirns, d.h. in den
klassischen Regionen des neuronalen Selbst-Netzwerks, verarbeitet. Im Gegensatz dazu fanden wir kaum Unterschied zwischen
der neuronalen Verarbeitung von Lehrern und einer fremden Personengruppe, die der Politiker. Hohe berichtete Einsamkeit hing
negativ mit der Aktivierung dieser Strukturen bei Freunden und Lehrern zusammen. Die Aktivierung bei Freunden sagte wiederum
ein hohes akademisches Selbstkonzept vorher.
Diskussion
Die Ergebnisse unterstützen die hohe Relevanz von psychologischer Nähe zu Freunden für die Entwicklung eines stabilen
(akademischen) Selbstkonzepts in der Adoleszenz auf neuronaler Ebene. Darüber hinaus könnten die Zusammenhänge
zwischen gefühlter Einsamkeit und neuronaler Aktivierung bei Freunden und Lehrern von neurowissenschaftlicher Seite darauf
hinweisen, dass einsame Jugendliche eine größere psychologische Distanz zu ihren Freunden und Lehrern wahren und somit
weniger soziale Unterstützung erfahren.
Differences in perception of social support among students with high and low academic self-concepts
Olga Bakadorova
Ernst-Moritz-Arndt-Universität Greifswald
Theoretical Background
The transition from primary to secondary school in early adolescence, marked by physical and psychical changes (Rosenberg,
1979), is often associated with a motivational decline, academic failure or even school dropout (Ellis, Marsh, & Craven, 2005),
affecting adolescents’ development and educational chances in a long-term perspective. However, while some students
experience the transition as threatening, others take it as a challenge they successfully overcome. (Ellis et al., 2005). Self-concept
plays a vitally important role in this respect (Brinthaupt & Lipka, 2002), being not only both a condition and major outcome of
learning situations (Marsh, Craven, & MacInerney, 2005), but also contributing to long-lasting effects. Research suggests high
self-concept promotes psychological well-being (Craven & Marsh, 2008), presenting a protective factor during transitions and
adjustment (Gilman & Huebner, 2006). In school context, academic self-concept as a sub-component of self-concept, addressing
cognitive abilities in learning situations (Schöne et al., 2012), is essential for cyclical reinforcement of achievement (Marsh, 1990).
Therefore, its maintenance is vitally important for long-lasting educational outcomes.
At the same time, in adolescence both peers and teachers gain in importance (Harter, 1996), revealing a mismatch between
adolescents’ needs and school transition implications: new (academic and social) demands, larger classes, different peer groups
(Rosenberg, 1979). Peers provide attachment (Rubin, Bukowski, & Laursen, 2009), emotional comfort (Azmitia, Cooper, & Braun,
2009), and learning support (Seiffige-Krenke, 1990), positively affecting academic motivation and achievement (Birch & Ladd,
1996). Teachers’ support is in turn associated with students’ school self-concept (Skaalvik & Skaalvik, 2013), commitment to
learning (Becker & Luthar, 2002), higher achievement (Goodenow, 1993), and better school adjustment (Yueung & Leadbeater,
2010).
In sum, the literature research evidences positive effects of high (academic) self-concept on educational outcomes and indicates
positive associations between self-concept and social support, suggesting social relations present an important protective factor
for positive development in long-term perspective when put in the core of preventing strategies.
Research Questions
The current study explores the role of social relations with teachers and peers as well as their association with educational
outcomes among students with high or low academic self-concepts. The goal is to estimate the influence of these social actors
on motivational, learning and educational processes during school transition and address their impact in lifelong perspective.
Method
36 German-speaking adolescents from 23 schools in Brandenburg, determined by a prior longitudinal quantitative study (N2011
= 1088; N2013 = 845). were randomly selected for semi-structured qualitative interviews (Smith & Osborn, 2003), adressing
school process, social relations and motivation. In both high (HSSC) and low (LSSC) academic self-concept groups boys and
girls were represented (HSSC: 7 boys, 11 girls (MAge = 16.3, SD = .53); LSSC: 10 boys, 8 girls (MAge= 16.5, SD = .55)). The
interviews were analyzed by inductive thematic analysis (Braun & Clarke, 2006) with an inter-rater agreement κ ≥ .89.
Results
The results suggest peers are an important source of motivation (Wentzel, 2009) for all students, contributing to a positive social
climate (Wilson, 2004) and fulfilling emotional needs (Rubi et al., 2009). However, while high self-concept students were motivated
through comparison to others and strived for acknowledgement, low school self-concept students were motivated by support and
empowerment. Close relations with teachers provided emotional comfort for both groups, facilitating students’ motivation (Federici
& Skaalvik, 2014). However, HSSC students emphasized feeling of belonging, while LSSC students expressed the need of
fairness. While HSSC students were motivated by direct feedback including critique, LSSC students wished themselves
encouragement or positive comparison to important others. Practical implementations and their consequences for educational
context are discussed.
Profitieren neurotizistische Schüler/-innen von sozialer Unterstützung in Hinblick auf ihre
Prüfungsängstlichkeit?
Diana Raufelder1, Frances Hoferichter2
1
Ernst-Moritz-Arndt-Universität Greifswald, 2Freie Universität Berlin
Theoretischer Bezugsrahmen
Die Schule ist im besonderen Maße ein „Austragungsort“ unserer „test-oriented“ und „test-consuming“ Kultur (vgl. Zeidner, 2004).
So ist Prüfungsangst die Emotion, die unter Schülern/-innen am häufigsten genannt wird (Pekrun, 2000; Cassadya & Johnson,
2002; Elliot & McGregor, 1999; Eum & Rice, 2011). Einer Tagebuch-Studie zufolge, gehören schulische Stressoren, wie
Leistungsdruck, Nervosität vor Tests und die Angst vor schlechten Noten zu den häufigsten Alltagsbelastungen von Kindern und
Jugendlichen (Seiffge-Krenke, 1995). Die Angst vor Prüfungen ist dabei unabhängig von der Schulform unter den Schülern/innen verbreitet (vgl. Winkel, 2009). Prüfungsangst führt zu einer Abnahme des Selbstwerts und Selbstkonzepts (Pekrun, 2000),
reduziert intrinsische Motivation (Deci & Ryan, 1990), die Fähigkeit der Leistungserbringung (Cortina, 2008; Frydenberg, 2002;
Kondo, 1997) und wirkt sich negativ auf die Persönlichkeitsentwicklung und psychosomatische Gesundheit aus. Darüber hinaus
kann Prüfungsangst zu frühem Schulausschluss/-abbruch führen (Wild, Hofer, & Pekrun, 2006; Yousefi, 2012), was den weiteren
Werdegang maßgeblich beeinflussen kann. Einige Forscher/-innen haben die verschiedenen Manifestationen von Prüfungsangst
als Ausdruck einer übergeordneten Ängstlichkeitsdisposition identifiziert, die im Fünf-Faktoren-Modell der Persönlichkeit als
Neurotizismus bekannt ist (Chamorro-Premuzic, Ahmetoglu, & Furnham, 2008). Da erlebte soziale Unterstützung sowohl zur
Entwicklung einer gesunden Persönlichkeit als auch zur Minimierung von Ängsten beitragen kann (Flanagan, Erath, & Bierman,
2008; Steptoe, Wardle, Pollard, Canaan, & Davies, 1996), wurde die Rolle sozialer Beziehungen mit Peers und Lehrer/-innen im
Schulkontext als mögliche externale Ansatzpunkte für Präventions- und Interventionsmaßnahmen getestet, wobei
Geschlechtereffekte berücksichtigt wurden, da Mädchen in der Regel sowohl mehr Prüfungsangst (Chapell et al., 2005) als auch
Neurotizismus (McCrae et al., 2002) berichten.
Fragestellung
Folgende Hypothesen galt es im Detail zu überprüfen:
(I) Mädchen berichten mehr Prüfungsangst (worry und emotionality) und Neurotizismus. Darüber hinaus erleben Mädchen die
Beziehungen zu ihren Lehrer/-innen positiver als Jungen. In Bezug auf die Beziehungen zu Mitschüler/-innen wurde kein
Geschlechterunterschied erwartet.
(II) Der Zusammenhang zwischen Neurotizismus und Prüfungsangst wird durch die Qualität der Lehrer-Schüler-Beziehung (LSB)
und Schüler-Schüler-Beziehung (SSB) mediiert.
Methode
Die empirische Grundlage der Studie bildet eine Fragebogenstudie an Gymnasien in Berlin mit 513 Schülern/-innen (MAlter =
14,03, SD = ,55, Altersspanne: 13–16 Jahre; 301 Mädchen, 212 Jungen). Die Schüler/-innen wurden 2009 zu ihrer
Prüfungsangst, Persönlichkeit und ihren sozialen Beziehungen mit Peers und Lehrkräften befragt. Zur Überprüfung der
Hypothesen wurden mittels Mplus (1) ein latenter Mittelwertsvergleich durchgeführt und (2) ein Strukturgleichungsmodell
konzipiert, in dem LSB und SSB als Mediator fungieren.
Ergebnisse
Die Ergebnisse des latenten Mittelwertvergleichs bestätigen Hypothese I teilweise, da Mädchen im Vergleich zu Jungen eher
Prüfungsangst (worry und emotionality) erleben und auch eher dazu neigen, neurotizistisch zu sein.. In Bezug auf das Erleben
sozialer Beziehungen konnten hingegen keine Geschlechterunterschiede identifiziert werden. Hypothese II wurde insofern
bestätigt, dass eine positive SSB den Zusammenhang zwischen Neurotizismus und beiden Aspekten der Prüfungsangst (worry
und emotionality) mediiert, nicht aber die LSB. D.h., das Erleben von sozialer Unterstützung durch positive Peer-Beziehungen
kann dazu beitragen die Prüfungsängstlichkeit von neurotizistischen Schüler/-innen zu minimieren. Schulpraktische
Konsequenzen aus den Forschungsbefunden werden diskutiert.
ID: 354
Symposium
Disziplinen-Cluster: Psychologie
Thematisches Cluster: Gesundheit/ Stress/ Belastung, Lernen mit Computer und neuen Medien, Vorschulische Bildung
Stichworte: Schreiben, Lesen, Motorik, Kognition, Kinder
Motorik und Schriftspracherwerb in heterogenen Gruppen
Chair(s): Julia Festman (Universität Potsdam), Annegret Klassert (Universität Potsdam)
Diskutant(en): Sascha Schröder (MPIB)
Die interdisziplinäre Forschungsgruppe Heterogenität und Inklusion (FG-HI) der Universität Potsdam wurde im Oktober 2013
gegründet, um empirisch zu untersuchen, wie Kinder in heterogenen Gruppen Schriftsprache erwerben. Hierbei gilt es
insbesondere, die interdisziplinären Zusammenhänge beim Schriftspracherwerb näher zu betrachten, aber auch die förderlichen
und hindernden Faktoren zu identifizieren und Möglichkeiten der Kompensation zu erarbeiten. Methodisch breit betreibt die
Forschungsgruppe sowohl experimentelle Grundlagen- als auch Anwendungsforschung. Sie besteht aus
NachwuchswissenschaftlerInnen und bündelt die Expertise der Humanwissenschaftlichen Fakultät der Universität Potsdam in
den Disziplinen Erziehungswissenschaften, Primarstufe, Inklusionspädagogik, Linguistik, Psychologie, Sport- und
Gesundheitswissenschaften.
Ein Schwerpunkt der FG-HI liegt in der Erforschung des Zusammenhangs zwischen der motorischen Entwicklung und dem
Schreiberwerb. Die Annahme, dass der Erfolg des Schreiberwerbs auf der Aneignung basaler grob- und feinmotorischer
Komponenten beruht (Van Galen 1991), ist nicht neu. Dennoch ist über die Art und das Ausmaß des Zusammenspiels von
verschiedenen Dimensionen motorischer Fähigkeiten und grundlegender (grafomotorischer) wie auch höherer Schreibfähigkeiten
(z.B. orthografisches und phonologisches Regelwissen) wenig bekannt.
Die Beiträge des Symposiums stellen Erkenntnisse aus den einzelnen Teilprojekten der FG-HI dar, die motorische Aspekte des
Schreibens aus unterschiedlichen interdisziplinären Perspektiven und in verschiedenen Populationen untersucht haben. Getestet
wurden u.a. Kinder in sozial schwächeren Stadtteilen, Kinder mit Migrationshintergrund, und Kinder aus inklusiven Grundschulen.
Im Beitrag von Gerth und Kollegen werden Ergebnisse aus dem Projekt „Tablet vs. Papier“ (TaPir) vorgestellt. Dieses erforscht,
ausgehend von der Debatte um die zunehmende Digitalisierung in der Schule, ob die Anforderungen, auf einem Tablet oder auf
dem Papier zu schreiben, identisch sind. Im Fokus des Beitrags stehen hierbei Aspekte der motorischen Ausführung von Schülern
der 2. Klasse verglichen mit einer Gruppe von Erwachsenen.
Fließer und Kollegen präsentieren Erkenntnisse aus dem Projekt „Motorik-Balance-Schreiben“ (MoBaS), zur Frage frühe
Handschriftfähigkeiten bei Vorschulkindern mit der motorischen Entwicklung in den Teilbereichen Stützmotorik,
Bewegungsmotorik und Handgeschicklichkeit assoziiert sind.
Zwei weitere Beiträge stellen Ergebnisse aus dem Projekt „Rahmenbedingungen des Schriftspracherwerbs“ (RaSch) dar. Anhand
einer heterogenen Stichprobe von Drittklässlern (n=167) untersucht die FG-HI hier das Zusammenspiel von kognitiven,
sprachlichen, motorischen und emotionalen Fähigkeiten und dem Schriftspracherwerb. Wotschack & Klassert berichten über
einen neuen Test zur Erfassung der motorischen Komponente des Schreiberwerbs und dessen diagnostische Relevanz für
Schwierigkeiten im Schriftspracherwerb in vier Gruppen (ungestört, Lese-Rechtschreibstörung, isolierte Lesestörung oder
isolierte Rechtschreibstörung). Der Vortrag von Czapka und Kollegen beschreibt den Einfluss von kognitiver und motorischer
Belastung auf motorische Balancefähigkeiten und exekutiven Funktionen und deren Zusammenhang mit den
Rechtschreibkompentenzen der Kinder der heterogenen Stichprobe.
Beiträge des Symposiums
Tablet statt Tafel oder wie sich die Digitalisierung in den Schulen auf die Handschriftqualität auswirkt
Sabrina Gerth, Michael Fliesser, Annegret Klassert, Julia Festman
Universität Potsdam
Die Debatte um die Digitalisierung in den Schulen wird momentan ausgiebig in der Politik und der Presse geführt. Weltweit wird
daran gearbeitet, mehr neue Medien in die Klassenzimmer zu bringen: Finnland schafft die Schreibschrift ab, in den Niederlanden
sind sogenannte iPad-Schulen im Vormarsch und in Südkorea soll Papier noch vor Ablauf des Jahres aus den Klassenzimmern
verbannt werden.
Die Vorteile liegen auf der Hand. Auf Tablets können interaktiv Videos gezeigt werden, und sie bieten eine unbegrenzte Anzahl
von Quellen, die im Schulbuch möglicherweise schon veraltet sind, sobald es erscheint. Individuell abgestimmte Lern-Apps
können individualisiertes Lernen ermöglichen. Die individuelle Förderung entspricht dem Leitbild der Inklusion, bei der Schüler in
heterogenen Gruppen ganz nach ihren Anforderungen lernen. Allerdings gibt es auch Gegenstimmen, die fordern, dass Computer
erst dann zielgerichtet im Lernprozess eingesetzen werden, sobald Kinder die entwicklungsbiologische Reife dazu erlangt haben
(Lembke & Leipner, 2015).
In diesem Projekt untersuchen wir, inwieweit sich ein Unterschied zeigt, ob Kinder auf dem Papier oder einem Tablet schreiben.
Diese Fragestellung ist in doppelter Hinsicht relevant: in Bezug auf die oben beschriebenen bildungspolitischenDebattenund auf
die Evaluation einer Forschungsmethode. Mit Hilfe von Tablets untersuchen Wissenschaftler seit einigen Jahren den
Schreibprozess (Marquardt & Mai, 1994; Rosenblum et al., 2003; Tucha et al., 2008), um objektivere und dynamischere Maße
zu gewinnen als in früheren Studien, die meist die Handschriftqualität des Schreibproduktes (Berninger et al., 1992; Graham et
al., 2000), d.h. die Lesbarkeit und Konsistenz des Schriftbildes, betrachteten.
Getestet wurden Kinder der 2. Klasse (n=27, 7-8 Jahre), die sich mitten im Handschrifterwerb befinden, und Erwachsene (n=25,
18-28 Jahre) als Kontrollgruppe. Alle Aufgaben wurden einmal auf dem Tablet und auf dem Papier (aufgelegt auf ein Tablet) an
zwei Erhebungsterminen (Dauer jeweils 25-35 min) durchgeführt. Die Hälfte der Probanden begann auf dem Tablet. Es wurden
zwei Aufgabentypen gestellt: (a) graphomotorische Fertigkeiten und (b) Schreiben der Phrase “Sonne und Wellen”.
Unsere Schreibmaße gliedern sich in die Beurteilung der Handschriftqualität durch ein selbstentwickeltes Scoring (Auswertungen
gibt es bisher nur für (a), für (b) läuft das Rating noch) und die objektive Messung des Automatisierungsgrades der Handschrift
mit Hilfe der Schreibgeschwindigkeit und der Geschwindigkeitsumkehrpunkte (NIVs) auf dem Tablet (Marquardt & Mai, 1994;
Tucha et al., 2008).
Die Kinder zeigen teilweise Unterschiede zwischen den Medien (p<.02). Sie weisen schlechtere Werte im Scoring, also eine
schlechtere Handschriftqualität, auf dem Tablet als auf dem Papier auf. Hingegen zeigen die Erwachsenen keinen Unterschied
zwischen Papier und Tablet. Beide Gruppen schreiben signifikant größer auf dem Tablet als auf dem Papier (p<.001).
Die Ergebnisse der Schreibprozessmaße ergab eine schnellere Schreibgeschwindigkeit auf dem Tablet für alle Aufgaben (alle
p<.001). Beide Gruppen zeigen einen geringeren Automatisierungsgrad (mehr NIVs) auf dem Papier für einen Teil der
graphomotorischen Aufgaben, was auf eine Fokussierung auf motorische Ausführung der Schreibaufgabe hinweist. Für die
Schreibaufgabe (b) zeigten sich höhere Werte für die NIVs lediglich auf dem Tablet für die Erwachsenen (p=.0103).
Die Vergrößerung der Schrift bei beiden Gruppen und die schlechtere Handschriftqualität der Kinder auf dem Tablet werden auf
die glattere Tablet-Oberfläche zurückgeführt. Geübte Schreiber adaptieren ihre grafomotorische Ausführung/Schreibbewegung
entsprechend der Verringerung der Reibung der Schreiboberfläche durch eine Erhöhung der Schreibgeschwindigkeit und eine
Vergrößerung der Schrift (Denier van der Gon & Thuring, 1965). Ungeübte Schreiber hingegen gelingt die Adaptation nicht so
schnell. Sie schreiben daher unsauberer auf einer glatteren Oberfläche.
Daher bezweifeln wir, dass Kinder in der Lage sind, genauso gut auf einem Tablet schreiben zu lernen, wie auf dem Papier, da
die glattere Oberfläche des Tablets eine zusätzliche motorische Herausforderung für sie darstellt.
Assoziation früher Handschriftfähigkeiten mit unterschiedlichen motorischen Teilberei-chen
Michael Fliesser, Gerit Brenner, Annegret Klassert, Steffen Müller, Monique Wochatz, Sabrina Gerth, Stephan
Kopinski, Julia Festman
Universität Potsdam
Das möglichst frühe Aufdecken von Defiziten in für die Handschrift relevanten motorischen Bereichen ist in heterogenen
Schulklassen ein wichtiges Ziel, da Probleme in der motorischen Aus-führung den Erwerb höherer Schreibfähigkeiten wie
Rechtschreibung oder korrekter Satzbau er-schweren (Berninger et al. 1997). Drei potentielle Einflussbereiche sind zu
unterscheiden (entwicklungstaxonomisches Modell; Haibach et al. 2011): (1) Stützmotorik: Körperhaltung gegen die Schwerkraft
aufrechthalten, (2) Bewegungsmotorik: den Körper zielgerichtet im Raum bewegen, und (3) Handgeschicklichkeit: feine
Bewegungen ausführen, um Objekte mit der Hand zu steuern.
Erste Zusammenhänge dieser Bereiche mit Handschriftaufgaben konnten bereits nachgewiesen werden (u.a. Daly et al. 2003;
Volman et al. 2006; Flatters et al. 2014; Rosenblum et al. 2006; Hicheur et al. 2005). Bisher wurden die genannten Bereiche
allerdings noch nicht gemeinsam untersucht, so dass unklar ist, welchen Einfluss Stütz- und Bewegungsmotorik und
Handgeschicklichkeit auf die frühen Handschriftfähigkeiten haben.
Untersucht wurden 41 Vorschulkinder (13 Mädchen); Durchschnitt Alter: 5;11 Jahre (SD=0;5), Größe: 1.15m (SD=0.05) Gewicht
20kg (SD=2,5); in vier Testbereichen:
1. Frühe Handschriftfähigkeiten (Tablet): Buchstaben, Zahlen, Schlaufen um Punkte und freie Schlaufen kopieren. Gemessen
wurden die Qualität des Produktes anhand eines Fehlerscores und die Anzahl der Geschwindigkeitsänderungen (Numbers of
Inversion in Velocity, NIVs) bei der Ausführung.
2. Stützmotorik (Kraftmessplatte): Einbeinstand und mit abgehobenen Füßen so ruhig wie möglich auf einem Hocker sitzen. Bei
beiden Aufgaben wird der Center of Pressure Weg (COP in mm) über eine Messdauer von 10s gemessen.
3. Bewegungsmotorik (Kraftmessplatte/Lichtschranken): Möglichst hoch springen und zehnmal möglichst gleichmäßig durch
einen 3m langen Korridor gehen (Müller et al. 2013). Bei der ersten Aufgabe ist die Zeit ohne Bodenkontakt, also zwischen
Absprung und Landung [sec], und bei der zweiten Aufgabe die Variabilität der Ganggeschwindigkeit (Coefficient of Variation CV)
über 10 Wiederholungen [%] die Meßgröße.
4. Handgeschicklichkeit (M-ABC 2): Münzen durch einen Schlitz werfen und Perlen auf eine Schnur auffädeln, beides Aufgaben
der Movement Assessement Battery for Children (Petermann et al. 2009). Gemessen wurde die jeweils benötigte Zeit.
Aus den zusammengehörigen Aufgaben wurde für jedes Kind ein Durchschnittsrang errechnet. Die Korrelation dieser Ränge mit
den Handschriftaufgaben wurden mithilfe von Spearman Rangkorrelationen (95%-Konfidenzintervalle, 2-seitig) überprüft.
Zusätzlich wurde der Mann-Whitney U-Tests durchgeführt (Gruppentrennung beim Median) (α=0,05).
Die Handgeschicklichkeit der Kinder korreliert mit ihrer Fähigkeit, freie Schlaufen zu kopieren (ϱ=-0.418, n=40): Kinder, die beim
Münzen einwerfen und Perlen auffädeln geschickter sind, machen weniger Fehler, wenn sie freie Schlaufen kopieren.
Die Gruppe, die die Handschriftaufgabe unterdurchschnittlich erfüllte, also die Aufgabe mit mehr Geschwindigkeitsumkehrpunkte
(NIVs) ausführte, wies signifikant schlechtere Handgeschicklich-keitswerte auf als die überdurchschnittliche Vergleichsgruppe
(p=0.006, n=39).
Zwischen Stützmotorik und frühen Handschriftfähigkeiten zeigen sich keine signifikanten Korrelationen (r=0.117, n=29). Nur für
NIVs bei Schlaufen um Punkte kann ein kleiner Einfluss (ρ=-0.231) vermutet werden.
Auch zwischen Bewegungsmotorik und frühen Handschriftfähigkeiten weisen die Korrelationen keine signifikanten
Zusammenhänge auf (r=0.066, n=38). Eine Tendenz zeigt sich bei dem Fehlerpunktescore für Zahlen (ρ=-0.253). Diese wird
durch den Gruppenvergleich gestützt: Die Gruppe mit überdurchschnittlich vielen Fehlern beim Kopieren der Zahlen weist
signifikant niedrigere Werte (p=0.028, n=41) in der Bewegungsmotorik auf.
Vor allem Handgeschicklichkeit scheint einen Einfluss auf die frühe Handschriftfähigkeit zu haben, was die signifikante Korrelation
zwischen der Anzahl der Geschwindigkeitsänderungen (NIVs) bei den freien Schlaufen und den Handgeschicklichkeitsaufgaben
(Summenscore von Münzen einwerfen und Perlen auffädeln) zeigt (r=-0.371, n=38).
Zusammenfassend bleibt festzuhalten, dass ein Einfluss der Motorik auf (frühe) Handschriftfähigkeiten vor allem über die
Handgeschicklichkeit vermittelt zu sein scheint, während andere Bereiche nur eine geringe Rolle zu spielen scheinen. Da diese
entwicklungstaxonomisch aber vor der Entwicklung der Handgeschicklichkeit ausgeprägt werden, kann ein indirekter
Zusammenhang vermutet werden.
Handschrift und Rechtschreibung in der Grundschule: Rapid Automatized Writing (RAW) - Ein neuer
Schnellschreibtest
Christiane Wotschack, Annegret Klassert
Universität Potsdam
Die Bedeutung der Automatisierung und Geschwindigkeit der Handschrift wurde in der Schulpädagogik lange zugunsten von
Ordentlichkeit und Schreibstil vernachlässigt (Medwell & Wray, 2007). Der Mangel einer automatisierten orthografischmotorischen Integration, also einer effizienten Handschrift, beeinträchtigt jedoch sowohl den schulischen Erfolg als auch das
Selbstbewusstsein negativ (vgl. Überblick von Feder 2007). Während sich für die Leistung beim Wortlesen ein Schnellbenenntest
von Buchstaben (Rapid Automatized Naming, RAN) als unabhängiger und valider Prädiktor erwiesen hat (z.B. Wolf et al. 2002),
liegt ein solcher Test für das Schreiben nicht vor. Da bei RAN die Geschwindigkeit beim Abruf der phonologischen
Buchstabeninformation gemessen wird, nicht aber die für den Abruf der graphematischen Information, wurde ein vergleichbarer
Schnellschreibtest für Buchstaben (Rapid Automatized Writing, RAW) entwickelt, der die Prozesse beim Schreiben aufgrund der
schriftlichen Modalität besser abbilden soll. Die Annahmen sind, dass RAW einen zusätzlichen Einfluss auf die Schreibleistung
hat und RAW besonders für Schüler mit Schreibproblemen prädiktiv sein sollte.
Die Stichprobe umfasst 167 Schüler (davon 84 männlich) der 3.Klasse in Berlin und Potsdam mit einem Durchschnittsalter von
9;1 Jahren.
Als Kontrollvariablen wurde u.a. ein Test zur phonologischen Bewusstheit (BAKO Untertests 2 und 4), ein Schnellbenenntest
(TEPHOBE Untertest RAN Buchstaben) sowie ein standardisierter Lesetest zum Wortverständnis (ELFE Untertest
Wortverständnis) durchgeführt. Neben einem standardisierten Schreibtest (BUEGA Untertest 5) wurde das Schreiben von
Neologismen getestet. Der Schnellschreibtest für Buchstaben (RAW) wurde als Tabletversion neu entwickelt. Aufgabe war es,
insgesamt 30 mal verschiedene, auditiv präsentierte Buchstaben so schnell wie möglich auf eine Tabletoberfläche zu schreiben.
Anhand der Ergebnisse in den standardisierten Lese- und Rechtschreibtest wurden die Schüler auf Basis des strengen, einfachen
Diskrepanzkriteriums (1,5 Standardabweichungen unter der Klassennorm laut DGKJP, 2015) verschiedenen Gruppen
zugeordnet: ungestört (n=91), Lese-Rechtschreibstörung (n=33), isolierte Lesestörung (n=12) oder isolierte Rechtschreibstörung
(n=31).
Zur Einschätzung des Einflusses der verschiedenen Maße auf die Leistung beim Schreiben von Neologismen (Anzahl
Fehlerpunkte) wurde eine lineare Regression gerechnet.
Für die Gesamtgruppe konnte das neu entwickelte Maß RAW zusätzlich zur phonologischen Bewusstheit und RAN als
bedeutsamer Prädiktor für die Schreibleistung bei Nichtwörtern identifiziert werden (b = .57, t (161) = 2.5, p = .015): Je weniger
Buchstaben pro Sekunde geschrieben wurden, desto besser war die Akkuratheit beim Schreiben von Neologismen.
Bei Betrachtung der Defizitgruppen zeigte sich, dass RAW vor allem bei Schülern mit isolierter Rechtschreibstörung einen
signifikanten Prädiktor auf die Schreibleistung darstellt (b = 1.07, t (27) = 2.4, p = .02).
Die Ergebnisse bestätigen die Annahme, dass RAW einen zusätzlichen Einfluss auf die Schreibleistung hat, insbesondere bei
Schülern mit schlechter Schreibleistung. Das Ergebnis eines negativen Zusammenhangs bei schlechten Schreibern, nämlich
dass ein schnelleres Buchstabenschreiben mit einer schlechteren Schreibleistung korreliert ist, lässt sich mit einer noch nicht
abgeschlossenen Entwicklung der Automatisierung der Handschrift erklären. Bei dieser Defizitgruppe wird das Rechtschreiben
nicht durch Schnelligkeit und Automatisierung geprägt, sondern hauptsächlich durch korrekte Schreibweise und Lesbarkeit, was
auch den pädagogischen Fokus des Schreibenlernens widerspiegelt. Insbesondere beim Schreiben von Nichtwörtern erfolgt die
Akkuratheit jedoch auf Kosten der Schnelligkeit (vgl. Tucha et al., 2008). Die Ergebnisse machen den Bedarf eines validen Tests
zur Identifikation von Schülern mit Handschriftproblemen deutlich, da eine Verbesserung der automatisierten orthografischmotorischen Integration Ressourcen für höhere, kognitive Aufgaben, wie der Textkomposition, freigibt.
Der Einfluss von motorischer und kognitiver Kontrolle auf Lesen und Schreiben
Sophia Czapka, Stephan Kopinski, Annegret Klassert, Julia Festman
Universität Potsdam
Exekutive Funktionen (EF) sind als allgemeine Kontrollmechanismen zur Steuerung von Kognition und Handlung (Miyake &
Friedman, 2012) wichtige Prädiktoren für Lesen und Schreiben (Altemeier, Abbott, & Berninger, 2008; Limbird et. al, 2014), sowie
ein Indikator für Schulreife (Blair & Razza, 2007). Trotzdem bleibt unklar, welche Relevanz einzelne EF-Komponenten für den
Schriftspracherwerb haben.
In der vorliegenden Studie werden zwei für den Schriftspracherwerb relevante EF-Komponenten untersucht: kognitive und
motorische Kontrolle. Kognitive Kontrolle bezeichnet die Fähigkeit, Ziele und zielrelevante Informationen aktiv aufrechtzuerhalten,
während irrelevante Informationen unterdrückt werden (Miyake & Friedman, 2012). Motorische Kontrolle kann u.a. zur
Unterdrückung von bestehenden irrelevanten motorischen Handlungstendenzen dienen. Diese kann sich allgemein auf den
Körper als Ganzes (z.B. statische Balance) als auch spezifisch auf einzelne motorische Teilbereiche (z.B. Finger, Sprechapparat)
beziehen.
Für den Leseprozess ist kognitive Kontrolle notwendig, um visuelle und sprachliche Informationen zu integrieren, um PhonemGraphem-Korrespondenzen effizient abzurufen und um gleichzeitig irrelevante Informationen zu unterdrücken (Altemeier et al.,
2008). Beim Schreiben wird zusätzlich allgemeine und spezifische motorische Kontrolle gebraucht, um z.B. Schriftzüge korrekt
(in Hinblick auf die Umsetzung des motorischen Programms und die räumliche Anordnung) auszuführen, und kognitive Kontrolle,
u.a. um orthographisch korrekt zu schreiben.
Ziel der vorliegenden Studie ist, den Einfluss von EF auf Lese- und Schreibleistungen zu untersuchen. Dabei soll geklärt werden,
in wie weit kognitive Kontrolle und spezifische motorische Kontrolle zusammenwirken und allgemeine motorische Kontrolle
unabhängig die Lese- und Schreibleistung bei Grundschulkindern beeinflussen.
Mit 137 Schülern (3. Klasse, Durchschnittsalter 9;1 Jahre) wurden zwei EF-Tests durchgeführt: Eine Untergruppe(n=94) hat den
BST (Bivalent Shape Task; Mueller & Esposito, 2014) und den Smiley-Stroop auf dem Tablet (T-Stroop) gelöst. Die richtige
Antwort war jeweils motorisch per Fingerdruck zu geben. Die zweite Gruppe (n=43) hat die gleichen Aufgaben erhalten, allerdings
wurde der Smiley-Stroop auf einem Bildschirm präsentiert und verbal beantwortet (V-Stroop). Als Maß für allgemeine motorische
Kontrolle dient die Auslenkung des Körperschwerpunkts (CoP-Sway), die während des V-Stroop mit einer Kraftmessplatte
gemessen wurde.
Mit den Stroop-Aufgaben (BST, V-Stroop und T-Stroop) wird Interferenzinhibition, eine wichtige Komponente der kognitiven
Kontrolle, gemessen. Sie beschreibt die Fähigkeit, irrelevante Reize, die die Zielsetzung stören, auszublenden. Als Maß für
Interferenzinhibition dient der Stroopeffekt, die Differenz in Verhaltensmaßen (Reaktionszeiten und Fehlerrate) zwischen der
inkongruenten und kongruenten Bedingung, aus denen die Aufgaben bestehen. Im Gegensatz zu der kongruenten Bedingung
stimmen Reiz und Ziel in der inkongruenten Bedingung in ihren Eigenschaften nicht überein, was dazu führt, dass mehr kognitive
Kontrolle erforderlich ist, um eine korrekte Antwort zu geben, die länger dauert und fehleranfälliger ist als in der kongruenten
Bedingung. In beiden Aufgabenstellungen spielt spezifische motorische Kontrolle eine wesentliche Rolle: jeweils in der
inkongruenten Bedingung ist die motorisch automatische Antwort zu adaptieren (Fingerdruck und verbale Antwort).
Standardisierte Tests wurden zur Erfassung der Lese- (ELFE) und Schreibleistung (BUEGA) verwendet.
Vorläufige Analysen zeigen, dass nur der T-Stroop zur Varianzaufklärung in dem Rechtschreibtest beiträgt (Beta = -0,05,
p=0,002), allerdings erklärt er nur etwa 5% der Varianz der Daten. Die Ergebnisse für den Leseverständnistest sind ähnlich. Auch
hier trägt nur der T-Stroop zur Varianzaufklärung bei (Beta = -0,04, p=0,03).
Der Einfluss der motorischen Kontrolle zeigt sich tendenziell für den Rechtschreibtest, aber nicht für das Leseverständnis. Dies
spiegelt den Entwicklungsstand der Kinder im Schriftspracherwerb wieder: Sie müssen zunächst die Grundfähigkeiten
beherrschen, wie die motorische Ausführung von Schriftzügen, wofür bewusste motorische Kontrolle notwendig ist. Erst mit
fortschreitender Automatisierung des Schreibprozesses sinkt der Bedarf an motorischer Kontrolle(Halsband & Lange, 2006).
Die Ergebnisse werden in Hinblick auf kognitive Anforderungen und dem Einfluss allgemeiner bzw. spezifischer motorischer
Kontrolle im Zusammenhang mit schulrelevanten Fähigkeiten diskutiert.
ID: 365
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie
Thematisches Cluster: Grundschulbildung, Hochbegabung, Trainings- und Evaluationsforschung
Stichworte: Enrichment Kurse, Grundschulkinder, Evaluation, Begabung
Außerschulische Förderangebote für besonders begabte Grundschulkinder: Konzeption, Evaluation,
Implementation
Chair(s): Jessika Golle (Universität Tübingen)
Diskutant(en): Miriam Vock (Universität Potsdam)
Für besonders begabte Kinder spielen die Lernumgebung und Lernmöglichkeiten eine bedeutende Rolle bei der Entfaltung ihrer
Potentiale. Verschiedene Arten der Förderung, wie Enrichment und Akzeleration, bieten die Möglichkeit, die Lerninhalte und
Lernvoraussetzungen den Bedürfnissen dieser Zielgruppe anzupassen.
Im Rahmen des extracurricularen Enrichment-Programms der Hector-Kinderakademien soll eine individuelle Förderung
besonders begabter Kinder bereits in der Grundschule ermöglicht werden. Die Kinder setzten sich entweder vertieft mit bereits
bekannten schulischen oder neuen Themen auseinander. Der inhaltliche Schwerpunkt liegt im MINT-Bereich (*M*athematik,
*I*nformatik, *N*aturwissenschaften und *T*echnik). Ziel der Hector-Kinderakademien ist es das Potential der Kinder zu stärken,
Interesse zu wecken und sie in ihrer Entwicklung ganzheitlich zu unterstützen. Das Programm wird seit 2010 in ganz BadenWürttemberg an 61 Standorten angeboten.
In diesem Symposium werden die Konzeption, Evaluation und Implementation von 4 Kursangeboten der HectorKinderakademien, die langfristig zu einem festen Angebot an allen Standorten gehören sollen, vorgestellt und diskutiert. Im
Rahmen der Kursentwicklung gab es einen engen interdisziplinären Austausch und es flossen Erkenntnisse aus der Psychologie
und Unterrichtsqualitätsforschung sowie verschiedener Fachdidaktiken (Deutsch, Sprecherziehung, Naturwissenschaft und
Technik, Mathematik und Musik) ein. Abhängige Variablen wurden gemeinsam definiert und Messinstrumente neu entwickelt
(Tests, Fragebögen, Beobachtungsbogen). Die Überprüfung der Kurseffektivität erfolgte mittels quasi-experimenteller und
experimenteller Kontrollgruppendesigns mit Messwiederholungen. Analysen wurden basierend auf Selbst- und
Fremdeinschätzungen durchgeführt.
Der im ersten Beitrag vorgestellte Kurs setzt den Fokus auf die Förderung der Präsentationsleistung im MINT Bereich. Durch
praktische Übungen und (Video)Feedback lernen die Kinder kompetent über naturwissenschaftliche Themen zu sprechen. Die
berichteten Ergebnisse legen nahe, dass sich sowohl die Präsentationsleistung als auch die Sprechangst durch den Kurs positiv
beeinflussen lassen. Im zweiten Beitrag wird ein Kurs vorgestellt, der das Wissenschaftsverständnis der Kinder und ihr Interesse
an Naturwissenschaften fördern soll. Die Kinder führen selbst Experimente durch und erleben dadurch den Zyklus der
naturwissenschaftlichen Erkenntnisgewinnung. Die Evaluationsergebnisse zeigen, dass sich der Kursbesuch positiv auf das
Verstehen des Forschungszyklus und das Nutzen geeigneter Experimentierstrategien auswirkt. Der dritte Kurs bereitet die
Schüler auf die Teilnahme an der Mathematik-Olympiade vor. Kursziel ist es das Erkennen und Nutzen mathematische Muster
und Strukturen sowie das Verbalisieren von Lösungswegen zu fördern. Die Ergebnisse der ersten Evaluation legen eine bessere
Mathematikleistung der Kinder im Anschluss an den Kurs nahe. Der vierte Kurs hat das Ziel die mathematischen und visuellräumlichen Fähigkeiten der Kinder durch gezielte Auseinandersetzung mit musikalischen Strukturen und kreativen
kompositorischen Tätigkeiten zu fördern. Vorläufige Ergebnisse deuten darauf hin, dass die Kursteilnahme musikalisches
Hörverständnis sowie mathematisches und räumliches Vorstellungsvermögen positiv beeinflusst.
Beiträge des Symposiums
Wissen präsentieren – Effekte eines Präsentationstrainings auf die Präsentationskompetenz besonders
begabter Grundschulkinder
Evelin Herbein1, Ingo Zettler2, Jessika Golle1, Maike Tibus1, Ulrich Trautwein1
1
Universität Tübingen, 2Universität Kopenhagen
*Theoretischer Hintergrund:* Kompetent kommunizieren zu können ist bedeutsam für das persönliche Wohlbefinden sowie den
schulischen und beruflichen Erfolg (vgl. Morreale & Pearson, 2008). Unter anderem sind kompetente Sprecher besser in der
Lage ihr Wissen und ihre Ideen effektiv darzustellen (Girard, Pinar, & Trapp, 2011). Eine spezielle kommunikative Interaktion, die
als Methode des Wissensaustauschs zum Beispiel im beruflichen Kontext von Bedeutung ist, ist das Präsentieren (Živković,
2014).
Bereits an Grundschulkinder wird die Aufgabe gestellt vor anderen zu präsentieren um beispielsweise über Hobbies oder
Interessen zu informieren. Um mit den Anforderungen zurechtzukommen spielen das Wissen zum Vortragsthema, verbale
Fähigkeiten (Schleppegrell, 2001) und kommunikative Fähigkeiten im Bereich des Präsentierens eine bedeutsame Rolle
(Eriksson, 2006). Letztere umfassen sowohl den Umgang mit der Vortragssituation (z.B. Lampenfieber) als auch nonverbale und
verbale Fähigkeiten (vgl. De Grez & Valcke, 2010). Obwohl die Fähigkeit kompetent zu präsentieren im Bildungsplan verankert
ist (Kultusministerkonferenz, 2005) und Kinder mit Präsentationsaufgaben in der Grundschule konfrontiert werden (Behrens &
Eriksson, 2011) spielt die Förderung von Präsentationskompetenz im Schulalltag, im Vergleich zur Lese- und
Rechtschreibförderung, eine untergeordnete Rolle (Morreale, Cooper, & Perry, 2000).
Aufgrund der Bedeutung von Präsentationskompetenz und der Wichtigkeit, Informationen effektiv weitergeben zu können, wurde
ein Präsentationstraining als Enrichment-Programm entwickelt. Abgeleitet aus bestehenden theoretischen und praktischen
Ansätzen (vgl. Morreale et al., 2000; Pabst-Weinschenk, 2005; Wagner, 2006) fokussiert es auf drei Hauptbereiche:
Lampenfieber/Sprechangst, nonverbale Kommunikation und Verständlichkeit. Ziel des Trainings war es, die
Präsentationskompetenz zu steigern und Sprechangst zu reduzieren.
*Methode:* Das Präsentationstraining ist Teil eines außerunterrichtlichen Förderprogramms für besonders begabte und
hochbegabte Grundschulkinder (Hector-Kinderakademien) in Baden-Württemberg. Es umfasst elf 90-minütige Kurseinheiten und
wurde, nach einer Vorerprobungsphase und ersten Evaluation, im Sommer 2015 mit acht Dozent/inn/en multipliziert. Um die
Durchführungstreue zu erhöhen (Graham & Harris, 2014) erhielten die Dozent/inn/en ein detailliertes Kursmanual mit Ablaufplan,
Übungen und Materialien für jede Sitzung. Zusätzlich nahmen sie an einer eintägigen Qualifizierungsveranstaltung teil. Ziel der
vorliegenden Studie war es, die Trainingseffekte auf die Präsentationskompetenz und Sprechangst zu überprüfen.
Zur Überprüfung der Trainingseffekte wurde ein randomisiertes Wartekontrollgruppen-Design mit Prä-Post-Messung verwendet.
61 Dritt- und Viertklässler (54,1% Jungen; Alter: _M_ = 9,10 _SD_ = 0,84), die für die Teilnahme an einer Hector-Kinderakademie
nominiert worden waren, wurden zufällig entweder dem Training (_N_ = 29) oder der Wartekontrollgruppe (_N_ = 32) zugeteilt.
In der Studie wurden sowohl Fragebögen also auch Videoratings eingesetzt. Diese erfassten verschiedene abhängige Maße der
Präsentationskompetenz (nonverbales Verhalten, Sprachgebrauch, Organisation der Präsentation sowie die selbsteingeschätzte
Präsentationsleistung) und Sprechangst. Die Auswertung der Daten erfolgte mittels multipler linearer Regressionen. Dabei
wurden für den Ausgangswert sowie für verbale und fluide Intelligenz kontrolliert. Alle kontinuierlichen Variablen wurden vor den
Analysen standardisiert, weshalb der Regressionskoeffizient für den Kurs als Effektstärke interpretiert werden kann. Zur
Berücksichtigung fehlender Werte wurde in Mplus das Full-Information Maximum Likelihood Schätzverfahren (_FIML_)
verwendet.
*Ergebnisse und Ausblick:* Vorläufige Analysen ergaben, dass die Kinder, die am Präsentationstraining teilgenommen hatten,
im Mittel eine signifikant höhere selbsteingeschätzte Präsentationsleistung berichteten als die Kinder der Kontrollgruppe (_B_ =
.44, _p_ < .05). Gleichzeitig berichteten sie eine signifikante Reduktion der Sprechangst, sowohl für die körperliche
Sprechangstsymptomatik (_B_ = -.47, _p_ < .05), als auch die kognitiven Sprechangstsymptome (_B_ = -.59, _p_ < .001).
Momentan werden die im Rahmen des Prä- und Posttest gefilmten Kurzpräsentationen von externen Ratern eingeschätzt. Der
dazu verwendete Beobachtungsbogens erfasst die Präsentationskompetenz auf den Ebenen nonverbales Verhalten–visuell,
nonverbales Verhalten–auditiv, Organisation der Präsentation und Sprachgebrauch.
Die vorliegenden Ergebnisse weisen auf die Effektivität des Präsentationstrainings hinsichtlich der Förderung von
Präsentationsleistung und der Reduktion von Sprechangst hin. Durch parallele Verwendung von sowohl Videoratings als auch
Fragebögen werden die Trainingseffekte aus verschiedenen Perspektiven erfasst und überprüft.
Förderung des Wissenschaftsverständnisses bei Grundschulkindern – Multiplikation eines
außerschulischen MINT-Programms
Julia Schiefer, Jessika Golle, Kerstin Oschatz, Maike Tibus, Ulrich Trautwein
Universität Tübingen
*Theoretischer Hintergrund und Fragestellung:* Die Förderung und Erfassung des Wissenschaftsverständnisses spielt an der
Schnittstelle zwischen kognitiver Psychologie und Bildungsforschung eine zentrale Rolle (OECD, 2007; Zimmerman, 2007). Um
ein angemessenes Wissenschaftsverständnis zu entwickeln, müssen Schüler/innen sowohl Einsicht in naturwissenschaftliche
Methoden und Arbeitsweisen bekommen, als auch ein Verständnis für den epistemischen Status naturwissenschaftlichen
Wissens aufbauen (Elder, 2002; Höttecke, 2001; Lederman, 2002, 2007). Im Rahmen des Enrichment-Programms der HectorKinderakademien wurde eine Intervention (Hector Core Course „Kleine Forscher“) entwickelt, der beide Bereiche bereits bei
Grundschulkindern fördern soll. Nach einer Pilotierungsphase wurde der Kurs durch zehn Kursleiter/innen multipliziert. In der
vorliegenden Studie wurde untersucht, welche Effekte der Besuch des Kurses auf die naturwissenschaftsbezogenen
(epistemischen) Überzeugungen als auch auf die Methodenkompetenzen der Kinder hat. Dabei kam u.a. ein neu entwickeltes
Instrument (SIC-Test: _Scientific Inquiry Cycle_) zum Einsatz, das das Verständnis für den zyklischen Prozess der
naturwissenschaftlichen Erkenntnisgewinnung (Forschungszyklus) erfasst (Kuhn, 2002).
*Methode:*
_Design und Stichprobe_
Die Forschungsfragen wurden im Rahmen einer Interventionsstudie mit 117 Dritt- und Viertklässlern in einem randomisierten
Prä-Posttest-Design mit Wartekontrollgruppe untersucht (71,2% Jungen, 45,8% Viertklässler/innen; Alter: _M_ = 8.89, _SD_ =
0.82). Die Intervention zur Förderung des Wissenschaftsverständnisses wurde über einen Zeitraum von zehn Wochen an zehn
Hector-Kinderakademien durch zuvor geschulte Kursleiter/innen durchgeführt.
_Kurskonzeption_
Die Intervention fokussierte sowohl die explizite Anregung wissenschaftstheoretischer Reflexion sowie die Vermittlung von
naturwissenschaftlichen Methoden und Arbeitsweisen (z.B. durch spielerische Forschungsprojekte und Experimente oder dem
Besuch eines Schülerlabors).
_Instrumente_
Das Verständnis für den Forschungszyklus wurde mit dem neu entwickelten SIC-Test erfasst (12 Items, EAP Reliabilität (t1/t2) =
.73/.76). Der SIC-Test wurde in einer Vorstudie an einer Stichprobe von 878 Dritt- und Viertklässlern (57,2% Jungen, 50,1%
Viertklässler/innen; Alter: _M_ = 8.89, _SD_ = 0.76) skaliert und validiert. Zur Erfassung der Experimentierstrategien wurden
Items aus dem Projekt _Science-P_ (Mayer, 2011; Mayer et al., 2014) eingesetzt, welche durch selbst generierte Aufgaben
ergänzt wurden (6 Items, _α_ (t1/t2) = .51/.81). Naturwissenschaftsbezogene Überzeugungen wurden mit dem Instrument von
Conley et al. (2004, in der Übersetzung von Urhahne & Hopf, 2004) erhoben (26 Items, Skalen Quelle, Sicherheit, Entwicklung
und Rechtfertigung des Wissens, _α_ (t1/t2)= .72/.70, .68/.73, .69/.66, .60/.76). Die fluide Intelligenz der Kinder wurde mit dem
BEFKI-short (Schipolowski et al., 2013; 16 Items, _α_ = .76) erfasst. Die Umsetzung des Kurskonzepts wurde durch eine genaue
Dokumentation der Manualtreue der Kursleiter/innen kontrolliert.
_Statistische Analyse_
Um die Frage nach der Effektivität des Kurses beantworten zu können, wurden multiple lineare Regressionsanalysen in Mplus
(Muthèn & Muthèn, 1998-2012) berechnet. Abhängige Variablen waren die z-standardisierten Differenzen zwischen den beiden
Messzeitpunkten. Die Regressionskoeffizienten können somit als standardisierte Differenzen zwischen den beiden Gruppen
(Effektstärken) interpretiert werden. Fehlende Werte wurden bei den Analysen durch Full-Infomation-Maximum-Likelihood(_FIML_) Verfahren (Schafer & Graham, 2002) berücksichtigt.
*Ergebnisse:* Vorläufige Ergebnisse zeigten (unter Kontrolle des jeweiligen Ausgangsniveaus, der Intelligenz sowie des
Geschlechts) signifikante Interventionseffekte auf die Entwicklung der Experimentierstrategien (_B_ = .33, _p_ < .05) sowie die
Leistungen der Kinder im SIC-Test (_B_ = .23, _p_ < .05). Bezüglich der Entwicklung der naturwissenschaftsbezogenen
Überzeugungen zeigten sich keine Unterschiede zwischen der Interventions- und der Kontrollgruppe.
Die Ergebnisse liefern Hinweise auf die Effektivität des Kurses, wobei sich insbesondere die methodischen Kompetenzen der
Kinder (Experimentierstrategien sowie das Verständnis für den Forschungszyklus) verbessert haben. Das Enrichment-Programm
soll langfristig allen 61 Hector-Kinderakademien zur Verfügung gestellt werden und so zur Qualität der Förderangebote im MINTBereich an den Akademien beitragen.
Evaluation eines Mathematiktrainings als Enrichment-Programm für begabte Grundschulkinder
Franziska Rebholz, Jessika Golle, Maike Tibus, Ulrich Trautwein
Universität Tübingen
*Theoretischer Hintergrund:* Mathematik kann verallgemeinert als „…die Wissenschaft von den Mustern“ charakterisiert werden
(Devlin, 2002, S. 3). Das Erkennen von Mustern und Strukturen in mathematischen Problemstellungen ist entscheidend für das
kompetente Lösen mathematischer Probleme (vgl. Nolte, 2013). Mathematische Kompetenz spiegelt sich in verschiedenen
mathematischen Fähigkeiten wider, wie z.B. in der Fähigkeit zur Analogienbildung (Aßmus & Förster, 2013), im räumlichen
Vorstellungsvermögen (Käpnick, 1998) oder in der Fähigkeit zum Bilden von Superzeichen (Kießwetter, 2013).
Mathematisch begabte Kinder sind häufig nicht nur kompetent im Umgang mit mathematischen Problemen, sondern sie sind
fasziniert von Mathematik, haben ein besonderes Gefühl für Zahlen und sind begeistert von geometrischen Mustern (vgl.
Kießwetter, 2013; Käpnick, 1998). Diese bereichsspezifische Begabung bei hoher allgemeiner kognitiven Leistungsfähigkeit
bietet viele Chancen für erfolgreiches mathematisches Arbeiten (Käpnick et al., 2011). Dennoch können bei der Arbeit mit diesen
Kindern Defizite beobachtet werden, die dem Entwickeln von Expertise in diesem Bereich hinderlich sein können, wie z.B. im
Bilden und Begründen von Hypothesen oder in der Verbalisierung erkannter mathematischer Zusammenhänge (Bezold, 2012;
Käpnick 1998).
Im Rahmen dieser Studie wurde ein Mathematik-Training für besonders begabte Grundschulkinder entwickelt und evaluiert. Die
Ziele des Trainings waren 1) das Erkennen und Nutzen mathematischer Muster und Strukturen zu fördern und 2) möglichen
Defiziten mathematisch begabter Kinder - beispielsweise durch das begründete Notieren eines erarbeiteten Lösungswegs in
Kleingruppen - entgegenzuwirken. Das Training orientierte sich inhaltlich an den Ansprüchen der Mathematik-Olympiade und
umfasste 10 Sitzungen a 90 Minuten. Die Mathematik-Olympiade ist ein dreistufiger Wettbewerb, der sich durch komplexe
Aufgabengestaltung und eine Bewertung des Lösungsweges besonders für begabte und hochbegabte Kinder anbietet.
*Methode:* Das Training wurde als Kurs mit dem Titel „Fit für die Mathematik-Olympiade“ an 6 Hector-Kinderakademien für
besonders begabte Grundschüler durchgeführt. Um die Effektivität des Trainings zu überprüfen, wurde ein Kontrollgruppendesign
mit Messwiederholung gewählt.
Insgesamt nahmen 201 Kinder an der Untersuchung teil, 50 Kinder in der Trainingsgruppe und 151 Kinder in der Kontrollgruppe.
Die Kontrollgruppe bestand aus Schülerinnen und Schülern, die nicht für die Hector-Kinderakademien nominiert wurden. Beide
Gruppen bestanden zu ähnlichen Teilen aus Dritt- und Viertklässlern. Die Erhebung der Daten erfolgte zu Beginn und zum Ende
eines Schulhalbjahres, dies entsprach auch dem Beginn und dem Ende des Trainings.
Zu beiden Messzeitpunkten wurden die Mathematik-Kompetenz der Kinder (DEMAT 2+/3+/4, Krajewski et al., 2004; Roick et al.,
2004; Gölitz et al., 2006), ihr mathematisches Interesse, ihr Selbstkonzept in Mathematik und die figuralen sowie kristallinen
kognitiven Fähigkeiten via BEFKI-short (Schipolowski et al., 2013) erfasst. Zusätzlich wurden die Leistungsdaten während der
Mathematik-Olympiade erhoben.
Die Daten wurden mit Hilfe multipler linearer Regressionen ausgewertet. Um die Kurseffekte für mögliche Eingangsunterschiede
zwischen den beiden Gruppen kontrollieren zu können, wurden die zum ersten Messzeitpunkt erhobenen Variablen in allen
Analysemodellen als Kovariaten berücksichtigt (Alter, Geschlecht, Mathematik-Kompetenz, kognitive Fähigkeiten,
mathematisches Interesse und Selbstkonzept).
*Ergebnisse:* Sowohl für die Dritt- als auch für die Viertklässler zeigte sich ein signifikanter Interventionseffekt auf die
Mathematik-Kompetenz, Cohen‘s _d_ = .74 (3. Klasse) bzw. _d_ = .82 (4. Klasse). Auch auf die Leistung in der MathematikOlympiade wurden unter Kontrolle des Alters, des Geschlechts sowie aller Ausgangsvariablen positive Effekte gefunden, Cohen‘s
_d_ = .76 (3. Klasse) bzw. _d_ = .84 (4. Klasse). Das Selbstkonzept in Mathematik und das Interesse an Mathematik unterschied
sich nicht signifikant in Abhängigkeit der Gruppenzugehörigkeit zum zweiten Messzeitpunkt.
*Diskussion und Ausblick:* Die Ergebnisse weisen darauf hin, dass die entwickelte Intervention wirksam ist und die
mathematischen Fähigkeiten der Kinder positiv beeinflusst werden können. Einschränkungen in der Aussagekraft der Effekte
ergeben sich durch die nicht-zufällige Gruppenzuweisung. Im nächsten Schritt wird das Trainingsprogramm überarbeitet und in
einem Warte-Kontrollgruppen-Design mit randomisierter Gruppenzuweisung evaluiert.
„Mathematik zum Anhören: Kinder komponieren mit LEGO“ – Pilotstudie eines musikalischmathematischen Kurses für besonders begabte und hochbegabte Kinder der dritten und vierten Klasse.
Jennifer Müller1, Jessica Kornmann1, Uwe Oestermeier1, Leonie Jacob1, Jessika Golle2, Peter Gerjets1
1
Leibniz-Institut für Wissensmedien, 2Universität Tübingen
*Theoretischer Hintergrund:* In Anbetracht der Relevanz der MINT-Fächer (Mathematik, Informatik, Naturwissenschaft und
Technik; Cramer & Walcher, 2010) und dem steigenden Mangel an Fachkräften in den MINT-Bereichen (Anger, Demary, Koppel,
& Plünnecke, 2013) ist die Förderung mathematischer und visuell-räumlicher Fähigkeiten bereits bei Grundschulkindern zu einer
Notwendigkeit geworden. Insbesondere die Förderung von besonders begabten und hochbegabten Kindern stellt hierbei eine
Herausforderung dar, da einseitige Förderung zu Langeweile im Unterricht und somit zu Underachievement führen kann (Rost
und Sparfeldt, 2009). Um dem vorzubeugen, wurde ein Kurskonzept entwickelt, welches musisch-kreative und mathematische
Komponente miteinander verbindet.
Das Ziel des Kurses ist die implizite Förderung mathematischer und visuell-räumlicher Fähigkeiten der Kinder durch gezielte
Auseinandersetzung mit musikalischen Strukturen und kreativen kompositorischen Tätigkeiten (vgl. Graziano, Peterson, & Shaw,
1999). Diese implizite Förderung wird durch eine strukturelle Überlappung der kognitiven Anforderungen von Mathematik und
Musik ermöglicht (vgl. Bahr & Christensen, 2000). So machten wir uns beispielsweise zu Nutze, dass in der Musik beim
Repräsentieren der Tonhöhen genauso wie in der Mathematik beim Repräsentieren von Zahlen visuell-räumliche Fähigkeiten
eine wichtige Rolle spielen oder dass musikalischen Rhythmen mathematische Teil-Ganzes-Relationen zugrunde liegen
(Toussaint, 2005). Folglich entwickelten wir Kurseinheiten, die vordergründig Kompositionstechniken wie Transposition,
Umkehrung oder Diminution vermitteln, gleichzeitig aber dazu beitragen, dass mathematisch-geometrische Fertigkeiten wie
Translation oder Spiegelung von geometrischen Figuren und Bruchrechnen herausgebildet und gefestigt werden.
Eine Besonderheit des Kurskonzeptes ist es, dass für die Komposition keine musikalischen Vorkenntnisse erforderlich sind. Um
Musik zu komponieren, bauen die Kinder Muster aus Lego-Steinen, die von einer Software nach Positionierung auf einem
Multitouch-Tisch in Töne umgewandelt werden. Im Rahmen des Kurses lernen die Kinder aus eigener Erfahrung, welche Muster
in Verbindung mit der Position auf dem Multitouch-Tisch ein angenehmes Klangerlebnis erzeugen und wie sie neuerlernte
Kompositionstechniken kreativ umsetzen können. Durch den Einsatz von Lego-Steinen und durch das Hantieren mit den Mustern
wird das visuell-räumliche Vorstellungsvermögen angeregt (Caldera, Culp, O’Brien, Truglio, Alvarez, & Huston, 1999) und
dadurch der Zugang zu den abstrakt-strukturellen Komponenten der Mathematik erleichtert.
*Methode:* In einer Pilotstudie wurde das Kurskonzept an zwei Hector-Kinderakademien im Sommersemester 2015 in zehn
Kurseinheiten je 90 Minuten umgesetzt. Im ersten Evaluationsschritt wurde untersucht, ob direkter und indirekter Wissenstransfer
in den Bereichen Mathematik und Musik stattfand. Dazu absolvierten 16 Dritt- und Viertklässler am Anfang und am Ende des
Kurses eine Testbatterie bestehend aus Aufgaben zu Mathematik und räumlichen Vorstellungsvermögen (z.B. DEMAT 4+),
Musiktheorie und einem Musical Aptitude Test (MAT). Die Daten wurden mittels einfaktorieller Varianzanalysen mit
Messwiederholung ausgewertet.
*Ergebnisse:* Im Vergleich zum Prätest verbesserten sich die Kinder bei den Aufgaben zu Mathematik und räumlichem
Vorstellungsvermögen (Cohen’s _d_ = 0.71) sowie beim MAT (Cohen’s _d_ = 2.50) deutlich. Keine Unterschiede zwischen dem
Prä- und Posttest wurden bei musiktheoretischen Aufgaben gefunden.
*Diskussion und Ausblick:* Die Ergebnisse deuten darauf hin, dass das Kurskonzept musikalisches Hörverständnis sowie
mathematisches und räumliches Vorstellungsvermögen von besonders begabten und hochbegabten Kindern fördern kann. Die
kleine Stichprobengröße und die fehlende Kontrollgruppe müssen bei der Aussagekraft jedoch berücksichtigt werden. Daher ist
als nächster Evaluationsschritt eine Multiplikationsstudie samt Kontrollgruppenvergleich an 12 Hector-Kinderakademien im
Sommersemester 2016 geplant.
ID: 366
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Didaktiken der Naturwissenschaften und Technik, Didaktik Deutsch
Thematisches Cluster: Bildung im Sekundarbereich, Grundschulbildung, Unterrichtsentwicklung/ Unterrichtsqualität
Stichworte: Lernaufgaben, Leistungsaufgaben, Heterogenität, Diagnose
Mit herausfordernden Aufgaben und standardisierten Beurteilungsvorgaben Heterogenität in der Schule
begegnen?
Chair(s): Marc Kleinknecht (TU München), Svenja Kühn (Universität Duisburg-Essen), Stefan Schipolowski (Institut zur
Qualitätsentwicklung im Bildungswesen Berlin), Eva-Maria Lankes (TU München)
Diskutant(en): Knut Neumann (Institut der Pädagogik der Naturwissenschaften Kiel)
Aufgaben haben im Unterricht für das Lehren und Lernen eine wichtige Bedeutung und eignen sich insbesondere für einen
produktiven Umgang mit Heterogenität: Sie lassen sich für verschiedene Zielgruppen (z.B. leistungsstarke und
leistungsschwache Schülerinnen und Schüler) variieren und können so Lernende ihrem Wissens- und Kompetenzstand
entsprechend fördern (z.B. Caspari, 2013a, 2013b). Aufgaben sind aber auch Instrumente der Leistungsentwicklung sowie feststellung (z.B. Abraham & Müller, 2008). Basierend auf der Kritik der schulischen Beurteilungspraxis geraten neben der
Aufgabenqualität zunehmend Korrektur- und Bewertungsvorgaben in den Fokus, die eine möglichst objektive, transparente und
vergleichbare Leistungsbeurteilung ermöglichen sollen – dies gilt insbesondere im Kontext standardisierter,
lerngruppenübergreifender Tests und Prüfungen. Sowohl der Einsatz adäquater Aufgaben als auch standardisierter
Beurteilungsverfahren haben das Potenzial, der Heterogenität von Schülerinnen und Schülern angemessen zu begegnen und
so den Bildungserfolg aller Schülerinnen und Schüler zu gewährleisten. Vor diesem Hintergrund werden im Symposium Aufgaben
und standardisierte Beurteilungsvorgaben aus fachdidaktischer, schulpädagogischer und psychometrischer Perspektive
beleuchtet.
Die ersten beiden Beiträge gehen der Frage nach, wie Lehrkräfte schwache Schülerinnen und Schüler durch Aufgaben
identifizieren und fördern können: Der erste Beitrag fokussiert die Bedeutung komplexer Aufgaben für das Lehren und Lernen in
der Biologie. Dazu präsentieren die Autoren Ergebnisse einer videobasierten Prä-Post-Studie, in der untersucht wurde, inwieweit
komplexe Aufgaben zu höheren Leistungen gerade auch bei schwachen Lernenden führen und welches fachliche und
fachdidaktische Wissen den Einsatz solcher Aufgaben begünstigt. Im zweiten Beitrag zu Diagnoseaufgaben werden wiederum
komplexe Aufgaben thematisiert, die im Leseunterricht der Grundschule dazu dienen können, die Leseprozesse in der
Grundschule zu identifizieren. Die Autoren untersuchen, welche wissens- und textbezogenen Modellierungsformen bei den
Lösungen zu IGLU-Aufgaben bei schwachen und starken Leserinnen und Lesern auftreten, und ziehen Konsequenzen für die
schulische Diagnosepraxis.
Im Fokus des dritten und vierten Beitrags stehen Aufgaben und dazugehörige Bewertungsvorgaben im Kontext
lerngruppenübergreifender Tests und Prüfungen: Die Autoren des dritten Beitrags analysieren die Konfiguration von Korrekturund Bewertungsvorgaben in Prüfungsverfahren für den Mittleren Schulabschluss aller Bundesländer in den Fächern Deutsch
und Mathematik. Sie diskutieren, inwieweit diese Transparenz und Vergleichbarkeit tatsächlich befördern. Schließlich behandelt
der vierte Beitrag Leistungsaufgaben im Kontext der Vergleichsarbeiten (VERA-8) im Teilbereich Schreiben des Faches Deutsch.
Diese Leistungsaufgaben sollen von den Lehrkräften auch als Diagnoseaufgaben genutzt werden und deren
Unterrichtsgestaltung positiv verändern. Die Autoren untersuchen die Qualität des Assessments aus psychometrischer
Perspektive und dessen Nutzen für die schulische Praxis, unter anderem zur Identifikation und Förderung schwacher Lernender,
aus Perspektive der Lehrkräfte. Das Symposium schließt mit einer Diskussion der zuvor präsentierten Forschungsergebnisse.
Beiträge des Symposiums
Einfluss des Professionswissens auf den Einsatz von komplexeren Lernaufgaben im Biologieunterricht
zur Förderung der Leistung von Schülern mit wenig Vorwissen
Christian Förtsch, Sonja Werner, Lena von Kotzebue, Birgit J. Neuhaus
LMU München
Theoretischer Hintergrund
Das im Rahmen des Projekts Evaluation der Standards in den naturwissenschaftlichen Fächern der Sekundarstufe I (ESNaS;
u.a. Kauertz et al., 2010) entwickelte Kompetenzmodell zur Erstellung von Aufgaben enthält unter anderem das Merkmal
Komplexität. Hierbei wird die Komplexität von Aufgaben grundsätzlich in die verschiedenen Niveaustufen Fakt, Zusammenhang
und Übergeordnetes Konzept eingeteilt. Wadouh et al. (2014) nutzten diese Einteilung zur Kodierung aller Aussagen im
Biologieunterricht. Sie konnten bei Schülerinnen und Schülern (SuS) in Klassen mit hohem Vernetzungsniveau ein besser
strukturiertes Wissen identifizieren, als bei Schülerinnen und Schülern in Klassen mit niedrigem Vernetzungsniveau. Erste
Ergebnisse zur Wirksamkeit eines konzeptorientieren Biologieunterrichts konnten bereits von Förtsch et al. (eingereicht) gezeigt
werden. Basierend auf Lehr-Lern-Modellen wird zudem davon ausgegangen, dass das Professionswissen einer Lehrkraft die
Unterrichtsqualität beeinflusst, welche wiederum die Schülerleistung steigert (Kunter et al., 2011; Helmke, 2014). Empirische
Hinweise zum Einfluss des fachdidaktisches Wissens (FDW), auf die Gestaltung von Lernaufgaben liegen allerdings erst im
Bereich der Mathematik vor (Kunter et al., 2011).
Fragestellungen
Welchen Einfluss hat das fachspezifische Professionswissen auf den Einsatz von komplexeren Lernaufgaben im
Biologieunterricht? Steigert der Einsatz von komplexeren Lernaufgaben im Biologieunterricht die Schülerleistung, insbesondere
bei SuS mit wenig Vorwissen?
Methode
Im Rahmen des Projekts Professionswissen in den Naturwissenschaften (ProwiN) wurden 43 Biologielehrkräfte (Alter M=35,3
Jahre, SD=8,0; 60,5% weiblich) des bayerischen Gymnasiums für jeweils zwei Unterrichtsstunden in der 9. Jahrgangsstufe zum
Themenbereich Neurobiologie videographiert (N=85 Unterrichtsstunden). Das Fachwissen (FW) und FDW der Lehrkräfte wurde
mittels zwei separaten Paper-Pencil-Tests, jeweils bestehend aus offenen und Multiple-Choice-Fragen (Jüttner et al., 2013), vor
der Videographie erhoben und unter Verwendung des Partial-Credit-Modells Rasch-skaliert (FW: 12 Items; FDW: 9 Items). Beide
Tests wiesen zufriedenstellende fit-Werte auf (alle Infit/Outfit-MNSQ≤1,5; Personenreliabilität: 0,53 (FDW); 0,73 (FW);
Itemreliabilität: 0,96 (FDW); 0,99 (FW)). Die Schülerleistung wurde mit Hilfe eines Leistungstests zum Thema Neurobiologie im
Prä-Post-Design erhoben (Prätest: 18 Items, Posttest: 22 Items) und ebenfalls Rasch-skaliert. Die Personen- (Prätest: 0,63;
Posttest: 0,78) und Itemreliabilitäten (Prätest/Posttest: 1,00), sowie Item fit-Werte (alle Infit/Outfit-MNSQ≤1,3) wiesen ebenfalls
gute Werte auf (Bond & Fox, 2007). Die Aufgabenkodierung im Unterricht erfolgte in zwei Schritten. Zunächst wurde jede
inhaltsbezogene Denk- oder Handlungsaufforderung der Lehrkraft an die SuS als Lernaufgabe grundkodiert. Die identifizierten
Lernaufgaben wurden basierend auf Wadouh et al. (2014) und Kauertz et al. (2010) einer der drei Komplexitätsstufen Fakt,
Zusammenhang oder Konzept zugeordnet. Bei 10 % der Videos erfolgte die Aufgabenkodierung zusätzlich durch einen zweiten
unabhängigen Rater, welche eine sehr gute Übereinstimmung aufwies (Cohens κ = 0,94). Anschließend wurde für jede
Unterrichtsstunde der Anteil an komplexen Aufgaben (Zusammenhangs- und Konzeptaufgaben) berechnet. Zur Überprüfung der
Fragestellungen wurden lineare multiple Regressionsmodelle, sowie Mehrebenenpfadmodelle berechnet.
Ergebnisse
Deskriptive Ergebnisse zeigten im Mittel den Einsatz von 31,3 Aufgaben (SD=13,3) pro Unterrichtsstunde, wobei nur 6,4
Aufgaben (SD=4,5) einer hohen Komplexität zugeordnet werden konnten. FDW konnte als signifikanter Prädiktor für den Einsatz
von komplexen Lernaufgaben im Unterricht identifiziert werden (β=0,32, p=0,036, R²=0,10). Ergebnisse der
Mehrebenenpfadanalyse zeigten auf der Klassenebene einen positiven Effekt des FDW auf den Einsatz von komplexen
Lernaufgaben (β = 0,39, p=0,005, R²=0,17), welche wiederum einen positiven Einfluss auf die Schülerleistung im Posttest
aufwiesen (β=0,45, p=0,001, R²=0,21). Auf Schülerebene wurden die Leistung im Prätest und die Anstrengungsbereitschaft
kontrolliert. Bei SuS mit wenig Vorwissen konnten mittels einer multiplen Regression ähnliche Effekte auf deren Schülerleistung
gezeigt werden (β=0,20, p=0,001, R²=0,038).
Fazit
Es konnte gezeigt werden, dass der Einsatz von komplexen Lernaufgaben im Biologieunterricht zu einer Steigerung der
Schülerleistung führt, die ebenfalls bei SuS mit wenig Vorwissen nachweisbar ist. Ein höheres FDW der Lehrkraft fördert zudem
deren Einsatz, weshalb die Integration in die universitäre Lehrerausbildung, sowie in Lehrerfortbildungen sinnvoll erscheint.
Wissens- und textbezogene Modellbildungen schwacher und starker Leserinnen und Leser beim Lösen
komplexer Leseaufgaben
Marc Kleinknecht, Eva-Maria Lankes
TU München
Theoretischer Hintergrund
Komplexe Leseaufgaben gelten als wichtiges methodisches Werkzeug, um die Lesekompetenz bereits in der Grundschule zu
diagnostizieren und zu fördern (Köster, 2005). Ein gelingender Einsatz solcher Leseaufgaben setzt voraus, dass Lehrkräfte ein
fundiertes Wissen zu Leseaufgaben und den Leseprozessen der Schülerinnen und Schüler bei der Bearbeitung dieser Aufgaben
besitzen. Das Wissen über diese kognitiven Prozesse und die Anwendung dieses Wissens im schulischen Alltag stellt eine
zentrale Facette diagnostischer Kompetenz von Lehrkräften dar, die allerdings bei Lehrkräften wenig ausgeprägt sein dürfte
(Artelt et al., 2007, S. 66f).
Bislang beschäftigen sich nur wenige empirische Arbeiten mit der diagnostischen Betrachtung von Leseprozessen bei der
Bearbeitung von komplexen Aufgaben und möglichen Kriterien zur Analyse von Leseprozessen in der schulischen Praxis
(Schnotz & Dutke, 2004). Insbesondere mangelt es an Studien, die die Leseprozesse schwacher Schülerinnen und Schüler
untersuchen, die oftmals an komplexen Aufgaben scheitern und für die Diagnosekonzepte weitgehend fehlen (Bos, Tarelli,
Bremerich-Vos & Schwippert, 2012).
Fragestellung
Der vorliegende Beitrag beleuchtet auf Basis kognitionspsychologischer Ansätze (Richter & Christmann, 2002) die Prozesse des
vorwissensbasierten Interpretierens und Schlussfolgerns beim aufgabengesteuerten Lesen. Ein besonderes Augenmerk des
Beitrags liegt auf den Leseprozessen schwacher Leserinnen und Leser.
Methode
Als Datenmaterial für diese Studie dienen Aufgabenlösungen zu 11 Aufgaben (13 Einzelitems) der Internationalen GrundschulLese-Untersuchung (IGLU 2011) von zufällig gezogenen N = 199 Grundschülerinnen und -schülern. Diese Teilstichprobe wurde
aus der (für Deutschland repräsentativen) Gesamtstichprobe der in IGLU getesteten Schülerinnen und Schüler (N = 4000),
geschichtet nach Kompetenzstufe und Geschlecht, gezogen, sodass Jungen und Mädchen etwa gleichverteilt über die fünf
Kompetenzstufen in der Stichprobe vertreten waren. Die Aufgaben im offenen Aufgabenformat (constructed response) beziehen
sich auf zwei literarische und zwei informierende Texte. Für die Analyse wurden angelehnt an kognitionspsychologische Ansätze
zum Lesen drei Formen der Modellbildung unterschieden: Eine ausschließlich erfahrungs- und vorwissensbezogene
Modellierung, eine auf Textausschnitte bezogene Modellierung und eine auf den Gesamtzusammenhang des Textes bezogene
Modellierung. Für die Inhaltsanalyse der Daten wurden zwei studentische Hilfskräfte geschult und deren Probekodierungen an
20 Prozent des Datenmaterials geprüft. Die Werte für Cohen’s Kappa .58 - .79 verweisen auf eine moderate bis sehr gute
Übereinstimmung für die drei Kategorien.
Ergebnisse
Die Ergebnisse für die Gesamtgruppe zeigen, dass knapp 40% der Schülerinnen und Schüler gesamttextbezogene
Modellierungen verwenden, gut 30% der Kinder gelingt in ihren Antworten keine der Modellierungsarten. Formen der erfahrungsund wissensbezogenen Modellierung (ohne Textbezug) (12%) und lediglich auf Textausschnitte bezogene Modellierungen (19%)
kommen dagegen seltener vor. Ein Vergleich der Modellbildungen leistungsschwacher vs. -starker Leserinnen und Leser zeigt,
dass sich Leserinnen und Lesern auf verschiedenen Kompetenzstufen bei der Modellierung signifikant unterscheiden (F = 7,80,
p = .000, n2 = .147; F = 56,14, p = .000, n2 = .554). Schwache Leserinnen und Leser (auf Kompetenzstufe 1 und 2) bilden
vorwiegend erfahrungs- und wissensbezogene Modelle, starke Leserinneren und Leser (auf Kompetenzstufe 3 bis 5) dagegen
primär gesamttextbezogene Modellierungen. Im Beitrag illustrieren wir die Ergebnisse an Antwortbeispielen schwacher bzw.
starker Lesenden und diskutieren den Nutzen der Ergebnisse für die Lesediagnostik und -förderung im Grundschulunterricht.
Gleiche Aufgaben, gleiche Bewertungsvorgaben, gleiche Chancen für alle? Potenziale und Risiken
zentraler Abschlussprüfungen
Stefanie Mathes, Svenja Kühn
Universität Duisburg-Essen
Theoretischer Hintergrund
Mit der Einführung zentraler Abschlussprüfungen geht u.a. die Annahme einher, durch landesweit einheitliche Prüfungsaufgaben
sowie vorgegebene Korrektur- und Bewertungsrichtlinien mehr Transparenz und Vergleichbarkeit bei der Vergabe von
Schulabschlüssen herstellen zu können und damit einen Beitrag zu mehr Bildungsgerechtigkeit zu leisten. Inwieweit diese
intendierten Zielsetzungen in der gegenwärtigen Prüfungspraxis tatsächlich erreicht werden, ist bislang nur unzureichend
empirisch überprüft worden. Empirische Analysen von Prüfungsaufgaben (z.B. Roppelt et al., 2008; Kühn & Drüke-Noe, 2013;
Neubrand & Neubrand, 2010) weisen auf eine Diskrepanz zwischen den bildungspolitischen Wirkungserwartungen und den
Wirkungserfahrungen hin – im Bereich der konkreten Ausgestaltung von Korrektur- und Bewertungsvorgaben sowie deren
Wahrnehmung und tatsächlichen Nutzung seitens der beurteilenden Lehrkräfte steht die wissenschaftliche Auseinandersetzung
hingegen noch am Anfang. Es existieren bislang nur vereinzelte Untersuchungen, welche erste Hinweise auf eine Heterogenität
der formalen und inhaltlichen Gestaltung von Beurteilungsvorgaben geben (vgl. Klein et al., 2009; Zabka & Stark, 2010), wie
auch auf eine ambivalente Einschätzung durch die Lehrkräfte hinsichtlich der subjektiv wahrgenommenen Qualität und
Nützlichkeit verweisen (vgl. Appius & Holmeier, 2012; Odendahl, 2008).
Projektdesign
Der Beitrag greift dieses bislang vernachlässigte Thema auf und stellt ausgewählte Befunde eines DFG-Projekts vor, das die
Konfiguration und professionelle Nutzung der einheitlichen Korrektur- und Bewertungsvorgaben im Rahmen zentraler
Abschlussprüfungen zum Erwerb des Mittleren Schulabschlusses untersucht. Im Rekurs auf schulische Governance-Ansätze
(z.B. Altrichter, Brüsemeister & Wissinger, 2007; Altrichter & Maag Merki, 2010) ist davon auszugehen, dass die Nutzung der
Korrektur- und Bewertungsvorgaben u.a. durch strukturelle und organisational-situative Handlungsbedingungen sowie
individuelle Einstellungen, Kenntnisse und Merkmale der beurteilenden Lehrerinnen und Lehrer bedingt wird. Anknüpfend an die
o.g. Forschungsarbeiten kann angenommen werden, dass die Nutzung der vorgegebenen Korrektur- und Bewertungsrichtlinien
zudem maßgeblich durch deren konkrete Ausgestaltung determiniert wird. Um zu erfassen, ob und inwieweit Lehrkräfte diese
tatsächlich nutzen, muss also zunächst eine differenzierte Analyse der Korrektur- und Bewertungsvorgaben erfolgen. Kern des
Beitrags ist daher die Deskription der länderspezifischen Ausgestaltungsvarianten der Beurteilungsvorgaben sowie die
Bestimmung von Ländertypen, welche hinsichtlich der Konfiguration entsprechender Vorgaben möglichst viele
Übereinstimmungen aufweisen.
Fragestellung
Wie sind die Korrektur- und Bewertungsvorgaben in den Fächern Deutsch und Mathematik im Kontext zentraler
Abschlussprüfungsverfahren zum Erwerb des Mittleren Schulabschlusses in den deutschen Ländern ausgestaltet?
Methode
Vorgestellt werden die Befunde einer kategoriengeleiteten Analyse der Korrektur- und Bewertungsvorgaben im bundesweiten
Ländervergleich; dabei werden ausschließlich die beiden Kernfächer Deutsch und Mathematik fokussiert, die im Kontext der
Prüfungsverfahren zum Erwerb des Mittleren Schulabschlusses als einzige in allen Bundesländern zentral geprüft werden (vgl.
Kühn, 2013). In Anlehnung an inhaltsanalytische Verfahren (vgl. Mayring, 2010) wurden hierfür sowohl induktiv als auch deduktiv
zwei fachspezifische Kategoriensysteme entwickelt, welche sowohl formale (z.B. Darstellungsform, Umfang) als auch inhaltliche
Aspekte (z.B. Detailliertheits- und Verbindlichkeitsgrad) der Korrektur- und Bewertungsvorgaben berücksichtigen.
Ergebnisse
Die Analysen verweisen auf ein großes Spektrum von offenen, global formulierten Erwartungshorizonten ohne
Verbindlichkeitsgrad bis hin zu konkreten kriteriengeleiteten Punkterastern. Trotz der ausgeprägten Heterogenität der Vorgaben
können gleichwohl Ländertypen identifiziert werden, die im Spannungsfeld von Standardisierungsanspruch und pädagogischem
Ermessen unterschiedliche Schwerpunkte setzen. Die Befunde werden im Hinblick auf den Beitrag zentraler Prüfungen zur
Erhöhung von Bildungsgerechtigkeit diskutiert.
Messung von Schreibkompetenz im Fach Deutsch: Bewährung der eingesetzten Beurteilungsskalen im
Rahmen der Vergleichsarbeiten und in der schulischen Praxis
Stefan Schipolowski, Katrin Böhme
Institut zur Qualitätsentwicklung im Bildungswesen Berlin
Theoretischer Hintergrund
Obgleich der Vermittlung produktiver schriftsprachlicher Kompetenzen in Schulcurricula und in den Bildungsstandards der
Kultusministerkonferenz eine große Bedeutung zugeschrieben wird (vgl. etwa KMK, 2004), wurde eine direkte Messung der
Schreibkompetenz in Schulleistungsstudien bisher vergleichsweise selten durchgeführt. Dies kann teilweise darauf zurückgeführt
werden, dass die Bewertung der von den Schülerinnen und Schülern verfassten Texte eine besondere Herausforderung darstellt:
Einerseits sollen die verwendeten Beurteilungsskalen zuverlässige, valide und möglichst differenzierte Aussagen bezüglich der
Stärken und Schwächen bei verschiedenen Aspekten der Schreibkompetenz erlauben, auf der anderen Seite muss die
Bewertung der Texte vom Aufwand her leistbar sein (Behrens & Krelle, 2011). Letzteres ist wesentlich für die Akzeptanz der
entwickelten Testinstrumente, insbesondere dann, wenn die Bewertung der Schülertexte durch die Lehrkräfte der beteiligten
Schulen vor Ort vorgenommen werden soll, wie es typischerweise in den länderübergreifenden Vergleichsarbeiten (VERA) der
Fall ist.
Fragestellungen
1) Neben der Frage des Ressourceneinsatzes der Lehrkräfte bei der Bewertung von Schülertexten ist bisher weitgehend unklar,
inwieweit sich die verschiedenen, in der Fachliteratur diskutierten Ansätze zur Bewertung von Schülertexten (vgl. etwa Neumann,
2012; Schipolowski & Böhme, 2015) psychometrisch für den Einsatz in groß angelegten Kompetenztestungen eignen.
2) Zudem ist offen, ob eine Eignung für Zwecke der Bildungsforschung gleichzeitig mit einem hohen Nutzen dieser
Bewertungsansätze für die Unterrichtsentwicklung und der Verwendbarkeit in der schulischen Praxis einhergehen.
Methode
Grundlage unseres Beitrags sind die am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) für den Einsatz in den
Vergleichsarbeiten in der achten Jahrgangsstufe (VERA-8) entwickelten Aufgaben und Beurteilungsskalen zur Erfassung von
Schreibkompetenz im Fach Deutsch. Konkret wurden für VERA-8 im Jahr 2015 verschiedene mehrstufige Skalen entwickelt, die
eine Beurteilung von Schülertexten mit Blick auf inhaltliche und stilistisch-strukturelle Aspekte sowie hinsichtlich der sprachlichen
Richtigkeit erlauben. Diese Beurteilungsskalen wurden in einer umfangreichen Pilotierungsstudie (N = 2.918 Achtklässlerinnen
und Achtklässler aus acht Bundesländern) für 12 verschiedene Schreibaufgaben erprobt.
Für die Untersuchung der zweiten Fragestellung befragen wir gegenwärtig Lehrkräfte, die an der Durchführung von VERA-8 2015
teilgenommen haben. Zentrale Inhalte dieser Zusatzbefragung sind die Eignung der Skalen zur Identifikation von
leistungsschwachen Lernern, die Eignung für Zwecke der Unterrichtsentwicklung, die Nutzung und der Nutzen von
Benchmarktexten sowie die Nutzung der zugehörigen fachdidaktischen Kommentare.
Ergebnisse
In unserem Vortrag beschreiben und erläutern wir zunächst die eingesetzten Aufgaben und Beurteilungsskalen einschließlich
des verwendeten Begleitmaterials (u. a. kommentierte Benchmarktexte) und berichten zentrale, in der Pilotierungsstudie
ermittelte psychometrische Eigenschaften der Beurteilungsskalen. Konkret präsentieren wir für die Beantwortung der ersten
Fragestellung die Urteilerübereinstimmung bei geschulten Kodiererinnen und Kodierern anhand von Intraklassen-Korrelationen
und die mittels Strukturgleichungsmodellierung geprüften Zusammenhänge zwischen den Skalenwerten unter Berücksichtigung
der Reliabilität. Ferner untersuchen wir das Ausmaß von Haloeffekten. Für die Beantwortung der zweiten Fragestellung richten
wir das Augenmerk auf die Bewährung der Skalen in der Schulpraxis und stellen hierzu Ergebnisse der durchgeführten
Zusatzbefragung dar. Dabei reflektieren wir diese Ergebnisse vor dem Hintergrund der Zielstellungen der Vergleichsarbeiten in
der achten Jahrgangsstufe und den besonderen Herausforderungen des Unterrichtens in heterogenen Lerngruppen.
Abschließend diskutieren wir auf Basis der Ergebnisse die Vor- und Nachteile der eingesetzten Bewertungsskalen sowohl aus
psychometrischer Sicht als auch aus Sicht der Lehrkräfte und leiten Empfehlungen für zukünftige Schreibassessments im
Rahmen von groß angelegten Kompetenztestungen mit verschiedenen Zielsetzungen (etwa Systemmonitoring oder
Unterrichtsentwicklung) ab.
ID: 368
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Didaktik Mathematik, Didaktiken der Naturwissenschaften und Technik
Thematisches Cluster: Bildung im Sekundarbereich, Hochschulbildung, Lese- und Sprachförderung
Stichworte: Sprachförderung, Sprache im Fach, Deutsch als Zweitsprache
Sprache im Fachunterricht
Chair(s): Dominik Leiss (Leuphana Universität Lüneburg), Knut Schwippert (Universität Hamburg)
Diskutant(en): Miriam Vock (Universität Potsdam)
Sprachliche Kompetenzen und deren Zusammenhang mit Schülerleistungen kommt in den letzten Jahren eine besondere
Bedeutung zu und stellt schon jetzt Fachlehrpersonen vor besondere Herausforderungen (Becker-Mrotzek et al. 2013). Einerseits
verlangen die für zahlreiche Fächer vorliegenden bzw. diskutierten Bildungsstandards die Vermittlung fachsprachlicher
Kompetenzen (KMK 2004, VGD 2011). Andererseits ist aus (inter)nationalen Vergleichsstudien bekannt, dass insbesondere
Schülerinnen und Schüler mit einem Migrationshintergrund Probleme haben bei der Bearbeitung komplexerer
Aufgabenstellungen (vgl. u. a. Anand Pant et al. 2013, Prenzel et al. 2013). So bestimmt ein komplexes Wechselspiel von
Merkmalen der in der Regel schriftlich dargelegten Aufgabenstellung (Verschaffel et al. 2000) und von intrapersonellen Aspekten
(Artelt et al. 2001) das mentale Modell der schriftlichen Problemstellung in der Schülerkognition. Dabei scheint der Schreib- und
Lesekompetenz bei den intrapersonellen Aspekten eine herausragende Rolle zuzukommen, was sich empirisch u.a. bei
zahlreichen Studien in einer hohen Korrelation der Lesekompetenz mit der jeweiligen anwendungsorientierten Fachkompetenz
widerspiegelt (vgl. u. a. Vilenius-Tuochimaa et al. 2008). Auch wenn es zu diesem komplexen Zusammenhang eine Reihe von
deduktiven Theorien existieren, so stellt die empirische Klärung der relevanten Prozessvariablen und deren Zusammenhänge
sowohl in der nationalen als auch der internationalen Forschung ein Desiderat dar (siehe Überblick in Kintsch 2004).
Entsprechend zielt das beantrage Symposium darauf ab, ein Verständnis über fachbezogene Denk- und Lösungsprozesse in
aufgabenbasierten Lehr-Lernarrangements unter der gemeinsamen Berücksichtigung sprachlicher Heterogenität in den
Mittelpunkt empirischer Forschung zu stellen. Konzeptionelle Grundlage ist die systematische Verbindung empirischer
Bildungsforschung mit und zwischen der Fachdidaktik Deutsch, Mathematik, Musik und Physik.
Der erste Beitrag stellt ein theoretisches Rahmenmodell zur Beschreibung der sprachlichen Anforderungen von
Unterrichtsaufgaben sowie eine diesbezügliche empirische Studie zur Analyse von Interaktionseffekten zwischen Fachleistungen
und sprachlichen Anforderungen exemplarisch für die Fächern Physik und Musik vor. Im zweiten Beitrag wird im Rahmen einer
quasi-experimentellen Interventionssstudie untersucht inwiefern sprachlich bzw. fachlich schwache Lernende von einer eher
ganzheitlichen oder einer eher fokussierten Sprachförderung im Fach Mathematik profitieren. Der dritte Beitrag widmet sich einer
ähnlichen Thematik, indem anhand zweier 15 Wochen dauernder Sprachförderkonzepte, einer separierten Sprach- und
Fachförderung eine integrierte Förderung in den Fächern Deutsch und Mathematik gegenüber gestellt wurde. Im vierten Beitrag
wird der Blick auf die Überzeugungen von Lehrpersonen hinsichtlich sprachlicher und kultureller Heterogenität gelenkt. Die
Autoren haben hierzu 427 Lehramststudierende mit einem selbst entwickelten Testinstrument befragt und beschreiben u.a.
Zusammenhänge von DaZ-Kompetenzen und diesbezüglichen beliefs.
Beiträge des Symposiums
Sprache und Fachunterricht: Modellierung sprachlicher Anforderungsniveaus
Dietmar Höttecke1, Michael Ahlers2
1
Universität Hamburg, 2Leuphana Universität Lüneburg
Theoretischer Hintergrund
Felder sprachlichen Handelns sind auch in nicht explizit sprachlichen Unterrichtsfächern zahlreich (Vollmer & Thürmann 2010).
Schulunterricht aller Fächer stellt fachspezifische und überfachliche Sprachanforderungen (Feilke 2012). Besondere Hemmnisse
für gelingende fachliche Lernprozesse ergeben sich, wenn die Bedeutungskonstruktion über Sach- oder Aufgabentexte von
sprachlichen Eingangsvoraussetzungen abhängt. Sichtbar wird dieses Problem z.B. in dem Befund, dass die zu Hause
gesprochene Sprache Einfluss auf fachliche Kompetenzen hat (Pant et al. 2013) oder in Korrelationen zwischen Lesekompetenz
(Leutner et al. 2004) bzw. sprachlichen Kompetenzen (Härtig et al. 2015) mit fachlichen Kompetenzen.
Eine Didaktik der Mehrsprachigkeit empfiehlt daher Maßnahmen der Sprachförderung oder sprachliche Entlastungsmaßnahmen
(z.B. Vereinfachung von Sachtexten) (Leisen 2010). Ob Reduktion sprachlicher Komplexität eine sinnvolle Entlastungsstrategie
für Aufgaben darstellt, wird in unserer Studie untersucht. Hinweise darauf ergaben sich bereits aus Studien, bei denen Items in
Chemie bzw. Science sprachlich auf den Ebenen der Lexik, Syntax, Tempus, der Verwendung von Negationen und der Textlänge
variiert worden waren (Cassels & Johnstone 1984, Bird & Welford 1995, Prophet & Badede 2009).
Fragestellungen
(1) Wie lassen sich sprachliche Anforderungen von Textaufgaben in der Sekundarstufe I über verschiedene Fächer hinweg
praktikabel operationalisieren?
(2) Sinkt die Lösungswahrscheinlichkeit von Aufgaben mit ansteigender sprachlicher Schwierigkeit?
(3) Zeigen sich systematische Zusammenhänge zwischen Lösungswahrscheinlichkeiten der sprachlich variierten Aufgaben und
Personenmerkmalen?
Methode
Es wurde ein Testdesign gewählt, bei dem sprachliche Anforderungen von primär geschlossenen Testitems auf drei sprachlichen
Niveaus über die Domänen Mathematik, Physik, Sport, Deutsch und Musik hinweg systematisch variiert wurden. Dazu wurde ein
Modell zur Operationalisierung sprachlicher Anforderungsniveaus entwickelt. Der Modellentwicklung lag die theoretische
Annahme zugrunde, dass sprachliche Anforderungen sich aus mehreren voneinander nicht isolierbaren Faktoren ergeben, die
bei der Aufgabenkonstruktion zugleich variiert werden (u.a. Wort- und Satzlänge, Syntax, Morphosyntax, Layout,
Kohäsionsmittel).
Jedes Item liegt auf drei Sprachniveaus vor. Die Variation der drei Sprachniveaus erfolgte ausgehend vom mittleren Niveau und
bezog sich nur auf Itemstämme. Instruktionen, Lösungen und Distraktoren wurden auf dem leichten Niveau gehalten.
Lösungsrelevante Informationen variierten nicht. Es ergaben sich für 5 Fächer, 3 Items je Fach und 3 Sprachstufen 45 Testitems,
die über drei Testhefte rotiert wurden, um Positionseffekte zu berücksichtigen. Die Items wurden durch Schülerinterviews
präpilotiert.
Das Sample bestand aus N = 601 Schülern/innen (weiblich: 49,7%, 7./8. Jg., Hamburg, NRW, Hessen, Baden-Württemberg).
Jede/r Schüler/in bearbeitete je drei Aufgaben pro Unterrichtsfach, die sich in der sprachlichen Schwierigkeit unterschieden.
Sprachliche Fähigkeiten wurden zusätzlich mit einem C-Test erhoben. Ein Fragebogen erhob weitere Hintergrunddaten (Alter,
Geschlecht, Migrationshintergrund, Anzahl Bücher zu Hause).
Ergebnisse
Frage (1): Es konnte auf Basis linguistischer und fachdidaktischer Expertise ein Modell zur Operationalisierung sprachlicher
Schwierigkeiten entwickelt werden, das die Konstruktion von 45 Items ermöglichte und validierte.
Frage (2): Die Erwartung, dass sich die theoretisch erwartete Stufung der Sprachschwierigkeit empirisch bewährt, konnte nicht
bestätigt werden. Lösungswahrscheinlichkeiten fallen nur bei wenigen Items monoton mit ansteigendem Sprachniveau.
Tendenziell haben Items auf dem mittleren sprachlichen Anforderungsniveau eine höhere Lösungswahrscheinlichkeit gegenüber
dem einfachen und schweren Sprachniveau.
Regressionsmodelle zeigen, dass die Regressionsgewichte der Itemeigenschaften „Sprachniveau leicht“ oder „Sprachniveau
schwer“ gering ausfallen und das Kriterium der Lösungswahrscheinlichkeit kaum vorhersagen (Varianzaufklärung
durchschnittlich R² = 0.01).
Frage (3): In einem Regressionsmodell unter Kontrolle der Kovariaten bleiben Regressionskoeffizienten gering, zeigen aber für
Sprachfähigkeit und sozio-ökonomischen Hintergrund klare positive, für Migrationshintergrund klare negative Zusammenhänge
mit der Lösungswahrscheinlichkeiten der Items. Die Varianzaufklärung steigt hier an (R² = 0.11). Dieses Ergebnismuster zeigt
sich ebenfalls auf der Ebene bivariater Korrelationen.
Der Beitrag schließt mit einer Diskussion über Grenzen der Studie und über mögliche Konsequenzen für die Konstruktion von
Lern- und Testaufgaben. Der Bezug des Beitrags zum Tagungsthema ergibt sich, da wir die sprach-bezogenen
Ausgangsbedingungen, die wir untersuhen, als „schwierige Randbedingung“ gelingender fachlicher Lernprozesse verstehen.
Brauchen mehrsprachige Jugendliche eine andere fach- und sprachintegrierte Förderung als
einsprachige? Differentielle Analysen zur Wirksamkeit einer Intervention in Mathematik
Susanne Prediger, Lena Wessel
TU Dortmund
Theoretischer Hintergrund: Aufgrund zahlreicher empirischer Befunde zu sprachlich bedingten Leistungsdisparitäten (OECD,
2007; Prediger, Wilhelm, Büchter, Benholz, & Gürsoy, 2015; Stanat, 2006) ist Sprachförderung zur Querschnittsaufgabe aller
Fächer erklärt worden (Ahrenholz, 2010). Gegenstand der Sprachförderung im Fach ist neben der Fachsprache vor al-lem die
Bildungssprache, deren kommunikative und epistemische Funktion nicht nur für mehr-sprachige, sondern auch für sprachlich
schwache einsprachige Lernende zum Lernhindernis wer-den kann (Feilke, 2012; Gogolin, 2006; Morek & Heller, 2012). Mit
Konzepten des Makro-Scaffolding (Gibbons, 2002) und der Darstellungsvernetzung (Leisen, 2005; Prediger & Wessel, 2013)
stehen Ansätze zur Verfügung, die sich zur Weiterentwicklung der sprachlichen und fach-lichen Kompetenzen in integrierter Form
bewährt haben.
Fragestellung: Ein Forschungsdefizit gibt es jedoch weiterhin in der empirischen Absicherung und theoretischen
Ausdifferenzierung der fach- und sprachintegrierten Förderung (Bredel, 2005). Insbesondere gibt es wenig empirisch
konsolidiertes Wissen darüber, welche Maßnahmen fach- und sprachintegrierter Förderung für welche Sprachhintergründe
tatsächlich das fachliche Lernen stützen können: sind es eher die ganzheitlichen Anregungen zur Kommunikation oder zusätzlich
fokussiertere Sprachangebote auf Wort- und Satzebene? Benötigt die Gruppe der sprachlich schwachen einsprachigen
Lernenden andere Fördermaßnahmen als mehrsprachige Lernende? Inwiefern kann die Gruppe der sprachlich starken, aber
mathematisch schwachen Lernenden ebenfalls von einer fach- und sprach¬integrierten Förderung mathematisch profitieren? Im
Vortrag berichtet wird aus einem DFG-Projekt, das die differentiellen Bedarfe und Wirkungen bei ein- und mehrsprachigen
Jugendlichen mit unterschiedlicher Sprachkompetenz am Beispiel des Um-gangs mit Brüchen untersucht.
Methode: In einer quasiexperimentellen Interventionsstudie werden zwei Varianten der fach- und sprachintegrierten Förderung
(5x 90 min) verglichen bzgl. der abhängigen Variable verstehens-bezogene Mathematikleistung. Die unabhängige Variable im
Prä-Post-Follow-up-Design bilden zwei Interventionsformen (plus Kontrollgruppe): eine ganzheitliche Förderung G des mathematisch konzep¬tuellen Verständnisses mit ganzheitlicher Kommunikationsanregung und eine Förde-rung F, die zusätz¬lich eine
fokussierte Erarbeitung der themenbezogenen Sprachmittel auf Wort- und Satzebene anbietet. Die Interventionsgruppen sind
vergleichbar bzgl. der Kontrollvariablen kognitive Grundfertigkeit, bildungssprachliche Kompetenz, Mehrsprachigkeit, SES und
verste-hensbezogene Mathematik-Ausgangsleistung.
Die differentielle Wirksamkeit der beiden Interventionsformen wird untersucht für vier Sub-samples mathematisch schwacher
Lernender mit unterschiedlichen Sprachhintergründen: einspra-chig (E) oder mehrsprachig (M), jeweils mit höherer (+) oder
niedrigerer (-) Sprachkompetenz im Deutschen (also Subsamples E-, E+, M-, M+, zusammen n = 332).
Die Datenanalyse erfolgt mittels Varianzanalyse mit Messwiederholung und dem Vergleich von Effektstärken für die
Intragruppeneffekte.
Ergebnisse. Die Varianzanalyse mit Messwiederholung (ANOVA) und Post-hoc-Test zeigt für beide Interventionsformen einen
signifikant höheren Lernzuwachs bzgl. der verstehensbezogenen Mathematikleistungen als in der Kontrollgruppe (F(Zeit) =
292.15, p<0.001, ² = 0.47; F(Gruppen) = 8.1, p<0.001, ² = 0.047; F(Gruppen x Zeit) = 19.59, p<0.001, ² = 0.11), aber keine
relevanten Unter-schiede zwischen beiden Interventionsformen. Die Effektstärken im Zuwachs an verstehens-bezogener
Leistung sind mit dG = 1.14 für Förderung G und dF =1.12 für Förderung F sehr hoch, die für die Kontrollgruppe mit d=0.59 nur
mittel.
Die differentiellen Analysen zeigen unterschiedliche Lernzuwächse der vier Subsamples je nach Sprachhintergrund. Dabei wird
insbesondere deutlich, dass gerade die sprachlich schwachen einsprachigen Lernenden (Gruppe E-) besonders von der
Interventionsform F (auch fokussierte Förderung auf Wort- und Satzebene) profitieren (mit einer Mittelwertdifferenz von 5.27),
deut-lich mehr als die mehrsprachigen Lernenden (Mittelwertdifferenz von 3.41 in dem Subsample M- und 2.78 in M+).
Diese Phänomene sollen durch vertiefte Analysen auch aus den videographierten Förderpro-zessen genauer erklärt werden, um
durch genauere Implementations- und Nutzungskontrolle die differenzielle Wirksamkeit von Förderansätzen genauer zu
bestimmen. Damit wird eine empirisch gesicherte Basis für zielgruppenspezifisch adaptive Förderung je nach Sprachhintergrund
geschaffen.
Integrierte und separierte Sprachförderung im Vergleich – Entwicklungsverläufe bei Schülerinnen und
Schülern des 7. Jahrgangs
Maike Hagena1, Sabrina Kulin2, Knut Schwippert2, Dominik Leiss1
1
Leuphana Universität Lüneburg, 2Universität Hamburg
Innerhalb des schulischen Lernens kommt es häufig zu einer Separierung von sprachlichem und fachlichem Lernen.
Sprachförderung im Sinne eines bildungssprachlich gestützten Lernens gilt jedoch als Schlüssel für den Kompetenzerwerb im
Fachlernen (Becker-Mrotzek, Schramm, Thürmann & Vollmer, 2013), woraus sich die Notwendigkeit einer Sprachbildung und förderung in sämtlichen Fächern (Gogolin et al., 2011; Prediger, 2013; Schmölzer-Eibinger, 2013) bzw. einer Verbindung von
sprachlichem und fachlichem Lernen ableitet. Da Schülerinnen und Schüler mit Defiziten in der deutschen Sprache nicht nur in
den als eindeutig sprachlich klassifizierten Fächern, sondern auch in vermeintlich sprachfernen Fächern wie z.B. der Mathematik
benachteiligt sind (Baumert & Schümer, 2001), wäre mit einem Sprach-Fach-Lernen erhöhter Bildungserfolg trotz
erwartungswidriger Ausgangsbedingungen zu erwarten. Befunde, dass Sprachkompetenz ein wichtiger Indikator für erfolgreiches
Fachlernen ist (z.B. Bos et al., 2007; Becker-Mrotzek et al., 2013), untermauern diese Relevanz. Konzeptionen von integriertem
Sprach-Fachlernen sollen Lösungsansätze liefern.
Auf Grund der theoretischen Überlegungen ergeben sich folgende Forschungsfragen:
(a) Wie entwickelt sich die Handlungsfähigkeit von Schülerinnen und Schülern im Fachunterricht durch Sprachförderung?
(b) Welche Unterschiede lassen sich zwischen Schülerinnen und Schülern identifizieren, die integrierte bzw. separierte
Sprachförderung erhalten?
Im Rahmen der Studie Fach-an-Sprache-an-Fach (FaSaF) wurden 15 Wochen lang 256 Schülerinnen und Schüler der 7. Klassen
an sieben Schulen aus dem Raum Hamburg und Niedersachsen sprachlich gefördert. Entsprechend den Bedingungen in der
schulischen Praxis wurden heterogene Lerngruppen anhand sprachlicher und mathematischer Eingangstests (LGVT, DEMAT,
C-Tests) gebildet. Pro Schule konnten somit zwei in sich heterogene Fördergruppen additiv zum Regelunterricht implementiert
werden, die von geschulten Projektmitarbeiterinnen unterrichtet wurden – dabei wurde in einer Fördergruppe mit einem
separierten, in einer Fördergruppe mit einem integrierten Sprachförderkonzept gearbeitet.
Experimentalgruppe 1: Separiertes Sprachförderkonzept (n = 124)
Es fand eine separierte Sprach- und Mathematikförderung statt, in der Lese- und Schreibstrategien anhand von argumentativen
Texten erarbeitet wurden. Anschließend wurde die Bearbeitung mathematischer Modellierungsaufgaben fokussiert.
Experimentalgruppe 2: Integriertes Sprachförderkonzept (n = 126):
Ausgehend von der Bearbeitung mathematischer Modellierungsaufgaben wurden sowohl Lese- als auch Schreibstrategien
anhand von argumentativen Texten erarbeitet.
Zur Untersuchung der fachspezifischen Entwicklungsverläufe kamen in einem Pre-Post-Test-Design selbstentwickelte,
standardisierte Testinstrumente zum mathematischen Modellieren zum Einsatz. Nach einem Jahr (Mitte 2016) erfolgt eine FollowUp-Testung.
Auswertungen bestätigen die Güte der entwickelten Testinstrumente (Mathematisches Modellieren: Cronbachs Alpha = .79). Aus
derzeitigen Analysen zeichnet sich sowohl im Pretest als auch im Posttest bei einer geschlossenen Aufgabe für das
Argumentieren ab, dass die Schülerinnen und Schüler ein hohes implizites Schreibwissen besitzen und sich dieses z.T. im Laufe
der Förderung mit einem kleinen Effekt (Cohens d = 0.32) signifikant verbessert. Analysen zu den Entwicklungen der
Schülerantworten zu Aufgaben beim mathematischen Modellieren werden – neben einem Vergleich der Fördergruppen – im
Vortrag präsentiert und diskutiert.
Deutsch als Zweitsprache im Fachunterricht - Überzeugungen angehender Lehrkräfte
Nele Fischer, Svenja Hammer
Leuphana Universität Lüneburg
Das Anforderungsprofil an den Lehrerberuf wird immer vielfältiger. Darunter fällt auch die Kompetenz, Schülerinnen und Schüler
mit Deutsch als Zweitsprache (DaZ) im Fachunterricht angemessen unterstützen zu können (DaZ-Kompetenz). Um das Verhalten
von Lehrkräften zu erklären, hat sich das Konstrukt der Überzeugungen bzw. „beliefs“ als besonders relevant erwiesen (Pintrich
1990). Dies sind subjektiv geprägte und als legitim angesehene Thesen, welche die Analysen von und Reaktionen auf
Sachverhalte, Situationen und Personen beeinflussen (Borg 2011).
Die Forschung zu Überzeugungen im schulischen Kontext hat in den letzten Jahren zugenommen, sich aber hauptsächlich auf
das fachspezifische Lehren und Lernen, die Leistungserwartungen von Lehrkräften im Kontext migrationsbedingter Heterogenität
und das Auftreten kultureller Konflikte konzentriert. Nur wenige Untersuchungen nehmen den Umgang mit DaZ zum Anlass, das
Konstrukt der „beliefs“ nutzbar zu machen, um daraus vor allem eventuelle Lücken in der Lehramtsausbildung zu erkennen und
zu schließen.
Ziel der durchgeführten Studie war es, zu untersuchen, welche Überzeugungen angehende Lehrkräfte hinsichtlich sprachlicher
und kultureller Heterogenität vertreten. Hierfür wurden theoretisch die drei Bereiche Wertschätzung der Herkunftssprachen,
Zuständigkeit für Sprachförderung und Sprachsensibilität im Fachunterricht identifiziert. Konkret wurden folgende
Fragestellungen untersucht:
(1) Ist es möglich, die Skalen zu Überzeugungen hinsichtlich Mehrsprachigkeit auf Basis des Rasch-Modells zu skalieren und ein
theoretisch angenommenes, dreidimensionales Konstrukt zu bestätigen?
(2) Welche Zusammenhänge bestehen zwischen den Überzeugungen von Lehramtsstudierenden hinsichtlich Mehrsprachigkeit,
Personenmerkmalen und DaZ-Kompetenz?
Angelehnt an das im Projekt DaZKom (Köker et al. 2015) entwickelte Kompetenzmodell, wurden Skalen für den Einsatz bei
Lehramtsstudierenden (N = 427) konzipiert und erprobt. Die Skala besteht aus 31 Items mit einer EAP Reliabilität = 0.84.
Zusätzlich wurden Skalen zu inner- und außeruniversitären Lerngelegenheiten sowie Praxiserfahrungen im Bereich DaZ
eingesetzt (vgl. Hammer et al., 2015).
Auf Grundlage der Skalen- und Itemkennwerte wird deutlich, dass sich Einstellungen zu Mehrsprachigkeit mit einem RaschModell abbilden lassen. Die Ergebnisse der Erhebung sprechen zudem dafür, dass 75% der befragten Studierenden
sprachsensible Überzeugungen in Bezug auf Fachunterricht haben. 82% der Studierenden fühlen sich zuständig für
Sprachförderung, wohingegen nur 58% der Studierenden Wertschätzung für die Herkunftssprachen der Schülerinnen und
Schüler zeigt. Besonders Studierende mit Praxiserfahrung im Bereich DaZ zeigen positivere Einstellungen gegenüber
Mehrsprachigkeit als Studierende ohne Praxiserfahrung. Dies zeigt sich auch bei Studierenden mit einer höheren Anzahl an
universitären Lerngelegenheiten. Ein Zusammenhang zwischen der DaZ-Kompetenz und den DaZ-Einstellungen konnte
ebenfalls festgestellt werden – Studierende mit hoher DaZ-Kompetenz zeigten positivere Einstellungen zu Mehrsprachigkeit als
Studierende mit geringerer DaZ-Kompetenz. Diese Studie konnte somit herausstellen, dass universitäre Lerngelegenheiten nicht
nur auf kognitive Aspekte, sondern auch auf motivationale und volitionale Aspekte ausgerichtet werden sollten. Aus den
Ergebnissen sollen Schlussfolgerungen für die Gestaltung der universitären Lehre im Bereich DaZ abgeleitet werden. Zudem
werden Grenzen der Studie diskutiert und ein Ausblick auf weitere Forschungsdesiderate gegeben.
ID: 370
Symposium
Disziplinen-Cluster: Psychologie
Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Motivation und Emotion
Stichworte: Fähigkeitsselbstkonzept, Selbstwirksamkeitsüberzeugung, Schulleistung
Fähigkeitsselbstkonzept und Selbstwirksamkeitsüberzeugung im Kontext von Schulleistung
Chair(s): Anne Franziska Weidinger (Technische Universität Dortmund), Anja Meißner (Technische Universität Dortmund),
Ricarda Steinmayr (Technische Universität Dortmund)
Diskutant(en): Oliver Dickhäuser (Universität Mannheim)
Erfolgserwartungen, wie das Fähigkeitsselbstkonzept und die Selbstwirksamkeitsüberzeugung gelten als wichtige motivationale
Determinanten schulischen Leistungsverhaltens und des Bildungserfolgs (Wigfield, Eccles, Schiefele, Roeser & Davis-Kean,
2006). Lernende mit höheren Erfolgserwartungen zeigen bessere Schulleistungen als ihre Mitschülerinnen und Mitschüler mit
geringeren Erfolgserwartungen (zsf. Marsh & Martin, 2011). Im Sinne einer differenzierten Betrachtung des Zusammenspiels von
Erwartungen und Leistung werden die Zusammenhänge im vorliegenden Symposium in unterschiedlichen Domänen und für
unterschiedliche Altersgruppen, Schulformen sowie Leistungs- und Begabungsniveaus thematisiert.
In einer Längsschnittstudie mit insgesamt sieben Messzeitpunkten untersuchten Weidinger, Steinmayr und Spinath, ob sich vom
zweiten bis zum vierten Schuljahr Veränderungen in der Richtung des Zusammenhangs zwischen Fähigkeitsselbstkonzept und
Schulleistung ergeben. Entsprechend theoretischer Annahmen überwogen im Alter von sieben bis acht Jahren SkillDevelopment-Effekte, und erst gegen Ende der Grundschulzeit zeigte sich ein Einfluss des Fähigkeitsselbstkonzepts auf die
Leistungsveränderung der Kinder.
Herrmann, Schmidt, Kessels und Preckel untersuchten Referenzgruppeneffekte auf das Fähigkeitsselbstkonzept von
Fünftklässlerinnen und Fünftklässlern aus regulären Gymnasialklassen und aus Hochbegabtenklassen. Bei gleichzeitiger
Betrachtung von Kontrast- und Assimilationseffekten konnten sie für das Fach Mathematik – nicht jedoch für Deutsch – zeigen,
dass der durch die Leistungsstärke der Bezugsgruppe bedingte negative Kontrasteffekt in Hochbegabtenklassen vollständig
durch einen positiven Assimilationseffekt kompensiert wurde.
McElvany, Gebauer, Bos, Schöber und Köller untersuchten die Rolle der domänenspezifischen Selbstwirksamkeitsüberzeugung
von Siebtklässlerinnen und Siebtklässlern unterschiedlicher Schulformen für deren Leistung in standardisierten Mathematik- und
Lesetests und deren domänenspezifische Motivation. Während die domänenspezifische Selbstwirksamkeitsüberzeugung für die
Testleistung in Mathematik und Lesen gleich bedeutsam war, zeigte sich in Mathematik ein höherer Zusammenhang zwischen
Selbstwirksamkeitsüberzeugung und Motivation. Dieses Befundmuster blieb bei Kontrolle weiterer motivationaler Konstrukte
stabil, wobei sich die Effekte bei Berücksichtigung der kognitiven Grundfähigkeiten reduzierten. Dies zeigte sich sowohl für
leistungsschwächere als auch -stärkerer Lernende.
Meißner und Steinmayr untersuchten die relative Bedeutsamkeit von Fähigkeitsselbstkonzept und Intelligenz für die Schulleistung
von Achtklässlerinnen und Achtklässlern unterschiedlicher Schulformen in Mathematik und Deutsch. Dabei wurde die Art des
Schulleistungsindikators unterschieden. Während sich das domänenspezifische Fähigkeitsselbstkonzept in beiden Domänen als
bedeutsamster Prädiktor der jeweiligen Note erwies, leistete Intelligenz einen größeren (Mathematik) oder genauso großen
Beitrag (Deutsch) wie das domänenspezifische Fähigkeitsselbstkonzept zur Vorhersage der Testleistung. Dieses Befundmuster
zeigte sich unabhängig von der Schulform.
Zusammengefasst liefern die Studien wichtige Erkenntnisse zur Rolle von Erwartungen für die Schulleistung in unterschiedlichen
Domänen sowie verschiedener Schülergruppen. Die Befunde zeigen, dass eine differenzierte Betrachtung des Zusammenhangs
von Fähigkeitsselbstkonzept bzw. Selbstwirksamkeitsüberzeugung und Schulleistung aus theoretischer und praktischer Sicht
lohnenswert ist.
Beiträge des Symposiums
Von Skill-Development über Self-Enhancement zu reziproken Effekten: Veränderung der gegenseitigen
Beeinflussung von Fähigkeitsselbstkonzepten und Leistung in der Grundschule
Anne Franziska Weidinger1, Ricarda Steinmayr1, Birgit Spinath2
1
Technische Universität Dortmund, 2Ruprecht-Karls-Universität Heidelberg
Im Laufe der Grundschulzeit durchläuft das Fähigkeitsselbstkonzept verschiedene Veränderungen (zsf. Dweck, 2002). Zum
Beispiel differenziert es sich bei Kindern zwischen sieben und acht Jahren insofern aus, dass zunehmend besser zwischen
Fähigkeiten und Anstrengung unterschieden, und das Fähigkeitsselbstkonzept von anderen Selbstkonzeptfacetten (z.B. soziale
Kompetenz, Aussehen) klarer getrennt wird (Stipek & Mac Iver, 1989). Gleichzeitig steigt das Interesse der Kinder an sozialen
Vergleichen und der schulische Kontext bietet die Möglichkeit, diese vermehrt anzustellen (zsf. Dweck, 2002; Nicholls, 1984).
Diese Prozesse sollten dazu führen, dass Kinder ihre Fähigkeiten über die Grundschulzeit hinweg zunehmend realistischer
beurteilen können (Stipek, 1981). Tatsächlich zeigten sich mit zunehmendem Alter höhere Zusammenhänge zwischen dem
Fähigkeitsselbstkonzept und objektiven Leistungsmaßen bzw. Fremdeinschätzungen der Fähigkeiten (z.B. Asendorpf & van
Aken, 1993; Spinath & Spinath, 2005), und anfänglich sehr positive Fähigkeitsselbstkonzepte wurden im Laufe der Zeit negativer
(z.B. Spinath & Steinmayr, 2008). Für die Frage nach der gegenseitigen Beeinflussung von Fähigkeitsselbstkonzept und Leistung
bedeutet dies, dass bei Sieben- bis Achtjährigen vor allem Effekte der vorherigen Leistung in einer Domäne auf die Veränderung
des domänenspezifischen Fähigkeitsselbstkonzepts im Sinne von Skill-Development-Effekten (vgl. Calsyn & Kenny, 1977) zu
beobachten sein sollten, da sich das Fähigkeitsselbstkonzept erst einmal formieren muss. Erst mit ca. zehn Jahren sollte die
Unterscheidung zwischen Fähigkeit und anderen Faktoren (z.B. Anstrengung) sowie deren Effekte auf die eigene Leistung voll
ausgeprägt sein (Dweck, 2002; Nicholls & Miller, 1984). Erst, wenn Fähigkeiten als stabile Eigenschaft der Person verstanden
und nicht mehr nur an einzelnen Handlungsergebnissen festgemacht werden, sollten Fähigkeitsselbstkonzepte zu Prädiktoren
für zukünftiges Verhalten bzw. Leistung werden. Folglich sollten sich Effekte des Fähigkeitsselbstkonzepts auf die
Leistungsentwicklung (Self-Enhancement-Effekte; vgl. Calsyn & Kenny, 1977) erst zum Ende der Grundschulzeit zeigen.
Obgleich die gegenseitige Beeinflussung von Fähigkeitsselbstkonzepten und Leistung bereits bei Grundschulkindern untersucht
wurde (z.B. Helmke & van Aken, 1995; Guay, Marsh & Boivin, 2003; Viljaranta, Tolvanen, Aunola & Nurmi, 2014), wurde diese
Hypothese noch nicht geprüft. Mit dem Ziel diese Forschungslücke zu schließen, untersuchten wir den Kausalzusammenhang
zwischen Fähigkeitsselbstkonzept und Leistung bei Kindern vom achten bis zehnten Lebensjahr, wobei die Konstrukte
siebenmal, je im Abstand von vier Monaten kurz nach Einführung der Ziffernnoten erhoben wurden. Eine engmaschigere
Untersuchung des Zusammenhangs zwischen Fähigkeitsselbstkonzept und Leistung als in vorherigen Studien kann Aufschluss
darüber geben, ob sich in der schulischen Phase, in der Fähigkeitsselbstkonzepte stark geformt werden, Veränderungen in der
Richtung des Zusammenhangs ergeben.
Die Daten zur Untersuchung der Fragestellung stammen aus einer Längsschnittstudie mit 542 Grundschulkindern (t1: M = 7.95
Jahre, SD = 0.58; t7: M = 9.93 Jahre; SD = 0.72). Das Fähigkeitsselbstkonzept für Mathematik (Selbstberichtfragebögen) sowie
die Mathematiknote (Angabe der Lehrkraft) wurden zu sieben Messezeitpunkten vom Ende der zweiten bis zum Ende der vierten
Klasse erhoben. Die Daten wurden mit latenten Wachstumskurvenmodellen (LGCM) sowie einem latenten cross-lagged Modell
(CLM) ausgewertet.
Die univariaten LGCM zeigten, dass das Fähigkeitsselbstkonzept im Gegensatz zur Mathematiknote im Mittel über die Zeit abfiel,
wobei es signifikante interindividuelle Unterschiede in dem Abfall gab. Das CLM zeigte, dass Skill-Development-Effekte bis zum
Beginn der vierten Klasse (t5) geringer wurden, während Self-Enhancement-Effekte erwartungskonform größer wurden: Bis Mitte
der dritten Klasse (t3) zeigten sich nur Skill-Development-Effekte, dann reziproke Effekte (t3-t4) und zu Beginn der vierten Klasse
nur noch Self-Enhancement-Effekte (t4-t5). Ab Mitte der vierten Klasse überwogen erneut Skill-Development-Effekte (t5-t6),
bevor Skill-Development- und Self-Enhancement-Effekte am Ende der vierten Klasse (t6-t7) vergleichbar hoch ausfielen.
Unsere Ergebnisse zeigen, dass im Alter von sieben bis acht Jahren Skill-Development-Effekte überwiegen, und dass sich erst
gegen Ende der Grundschulzeit ein Einfluss des Fähigkeitsselbstkonzepts auf die Leistungsveränderung der Kinder zeigt. Dies
stützt theoretische Annahmen zur Motivationsentwicklung im Grundschulalter und es wird in Bezug auf die pädagogische Praxis
diskutiert.
Big fish in big ponds: Assimilations- und Kontrasteffekte in Hochbegabtenklassen
Julia Herrmann1, Isabelle Schmidt2, Ursula Kessels1, Franzis Preckel2
1
Freie Universität Berlin, 2Universität Trier
Theoretischer Hintergrund:
Der sogenannte Big-Fish-Little-Pond-Effekt (BFLPE; Marsh & Parker, 1984) besagt, dass sich die Zugehörigkeit zu
leistungsstarken Referenzgruppen ungünstig auf akademische Selbstkonzepte (ASKs) von SchülerInnen auswirken kann, was
insbesondere für die Hochbegabtenförderung in Spezialklassen einen großen Nachteil bedeuten würde. Ursprünglich wurde der
BFLPE als reiner negativer Kontrasteffekt (negativer Einfluss des mittleren Leistungsniveaus der Klasse auf ASKs bei
Konstanthaltung der individuellen Fähigkeit) beschrieben und als solcher bereits gründlich beforscht und repliziert. Neuere
Konzeptionen des BFLPE (z. B. Marsh & Craven, 2002) berücksichtigen, dass sich die Zugehörigkeit zu einer leistungsstarken
Gruppe auch positiv auf ASKs auswirken kann (z. B. weil mit der Gruppenzugehörigkeit ein gewisser Status einhergeht und weil
man sich positive Eigenschaften, die die Gruppe charakterisieren, auch selbst zuschreiben kann – ein sogenannter positiver
Assimilationseffekt). Verglichen mit der großen Anzahl herkömmlicher BFLPE-Studien ist bislang in nur wenigen
Forschungsarbeiten versucht worden, Assimilations- und Kontrasteffekte voneinander zu trennen. Genaueren Aufschluss über
die jeweilige Stärke und ein evtl. domänenspezifisches Auftreten dieser gegenläufigen Effekte zu gewinnen, erscheint jedoch
lohnenswert und gerade in Hochbegabtenstichproben interessant, da hier Hinweise auf starke Assimilationseffekte durch
Fähigkeitsgruppierungsmaßnahmen vorliegen (z. B. Preckel & Brüll, 2010; Rindermann & Heller, 2005).
Fragestellung:
Die Studie geht der Frage nach, ob sich bei Leistungsgruppierung in reguläre Gymnasial- und spezielle Hochbegabtenklassen
innerhalb der gleichen Schulen BFLPEs auf domänenspezifische ASKs zeigen und dabei negative Kontrast- und positive
Assimilationseffekte trennen lassen.
Hypothesen:
Bei Kontrolle der individuellen kognitiven Leistungsfähigkeit zeigen sich simultan:
- Ein negativer Kontrasteffekt des Klassenleistungsniveaus
- Ein positiver Assimilationseffekt der Hochbegabtenklassenzugehörigkeit auf die ASKs.
Die gegenläufigen Effekte lassen sich sowohl für das ASK im Fach Mathematik als auch für das ASK im Fach Deutsch zeigen.
Die Replikation des BFLPE gelingt bei relativ breiter und schulferner Leistungsoperationalisierung über ein Intelligenzmaß.
Die Effekte bleiben bei Kontrolle für früheres ASK bestehen.
Methode:
An der Studie nahmen 1330 FünftklässlerInnen teil, die entweder reguläre Gymnasial- oder spezielle Hochbegabtenförderklassen
besuchten (42 reguläre Klassen, n = 1069, 48% Mädchen; 15 Hochbegabtenförderklassen, n = 261, 39% Mädchen).
Datenerhebungen fanden zu drei Zeitpunkten statt:
- Beginn Kl. 5: 1. Erhebung ASK Mathematik und Deutsch (Self-Description Questionnaire, SDQ II; Marsh, 1990)
- Ca. 4 Wochen nach dem Schulübergang: 2. Erhebung ASK Mathematik und Deutsch (SDQ II)
- 10-12 Wochen nach dem Schulübergang: Erhebung Intelligenz (Kognitiver Fähigkeitstest für 4. bis 12. Klassen, Revision, KFT
4-12+ R; Heller & Perleth, 2000)
Zur Datenauswertung wurden in Mplus Random-Intercept Mehrebenen-Regressionsanalysen durchgeführt und dabei ein
schrittweises Vorgehen gewählt. Die ASK-Domänen Mathematik und Deutsch wurden separat betrachtet (AV: ASK Mathe bzw.
Deutsch zu T2). Bei Konstanthaltung der individuellen Leistungsfähigkeit (numerische oder verbale Intelligenz) wurden zunächst
nur negative Kontrasteffekte (operationalisiert über das durchschnittliche Intelligenzniveau der Klasse im numerischen bzw.
verbalen Bereich) bzw. positive Assimilationseffekte (operationalisiert über den Klassentyp: reguläre vs.
Hochbegabtenförderklasse) jeweils einzeln geprüft. Anschließend wurden beide antagonistischen Effekte simultan modelliert
sowie das ASK in Mathematik bzw. Deutsch zu T1 mit ins Modell aufgenommen, um auszuschließen, dass es sich bei den
erwarteten Assimilationseffekten um Auswirkungen a priori hoher ASKs bei den SchülerInnen in den Hochbegabtenklassen
handelte.
Ergebnisse und Diskussion:
Bei einzelner Modellierung ließen sich weder in der mathematischen noch in der verbalen Domäne Kontrast- oder
Assimilationseffekte zeigen. Bei gleichzeitiger Aufnahme beider Ebene-2-Prädiktoren (Leistungsniveau der Klasse und
Klassentyp) ins Modell trat für Mathematik der erwartete Suppressionseffekt auf: Es zeigte sich ein positiver Assimilationseffekt
der Zugehörigkeit zu einer Hochbegabtenklasse, der einen negativen - durch die Leistungsstärke der Bezugsgruppe bedingten -
Kontrasteffekt vollständig kompensierte. Dieses Ergebnismuster blieb auch bei Kontrolle für vorbestehendes ASK erhalten. Für
Deutsch zeigten sich entgegen der Hypothese auch bei simultaner Modellierung keinerlei Referenzgruppeneffekte. Es wird
diskutiert, wodurch dieses bereichsspezifische Befundmuster zustande gekommen sein könnte und welche Implikationen die
Ergebnisse für die Hochbegabtenförderung in Spezialklassen haben.
Prädiktion von Motivation und Kompetenz in Mathematik und Lesen: Die Bedeutung der
Selbstwirksamkeitsüberzeugung im Kontext motivationaler und kognitiver Merkmale
Nele McElvany1, Miriam M. Gebauer1, Wilfried Bos1, Christian Schöber2, Olaf Köller2
1
Institut für Schulentwicklungsforschung, TU Dortmund, 2IPN, Universität Kiel
Ziel schulischer Bildung ist multikriterialer Kompetenzerwerb (vgl. Landesschulgesetze). Hierzu zählen neben psychischem
Wohlbefinden, Persönlichkeitsmerkmalen und sozialen Kompetenzen insbesondere kognitiven Kompetenzen und motivationale
Orientierungen (vgl. Baumert & Köller, 2000; Fend, 1980; Kunter, 2005). Grundlegende kognitive Kompetenzen im schulischen
Kontext sind unter anderem Mathematik- und Lesekompetenz. Im Bereich der motivationalen Merkmale gehört die Förderung
der intrinsischen Motivation (vgl. Deci & Ryan, 1993) gegenüber Mathematik und Lesen zu den Bildungszielen. Im
Zusammenspiel multipler Determinanten für Bildungserfolg von Lernenden gelten auch Selbstwirksamkeitsüberzeugungen als
relevante individuelle Bedingungsfaktoren (Pajares & Urdan, 2006). Diese beeinflussen - als das Vertrauen in die eigene
Kompetenz bezogen auf zukünftige Handlungen und die Einschätzung des zu erwartenden (Miss)Erfolgs - Planung, Organisation
und Durchführung von Handlungen (Bandura, 1997). Die Relevanz von Selbstwirksamkeitsüberzeugungen kann insgesamt als
gut gesichert gelten. Es liegen jedoch bisher wenige Erkenntnisse zur differentiellen Bedeutung für Kompetenz und Motivation in
unterschiedlichen schulischen Domänen vor. Dies gilt auch für die simultane Berücksichtigung anderer motivationaler
Einflussfaktoren, wie akademischem Selbstkonzept, Lernzielorientierung und Schulfreude, und von kognitiven Grundfähigkeiten
sowie für Befundmuster unterschiedlich leistungsstarker Schülergruppen.
Vor diesem Hintergrund werden vier Forschungsfragen untersucht:
(1) Hat mathematikbezogene Selbstwirksamkeitsüberzeugung für Mathematikmotivation und Mathematikleistung eine stärkere
prädiktive Kraft als lesebezogene Selbstwirksamkeitsüberzeugung für Lesemotivation und Lesekompetenz?
(2) Sind domänenspezifische Selbstwirksamkeitsüberzeugungen auch bei Berücksichtigung anderer zentraler motivationaler
Merkmale (akademisches Selbstkonzept, Lernzielorientierung, Schulfreude) prädiktiv für (a) Mathematik- und Lesemotivation
sowie (b) Mathematik- und Lesekompetenz?
(3) Sind domänenspezifische Selbstwirksamkeitsüberzeugungen auch bei zusätzlicher Berücksichtigung der kognitiven
Grundfähigkeiten neben motivationalen Merkmalen signifikante Prädiktoren für domänenspezifische Motivation und Kompetenz?
(4) Gilt das Befundmuster gleichermaßen bei leistungsschwächeren wie bei leistungsstärkeren Schülergruppen?
Aufgrund der expliziten Vermittlung von Mathematik im Rahmen des Mathematikunterrichts verbunden mit
Leistungsrückmeldungen wird eine stärkere Relevanz der Selbstwirksamkeitsüberzeugungen für diesen Bereich als für die
Lesekompetenz, die eher implizite Grundlage des Lernens in der weiterführenden Schule ist, erwartet. Darüber hinaus wird
angenommen, dass die Selbstwirksamkeitsüberzeugungen auch bei Berücksichtigung anderer motivationaler Merkmale sowie
der kognitiven Grundfähigkeiten bedeutsame Prädiktoren bleiben und dass das Ergebnismuster bei Schülergruppen an
Hauptschulen (leistungsschwach) und Gymnasien (leistungsstark) vergleichbar ist.
Es wurden die Daten von 1.307 Schülerinnen und Schülern der 7. Klassenstufe an Haupt- und Gesamtschulen sowie Gymnasien
analysiert, die im Rahmen der Studie Se-Mig erhoben wurden (51.1% weiblich, M = 12.1 Jahre [SD = 0.6]). Die Kompetenztests
wurden anhand von Aufgaben aus mehreren großen Studien (u.a. LAU, TIMSS) für die Zielgruppe zusammengestellt und skaliert
(WLE-Scores). Die Mathematik- und Lesemotivation wurden als intrinsische Komponente angelehnt an Möller und Bonerad
(2007) parallel formuliert erfasst. Ebenso wurden die Selbstwirksamkeitsüberzeugungen bezogen auf Mathematik- und
Lesekompetenz parallel erhoben (angelehnt an Jerusalem & Satow, 1999). Akademisches Selbstkonzept, Lernzielorientierung
und Schulfreude wurden ebenfalls mit reliablen Skalen gemessen. Zur Erfassung der kognitiven Grundfähigkeiten wurden zwei
Subtests aus dem KFT 5-12+ R (Heller & Perleth, 2000) eingesetzt. Die Analysen in dem Programm Mplus 7.11 erfolgten (1) mit
Strukturgleichungsmodellen und (2) Modellfitvergleichen bei Gleichsetzung von zu vergleichenden Pfaden. Aufgrund der
Stichprobengröße konnten nur die Mathematik- und Lesemotivation latent modelliert werden.
Die Ergebnisse zeigen zunächst, dass die Selbstwirksamkeitsüberzeugungen für Motivation im Bereich Mathematik stärker
prädiktiv sind (β = .67) als für den Bereich Lesen (β = .42) und die Selbstwirksamkeit der jeweils anderen Domäne negativ
prädiktiv sind. Für die Kompetenzen sind die jeweiligen Selbstwirksamkeitsüberzeugungen vergleichbar bedeutsam (β = .28 für
Mathematik, β = .23 für Lesen). Das Befundmuster bleibt insgesamt auch bei Berücksichtigung der zusätzlichen motivationalen
Bedingungen stabil, wobei sich die Prädiktionskraft deutlich reduziert, wenn in einem weiteren Schritt die kognitiven
Grundfähigkeiten aufgenommen werden (χ2[106]= 456.087, p < .05, CFI = .96, RMSEA = .05; R2 zwischen .45 [Lesekompetenz]
und .71 [Lesemotivation]). Das Befundmuster ist für leistungsschwächere überwiegend vergleichbar mit leistungsstärkeren
Lernenden.
Implikationen für Forschung und Praxis, insbesondere die Förderung der Selbstwirksamkeitsüberzeugungen, werden diskutiert.
Zur relativen Bedeutsamkeit des Fähigkeitsselbstkonzeptes und der Intelligenz bei der Vorhersage von
Testleistung und Schulnoten: Spielt die Domäne eine Rolle?
Anja Meißner, Ricarda Steinmayr
Technische Universität Dortmund
Beim Fähigkeitsselbstkonzept handelt es sich um eines der zentralen Konstrukte in der empirischen Bildungsforschung, da es
das Lern- und Leistungsverhalten der Schülerinnen und Schüler (SuS) wesentlich beeinflusst (z.B. Helmke & van Aken, 1995; s.
Eccles & Wigfield, 2002). Verschiedene Studien zeigten, dass das Fähigkeitsselbstkonzept über bewährte kognitive Konstrukte
wie die Intelligenz hinaus die Schulleistung vorhersagen konnte (z.B. Helmke, 1992; Steinmayr & Spinath, 2009).
Fähigkeitsselbstkonzept und Intelligenz haben sich jedoch als interkorrelierte Prädiktoren schulischer Leistungen erwiesen (z.B.
Steinmayr & Meißner, 2013). Um die Bedeutsamkeit des Fähigkeitsselbstkonzeptes für die Schulleistung einzuschätzen, sollte
neben dem eigenständige Anteil auch der mit Intelligenz gemeinsam aufgeklärte Varianzanteil betrachten werden. Die
Varianzanteile, die allein durch einen Prädiktor oder durch beide Prädiktoren gemeinsam in der Schulleistung aufgeklärt wurden,
variieren jedoch erheblich zwischen Studien. Diese heterogene Befundlage könnte darauf zurückzuführen sein, dass in den
Studien unterschiedliche Schulleistungsindikatoren (z.B. standardisierte Tests, Schulnoten) verwendet wurden. Bislang haben
nur wenige Studien untersucht, ob sich die relative Bedeutsamkeit motivationaler und kognitiver Prädiktoren in Abhängigkeit vom
Leistungsindikator unterscheidet (z.B. Helmke, 1992; Sauer & Gamsjäger, 1996; Steinmayr & Meißner, 2013). Für die Domäne
Mathematik wurde gezeigt, dass Intelligenz der beste Prädiktor zur Vorhersage der Testleistung war, während
Fähigkeitsselbstkonzept und Intelligenz einen vergleichbaren Beitrag zur Vorhersage der Noten leisteten (Helmke, 1992;
Steinmayr & Meißner, 2013). Ein anderes Befundmuster zeigte sich jedoch für die Domäne Lesen (Meißner, McElvany &
Steinmayr, 2015), sodass domänen-spezifische Effekte anzunehmen sind. Um Schlussfolgerungen über domänen-spezifische
Effekte ziehen zu können, bedarf es Studien, die Fähigkeitsselbstkonzept und Intelligenz sowie verschiedene schulische
Leistungsindikatoren in mehreren Domänen an einer Stichprobe untersuchen. Uns ist keine Studie bekannt, die diesem Anspruch
gerecht wird. Aus diesem Grund soll in der vorliegenden Studie untersucht werden, ob sich die relative Bedeutsamkeit von
Fähigkeitsselbstkonzept und Intelligenz in Abhängigkeit vom Schulleistungskriterium (Testleistung und Schulnoten) und der
Domäne (Mathematik und Deutsch) unterscheidet.
Es wurden N = 689 SuS (M = 13.3 Jahre, SD = 0.6, 366 Mädchen) der 8. Jahrgangsstufe von 4 Gymnasien und 4 Realschulen
untersucht. Wir erfassten standardisiert die Mathematikleistung (TIMSS; Baumert et al., 1998) und die Deutschleistung (indiziert
über die Leseleistung: LGVT 6-12 von Schneider, Schlagmüller & Ennemoser, 2007; und die Rechtschreibleistung: START-R
von Kersting, in Vorbereitung) sowie die Zeugnisnoten in Mathematik und Deutsch (Schülerangabe) als Kriterien. Die domänenspezifischen Fähigkeitsselbstkonzepte (SESSKO; Schöne, Dickhäuser, Spinath & Stiensmeier-Pelster, 2002) und die Intelligenz
(CFT 20-R; Weiß, 2006) wurden als Prädiktoren erfasst. Es wurde ein latentes Strukturgleichungsmodell berechnet und mittels
latenter Mehr-Gruppenvergleiche geprüft, ob sich Unterschiede zwischen den Schulformen zeigen. Anschließend wurden
Kommunalitätenanalysen (s. Pedhazur, 1997) berechnet.
Die latenten Mehr-Gruppenvergleiche zeigten, dass Messinvarianz gegeben war und sich die Strukturbeziehungen zwischen den
Schulformen nicht unterschieden. Folglich wurde das Strukturgleichungsmodell mit der Gesamtstichprobe berechnet. Im Rahmen
der latenten multiplen Regressionsanalysen leisteten das domänen-spezifische Fähigkeitsselbstkonzept und die Intelligenz einen
bedeutsamen Beitrag zur Vorhersage der Testleistung und der Schulnoten in Mathematik und Deutsch. Für die Domäne
Mathematik erwies sich die Intelligenz als bester Prädiktor zur Vorhersage der Testleistung, während sich das domänenspezifische Fähigkeitsselbstkonzept als bester Prädiktor zur Vorhersage der Mathematiknote erwies. In Deutsch leisteten das
domänen-spezifische Fähigkeitsselbstkonzept und die Intelligenz einen vergleichbaren Beitrag zur Vorhersage der Testleistung,
während sich das domänen-spezifische Fähigkeitsselbstkonzept als bester Prädiktor zur Vorhersage der Deutschnote erwies.
Ein bedeutsamer Anteil der Varianz im Mathematiktest und den Mathematiknoten wurde durch die Prädiktoren gemeinsam
erklärt. Der Anteil gemeinsam erklärter Varianz im Deutschtest und den Deutschnoten fiel hingegen sehr gering aus. Die
Ergebnisse sprechen dafür, dass sich die relative Bedeutsamkeit des Fähigkeitsselbstkonzepts in Abhängigkeit vom
Leistungsindikator und der Domäne unterscheidet. Die Ergebnisse werden im Hinblick auf die differentielle Bedeutsamkeit des
Fähigkeitsselbstkonzeptes in verschiedenen Leistungskontexten diskutiert.
ID: 380
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Soziologie
Thematisches Cluster: Berufliche Bildung, Hochschulbildung, Inklusion
Stichworte: Promotionsphase; Postdocphase; soziale Herkunft; Verselbständigung; Forschungsprogramm
Against the Odds? Akademische Verselbständigung im Kontext erwartbarer und erwartungswidriger
Karriereverläufe in der Wissenschaft
Chair(s): Susanne Maria Weber (Philipps-Universität Marburg)
Diskutant(en): Kolja Briedis (DZHW)
Die Karriereverläufe von NachwuchswissenschaftlerInnen sind untrennbar verknüpft mit ihren Bildungsverläufen; ‚Erfolg‘ lässt
sich in dieser Doppelstruktur nicht allein über den Erwerb formaler Bildungsabschlüsse oder das Besetzen bestimmter beruflicher
Positionen bestimmen, sondern kommt letztlich in der Fähigkeit zum Ausdruck, als eigenständige WissenschaftlerInnen
wissenschaftliche Praxis mitgestalten zu können. Welche konkreten Lern- und Bildungsprozesse sich im Verlauf der einzelnen
Qualifizierungs- und Karrierephasen aber vollziehen müssen, um in dieser Weise ‚erfolgreiche‘ Verläufe wissenschaftlicher
Nachwuchskarrieren zu produzieren, ist nicht nur eine für die NachwuchswissenschaftlerInnen selbst sowie für etablierte
WissenschaftlerInnen und für Wissenschaftsorganisationen drängende, sondern auch eine bildungs- und wissenschaftspolitisch
viel diskutierte Frage.
Wie wird also akademische Verselbständigung im Kontext erwartbarer und erwartungswidriger Verläufe wissenschaftlicher
Nachwuchskarrieren hervorgebracht? Dieser Frage geht das hier vorgeschlagene Symposium nach, indem aktuelle empirische
Forschungsergebnisse aus Projekten des BMBF-Programms „Forschung zum Wissenschaftlichen Nachwuchs“ diskutiert
werden. Die einzelnen Beiträge nutzen unterschiedliche disziplinäre, theoretische und methodische Zugänge, um akademische
Verselbständigung entlang des Prozessverlaufs akademischer Karrierewege zu rekonstruieren.
Dieser Logik folgend nimmt das Symposium seinen Ausgangspunkt bei der Betrachtung von Bildungsverläufen „vom Abitur bis
zur Promotion“ und der hierbei zu bewältigenden Übergänge – dabei zeigen Anna Bachsleitner, Michael Becker, Marko Neumann
und Kai Maaz (DIPF), wie der Übergang in die Promotion von der sozialen Herkunft beeinflusst wird und wie Herkunftseffekte
auf primäre und sekundäre Effekte zurückzuführen sind. Verselbständigungsprozesse in der Promotionsphase untersuchen die
Beiträge von Anna Brake, Hannah Burger und Julia Elven (Universität Augsburg) sowie von Jörg Schwarz, Franziska Teichmann
und
Susanne
Weber
(Philipps-Universität
Marburg),
wobei
erstere
die
habituellen
Strukturen
von
NachwuchswissenschaftlerInnen und letztere die institutionalisierten Strukturen ihrer Arbeitszusammenhänge fokussieren.
Schließlich kann als eine zentrale Leistung am Ende dieses Prozess der Verselbständigung von NachwuchswissenschaftlerInnen
die Herausbildung eines selbständigen Forschungsprogramms stehen: Grit Laudel und Jana Bielick (TU Berlin) zeigen in ihrem
Beitrag, unter welche Bedingungen die dafür notwendigen Lernprozesse stattfinden und zum Erfolg führen. Schließlich wird Kolja
Briedis (DZHW) die Beiträge vor dem Hintergrund des Tagungsthemas diskutieren.
Gemeinsam ist den im geplanten Symposium versammelten Beiträgen damit eine prozessuale Perspektive auf die
Verselbständigung von NachwuchswissenschaftlerInnen – dabei helfen nicht nur die unterschiedlichen vertretenen disziplinären
Perspektiven aus Erziehungswissenschaft und Soziologie, sondern auch die unterschiedlichen methodischen Zugänge
quantitativer und qualitativer Provenienz, eine komplexe Rekonstruktion von Verselbständigung im Rahmen erwartbarer und
erwartungswidriger Karriereverläufe in der Wissenschaft zu leisten.
Beiträge des Symposiums
Soziale Herkunftseffekte beim Übergang in die Promotion
Anna Bachsleitner, Michael Becker, Marko Neumann, Kai Maaz
DIPF
Während der Einfluss der sozialen Herkunft für frühe Übergänge im Bildungssystem, vor allem für den Übertritt in die
Sekundarstufe sowie ins Studium, vielfach nachgewiesen worden ist, finden sich zu späteren Bildungsübergängen, wie der
Aufnahme einer Promotion, kaum Untersuchungen (Möller, 2013). Insbesondere mangelt es an Studien, die soziale
Herkunftseffekte beim Promotionsübergang unter der Perspektive primärer und sekundärer Effekte betrachten.
Die Unterscheidung in primäre und sekundäre Effekte geht zurück auf Boudon (1974), der Bildungsungleichheit als das Ergebnis
von Unterschieden zwischen sozialen Schichten in Leistungen (primäre Effekte) und Bildungsentscheidungen (sekundäre
Effekte) versteht. Nach Esser (1999) wägen Personen bei einer Bildungsentscheidung den Nutzen der weiterführenden Bildung,
die Kosten, ihre subjektive Erfolgswahrscheinlichkeit und ihren potentiellen Statusverlust ab. Höhere soziale Schichten sollten
sich eher für weiterführende Bildung entscheiden, da für sie ein hoher Bildungsabschluss notwendig zum sozialen Statuserhalt
ist und sie eine höhere Erfolgswahrscheinlichkeit durch eine geringere Distanz zu hoher Bildung haben. Da es jedoch im
Bildungsverlauf durch die verschiedenen Selektionsstufen sowie die zunehmende Unabhängigkeit vom Elternhaus zu einer
Abnahme des Einflusses sozialer Herkunft kommen sollte (Blossfeld/Shavit, 1993), stellt sich die Frage, ob und in welchem
Umfang die soziale Herkunft beim Übergang in die Promotion noch eine Rolle spielt.
Bisherige Befunde zum Zusammenhang von sozialer Herkunft und Promotion basieren größtenteils auf
Promovierendenbefragungen, die darauf hindeuten, dass Promovierende eine nach sozialer Herkunft selektive Gruppe darstellen
(u.a. Enders/Bornmann, 2001). Vergleichende Untersuchungen für den Promotionsübergang zwischen Promovierenden und
nichtpromovierenden Hochschulabsolventen gibt es jedoch bislang kaum. Jaksztat (2014) berichtet einen positiven Effekt der
Bildungsherkunft auf den Promotionsübergang, der hauptsächlich auf Leistungsunterschiede, die Fachrichtungswahl und die
Tätigkeit als studentische Hilfskraft zurückzuführen ist. Jedoch wurde bisher noch nicht explizit das Verhältnis primärer und
sekundärer Effekte beim Promotionsübergang untersucht.
Ausgehend von der noch lückenhaften Forschungslage soll in dieser Studie untersucht werden, inwieweit der Übergang in die
Promotion von der sozialen Herkunft beeinflusst wird und wie sich ein potentieller Effekt erklären lässt. Dabei soll mit Hilfe einer
Effektdekomposition auch ermittelt werden, welche Anteile des Herkunftseffektes auf primäre und sekundäre Effekte
zurückzuführen ist.
Die Untersuchung basiert auf den Daten der Längsschnittstudie BIJU (Bildungsverläufe und psychosoziale Entwicklung im
Jugend- und jungen Erwachsenenalter), die die Bildungsverläufe von ehemaligen 7.-Klässlern bis zu Beginn ihres vierten
Lebensjahrzehntes beinhaltet. Die Stichprobe umfasst 2.214 Hochschulabsolventen, 316 davon mit aufgenommener Promotion.
Es wurden eine logistische Regression zur Vorhersage der Promotionsaufnahme und eine Effektdekomposition mit der Methode
khb (Karlson/Holm/Breen, 2012) durchgeführt. Die soziale Herkunft wird durch die Bildungsherkunft, kategorisiert in Eltern ohne
Hochschulabschluss, mindestens ein Elternteil mit Hochschulabschluss und mindestens ein Elternteil mit Promotion,
operationalisiert. Zur Messung der primären Effekte werden Abitur- und Studiennote sowie die Ergebnisse standardisierter
Leistungstests (kognitive Grundfähigkeiten, Englisch, Mathematik) als Prädiktoren verwendet. Zudem werden verschiedene
Indikatoren zu Kosten-Nutzen-Abwägungen aus der Studienzeit einbezogen. Als Kontrollvariablen dienen das Geschlecht, die
Studienfachgruppen und die Hochschulform.
In den Ergebnissen zeigt sich, dass ein positiver Effekt eines höheren Bildungshintergrundes auf den Promotionsübergang
nachweisbar ist. Dieser bleibt auch nach Kontrolle des Studienfaches und der Hochschulform für Hochschulabsolventen
bestehen, von denen mindestens ein Elternteil selber promoviert hat. Bei Aufnahme der Leistungsparameter verliert der
Herkunftseffekt an statistischer Signifikanz. Die Indikatoren der Kosten-Nutzen-Abwägung reduzieren ebenfalls den Effekt des
Bildungshintergrundes, dieser bleibt jedoch weiterhin signifikant. Die Effektdekomposition zur Ermittlung des Verhältnisses von
primären und sekundären Effekten deutet darauf hin, dass sekundäre Effekte von größerer Relevanz für den
Promotionsübergang sind. Jedoch variiert das Verhältnis, je nachdem ob die Abschlussnoten oder die Leistungstests als Maße
der primären Effekte verwendet werden.
Habitus als Ermöglichungsstruktur von Verselbständigungsprozessen in wissenschaftli-chen
Nachwuchskarrieren
Anna Brake1, Hannah Burger2, Julia Elven2
1
Philipps-Universität Marburg, 2Universität Augsburg
Autonomie gilt gleichermaßen als Ziel wie auch als Ausweis erfolgreicher wissenschaftlicher Laufbahnen. Die Befähigung zu
einer eigenständigen wissenschaftlichen Praxis kann damit nicht nur als zentrales Ziel von Lern- und Sozialisationsprozessen in
wissenschaftlichen Nachwuchskarrieren verstanden werden, sondern auch als erfolgskritische Voraussetzung für den weiteren
Karriereverlauf. Doch obwohl dies so ist, liegen bisher wenige Erkenntnisse dazu vor, wie Selbständigkeit in den
unterschiedlichen Phasen wissenschaftlicher Laufbahnen ermöglicht und in konkreten Arbeitszusammenhängen praktisch
hervorgebracht wird.
Aus praxistheoretischer Perspektive, in der wissenschaftliche Nachwuchskarrieren als Trajektorien in den Blick kommen, die im
Zusammenspiel habitualisierter und institutionalisierter Strukturen hervorgebracht werden (Bourdieu 1987; 2002), wird deutlich,
dass Prozesse der Verselbständigung erstens sehr voraussetzungsreich sind und zweitens sehr unterschiedlich verlaufen
können. Mit Blick auf die akteursseitigen Voraussetzungen von Verselbständigung in wissenschaftlichen Nachwuchskarrieren
kommt daher dem Konzept des Habitus eine zentrale Bedeutung zu. Als langfristig biographisch erworbenes, herkunfts- und
laufbahnspezifisches Dispositionssystem bildet er die Grundlage für weitere Lern- und Sozialisationsprozesse in der
Promotionsphase.
Im
Zusammenspiel mit den
institutionalisierten Strukturen konkreter
wissenschaftlicher
Arbeitszusammenhänge sind die als Habitus verdichteten inkorporierten Denk-, Wahrnehmungs- und Handlungsstrukturen der
NachwuchswissenschaftlerInnen an der Hervorbringung einer wissenschaftlichen Praxis beteiligt, in der Verselbstständigung erst
ermöglicht, erleichtert oder auch begrenzt wird.
Von dieser theoretischen Perspektive ausgehend fragen wir im vorgeschlagenen Beitrag danach, in welcher Weise habitualisierte
Denk-, Wahrnehmungs- und Handlungsmuster für Verselbständigungsprozesse in der Promotionsphase wirksam werden, wie
sie diese Prozesse in den konkreten wissenschaftlichen Arbeitszusammenhängen, in die die NachwuchswissenschaftlerInnen
eingebunden
sind,
ermöglichen
oder
begrenzen,
und
in
welcher Weise
die
daraus
resultierenden
Verselbständigungskonstellierungen für die weitere Trajektorie wirksam werden (können).
Der Beitrag basiert auf Ergebnissen des Forschungsprojekts „Trajektorien im akademischen Feld – Habitus als
Ermöglichungsstruktur wissenschaftlicher Nachwuchskarrieren“. Für das Projekt wurden 30 leitfadengestützte Interviews mit
NachwuchswissenschaftlerInnen aus akademischen und nicht-akademischen Elternhäusern geführt, die in unterschiedlichen
organisationalen Kontexten promoviert haben. Alle InterviewpartnerInnen hatten zum Zeitpunkt der Erhebung ihre Promotion
eingereicht bzw. vor maximal sechs Monaten verteidigt und befanden sich damit in einer für ihre Karriereverläufe kritischen
Übergangsphase. Etwa eineinhalb Jahre nach dem Erstinterview wird über eine telefonische Nachbefragung zusätzlich der
weitere Karriereverlauf erhoben. Auf der Basis dieses Materials können unter Rückgriff auf die dokumentarische Methode
(Bohnsack 2010; Nohl 2013) habituelle Orientierungen rekonstruiert werden, die Verselbständigungsprozesse in
wissenschaftlichen Nachwuchskarrieren in je spezifischer Weise erleichtern oder limitieren. Dabei richtet sich die Analyse nicht
nur darauf, in welchen thematischen Zusammenhängen die NachwuchswissenschaftlerInnen sich (explizit) mit Selbständigkeit
auseinandersetzen. Aufschlussreich ist insbesondere auch, wie sie von ihrer bisherigen Laufbahn und ihrer wissenschaftlichen
Alltagspraxis erzählen. Über den in der dokumentarischen Methode angelegten systematischen Vergleich lassen sich dabei
Gemeinsamkeiten und Unterschiede entlang relevanter Strukturmerkmale – u.a. der sozialen Herkunft – rekonstruieren.
In der Analyse des Interviewmaterials konnten dabei unterschiedliche Dimensionen herausgearbeitet werden, anhand derer sich
Verselbständigungsprozesse in wissenschaftlichen Nachwuchskarrieren systematisieren und vergleichen lassen. Danach
können diese sich beziehen auf: 1. die wissenschaftliche Alltagspraxis (z.B. das Schreiben von Artikeln oder Vorbereiten und
Halten von Lehrveranstaltungen); 2. die Art und Weise, mit der die NachwuchswissenschaftlerInnen sich in ein (reflexives)
Verhältnis zum wissenschaftlichen Feld setzen sowie die spezifischen Feldrekonstruktionen, die sich darin ausdrücken und 3.
die soziale Einbindung der NachwuchswissenschaftlerInnen auf der Ebene der Arbeitsbeziehungen in den Arbeitsbereichen
(Betreuer, Peers) sowie in darüber hinausgehende Netzwerke. Die bisherigen Analysen verdeutlichen, dass Verselbständigung
sich in diesen Dimensionen auf der Ebene des Einzelfalls durchaus spannungsreich und widersprüchlich gestalten kann, sodass
den (konvergenten, ambivalenten…) Relationen dieser Dimensionen eine besondere Bedeutung zukommt. Die Ergebnisse der
vergleichenden Analyse entlang dieser Dimensionen und ihrer Relationen werden im Beitrag insbesondere mit Blick auf die
Bedeutung diskutiert, die die herausgearbeiteten Verselbständigungskonstellierungen für die weiteren Trajektorien der
NachwuchswissenschaftlerInnen haben (können).
Institutionelle Strukturierung von Verselbständigungsprozessen im akademischen Feld
Jörg Schwarz, Franziska Teichmann, Susanne Maria Weber
Philipps-Universität Marburg
Autonomie und Selbständigkeit von WissenschaftlerInnen werden diskutiert als Wert und wichtiger Bestandteil der akademischen
Identität, die auf der Ebene individueller und disziplinär je spezifischer kollektiver Orientierungsmuster geformt und erhalten
werden (Henkel 2005). Problematisiert wird aber auch ihr drohender Verlust im Zuge aktueller Politikstrategien, die Auswirkungen
auf klassisch „autonome“ Orientierungsmuster von WissenschaftlerInnen haben. Diskutiert wird hier die heteronome
Überformung im Kontext von Audit, Controlling und Fremdsteuerung der managerialen Universität (Clarke/Knights 2015).
Autonomie wird weiterhin thematisiert als Anforderung der akademischen Profession und eines akademischen
Selbstverständnisses. Aus dieser Perspektive bedarf akademische Autonomie der aktiven Weitergabe im Generationenverhältnis
der Wissenschaft (Hamilton 2007). Die Freiheit von Forschung und Lehre, die kollektive Praxis der Selbstkontrolle in Peer Review
sowie die akademische Selbstverwaltung fasst Hamilton (2007) als sozialen Kontrakt. Mit diesem gehe die Verantwortung einher,
die Autonomie akademischer Professioneller an die nachfolgenden WissenschaftlerInnen-Generationen weiterzugeben, wenn
man nicht die akademische Autonomie riskieren wolle.
In der deutschsprachigen Diskussion finden wir „Autonomie“ als nachwuchspolitische Forderung, als Ausbildungsprojekt des
wissenschaftlichen Nachwuchses, als erwartete „Selbstverständlichkeit“ oder auch als „empirische Leerstelle“. So findet sich die
Ausbildung des wissenschaftlichen Nachwuchses in Qualifikationsrahmen und gestuften Qualifikationsschritten einer
wissenschaftlichen Kompetenzentwicklung hin zur wissenschaftlichen Selbstständigkeit (vgl. BUWIN). Im Rahmen von
Bildungsberichterstattung und Grundlagenforschung zum wissenschaftlichen Nachwuchs zielen empirische Studien auf die
Erfassung von Autonomie als Praxis oder Desiderat (vgl. FOWIN). Die empirische Erhellung der konkreten Praxis
wissenschaftlicher Verselbständigung in akademischen Arbeitszusammenhängen stellt jedoch eine weitgehende
Forschungslücke dar.
Um Verselbständigung in wissenschaftlichen Nachwuchskarrieren erhellen zu können, bedarf es der Analyse von
Entwicklungskontexten, innerhalb derer sich die Entwicklung und Professionalisierung von NachwuchswissenschaftlerInnen
vollzieht. Verselbständigung als Prozess des Zusammenwirkens habitualisierter und institutionalisierter Strukturen lenkt den Blick
auf die alltäglichen Arbeitskontexte und die sich hier in sozialer Praxis aktualisierende Relevanz und Ausgestaltung von
Selbständigkeit und Autonomie. Der Beitrag stellt für diese Fragestellung zentrale Ergebnisse des Projekts „Trajektorien im
akademischen Feld – Institutionelle Ermöglichungskontexte wissenschaftlicher Nachwuchskarrieren“ vor. Aus einer
praxeologischen Perspektive (Bourdieu 1993; Elven/Weber 2012) zeigen sich im akademischen Feld (resp. disziplinäre Felder
oder Forschungsfelder etc.) als einer relationalen Ordnung von Akteuren unterschiedliche Praxismuster der Verselbständigung
entlang durch soziale Ungleichheit strukturierter Orientierungsrahmen.
Selbstständigkeit und Autonomie stellen zentrale Bezugspunkte akademischer Selbstverständnisse und Wertbezüge dar und
gehören wesentlich zur „Illusio“ im akademischen und wissenschaftlichen Feld. Welche Vorstellungen von „guter Wissenschaft“,
„guter Forschung“, „WissenschaftlerIn sein“ und Lebensführung aktualisieren sich bei der Auswahl und Verselbständigung von
NachwuchswissenschaftlerInnen? Welche Ordnung von Praktiken (Bourdieu 2002; Weber 2012) der Autonomie und
Verselbständigung lässt sich in der wissenschaftlichen Alltagspraxis auffinden? Es ist zu erwarten, dass sich an spezifischen
Positionierungen im jeweiligen Forschungsfeld mit höherer Wahrscheinlichkeit spezifische Grundüberzeugungen von
Wissenschaft, Strategien ihrer Realisierung und konkrete alltägliche Praktiken vorfinden lassen: Welche Perspektiven sehen die
BetreuerInnen für „ihren“ „Nachwuchs“ und welche Strategien verfolgen sie für und mit ihnen? In ungleichheitstheoretischer
Perspektive und mit Blick auf erwartungswidrigen Bildungserfolg wird die spezifische Lern- und Förderpraxis in der institutionellen
Herstellung akademischer Nachwuchskarrieren wirksam für die Reproduktion oder Kreation von Pfaden
(Schwarz/Teichmann/Weber 2015).
In einer qualitativen Analyse wird mittels eines triangulativen (Brake 2010) Forschungssettings anhand von leitfadengestützten
Interviews mit BetreuerInnen, Gruppendiskussionen mit den Peers und Dokumentenanalysen die institutionelle Praxis von
Universität, außeruniversitärer Forschungseinrichtung bzw. Graduiertenkolleg untersucht. Die Analyse der drei Dimensionen
BetreuerIn, Peers und Organisation wird das Forschungsmaterial angelehnt an die dokumentarischen Methode (Bohnsack 2010)
rekonstruktiv erschlossen.
Der Beitrag zeigt auf, wie soziale Ungleichheit wirksam wird in den Strategien der Verselbständigung im Zusammenspiel von
BetreuerInnen und Peers sowie Organisationen. In den Identifikationen, in spezifischen Mustern der Führung und Steuerung in
Arbeitszusammenhängen sowie den institutionellen Strategien entstehen spezifische Settings und spezifische räumliche und
zeitliche Arrangements der Verselbständigung. Im Zusammenwirken institutioneller mit habituellen Orientierungsmustern lassen
sich so Passungsverhältnisse und Karriereperspektiven des akademischen Nachwuchses im Sinne erwartbarer und
erwartungswidriger Karriereverläufe rekonstruieren.
Wann haben NachwuchswissenschaftlerInnen „ausgelernt“? Fachgebietsspezifische Bedingungen für
die Entstehung der ersten individuellen Forschungsprogramme
Grit Laudel, Jana Bielick
TU Berlin
NachwuchswissenschaftlerInnen gewinnen in einem längeren Prozess den Status unabhängiger ForscherInnen, der den
Erwartungen ihrer Scientific Communities entspricht (Puljak/Sharif 2009). Dieser Prozess endet nicht mit dem Erlangen eines
formalen Status‘ (Promotion, Habilitation oder Professur), sondern mit der Entwicklung des ersten eigenständigen individuellen
Forschungsprogramms. Damit dies gelingt, müssen die NachwuchswissenschaftlerInnen lernen, aussichtsreiche mittelfristige
Forschungsvorhaben zu formulieren, und sich die zu deren Bearbeitung erforderlichen Methoden aneignen. Diese Lernprozesse
dauern auch nach der Promotion an und vollziehen sich unter Bedingungen zunehmend unsicherer Karrierephasen.
Insbesondere ist weltweit eine wachsende Länge der Sequenzen befristeter Beschäftigung als Postdoc beobachtet worden
(Stephan/Levin 2001; Åkerlind 2005; Lam/de Campos 2014), was zu der Hypothese geführt hat, dass die Lernphase zu einem
„holding pattern“ (NRC 2005: 4) wird, in dem Postdocs auf unbefristete Stellen warten. Die Auswirkungen solcher Veränderungen
auf die Entwicklung individueller Forschungsprogramme durch NachwuchswissenschaftlerInnen sind bislang nicht bekannt.
In unserem Beitrag wollen wir aufklären, wovon abhängt, dass manche NachwuchswissenschaftlerInnen erfolgreich individuelle
Forschungsprogramme entwickeln, andere dagegen nicht. Es soll gezeigt werden, welche Bedingungen gegeben sein müssen,
damit die genannten Lernprozesse stattfinden können und zum Erfolg führen.
Die theoretische Grundlage der Untersuchung bildet ein an Heuristiken der Chicago School anschließender weiter Karrierebegriff,
der Karrieren als Sequenzen rollenbezogener Erfahrungen versteht (Barley 1989) und die systematische Einbeziehung des
Inhalts der Arbeit (Barley/Kunda 2001). Auf diesen Grundlagen lässt sich ein theoretisches Modell entwickeln, dass die Karrieren
von ForscherInnen analytisch in drei miteinander verschränkte parallele Karrieren auflöst, und zwar eine kognitive Karriere, eine
Reputationskarriere in der Scientific Community und eine Organisationskarriere (Laudel/Gläser 2008). Ein individuelles
Forschungsprogramm (IFP) ist ein Skript der kognitiven Karriere, in dem die Realisierung eines über das einzelne Projekt
hinausgehenden Erkenntnisinteresses angelegt ist (Laudel/Bielick 2015).
Anhand von vergleichenden Fallstudien in drei Fachgebieten (Pflanzenbiologie, Geschichte der Frühen Neuzeit, experimentelle
Atom- und Molekularphysik) untersuchen wir die Situationen von NachwuchswissenschaftlerInnen, die typische Stellen des
deutschen Karrieresystems innehaben (Postdoc, Assistent, Juniorprofessur, Gruppenleiter, Fellowship). Dazu führen wir
Experteninterviews mit den NachwuchswissenschaftlerInnen durch (30 pro Fachgebiet), die durch strukturbibliometrische
Methoden unterstützt werden (Gläser/Laudel 2015). Die Interviews werden mit qualitativer Inhaltsanalyse analysiert, indem für
die Fragestellung relevante Informationen unter theoretisch und empirisch bestimmte Kategorien subsumiert (Gläser/Laudel
2013) werden.
Unsere bisherigen Ergebnisse zeigen, dass nicht alle NachwuchswissenschaftlerInnen IFP entwickeln können. Außerdem
variieren die Zeiträume, in denen IFP entwickelt wurden, erheblich. Diese Varianz konnte nicht mit der Organisationskarriere formalen Eigenschaften von Stellen (wie Autonomie oder Befristungsdauer) oder deren Abfolge – erklärt werden. So haben
NachwuchswissenschaftlerInnen auf Postdoc-Positionen in der Biologie und der Physik in einigen Fällen ein IFP vorbereitet, in
anderen Fällen dagegen lediglich das IFP des Gruppenleiters unterstützt. Die Unterschiede lassen sich jedoch aufklären, wenn
man die durch die jeweiligen Stellen im Einzelfall geschaffenen Bedingungen analysiert. Folgende Mechanismen konnten bisher
gefunden werden:
1. Die durch die Stelle eines Wissenschaftlers geschaffenen formalen Bedingungen werden stark überformt durch die
tatsächlichen Autoritätsbeziehungen in Forschungsgruppen. Postdocs sind stets formal von ihren Gruppenleitern abhängig, die
ihnen jedoch Autonomie und Ressourcen für eigene Forschungspläne gewähren können.
2. Die gezielte Auswahl von Postdoc-Stellen ermöglicht das Erlernen neuer Methoden. Eine solche Selektion setzt voraus, dass
Postdoc-Stellen in allen Spezialgebieten eines Faches reichlich vorhanden sind.
3. Lernprozesse waren seltener, wenn Wissenschaftler als Quelle von Wissen eingestellt wurden, d.h. weil sie eine für die
Forschungen des Gruppenleiters relevante Methode beherrschten.
4. Fachspezifische Unterschiede in der Entstehung von IFP hängen mit der Natur der Lernprozesse zusammen. In den beiden
naturwissenschaftlichen Fächern liegt der Schwerpunkt wegen der großen Methodendynamik auf dem Erlernen von Methoden;
die Formulierung von Forschungsproblemen wird durch Beobachtung in der Gruppe erlernt. In den Geschichtswissenschaften
spielt das Erlernen von Methoden eine sehr viel geringere Rolle, da die Dynamik der Methoden geringer ist.
ID: 382
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Didaktik Fremdsprachen, Lehrerbildung
Thematisches Cluster: Fremdsprachenunterricht, Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung
Stichworte: fachdidaktisches Wissen, professionelle Kompetenz von Lehrkräften, Fremdsprachenlehrer, Lerngelegenheiten,
Lehrerausbildung
Fertig ausgebildet? Professionelle Kompetenzen angehender Englischlehrkräfte auf dem Prüfstand
Chair(s): Johannes König (Universität zu Köln)
Diskutant(en): Gabriele Kaiser (Universität Hamburg)
Theoretisch-konzeptionelle Arbeiten (im Überblick zuletzt Depaepe et al., 2013) und empirische Untersuchungen (u.a. Hill et al.,
2005; Baumert et al., 2010) unterstreichen die besondere Bedeutung des fachdidaktischen Wissens von Lehrpersonen
(pedagogical content knowledge, PCK) für die Lernfortschritte ihrer Schüler. Während für die Domäne der Mathematik mittlerweile
verschiedene Studien zur standardisierten Erfassung vorliegen, fehlt noch weitgehend entsprechende Forschung für sprachliche
Fächer. So stehen auch Arbeiten für das Fach Englisch als Fremdsprache noch sehr am Anfang (Nold, 2013). Dies ist insofern
erstaunlich, als dass Englisch im hiesigen Schulsystem ebenfalls Kernfach ist und im Zuge der Globalisierung als
Basiskompetenz von Heranwachsenden an Bedeutung gewinnt. An dieser Problemlage setzt das geplante Symposium an.
Im Rahmen des interdisziplinären und DFG-geförderten Projekts PKE („Professionelle Kompetenz von Englischlehrkräften:
Fachdidaktisches Wissen angehender Englischlehrkräfte - Konzeption, Messung, Validierung“, KO3947/6-1) wurden im Sommer
2015 angehende Englischlehrkräfte für die Sekundarstufe (Lehrämter Gymnasium und Haupt-/Realschule) aus erster und zweiter
Ausbildungsphase in Nordrhein-Westfalen (NRW) zu ihrem fachlichen, fachdidaktischen und pädagogischen Wissen mithilfe von
standardisierten Papier-Bleistift-Tests getestet. Ferner nahmen sie an einer sprachpraktischen Testung teil und wurden
ausführlich zu den Lerngelegenheiten ihrer bislang durchlaufenen Ausbildung sowie individuellen Merkmalen befragt. Für die
zweite Ausbildungsphase liegt eine repräsentative Stichprobe angehender Lehrkräfte im letzten Jahr ihrer Ausbildung vor, sodass
belastbare Aussagen zum erreichten Stand am Ende der Lehrerausbildung (bezogen auf NRW) getroffen werden können. In den
Beiträgen des Symposiums werden zentrale Ergebnisse zur professionellen Kompetenz und zu Lerngelegenheiten der
angehenden Englischlehrkräfte berichtet, wobei ein fachdidaktischer Fokus eingenommen wird.
Im Rahmen von Beitrag (1) von Johannes König u.a. wird zunächst das Design der PKE-Studie überblicksartig vorgestellt, dann
auf die Testung von fachdidaktischem Wissen angehender Lehrkräfte eingegangen. Ergebnisse aus binnenstrukturierenden
Analysen zur Konstruktvalidität des verwendeten PCK-Tests und deskriptive Ergebnisse zum Abschneiden der angehenden
Lehrkräfte am Ende ihrer Ausbildung werden berichtet. Im Anschluss fokussiert Beitrag (2) von Sarah Strauß u.a. auf
Validierungsanalysen des getesteten fachdidaktischen Wissens mit Außenkriterien (kognitive und motivational-affektive Maße
professioneller Kompetenz). Beitrag (3) von Sandra Lammerding u.a. stellt die Konzeption und Erfassung von fachdidaktischen
Lerngelegenheiten im Rahmen der PKE-Studie vor. Berichtet wird die strukturelle Überprüfung des verwendeten
Erhebungsinventars sowie deskriptive Befunde aus Selbstberichten der angehenden Lehrkräfte. In Beitrag (4) von Sarantis
Tachtsoglou schließlich wird in Regressionsanalysen der Einfluss von Lerngelegenheiten auf das fachdidaktische Wissen
modelliert. Das Symposium wird abgerundet durch die reflektierte Einordnung der Studie und ihrer Untersuchungsergebnisse in
den Stand aktueller Forschung zur (fachbezogenen) professionellen Kompetenz von Lehrkräften durch die Diskutantin Gabriele
Kaiser.
Beiträge des Symposiums
Modellierung und Erfassung des pedagogical content knowledge (PCK) angehender Englischlehrkräfte
Johannes König1, Günter Nold2, Andreas Rohde1, Sandra Lammerding1, Sarah Strauß1, Sarantis Tachtsoglou1
1
Universität zu Köln, 2Technische Universität Dortmund
Theoretischer Hintergrund:
Das fachdidaktische Wissen (pedagogical content knowledge, PCK) gilt als zentrale kognitive Komponente der professionellen
Lehrerkompetenz. Bisherige Ansätze zur Konzeptualisierung und Messung fokussieren auf Mathematik als Unterrichtsfach (Hill
et al., 2005; Baumert et al., 2010; Blömeke et al., 2010). Entsprechende Arbeiten für das Fach Englisch als Fremdsprache stehen
dagegen noch sehr am Anfang (Nold, 2013). Angesichts der Bedeutung von Englisch als gleichwertiges Kernfach im Schulsystem
sowie seiner wachsenden Bedeutung im Kontext der Globalisierung, z.B. hinsichtlich individueller Mehrsprachigkeit und in seiner
Funktion als Lingua Franca, sollten die theoretischen Diskurse zu Positionen und Konzepten der Fremdsprachenlehrerausbildung
auch in der Domäne Englisch als Fremdsprache durch empirische Forschung gestützt werden. Diesem Forschungsanliegen
begegnet die interdisziplinäre und DFG-geförderte Studie PKE („Professionelle Kompetenz von Englischlehrkräften:
Fachdidaktisches Wissen angehender Englischlehrkräfte - Konzeption, Messung, Validierung“, KO3947/6-1). Ziel dieses ersten
Beitrages des Symposiums ist es, das Studiendesign überblicksartig vorzustellen und daraufhin die Testung fachdidaktischen
Wissens angehender Englischlehrkräfte als das Kernstück der PKE-Studie sowie zentrale empirische Befunde zu präsentieren.
Die Konzeptualisierung und Operationalisierung des PCK in der PKE-Studie schließt an Arbeiten in anderen Domänen (z.B.
Mathematik) und an den internationalen Diskurs zu Lehrerwissen, -expertise und -kompetenzen an. Eine Testdesignmatrix sieht
einerseits drei inhaltliche Dimensionen vor (knowledge of curriculum, knowledge of teaching strategies and representations,
knowledge of students), andererseits drei Dimensionen kognitiver Anforderungen (recall, analyze, create).
Fragestellung:
Die PKE-Studie geht der übergreifenden Frage nach, wie sich das PCK von angehenden Englischlehrkräften modellieren und
erfassen lässt. Grundsätzlich wird eine homogene Fähigkeitsstruktur vermutet, sodass ein PCK-Gesamtscore berichtet werden
kann. Angesichts einer vermuteten Abhängigkeit des PCK von spezifischen Lerngelegenheiten in der Lehrerausbildung prüfen
wir Hypothesen wie die folgenden:
H1: Wir erwarten Messinvarianz des Tests für angehende Lehrkräfte der ersten und zweiten Phase, jedoch sollten Referendare
angesichts erweiterter Lerngelegenheiten besser abschneiden als Studierende.
H2: Eine Prüfung der Binnenstruktur des Tests sollte die inhaltlichen Dimensionen sowie die Dimensionen kognitiver
Anforderungen ausweisen.
Methode:
Im Sommer 2015 wurden angehende Englischlehrkräfte für die Sekundarstufe (Lehrämter Gymnasium und Haupt-/Realschule)
aus erster (216 Master-Studierende von 11 Universitäten) und zweiter Phase (228 Referendare von 11 ZfsLs) in NRW rekrutiert.
Die Referendar-Stichprobe wurde zufällig gezogen (Lehramt Gymnasium) bzw. als Vollerhebung durchgeführt (Lehramt Haupt/Realschule). Der institutionelle Rücklauf (ZfsL) beträgt 100%, bei Referendaren 78%. Damit entspricht die Stichprobe
internationalen Standards (Tatto, 2013), sie ist repräsentativ für eine Population von 544 angehenden Englischlehrkräften der
zweiten Phase. Der Rücklauf der MA-Studierenden-Stichprobe beträgt auf Institutionsebene 92%, fehlende
Populationsstatistiken lassen eine präzise Abschätzung des Rücklaufs auf Individualebene aber nicht zu.
Als Instrumente wurden drei paper-pencil Tests zur Erfassung von fachlichem, fachdidaktischen, pädagogischem Wissen sowie
ein Sprachtest eingesetzt, ferner wurden Lerngelegenheiten, demographische sowie motivational-affektive Merkmale erfragt. Alle
Erhebungen fanden zuerst in Ausbildungsseminaren statt und wurden aus Zeitgründen fortgesetzt als Online-Survey (Rücklauf
> 70% der in Seminaren einbezogenen Probanden).
Der PCK-Test umfasst 36 Items, die sich gleichmäßig über die 3x3-Matrix von Inhaltsdimensionen und kognitiven Anforderungen
verteilen (jeweils 18 geschlossene/offene Items). Neun Testitems wurden aus der TEDS-LT-Studie übernommen (Jansing et al.,
2013), die meisten Items jedoch im Rahmen der PKE-Studie in einem aufwändigen Verfahren neu entwickelt.
Ergebnisse:
In einer eindimensionalen IRT-Skalierung unter Einschluss von 33 der 36 Items erweist sich der PCK-Test als reliabel (EAPReliabilität, Cronbach’s Alpha jew. ≥ .70), Item-Diskriminationswerte liegen im Durchschnitt bei ≥ .3.; Messinvarianz für die zwei
phasenbezogenen Stichproben lässt sich in vergleichenden Skalierungsanalysen belegen. Eine Regressionsanalyse des PCK
mit der Ausbildungsphase als Prädiktor weist ein signifikant und praktisch bedeutsam besseres Abschneiden der Referendare
gegenüber den Studierenden aus (curriculare Validität). Eine Prüfung der mehrdimensionalen Teststruktur belegt insbesondere
die Konstruktvalidität für die Dimensionen kognitiver Anforderungen (ein dreidimensionales Skalierungsmodell mithilfe der
Software Conquest gelangt zu einer signifikant besseren Anpassung an die Daten als das eindimensionale Modell).
Validierung des pedagogical content knowledge (PCK) angehender Englischlehrkräfte
Sarah Strauß1, Johannes König1, Günter Nold2
1
Universität zu Köln, 2Technische Universität Dortmund
Theoretischer Hintergrund:
In der aktuellen Forschung zur professionellen Kompetenz von Lehrkräften haben sich modellhafte Vorstellungen durchgesetzt,
die zwischen kognitiven und motivational-affektiven Bereichen unterscheiden (Baumert & Kunter, 2006; Blömeke et al., 2010).
Professionelles Wissen von Lehrkräften wird in Anlehnung an die Arbeiten von Shulman (1987) in fachliches, fachdidaktisches
und pädagogisches Wissen untergliedert (Baumert et al., 2010; Tatto et al., 2012). Hinzu kommen personale Merkmale im
Bereich der berufsbezogenen Überzeugungen, motivationalen Orientierungen und Selbstregulation. Für die Zielgruppe
angehender Englischlehrkräfte fehlen bislang Arbeiten, die die verschiedenen Elemente professioneller Kompetenz
fachspezifisch konkretisieren und auf Zusammenhänge empirisch prüfen.
In diesem Forschungskontext verfolgt der Beitrag das Ziel, Zusammenhänge zwischen dem im Rahmen der PKE-Studie erfassten
fachdidaktischen Wissen (pedagogical content knowledge, PCK) angehender Englischlehrkräfte mit weiteren zentralen
Merkmalen ihrer professionellen Kompetenz zu prüfen, um letztlich Aussagen zur Validität des neu entwickelten PCK-Tests
treffen zu können.
Fragestellung:
Bearbeitet wird die übergreifende Fragestellung, ob sich spezifische Zusammenhänge in erwarteter Richtung (positiv oder
negativ) sowie in einer jeweils erwarteten Höhe zwischen dem PCK und weiteren kognitiven sowie motivational-affektiven Maßen
der angehenden Englischlehrkräfte zeigen. Dabei untersuchen wir Hypothesen wie die folgenden:
H1: Im kognitiven Bereich erwarten wir positive Zusammenhänge in jeweils mittlerer Höhe zu ihrem fachlichen Wissen in
Literaturwissenschaft und Linguistik, zu ihrem pädagogischen Wissen und zu Ergebnissen aus einem sprachpraktischen Test.
H2: In Ergänzung zu H1 sollte, im Sinne einer diskriminanten Validität, das PCK höher mit dem pädagogischen Wissen korreliert
sein als die Korrelation zwischen pädagogischem und fachlichem Wissen (vgl. die „Amalgam-Hypothese“ von Shulman, 1987, S.
8, der zufolge PCK „that special amalgam of content and pedagogy“ sei).
H3: Wir erwarten positive Korrelationen zwischen PCK und motivationalen Variablen (Enthusiasmus) und zur Selbstregulation
(Selbstwirksamkeit) sowie konstruktivistischen Überzeugungen zum Lehrern und Lernen, jedoch negative zur
Transmissionsorientierung.
Methode:
Verwendet wird die Stichprobe von 228 Referendarinnen und Referendaren mit Fach Englisch für die Sekundarstufe (Lehramt
Gymnasium, Lehramt Haupt-/Realschule) im letzten Jahr ihrer Ausbildung in Nordrhein-Westfalen. Die im Sommer 2015
erhobene Zufallsstichprobe weist eine sehr gute Rücklaufquote auf (Ebene der Institutionen 100%, Ebene der Referendare 78%)
und ist repräsentativ für die zugrunde liegende Population von 544 angehenden Sekundarstufenlehrkräften für das Fach Englisch
in NRW.
In Ausbildungsseminaren sowie im Rahmen eines ergänzenden Online-Surveys (Rücklauf > 70%) wurden Tests zur Erfassung
des professionellen Wissens (fachliches, fachdidaktisches, pädagogisches) eingesetzt. Während der PCK-Test im Wesentlichen
neu entwickelt wurde (vgl. den ersten Beitrag dieses Symposiums), wurde das Fachwissen mit Tests aus TEDS-LT (Roters et
al., 2011) sowie pädagogisches Wissen mit dem TEDS-M-Instrument (König et al., 2011) erfasst. Als Sprachtest wurde der
Cambridge English Placement Test (CPT) von Cambridge English Language Assessment (der University of Cambridge)
eingesetzt. Für die Erfassung der motivational-affektiven Merkmale Enthusiasmus, Selbstwirksamkeit und Überzeugungen zum
Lehren und Lernen wurden u.a. Instrumente aus der COACTIV-Studie (Baumert et al., 2008) zugrunde gelegt, jedoch auf das
Fach Englisch angepasst.
Ergebnisse:
Die Ergebnisdarstellung gliedert sich in zwei Schritte: Zunächst werden für die einbezogenen Konstrukte jeweils deskriptive
Befunde zum „Erreichen“ der Leistungen bzw. „Vorliegen“ entsprechender motivational-affektiver Merkmale bei angehenden
Englischlehrkräften am Ende ihrer Ausbildung berichtet. Daraufhin werden in interkorrelativen Analysen mithilfe der Software
Mplus (Muthén & Muthén, 1998-2010) die Zusammenhänge schrittweise sowie gesamthaft geprüft, wobei die Cluster-Struktur
der Stichprobe (Referendare in Ausbildungsseminaren in Regierungsbezirken) Rechnung getragen wird, um korrekte
Teststatistiken und Standardfehler zu erhalten. Zum Zeitpunkt des Einreichens des vorliegenden Abstracts waren diese Analysen
noch nicht vollständig abgeschlossen. Erste Befunde zeigen aber, dass sich unsere genannten Hypothesen weitgehend
bestätigen lassen. So korreliert beispielsweise das PCK mit dem pädagogischen Wissen bei .50 und der Enthusiasmus für das
Unterrichten von Englisch korreliert positiv mit dem PCK. Auch für die Zusammenhänge zwischen dem PCK und den
transmissionsorientierten und konstruktivistischen Überzeugungen zeigen sich Korrelationen in erwarteter Richtung.
Modellierung und Erfassung von Lerngelegenheiten angehender Englischlehrkräfte
Sandra Lammerding, Johannes König
Universität zu Köln
Theoretischer Hintergrund:
In der Wirksamkeitsforschung zur Lehrerbildung ist die Annahme zentral, dass der Erwerb professioneller Kompetenz von
angehenden Lehrkräften beeinflusst wird durch das Angebot und die Nutzung von Lerngelegenheiten des jeweiligen
Ausbildungsprogramms (u.a. Tatto et al., 2008; Blömeke et al., 2010; König & Seifert, 2012). Die Erfassung von
Lerngelegenheiten (engl. opportunities to learn – OTL) ist daher auch bei der Untersuchung der professionellen Kompetenz
angehender Englischlehrkräfte bedeutsam. Allerdings ist die Forschungslage bislang dünn, sodass im Rahmen der PKE-Studie,
aufbauend auf angrenzenden Vorarbeiten (Stancel-Piatak et al., 2013; Darge et al., 2012; König et al., 2014), eine
Konzeptualisierung von Lerngelegenheiten sowie eine Operationalisierung zur Erfassung über Befragungen der angehenden
Lehrkräfte entwickelt wurde. Der Beitrag stellt das Konzept vor, welches zentrale Aspekte der fachdidaktischen Ausbildung in
Vorlesungen und Seminaren sowie der schulpraktischen, auf das Unterrichten von Englisch bezogenen Lerngelegenheiten
umfasst. Ausbildungsinhalte wurden in sieben Bereiche (u.a. Sprachdidaktik/Spracherwerb, Literaturdidaktik, Methodik des
Englischunterrichts, fachdidaktische Bildungsforschung), lernprozessbezogene Tätigkeiten in schulpraktischen Settings wurden
in fünf Bereiche unterteilt (u.a. Planung und Durchführung von Englischunterricht, Aspekte forschenden Lernens); ferner wurde
die Theorie-Praxis-Kohärenz der Ausbildung und die mentorielle Unterstützung in der Schulpraxis erfragt.
Fragestellung:
Zwei Fragestellungen werden bearbeitet: Zunächst wird die Strukturierung der Lerngelegenheiten in Ausbildungsinhalte,
praktische Tätigkeiten, Kohärenz und mentorielle Unterstützung analysiert. Leitend ist dabei die Hypothese (H1), dass
entsprechend unserer modellhaften Vorstellungen sich die unterschiedenen Komponenten voneinander empirisch trennen
lassen. In einem zweiten Schritt werden deskriptive Befunde zu Lerngelegenheiten angehender Englischlehrkräfte im letzten Jahr
ihrer Ausbildung berichtet. Dabei untersuchen wir Hypothesen wie die folgenden: Unter den Ausbildungsinhalten wird
fachdidaktische Forschung weniger fokussiert als die Methodik des Englischunterrichts (H2a); Innerhalb der Ausbildungsinhalte
erhält die Sprachdidaktik die größte Bedeutung (H2b); innerhalb lernprozessbezogener Tätigkeiten in der Schulpraxis ist das
forschende Lernen weniger ausgeprägt als Bereiche von Unterrichtsplanung und -durchführung (H2c).
Methode:
Grundlage bildet die repräsentative Stichprobe der PKE-Studie (detailliert: vorhergehende Symposiumsbeiträge) von 228
angehenden Englischlehrkräften (Lehrämter Gymnasium und Haupt-/Realschule) im letzten Jahr ihrer Ausbildung in NordrheinWestfalen (zugrunde liegende Population: 544 angehende Englischlehrkräfte). Die verwendeten Skalen zur Erfassung von
Inhalten (7) des Studiums sowie im schulpraktischen Setting die praktischen Tätigkeiten (5), Kohärenz (1) und mentorielle
Unterstützung (1) wurden in einem aufwändigen Verfahren im Rahmen der PKE-Studie entwickelt. Für die Konzeptualisierung
der Inhaltsskalen wurden eine Analyse zentraler Lehrwerke sowie ein umfassendes Expertenreview durchgeführt (Lammerding
& König, 2015), um curriculare Validität zu sichern. Über 86 Items werden diverse Inhaltsaspekte der fachdidaktischen Ausbildung
erfragt, ob diese studiert wurden oder nicht (ja=1/nein=0). Analog wurde die Durchführung praktischer Tätigkeiten über 99 Items
erfragt (ja=1/nein=0). Kohärenz wird über fünf, mentorielle Unterstützung über vier Items erfasst (vierstufiges Antwortformat).
Ergebnisse:
Die Reliabilitäten der gebildeten 14 Skalen sind akzeptabel bis gut (zwischen .60 und .92). Eine konfirmatorische Faktorenanalyse
zur Prüfung der dimensionalen Struktur in vier latente Variablen (Inhalte, Tätigkeiten, Kohärenz, Mentoring), gemessen über
manifeste Skalen (Inhalte, Tätigkeiten) bzw. manifeste Einzel-Items (Kohärenz, Mentoring) bestätigt die Unterteilung der
Lerngelegenheiten in die verschiedenen Aspekte (χ2/df=1.8; CFI=.917; RMSEA=.057). Die Interkorrelationen sind relativ niedrig,
lediglich Inhalte und Tätigkeiten sind etwas höher korreliert. Dagegen gelangt eine Faktorenanalyse mit einem allgemeinen Faktor
für sämtliche Lerngelegenheiten zu einem schlechten Modell-Fit (χ2/df=.6; CFI=.472; RMSEA=.142). Insgesamt verweisen die
Ergebnisse auf eine strukturelle Trennung der OTL-Bereiche. Deskriptive Ergebnisse für die Skalen der Ausbildungsinhalte
zeigen, dass wie angenommen die fachdidaktische Forschung (12 Items, Skalenwerte: M=.44, SE=.01) weniger verbreitet ist als
die Methodik des Englischunterrichts (13 Items, Skalenwerte: M=.65, SE=.01). Die Sprachdidaktik ist der wichtigste Inhaltsbereich
(24 Items, Skalenwerte: M=.71, SE=.01). Bezüglich der praktischen Tätigkeiten kann aufgezeigt werden, dass
forschungsmethodische Zugänge eine geringere Rolle spielen (9 Items, Skalenwerte: M=.32, SE=.01) als die Planung (19 Items,
Skalenwerte: M=.86, SE=.004) und Durchführung (28 Items, Skalenwerte: M=.87, SE=.004) von Unterricht. Implikationen für die
Fremdsprachencurricula werden diskutiert.
Die Bedeutung von Lerngelegenheiten für das pedagogical content knowledge (PCK) angehender
Englischlehrkräfte
Sarantis Tachtsoglou, Johannes König, Sandra Lammerding
Universität zu Köln
Theoretischer Hintergrund:
Eine drängende Frage der aktuellen Lehrerbildungsforschung ist, inwieweit der Erwerb professioneller Kompetenz von
angehenden Lehrkräften durch Lerngelegenheiten unterstützt wird, die sie im Rahmen ihrer Ausbildung durchlaufen (u.a. Tatto
et al., 2008; Blömeke et al., 2010; König & Seifert, 2012). Aufbauend auf dem vorherigen Beitrag dieses Symposiums zur
Erfassung von Lerngelegenheiten (engl. opportunities to learn – OTL) zielt der vorliegende Beitrag auf die Analyse von
Zusammenhängen zwischen den Lerngelegenheiten und dem erreichtem fachdidaktischen Wissen (PCK) angehender
Englischlehrkräfte im letzten Jahr ihrer Ausbildung. Hierzu ist der Forschungsstand generell (vgl. Blömeke & König, 2011) wie
auch in Bezug auf die Fremdsprachenlehrerausbildung (Blömeke et al., 2013) dünn. Analysen zur Ausbildung von
Mathematiklehrkräften oder von Lehrkräften allgemein zeigen jedoch, dass sowohl Ausbildungsinhalte sowie
lernprozessbezogene Tätigkeiten in der Schulpraxis den Erwerb professionellen Wissens beeinflussen können (zuletzt u.a.
Blömeke et al., 2012; König & Klemenz, 2015). Entsprechende Ergebnisse können wichtige Einblicke in die Effektivität von
Curricula sowie Implikationen für die zukünftige Gestaltung von Lerngelegenheiten in der Lehrerbildung liefern (vgl. Tatto et al.,
2008).
Fragestellung:
Bearbeitet wird die Frage, welche der erfassten Lerngelegenheiten die Testleistungen der angehenden Lehrkräfte im PCK
erklären können. Hierzu prüfen Hypothesen wie die folgenden:
H1: In Bezug auf die fachdidaktischen Inhalte vermuten wir Zusammenhänge in mittlerer Höhe für Inhaltsskalen, die besonders
gut mit dem verwendeten Konzept des PCK-Tests übereinstimmen, insbesondere Sprachdidaktik/Spracherwerb, Methodik des
Englischunterrichts und Curriculum und Assessment/Beurteilung.
H2: In Bezug auf schulpraktische Tätigkeiten erwarten wir Zusammenhänge in mittlere Höhe für unterrichtsnahes Handeln wie
die Planung und Durchführung von Unterricht.
Methode:
Datengrundlage bildet die repräsentative Stichprobe von 228 Referendarinnen und Referendaren mit Fach Englisch für die
Sekundarstufe im letzten Jahr ihrer Ausbildung in Nordrhein-Westfalen, die im Rahmen der PKE-Studie im Sommer 2015 u.a. zu
ihrem fachdidaktischen Wissen (PCK) getestet und zu ihren Lerngelegenheiten befragt wurde (detailliert: vorhergehende
Symposiumsbeiträge). Ferner wird als Vergleichsstichprobe die in die PKE-Studie einbezogenen Master-StudierendenStichprobe verwendet (n=216 von 11 Universitäten). Vertreten sind in beiden Stichproben die Lehrämter Gymnasium sowie
Haupt-/Realschule. Da das PCK substanziell vom gewählten Lehramt beeinflusst wird (vgl. erster Symposiumsbeitrag), wird
dieses in den Analysen zum Zusammenhang zwischen Lerngelegenheiten und PCK kontrolliert. Darüber hinaus kontrollieren wir
den Einfluss weiterer Merkmale (Geschlecht, Alter, HISEI) auf das PCK, um den Einfluss der individuellen Voraussetzungen
angehender Lehrkräfte Rechnung zu tragen.
Ergebnisse:
Erste Ergebnisse aus schrittweisen Regressionsanalysen für die repräsentative Stichprobe der Referendarinnen und
Referendare zeigen zunächst, dass den Inhalten der Sprachdidaktik die höchste prädiktive Kraft zukommt (standardisiertes
Regressionsgewicht > .33), gefolgt von der Kulturdidaktik, Curriculum und Beurteilung sowie Fachdidaktische Forschung
(Gewicht > .2). Nur gering können Methodik und Literaturdidaktik das Wissen vorhersagen (Gewicht > .1); die Mediendidaktik ist
ohne praktische Bedeutsamkeit (Gewicht < .1). Ebenfalls geringe Vorhersagekraft haben die schulpraktischen Tätigkeiten sowie
der mentorielle Support. Von den Kontollvariablen lässt sich nur der Einfluss vom gewählten Lehramt (Gewicht > .30) feststellen,
der für höhere PCK-Werte derjenigen angehenden Lehrkräfte spricht, die ein gymnasiales Lehramt anstreben.
Unter Einbezug der Stichprobe der ersten Ausbildungsphase zeigt sich, dass Referendarinnen und Referendare über
umfangreicheres fachdidaktisches Wissen verfügen als die getesteten Master-Studierenden, allerdings ist dieser Effekt klein.
Ferner verringert sich der Unterschied zwischen erster und zweiter Phase, wenn die Inhalte der Sprachdidaktik als Prädiktor
einbezogen werden. Dies lässt die vorsichtige Schlussfolgerung zu, dass weniger das formale Stadium (erste vs. zweite Phase),
sondern die mit einem Lehramt (Gymnasium vs. Haupt-/Realschule) verbundenen Profile von Lerngelegenheiten sowie der
Umfang studierter Inhalte für das Abschneiden im Test entscheidend sind. Vertiefende Analysen im Mehrebenendesign werden
zur Tagung vorliegen und zur Diskussion gestellt. Implikationen der Ergebnisse, die auf die Bedeutung disziplinärer Inhalte der
Fachdidaktik (v.a. Sprachdidaktik) verweisen, erwartungswidrig aber die relativ schwache Bedeutung von Unterrichtsmethodik
und schulpraktischen Tätigkeiten anzeigen, werden zur Diskussion gestellt.
ID: 386
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung
Thematisches Cluster: Selbstreguliertes Lernen, Motivation und Emotion
Stichworte: Motivationsregulation, Strategien, Selbstreguliertes Lernen
Motivationsregulation beim Lernen differenziert betrachtet: Neue Vorgehensweisen, neue Befunde.
Chair(s): Hubertina Thillmann (Ruhr-Universität Bochum), Joachim Wirth (Ruhr-Universität Bochum)
Diskutant(en): Birgit Spinath (Ruprecht-Karls-Universität Heidelberg)
Während die bisherigen Ergebnisse zur Motivationsregulation beim selbstregulierten Lernen (SRL) weitgehend auf Maßen der
selbstberichteten Quantität der Nutzung von Motivationsregulationsstrategien beruhen (z. B. Wolters, 1998; Schwinger, von der
Laden, Spinath, 2007), werden in diesem Symposium verschiedene neue methodische Herangehensweisen vorgestellt, bei
denen eine differenzierte Betrachtungsweise zu neuen, teilweise erwartungswidrigen Erkenntnissen über die Rolle der
Motivationsregulation beim SRL führt. Vor dem Hintergrund der Validitätsproblematik von Selbstberichtverfahren zur Erfassung
von Strategien des SRL (vgl. Leopold & Leutner, 2002), nehmen die beiden ersten Beiträge neue Maße der Motivationsregulation
in den Blick, die insbesondere qualitative Aspekte der Motivationsregulation erfassen. Im ersten Beitrag kamen neben Maßen,
welche die Quantität der Strategienutzung erfragen, insbesondere Maße, welche die Qualität der Strategienutzung in den Blick
nehmen, zum Einsatz. Hierbei erwiesen sich insbesondere die Maße der Qualität, wie die Effektivität, Genauigkeit und Kontrolle
der Strategienutzung, als prädiktiv für den Regulationserfolg, die Anstrengung beim Lernen und die Studienleistung. Einen
ähnlichen Ansatz verfolgen die Autoren des zweiten Beitrags. Neben dem bekannten Maß der Strategienutzung (Schwinger et
al., 2007) haben sie ein Maß für das konditionale Strategiewissen von Schülerinnen und Schülern eingesetzt. Nach einer
situationalen Anregung der Motivationsregulation erwies sich hier neben der selbstberichteten Nutzung ausgewählter Strategien
insbesondere das konditionale Strategiewissen um die Aufrechterhaltung der Motivation beim Lernen als prädiktiv für den
Lernerfolg in einer konkreten Lernsituation. Ebenfalls um einen neuen Ansatz der Erfassung von Motivationsregulation geht es
in dem dritten Beitrag. Basierend auf dem theoretischen Konzept volitionaler Kompetenzen (vgl. Kuhl & Fuhrmann, 1998) zeigt
sich, dass eine Ausdifferenzierung des Aspektes der Motivationskontrolle, die gezielt der Aufrechterhaltung der Selbstintegrität
beim Lernen dienen soll, sich als prädiktiv für das Lernerleben im Verlauf eines Semesters sowie für das allgemeine Wohlbefinden
erweist. Ebenfalls längsschnittlich angelegt befasst sich der abschließende Beitrag dieses Symposiums mit den Effekten einer
spezifischen Strategie der Motivationsregulation, nämlich der self-enhancement-Strategie der Überschätzung eigener Leistung
(vgl. Dickhäuser & Plenter, 2005). Dabei gehen die Autoren der Frage nach, welche kurz- und langfristigen Effekte die Nutzung
dieser Strategie auf das Selbstkonzept und die Leistung von SchülerInnen hat. Die Ergebnisse bestätigen neben kurzfristigen
positiven Effekten auf das Selbstkonzept und indirekt auf die Leistung, einen langfristigen negativen Effekt auf das Selbstkonzept
und indirekt auf die Leistung. Zusammenfassend leisten alle vier Beiträge neue Erkenntnisse darüber, welche spezifischen
Aspekte bzw. Strategien der Motivationsregulation relevant für Erleben und Leistung beim SRL sind. Damit erbringen sie sowohl
neue theoretische als auch praktische Implikationen für die Forschung zur Motivationsregulation.
Beiträge des Symposiums
Motivationsregulation bei Studierenden: Quantität und Qualität des Strategieeinsatzes als Indikatoren
erfolgreicher Regulation bei spezifischen motivationalen Problemlagen
Tobias Engelschalk, Gabriele Steuer, Markus Dresel
Universität Augsburg
Theoretischer Hintergrund
Für ein erfolgreiches Studium wird dem selbstregulierten Lernen (SRL) hohe Relevanz zugeschrieben (vgl. Streblow & Schiefele,
2006). Bei dieser Art des Lernens kommt ¬ neben dem Einsatz von kognitiven und metakognitiven Lernstrategien ¬ der aktiven
Kontrolle von motivationalen Prozessen eine wichtige Rolle zu (z.B. Winne & Hadwin, 2012). In den letzten Jahren hat sich die
SRL-Forschung, die speziell auf den Aspekt der Selbststeuerung der Motivation fokussiert, deutlich intensiviert. Dabei wurde die
Motivationsregulation vorwiegend im Hinblick auf die Quantität des Strategieeinsatzes untersucht, wobei sich zeigte, dass die
Häufigkeit der Nutzung von Strategien zwar prädiktiv für die Bereitschaft ist, sich beim Lernen anzustrengen, jedoch nicht mit
tatsächlichem Lernerfolg in Zusammenhang steht (z.B. Schwinger, Steinmayr & Spinath, 2009). Dieses Befundmuster lässt sich
u.a. dahingehend interpretieren, dass die alleinige Betrachtung quantitativer Aspekte des Strategieeinsatzes zu kurz greifen
könnte, da eine Strategie nicht nur mit einer gewissen Intensität eingesetzt, sondern auch in qualitativer Hinsicht so reguliert
werden muss, dass das Ziel der jeweiligen Strategie tatsächlich auch erreicht wird (Schreiber, 1998). Während für den Einsatz
kognitiver Lernstrategien bereits empirische Hinweise vorliegen, dass insbesondere die qualitativen Aspekte des
Strategieeinsatzes gelingendes SRL vorhersagen können, mangelt es für den Bereich der motivationalen Lernstrategien an
Studien, die eine Beurteilung der Bedeutung von quantitativen versus qualitativen Aspekten des Strategieeinsatzes erlauben.
Fragestellung
Im Beitrag werden quantitative und qualitative Aspekte des Einsatzes von Motivationsregulationsstrategien simultan betrachtet,
um den jeweiligen Beitrag zum Erfolg der Regulationsbemühungen quantifizieren zu können. Dazu werden die folgenden
Forschungsfragen formuliert: (1) Lassen sich mit Hilfe der Quantität des Strategieeinsatzes Regulationserfolg (Einschätzung, wie
gut ein motivationales Problem überwunden werden kann), Anstrengung (Bereitschaft sich im Studium anzustrengen) und
Studienleistungen vorhersagen? (2) Verbessern sich die Vorhersagen, wenn neben der Quantität auch die Qualität des
Strategieeinsatzes berücksichtigt wird?
Methode
Um die Validität der Messungen zu sichern, wurden zentrale Variablen situationsspezifisch und möglichst verhaltensnah erhoben
(vgl. Spörer & Brunstein, 2006). Mittels Fragebogen wurden 188 Studierenden Beschreibungen prototypischer Lernsituationen
(Prüfungsvorbereitung und Semesterarbeit) vorgelegt, die jeweils spezifische Ursachen mangelnder Lernmotivation (geringe
Erfolgserwartung und geringer subjektiver Wert jeweils vor- und während der aktionalen Lernphase) enthielten (vgl. Engelschalk,
Steuer & Dresel, 2015). Für diese 2 x 2 x 2 motivationalen Problemlagen berichteten sie die Quantität des Strategieeinsatzes
(operationalisiert als Häufigkeit des Einsatzes von acht verschiedenen Motivationsregulationsstrategien), die Qualität des
Strategieeinsatzes (operationalisiert als Effektivität, Genauigkeit und Kontrolle bei der Umsetzung derjenigen Strategien, die in
der jeweiligen Situationen am ehesten eingesetzt wurden) sowie den jeweiligen Erfolg der Motivationsregulationsbemühungen
(„Regulationserfolg“, erfasst mit je zwei Items). Die Anstrengung wurde global mit einer 15 Items umfassende Skala erhoben und
die Studienleistung als Durchschnitt der letzten vier erhaltenen Modulnoten operationalisiert.
Ergebnisse
In den durchgeführten Regressionsanalysen erwies sich die Quantität des Einsatzes von Motivationsregulationsstrategien als
moderat positiver Prädiktor des Regulationserfolgs sowie der Anstrengung. Die Studienleistung ließ sich jedoch nicht aus der
Nutzungsquantität vorhersagen. Alle drei abhängigen Variablen, insbesondere auch die Studienleistung, ließen sich signifikant
besser durch die Hinzunahme der Qualität des Strategieeinsatzes prädizieren. Hier waren teils große Anteile der
Kriteriumsvarianz zu beobachten, die spezifisch mit dem Qualitätsaspekt im Zusammenhang standen, mithin Aspekte
reflektierten, die nicht im Umfang der Strategienutzung abgebildet sind (Regulationserfolg: deltaR² = .21, p < .001; Anstrengung:
deltaR² = .04, p < .01; Studienleistung: deltaR² = .02, p< .05). Im Gegensatz dazu erwiesen sich die Anteile der Kriteriumsvarianz,
die spezifisch aus dem Quantitätsaspekt vorhergesagt werden konnten, als nicht signifikant für den Regulationserfolg und die
Studienleistung und als klein für die Anstrengung (deltaR² = .03, p < .05).
Diskussion
Insgesamt verweisen die Ergebnisse darauf, dass die Qualität des Einsatzes von Motivationsregulationsstrategien prädiktiv für
relevante Aspekte des Lernprozesses ist und dass gerade diesem Aspekt im Hinblick auf eine effektive und zielführende
Regulation der Lernmotivation besondere Bedeutung beigemessen werden sollte.
Motivationsregulation bei SchülerInnen: Zum Einfluss des Wissens über und der Nutzung von Strategien
zur Motivationsregulation auf den Lernerfolg beim SRL
Hubertina Thillmann, Joachim Wirth
Ruhr-Universität Bochum
Theoretischer Hintergrund
Die Selbstregulation der Motivation rückt zunehmend in den Fokus der Forschung zum selbstregulierten Lernen (SRL) (Winne &
Hadwin, 2012; Wolters, 2003). Bislang konnte gezeigt werden, dass Studierende und auch schon SchülerInnen nicht nur
angeben, eine Reihe unterschiedlicher Motivationsregulationsstrategien anzuwenden (Wolters, 1998; Schwinger, von der Laden
& Spinath, 2007), sondern dass sie die Auswahl dieser Strategien auch nach dem jeweiligen Anlass ausrichten (Engelschalk,
Steuer & Dresel, 2015). Obwohl die berichtete Strategienutzung mit erhöhter Anstrengung beim Lernen assoziiert ist (Schwinger
& Stiensmeier-Pelster, 2012), zeigte sich bislang kein Effekt auf den Lernerfolg in konkreten Lernsituationen (Schwinger,
Steinmayr & Spinath, 2009). Dies könnte jedoch an Validitätsproblemen der eingesetzten Selbstberichtverfahren liegen (vgl.
Artelt, 2000). Es stellt sich daher die Frage, welche Relevanz der Motivationsregulation beim SRL tatsächlich zukommt, bspw.
wenn zwecks Erhöhung der Validität a) die Motivationsregulation in einer konkreten Situation angeregt wird und b) neben der
Nutzung von Motivationsregulationsstrategien auch das Wissen über Motivationsregulationsstrategien erfasst wird (vgl. Leopold
& Leutner, 2002).
Fragestellung und Hypothese
Welchen Einfluss auf den Lernerfolg in einer konkreten Lernsituation hat neben der Nutzung von Motivationsregulationsstrategien
das Wissen über Motivationsregulationsstrategien?
H: Die Nutzung von und das Wissen über Strategien zur Motivationsregulation leisten einen inkrementellen Beitrag zur
Vorhersage des Lernerfolgs beim SRL über das inhaltliche Vorwissen und das allgemeine Leistungsniveau hinaus.
Methode
N=80 Schülerinnen und Schüler (SuS) der Jahrgangsstufe 10 an zwei Gymnasien in NRW haben an dieser Studie teilgenommen.
47 Schüler waren männlich, das Alter betrug M=15.20 Jahre (SD=0.71 Jahre).
Zunächst wurden Alter, Geschlecht und die letzten Schulnoten erfragt. Aus dem Mittelwert der Noten wurde das Leistungsniveau
berechnet. Im Anschluss wurde die motivationale Zielorientierung anhand der Skalen zur Lern- und Leistungsmotivation (Spinath,
Stiensmeier-Pelster, Schöne & Dickhäuser, 2002) erfasst. Danach war es Aufgabe der SuS, sich selbstreguliert Wissen aus
einem Text zum Thema Lebewesen anzueignen. Dazu wurde ihr inhaltsspezifisches Vorwissen (5 MC-Items) erfasst. Alle SuS
erhielten
vor
dem
Lesen
des
Textes
einen
motivationsregulatorischen
Prompt
zur
Strategie
der
annäherungsleistungszielbezogenen Selbstinstruktion und 3 min. Zeit zur selbständigen Motivationsregulation. Zudem wurde
ihre aktuelle Motivation, den Text zu bearbeiten, einmal vor und einmal nach der Selbstmotivation anhand des Fragebogens zur
Aktuellen Motivation (Rheinberg, Vollmeyer & Burns, 2001) erfasst. Nach dem SRL wurde das konditionale Wissen über
Strategien zur Motivationsregulation anhand eines Strategiewissenstests mit den Skalen Initiation und Persistenz der Motivation
erhoben (Thillmann & Wirth, 2011). Daran anschließend wurde die selbstberichtete Nutzung von Strategien zur
Motivationsregulation (Schwinger, von der Laden & Spinath, 2007) sowie ihr inhaltliches Wissen zum Lehrtext (21 MultipleChoice-Items) erfasst.
Ergebnisse
Die Reliabilitäten der eingesetzten Maße erwiesen sich als zufriedenstellend. Zur Überprüfung der Hypothese wurde eine
univariate Varianzanalyse zur Vorhersage des Wissens zum Post-Zeitpunkt gerechnet. Als Prädiktoren gingen nacheinander
folgende
Variablen
in
die
Analyse
ein:
inhaltliches
Vorwissen,
Leistungsniveau,
Lernzielund
Annäherungsleistungszielorientierung, Strategien zur Motivationsregulation und konditionales Wissen über Strategien zur
Motivationsregulation. Die Ergebnisse zeigen über signifikante Haupteffekte für das inhaltliche Vorwissen und das
Leistungsniveau hinaus, Effekte für die Nutzung der Strategien Interessensteigerung (F(1,74)=6.36; p=.035; eta²=.090),
Bedeutsamkeitssteigerung (F(1,74)=4.66; p=.028; eta²=.068) und annäherungsleistungszielbezogene Selbstinstruktion
(F(1,74)=5.05; p=.028; eta²=.073) sowie für das konditionale Strategiewissen zur Persistenz (F(1,74)=4.84; p<.031; eta²=.070).
Somit konnte die Hypothese bestätigt werden.
Diskussion
Die Ergebnisse dieser Studie sprechen für die Relevanz der Motivationsregulation für den Lernerfolg beim SRL, und zwar über
den Einfluss des Vorwissens und des Leistungsniveaus hinaus. Demnach erzielen SuS, die angeben Erfahrungen in spezifischen
Strategien zur Motivationsregulation zu haben, einen höheren Lernerfolg in einer konkreten Lernsituation als SuS, die dies nicht
angeben. Zudem zeigt sich ein zusätzlicher Informationswert des konditionalen Wissens über Strategien zur Aufrechterhaltung
der Motivation beim SRL, über die selbstberichtete Nutzung spezifischer Strategien hinaus.
Zum Einfluss von Motivationskontrolle auf Lernerleben und -verhalten und das allgemeine Wohlbefinden:
Eine vorlesungsbegleitende Studie mit Lehramtsstudierenden
Axel Grund, Carola Grunschel, Stefan Fries
Universität Bielefeld
Theoretischer Hintergrund
Motivationskontrolle stellt in Kuhls modularer Konzeption volitionaler Kompetenzen (Kuhl & Fuhrmann, 1998) einen Teilprozess
der Selbstregulation dar. Die zentrale Funktion der Motivationskontrolle liegt insbesondere in der Aufrechterhaltung der
Selbstintegrität („self-maintenance”) und weniger in der Zielerreichung („goal-maintenance“). Für letzteres ist die Selbstkontrolle
zuständig. Durch die Motivationskontrolle soll die Zielverfolgung motivational angereichert und energetisiert werden, indem
positive affektive Zustände hergestellt werden. Motivationskontrolle sollte demnach eine entscheidende Rolle beim
selbstregulierten Lernen spielen und das aktuelle Lernerleben und –verhalten günstig beeinflussen. Darüber hinaus sollte
Motivationskontrolle aber auch nachhaltige Effekte auf das allgemeine Wohlbefinden haben. Allerdings gibt es bisher kaum
Forschung dazu, wie sich diese Prozesse im konkreten (Lern-) Alltag von Studierenden entfalten.
Fragestellung
Im Rahmen einer Feldstudie soll überprüft werden, inwiefern Motivationskontrolle in Zusammenhang mit Aspekten des aktuellen
und prospektiven Lernerlebens und -verhaltens in konkreten Situationen selbstregulierten Lernens (Besuch einer Vorlesung)
steht. Es wird angenommen, dass eine bessere Motivationskontrolle mit einer funktionalen Stabilisierung der aktuellen
Handlungsregulation auf motivational-affektiver Ebene einhergeht (z.B. weniger Konflikterleben, mehr situatives Interesse, mehr
Lernfreude, weniger negative Emotionen) und positive prospektive Leistungsemotionen (mehr Hoffnung und weniger Angst)
vorhersagt. Darüber hinaus werden bereichsübergreifende Effekte der Motivationskontrolle auf das allgemeine subjektive
Wohlbefinden erwartet.
Methode
Die Daten wurden zu mehreren Messzeitpunkten im Rahmen einer Vorlesung im Fach Psychologie für Lehramtsstudierende
erhoben. Zum ersten Vorlesungstermin nahmen insgesamt 245 Studierende an der Befragung teil (weiblich = 84%; MAlter= 22.1,
SDAlter= 3.5; MSemester= 3.7, SDSemester= 2.0) und beantworteten einen Fragebogen zur Motivationskontrolle sensu Kuhl
sowie weitere Kontrollvariablen (z.B. soziale Erwünschtheit, allgemeines affektives und kognitives Wohlbefinden). Zudem wurden
sie bis zur Mitte des Semesters im Anschluss an die Vorlesungstermine zu ihrem Lernerleben und –verhalten in den jeweiligen
Sitzungen befragt. Zur Mitte des Semesters wurden abschließend die prospektiven Leistungsemotionen der Studierenden in
Bezug auf die anstehende Modulklausur zur Vorlesung sowie abermals ihr allgemeines affektives und kognitives Wohlbefinden
erfasst. Die Daten wurden regressionsanalytisch ausgewertet.
Ergebnisse
Wie erwartet berichteten Studierende, die über eine bessere Motivationskontrolle verfügen, im Durchschnitt der verschiedenen
Veranstaltungen über mehr funktionales motivational-affektives Lernerleben und -verhalten (z.B. situationales Interesse, Spaß
und flowartige Zustände) und weniger dysfunktionale motivational-affektive Zustände (z.B. weniger motivationale Konflikte,
Ablenkungen und Langeweile). Die Befunde blieben auch bestehen, wenn Selbst- und Fremdtäuschungstendenzen sowie das
allgemeine affektive Wohlbefinden der Studierenden statistisch kontrolliert wurden. Motivationskontrolle sagte zudem prospektive
Leistungsemotionen in Bezug auf die Klausur sowie das allgemeine psychologische Wohlbefinden der Studierenden zur
Semestermitte vorher. Diejenigen, die angaben ihre Motivation gut kontrollieren zu können, berichteten weniger Angst und mehr
Hoffnung in Bezug auf das Abschneiden in der anstehenden Klausur. Zudem berichteten sie zur Mitte des Semesters insgesamt
mehr positive Affekte und eine höhere Lebenszufriedenheit, auch wenn frühere Einschätzungen zum subjektiven Wohlbefinden
sowie Selbst- und Fremdtäuschungstendenzen kontrolliert wurden.
Insgesamt sprechen die Befunde dafür, dass Motivationskontrolle funktionale motivational-affektive Zustände in konkreten
Kontexten des selbstregulierten Lernens unterstützt, darüber hinaus aber auch das allgemeine Wohlbefinden fördert.
Short- and Long-Term Effects of Over-Reporting of Grades on Academic Self-Concept and Achievement
Fabio Sticca1, Thomas Götz1, Ulrike Nett2, Kyle Hubbard3, Ludwig Haag4
1
Universität Konstanz & Pädagogische Hochschule Thurgau, 2Universität Ulm, 3McGill University, 4Universität Bayreuth
Theoretical background
A number of studies from different research fields have shown that there is a tendency to portray oneself as above average with
respect to many individual characteristics. This tendency is most evident for characteristic that are perceived as important (e.g.,
Brown, 2012). In the academic context, one such important individual characteristic is academic achievement. Indeed, many
students are prone to over-report their grades (Kuncel, Credé, & Thomas, 2005), which has been interpreted as a form of selfenhancement strategy (Dickhäuser & Plenter, 2005). Although such self-enhancement strategies were assumed to be adaptive
in terms of self-concept and academic achievement, a first longitudinal study by Robins and Beer (2001) showed that selfenhancement was adaptive in the short term but maladaptive in the long term as far as self-esteem, well-being, and achievement
are concerned. To date, results obtained by Robins and Beer (2001) have not been replicated. Moreover, no study has examined
whether the short-term adaptive effects are partly responsible for the long-term maladaptive effects of self-enhancement on
academic achievement. In order to examine such a complex longitudinal relationship, it is imperative to adopt a multivariate
approach, as complex relationship between multiple constructs might remain undetected in bivariate approaches such as the one
used by Robins and Beer (2001).
Research question
This study examined the short- and long-term effects of self-enhancement (i.e., over-reporting of academic grades) on academic
self-concept and academic achievement. In particular, we examined whether the positive short-term effects of self-enhancement
are partly responsible for the negative long-term effects.
Method
916 Swiss ninth-graders participated in three assessments across three years (mean age at T1 = 15.6 years, 56% female).
Students reported their last mid-term grades and their self-concepts (SDQ; Marsh & O’Neill, 1984) in mathematics, German,
English, and French. Actual mid-term grades were obtained from the school administrations. The longitudinal interplay between
self-enhancement, academic self-concept, and academic achievement was examined using a trivariate parallel process latent
growth model (TPPLGM). This model allowed us to test whether latent growth parameters of one latent growth model (LGM)
predicted those of another LGM.
Results
Results from the PPLGM showed that, in the short term, self-enhancement was positively associated with self-concept but not
with achievement, while self-concept was strongly associated with achievement. However, in the long term, self-enhancement
had a direct maladaptive effect on academic self-concept and an indirect maladaptive effect on academic achievement that was
mediated by inflated academic self-concepts.
Discussion
The present study yielded the first results showing that self-enhancement has adaptive short-term effects on academic-self
concept and that these apparently adaptive effects lead to maladaptive developments in academic achievement over time. An
inflated academic self-concept might lead to unrealistic expectations and maladaptive learning strategies or reduced learning
efforts, which in turn may lead to lower academic achievement. If a decrease in academic achievement is then attributed to
external causes, the likelihood of continued self-enhancement increases and a vicious cycle may arise with maladaptive longterm consequences for academic achievement. Implications for research and educational practice are discussed.
ID: 390
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktiken der Naturwissenschaften und Technik
Thematisches Cluster: Bildung im Sekundarbereich, Mathematisch-naturwissenschaftlicher Unterricht, Unterrichtsentwicklung/
Unterrichtsqualität
Stichworte: internationaler Vergleich, Mehrebenenmodellierung, multiple Outcomes, Unterrichtsforschung
Unterrichtsforschung durch die Brillen verschiedener Disziplinen
Chair(s): Susanne Kuger (Deutsches Institut für Internationale Pädagogische Forschung), Ronny Scherer (Centre for
Educational Measurement at the University of Oslo (CE)
Diskutant(en): Ilonca Hardy (Goethe-Universität Frankfurt)
Die Unterrichtsforschung verfolgt multiple Ziele und nutzt dabei sehr heterogene Studien aus unterschiedlichen disziplinären und
personellen Perspektiven auf unterschiedliche Kriteriumsmerkmale. Auf der einen Seite finden sich rekonstruierende Ansätze,
die Interaktionen zwischen den beteiligten Akteuren erst einmal sichtbar, beschreibbar und reliabel und valide messbar machen
wollen. Des Weiteren existieren Studien, die Unterricht vergleichend darstellen und beschreiben wollen. Vergleiche finden
zwischen Schulformen, Fächern oder Ländern statt. Nicht zuletzt stellt die Frage nach der ultimativen Effektivität von Unterricht
für verschiedene Zielmerkmale eine zentrale Frage der Erforschung von Unterricht dar.
Ziel des Symposiums ist es, diese drei Ansätze zur Beschreibung von Unterricht und seiner Effektivität anhand von vier Studien
zu illustrieren und dabei die Komplexität des Unterrichtsgeschehens und Wirkens multi-perspektivisch zu betrachten. Dabei
werden verschiedene disziplinäre Brillen eingesetzt, um auf Basis substanzieller Datenlagen Unterricht empirisch zu beschreiben.
Der erste Beitrag berichtet dabei zunächst von den Schwierigkeiten und Möglichkeiten, die Komplexität großer multimethodischer Datensätze zu systematisieren und zu belastbaren und interkulturell validen Beschreibungsdimensionen des
Physikunterrichts in drei verschiedenen Ländern zu kommen. Eine besondere Herausforderung stellt die Vereinigung und
Verknüpfung von Datenquellen aus Befragungen, Tests und Videografien dar. Die Studie zeichnet sich vor allem durch eine
fachdidaktische Beschreibungsweise von Unterricht aus, die über die verfügbaren Maße in internationalen Schulleistungsstudien
hinausgeht.
Der zweite Beitrag nimmt die ländervergleichenden Überlegungen des ersten Beitrags auf und rekonstruiert Unterrichtskulturen
in 11 Ländern weltweit. Betrachtet werden dabei fachdidaktische, allgemeindidaktische und pädagogisch-psychologische
Beschreibungsdimensionen von Unterricht zugleich. Anhand der Daten der PISA 2012 Studie werden latente Profilanalysen
zwischen und innerhalb der Länder verglichen, um verschiedene Unterrichtskulturen in Ländern und Schulen zunächst zu
rekonstruieren und dann kontrastierend und vergleichend zu analysieren.
Im dritten Beitrag wird aus einer eher pädagogisch-psychologischen Perspektive heraus die Bedeutung von Unterricht für
verschiedene Schülermerkmale untersucht. Um der multi-kriterialen Zielsetzung von Unterricht nachzugehen, analysiert diese
Studie die Zusammenhänge gängiger Beschreibungsdimensionen von Unterricht mit motivationalen, Leistungs- und
Persönlichkeitsmerkmalen der Schülerinnen und Schüler und vergleicht die Bedeutung unterschiedlicher Unterrichtsmerkmale
für diese Kriterien.
Zuletzt wird aus methodischer Perspektive ein Ansatz geliefert, der es erlaubt, die Komplexität der Beschreibung von
Instruktionsqualität anhand von Schülereinschätzungen quantitativ zu explizieren. Dabei können zum einen die verschiedenen
Merkmale der Instruktionsqualität (Mehrdimensionalität, Domänenspezifität, Mehrebenenstruktur) integrativ beschrieben und
zum anderen Unterschiede zwischen Ländern berücksichtigt werden. Anhand der Daten der TIMSS und PIRLS 2011 Studien
wird die Validität des Ansatzes empirisch geprüft.
Abschließend werden die Beiträge aus einer erziehungswissenschaftlichen Perspektive dahingehend diskutiert, welchen
Erkenntnisgewinn sie zur zukünftigen Lehrerbildung beitragen können.
Beiträge des Symposiums
Die Messung fachbezogener Instruktionsqualität mittels Videoanalysen
Knut Neumann
Leibniz-Institut für die Pädagogik der Naturwissenschaften und M
Die fachspezifische Interpretation der Instruktionsqualität ist eine zentrale Aufgabe der Fachdidaktik. So hat die
Unterrichtsqualitätsforschung zwar einzelne Merkmale der Instruktionsqualität identifiziert (u.a. Strukturiertheit, Aktivierung oder
Klassenführung, vgl. z.B. Helmke, 2006), unklar ist jedoch wie sich diese im Fachunterricht manifestieren. Was sind zum Beispiel
lernwirksame Strukturen des Physikunterrichts, oder welche Elemente des Physikunterrichts sind besonders aktivierend? Diese
Fragen sind auch mit Blick auf die wissenschaftliche Fundierung der Lehrerbildung von zentraler Bedeutung. Insbesondere in
den Fachdidaktiken der Mathematik und der naturwissenschaftlichen Fächer sind in Folge der TIMSS Videostudien (z.B. Roth et
al., 2006) zahlreiche Studien durchgeführt worden, in denen die Instruktionsqualität in den jeweiligen Fächern untersucht wurde
(z.B. Reyer, 2004). Dabei wurde in unmittelbarer Anlehnung an die Prozess-Produkt-Forschung zunächst auf die Wirkung
einzelner Merkmale wie z.B. der Strukturierung (Reyer, 2004) oder der Aktivierung (z.B. Lau, 2011) untersucht. Dies wird aber
der Komplexität der realen Unterrichtssituation nicht gerecht. Eine valide Beschreibung von Instruktionsqualität muss
idealerweise sämtliche Merkmale und deren Zusammenspiel berücksichtigen. Statt einzelner Merkmale von Instruktionsqualität
müssten Instruktionsqualitätsmuster beschrieben werden. Offen ist dabei allerdings bisher, wie die Identifikation solcher Muster
methodisch anzugehen ist.
Dieser Frage soll im vorliegenden Beitrag am Beispiel der internationalen Vergleichsstudie „Quality of Instruction in Physics“
(QuIP) nachgegangen werden. Im Rahmen dieser Vergleichsstudie wurde Physikunterricht in den drei Ländern Deutschland,
Finnland und der Schweiz im Rahmen eines Prä-Post-Designs untersucht. Die Prä-Testung erfolgte zu Beginn einer
Unterrichtseinheit zur Elektrizitätslehre, in deren Verlauf dann in jeder Klasse entweder eine Doppelstunde oder zwei einzelne
Stunden auf Video aufgezeichnet wurden. Die Post-Testung erfolgte am Ende der Unterrichtseinheit. Erfasst wurden unter
anderem Schülerleistung, -interesse und –motivation im Prä-Post-Vergleich aber auch Rahmenbedingungen wie das
Professionswissen der Lehrkräfte. Insgesamt wurde Unterricht in N = 103 Klassen des 9. und 10. Jahrgangs in den drei Ländern
videographiert. Diese Unterrichtsstunden wurden neben der Klassenführung unter anderem mit Hilfe physikdidaktisch
ausformulierten Kategoriensysteme zur inhaltlichen Strukturierung (Brückmann, 2009) und zur kognitiven Aktivierung (Lau, 2011)
analysiert.
Die Ergebnisse zeigen deutliche Unterschiede im Leistungszuwachs der Schülerinnen und Schüler verschiedener Länder und
bestätigen damit, dass die Befunde z.B. aus PISA durch Unterschiede im Lernen der Schülerinnen und Schüler erklärt werden
können. Die einzelnen Videoanalysen bestätigen klare Effekte der inhaltlichen Strukturierung, der kognitiven Aktivierung und der
Klassenführung sowie weiterer Merkmale der Instruktionsqualität. So wirkt sich sowohl die Zahl der Konzepte, r = .36, p < .001,
als auch die Zahl der Verbindungen zwischen diesen Konzepten, r = .28, p < .01, positiv auf den Lernzuwachs der Schülerinnen
und Schüler aus. Zudem zeigt sich ein Einfluss der Passung zwischen dem von der Lehrkraft angestrebten und von den
Schülerinnen und Schülern gezeigten Vernetzungsniveau als Maß für kognitive Aktivierung, r = .36, p < .01. Nicht zuletzt erwiesen
sich im Rahmen einer Kovarianzanalyse der Schülerleistung im Posttest unter Berücksichtigung der Schülerleistung im Prätest
verschiedene Merkmale der Klassenführung als statistisch bedeutsam; darunter die effektive Zeitnutzung, F(94, 9) = 4.46, p <
.05, 2 = .10.
In der Gesamtschau der Ergebnisse zeigt sich ein Bild, dem zufolge eine hohe Instruktionsqualität in Physik durch eine starke
Lehrerzentrierung, einen systematischen Wissensaufbau und weitere Elemente (die hier im Detail nicht dargestellt werden
können) wie häufigere Wiederholungen und Leistungsüberprüfungen oder weniger und qualitativere Experimente
gekennzeichnet ist. Dieses Bild lässt sich empirisch bisher allerdings weder durch z.B. Regressionsanalysen oder (hierarchische)
Strukturgleichungsmodelle belegen. Dies kann u.a. in der für diese Verfahren auf Klassenebene vergleichsweise kleine
Stichprobe begründet sein. Detailliertere Analysen legen jedoch nahe, dass in den einzelnen Klassen jeweils ganz
unterschiedliche Merkmale der Instruktionsqualität zum Tragen kommen. Der Beitrag diskutiert vor dem Hintergrund dieser
Ergebnisse wie sich Muster der Instruktionsqualität identifizieren und beschreiben lassen; sowie insbesondere die Validierung
dieser Muster.
Profile von Unterrichtsbeschreibungen in 11 Ländern
Susanne Kuger
Deutsches Institut für Internationale Pädagogische Forschung
Hintergrund und Problemstellung
Bei der Suche nach universellen Beschreibungsansätzen und Wirkungsmustern des Unterricht konzentriert sich ein Teil der
Forschung auf den internationalen Vergleich, um eine Kulturabhängigkeit der Ergebnisse zu verringern und so eine größere
Generalisierbarkeit der Ergebnisse annehmen zu können. Gleichwohl kommen diese Studien zu keinem einheitlichen Fazit.
Während einige Studien größere Unterschiede in der Beschreibung und Effektivität des Unterrichts zwischen den Ländern
feststellen (manchmal auch cultural scripts genannt, z.B. Kobarg et al., 2011; Stigler & Hiebert, 2009; Vieluf, Kaplan, Klieme, &
Bayer, 2012), kommen andere Studien zu dem Schluss großer Ähnlichkeiten (Baker & LeTendre, 2005; Hattie, 2009; Seidel &
Shavelson, 2007).
Ein Problem stellt in diesen Analysen die Auswahl der Beschreibungsdimensionen für den Unterricht dar. Je nach Studie werden
Beschreibungen aus allgemeindidaktischer (Vieluf et al., 2012), aus fachdidaktischer (Schmidt et al., 2001) oder aus
pädagogisch-psychologischer (Kobarg et al., 2011) Sicht gewählt und das Unterrichtsgeschehen über Konstrukte
operationalisiert, die aus den jeweiligen Perspektiven übliche Beschreibungsdimensionen darstellen. Es existieren dagegen
weniger Studien, die Beschreibungen unterschiedlicher disziplinärer Perspektiven und unterschiedlicher Dimensionen einer
Perspektiven gleichzeitig berücksichtigen.
Ein weiterer Kritikpunkt an bisherigen Studien mit einem international vergleichenden Ansatz ist die häufig auch nur implizite
Annahme, dass nicht nur alle Konstrukte in den jeweiligen Ländern existieren und ähnlich gut erfasst werden können, sondern
dass sie darüber hinaus auch in allen Ländern in gleichen Verhältnissen zueinander stehen. Diese Annahme unterstellt, dass die
Orchestrierung von Unterricht in den unterschiedlichen Kulturen ähnlich realisiert wird und widerspricht dem Befund
länderspezifischer Besonderheiten des Unterrichts (Stigler & Hiebert, 2009).
Um eine einheitliche Operationalisierung sicherzustellen, untersuchten Givvin, Hiebert, Jacobs, Hollingsworth und Gallimore
(2005) Zeiteinheiten des Auftretens bestimmter Sichtstrukturen in den TIMSS Videos von 1995 und 1999. Ihr Maß der
Konvergenz verschiedener Zeitanteile einer Unterrichtsaktivität an der Gesamtunterrichtszeit zwischen Schulen und Ländern
weist auf stark unterschiedliche Auftretenswahrscheinlichkeiten der untersuchten Aktivitäten bei gleichzeitig ähnlichen
Wirkungsmustern für die Schülerleistungsentwicklung hin.
Beitrag dieser Studie
Aufbauend auf diesen Analysen möchte die vorliegende Studie das Repertoire der untersuchten Beschreibungsdimensionen auf
gängige Indikatoren der allgemeindidaktischen, der fachdidaktischen sowie der pädagogisch-psychologischen Forschung
erweitern, um die Komplexität des Unterrichtsgeschehens an verschiedene Forschungsstränge anschließend darstellen und
vergleichen zu können. Ziel der Studie ist es, Ähnlichkeiten in den Beschreibungen des Mathematikunterrichts in den einzelnen
Ländern zu finden und zugleich länderspezifische Kovariationen der Beschreibungsdimensionen zuzulassen, um kulturelle
Muster des Unterrichtens nicht zu übersehen.
Methode
Als Datengrundlage dienen die Daten der Studie PISA 2012 aus elf Ländern (Australien, Deutschland, Finnland, HongkongChina, Japan, Niederlande, Polen, Schweden, Schweiz, Tschechische Republik, USA). PISA 2012 erfasste in diesen Ländern
ca. 74.000 Schülerinnen und Schüler. Das Rotationsdesign der Kontextfragebögen führt zu einer Datenbasis von etwa ⅓ dieser
Stichprobe. Für dieses Drittel liegen Angaben zu Beschreibungsdimensionen der bisher häufig in der pädagogischpsychologischen Forschung untersuchten Unterrichtsqualität, eher allgemeindidaktischer Unterrichtsaktivitäten und -methoden
sowie fachdidaktisch orientierter Angaben zu den behandelten Inhalten des Mathematikunterrichtes vor. Nach einer Analyse der
Messinvarianz dieser Beschreibungsdimensionen werden latente Profilanalysen auf individueller und auf Schulebene berechnet.
Aufgrund der großen Unterschiede in den Schulsystemen der Länder werden die Schülerperformanz im PISA Mathematiktest,
die besuchte Klassenstufe und der sozioökonomischer Hintergrund der Schüler als Prädiktoren für die latenten Klassen mit in
die Analysen aufgenommen.
Ergebnisse
Die Messinvarianzprüfung zeigt eine eingeschränkte Vergleichbarkeit der Daten in den Ländern. Erste Mehrgruppenmodelle
latenter Profilanalysen weisen darauf hin, dass einige Beschreibungsdimensionen keinen relevanten Beitrag zur Profilbildung
beitragen, wogegen andere stärker differenzieren. Die Schülerangaben zur Unterrichtsbeschreibung zeigen deutliche
Unterschiede zwischen den Ländern, wobei sich jeweils Ähnlichkeiten zwischen einzelnen Ländern beobachten lassen. Die
Ergebnisse werden vor dem Hintergrund der Allgemeingültigkeit und Generalisierbarkeit von Unterrichtskulturen in so
verschiedenen Regionen und Bildungssystemen diskutiert.
Mehrdimensionale Bildungsziele im Mathematikunterricht und ihr Zusammenhang mit den
Basisdimensionen der Unterrichtsqualität
Anja Schiepe-Tiska1, Jörg-Henrik Heine1, Oliver Lüdtke2, Tina Seidel1, Manfred Prenzel1
1
Technische Universität München, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und M
Theoretischer Hintergrund
Schule und Unterricht haben nicht nur das Ziel (Fach-)Wissen zu vermitteln; sie sollen im Sinne mehrdimensionaler Bildungsziele
Jugendliche auch dabei unterstützen, fachspezifische Interessen und Vertrauen in die eigenen Fähigkeiten
(Selbstwirksamkeitserwartungen) zu entwickeln. Interesse ist dabei gekennzeichnet durch eine kognitive
(gegenstandsbezogene), affektive und wertbezogene Komponente (Krapp & Prenzel, 2011). Selbstwirksamkeitserwartungen
beschreiben Überzeugungen, konkrete Handlungen und Problemstellungen erfolgreich bewältigen zu können (Bandura, 1977).
Für das Erreichen dieser mehrdimensionalen Bildungsziele nimmt der Mathematikunterricht eine zentrale Rolle ein (KMK, 2003).
Angebots-Nutzungs-Modelle (vgl. Seidel & Reiss, 2014) postulieren, dass die Qualität der angebotenen Lerngelegenheiten im
Unterricht unter anderem von der professionellen Lehrerkompetenz sowie Kontexteffekten der Klasse und Schule beeinflusst
werden. Inwieweit der Unterricht jedoch seine Wirkung entfaltet und Jugendliche die angestrebten Zielkriterien erreichen, hängt
davon ab, ob und wie Lernende die dargebotenen Lerngelegenheiten wahrnehmen und aktiv nutzen. Die Qualität von Unterricht
kann demnach daran festgemacht werden, wie gut es Lehrpersonen gelingt, Angebotsstrukturen zu schaffen, die Jugendlichen
Möglichkeiten bieten, mehrdimensionale Ziele zu erreichen. Auf der Basis von Analysen von Unterrichtsvideos ließen sich drei
Dimensionen der Unterrichtsqualität identifizieren (Klieme, Schümer & Knoll, 2001), die sich auch in Studien fanden, die andere
methodische Zugänge wählten (z.B. Kunter et al., 2011): kognitive Aktivierung, effiziente Klassenführung und konstruktive
Unterstützung.
Bisherige Befunde zeigen, dass ein kognitiv aktivierender, störungsarmer Unterricht positiv mit der Mathematikleistung
zusammenhing (Klieme et al., 2001; Kunter, 2005; Rakoczy, 2008). Gleichzeitig zeigte sich, dass eine effiziente Klassenführung
mit einem höheren Maß an Interesse an Mathematik einherging. Darüber hinaus hing Interesse positiv mit der konstruktiven
Unterstützung durch die Lehrkraft zusammen.
Selbstwirksamkeitserwartungen wurden bisher nicht in Studien einbezogen, die den
Basisdimensionen der Unterrichtsqualität und mehrdimensionalen Zielkriterien betrachteten.
Zusammenhang
zwischen
Fragestellung
Der vorliegende Beitrag untersucht, wie multiple Zielkriterien mit den drei Dimensionen der Unterrichtsqualität kognitive
Aktivierung, Disziplin im Klassenzimmer und konstruktiver Unterstützung zusammenhängen. Dabei werden neben der
mathematischen Kompetenz die Ziele Freude und Interesse an Mathematik sowie mathematikbezogene
Selbstwirksamkeitserwartungen einbezogen und es werden systematisch die Zusammenhänge dieser Zielkriterien mit den
Dimensionen der Unterrichtsqualität auf der Schüler- und Klassenebene verglichen.
Methode
Zur Beantwortung unserer Fragestellungen wurden Daten aus der nationalen Erweiterung der PISA-Studie 2012 verwendet. Die
Stichprobe bestand aus 211 bundesweiten Schulen von denen 412 Klassen mit 9845 Jugendlichen (MAlter = 15.56; SDAlter =
0.62; nweiblich = 4919; nmännlich = 4926) teilnahmen. Die mittlere Klassengröße betrug 23.9 Schülerinnen und Schüler (SD =
4.25). Die Schülerinnen und Schüler bearbeiteten einen zweistündigen Kompetenztest und anschließend Fragen zu ihrem
Unterricht, Interesse und Selbstwirksamkeitserwartungen. Der Schülerfragebogen wurde erstmals in einem Rotationsdesign mit
drei verschiedenen Fragebogenvarianten eingesetzt (OECD, 2014). Alle Varianten enthielten Fragen zum familiären Hintergrund,
aber nur jeweils zwei Drittel der Jugendlichen beantworteten Fragen zum Unterricht, Interesse und
Selbstwirksamkeitserwartungen.
Im Umgang mit den fehlenden Werten wurden multiple Imputationen verwendet (Lüdtke, Robitzsch, Trautwein & Köller, 2007).
Für jedes Zielkriterium wurden latente Zwei-Ebenen-Strukturgleichungsmodelle spezifiziert, die die Schüler- und
Klassengewichte sowie die Stratifizierung der Stichprobe berücksichtigten. Die individuellen und aggregierten Einschätzungen
des Unterrichts wurden gleichzeitig als Prädiktoren auf Individual- und Klassenebene berücksichtigt (Lüdtke, Robitzsch,
Trautwein & Kunter, 2009). Kontrolliert wurde auf individueller Ebene für die kognitiven Grundfertigkeiten und den
sozioökonomischen Status sowie auf Klassenebene für die Schulart.
Ergebnisse
Die Ergebnisse zeigten für die mathematische Kompetenz positive Zusammenhänge mit kognitiver Aktivierung und effizienter
Klassenführung. Freude und Interesse an Mathematik hing positiv mit kognitiver Aktivierung, Disziplin sowie konstruktiver
Unterstützung zusammen. Hohe mathematikbezogene Selbstwirksamkeitserwartung ging mit kognitiver Aktivierung sowie
Disziplin einher. Dabei zeigten sich die Zusammenhänge mit mathematischer Kompetenz vorwiegend auf der Klassenebene
während die Zusammenhänge mit Interesse eher auf der individuellen Ebene zu finden waren. Für die
Selbstwirksamkeitserwartung zeigten sich Effekte auf beiden Ebenen. Die Befunde weisen darauf hin, dass eine Förderung
mehrdimensionaler Bildungsziele im Mathematikunterricht möglich ist.
Die psychometrische Brille der Unterrichtsforschung: Ein integrativer Ansatz zur Modellierung der
Struktur und Messinvarianz von Aspekten der Instruktionsqualität
Ronny Scherer1, Jan-Eric Gustafsson2
1
Centre for Educational Measurement at the University of Oslo (CE, 2University of Gothenburg
Theoretischer Hintergrund
Die valide Messung der Instruktionsqualität stellt die Grundlage empirischer Forschung zur Effektivität von Unterricht dar. Aktuell
werden verschiedene Datenquellen genutzt, um Aspekte der Instruktionsqualität wie Klassenführung, konstruktive Unterstützung
und kognitive Aktivierung zu beschreiben (Wagner et al., 2015). Die Mehrheit bisheriger Studien verwendete hierbei
Schülereinschätzungen dieser Aspekte und konnte verschiedene Merkmale der Instruktionsqualität identifizieren: (1)
Mehrebenenstruktur: Wenngleich Schülereinschätzungen individuelle Wahrnehmungen des Unterrichtsgeschehens darstellen,
basieren sie auf den Erfahrungen in einem Klassenraum. Wenn die Frage nach der Effektivität von Unterricht im Mittelpunkt steht,
sind diese Einschätzungen auf Klassenebene von Interesse (Marsh et al., 2012). (2) Mehrdimensionalität: Instruktionsqualität
umfasst verschiedene kognitive und nicht-kognitive Aspekte des Lehrens und Lernens (Fauth et al., 2014). (3) Domänenspezifität:
Aspekte der Instruktionsqualität können domänenspezifische Ausprägungen haben. Schließlich wird in der einschlägigen
Literatur darauf hingewiesen, dass die Beschreibung der Instruktionsqualität kulturspezifisch sein kann (OECD, 2014).
Fragestellung
Basierend auf den bislang identifizierten Merkmalen der Instruktionsqualität wird der Frage nachgegangen, inwiefern
Schülereinschätzungen eine valide Beschreibung von Aspekten des Konstrukts liefern. Im Speziellen werden folgende Fragen
beantwortet:
1) Inwiefern repräsentieren die eingesetzten Items die beschriebenen Eigenschaften der Instruktionsqualität?
2) Inwiefern lässt sich das unter 1) identifizierte Messmodell über ausgewählte Länder hinweg verallgemeinern?
3) Welche Zusammenhänge bestehen zwischen den Faktoren der Instruktionsqualität und den Leistungen der Schülerinnen und
Schüler in den Mathematik-, Naturwissenschafts- und Lesetests?
Methode
Grundlage der vorliegenden Studie bilden die TIMSS und PIRLS 2011 Datensätze dreier skandinavischer Länder: Finnland,
Norwegen und Schweden. Insgesamt nahmen 12077 Schülerinnen und Schüler der Jahrgangsstufe 4 an beiden Studien teil und
bearbeiteten Leistungstests sowie Fragebögen in den Domänen Mathematik, Naturwissenschaften und Lesen. Im Wesentlichen
wurden drei Aspekte der Instruktionsqualität erfasst: (1) Klarheit der Anforderungen und Erwartungen, (2) Verständlichkeit der
kommunizierten Inhalte, (3) Interesse der Schülerinnen und Schüler an den Lehreräußerungen. Die Schülerinnen und Schüler
schätzten den Grad des Vorhandenseins dieser drei Aspekte in den drei Domänen ein. Die resultierenden Itemantworten wurden
mit Hilfe eines Mehrebenen-Strukturgleichungsmodells beschrieben, das neben den Aspekten der Instruktionsqualität und den
Domänen auch einen Generalfaktor aller Schülereinschätzungen beinhaltete (Scherer & Gustafsson, 2015). Dieser Faktor lässt
sich zum einen als eine umfassende, domänenübergreifende Einschätzung der Instruktionsqualität deuten; er lässt aber auch
eine Interpretation als Faktor zu, der kulturell geprägte Antwortmuster kontrolliert. Das resultierende, bifaktorielle MehrebenenStrukturgleichungsmodell wurde genutzt, um die drei Forschungsfragen zu beantworten.
Ergebnisse
Hinsichtlich der Mehrebenenstruktur der Instruktionsqualität zeigte sich eine Abhängigkeit der Schülerdaten von der Nestung in
Klassen (ICC-1 zwischen .03 und .12). Auf Schüler- und Klassenebene ließen sich die drei Aspekte der Instruktionsqualität sowie
ein Generalfaktor als latente Variable beschreiben. Schließlich war es möglich, die drei Domänen auf Schülerebene zu
modellieren; um das Modell zu identifizieren, wurde jedoch der Mathematik-Faktor auf Klassenebene entfernt. Auf Grundlage
dieser Befunde konnten damit die Mehrebenenstruktur, Mehrdimensionalität sowie die Domänenspezifität beschrieben werden.
Das vorgeschlagene Modell erwies sich als vollständig messinvariant über die drei Länder hinweg (strikte Messinvarianz) und
lieferte somit Hinweise auf die Generalisierbarkeit im Kontext der drei Länder. Hinsichtlich der Zusammenhänge der
verschiedenen Faktoren zu den Schülerleistungen ergaben sich signifikante Korrelationen in allen drei Domänen lediglich mit
dem Faktor „Verständlichkeit der kommunizierten Inhalte“ auf Klassenebene (beta=.31-.32). Der Generalfaktor kann aufgrund
der geringen und größtenteils nicht signifikanten Korrelationen mit den Leistungen als ein Faktor interpretiert werden, der
möglichen Bias im Antwortmuster der Schülerinnen und Schüler beschreibt (He, Bartram, Inceoglu, & van de Vijver, 2014). Vor
dem Hintergrund der Ergebnisse folgern wir, dass das vorgeschlagene bifaktorielle Mehrebenen-Strukturgleichungsmodell
Evidenzen für eine valide Beschreibung von Aspekten der Instruktionsqualität liefert, da dieses Modell die verschiedenen
Charakteristiken der Instruktionsqualität systematisch vereint.
ID: 394
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktik Deutsch
Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Lese- und Sprachförderung
Stichworte: Lesekompetenz, Diagnostik, Textverständnis, Textmerkmale, Personenmerkmale
Diagnostische Aspekte der Lesekompetenzmessung über die Lebenspanne unter Berücksichtigung
verschiedener Text- und Personenmerkmale
Chair(s): Ilka Wolter (Leibniz-Institut für Bildungsverläufe Bamberg), Lena Nusser (Otto-Friedrich-Universität Bamberg),
Cordula Artelt (Otto-Friedrich-Universität Bamberg)
Diskutant(en): Barbara Drechsel (Otto-Friedrich-Universität Bamberg)
Lesekompetenz wird verstanden als Fähigkeit, das Gelesene zu nutzen, um eine mentale Repräsentation des Inhaltes (d.h. ein
Situationsmodell) eines Textes zu bilden (Kintsch, 1998; vgl. Oakhill, Kain & Elbro, 2015). Neben Fähigkeits- und
Wissensmerkmalen sowie den Rezeptionszielen der Lesenden spielen bei der Vorhersage des Textverstehens auch Merkmale
der Texte (z.B. Gestaltung des Textmaterials, also die Bereitstellung von Strukturen, die das Bilden von Referenzen und von
Verknüpfungen zwischen Sätzen und somit auch das Ziehen von Inferenzen aus Texten ermöglichen) und die konkreten
Verstehensanforderungen eine Rolle. Das Textverständnis ist dabei als Resultat des Zusammenwirkens von Personen- und
Textmerkmalen zu verstehen (vgl. Schnotz, 2006).
Die Bedeutung von Text- und Anforderungsmerkmalen für die Lesekompetenzdiagnostik soll in dieser Arbeitsgruppe
herausgestellt werden. Da sich in empirischen Studien in der Lesekompetenz wiederholt Unterschiede aufgrund verschiedener
Personenmerkmale zeigen, besteht ein großer Bedarf an reliablen und validen Testinstrumenten, welche Besonderheiten von
Subgruppen berücksichtigen sowie sensitiv für Veränderungen in verschiedenen Altersbereichen sind. Vor dem Hintergrund
zahlreicher Studien, in welchen Differenzen in der Lesekompetenz u.a. auf sprachliche Herkunft, SES und Geschlecht
zurückgeführt werden (z.B. Naumann, Artelt, Schneider & Stanat, 2010), sollen Besonderheiten der Lesekompetenzdiagnostik in
der Betrachtung verschiedener Personengruppen beleuchtet werden.
In dieser Arbeitsgruppe werden Einflüsse variierender Textmerkmale und in verschiedenen Subgruppen in der Diagnostik des
Textverständnisses betrachtet. Die Beiträge zeichnen sich dadurch aus, dass in der Entwicklung der Verfahren zur Erhebung
des Textverständnisses vor allem kognitionspsychologische Konzeptionen (vgl. Kintsch, 1988) herangezogen, aber auch
herausfordernde Personengruppen wie jüngere Kinder und Schüler(innen) mit sonderpädagogischem Förderbedarf einbezogen
werden.
Im ersten Beitrag wird ein computerbasiertes, adaptives Testverfahren zur Lesediagnostik bei Grundschulkindern der 3. Klasse
vorgestellt, welches über Sach- und narrative Texte unterschiedlicher Anforderungsstufen das Textverständnis erfasst. Der
zweite Beitrag stellt eine experimentelle Variation von Anforderungen in Testmaterialien für die Lesekompetenzmessung bei
Schüler(innen) der 7. Klasse mit sonderpädagogischem Förderbedarf vor. Es werden unterschiedliche Bearbeitungsarten
identifiziert und Zusammenhänge mit kognitiven Grundfähigkeiten aufgezeigt. Im dritten Beitrag wird in einer experimentellen
Studie am Beispiel von Physiktexten aufgezeigt, inwiefern das Textverständnis von Schüler(innen) der 9. Klasse bei variierender
Kohäsion von Texten identischen Inhalts mit bestimmten Personenmerkmalen (z.B. Geschlecht, sprachlicher Hintergrund,
Vorwissen) einhergeht. Der vierte Beitrag thematisiert die Lesekompetenzmessung im Erwachsenalter und die individuelle
Anwendung von Strategien bei der Aufgabenbearbeitung in einem computerbasierten Testverfahren. In einem experimentellen
Design werden die initialen Text-Lesezeiten in Abhängigkeit davon untersucht, ob nach begonnener Aufgabenbearbeitung
Texteinsicht oder keine Texteinsicht möglich war. Abschließend werden die Beiträge hinsichtlich ihres Mehrwerts für die
Lesekompetenzdiagnostik in verschiedenen Altersbereichen diskutiert.
Beiträge des Symposiums
Faire und adaptive Lesediagnostik: Analysen zu Reliabilität, Fairness und Validität eines
computerbasierten Textverständnistests für Grundschulkinder
Annika Ohle, Franziska Schwabe, Nele McElvany
Institut für Schulentwicklungsforschung (ifs), Dortmund
Aufgrund der Bedeutung von Lesekompetenzen für die Teilhabe am schulischen und gesellschaftlichen Leben und der
Heterogenität in den Leseleistungen bereits bei Grundschulkindern (Foorman & Connor, 2011) sind passgenauer Unterricht und
individuelle Unterstützung der Kinder aller Kompetenzstufen erforderlich. Die verlässliche und faire Messung der vorhandenen
Kompetenzen und Defizite ist dabei eine Grundvoraussetzung für Auswahl und Einsatz adäquater Fördermaßnahmen.
Computerbasierte, adaptive Testverfahren können hier zu einer Steigerung der Messeffizienz beitragen, da sie im Gegensatz
zum Vorgehen konventioneller Testverfahren die zu bearbeitenden Testaufgaben an die beobachteten Leistungen der
Testperson anpassen (van der Linden & Glas, 2000). Damit sind sie klassischen Verfahren vor allem aufgrund der höheren und
gleichmäßigeren Messgenauigkeit überlegen. Vor dem Hintergrund wachsender Diversität in Schule und Unterricht ist darüber
hinaus die Fairness des Gesamttests sowie einzelner Items für unterschiedliche Schülergruppen ein bedeutsames Kriterium
(Camilli, 2006) und bei der Entwicklung neuer Instrumente zu berücksichtigen. Zentrales Element eines adaptiven Tests ist ein
ausreichend homogener Itempool, der den üblichen Gütekriterien an Tests gerecht wird und den Anforderungen an „faires“
Testen gerecht wird. Ausgehend von einem solchen Itempool kann eine verlässliche Diagnostik von Lesekompetenz bei Kindern
im Grundschulalter kurz nach dem Entwicklungsschritt zwischen _Lernen zu lesen_ und _Lesen um zu lernen_ realisiert werden.
Um zu klären, ob die vorliegenden Testitems in der schulischen Praxis und für die weitere Forschung eingesetzt werden können,
werden die folgenden Fragen zu einem auf Basis der Theorie von Kintsch (van Dijk & Kintsch, 1983) entwickelten Itempool, der
das Textverständnis von Kindern der dritten Grundschulklasse computerbasiert erfasst, beantwortet:
(1) Erfüllt der Itempool die Anforderungen an Reliabilität sowohl für (1a) die Gesamtstichprobe als auch für (1b) relevante
Schülersubgruppen (Mädchen, Jungen; Kinder mit/ohne Migrationshintergrund; Kinder sozial schwächerer/stärkerer Lage)?
(2) Sind die Einzelitems des Itempools fair gegenüber den genannten Schülersubgruppen?
(3) Weist der Itempool zufriedenstellende (3a) konvergente und (3b) diskriminante Validität auf?
Insgesamt flossen die Daten von _N_ = 1 039 Grundschulkindern der dritten Klassenstufe in die Analysen ein (Alter: _M_ = 9.08
Jahre [_SD_ = 0.50]; 50.3% Mädchen; 40.0% Kinder mit sprachlichem Migrationshintergrund; HISEI: _M_ = 47.59 [_SD_ =
15.65]). In einem Multi-Matrix-Design bearbeitete jeweils nur ein Teil der Kinder einen Teil der 86 computerbasierten Items. Der
Textverständnistest ist – angelehnt an Modelle des Leseverstehens – so konzipiert, dass sowohl literarische und Sachtexte als
auch hierarchieniedrige und -hohe Leseprozessanforderungen abgedeckt sind. Das Antwortformat aller Items ist ein MultipleChoice Format mit vier Antwortmöglichkeiten. Dargestellt werden Kennzahlen zur Verteilung der Itemschwierigkeitsparameter
auf Grundlage einer Skalierung mit dem einparametrischen logistischen Modell der IRT mit TAM in R. Zur Beantwortung der
Forschungsfragen werden (1) Reliabilitäten für Subgruppen, (2) Ergebnisse zu _Differential Item Functioning_ (DIF) als Indikator
für Testfairness und (3) Zusammenhänge mit relevanten Drittvariablen dargestellt.
Die Ergebnisse in Bezug auf den Itempool zeigen, dass für das gewählte einparametrische logistische Testmodel global die
größte Zuverlässigkeit im mittleren Bereich der Fähigkeitsverteilung liegt. Die Reliabilitäten des Itempools (Frage 1) sind in der
Gesamtgruppe wie auch für die genannten Subgruppen akzeptabel bis zufriedenstellend (.63 < EAP α <.73). Die Items des
Gesamttests sind außerdem gegenüber den genannten Schülergruppen frei von DIF (Frage 2). In Bezug auf Hinweise zur
Validität (Frage 3) bestehen signifikante Korrelationen zu bereits etablierten Testverfahren im Bereich sprachlicher Kompetenzen
(.55 < _r_ < .89) sowie nur geringe Korrelationen zu einem Test kognitiver Grundfähigkeiten (_r_ < .29).
Abschließend wird die Qualität – gemessen an den dargestellten Gütekriterien – des Testinstruments mit Blick auf dessen
Verwendung im Schulkontext sowie im Rahmen weiterer, wissenschaftlicher Studien diskutiert.
Widrigkeiten bei der Kompetenztestung!? – Erklärungsansätze für die Lesetestbearbeitung von
Förderschülerinnen und -schülern
Lena Nusser1, Karin Gehrer2, Sabine Weinert1, Cordula Artelt1, Claus H. Carstensen1
1
Otto-Friedrich-Universität Bamberg, 2Leibniz-Institut für Bildungsverläufe Bamberg
Der Anteil der Schülerinnen und Schüler, die eine Zuweisung eines sonderpädagogischen Förderbedarfs erhalten, hat in den
letzten Jahren stetig zugenommen (von 5.3% in 2000 auf 6.6% in 2010; Autorengruppe Bildungsbericht, 2014). Die größte
Gruppe mit fast 40% stellen jene Schülerinnen und Schüler mit einem sonderpädagogischen Förderbedarf Lernen (SPF-L) dar,
die meist lernzieldifferent und überwiegend in einem stark gegliederten Förderschulsystem unterrichtet werden.
Bisher existieren wenige breit angelegte und zugleich differenzierte Untersuchungen hinsichtlich der Kompetenzentwicklung
dieser Schülergruppe, vor allem im Vergleich zu integrativ beschulten Kindern bzw. Kindern ohne SPF. Grund hierfür ist die
besondere Herausforderung, bildungsrelevante Kompetenzen von Schülerinnen und Schülern mit und ohne SPF-L in beiden
Gruppen gleichermaßen valide und vergleichbar zu erfassen. Bisherige Ergebnisse von Machbarkeitsstudien zur Erfassung der
Lesekompetenz bei Lernenden an Förderschulen in 5. Klassen im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld,
Roßbach & von Maurice, 2011; Heydrich, Weinert, Nusser, Artelt & Carstensen, 2013) zeigen bei dieser Gruppe - im Unterschied
zu einer Schülergruppe an Hauptschulen - neben einem erhöhten Auftreten von fehlenden Werten, nicht akzeptable,
unsystematische Itemfitwerte sowie differential-item-functioning bei einer Vielzahl von Items (Südkamp, Pohl & Weinert, 2015).
Dabei dürfte die Gruppe von Schülerinnen und Schülern mit SPF-L alles andere als homogen in ihren Fähigkeitsprofilen, die die
Item- und Testbearbeitung und damit die Messung der Lesekompetenz beeinflussen, sein. Neben eingeschränkten sprachlichen
Fähigkeiten kann eine reduzierte Aufmerksamkeitsspanne, die bei der Schülergruppe mit SPF-L häufig zu finden ist (Grünke,
2004), dazu führen, dass das Verständnis der Ausfüllhinweise als auch die konsequente und sequenzielle Testbearbeitung nur
eingeschränkt erfolgt. Dabei ist eine Interaktion zwischen spezifischen Anforderungen des Testmaterials und den Fähigkeiten
einer Person zu erwarten. So wird vermutet, dass Lese- und Wahrnehmungsgeschwindigkeit, die Aufmerksamkeitsspanne sowie
verbale und nonverbale Fähigkeiten die Testbearbeitung der Schülerinnen und Schüler maßgeblich beeinflussen können (vgl.
auch Artelt, Stanat, Schneider & Schiefele, 2001). Um die erwähnten Ausgangsbedingungen dieser Schülergruppe bei
Kompetenztestungen zu berücksichtigen, werden häufig Akkommodationen, von denen angenommen wird, dass sie
konstruktirrelevant sind, implementiert (z. B. read-aloud, mehr Testzeit, reduzierte Itemschwierigkeit, vgl. Koretz & Barton, 2003).
Ziel der vorliegenden Studie ist es zu überprüfen, ob bei der Erfassung des Leseverständnisses innerhalb der NEPSRahmenkonzeption (Gehrer, Zimmermann, Artelt & Weinert, 2013) bei Schülerinnen und Schülern mit SPF-L unterschiedliche
Bearbeitungsprofile mittels latenter Klassenanalysen identifiziert werden können. Zum einen sollen aufgabenspezifische
Schwierigkeiten im Zusammenhang mit kognitiven Anforderungen des Testmaterials aufgezeigt und zum anderen die
Bearbeitungsprofile durch relevante Vorläuferfertigkeiten erklärt werden. Zudem wird untersucht, ob sich vergleichbare Profile
und Erklärungsansätze bei Schülergruppen an Hauptschulen finden lassen.
413 Schülerinnen und Schüler mit SPF-L in der 7. Jahrgangstufe an Förderschulen Lernen nahmen an der Studie teil
(Altersdurchschnitt: _M_ = 13.43 Jahre, 40% weiblich). Die Schülerinnen und Schüler (_n_ = 125) im 6. Jahrgang an
Hauptschulen dienen im Rahmen dieser Analysen als Vergleichsgruppe (Altersdurchschnitt: _M_ = 12.22 Jahre, 39% weiblich).
In einem experimentellen Design wurden für die vorliegende Studie je zwei unveränderte Test-Units (Text plus Aufgaben) mit
drei angepassten Test-Units ergänzt. Eine Akkommodation zielte auf eine Reduzierung des Wortschatzes sowie einer
Vereinfachung der grammatikalischen Struktur der Verständnisfragen (Groeben & Christmann, 1998). Anhand eines theoretisch
hergeleiteten Regelsystems wurden alle Aufgabenstämme und -antworten überarbeitet, um eine signifikante Verbesserung der
Lesbarkeit zu erzielen. In einer zweiten Experimentalbedingung wurden Texte und zugehörige Verständnisfragen administriert,
die ursprünglich für jüngere Schülerinnen und Schüler an Regelschulen entwickelt wurden (out-of-level-Testung; siehe auch
Thurlow, Elliott & Ysseldyke, 1999).
Erste Ergebnisse zeigen differenzielle Bearbeitungsprofile, die zwischen Schülergruppen mit höheren bzw. niedrigeren
Lösungswahrscheinlichkeiten über eine Vielzahl von Aufgaben sowie Profilen mit spezifischen Stärken und Schwächen
unterscheiden. Es deuten sich Zusammenhänge zwischen den identifizierten Testbearbeitungsprofilen und den kognitiven
Grundfähigkeiten der Schülerinnen und Schüler an.
Naturwissenschaftsbezogenes Textverständnis als Interaktion von Personen- und Textmerkmalen
Nicole Kohnen, Hendrik Härtig, Sascha Bernholt, Jan Retelsdorf
IPN Kiel
*Theoretischer Hintergrund*
Auch für den Bildungserfolg in den Naturwissenschaften ist ein angemessenes Textverständnis wesentlich (Norris & Phillips,
2003). Im Allgemeinen versteht man Lesen nicht als eine reine Informationsentnahme aus einem Text. Vielmehr haben Lesende
z.B. mit ihrem Vorwissen und ihren Erwartungen individuelle Zugangsvoraussetzungen, auf deren Basis der Verstehensprozess
stattfindet. Dieser führt nach van Dijk und Kintsch (1983) zu einer Repräsentation des Textes auf drei Ebenen (wörtliche
Repräsentation, propositionale Repräsentation, Situationsmodell). Da der Verstehensprozess sowohl von den einzelnen
Lesenden abhängt als auch vom Text angeleitet wird, nimmt man einen vom Text gesteuerten Konstruktionsprozess und einen
von den Lesenden gesteuerten, aktiven Integrationsprozess an. Das Textverständnis ergibt sich somit auf allen Ebenen aus
einem Zusammenspiel von Personen- und Textmerkmalen (Schnotz, 2006; Kintsch, 1988).
Im Rahmen dieses Projekts wird das naturwissenschaftsbezogene Textverständnis von Schüler/innen erstmals systematisch als
eine ebensolche Interaktion untersucht. An Personenmerkmalen werden inhaltsbezogenes, domänenspezifisches Vorwissen,
der allgemeine rezeptive Wortschatz, die basale Lesekompetenz, das allgemeine Textverständnis narrativer Texte, das
Lesestrategiewissen, das schlussfolgernde Denken, das Geschlecht und die Sprache im Elternhaus erhoben. Auf der Textseite
wird die Kohäsion variiert (d.h. mehr oder weniger sprachliche Verknüpfungsmittel auf der Textoberfläche werden zwischen den
einzelnen Sätzen bzw. Absätzen eingesetzt), da ein Einfluss der Kohäsion auf das Textverständnis belegt ist (Schmitz & Gräsel,
angenommen; Ozuru et al., 2009).
*Fragestellungen*
1. Inwiefern beeinflusst die sprachliche Gestaltung (Leichte Sprache/lokal und global kohäsiv/lokal und global inkohäsiv) das
Textverständnis naturwissenschaftlicher expositorischer Texte für die Sekundarstufe 1?
2. Welchen Effekt haben die personenbezogenen Variablen (Vorwissen, Wortschatz, basale Lesekompetenz, allgemeines
Textverständnis, Lesestrategiewissen, schlussfolgerndes Denken, Geschlecht, Sprache im Elternhaus) auf das Textverständnis?
3. Welche Interaktionseffekte stellen sich zwischen den Personen- und den Textmerkmalen mit Blick auf das Textverständnis
naturwissenschaftlicher Texte dar?
*Methode*
Aktuell wird ein randomisiertes Experiment mit den drei Bedingungen der Textversionen durchgeführt. Befragt werden ca. 300
Neuntklässler/innen an schleswig-holsteinischen Gemeinschaftsschulen. Insgesamt werden zu zwei physikalischen Themen
jeweils drei Textversionen eingesetzt. Die Textversionen zu einem Thema unterscheiden sich nur in sprachlicher, nicht in
inhaltlicher Hinsicht. Die erste Version ist in Leichter Sprache (nach Maaß, 2015) verfasst und damit lokal und global hochkohäsiv.
Die Syntax und die Morphologie der zweiten Version sind komplexer, das Layout ist verändert. Auch diese Variante ist aber mit
den explizit gemachten semantischen Relationen, vielen Erklärungen sowie den Themensätzen lokal und global sehr kohäsiv.
Die dritte Version ist in syntaktischer und morphologischer Hinsicht ähnlich komplex, die genannten Kohäsionsmittel sind aber
nicht vorhanden. Jede/r Schüler/in liest zwei Texte unterschiedlichen Inhalts, wobei beide Texte in Leichter Sprache verfasst,
kohäsiv oder inkohäsiv sind.
An Kontrollvariablen werden der sozio-ökonomische Hintergrund, das Alter, die Deutsch- und Physiknoten, das generelle
Fachinteresse, das Selbstkonzept Physik, die habituelle Lesemotivation und Grit erhoben. Außerdem werden die
Lesbarkeitsindizes und die Lesedauer gemessen. Nach dem Lesen werden das situative Interesse, die Einschätzung der eigenen
Leistung sowie die drei Ebenen der Textrepräsentation getestet.
*Erwartete Ergebnisse*
Erwartet wird der Expertise Reversal Effect (McNamara & Kintsch, 1996; McNamara et al., 1996), nach dem Lesende mit wenig
Vorwissen stärker von einer hohen Kohäsion, Lesende mit viel Vorwissen dagegen stärker von einer geringen Kohäsion
profitieren. Eine hohe Kohäsion sollte aber auch für Lesende mit viel Vorwissen vorteilhaft sein, die über eine hohe
Lesekompetenz verfügen (O’Reilly & McNamara, 2007). Ebenso sollten Lesende mit wenig Vorwissen mit einem kohäsiven Text
v.a. dann eine angemessene Textrepräsentation erlangen können, wenn sie im Allgemeinen gut lesen können (Ozuru et al.,
2009). Ferner gehen wir davon aus, dass Lesende mit wenig Vorwissen den Nachteil beim Lesen inkohäsiver Texte durch eine
hohe allgemeine Lesefähigkeit und schlussfolgerndes Denken kompensieren können. Schließlich erwarten wir, dass der
Wortschatz, das Vorwissen und das schlussfolgernde Denken das Textverständnis am stärksten beeinflussen.
Sind gute Lesende unter widrigen Bedingungen flexible Strategienutzende? Logdatenanalyse der
Kontextauswirkung auf Testleistungen
Florian Kopp1, Karin Gehrer1, Cordula Artelt2, Ilka Wolter1, Ingrid Koller3
1
Leibniz-Institut für Bildungsverläufe Bamberg, 2Otto-Friedrich-Universität Bamberg, 3Alpen-Adria Universität Klagenfurt
Empirische Befunde zeigen, dass Testleistungen als Resultat individueller Kompetenzen im Zusammenspiel mit den jeweiligen
Kontextbedingungen der Testsituation gesehen werden müssen. (Fischer, Bullock, Rotenberg & Raya, 1993). Als Teil der
Kompetenz sehen wir das Wissen und die adaptive Anwendung von Strategien in Abhängigkeit vom Kontext. Daraus folgt, dass
Kontext nicht nur einen direkten Einfluss auf die Testleistung hat, z.B. durch eine Änderung der kognitiven Anforderungen,
sondern auch zu einem veränderten Strategieeinsatz führt, der ebenfalls einen Effekt auf die Testleistung haben sollte. Wir
nehmen an, dass Personen unterschiedlicher Kompetenzniveaus sich hinsichtlich ihres Strategieeinsatzes bei der Bearbeitung
von Aufgaben unterscheiden, da sowohl die Strategien als auch die Fähigkeit, die situational passende Strategie auszuwählen,
leistungsrelevante Aspekte sind (vgl. Pressley, Borkwski & Schneider, 1989).
Im Rahmen der Lesekompetenzmessung stellen mögliche Einschränkungen der Texteinsicht bei der Bearbeitung dazugehöriger
Aufgaben eine Variation der Aufgabenanforderungen dar, die mit unterschiedlichen Strategien einhergehen sollte. Ohne
Texteinsicht zeichnet sich das Leseverhalten insbesondere durch eine höhere Verarbeitungsqualität (vgl. Artelt, Stanat,
Schneider & Schiefele, 2001, S. 84) aus. Dies sollte mit höheren Anforderungen und somit mit längeren Lesezeiten einhergehen
(vgl. Goldhammer, Naumann, Stelter, Tóth, Rölke & Klieme, 2014). Empirische Ergebnisse zeigen, dass sich die Testresultate
beim Lesen mit oder ohne Testeinsicht für verschiedene Teilnehmergruppen unterscheiden (Artelt et. al., 2001, S. 126).
In der vorgestellten Studie wurde eine Variation in der Aufgabenanforderung über zwei Bedingungen realisiert: Die teilnehmenden
Personen konnten Leseaufgaben entweder mit oder ohne Texteinsicht nach dem Beginn der Aufgabenstellung bearbeiten. Bei
der Konstruktion des Testmaterials wurde darauf geachtet, dass Leseverstehensaufgaben sich durch geringe
Gedächtnisanforderungen auszeichnen (vgl. Kintsch, 1982). Aufgrund obiger theoretischer Überlegungen und ausgehend von
der nachgewiesenen Voraussetzung der Eindimensionalität des gemessenen Lesekompetenzkonstruktes über die Aufgaben der
beiden Bedingungen, wurden die folgenden zwei Hypothesen untersucht: 1) Die Bedingung der Nicht-Texteinsicht sollte zu
erhöhten Itemschwierigkeiten führen (vgl. Artelt et. al., 2001). 2) Personen in der Bedingung der Nicht-Texteinsicht passen ihre
Erstlesestrategie an. Dies gilt insbesondere für Personen mit hoher Lesekompetenz.
In einer Stichprobe von _N_ = 899 Erwachsenen (Altersrange 20-70 Jahre) aus einer computeradministrierten Entwicklungsstudie
im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld, Roßbach & von Maurice, 2011) erfolgte die
Lesekompetenzmessung (Gehrer, Zimmermann, Artelt & Weinert, 2013) anhand von 18 Texten unterschiedlicher Textsorten
(Gehrer & Artelt, 2013). In sechs Texten wurden die Personen zufällig der experimentellen Bedingung (mit oder ohne
Texteinsicht) zugeordnet.
Als Indikator für die Strategienutzung diente im Rahmen des Bearbeitungsverhaltens die Erstlesezeit der Texte vor der
Aufgabenbearbeitung. Dazu erfolgte eine Logdatenanalyse.
Die Überprüfung der Messinvarianz über die Experimentalgruppen sowie die Dimensionalitätsprüfung der Aufgaben über die
zwei experimentellen Variationen erfolgte mittels des multidimensionalen Rasch-Modells. Entgegen der ersten Annahme zeigten
die Analysen, dass die Variation der Texteinsicht keinen Einfluss auf die geschätzten Itemschwierigkeiten hatte. Aufgaben ohne
Texteinsicht waren zum Großteil nicht schwerer als dieselben Aufgaben, die mit Texteinsicht administriert wurden.
In Bezug auf die zweite Hypothese zeigte die Analyse der Logdaten erwartungskonform, dass die durchschnittlichen
Erstlesezeiten bei den Personen in der Bedingung ohne Texteinsicht über alle sechs Texte länger war als in der Bedingung mit
Texteinsicht (_p <_ .01, Mittelwertdifferenzen: 11.5-31.0 Sekunden). Weiterhin zeigte sich wie erwartet, dass Personen mit
höherer Lesekompetenz in der Bedingung ohne Texteinsicht bei allen sechs Texten signifikant mehr Zeit benötigten als in der
Bedingung mit Texteinsicht (_p <_ .01, Mittelwertdifferenzen: 21.1-38.1 Sekunden). Bei den schlechten Lesenden zeigt sich
dieses Muster weniger deutlich. Weitere Analysen sollen den unterschiedlichen Strategiegebrauch in der Gruppe der
schlechteren Lesenden näher beleuchten und untersuchen, inwiefern weitere Muster in den Strategien der Aufgabenbearbeitung
abgebildet werden können.
Die Ergebnisse werden vor dem Hintergrund der Frage adaptiver Strategienutzung in der Testbearbeitung diskutiert.
Abschließend wird ein Ausblick gegeben, wie weitere Bearbeitungsstrategien in computerbasierten Kompetenztests durch
Logdatenanalyse untersucht werden können.
ID: 400
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Didaktiken der Naturwissenschaften und Technik, Lehrerbildung
Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung
Stichworte: (Angehende) Lehrkräfte, Professionelle Kompetenz, Professionswissen, Motivationale Orientierungen,
Erkenntnisgewinnung
Struktur und Entwicklung professioneller Kompetenz von (angehenden) Lehrkräften
Chair(s): Ute Harms (IPN)
Diskutant(en): Thilo Kleickmann (Christian-Albrechts-Universität Kiel)
Das hier vorgeschlagene Symposium führt Arbeiten zur Strukturaufklärung und Entwicklung professioneller Kompetenz von
(angehenden) Lehrkräften aus den Projekten BilWiss, KiL und Ko-WADiS zusammen. Dabei werden alle drei Phasen der
Lehrerbildung (Studium, Vorbereitungsdienst und Schuldienst) in den Blick genommen. Der fachliche Schwerpunkt liegt auf der
Lehrerbildung im Bereich der Naturwissenschaften. Die Einzelbeiträge werden durch zwei Linien miteinander verknüpft. Die erste
Linie bezieht sich auf die jeweils untersuchten Aspekte der professionellen Kompetenz: Die ersten drei Beiträge thematisieren
das Professionswissen, der vierte Beitrag nimmt Domänen der motivationalen Orientierungen von Lehrkräften in den Blick. Die
zweite Linie adressiert unterschiedliche Fragen an diese Aspekte: Beitrag eins (Großschedl et al.) und zwei (Hartmann et al.)
beschäftigen sich mit Fragen der Struktur des fachbezogenen Professionswissens; Beitrag drei (Kunina-Habenicht et al.) und
vier (Harms & Mahler) legen den Schwerpunkt auf die Entwicklung einzelner Aspekte der professionellen Kompetenz von
Lehrkräften in Abhängigkeit von speziellen Lerngelegenheiten. In diesem Zusammenhang wird zum einen die Wirksamkeit neuer
in den Vorbereitungsdienst integrierter Ausbildungselemente auf die Entwicklung bildungswissenschaftlichen Wissens
untersucht, zum anderen wird Zusammenhängen zwischen universitären bzw. außeruniversitären Lerngelegenheiten und der
Entwicklung motivationaler Orientierungen nachgegangen.
Ziel des Symposiums ist es, die vorgestellten Studien sowohl hinsichtlich ihres methodischen Vorgehens als auch inhaltlich sowohl aus fachbezogener als auch aus allgemeiner bildungswissenschaftlicher Perspektive - zu diskutieren. Dabei soll es neben
Fragen der Modellierung einzelner Komponenten des Lehrerprofessionswissens insbesondere auch um Fragen ihres
Zusammenspiels und ihrer Förderung gehen.
Beiträge des Symposiums
Entwicklung fachdidaktischen Wissens: integrative versus transformative Modellierung
Jörg Großschedl, Daniela Mahler, Ute Harms
IPN
THEORETISCHER HINTERGRUND
Fachdidaktisches Wissen ist das Wissen darüber, wie fachliche Inhalte Schülerinnen und Schülern nähergebracht werden können
(z. B. Magnusson, Krajcik, & Borko, 1999; Shulman, 1987). Zur Beschreibung der Entwicklung des fachdidaktischen Wissens
(PCK) werden nach Gess-Newsome (1999) ein integratives und ein transformatives Modell gegenübergestellt. Beide Modelle
ziehen spezifische Implikationen für die Gestaltung der fachdidaktischen Ausbildung nach sich. Im integrativen Modell bildet PCK
keine eigenständige Wissensdomäne, sondern geht in der jeweiligen Unterrichtssituation in einem kreativen Schöpfungsakt aus
dem vorhandenen CK und PK hervor. Dagegen wird PCK im transformativen Modell als eigenständige Wissensdomäne
betrachtet, die mehr ist als die Summe ihrer Teile (CK und PK).
FORSCHUNGSFRAGEN
Zum jetzigen Zeitpunkt besteht kaum empirische Evidenz darüber, ob das integrative oder das transformative Modell die
Entwicklung von PCK besser beschreibt. Dementsprechend sollen folgende Forschungsfragen beantwortet werden: (1) Kann
eine Unterteilung des Professionswissens in CK, PCK und PK empirisch gestützt werden (wenn ja, dann spräche dies für das
transformative Modell)? (2) Ist PCK mehr als die Summe seiner Teile (CK und PK; wenn ja, dann spräche dies ebenfalls für das
transformative Modell) oder gleich der Summe seiner Teile (wenn ja, spräche dies für das integrative Modell)?
METHODE
In einer Querschnittstudie mit Multimatrixdesign beantworteten N=620 angehende Biologielehrkräfte (Semester: M=5,5, SD=2,8;
78,6% weiblich; 64,7% gymnasiales Lehramt) einen getesteten Fragebogen aus dem Projekt KiL (Großschedl, Harms,
Kleickmann, & Glowinski, 2015) zur Erfassung ihres CK (38 Items), PCK (34 Items) und PK (67 Items). Alle Instrumente weisen
gute Reliabilitäten auf. In einem konfirmatorischen Faktorenmodell wurden CK, PCK und PK als korrelierte aber eigenständige
Konstrukte spezifiziert (Standardmodell). Dabei wird angenommen, dass die Lösung von PCK-Items allein vom PCK der
Studienteilnehmer abhängt, nicht von ihrem CK und PK. In einem Nested-Faktormodell wurde die Lösung von PCK-Items
dagegen so modelliert, dass sie einerseits von einem spezifischen fachdidaktischen Wissen (PCKspez) abhängt, andererseits
aber auch vom CK und PK, die beide als Generalfaktoren modelliert wurden. Als Indikatoren der Wissensdomänen dienten in
beiden Modellen Subskalenwerte, die auf Grundlage mehrdimensionaler Raschmodelle berechnet wurden. Ob im NestedFaktormodell tatsächlich PCKspez nachweisbar bleibt, nachdem CK und PK auspartialisiert wurden, wurde mittels latenter
Regressionsanalyse zwischen PCKspez und ausgewählten Prädiktoren untersucht.
FORSCHUNGSERGEBNISSE; DISKUSSION UND RELEVANZ
Zunächst wurden die Modellfitindizes des Standardmodells betrachtet. Diese weisen auf eine gute Modellpassung hin (CFI=0,97,
TLI=0,06, RMSEA=0,03) und können als erster Hinweis für die Gültigkeit des transformativen Modells verstanden werden, in
dem PCK als eigenständiger Wissensbereich beschrieben wird. Anschließend wurden die Regressionsanalysen aus dem
Nested-Faktormodell betrachtet. Die Ergebnisse aus den Regressionsanalysen sind erwartungskonform und stützen die
Annahme einer spezifischen fachdidaktischen Kompetenz - unabhängig vom CK und PK: Höhere kognitive Fähigkeiten
(operationalisiert über die Abiturnote) scheinen sich positiv auf PCKspez auszuwirken (r=-,41). Studierende des gymnasialen
Lehramts verfügen im Mittel über eine höheres PCKspez als Studierende des nicht-gymnasialen Lehramts (r=,71). Gleiches gilt
für Studierende höherer Semester gegenüber Studienanfängern (r=,61). Dass PCKspez tatsächlich eine spezifische
fachdidaktische Kompetenz repräsentiert, legt der Zusammenhang (r=,32) zwischen PCK und der Skala „universitäre
Lerngelegenheiten für PCK im Studium“ nahe (alle p<,05).
Unsere Analysen stützen die Gültigkeit des tranformativen Modells zur Beschreibung der Entwicklung von PCK. Dies birgt u. a.
folgende Implikationen für die Lehrer/-innen-Bildung: (a) Die fachliche und bildungswissenschaftliche Ausbildung unterstützt den
Aufbau von PCK, kann die fachdidaktische Ausbildung jedoch nicht ersetzen. (b) Fachliche und bildungswissenschaftliche Inhalte
müssen bereits in der universitären Lehre zusammengeführt, da im transformativen Modell nicht von einer eigenständigen
Integrationsleistung der Studierenden ausgegangen wird. (c) Die Fachdidaktik zeigt „best practice“ auf und bereitet angehende
Biologielehrkräfte damit auf möglichst viele Unterrichtssituation vor.
Wissenschaftliches Denken als fächerübergreifende Kompetenz im Lehramt: Analysen zur
Kompetenzstruktur
Stefan Hartmann1, Annette Upmeier zu Belzen1, Dirk Krüger2
1
Humboldt-Universität zu Berlin, 2Freie Universität Berlin
THEORETISCHER HINTERGRUND UND FORSCHUNGSFRAGEN
Das Projekt Ko-WADiS hat zum Ziel, die Entwicklung von Kompetenzen des wissenschaftlichen Denkens bei
Lehramtsstudierenden der Biologie, Chemie und Physik zu erfassen. Wissenschaftliches Denken (Scientific Reasoning) wird
dabei als domänenspezifische Problemlösefähigkeit aufgefasst, die Personen zum erfolgreichen Umgang mit empirischwissenschaftlichen Problemstellungen befähigt (Mayer, 2007). Diese Kompetenz manifestiert sich beim wissenschaftlichen
Arbeiten, wenn einzelne Schritte eines idealtypischen Forschungsprozesses angemessen zur Lösung naturwissenschaftlicher
Probleme angewendet werden.
Zur Erfassung der Kompetenz wurde ein schriftlicher Test mit 123 Multiple-Choice-Items entwickelt. Es wurden verschiedene
Analysen zur Beurteilung der Validität durchgeführt (Hartmann, Mathesius, Stiller, Straube, Krüger & Upmeier zu Belzen, 2015;
Hartmann, Upmeier zu Belzen, Krüger & Pant, 2015). Eine wesentliche Quelle für Validitätsevidenz stellt die interne Struktur
eines Tests dar (AERA, APA & NCME, 2014). Inwieweit sich die empirische Struktur der mit dem Test erfassten Kompetenz mit
theoretischen Vorhersagen deckt, wurde im Projekt Ko-WADiS bereits während der Testentwicklung im Rahmen einer
Pilotierungsstudie untersucht. Die Ergebnisse dieser Studie stützten die Annahme, dass die Kompetenz des wissenschaftlichen
Denkens eine eindimensionale Struktur aufweist und domänenübergreifend auf Kontexte aller empirisch arbeitenden
Naturwissenschaften übertragbar ist. Dies zeigte sich in hohen Korrelationen zwischen den Teilleistungen der Aufgaben mit
biologischen, chemischen und physikalischen Kontexten.
Eine dem Längsschnitt vorgeschaltete Normierung des Testinstruments in allen zu testenden Studierendenkohorten stand
bislang aus. Vor der längsschnittlichen Erhebung war zudem zu prüfen, inwieweit die psychometrischen Eigenschaften des Tests
in den unterschiedlichen Studierendenkohorten invariant sind. Somit ergaben sich folgende Fragestellungen:
1) Bilden die mit dem Instrument erhobenen Leistungen die theoretisch vorhergesagte eindimensionale Kompetenzstruktur ab?
2) Bilden die mit dem Instrument erhobenen Leistungen die theoretisch vorhergesagte Übertragbarkeit über Fächergrenzen
(Biologie, Chemie und Physik) ab?
3) Sind die psychometrischen Kennwerte hinsichtlich Dimensionalität, Reliabilität, Reihenfolge der Itemschwierigkeiten und
Korrelationen zwischen den Fächern in den zu testenden Studienkohorten invariant?
METHODE
Zur Prüfung der Forschungsfragen wurden die 123 Items des Ko-WADiS-Testinstruments in einem Balanced Incomplete Block
Design bei 2058 Bachelor- und 381 Masterstudierenden der Freien Universität Berlin und der Humboldt-Universität zu Berlin
eingesetzt. Es handelt sich um Studierende der Fächer Biologie, Chemie und Physik mit und ohne Lehramtsoption. Die im
bevorstehenden Längsschnitt zu erfassenden Kohorten sind in diesen Gruppen querschnittlich vollständig abgedeckt. Auf Basis
der Multiple-Choice-Antworten der Studierenden wurden mit ein- und mehrdimensionalen Verfahren der Item-Response-Theorie
(IRT) Item- und Personenparameter geschätzt. Neben der eindimensionalen Skalierung kamen zum Einsatz: eine
zweidimensionale Skalierung (Kompetenzen im Bereich „naturwissenschaftliche Untersuchungen“ und „naturwissenschaftliche
Modellbildung“), eine dreidimensionale Skalierung (Kompetenzen des wissenschaftlichen Denkens anhand von Kontexten der
Fächer Biologie, Chemie und Physik) sowie eine siebendimensionale Skalierung (Kompetenzen in den Bereichen „Fragen
formulieren“, „Hypothesen generieren“, „Untersuchungen planen“, „Daten auswerten“, „Zweck von Modellen“, „Testen von
Modellen“ und „Ändern von Modellen“). Personenfähigkeiten wurden jeweils in Form von Plausible Values geschätzt.
Zusammenhänge zwischen Teilkompetenzen wurden als latente Korrelationen direkt im IRT-Modell modelliert. Die jeweilige
Passung zwischen modellhaften Annahmen und empirischer Datenstruktur wurde über geeignete Informationsparameter (BIC,
CAIC) verglichen.
ERGEBNISSE
Sowohl die Informationskriterien BIC und CAIC als auch die latenten Korrelationen der Dimensionen in den mehrdimensionalen
Modellen sprechen deutlich für eine eindimensionale Fähigkeitsstruktur. Dieser Befund deckt sich sowohl mit den theoretischen
Annahmen als auch mit den Ergebnissen der Pilotierungsstudie. Hohe latente Korrelationen zwischen den Teilleistungen in
Biologie, Chemie und Physik (.76 ≤ r ≤ .87) sprechen für einen starken Generalfaktor und eine hohe Übertragbarkeit der
Kompetenz über Fächergrenzen hinweg. Analysen, die getrennt nach den Studierendengruppen Bachelor und Master
durchgeführt wurden, ergeben ebenfalls jeweils die beste Modellpassung für die eindimensionale Skalierung sowie nahezu
identische Werte für Reliabilität, Reihenfolge der Itemschwierigkeiten und Korrelationen zwischen den Fächern. Mit den Befunden
ist eine wichtige Voraussetzung für die bevorstehende längsschnittliche Kompetenzerfassung vom Studienbeginn bis zum
Studienende erfüllt.
Quo Vadis Bildungswissenschaften in der Lehrerbildung: Unterschiede zwischen verschiedenen Formen
des Vorbereitungsdienstes
Olga Kunina-Habenicht1, Detlev Leutner2, Tina Seidel3, Ewald Terhart4, Mareike Kunter1
1
Johann Wolfgang Goethe-Universität, 2Universität Duisburg-Essen, 3Technische Universität München, 4Westfälische WilhelmsUniversität Münster
THEORETISCHER HINTERGRUND
Die Lehrerbildung in Deutschland ist in eine überwiegend theoretisch orientierte universitären Phase und eine stärker auf die
Praxis ausgerichtete zweite Phase (Vorbereitungsdienst) strukturiert. In Nordrhein-Westfalen wurde der Vorbereitungsdienst
2011 von 24 Monaten auf 18 Monate verkürzt. Als neue Ausbildungselemente wurden u.a. eine personenorientierte Beratung mit
Coaching-Elementen und ein Eingangs- und Perspektivgespräch eingeführt, die die Qualität der Ausbildung verbessern sollten
(Gerdes & Annas-Sieler, 2011).
Unter bildungswissenschaftlichem Wissen (BW) werden fachunspezifische universitäre Studieninhalte zusammengefasst, an
deren Vermittlung i.d.R. mehrere Disziplinen beteiligt sind. Im BilWiss-Forschungsprogramm wurde ein neuer Wissenstest
konstruiert, der über bestehende Verfahren zur Messung von pädagogisch-psychologischem Wissen hinausgeht (für eine
Übersicht siehe Voss, Kunina-Habenicht, Hoehne, & Kunter, 2015), indem er theoretisches universitäres Wissen fokussiert. In
bisherigen Vorarbeiten (Linninger et al., 2015) hat sich empirisch eine sechsdimensionale Struktur des BW gezeigt mit eher
unterrichtsnahen Inhaltsbereichen (u.a. Unterrichtsgestaltung, Lernen und Entwicklung) und eher unterrichtsfernen Bereichen
(u.a. Bildungstheorie, Lehrerberuf als Profession).
In diesem Beitrag wird explorativ untersucht, ob die Einführung der neuen Lerngelegenheiten im reformierten VD den
Wissensaufbau positiv begünstigt. Konkret werden zwei Forschungsfragen untersucht: a) ob sich der Stand des BW zwischen
den beiden Formen des VD am Ende des VD unterscheidet und b) ob die Entwicklungsverläufe in beiden Formen des VD
vergleichbar sind. Dabei ist denkbar, dass die negativen Effekte der zeitgleichen Verkürzung des VD den potentiellen positiven
Effekten durch die neuen Ausbildungselemente entgegenwirken, so dass sich empirisch keine Unterschiede im Wissensaufbau
in beiden Formen des VD zeigen. Da die Lerngelegenheiten im VD praxisorientiert gestaltet sind und der Test überwiegend
theoretisches Wissen erfasst, ist in Bezug auf die Wissensentwicklung ein geringer Anstieg in den unterrichtsnahen
Inhaltsbereichen zu erwarten, während in den unterrichtsfernen Inhaltsbereichen Wissensrückgang aufgrund von
Vergessenseffekten wahrscheinlich ist.
METHODE
Zur Beantwortung der Forschungsfragen werden längsschnittliche Daten
herangezogen. In Bezug auf die erste Fragestellung werden zwei Messzeitpunkte betrachtet. Zum ersten Messzeitpunkt (t1)
bearbeiteten 3273 Referendar(inn)e(n) (zum Beginn des VD) im Frühjahr 2011 den Wissenstest und am Ende des VD zusätzlich
eine Teilstichprobe (n=626) im Winter 2013/14 (t2). Zur Modellierung der Wissensentwicklung werden zusätzlich Daten ein Jahr
nach Beginn als selbständige Lehrkraft (t3; n=ca. 160) herangezogen.
Zum ersten Messzeitpunkt wurde die Langfassung des Wissenstests eigesetzt, während zu t2 eine Kurzfassung des
Wissenstests (Papierversion) bearbeitet wurde. Zum dritten Messzeitpunkt wurde die Kurzfassung des Wissenstests online
bearbeitet. Die Langfassung des Wissenstests beinhaltet 289 Items und wurde im Rotationsdesign eingesetzt, während die
Kurzform 56 Items umfasst.
Bei den Analysen werden zwei Personengruppen (Kohorte K1: letzter Jahrgang im bisherigen VD von 24 Monaten; Kohorte K2:
erster Jahrgang im reformierten VD von 18 Monaten) zu Beginn und am Ende des VD miteinander verglichen. Die Kohorten K1
und K2 waren zu Beginn des VD vergleichbar hinsichtlich der demografischen Angaben und der Abiturnote (Kunter, Linninger,
Schulze-Stocker, Kunina-Habenicht, & Lohse-Bossenz, 2013). Als Indikatoren für die Wissensleistungen werden IRT-Scores aus
eindimensionalen 2-PL-Partial-Credit-Modellen verwendet.
Die Vergleiche zwischen K1 und K2 erfolgten mittels des generalisierten linearen Modells mit Kovariaten (Abiturnote,
Muttersprache, Lehramtszugang). Für den Vergleich der Wissensentwicklung in beiden Kohorten werden Latent-Change-Modelle
und Multigruppenmodelle geschätzt.
ERGEBNISSE
K2 wies zu Beginn des VD signifikant bessere Werte in den Dimensionen Unterrichtsgestaltung und Schulorganisation als die
K1 auf (unter Kontrolle der Abiturnote, Muttersprache und Lehramtszugangs). Die Leistungen in allen sechs Wissensdimensionen
am Ende des VD unterschieden sich nicht signifikant zwischen den Kohorten (unter Kontrolle der Abiturnote, Muttersprache und
Testleistung zu t1). Eine mögliche Interpretation der Ergebnisse neben der oben erörterten Kompensationshypothese durch die
gleichzeitige Verkürzung des VD ist, dass K1 im alten VD Wissen aufholt. Latent-Change-Modelle sind Gegenstand aktueller
Analysen. Die Ergebnisse werden diskutiert in Bezug auf methodische Limitationen (bspw. das quasi-experimentelle
Studiendesign und verschiedene Testformen zu verschiedenen Messzeitpunkten) und Implikationen für die Lehrerbildung.
Motivationale Orientierungen von Biologielehrkräften als Aspekt professioneller Kompetenz
Ute Harms, Daniela Mahler
IPN
THEORETISCHER HINTERGRUND
Das Modell professioneller Kompetenz von Lehrkräften (Baumert & Kunter, 2006) beschreibt unterschiedliche
Kompetenzaspekte, die eine erfolgreiche Lehrkraft ausmachen. Aufgrund der hohen Belastung im Berufsalltag von Lehrkräften
sind neben kognitiven Kompetenzaspekten auch motivationale Orientierungen von Bedeutung. Diese Studie betrachtet zwei
Domänen der motivationalen Orientierungen: (1) Selbstwirksamkeit und (2) Enthusiasmus. Bandura (1977) beschreibt
Selbstwirksamkeit als die Erwartung, dass aufgrund der eigenen Kompetenz eine Handlung erfolgreich ausgeführt werden kann.
Enthusiasmus von Lehrkräften wird als affektive Orientierung beschrieben, die sich sowohl auf das Unterrichtsfach als auch auf
das Unterrichten bezieht (Kunter, Frenzel, Nagy, Baumert & Pekrun, 2011). Selbstwirksamkeit und Enthusiasmus sind neben
ihrer Relevanz für die Berufszufriedenheit von Lehrkräften (Moè, Pazzaglia & Ranconi, 2001) ebenfalls wichtig für die Wahl eines
Tätigkeitsfeldes, die Performanz sowie die Ausdauer in diesem Tätigkeitsfeld (Wigfield & Eccles, 2000). Aufgrund dieser
Relevanz und unter der Annahme, dass motivationale Orientierungen durch externe Faktoren beeinflussbar sind (Kunter, 2013),
stellt sich die Frage, wie sich motivationale Orientierungen fördern lassen. Dafür ist die Identifikation konkreter Lerngelegenheiten
wichtig sowie das Verständnis der Zusammenhänge zwischen motivationalen Orientierungen und den kognitiven Aspekten der
professionellen Kompetenz (hier: fachbezogenes Professionswissen).
FRAGESTELLUNGEN
1. Welcher Zusammenhang besteht zwischen (a) Selbstwirksamkeit, (b) Enthusiasmus für das Fach Biologie sowie (c)
Enthusiasmus für das Unterrichten und bestimmten Lerngelegenheiten (wahrgenommene Qualität der Universitätsausbildung,
Teilnahme an Fortbildungsveranstaltungen, Lehrerfahrung, Selbststudium (z. B. Rezeption von Primärliteratur))?
2. Welcher Zusammenhang besteht zwischen (a) Selbstwirksamkeit, (b) Enthusiasmus für das Fach Biologie sowie (c)
Enthusiasmus für das Unterrichten und dem fachbezogenen Professionswissen von Biologielehrkäften (Fachwissen,
fachdidaktisches Wissen)?
METHODE
An dieser Studie nahmen 134 Biologielehrkräfte (Alter: M=43,7 Jahre (SD=10,3), 75,4% weiblich) teil. Selbstwirksamkeit (10
Items, rho=,71; Schmitz & Schwarzer, 2000), Enthusiasmus für das Fach Biologie (3 Items, rho=,73; Baumert et al. 2009),
Enthusiasmus für das Unterrichten (2 Items, rho=,79; Baumert et al., 2009) sowie das fachbezogene Professionswissen
(Fachwissen: 19 Items, rho=,68; fachdidaktisches Wissen: 9 Items, rho=,78; Großschedl, Mahler, Kleickmann & Harms, 2014)
wurden mit Fragebögen erhoben. Die Abfrage der verschiedenen Lerngelegenheiten erfolgte mit geschlossenen Items
entsprechend der Studie von Großschedl et al., 2014. Zuerst wurde mithilfe einer konfirmatorischen Faktorenanalyse überprüft,
ob sich die drei angenommenen Domänen motivationaler Orientierungen auch empirisch abbilden lassen. Um die Frage nach
den Zusammenhängen zwischen motivationalen Orientierungen und Lerngelegenheiten nachzugehen, wurde unter
Berücksichtigung der faktoriellen Struktur eine Regression der latenten Faktoren auf manifeste Kovariaten durchgeführt (MIMICModell, Muthén & Muthén, 2007). Korrelationsanalysen geben Auskunft über die Zusammenhänge zwischen motivationalen
Orientierungen und den Domänen des fachbezogenen Professionswissens.
ERGEBNISSE UND FAZIT
Die konfirmatorische Faktorenanalyse zeigt, dass sich Selbstwirksamkeit, Enthusiasmus für das Fach Biologie sowie
Enthusiasmus für das Unterrichten empirisch trennen lassen (3-faktorielles Modell: CFI=0,98, TLI=0,97, RSMEA=0,02, TRd =
63,89, df=3, p<,001). Die Ergebnisse der Regressionsanalyse zeigen Zusammenhänge zwischen Selbstwirksamkeit bzw.
Enthusiasmus für das Unterrichten und der wahrgenommenen Qualität der Lehrerausbildung, der Teilnahme an
Fortbildungsveranstaltungen sowie der Häufigkeit des Selbststudiums.
Korrelationsanalysen zeigen einen marginal signifikanten positiven Zusammenhang zwischen Selbstwirksamkeit und
fachdidaktischem Wissen (r=,17, p<,07) und einen signifikant positiven Zusammenhang zwischen Enthusiasmus für Biologie und
fachdidaktischem Wissen (r=,22, p<,04).
Die Ergebnisse betonen die Relevanz der Lehreraus- und -fortbildung für die Förderung motivationaler Orientierungen von
Lehrkräften. Da sich Lehrerbildung vor allem auf Wissensaspekte bezieht, geben die gefundenen Zusammenhänge zum
fachdidaktischen Wissen weitere Hinweise für die Förderung motivationaler Orientierungen.
ID: 402
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Soziologie
Thematisches Cluster: Bildungsgerechtigkeit/ Migration, Motivation und Emotion
Stichworte: Akkulturation, psychologische Adaption, soziokulturelle Adaption, Zuwanderungshintergrund, Zweitsprache
Schulische Adaption von Heranwachsenden mit Zuwanderungshintergrund
Chair(s): Aileen Edele (Humboldt-Universität zu Berlin), Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen, HU
Berlin)
Diskutant(en): Heike Solga (Wissenschaftszentrum Berlin für Sozialforschung)
In Anlehnung an Ward (1996) lassen sich zwei übergeordnete Aspekte der schulischen Anpassung unterscheiden: die
soziokulturelle Adaption, also Verhaltensweisen und Fähigkeiten zur Bewältigung des Schulalltags (z.B. Beherrschung der
Unterrichtssprache, schulische Kompetenzen), sowie die psychologische Adaption, also affektive Reaktionen auf den
Schulkontext (z.B. schulbezogenes Wohlbefinden, Verbundenheit mit Schule/Peers). Es ist anzunehmen, dass Heranwachsende
mit Zuwanderungshintergrund hinsichtlich beider Aspekte vor besonderen Herausforderungen stehen. Sie besitzen oft geringer
ausgeprägte Fähigkeiten in der Unterrichtssprache Deutsch und erreichen im Durchschnitt ein geringeres schulisches
Kompetenzniveau als Gleichaltrige ohne Zuwanderungshintergrund (Stanat et al., 2010). Mit Bezug auf die psychologische
Adaption ist die Befundlage dagegen weniger eindeutig. So berichten Heranwachsende aus zugewanderten Familien einerseits
häufig ein hohes schulisches Wohlbefinden (Briones & Tabernero, 2012), andererseits können sie aber besonderen emotionalen
Belastungen ausgesetzt sein, etwa durch divergierende Erwartungen von schulischem und familiärem Kontext (Kumar & Maehr,
2010; Phinney et al., 2000) oder aufgrund von Diskriminierungserfahrungen (Wong et al., 2003). Das Symposium beschäftigt
sich mit Faktoren, die die psychologische und die soziokulturelle Adaption von Heranwachsenden mit Zuwanderungshintergrund
an den Kontext Schule beeinflussen. Zwei Vorträge fokussieren den psychologischen Aspekt schulischer Adaption, der bislang
wenig untersucht wurde. Der erste Beitrag (Rjosk et al.) geht der Frage nach, ob Kinder mit Zuwanderungshintergrund sich
emotional stärker mit ihren Peers verbunden fühlen, wenn sie eine Klasse mit hohem Anteil an Schülerinnen und Schülern aus
zugewanderten Familien besuchen. Zudem wird geprüft, ob die emotionale Verbundenheit mit den Peers die Lernfreude der
Kinder fördert. Der zweite Vortrag (Schachner et al.) untersucht, ob das interkulturelle Schulklima das Schulzugehörigkeitsgefühl
von Heranwachsenden mit und ohne Zuwanderungshintergrund begünstigt und ob es sich darüber vermittelt positiv auf ihre
schulisch-psychologische Anpassung auswirkt. Der dritte Beitrag (Seuring & Strobel) befasst sich mit dem Sprachgebrauch von
Jugendlichen aus zugewanderten Familien und untersucht, wie sich der Gebrauch der Sprache in unterschiedlichen Kontexten
auf die Kompetenz in der Unterrichtssprache Deutsch auswirkt, die als wichtiger Indikator der soziokulturellen Adaption gilt. Der
vierte Beitrag (Schotte et al.) beschäftigt sich mit beiden Aspekten der schulischen Adaption und untersucht differenzielle
Zusammenhänge der kulturellen Identität mit der psychologischen und der soziokulturellen Anpassung von Jugendlichen mit
Zuwanderungshintergrund. Insbesondere wird die Annahme geprüft, dass die ethnische Identität besonders positiv mit der
psychologischen Adaption assoziiert ist, während die soziokulturelle Adaption besonders von der nationalen Identität abhängt.
Die Vortragenden sind in unterschiedlichen Disziplinen verortet, nämlich der Psychologie (Rjosk, Schachner), der Soziologie
(Seuring) und den Erziehungswissenschaften (Schotte). Diskutiert wird das Symposium primär aus einer soziologischen
Perspektive (Solga).
Beiträge des Symposiums
Effekte zuwanderungsbezogener Klassenzusammensetzung auf die psychosoziale Anpassung von
Grundschulkindern
Camilla Rjosk1, Dirk Richter2, Oliver Lüdtke3
1
Institut zur Qualitätsentwicklung im Bildungswesen, HU Berlin, 2Bergische Universität Wuppertal, 3IPN
*Theoretischer Hintergrund*
Schulleistungsstudien haben wiederholt zuwanderungsbezogene und soziale Disparitäten in schulischen Leistungen
identifiziert(z.B. OECD, 2010). Ferner konnte gezeigt werden, dass diese Leistungsunterschiede nicht nur durch individuelle
Lernvoraussetzungen, sondern auch durch die Zusammensetzung der Schülerschaft in der Klasse bzw. der Schule beeinflusst
wird. Demnach besteht zwischen dem Anteil an benachteiligten Schülerinnen und Schülern (SuS) in der Klasse und der
individuellen Leistungsentwicklung ein negativer Zusammenhang (vgl. Dumont, Neumann, Maaz & Trautwein, 2013; Van Ewijk
& Sleegers, 2010a, 2010b). Die Auswirkungen der Klassenzusammensetzung auf Merkmale psychosozialer Anpassung, wie das
Verbundenheitsgefühl zu den Peers oder die Lernfreude, wurden indes kaum untersucht.
Emotionale Verbundenheit ist eine von drei Kontextbedingungen des Lernumfelds, die in der Selbstbestimmungstheorie als
motivationsförderlich benannt werden (Deci & Ryan, 2000). Gerade für SuS mit Zuwanderungshintergrund kann das
Verbundenheitsgefühl mit Peers von besonderer Bedeutung sein, da sie oft soziale und kulturelle Hürden überwinden müssen,
um sich als Teil der Schulkultur wahrzunehmen (vgl. Kumar & Maehr, 2010). Eine Grundlage dafür, dass Menschen Nähe
zueinander aufbauen, Freundschaften schließen und sich verbunden miteinander fühlen, ist der social identity theory (Tajfel &
Turner, 1986) und dem similarity attraction paradigm (Byrne, 1971) zufolge das Ausmaß wahrgenommener Ähnlichkeit mit der
anderen Person. Es wird angenommen, dass die zuwanderungsbezogene Herkunft von SuS ein Merkmal ist, das für
Ähnlichkeitswahrnehmungen eine wichtige Rolle spielt. Empirisch gibt es Hinweise aus dem US-amerikanischen Raum dafür,
dass in weniger heterogenen Schulen oder Klassen SuS das Schulklima insgesamt als fairer und förderlicher für interethnischen
Austausch wahrnehmen (Benner et al., 2008), SuS einer ethnischen Minderheit weniger Diskriminierung empfinden (Seaton &
Yip, 2009) und die gegenseitige Unterstützung sowie die Akzeptanz für SuS einer ethnischen Minderheit größer sind (Postmes
& Branscombe, 2002). Detaillierte Untersuchungen der Bedeutung, die der Zuwanderungshintergrund der Peers für das
Verbundenheitsgefühl und die Lernfreude von SuS mit Zuwanderungshintergrund im Vergleich zu SuS ohne
Zuwanderungshintergrund hat, fehlen bislang weitgehend.
*Fragestellung*
Der vorliegende Beitrag untersucht ausgehend von dieser Forschungslücke folgende Fragestellungen: (1) Fühlen sich SuS mit
Zuwanderungshintergrund stärker mit ihren Peers verbunden, wenn sie in Klassen mit einem höheren Anteil von SuS mit
Zuwanderungshintergrund unterrichtet werden? (2) Steht das Verbundenheitsgefühl der SuS mit der Lernfreude in diesen
Klassen in positivem Zusammenhang?
*Methode*
Die Analysen beziehen sich auf Daten des IQB-Ländervergleichs 2011 (Stanat et al., 2012) mit 18.762 SuS der 4. Jahrgangsstufe
(903 Klassen). Der Zuwanderungshintergrund der SuS wird über das Geburtsland der Eltern operationalisiert. Zur Analyse
wurden in einem ersten Schritt Mehrebenenstrukturgleichungsmodelle mit dem Verbundenheitsgefühl als abhängiger Variable
und dem Klassenanteil von SuS mit Zuwanderungshintergrund als unabhängiger Variable berechnet. In einem zweiten Schritt
wurden die Klassenzusammensetzung und das Verbundenheitsgefühl mit den Peers als Prädiktoren der Lernfreude der SuS
untersucht. Kontrollvariablen auf Individualebene waren kognitive Grundfähigkeiten als Proxy für Vorwissen, sozioökonomischer
Status und Geschlecht der SuS sowie auf Klassenebene mittlere Klassenleistung, mittlerer SES und
Geschlechterzusammensetzung.
*Ergebnisse*
Die Befunde weisen darauf hin, dass die zuwanderungsbezogene Klassenzusammensetzung differentiell mit dem
Verbundenheitsgefühl von SuS mit Zuwanderungshintergrund im Vergleich zu SuS ohne Zuwanderungshintergrund assoziiert ist
(β = 0.23, SE = 0.04 p < .05). Mit steigendem Anteil von SuS mit Zuwanderungshintergrund fühlen sich SuS mit
Zuwanderungshintergrund stärker mit ihren Peers verbunden, wobei sie sich durchschnittlich weniger verbunden mit ihren Peers
fühlen als SuS ohne Zuwanderungshintergrund. Ein erhöhtes Verbundenheitsgefühl wiederum hängt positiv mit der individuellen
Lernfreude der SuS zusammen (β = 0.30, SE = 0.02 p < .05). Die Ergebnisse verweisen somit auf die Relevanz der
Klassenzusammensetzung als Lernumfeld, das förderlich für die soziale Anpassung von SuS mit Zuwanderungshintergrund ist.
Effekte des interkulturellen Klimas auf schulisches Zugehörigkeitsgefühl und schulisch-psychologische
Anpassung von Kindern mit und ohne Migrationshintergrund
Maja Schachner1, Miriam Schwarzenthal1, Fons J. R. Van de Vijver2, Peter Noack3, Linda Juang1
1
Universität Potsdam, 2Tilburg University (NL), North-West University (SA), 3Friedrich-Schiller-Universität Jena
Basierend auf zwei unterschiedlichen Ansätzen aus dem Diversity Management in der Organisationsentwicklung (vergleiche z.B.
Ely & Thomas, 2001) werden auch an Schulen zwei Ansätze im Hinblick auf den Umgang mit kultureller Diversität unterschieden
(vergleiche z.B. Hachfeld, Hahn, Schroeder, Anders, & Kunter, 2015), die sich im interkulturellen Klima niederschlagen: Zum
einen Bestrebungen der _Gleichbehandlung und Inklusion_, und zum anderen Bestrebungen der _Wertschätzung kultureller
Vielfalt_. Schulen, die sich vor allem für _Gleichbehandlung und Inklusion_ einsetzen, betonen eher kulturelle Gemeinsamkeiten
und setzen sich gegen Diskriminierung und für die gleiche Teilhabe aller Schüler ein. Wenn eine Schule sich dagegen eher der
_Wertschätzung kultureller Vielfalt_ verschreibt, werden kulturelle Unterschiede nicht heruntergespielt sondern bewusst
thematisiert und als Bereicherung gesehen. Die Kombination beider Ansätze wirkt sich positiv auf die schulisch-psychologische
Anpassung von Schülern mit Migrationshintergrund aus, wobei die Effekte von _Gleichbehandlung und Inklusion_ über eine
höhere Orientierung zur Mehrheitskultur vermittelt werden und die Effekte von _Wertschätzung kultureller Vielfalt_ über eine
höhere Orientierung zur Herkunftskultur (Schachner, Noack, Van de Vijver, & Eckstein, in press). In der gegenwärtigen Studie
untersuchen wir, (1) inwiefern sich beide Ansätze bzw. deren Manifestation im wahrgenommenen Klassenklima positiv auf das
Schulzugehörigkeitsgefühl und darüber auf die schulisch-psychologische Anpassung aller Schüler (mit und ohne
Migrationshintergrund) auswirken, und (2) inwiefern die Betrachtung des interkulturellen Klimas bisher inkonsistente Befunde zu
Effekten der ethnischen Zusammensetzung der Schulklasse auf die schulisch-psychologische Anpassung von Schülern mit und
ohne Migrationshintergrund aufklären kann.
Die Stichprobe umfasst 1591 Sekundarschüler der 6. Klassenstufe, die für eine Fragebogenstudie zu Akkulturationsprozessen
an multikulturellen Schulen in Baden-Württemberg rekrutiert wurden. Davon haben 965 Schüler einen Migrationshintergrund
(mindestens ein Elternteil aus einem anderen Land; insgesamt 83 Herkunftsländer), wobei der Großteil (85%) in Deutschland
geboren wurde. Das Durchschnittsalter aller teilnehmenden Schüler beträgt 11,5 Jahre; 49,6% von ihnen sind weiblich. Die
Schüler repräsentieren 88 Schulklassen, die im Hinblick auf ihre ethnische Zusammensetzung variieren. So haben zwischen 8%
und 100% der Schüler in einer Klasse einen Migrationshintergrund (im Mittel 60%) und die Schüler mit Migrationshintergrund in
einer Klasse variieren in der Diversität ihrer Herkunftsländer zwischen einem Fraktionalisierungs-Index (Alesina,
Devleeschauwer, Easterly, Kurlat, & Wacziarg, 2003) von .42 bis .91 (M = .79, SD = .11). Alle Variablen (wahrgenommenes
Klassenklima und schulisch-psychologische Anpassung) wurden im Selbstbericht erhoben.
Mehrgruppenstrukturgleichungsmodelle auf individueller Ebene unter Kontrolle der ethnischen Zusammensetzung der
Schulklasse und des individuellen sozioökonomischen Status bestätigten, dass die Manifestation beider Ansätze im
wahrgenommenen Klassenklima gleichermaßen in beiden Gruppen (mit und ohne Migrationshintergrund) den erwarteten
positiven Effekt auf das Schulzugehörigkeitsgefühl (standardisiertes β = 0,38 , p < 0,001 für _Gleichbehandlung und Inklusion_;
β = 0,09, p < 0,001 für _Wertschätzung kultureller Vielfalt_) und darüber auf Variablen der schulisch-psychologischen Anpassung
(allgemeine Lebenszufriedenheit; β = 0,36, p < 0,001; und akademisches Selbstkonzept; β = 0,52, p < 0,001) haben.
_Gleichbehandlung und Inklusion_ hatte zudem einen direkten positiven Effekt auf allgemeine Lebenszufriedenheit bei Kindern
mit Migrationshintergrund (β = 0,12, p < 0,001). Ein geringerer Anteil von Schülern mit Migrationshintergrund schien in beiden
Gruppen das Schulzugehörigkeitsgefühl zu begünstigen (β = .19, p < 0.001), während mehr Vielfalt unter den Schülern mit
Migrationshintergrund nur bei deutschen Schülern einen positiven Effekt hatte (β = 0.14, p < 0,001). Das Structural-WeightsModell mit zwei freigesetzten Pfaden wies eine sehr gute Passung auf (χ2/df = 2,37; RMSEA = 0,04; TLI = 0,97; CFI = 0,98). In
Mehrebenenanalysen soll zusätzlich überprüft werden, ob sich ein ähnlicher Zusammenhang auch auf Klassenebene zeigt bzw.
ob Effekte der ethnischen Zusammensetzung der Schulklasse durch die individuelle Wahrnehmung des interkulturellen
Klassenklimas moderiert werden.
Die Ergebnisse werden im Hinblick auf Implikationen für die empirisch-pädagogische Forschung zur Rolle von kultureller
Diversität in Schule und Bildungsprozessen sowie für die Anwendung in schulischer Praxis und Schulpolitik diskutiert.
Spracherhalt oder Sprachverlagerung? Erstsprachgebrauch und Zweitspracherwerb bei Jugendlichen
mit Migrationshintergrund
Julian Seuring, Strobel Bernadette
Universität Bamberg
Kenntnisse in der Sprache des Aufnahmelandes stellen eine zentrale Ressource für die schulische Adaption von Zuwanderern
und ihren Nachkommen dar. Zweitsprachkompetenzen sind zentral für andere Aspekte der soziokulturellen Adaption, wie etwa
den schulischen Kompetenzerwerb (Stanat & Christensen, 2006), stehen aber auch mit Aspekten der psychologischen Adaption,
wie dem schulischen Wohlbefinden, in Zusammenhang (Wolfgramm et al., 2010). Geringe Zweitsprachkompetenzen von
Jugendlichen mit Zuwanderungshintergrund werden oftmals auf eine herkunftssprachliche Kommunikation innerhalb der Familie
zurückgeführt (z.B. Müller & Stanat, 2006; Verwiebe & Riederer, 2013). Weitere Kontexte des Sprachgebrauchs, z.B. außerhalb
der Familie oder der Medienkonsum, finden in der bisherigen Forschung dagegen nur selten Berücksichtigung. Der vorliegende
Beitrag widmet sich dieser Lücke und beschreibt den Sprachgebrauch von Jugendlichen mit Zuwanderungshintergrund in
verschiedenen alltagsrelevanten Kontexten. Darüber hinaus wird untersucht, ob sich die mit der Familiensprache verbundenen
Nachteile in den Zweitsprachkompetenzen durch die Muster des Sprachgebrauchs in anderen Kontexten verstärken oder aber
reduzieren.
Ausgehend von einem allgemeinen Modell des Zweitspracherwerbs (Esser, 2006) ist die Verwendung der Zweitsprache mit
einem verbesserten Zugang zu dieser Sprache sowie einer erhöhten Motivation diese zu erlernen verbunden. Beides sollte sich
positiv auf den Kompetenzerwerb in der Zweitsprache niederschlagen. Demzufolge sollten neben der Familiensprache auch alle
weiteren Gelegenheiten des Sprachgebrauchs ausschlaggebend für den Zweitspracherwerb sein, und dies in besonderem Maße
dann, wenn der familiäre Kontext nur einen eingeschränkten Zugang bietet.
Anhand der Daten des Nationalen Bildungspanels (NEPS) zu Schülerinnen und Schülern der neunten Klasse (Startkohorte 4)
lässt sich differenzieren, welche Sprache jugendliche Zuwanderer mit ihren Eltern, Geschwistern und Peers sowie beim
Medienkonsum verwenden. Die Muster des Sprachgebrauchs werden zudem für verschiedene Herkunftsgruppen und
Zuwanderungsgenerationen gesondert betrachtet. Die Analyse umfasst Informationen zu 910 Jugendlichen aus der Türkei, 481
aus Polen, 759 aus der ehemaligen Sowjetunion und 2.579 Fälle aus sonstigen Herkunftsländern. Um neben den aggregierten
Verteilungen des Sprachgebrauchs in einzelnen Kontexten zusätzlich den kontextübergreifenden Sprachgebrauch auf
individueller Ebene zu analysieren, werden in einem zweiten Schritt sogenannte _Sprachgebrauchsprofile_ gebildet. Diese Profile
geben Aufschluss darüber, in welchen Kontexten eine Person ausschließlich die Zweitsprache verwendet und in welchen sie
zusätzlich die Herkunftssprache gebraucht. Mittels linearer Regressionsmodelle wird geprüft, ob sich zwischen den
Sprachgebrauchsprofilen Unterschiede in der Deutschkompetenz zeigen. Die Ergebnisse eines standardisierten
Leseverstehenstests (Haberkorn et al., 2012) dienen dabei als Indikator für die Zweitsprachkompetenz.
Deskriptiv zeigt sich zunächst, dass die Herkunftssprache mit den Eltern (58%) häufiger verwendet wird als mit Geschwistern
(39%). Mit Peers wird hingegen überwiegend Deutsch gesprochen (82%), während beim Medienkonsum auch die
Herkunftssprache relativ oft genutzt wird (48%). Weiterhin kommunizieren türkischstämmige Jugendliche in allen Kontexten
häufiger in der Herkunftssprache als Jugendliche, deren Familien aus Polen oder der ehemaligen Sowjetunion stammen. Bei
Betrachtung der Sprachgebrauchsprofile zeichnet sich darüber hinaus eine maßgebliche Bedeutung der Familiensprache ab.
Wird mit den Eltern ausschließlich Deutsch gesprochen, dann auch meist in allen anderen Kontexten. Jugendliche mit einer nichtdeutschen Elternsprache variieren hingegen stark hinsichtlich des Sprachgebrauchs in weiteren Kontexten. Besonders die
Kommunikation im Freundeskreis und mit Mitschülerinnen und Mitschülern erweist sich hier als sehr heterogen.
Entgegen den theoretischen Annahmen stehen diese heterogenen Muster allerdings kaum mit Unterschieden in der
Lesekompetenz in Verbindung. Erhebliche Kompetenzunterschiede zeigen sich vorrangig in Abhängigkeit des Sprachgebrauchs
mit den Eltern (ß = -0,29, SE = 0,04). Diese Unterschiede bleiben auch bei weiterer Berücksichtigung der verwendeten Sprache
mit den Geschwistern und beim Medienkonsum nahezu konstant. Lediglich der Deutschgebrauch mit den Peers kann die mit der
Familiensprache assoziierten Unterschiede in geringem Umfang reduzieren (ß = -0,23, SE = 0,04). Insgesamt verdeutlichen die
Befunde die zentrale Rolle der Familiensprache für den Zweitspracherwerb, andere Kontexte sind diesbezüglich von
nachrangiger Bedeutung. Dies bedeutet gleichzeitig aber auch, dass durch die Verwendung der Herkunftssprache mit den
Geschwistern und beim Medienkonsum keine zusätzlichen Nachteile entstehen.
Die Rolle der kulturellen Identität für das Wohlbefinden und den Bildungserfolg von Jugendlichen mit
Zuwanderungshintergrund
Kristin Schotte1, Aileen Edele1, Petra Stanat2
1
Humboldt-Universität zu Berlin, 2Institut zur Qualitätsentwicklung im Bildungswesen; HU Berlin
Heranwachsende mit Zuwanderungshintergrund stehen im deutschen Bildungssystem vor besonderen Herausforderungen.
Empirisch ist vielfach belegt, dass sie im Vergleich zu Gleichaltrigen ohne Zuwanderungshintergrund weniger günstige Muster in
der Bildungsbeteiligung und im Kompetenzerwerb aufweisen (z.B. Pöhlmann et al., 2013). In diesen Aspekten der soziokulturellen
Adaption, die sich allgemein auf den Erwerb kultureller Fertigkeiten zur Alltagsbewältigung bezieht, sind sie also benachteiligt.
Günstigere Muster zeichnen sich hingegen für die psychologische Adaption, etwa das subjektive Wohlbefinden, ab:
Heranwachsende mit Zuwanderungshintergrund berichten durchschnittlich ein ähnlich hohes oder höheres Wohlbefinden als
Gleichaltrige ohne Zuwanderungshintergrund (z.B. Briones & Tabernero, 2012). Diese Diskrepanz zwischen soziokultureller und
psychologischer Adaption erscheint paradox und wirft die Frage nach (zuwanderungs-)spezifischen Schutzfaktoren auf.
Ein Faktor, der das subjektive Wohlbefinden der Heranwachsenden mit Zuwanderungshintergrund zu beeinflussen scheint, ist
ihre kulturelle Identität, also die Orientierung am Herkunfts- bzw. Aufnahmekontext. Laut Branscombe et al. (1999, _recjectionidentification-model_) und Berry et al. (2006) ist die ethnische Identität (Identifikation mit dem Herkunftskontext) besonders
förderlich für die psychologische Adaption, da dieses Zugehörigkeitsgefühl beispielsweise negative Erfahrungen, etwa
wahrgenommene Diskriminierung, abschwächen kann. Hingegen wird die nationale Identität (Identifikation mit dem
Aufnahmekontext) vor allem für die soziokulturelle Adaption als zentral angesehen. Zudem erachten Berry et al. (2006) eine
Identifikation mit beiden Kontexten insgesamt als besonders förderlich.
Bereits vorliegende Befunde bestätigen den positiven Zusammenhang zwischen ethnischer Identität und subjektivem
Wohlbefinden (Berry et al., 2006; Smith & Silva, 2011). Außerdem werden positive Zusammenhänge zwischen nationaler Identität
und anhand von schulbezogenen Einstellungen operationalisierter soziokultureller Adaption berichtet (Berry et al., 2006). In
einigen Studien hat sich zudem eine starke Identifikation mit beiden Kontexten als förderlich für die anhand von Noten erfasste
soziokulturelle Adaption erwiesen (z.B. Oysermann et al., 2003). Nur wenige Studien haben bislang jedoch die soziokulturelle
Adaption mit standardisierten Leistungsmessungen operationalisiert, um mögliche Verzerrungen in den Lehrkrafturteilen zu
berücksichtigen (Edele et al., 2013; Hannover et al., 2013), oder beide Formen der Adaption gleichzeitig mit ethnischer und
nationaler Identität in Beziehung gesetzt (Berry et al., 2006). Bislang wurde die Hypothese des differenziellen Zusammenhangs
der Identitätsdimensionen mit der psychologischen und soziokulturellen Adaption also kaum systematisch unter Einbeziehung
standardisierter Leistungsmaße überprüft. Die vorliegende Studie setzt an dieser Forschungslücke an und prüft folgende
Hypothesen:
(1) Die ethnische Identität hängt enger mit der psychologischen als mit der soziokulturellen Adaption zusammen.
(2) Die nationale Identität hängt enger mit der soziokulturellen als mit der psychologischen Adaption zusammen.
(3) Besonders förderlich für psychologische und soziokulturelle Adaption ist eine hohe Ausprägung beider Identitätsdimensionen.
Die Analysen wurden mit Daten des Nationalen Bildungspanels (NEPS) der 9. Klassenstufe (Schuljahr 2010/11) durchgeführt.
Die Stichprobe umfasst N = 1443 Heranwachsende mit Zuwanderungshintergrund (56% Mädchen, MAlter = 14.8). Neben Skalen
zur ethnischen und nationalen Identität (je vier Items, α = .90/.91) wurden Skalen zur Erfassung des globalen Selbstwertgefühls
(10 Items, α = .83) und der globalen Lebenszufriedenheit (5 Items, α = .76) als Indikatoren für psychologische Adaption sowie
standardisierte Leistungsmessungen im Leseverstehen (Haberkorn et al., 2012) und Mathematik (Duchhardt & Gerdes, 2013)
als Indikatoren für soziokulturelle Adaption in die Analysen einbezogen. Unter Kontrolle relevanter Hintergrundcharakteristika
(SES, Geschlecht, besuchte Schulform, Sprachgebrauch zuhause, Generationsstatus) wurden OLS-Regressionen mit robusten
Standardfehlern berechnet, um die Mehrebenenstruktur in den Daten zu berücksichtigen.
Erste Ergebnisse zeigen erwartungskonform einen engeren Zusammenhang der ethnischen Identität mit der psychologischen
Adaption (Selbstwertgefühl: ß=0.18, p < .001/Lebenszufriedenheit: ß=0.12, p < .001) als mit der soziokulturellen Adaption
(Leseverstehen: ß=-0.01, n.s./Mathematik: ß=-0.02, n.s.) (1). Die nationale Identität hängt positiv mit beiden Formen der Adaption
zusammen, jedoch zeigt sich kein engerer Zusammenhang mit der soziokulturellen als mit der psychologischen Adaption (2).
Zudem zeichnet sich kein signifikanter zusätzlicher Beitrag einer hohen Identifikation mit beiden Kontexten ab (3). Die Relevanz
der Befunde für zuwanderungsspezifische Bildungsungleichheiten wird diskutiert.
ID: 404
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Sonstige Didaktiken
Thematisches Cluster: Bildung im Sekundarbereich, Trainings- und Evaluationsforschung
Stichworte: Kulturelle Bildung, Persistenz, Selbstkonzept, Empathie, Bildhauerei
Wirkungen Kultureller Bildung
Chair(s): Caroline Theurer (Universität Kassel), Sebastian Konietzko (Westfälische-Wilhelms-Universität Münster)
Diskutant(en): Christian Rittelmeyer (Georg-August-Universität Göttingen)
Kulturelle Bildung kann als Sammelbegriff für vielfältige Bildungsangebote für Menschen jeder Altersgruppe in verschiedenen
Sparten wie Kunst, Musik, Literatur, Tanz und Theater verwendet werden (Fuchs, 2009) und kann im schulischen wie
außerschulischen Kontext stattfinden. Dabei bietet Kulturelle Bildung – besonders im schulischen Kontext – nicht nur ergänzende
Lerngelegenheiten, sondern kann Möglichkeiten zur gesellschaftlichen Teil-habe schaffen. Als persönlichkeitsbildende
Maßnahme wird ihr eine hohe Bedeutung bei-gemessen. Darüber hinaus wird häufig angenommen, dass Kulturelle Bildung
Transferef-fekte auf kognitive Maße oder sogar Lernleistungen (Hamer, 2014; Rittelmeyer, 2010) ha-ben kann, was sie in der
vergangenen Dekade zu einem bedeutsamen Thema für die Bil-dungsforschung hat werden lassen (Scheunpflug & Prenzel,
2013). Dementsprechend wird vermehrt darüber diskutiert, wie Kulturelle Bildung (innerhalb der Schule) gestärkt werden kann
(KMK, 2013). Diese Diskussion gewinnt gerade vor dem Hintergrund, dass die Partizi-pation an Bildungsangeboten im kulturellen
Bereich stark von sozio-ökonomischen Hin-tergrundvariablen (Rat für Kulturelle Bildung e. V., 2015; Weishaupt et al., 2012)
sowie el-terlicher Partizipation (Kröner et al., 2013) abhängt, an Relevanz.
Zwar wird die Bedeutung Kultureller Bildung für die Persönlichkeitsentwicklung nicht be-stritten, jedoch gibt es bislang nur wenige
empirische Befunde, die ihre Wirkungen bele-gen, so beispielsweise auf Merkmale wie Sprachentwicklung, Offenheit,
Selbstkonzept, Emotionalität oder Kreativität. In dem Symposium werden Studien vorgestellt, die sich mit den Wirkungen
Kultureller Bildung interdisziplinär auseinandersetzen. Mit unter-schiedlichen Schwerpunkten, Thematiken und methodischen
Herangehensweisen werden erste Ergebnisse von einzelnen Projekten vorgestellt, die über den „Forschungsfonds Kul-turelle
Bildung. Studien zu den Wirkungen Kultureller Bildung“ finanziert werden. Der For-schungsfonds ist ein Projekt vom Rat für
Kulturelle Bildung e.V., gefördert durch die Stif-tung Mercator. Interdisziplinäre besetzte Forschergruppen widmen sich in den
Einzelbei-trägen unterschiedlichen Themen und Altersgruppen: Rogh et al. untersuchen, in welcher Weise und Intensität
Fünftklässler Bildungsangebote im kulturellen Bereich nutzen und wie sich diese Nutzung auf personale Merkmale auswirkt.
Stuckert et al. nehmen Bil-dungsprozesse in Jugendkunstschulen in den Blick und analysieren, inwieweit selbstbezo-gene
Kognitionen dadurch beeinflusst werden. Marx et al. prüfen, ob empathische Fähig-keiten von Jugendlichen mit deren
Lesegewohnheiten zusammenhängen. Gruber et al. widmen sich schließlich der Entwicklung von BildhauerInnen indem sie
einerseits danach fragen, welche Erlebnisse und Personen den Werdegang beeinflussen und andererseits prüfen, ob hier
Unterschiede zwischen Experten und Novizen bestehen. Die vorgestellten Studien werden von Christian Rittelmeyer
zusammenfassend diskutiert.
Beiträge des Symposiums
Eine Wirkungsstudie zu kultureller Bildung im Medium „Tanz und Bewegungstheater“
Svenja Konowalczyk1, Esther Pürgstaller2, Marion Gonella2, Yvonne Hardt3, Nils Neuber2, Claudia Steinberg4, Martin
Stern1
1
Philippps-Universität Marburg, 2Westfälische-Wilhelms-Universität Münster, 3Hochschule für Musik und Tanz Köln, 4Johannes
Gutenberg-Universität Mainz
Das Projekt „Tanz und Bewegungstheater – ein künstlerisch-pädagogisches Projekt zur kulturellen Bildung in der
Ganztagsgrundschule“ zielt auf die empirische Überprüfung von Wirkungen kultureller Bildung am Beispiel von Tanz und
Bewegungstheater. Als Indikatoren für die Wirkung werden Effekte in den Bereichen Kreativität, Selbstkonzept und emotionale
Kompetenz bei Kindern in Ganztags(grund)schulen erfasst.
Kreativität, deren Förderung als ein wesentlicher Bestandteil kultureller Bildung gesehen wird (u. a. Liebau, 2012; Bockhorst;
Reinwand & Zacharias, 2012), rückt zunehmend als Bildungskomponente in den Vordergrund: bei der Bewältigung sozialer
Aufgaben des Alltags ebenso wie beim Bildungsweg und Berufsleben (vgl. Serve, 2000). Nationale und internationale Studien
zeigen, dass ein Unterricht in kreativer Tanz- und Bewegungserziehung zu einer spezifischen Förderung der (motorischen)
Kreativität beitragen kann (vgl. u. a. Neuber, 2000; Bournelli & Mountakis, 2008). Auch für den Bereich des Selbst- und
Körperkonzepts liegen positive Befunde vor, die die Annahme stützen, dass ein Unterricht im Tanz und Bewegungstheater
förderlich sein kann (vgl. Dinold, 2004; Reichel et al., 2010). Im Anschluss an die Theorie von Shavelson, Hubner und Stanton
(1976) ermöglicht das Selbstkonzept als Teil der Persönlichkeit eine Konkretisierung und empirische Operationalisierung der
Persönlichkeitsentwicklung (vgl. Conzelmann, 2008; Conzelmann & Müller, 2005). Darüber hinaus stellen emotionale
Kompetenzen eine wichtige Basisfertigkeit für die psychosoziale Entwicklung von Kindern dar (vgl. u.a. Jerusalem & Pekrun,
1999; Gembris, 2003). Aus einer ersten eigenen Studie ist bekannt, dass ein musik- und tanzpädagogisches Förderprogramm
im offenen Ganztag der Verbesserung der Emotionserkennung sowie des Emotionswortschatzes dienen kann (Behrens, Zubarik
& Henz, 2013).
Auf dieser Grundlage wird im vorgestellten Projekt der Frage nachgegangen, welche Effekte ein künstlerisch-pädagogisches
Angebot im Tanz und Bewegungstheater auf die Bereiche Kreativität, Selbstkonzept und emotionale Kompetenz von
Schülerinnen und Schülern hat. Zur Klärung werden in einer quasi-experimentellen Längsschnittuntersuchung im
Kontrollgruppendesign kognitive und motorische Facetten der Kreativität sowie Facetten des Selbstkonzeptes und der
emotionalen Kompetenz bei rund 360 Kindern im Grundschulalter (3. und 4. Klasse) erfasst. Geplant sind drei Messzeitpunkte
vor, unmittelbar nach sowie drei Monate nach Abschluss eines künstlerisch-pädagogischen Unterrichtsprojektes zum Tanz und
Bewegungstheater. Die Intervention wird über 12 Wochen (1 x 90 min. pro Woche) von qualifizierten Tanz- und
Bewegungspädagogen/innen durchgeführt. Zusätzlich zu den Experimentalgruppen, die am künstlerisch-pädagogischen
Angebot teilnehmen, werden Kontrollgruppen einbezogen, die während des gleichen Zeitraumes kein spezielles Angebot bzw.
ein Alternativ-Programm, z. B. in Form von Kleinen Spielen, erhalten. Insgesamt sind 12 Versuchsgruppen und 6 Kontrollgruppen
mit jeweils 15-20 Kindern vorgesehen (NVG=180-240; NKG=90-120).
Als standardisierte Testverfahren werden ein Subtest des Kreativitätstests für Vorschul- und Schulkinder (KVS-P; Krampen 1996)
sowie ein bewegungsspezifischer Kreativitätstest in Anlehnung an Neuber (2000) angewandt. Zur Erfassung des Selbstkonzepts
wird voraussichtlich der Self-Description Questionnaire-Short (SDQ-GS I) nach Arens et al. (2013) eingesetzt. Darüber hinaus
findet der emotionale Kompetenztest für Kinder und Jugendliche (KUSCHE-Affektive-Interview-Revised) zur Abbildung der
emotionalen Kompetenz in der Studie Verwendung (Kusche, Greenberg & Beilke, 1988).
Der wissenschaftliche Erkenntnisstand der Tanzforschung im Kontext von Tanz und kultureller Bildung ist noch unzureichend,
da es an Feld- und vor allem Längsschnittstudien in schulischen und außerschulischen Kontexten mangelt. Die geplante
empirische Studie trägt zur Schließung dieser Forschungslücke bei und lässt gewinnbringende Ergebnisse erwarten.
Nutzung Kultureller Bildung zu Beginn des fünften Schuljahres – erste deskriptive Befunde aus dem
Forschungsprojekt KuBiK5
Wida Rogh1, Caroline Theurer2, Nicole Berner1, Frank Lipowsky2
1
Alanus Hochschule Alfter, 2Universität Kassel
Kulturelle Bildungsangebote richten sich in vielfältiger Weise an Kinder und Jugendliche und bieten ihnen u. a. kunst-, musik-,
theater- und tanzpädagogische Angebote. Kinder und Jugendliche können so in einer ästhetisch-künstlerischen
Auseinandersetzung im sozialen Miteinander aktiv und kreativ werden und eigene Stärken erkennen und weiter ausbauen. Daher
wird Kultureller Bildung eine hohe Bedeutung für die Entwicklung von Heranwachsenden zugeschrieben (Scheunpflug & Prenzel,
2013).
Obwohl Kulturelle Bildung einen wichtigen Teil schulischer wie außerschulischer Bildung darstellt (Keuchel, 2013; Rat für
Kulturelle Bildung, 2015; Sozialgesetzbuch 8. Buch, §11) und von wissenschaftlicher und politischer Seite für die Förderung von
Kreativität und gesellschaftlicher Innovation als relevant erachtet wird (Kultusministerkonferenz, 2013; Liebau, 2008; Winner,
Goldstein & Lancrin, 2013), gibt es nur wenige empirische Befunde zur Nutzung Kultureller Bildung sowie zu
Wirkungszusammenhängen mit anderen personalen Merkmalen.
Die meisten Studien fokussieren dabei auf Teilbereiche Kultureller Bildung oder haben ein Experimentalgruppendesign, um ein
kulturpädagogisches Programm zu evaluieren, an dem die Schüler über einen bestimmten Zeitraum teilnehmen. Selten wird der
Blick auf eine umfassende Kulturelle Bildung gerichtet, um Wirkungen Kultureller Bildung auf personale Merkmale – insbesondere
auf die Kreativität – zu untersuchen (Harland et al., 2000; Luftig, 2000; Moga, Burger, Hetland und Winner, 2000). Zum Beispiel
wurde im deutschen Sprachraum bisher kaum die über einen längeren Zeitraum in Anspruch genommene kulturelle Bildung in
der Lebenswelt der Heranwachsenden betrachtet und untersucht, wie sich eine vielseitige Nutzung Kultureller Bildung auf die
Entwicklung personaler Merkmale auswirkt. Dabei ist zu erwarten, dass sich verstärkte Effekte Kultureller Bildung auf die
Kreativitätsentwicklung in sogenannten „multi-arts“-Studien (Moga et al., 2000) zeigen.
Hier setzt das Forschungsprojekt KuBiK5 (Wirkung Kultureller Bildung auf Kreativität im fünften Schuljahr; Berner, Theurer, Rogh
& Lipowsky, 2015) an, das die Nutzung Kultureller Bildung in verschiedenen Bereichen, u. a. Bildende Kunst, Musik, Medien,
Tanz und Theater sowohl auf schulischer als auch außerschulischer Ebene in den Blick nimmt. Längsschnittlich wird die Wirkung
Kultureller Bildung auf Kreativität im Verlauf des fünften Schuljahres über zwei Messzeitpunkte untersucht. Dabei werden auch
mediierende personale Merkmale, wie u. a. die Ausdauer, die Offenheit und das Selbstkonzept, berücksichtigt. Im Vortrag werden
Ergebnisse der ersten Datenerhebung zu Beginn des fünften Schuljahrs im Herbst 2015 berichtet.
Insgesamt wurden Schülerinnen und Schüler in 54 fünften Schulklassen in NRW, Hessen und Sachsen zu den von ihnen
genutzten schulischen und außerschulischen kulturellen Bildungsangeboten sowie zu ihren Interessen und Freizeitaktivitäten
befragt. Darüber hinaus wurden, neben bisher in der Forschung üblichen quantitativen Angaben zu Umfang und Intensität der in
Anspruch genommenen Kulturellen Bildungsangebote auch subjektive Wertungen der Freude und Beanspruchung mit
berücksichtigt. Diese subjektiven Wertungen fließen in ein Maß für individuell erlebte Qualität ein und werden als bedeutsame
Bedingung für eine positive Wirkung Kultureller Bildungsangebote betrachtet. Informationen zu Quantität und subjektiv erlebter
Qualität dienen schließlich der Generierung eines umfassenden Indikators für Kulturelle Bildung.
Um Aussagen über den familiären Hintergrund treffen zu können, wurden die Eltern ebenfalls befragt. Über einen
Elternfragebogen werden Angaben zum sozio-ökonomischen Status, kulturellem Kapital, zu Erziehungsstilen und -zielen sowie
zur elterlichen Einstellung zu Kultureller Bildung erfragt.
Diese umfassend vorliegenden Informationen ermöglichen es, die Nutzung Kultureller Bildung im Kontext von theoretisch
denkbaren Wirkmechanismen unter Berücksichtigung von mediierenden, individuellen, häuslichen sowie schulischen und
außerschulischen Kontextmerkmalen zu untersuchen und ein theoretisches Wirkmodell vorzustellen, mit dem die postulierten
Zusammenhänge auf Schülerebene geprüft werden sollen.
Erste deskriptive Ergebnisse zum generierten Indikator für Kulturelle Bildung und dessen Zusammenhang mit individuellen und
häuslichen Kontextmerkmalen werden vorgestellt. Weiterführende Analysen zu möglichen Wirkungsweisen Kultureller Bildung
auf die Kreativitätsentwicklung von Fünftklässlern werden prospektiv diskutiert.
Bildungsprozesse in Jugendkunstschulen
Marina Stuckert1, Ivo Züchner1, Werner Thole2, Jacqueline Rauschkolb1, Svenja Thielker2
1
Philippps-Universität Marburg, 2Universität Kassel
Theoretischer Hintergrund
Die musikalische und ästhetisch-kulturelle Bildung im Kindes- und Jugendalter wird in Deutschland stark durch außerschulische
Akteure – Musik- und Tanzschulen, Vereine und andere Organisationen –geprägt. Jugendkunstschulen sind hier zentrale Orte
der non-formaler Bildung von Kindern und Jugendlichen: Auf Freiwilligkeit der Teilnahme beruhend, machen sie Angebote der
ästhetisch-kulturellen Bildung, die in Kurs oder Projektform ablaufen. Gemeinsam ist den Angeboten das Lernen und die
ästhetisch-künstlerische Gestaltungen in Gruppen – als öffentlich geförderte Jugendarbeit haben diese sowohl das Ziel der
Persönlichkeitsentwicklung als auch der Unterstützung der Herausbildung künstlerischer Fähigkeiten: die Anregungsqualität von
Inhalten wie Theater, Musik, Bildende Kunst, Digitale Medien und Tanz wird nicht nur in der Entwicklung technischer Fähigkeiten
und Etablierung einer ästhetischen (Selbst)Wahrnehmung gesehen, sondern auch als Anstoß für die Weiterentwicklung von
grundsätzlicheren personalen und sozialen Fähigkeiten erachtet (bjke 2011).
Bislang existiert wenig empirisch abgesichertes Wissen darüber, welche konkreten Bildungsprozesse über das Engagement von
Kindern und Jugendlichen in den ästhetisch-kulturellen Angebotsbereichen stattfinden (u.a. Prenzel & Ray 2012; Autorengruppe
Bildungsberichterstattung 2012; Liebau 2014). Zu analysieren ist entsprechend, inwieweit ein Zusammenhang zwischen der
Teilnahme an Angeboten von Jugendkunstschulen und der Veränderung der Beherrschung ästhetisch-künstlerischen
„Techniken“ sowie des ästhetisch-expressiven Selbstkonzeptes besteht. Darüber hinaus werden Bildungsprozesse angenommen
in Bezug auf eine Erweiterung der Fähigkeiten zur Selbstdarstellung und -präsentation, auf die Fähigkeit, andere Perspektiven
zu übernehmen sowie bezüglich der Erprobung sozialer Interaktion (u.a. Lindner 2003; Bockhorst 2011). Die Analyse dieser
Aspekte ist Zielsetzung des Forschungsprojekts „Jugendkunstschulen – eine Studie zu den Wirkungen von Angeboten in der
kulturellen Kinder- und Jugendarbeit“ (JuArt), das als Kooperationsprojekt der Phillips-Universität Marburg und der Universität
Kassel vom Rat für Kulturelle Bildung im Rahmen der Förderlinie „Wirkungen kultureller Jugendbildung“ gefördert wird.
Fragestellung des Beitrags
Der Beitrag im Symposium analysiert, inwieweit die Teilnahme an Angeboten der Jugendkunstschulen eine Veränderung der
ästhetischen Selbstwahrnehmung und des sozialen und körperlichen Selbstkonzeptes beeinflusst. Dabei wird ein Augenmerk
auf differenzielle Effekte nach Angebotsart sowie unterschiedlichen Teilnehmerkreisen gelegt.
Methode
Dargestellt werden Ergebnisse der 1. und 2. Welle einer quantitativen Längsschnitterhebung an 38 Jugendkunstschulen mit ca.
900 Kindern und Jugendlichen. Diese wurden zu Beginn und zum Ende ihres Kurses/Projektes in einer Prä-/Posterhebung zu
eigenen Aktivitäten, zur sowie zur Einschätzung eigener ästhetische sowie zur Einschätzung der eigenen Person befragt. Ergänzt
wird die Studie durch Befragungen der Kursleitungen sowie Gruppendiskussionen in ausgewählten Projekten und Kursen. In den
standardisierten Befragungen wird neben biografischen und motivationalen Aspekten nach dem Wissen und Können innerhalb
der jeweils gewählten „Sparte“ gefragt. So kommen Konstrukte zum Einsatz wie das spartenspezifische Fähigkeitsselbstkonzept
in Anlehnung an Vispoel (1993). Um zudem die individuelle Bedeutsamkeit der jeweiligen künstlerischen Aktivität zu
berücksichtigen, wurde das Flow-Erleben in Anlehnung an die motivationale Orientierung nach Prenzel (1984) gemessen. Die
Erfassung der Persönlichkeitsfacetten basiert u. a. auf dem Shevelson-Modell des Selbstkonzepts (1976). D.h. es werden Skalen
zu hierarchisch niedrigeren bereichsspezifische Facetten eingesetzt – also zum sozialen (Helmke et al. 2002), emotionalen
(Barchard 2001) und körperlichen (Pöhlmann, Thiel & Joraschky 2007; Roth 2014) Selbstkonzept, bei welchen eine Veränderung
über die Zeit erwartbar ist.
Bei der Analyse der Daten im Längsschnitt werden Latent change score Modelle (Ferrer & McArdle 2010) verwendet. Die
Clusterstruktur der Daten, die durch die Erhebung in Einrichtungen (und Kursen) zustande kommt, wird durch eine
mehrebenenanalytische Modellierung berücksichtigt.
Ergebnisse
Da die Post-Erhebungen bei Einreichung des Exposés noch nicht abgeschlossen wurden, werden im Folgenden erwartete
Ergebnisse formuliert. So wird die Hypothese geprüft, dass sich stärkere Veränderungen bei den kulturellen Fähigkeiten als
Veränderungen des Selbstkonzepts ergeben und letztere über den Erwerb kultureller Fähigkeiten vermittelt werden. Zudem
werden in differentiellen Analysen besondere Veränderungen bei Kindern aus Familien mit niedrigerem kulturellen Kapitel
erwartet, die in den Jugendkunstschulen tendenziell unterrepräsentiert sind.
Unterschiede in empathischen Fähigkeiten zwischen viel- und weniglesenden Jugendlichen und ihre
Relevanz für literarisches Textverstehen als Indikator Kultureller Bildung
Alexandra Marx1, Sofie Henschel1, Thorsten Roick2, Petra Stanat1, Jörn Brüggemann3, Volker Frederking4
1
Humboldt-Universität zu Berlin, 2Landesamt für Schule und Lehrerbildung, Regionalstelle Frankfur, 3Carl von Ossietzky
Universität Oldenburg, 4Friedrich-Alexander-Universität Erlangen-Nürnberg
Theorie
Dem Erkennen von Perspektiven, Emotionen und Handlungsmotiven anderer Personen wird in unterrichtsdidaktischen
Überlegungen eine wichtige Rolle für das literarische Textverstehen beigemessen (z.B. Olsen, 2011). Der damit verbundene
Einfühlungsprozess soll die Aufmerksamkeit des Rezipienten auf relevante Informationen lenken und so die Bildung einer
kohärenten Textrepräsentation und das Textverstehen begünstigen. Untersuchungen bei Jugendlichen stützen diese Annahme
insofern, als sie darauf hinweisen, dass insbesondere die Fähigkeit, sich in die Stimmungen lyrischer Werke oder in die
Perspektive von Figuren einzufühlen (Fantasieempathie), über weitere Empathiefacetten (z.B. Betroffenheit) und motivationale
Variablen hinaus zur Erklärung des literarischen Textverstehens beiträgt (Henschel & Roick, 2013). Untersuchungen bei
erwachsenen Lesern zeigen zudem, dass Zusammenhänge zwischen dem häufigen Lesen literarischer Texte und Facetten der
Empathie bestehen (Bal & Veltkamp, 2013). Die vorliegende Studie untersucht, inwieweit Unterschiede in empathischen
Fähigkeiten in Abhängigkeit vom Leseverhalten bei jugendlichen Lesern zu beobachten sind und ob diese differenziell zur
Erklärung des literarischen Textverstehens beitragen.
Methode
Untersucht wurden 314 Jugendliche (42% weiblich), von denen 141 als viellesend (Gruppe VL; mehr als 60 Minuten täglich und
mehr als sechs literarische Bücher pro Jahr) und 173 als weniglesend (Gruppe WL; weniger als 15 Minuten täglich und höchstens
zwei literarische Bücher pro Jahr) klassifiziert wurden. Alle Jugendlichen bearbeiten am Ende der 10. Klasse Items zu Facetten
der (trait-bezogenen) Empathie (Fantasieempathie: α = .75; Empathiefähigkeit: α = .75), zur state-bezogenen Empathie (α = .87)
sowie zum literarischen Textverstehen (rtt = .77). Die Daten wurden unter Kontrolle des Geschlechts, der Schulform und der
früheren Leistung im literarischen Textverstehen strukturanalytisch in einem Mehrgruppenmodell ausgewertet.
Ergebnisse
Jugendliche der Gruppe VL erreichen im literarischen Textverstehen bessere Leistungen als ihre Peers der Gruppe WL und
berichten höhere Werte sowohl für die Fantasieempathie und Empathiefähigkeit als auch für die state-bezogene Empathie mit
literarischen Figuren. Unter Kontrolle des früheren literarischen Textverstehens zeigt sich, dass in beiden Gruppen ausschließlich
Fantasieempathie indirekt – vermittelt über die state-bezogene Empathie – zur Erklärung des literarischen Textverstehens
beiträgt. Darüber hinaus deutet sich vor allem für die Gruppe VL auch ein direkter Zusammenhang zwischen Fantasieempathie
und literarischem Textverstehen an, der nicht über die state-bezogene Empathie vermittelt wird.
Diskussion
Die Ergebnisse stützen die Annahme, dass häufiges Lesen von Literatur positiv mit empathischen Fähigkeiten assoziiert zu sein
scheint (vgl. Bal & Veltkamp, 2013). Entgegen bisheriger Studienergebnisse nutzen Jugendliche ihre empathischen Fähigkeiten
aber unabhängig vom Leseverhalten, um sich einen Text zu erschließen, indem sie sich während des Lesens in die Protagonisten
eines literarischen Textes einfühlen. Da in der Gruppe VL auch die trait-bezogene Fantasieempathie tendenziell zur Erklärung
des literarischen Textverstehens beizutragen scheint, sollte in weiteren Studien untersucht werden, welche prozessbezogenen
kognitiven und affektiven Merkmale diesen Zusammenhang neben der state-bezogenen Empathie mit literarischen Figuren
vermitteln. Die Ausbildung von Empathie wird in den Bildungsstandards als wesentliches Ziel des Deutschunterrichts benannt,
das insbesondere durch den Umgang mit literarischen Texten erreicht werden soll. Deshalb ist ein genaueres Verständnis
darüber, welche Wirkmechanismen zwischen Lesepraxis, empathischen Fähigkeiten und dem Verstehen literarischer Texte
bestehen von besonderer Bedeutung, um empathieförderliche Zugänge bei der Unterrichtsgestaltung in deutschdidaktischen
Überlegungen systematisch zu berücksichtigen.
Studien zur Bildhauerei. Fertigkeitserwerb und künstlerischer Werdegang von BildhauerInnen
Linda Puppe, Hans Gruber, Birgit Eiglsperger, Christiane Settele
Universität Regensburg
Theoretischer Hintergrund
Das vorliegende Forschungsvorhaben ist ein Teil des Projektes „Studien zur Bildhauerei. Analyse expertisegradbedingter
Unterschiede in differenzierter Wahrnehmung und plastischer Gestaltung“. Es werden Ergebnisse aus der Vorstudie vorgestellt
sowie erste Ergebnisse der eigentlichen Studie auf der Tagung präsentiert.
Der theoretische Ausgangspunkt der Studie ist die Expertiseforschung. Expertise bezieht sich nach Ericsson (2006) auf die
Charakteristika, die Fähigkeiten und das Wissen, welches ExpertInnen von NovizInnen unterscheidet. Deren zentrale Annahme
ist, dass der Expertiseerwerb Ergebnis eines langfristigen kognitiven Adaptationsprozesses ist. Ericsson und Charness (1994)
gehen davon aus, dass in der bildenden Kunst wenigstens zehn Jahre Vorbereitung nötig sind, um internationale Wettbewerbe
zu gewinnen.
Um Einflussfaktoren, welche zur Expertisierung beitragen, charakterisieren zu können, sind Analysen von Biographien
unterschiedlicher BidhauerInnen hilfreich. Sloane und Sosniak (1985) führten hierzu eine Befragung mit 25 BildhauerInnen und
15 Eltern durch. Sie beschrieben verschiedene Aspekte, welche als wichtig für die bildhauerische Entwicklung genannt wurden.
Diese sind unter anderem: familiärer Einfluss, Schulzeit, außerschulische Aktivitäten und Studium. Wiederholt wird betont, dass
ausgeprägte Motivation und Anstrengungsbereitschaft vorlag sowie Förderung durch Schule und Familie vorhanden war.
Fragestellung
Das Forschungsvorhaben hat das Ziel, folgende Fragen zu beantworten:
1. Welche Erlebnisse beeinflussen den Werdegang von BildhauerInnen und deren künstlerische Entwicklung?
2. Welche Personen begleiten den Werdegang von BildhauerInnen und fördern deren künstlerische Entwicklung?
3. Wie unterscheiden sich die Expertisegruppen im Fertigkeitserwerb?
Methode
Design Vorstudie
Es wurde ein quasi-experimentelles Design gewählt.
Stichprobe
Es nahmen 27 BildhauerInnen an der Umfrage teil.
Instrument
Als Instrument für die Vorstudie wurde ein Fragebogen mit offenen und geschlossenen Fragen entwickelt.
Durchführung
Für die Stichprobe der ExpertenInnen wurden KünstlerInnen befragt, welche Mitglied im Bundesverband bildender Künstlerinnen
und Künstler sind (BBK). Der Fragebogen stand als Online-Version zur Verfügung.
Auswertung
Die Analysen zu Gruppenunterschiede wurden mittels Kruskal-Wallis-Test durchgeführt.
Ergebnisse
Die Ergebnisse zeigen, dass es keine signifikanten Unterschiede zwischen den Expertisegruppen bezüglich der
feedbackgebenden Personen existieren. ExpertInnen und Semi-ExpertInnen erhalten gleichermaßen Rückmeldung von Familie,
DozentInnen, FreundInnen und KommilitonInnen. Aber die jeweiligen Expertisegruppen bewerten die Personen, welche für das
künstlerische Schaffen hilfreich sind, unterschiedlich. Für 41 Prozent der ExpertInnen war der Austausch mit KünstlerkollegInnen
hilfreich bezüglich des künstlerischen Weiterkommens, bei Semi-ExpertInnen lediglich vier Prozent. Die Gruppe der SemiExpertInnen empfanden KommilitonInnen und DozentInnen mit 41 und 36 Prozent am hilfreichsten.
Des Weiteren wurde nach der Häufigkeit der Rückmeldungen gefragt. Auch hier existieren keine signifikanten Unterschiede. Der
Modalwert lag bei den Semi-ExpertInnen bei „gelegentlich“, bei den ExpertInnen bei „oft“. Die Analyse der Ratingskalen ergab,
dass es für Semi-ExpertInnen signifikant anstregender ist Museen zu besuchen und Fachliteratur zu lesen.
Design Studie „Fertigkeitserwerb und künstlerischer Werdegang von BildhauerInnen“
Es wird ein Querschnittsdesign mit einem Zwei-Gruppen-Vergleich gewählt, der Faktor Expertisegruppe umfasst die Stufen
ExpertIn und Semi-ExpertIn. Unter die abhängigen Variablen fallen zum Beispiel Anzahl von Einzel- und Gruppenausstellungen,
Personen wie Eltern und Lehrende sowie Ereignisse, beispielsweise das Kennenlernen des Ehepartners.
Stichprobe
Die Stichprobe setzt sich aus jeweils zehn KünstlerInnen (ExpertInnen) und Semi-ExpertInnen zusammen. Die KünstlerInnen
haben bereits langjährige professionelle Erfahrung im Bereich der Bildhauerei. Zur Gruppe der Semi-ExpertInnen zählen
Studierende in künstlerischen Studiengängen, die bereits bildhauerische Erfahrung haben.
Instrument
Für die Studie wurde ein teilstrukturiertes Interview entwickelt sowie mithilfe von Dokumenten der ProbandInnen eine Timeline
zum künstlerischen Werdegang erstellt.
Durchführung
Die Versuchspersonen werden gebeten, Dokumente, die ihren künstlerischen Werdegang nachvollziehbar machen lassen, zu
einem Interview mitzubringen (z. B. Flyer und Einladungen zu Ausstellungen, eigene Kataloge, Wettbewerbsteilnahmen). Im
Verlauf des Interviews wird eine Timeline erstellt, die die einzelnen Stationen visualisiert. Die Interviews werden aufgenommen
und danach wörtlich transkribiert.
Auswertung
Das Interview zum Werdegang wird anhand einer inhaltlich strukturierenden qualitativen Inhaltsanalyse ausgewertet. Die
Aussagen der ProbandInnen werden in entsprechenden Kategorien und Unterkategorien eingeordnet. Analysen der
Gruppenunterschiede erfolgen nonparametrisch mittels Kruskal-Wallis Test beziehungsweise Mann-Whitney-U Test.
ID: 407
Symposium
Disziplinen-Cluster: Psychologie
Thematisches Cluster: Gesundheit/ Stress/ Belastung
Stichworte: Psychische Beeinträchtigung, Risikofaktiren, Prävention, Inervention, Bildungserfolg
Individuelle Risikofaktoren und Interventionsansätze im Kontext Schule: Beiträge aus dem Blickwinkel
der klinischen und neurowissenschaftlichen Forschung
Chair(s): Aiste Jusyte (LEAD Graduate School, Universität Tübingen), Thomas Dresler (LEAD Graduate School, Universität
Tübingen)
Diskutant(en): Klaus Hurrelmann (Hertie School of Governance)
Die Verbindung unterschiedlicher Forschungstraditionen gehört seit jeher zu den zentralen Anliegen der Empirischen
Bildungsforschung. Aktuelle Forschungsprogramme, wie etwa die Graduiertenschule LEAD (Learning, Educational Achievement,
and Life Course Development) in Tübingen, sind ein sichtbares Zeichen einer disziplinübergreifenden Zusammenarbeit. Im
Zentrum steht sowohl die Frage nach den kennzeichnenden Merkmalen erfolgreichen Lernens oder einer erfolgreichen
Entwicklung, aber auch die Identifikation relevanter Risikofaktoren auf Seiten des Lernkontexts oder der individuellen Person. Zu
den individuellen Risikofaktoren gehören sowohl früh auftretende Lernstörungen (z.B. Dyskalkulie), die den schulischen Erfolg
mindern, als auch psychische Störungen (z.B. Depression oder Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung [ADHS]), deren
Auftreten nicht nur die Schulleistungen beeinträchtigen, sondern sich auch auf andere Lebensbereiche, wie soziale Anpassung,
negativ auswirken können. Dabei stellen alle diese Störungen nicht nur eine erhebliche Belastung für die betroffenen
Schülerinnen und Schüler dar, sondern gefährden gleichzeitig die weitere Entwicklung von Heranwachsenden. Die Minimierung
und Prävention solcher Entwicklungsrisiken gehören daher zu den wichtigsten Aufgaben der Bildungsforschung. Vor allem das
Verständnis der Ätiologie der genannten Störungen ist von enormer Bedeutung, um diese durch effektive Präventions- und
Interventionsbemühungen frühzeitig zu adressieren. Diese Fragestellungen werden in der Graduiertenschule LEAD im Rahmen
von interdisziplinären Forschungsprojekten an den Schnittstellen zu klinischer Psychologie und Neurowissenschaften bearbeitet.
Im Rahmen des Symposiums sollen ausgewählte Befunde der Graduiertenschule LEAD zur Bedeutung individueller
Risikofaktoren aus klinisch-psychologischer und neurophysiologischer Perspektive vorgestellt und diskutiert werden. Auf der
Grundlage der interdisziplinären und damit einhergehenden methodischen Vielfalt sollen sowohl Erkenntnisse über die Ätiologie
dieser Störungen gezeigt, als auch praktische Implikationen für neue Förderangebote und Behandlungsansätze vorgestellt
werden. Inhaltlich beschäftigen sich die Beiträge zum einen mit Auswirkungen von Depressivität auf schulische Leistungen und
zum anderen mit der Frage, welche Faktoren die Wirksamkeit von Depressionspräventionsprogrammen an Schulen erhöhen
können. Ferner werden Ergebnisse von Grundlagen- und Präventionsstudien zu zwei verbreiteten Störungsbildern, nämlich
Dyskalkulie und ADHS, präsentiert, deren Untersuchung durch den Einsatz von Methoden aus den Neurowissenschaften einen
aktuellen Beitrag zur Aufklärung von zugrundeliegenden Mechanismen und der Entwicklung völlig neuer Behandlungsmethoden
bilden.
Beiträge des Symposiums
Die Bedeutung internalisierender Beeinträchtigungen für die schulische Entwicklung von
Heranwachsenden: Befunde der TRAIN Studie
Sina Müller1, Richard Göllner2, Aiste Jusyte1, Thomas Lösch1, Ulrich Trautwein2
1
LEAD Graduate School, Universität Tübingen, 2Hector-Institut für Empirische Bildungsforschung,Tübingen
Die schulische Entwicklung und die Lerngeschichte von Kindern und Jugendlichen sind abhängig von einer Vielzahl
unterschiedlicher Einflussfaktoren. Hierzu gehören die individuellen Lernvoraussetzungen des einzelnen Kindes, das elterliche
Erziehungsumfeld (z.B. der sozioökonomische Hintergrund oder das Erziehungsverhalten von Eltern) sowie die schulische
Lernumgebung selbst (Eccles & Roeser, 2011; Weinert & Helmke, 1997) – alles Faktoren, die bereits oft untersucht wurden.
Hingegen haben Einschränkungen der psychischen Gesundheit von Heranwachsenden bislang weniger Aufmerksamkeit
erfahren, wenngleich klinische Studien zeigen, dass ein substantieller Anteil Jugendlicher von erheblichen emotionalen
Beeinträchtigungen betroffen ist. In der BELLA-Studie des deutschen Kinder- und Jugendgesundheitssurveys (KiGGS; RavensSieberer, Wille, Bettge & Erhart, 2007) zeigten sich Prävalenzraten von 10% für Angst und 5.4% für Depression und in anderen
Studien weit höhere subklinischen Zahlen (Balazs et al., 2013). Die Auswirkungen dieser Beeinträchtigungen auf die schulische
Entwicklung von Schülerinnen und Schülern und eine erfolgreiche Gestaltung des Übergangs ins Erwachsenenalter sind jedoch
nach wie vor unklar.
In der vorliegenden Studie wurde untersucht, inwieweit internalisierende Beeinträchtigungen (das heißt depressive/ängstliche
Symptomatik) die Entwicklung von Schülerinnen und Schülerinnen beeinflussen. Neben den klassischen Entwicklungskriterien
(wie etwa dem Selbstwert) wurden auch Kriterien des schulischen Erfolges (Lesekompetenz und Mathematikleistung,
Eingebundenheit in der Schule) betrachtet.
Grundlage der Untersuchung waren Daten der Studie „Tradition und Innovation: Entwicklungsverläufe an Haupt- und Realschulen
in Baden-Württemberg und Mittelschulen in Sachsen“ (TRAIN; Jonkmann, Rose, & Trautwein, 2013), einer
Längsschnittuntersuchung zur Analyse differentieller Entwicklung von Schülerinnen und Schülern aus nicht gymnasialen
Schulformen (5., 6., 7., und 8. Klasse). Die Stichprobe umfasste N = 1062 sächsische Mittelschülerinnen und -schüler (46.8%
weiblich, M Alter = 10.76, SD = .68). Zur Erfassung internalisierender Symptomatik wurde in TRAIN die deutsche Version der
Child Behavior Checklist (CBCL; Döpfner et al., 2013) verwendet. Zudem wurden die Mathematikleistung (Blum, Drüke-Noe,
Hartung & Köller, 2006; Granzer, Köller & Bremerich-Vos, 2009), die Lesekompetenz (Böhme, Neumann & Schipolowski, 2010),
sowie die Subskalen Selbstwert und Familie des KINDLR-Fragebogen für Kinder und Jugendliche (Ravens-Sieberer & Bullinger,
1998) im Längsschnitt erhoben. Zur Beschreibung der sozialen Eingebundenheit von Schülerinnen und Schülern dienten ein
Selbstberichtsmaß (Fend & Prester, 1986) und auch Berichte von Mitschülerinnen und Mitschülern sowie Lehrkräften.
In Übereinstimmung mit Befunden aus klinischen Studien, zeigte sich, dass 9.2% der befragten Schülerinnen und Schüler eine
hohe und 15.1% eine moderate internalisierende Symptomatik aufwiesen. In Hinblick auf weitere Entwicklungskriterien, ergaben
sich für diese Schülergruppen substantielle Unterschiede: In der 5. Klasse wiesen die beeinträchtigten Jugendlichen in allen
untersuchten Entwicklungskriterien signifikant niedrigere Werte auf als Schülerinnen und Schüler ohne Beeinträchtigungen.
Darüber hinaus zeigten psychisch beeinträchtigte Jugendlichen im Rahmen von Veränderungsanalysen eine substantiell
geringere Zunahme im Verlauf für die Lesekompetenz, sowie für die soziale Einbindung aus Lehrersicht. Interessanterweise
zeigte sich für das Ausmaß der sozialen Einbindung im Selbstbericht eine stärker positive Zunahme.
Demnach bestehen bereits mit Beginn der Sekundarstufe (5. Klasse) bedeutende Unterschiede für Jugendliche mit
internalisierenden Beeinträchtigungen im Vergleich zu ihren Mitschülerinnen und Mitschülern. Für einige wichtige soziale und
akademische Entwicklungskriterien ergeben sich im zeitlichen Verlauf bedeutsame Unterschiede, die im Rahmen des Beitrags
weiterführend diskutiert werden sollen.
Ein Vergleich von Lehrkräften und Psychologen bei der Durchführung eines schulbasierten
Präventionsprogramms zur Vermeidung von Depressionen
Gabriel Kornwachs1, Richard Göllner2, Leona Hellwig1, Margarete Patak3, Melanie Wahl3, Martin Hautzinger3
1
LEAD Graduate School, Universität Tübingen, 2Hector-Institut für Empirische Bildungsforschung,Tübingen, 3Abteilung für
klinische Psychologie, Universität Tübingen
Depressionen treten bereits im Kindes- und Jugendalter häufig auf und stellen somit nicht nur eine Einschränkung der
Lebensqualität von Heranwachsenden dar, sondern können auch deren weitere Entwicklung in einem erheblichen Maße
gefährden (z.B. Bettge, Wille, Barkmann, Schulte-Markwort & Ravens-Sieberer 2008). Das schulische Umfeld bietet zur
Vermeidung von Depressionen sehr geeignete Möglichkeiten, wenngleich die Effektivität existierender Programme im Schulalltag
bisher nur vereinzelt evaluiert wurde (vgl. Stice, Shaw, Bohon, Marti & Rohde, 2009).
Ein vielfach angewendetes Programm zur Depressionsprävention ist das Programm Lebenslust mit LARS&LISA (Wahl, Patak,
Schmid & Hautzinger, 2008). Neben einer hohen Akzeptanz erwies sich das hauptsächlich von Psychologen durchgeführte
Programm als präventiv und konnte die Depressivität und das Selbstwertgefühl bei klinisch auffälligen Schülern positiv
beeinflussen (Groen, Pössel, Al-Wiswasi & Petermann, 2003; Pössel, Horn, Hautzinger & Groen 2004; Pössel, Seemann &
Hautzinger 2008).
Die praktische Umsetzung und Implementation solcher Programme im Schulalltag stellen jedoch weiterhin eine große
Herausforderung dar. So ist bisher weitestgehend unklar, inwieweit auch Lehrkräften eine „wirksame“ Programmdurchführung
gelingt. Die Untersuchung relevanter Prozessmerkmale auf Seiten des Unterrichts und deren Auswirkungen auf die
Programmeffektivität sind daher notwendige Schritte.
In der vorliegenden Arbeit wurde daher untersucht, inwieweit sich Lehrkräfte und Psychologen bzgl. der Effektivität und der
qualitativen Ausgestaltung des universellen schulbasierten Depressionspräventionsprogramms Lebenslust mit LARS&LISA
unterscheiden. Ferner wurde untersucht, inwieweit die Unterrichtsfaktoren Klassenführung, Strukturiertheit des Unterrichts und
Manualtreue einen Einfluss auf die Effektivität des Programms ausüben.
An der Studie nahmen 421 Hauptschüler der achten Klasse zwischen 2008 und 2009 in Baden-Württemberg teil. Das Programm
wurde von 22 Lehrkräften und 22 Psychologen durchgeführt, die zuvor in einem zweitägigen Training ausgebildet wurden. Die
zehn wöchentlichen Sitzungen (Dauer 90 min) wurden videografiert und anschließend im Hinblick auf die Unterrichtsfaktoren
durch unabhängige Beurteiler bewertet.
Als Zielgrößen zur Bestimmung der Programmeffektivität wurden die Ausprägung der depressiven Symptomatik (ADS, Meyer &
Hautzinger, 2001), der generellen Psychopathologie (SDQ, Goodman, 1997) und der positiven sozialen Fertigkeiten (TISS-P,
Inderbitzen & Foster, 1992) sowohl vor als auch nach dem Training (Post) sowie als 12 Monats-Follow-Up (12MFU) erhoben.
Ein Vergleich zwischen Lehrkräften und Psychologen zeigte keine bedeutsamen Unterschiede bzgl. der Programmeffektivität.
Mit Blick auf die untersuchten Unterrichtsfaktoren ergaben sich jedoch substantielle Unterschiede: Während Lehrkräfte im
Vergleich zu Psychologen besser in der Klassenführung abschnitten, gelang den Psychologen eine deutlich höhere
Strukturierung der Programminhalte. Hingegen ergab sich für die Manultreue kein Unterschied. Im Hinblick auf die gewählten
Effektivitätskriterien hatte der Unterrichtsfaktor Klassenführung sowohl einen positiven Einfluss auf die psychische Belastung
(SDQ, 12 MFU) als auch auf die sozialen Fertigkeiten (TISS-P, Post) der Schüler. Die Strukturiertheit des Unterrichts konnte den
SDQ-Wert (12MFU) voraussagen, während die Manualtreue keinen Einfluss hatte.
Insgesamt sprechen die Ergebnisse dafür, dass Unterrichtsfaktoren für die Effektivität eines universellen schulbasierten
Depressionspräventionsprogramms von Bedeutung sind. Dabei weisen Lehrkräfte und Psychologen unterschiedliche Stärken
während der Durchführung auf. Die Bedeutung dieser Befunde für die zukünftige Umsetzung derartiger Programme in der Praxis
wird diskutiert.
Blickbewegungsanalysen beim Lösen von Subtraktionsaufgaben mit und ohne Zehnerübergang bei
Kindern mit schwachen Mathematikleistungen
Katharina Lambert1, Kevin Eggebrecht2, Korbinian Möller2
1
Hector-Institut für Empirische Bildungsforschung,Tübingen, 2Leibniz Institut für Wissensmedien, Universität Tübingen
Bei Kindern mit schwachen Mathematikleistungen sind im Vergleich zu Kindern ohne Lernschwierigkeiten sowohl
Reaktionszeiten wie auch Fehlerraten schon beim Lösen von einfachen Rechenaufgaben deutlich erhöht (z.B. Gaupp et al.,
2004; Geary et al., 1993; Geary et al., 2004). Unterschiede in der Bearbeitung von Aufgaben mit mehrstelligen Zahlen sind
dagegen weit weniger gut untersucht. In ersten Untersuchungen zeigte sich für Kinder mit schwachen Mathematikleistungen ein
stärker ausgeprägter Carry-Effekt bei mehrstelligen Additionsaufgaben was die Lösungsgeschwindigkeit sowie die Fehlerrate
angeht (Busch et al., 2013; Lambert et al., in prep.). Allerdings fanden sich in den Blickbewegungsmustern keine Unterschiede
zwischen den Leistungsgruppen, was darauf hindeutet, dass der größere Carry-Effekt nicht auf qualitative, sondern quantitative
Verarbeitungsunterschiede zurückzuführen zu sein scheint. Wie in vorangegangenen Untersuchungen für Kinder ohne
Lernschwierigkeiten (Moeller et al., 2011), ließ sich auch für schwach rechnende Kinder eine verstärkte Verarbeitung der Einer
der Summanden feststellen, wenn ein Übertrag von den Einern zum Zehner notwendig war (Lambert et al., in prep).
Analog zum Carry-Effekt bei der Addition erscheint der Effekt des Borgens (Borrow-Effekt) bei der Subtraktion (z.B. 26 - 18).
Allerdings wurde die erhöhte Schwierigkeit durch die Notwendigkeit des Borgens bei mehrstelligen Subtraktionsaufgaben bisher
kaum (Kong et al., 2005) und bei Kindern noch gar nicht untersucht. Solche Aufgaben benötigen, analog zu Additionsaufgaben
mit Übertrag, allgemein mehr Aufmerksamkeit und Arbeitsgedächtniskapazität (z.B. Imbo et al., 2007), um auf basis-numerischer
Ebene die korrekte Integration der Einer und Zehner in die Platz x Wert Struktur arabischer Zahlen beim Borgen vom Zehner zu
leisten. Für Erwachsene konnten Radler, Huber, Moeller und Pixner (2014) für den Borrow-Effekt zeigen, dass die notwendigen
Prozesse zumindest für die Verarbeitung der Operanden (d.h., Subtrahend und Minuend) ähnlich denen beim Carry-Effekt in der
Addition sind. Allerdings gibt es bislang keine Untersuchung, die die dem Borrow zugrundeliegenden kognitiven Prozesse bei
sich typisch entwickelnden Kindern untersucht, oder gar mögliche Unterschiede für sich atypisch entwickelnde Kinder zu
identifizieren sucht.
Zur Beantwortung dieser Fragen, wurden in der vorliegenden Studie n = 24 Kinder der dritten Klassenstufe mit schwachen
mathematischen Leistungen (Prozentrang < 25) mit n = 46 Kindern mit guten Mathematikleistungen (Prozentrang > 45)
verglichen. Verwendet wurde im Gegensatz zu bisherigen Studien (z.B. Moeller et al., 2011) ein Produktionsparadigma, da dies
eher den schulischen Anforderungen der Kinder entspricht. Blickbewegungsmessungen wurden angewendet, um
Prozessunterschiede untersuchen zu können.
Wie erwartet, wiesen schwach rechnende Kinder höhere Reaktionszeiten und Fehlerraten auf als Kinder der Kontrollgruppe.
Darüber hinaus zeigten spezifischere Analysen in beiden Gruppen einen bedeutsamen Borgen-Effekt, d.h. höhere
Reaktionszeiten und Fehlerraten für Aufgaben mit verglichen mit Aufgaben ohne Zehnerübergang. Rechenschwache Kinder
hatten dabei spezifische Probleme mit dem Zehnerübertrag was sich in einem signifikant erhöhten Borrow-Effekt in den
Fehlerraten dieser Gruppe zeigte. Die Ergebnisse deuten somit darauf hin, dass sich die Befunde zum Carry-Effekt bei der
Addition auf Subtraktionsaufgaben übertragen lassen. Die Analysen der Blickbewegungsmuster zeigten analog zu
Untersuchungen zum Carry-Effekt bei der Addition und den Ergebnissen zur Subtraktion bei Erwachsenen, dass bei allen Kindern
die Notwendigkeit eines Zehnerübertrags mit spezifischer Verarbeitung der Einer, d.h. mit längeren Fixationsdauern auf eben
diesen, assoziiert war. Es fanden sich jedoch wieder keine qualitativen Gruppenunterschiede in den Blickbewegungsmustern.
Die Analysen deuten damit darauf hin, dass sich die kognitiven Prozesse von schwach und gut rechnenden Kindern zur zur
Anwendung der Borgenoperation bei mehrstelligen Subtraktionen nicht grundlegend voneinander unterscheiden. Allerdings
scheinen die Prozesse bei schwach rechnenden Kindern generell verlangsamt und mit geringerer Lösungsgenauigkeit
abzulaufen. Dies lässt sich möglicherweise auf eine fehlende Automatisierung des arithmetischen Faktenwissens, einer
mangelnden Flexibilisierung von Rechenstrategien (Qin et al., 2014) und einer (dadurch bedingten) stärkeren Belastung des
Arbeitsgedächtnisses (z.B. Geary et al., 2004) zurückführen. Mögliche Konsequenzen für die Praxis werden diskutiert.
Neurofeedbacktraining in einem virtuellen Klassenzimmer bei Schulkindern mit einer
Aufmerksamkeitsdefizit-/ Hyperaktivitätsstörung (ADHS) mit dem Ziel der Förderung schulischer
Leistungsfähigkeit
Friederike Blume1, Justin Hudak1, Thomas Dresler1, Tobias Renner2, Caterina Gawrilow3, Ann-Christine Ehlis4
1
LEAD Graduate School, Universität Tübingen, 2Klinik für Kinder- und Jugendpsychiatrie, Tübingen, 3Psychologisches Institut,
Universität Tübingen, 4Klinik für Psychiatrie und Psychotherapie, Tübingen
Kinder mit einer Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung (ADHS) sind unaufmerksam, hyperaktiv und impulsiv. Diese
Kernsymptome zeigen sich situationsübergreifend, insbesondere aber bei Aufgaben, die Aufmerksamkeit erfordern. Folglich
beeinflussen die Symptome die Leistungsfähigkeit zu Hause, bei der Arbeit oder in der Schule (American Psychiatric Association,
2013). Untersuchungen zeigen, dass Kinder mit ADHS schlechtere akademische Leistungen aufweisen als Kinder ohne ADHS
(Daley & Birchwood, 2010). Sie haben zudem Probleme in exekutiven Funktionen (EF), die der schlechteren schulischen
Leistungsfähigkeit zugrunde liegen könnten (Willcutt et al., 2005). Weitere Studien implizieren, dass ADHS-typisches Verhalten
eine primäre Ursache für schwache Schulleistungen darstellt (vgl. Frazier et al., 2007; Loe & Feldman, 2007; Rodriguez et al.,
2007). Folglich sollte eine Therapie der ADHS darauf abzielen, sowohl EF, als auch das Verhalten zu verbessern.
Die Verhaltensmuster von Kindern mit ADHS (Symptome, reduzierte EF) spiegeln sich auf neuronaler Ebene in veränderten
Aktivitätsmustern wider, die mittels Elektroenzephalographie (EEG) und funktionaler Nahinfrarotspektroskopie (fNIRS) gemessen
werden können (vgl., Barry et al., 2003; Ehlis et al., 2008). Negoro und Kollegen (2010) zeigten mittels fNIRS, dass der
ventrolaterale Präfrontalkortex von Kindern mit ADHS schlechter durchblutet ist als bei Kindern ohne ADHS.
Neurofeedbacktrainings (NFT) sind spezifische Interventionen, die zum Ziel haben, Selbstregulation auf neurophysiologischer
und auf Verhaltensebene zu verbessern, um so abweichende Hirnaktivität zu normalisieren (Gevensleben et al., 2014). Beim
NFT wird die Gehirnaktivität des Patienten in visuelle oder akustische Signale übersetzt und unmittelbar rückgemeldet (Drechsler
et al., 2007). Dadurch erlernen Patienten Strategien, ihre Gehirnaktivität selbst zu steuern (Gevensleben et al., 2014). Folglich
sollten sich dadurch EF und das Verhalten verbessern. Studien zur Wirksamkeit von NFT zeigen widersprüchliche Ergebnisse
auf. Holtmann und Kollegen (2014) konnte keine Verbesserung der ADHS-Symptomatik feststellen, die spezifisch auf ein EEGbasiertes NFT zurückzuführen war. Diese Ergebnisse stehen im Kontrast zu den Resultaten der Meta-Analysen von Arns und
Kollegen (2009; 2014), die Evidenz für solche spezifischen Effekte fanden. Marx und Kollegen (2015) zeigten in einer Pilotstudie,
dass ein NIRS-basiertes NFT mit Kindern mit ADHS die Symptomatik signifikant reduzieren konnte. Somit bleibt die spezifische
Effektivität von NFT weiter unklar, ebenso wie bisher kaum untersuchten Effekte auf EF und die schulische Leistungsfähigkeit
von Kindern mit ADHS (vgl. Meisel et al., 2013).
Bislang wurden NFT bei Kindern mit ADHS bisher nur in 2D-Trainingssituationen umgesetzt, jedoch nicht in virtuellen
Umgebungen, wie beispielsweise einem virtuellen Klassenzimmer. In der 2D-Situation werden die Signale auf einem
Computerbildschirm zurückgemeldet. Jedoch gibt es unserer Ansicht nach gute Gründe, warum Patienten mit ADHS von einem
NFT in einer virtuellen Umgebung profitieren sollten. Umso ähnlicher die Laborsituation dem realen Leben ist, umso leichter sollte
Generalisierung erfolgen. Othmer und Kaiser (2000) zeigten, dass ein NFT in einer virtuellen Umgebung die Compliance und die
kognitive Leistung von Probanden im Vergleich zu Personen, die in einer 2D-Umgebung trainiert hatten, verbessern konnte. Dies
zeigt, dass Interventionen in virtueller Umgebung Effekte haben könnten, die mit einer 2D-Umgebung nicht erreicht werden
können (vgl. Tortella-Feliu et al., 2011). Somit gehen wir erstens davon aus, dass die Generalisierung von im Labor erworbenen
Selbstregulationskompetenzen in den Alltag durch das Training in einer virtuellen Umgebung vereinfacht und stimuliert werden
kann. Othmer und Kaiser (2000) zeigten, dass ein Training in virtueller Umgebung im Vergleich zum 2D-Training den Verbleib
von Patienten im Trainingsprogramm und das Bemühen, während des Trainings und in kognitiven Tests gut abzuschneiden,
signifikant verbessern konnte. Deshalb sollte zweitens eine virtuelle Umgebung eine attraktivere Trainingsumgebung als eine
2D-Situation darstellen und zu einer höheren intrinsischen Motivation für das Training beitragen.
In dem geplanten Vortrag möchten wir das NFT in einem virtuellen Klassenzimmer als eine Intervention vorstellen, die das
Potential besitzt, neben der ADHS-Symptomatik auch EF zu verbessern. Dadurch könnte die schulische Leistungsfähigkeit von
Kindern mit ADHS langfristig gesteigert werden.
ID: 408
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung
Thematisches Cluster: Gesundheit/ Stress/ Belastung, Lehrer(aus)bildung
Stichworte: Lehrkräfte, Beanspruchung, Emotionale Erschöpfung, Praxisschock, Vorbereitungsdiest
Mythos „Praxisschock“ ? Beanspruchungserleben beim Übergang in die berufliche Praxis bei
(angehenden) Lehrkräften
Chair(s): Uta Klusmann (Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik), Friedericke
Zimmermann (Christian-Albrechts-Universität zu Kiel)
Diskutant(en): Anne Frenzel (Ludwig-Maximilians-Universität München)
Der Übergang in den Lehrerberuf wird seit über 30 Jahren einhellig als Phase mit erhöhtem Stresserleben, etwa mit den Begriffen
„Praxisschock“ oder „Survival Phase“, bezeichnet (Huberman, 1989; Schaefer, Long & Clandinin , 2012; Veenman, 1984).
Ursächlich hierfür seien das Erleben von Inkompetenz, unrealistische Erwartungen und die multiplen Aufgaben einer Lehrkraft
(Tynjälä & Heikkinnen, 2011). Eine Folge des Stresserlebens seien international hohe Abbruchquoten in den ersten Berufsjahren
(Schaefer et al., 2012).
Die empirische Befundlage ist weniger eindeutig als die Diskussion um den „Praxisschock“ impliziert (vgl. Dicke, 2015). Einerseits
deuten Arbeiten darauf hin, dass beginnende Lehrkräfte Symptome von Stress und einen Anstieg in Erschöpfung
aufweisen(Chan, 2002; Klusmann et al., 2012). Andere Arbeiten fanden allerdings niedrigere Stress-Werte angehender
Lehrkräfte verglichen mit erfahrenen Lehrkräften (Klassen & Chui, 2011). Diese heterogene Befundlage überrascht nicht, da sich
die für Beanspruchung verwendeten Indikatoren und die Gestaltung des Berufseinstiegs unterschieden. Auch in Anbetracht von
Reformen in den letzten Jahren erscheint es notwendig, die Frage nach dem „Praxisschock“ mit aktuellen Daten systematisch
zu untersuchen.
Das Symposium stellt aktuelle empirische Längsschnittstudien zum postulierten „Praxisschock“ zusammen. Dabei decken die
Beiträge alle Übergangsphasen in die schulische Praxis ab (Schulpraktikum, Vorbereitungsdienst, Beruf). Gemeinsam ist den
Beiträgen die Betrachtung desselben Indikators für Beanspruchungserleben (emotionale Erschöpfung).
Der erste Beitrag von Römer et al. untersucht individuelle und institutionelle Bedingungen des Beanspruchungserlebens im
Schulpraktikum. Der zweite Beitrag von Zimmermann et al. fokussiert auf Entwicklungsverläufe und Einflussfaktoren für BurnoutDimensionen am Übergang vom Studium in den Vorbereitungsdienst. Der dritte Beitrag von Dicke et al. untersucht auf Basis von
zwei Längsschnittkohorten die Entwicklung emotionaler Erschöpfung beim Übergang vom Vorbereitungsdienst in den Beruf. Der
vierte Beitrag von Schmidt et al. untersucht anhand von Tagebuchdaten Stresserleben und emotionale Erschöpfung von
Lehramtskandidaten im Vorbereitungsdienst im Vergleich zu Lehrkräften in den ersten Berufsjahren.
Beiträge
1) Jasmin Römer, Martin Rothland & Sophie Straub: Das Praxissemester als sensible Phase für das Beanspruchungserleben
von Lehramtsstudierenden. Erste Befunde aus dem Forschungsprojekt PriL
2) Friederike Zimmermann, Johanna Kaiser, Andrea Bernholt, Johannes Bauer & Lena Rösler: Veränderungsverläufe in BurnoutDimensionen: Die Bedeutung personaler und sozialer Faktoren angehender Lehrkräfte im Vorbereitungsdienst
3) Theresa Dicke et al.: „Doppelter Praxisschock“ auf dem Weg ins Lehramt? Die Entwicklung und potentielle Einflussfaktoren
von emotionaler Erschöpfung während des Vorbereitungsdienstes und nach Berufseintritt
4) Juliane Schmidt, Uta Klusmann & Mareike Kunter: Wird alles besser? Tägliches Stresserleben von Lehramtskandidaten im
Vorbereitungsdienst und Lehrkräften im Vergleich
5) Diskutantin: Anne Frenzel (Ludwig-Maximilians-Universität München)
Beiträge des Symposiums
Das Praxissemester als sensible Phase für das Beanspruchungserleben von Lehramtsstudierenden.
Erste Befunde aus dem Forschungsprojekt PriL
Jasmin Römer, Martin Rothland, Sophie Straub
Universität Siegen
Nationale wie internationale Studien belegen, dass sich viele Studierende als beansprucht erleben (u.a. Kreß, Sperth & Hofmann,
2015). Damit in Verbindung stehen körperliche und psychische Gesundheitsfolgen. Insbesondere psychosomatische
Beschwerden treten vermehrt auf. Es wird vermutet, dass das Praxissemester mit seinen vielfältigen Herausforderungen eine
(sensible) Phase erhöhten Beanspruchungserlebens für Lehramtsstudierende angesichts der vielfältigen neuen
Herausforderungen darstellt. Da die Studierenden nun ihre Rolle als Lehrende in einer für sie bislang fremden Arbeitswelt
ausschnittweise antreten, haben sie noch keine geeigneten Copingstrategien im Umgang mit den an sie gestellten
Berufsanforderungen entwickeln können. Es besteht daher die ständige Gefahr von Überbeanspruchung, die sich insbesondere
bei persönlich negativ eingeschätzter Lehrbefähigung gesundheitsschädigend auswirken könnte. Ob eine Bewältigung des
Praxissemesters mit positiver Rollenidentifikation letztlich gelingt, hängt (aber) sowohl von individuellen als auch institutionellen
Ressourcen ab.
Fragestellung
Bislang gibt es nur wenige Untersuchungen, in denen Lehramtsstudierende während des laufenden Praxissemesters zu ihrem
Beanspruchungserleben befragt wurden und die gleichermaßen international anschlussfähig sind.
Im Rahmen der Studie PriL (Praxissemester in der Lehrerbildung: Nutzung und Wirkung) wird die vermutete Beziehung
vermehrter Beanspruchung im Praxissemester im Vergleich zur Studienzeit längsschnittlich zu drei Messzeitpunkten (vor,
während und am Ende des Praxissemester) überprüft. Übergreifendes Ziel des Beitrags ist es, Einflüsse und Zusammenhänge
bedingender Faktoren, die zu einem erfolgreichen Gelingen des Praxissemester beitragen können unter Berücksichtigung
individueller Eingangsvoraussetzungen zu untersuchen. Gelingen wird dabei sowohl über positiv veränderte berufsbezogene
Selbstkonzepte als auch über einen gering erlebten Erschöpfungszustand definiert und operationalisiert.
Methode
Grundlage des eingereichten Beitrags sind Ergebnisse zum Burnouterleben (Maslach Burnout Inventory-Student Survey; MBISS) und den psychosomatischen Beschwerden (Fragebogen zur Erfassung des Gesundheitsverhaltens; FEG) von
Lehramtsstudierenden zum ersten und zweiten Messzeitpunkt der Studie PriL. Darüber hinaus werden Zusammenhänge mit
erlebten Herausforderungen (subjektiver work load) sowie personalen und institutionellen Ressourcen im Praxissemester (bspw.
pädagogische Vorerfahrungen; Unterstützung durch MentorInnen) aufgezeigt und diskutiert (u.a. Robins, Roberts & Sarris, 2015;
Fives, Hammon & Olivarez). Bereits Etablierte ebenso wie neu konstruierte Instrumente werden eingesetzt.
Ergebnisse
Befunde zum zweiten MZP werden im November 2015 erwartet. Ergebnisse können im Symposium auf der Basis einer
Stichprobe von n=137 berichtet werden.
Veränderungsverläufe in Burnout-Dimensionen: Die Bedeutung personaler und sozialer Faktoren
angehender Lehrkräfte im Vorbereitungsdienst
Friederike Zimmermann1, Johanna Kaiser1, Andrea Bernholt2, Johannes Bauer3, Lena Rösler2
1
Christian-Albrechts-Universität zu Kiel, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und M, 3Technische
Universität München
Dieser Beitrag widmet sich der Entwicklung von Ausprägungen in Burnout-Dimensionen angehender Lehrkräfte über ihr erstes
Jahr im Vorbereitungsdienst. Trotz des viel diskutierten „Praxis-Schocks“ gibt es nur wenige empirische Arbeiten, die sich mit
Auswirkungen des Berufseinstiegs auf das Beanspruchungserleben angehender Lehrkräfte beschäftigen. Diese Studien geben
einen Einblick in die Bedeutung verschiedener im Wesentlichen für Erschöpfung untersuchter Faktoren, z.B. eigenständiger
Unterricht (Klusmann, Kunter, Voss, & Baumert, 2012), soziale Unterstützung durch Mentorinnen und Mentoren (Alhija & Fresko,
2010) sowie angehende Mit-Lehrkräfte (Richter, Kunter, Lüdtke, Klusmann, & Baumert, 2011) und LehrerSelbstwirksamkeitserwartung (Dicke et al., 2015).
Vorhandene Studien gehen nicht über zwei Messzeitpunkte im Referendariat hinaus, so dass a) längsschnittliche Verläufe im
Beanspruchungserleben nicht beobachtet werden können (vgl. Singer & Willett, 2003) und b) eine möglicherweise schon im
Studium bestandene Vorbelastung nicht berücksichtigt wird. Außerdem ist offen, in welcher Form es zu Veränderungen in den
weiteren für Burnout relevant erachteten Facetten kommt und ob es für diese spezifische protektive Faktoren gibt (Maslach,
Schaufeli, & Leiter, 2001).
Wir untersuchen erstens, ob Veränderungen in Erschöpfung, Zynismus und Leistungsmangel im ersten Jahr
Vorbereitungsdienstes stattfinden, und wenn ja, welche Formen diese annehmen und zweitens, die Bedeutung
zeitinvarianten (z.B. Dauer ausschließlicher Hospitation, Ausprägungen in Burnout-Dimensionen im Studium)
zeitvariierenden Kovariaten (z.B. Betreuung durch die Ausbildungslehrkraft, soziale Unterstützung durch angehende
Lehrkräfte, Lehrer-Selbstwirksamkeitserwartung).
des
von
und
Mit-
Methode
Die angehenden Lehrkräfte entstammten 13 verschiedenen Hochschulstandorten und wurden im Anschluss an das Projekt
PaLea weiterverfolgt. Eine Substichprobe (N = 176; 80% weiblich) wurde verwendet, für die die erste Folgebefragung in den
ersten 12 Wochen des Vorbereitungsdienstes lag (T2); es folgten Befragungen nach einem halben Jahr (T3) und einem Jahr
(T4); Angaben am Ende des Studiums (T1) wurden berücksichtigt.
Die Burnout-Dimensionen wurden mit Versionen des Maslach Burnout Inventory (MBI; Maslach, Jackson, & Leiter, 1996) erfasst,
die an das Studium bzw. den Vorbereitungsdienst adaptiert waren (vgl. Schaufeli, Martinez, Marques Pinto, Salanova, & Bakker,
2002; Schaufeli & Salanova, 2007). Die Zufriedenheit mit der Betreuung durch die Ausbildungslehrkraft, die die Person am
intensivsten betreut sowie die soziale Unterstützung durch andere angehende Lehrkräfte wurden mit an anderer Stelle erstellten
Skalen erfasst (COACTIV-R, 2009). Außerdem wurde die Skala zur Lehrer-Selbstwirksamkeitserwartung eingesetzt (Schmitz &
Schwarzer, 2000). Die Reliabilitäten waren für alle Skalen und über alle Messzeitpunkte gut.
Latente Wachstumskurvenmodelle wurden berechnet: a) zur Bestimmung der Form der Veränderungsverläufe in den BurnoutDimensionen, b) unter Einschluss von zeitinvarianten und zeitvariierenden Kovariaten, wobei c) die Veränderung der Effekte
zeitvariierender Kovariaten über die Zeit getestet wurde (McArdle & Anderson, 1990; Muthén, 1993; Preacher, Wichman,
MacCallum, & Briggs, 2008).
Ergebnisse
Die Analysen der latenten Wachstumskurvenmodelle ergaben für Erschöpfung einen mittleren Anstieg im ersten Halbjahr sowie
ein Plateau stabil erhöhter Werte im zweiten Halbjahr, für Zynismus einen linearen Anstieg und für Leistungsmangel keine
Veränderung über das erste Jahr im Vorbereitungsdienst.
Die für alle Dimensionen signifikanten Varianzen in Ausgangs- und Veränderungswert konnten wesentlich durch die
Vorbelastungswerte zu T1 erklärt werden. Das Niveau, auf dem Veränderungen in Erschöpfung und Zynismus stattfinden bzw.
auf dem Ausprägungen im Leistungsmangel stabil bleiben ist also wesentlich von Ausprägungen in den Burnout-Dimensionen
im Studium bestimmt. Eine längere Dauer ausschließlicher Hospitation wirkte einem Anstieg in Erschöpfung entgegen. Die
Effekte der zeitvariierenden Kovariaten waren stabil über T2-T4. Während Lehrer-Selbstwirksamkeitserwartung negativ mit allen
Burnout-Dimensionen assoziiert war, war die Betreuung durch Ausbildungslehrkräfte für Leistungsmangel und Zynismus, die
soziale Unterstützung durch angehende Mit-Lehrkräfte spezifisch für Zynismus bedeutsam. Für die durchgängig bedeutsame
Lehrer-Selbstwirksamkeitserwartung war ferner der Leistungsmangel am Ende des Studiums prädiktiv.
Neben den günstigen Auswirkungen einer längeren Hospitationszeit und einer Unterstützung durch Ausbildungslehrkräfte und
angehende Mit-Lehrkräfte legen die Befunde nahe, dass der Aufbau von Ressourcen bereits im Lehramtsstudium zur
Vorbeugung erhöhter Burnout-Werte im Vorbereitungsdienst beitragen kann.
Keywords: Referendariat, Burnout-Dimensionen, soziale Unterstützung, Lehrer-Selbstwirksamkeitserwartung, Burnout im
Studium
„Doppelter Praxisschock“ auf dem Weg ins Lehramt? Die Entwicklung und potentielle Einflussfaktoren
von emotionaler Erschöpfung während des Vorbereitungsdienstes und nach Berufseintritt
Theresa Dicke1, Doris Holzberger2, Olga Kunina-Habenicht3, Christina Linninger3, Franziska Schulze-Stocker4, Tina
Seidel2, Ewald Terhard4, Detlev Leutner1, Mareike Kunter5
1
Duisburg-Essen University, 2Technische Universität München, 3Goethe University, Frankfurt, 4Westfälische WilhelmsUniversität Münster, 5Goethe Universität, Frankfurt
Beginnende Lehrkräfte gelten in der öffentlichen Wahrnehmung als eine Berufsgruppe mit einem besonders hohen
Beanspruchungsniveau. Dabei wird häufig auf den sogenannten Praxisschock verwiesen (Huberman, 1998). Die tatsächliche
Befundlage ist dabei nach wie vor allerdings unklar: (1) Studien zum Verlauf von der empfundenen Beanspruchung zeigen
inkonsistente Ergebnisse (Dicke et al., 2015). (2) andere Studien weisen auf individuelle Unterschiede im
Beanspruchungserleben hin (Schulte, 2008). (3) die Vergleichbarkeit internationaler Ergebnisse zur Beanspruchung beginnender
Lehrer mit deutschen Studien ist auf Grund des weltweit einzigartigen Vorbereitungsdienstes limitiert (Klusmann, Kunter, Voss &
Baumert, 2012).
Theoretisch sollte der in Deutschland durchgeführte Vorbereitungsdienst einen sukzessiven und begleiteten Einstieg
beginnender Lehrkräfte ermöglichen (Dietrich, 2014). Anderseits unterliegt der Vorbereitungsdienst Kritik, unter anderem
aufgrund des mangelnden Praxisbezugs (Kunter, Linninger, Schulze-Stocker, Kunina-Habenicht & Lohse-Bossenz, 2013) oder
dem Druck durch Noten und Examensarbeit (Schulte, 2008). Im Jahr 2009 wurde daraufhin im Land Nordrhein-Westfalen eine
Reform des Vorbereitungsdienstes beschlossen. Diese führte zu einer Verkürzung der Vorbereitungszeit und erhöhte damit das
Risiko einer höheren Belastung durch Zeitdruck. Gleichzeitig wurden jedoch Personenzentrierung (z.B. Mentoring) und
Handlungsorientierung (z. B. praxisgerechten Handlungssituationen) verstärkt sowie auf die Examensarbeit und Benotung des
Kernseminars verzichtet (Gerdes & Annas-Sieler, 2011). Diese Maßnahmen sollten zu einer stärkere Unterstützung und
Entlastung der Lehramtsänwärter(innen)(LAA) führen.
Ziel der vorliegenden Studie ist es deshalb, mehr über die Beanspruchungssituation während des Vorbereitungsdiensts zu
erfahren. Durch die Abbildung des Verlaufs der empfundenen Beanspruchung während des Vorbereitungsdienstes und ein Jahr
nach Beginn als selbständige Lehrkraft soll eine bessere Vergleichbarkeit mit internationalen Studien hergestellt werden. Zudem
soll untersucht werden, inwieweit die Reform des Vorbereitungsdienstes Auswirkung auf diesen Verlauf hat.
Methode
Design
Die vorliegende Studie bezieht sich auf drei Messzeitpunkte: Zu Beginn des Referendariats (T1), am Ende des Referendariats
(T2) und ein Jahr nach Beginn als Lehrkraft (T3). Dabei wurden Daten zweier Kohorten gewonnen: Kohorte 1 (K1): der letzte
Jahrgang des bisherigen Vorbereitungsdiensts von 24 Monaten; Kohorte 2 (K2): erster Jahrgang im reformierten
Vorbereitungsdienst von 18 Monaten. Somit handelt es sich bei dieser Studie um ein quasi-experimentelles Design mit
Messwiederholung.
Stichprobe
Die Ausgangsstichprobe der vorliegenden Studie (N = 1.749; K1: n = 1212, K2: n = 498) setzt sich aus 27.2% männlichen und
69.6% weiblichen LAA aller allgemeinbildenden Schularten mit einem Durchschnittsalter von M = 27.47 (SD = 4.11) Jahren
zusammen. Es zeigten sich keine signifikanten Unterschiede in diesen Merkmalen zwischen K1 und K2.
Instrumente
Emotionale Erschöpfung (Enzmann & Kleiber, 1989)
Analyseverfahren
Zur Untersuchung der Veränderung und möglicher Gruppenunterschiede von emotionaler Erschöpfung vom Beginn über das
Ende des Referendariats hinaus bis zum Ende des ersten Jahres als selbstständige Lehrkraft wurden Latent-Change-Modelle
(Ferrer & McArdle, 2010) sowie Mehrgruppen-Vergleiche angestellt.
Ergebnisse
Das Latent-Change-Modell zeigte eine gute Passung auf die Daten. Es zeigte sich eine leichte Abnahme der emotionalen
Erschöpfung während des Vorbereitungsdiensts; wobei die Effektgröße jedoch eher klein war. Ein Jahr nach Berufseinstieg als
selbstständige Lehrkraft zeigte sich wiederum ein etwas stärkerer Anstieg der emotionalen Erschöpfung. Zudem zeigten sich
individuelle Unterschiede im Wert des Ausgangsniveaus von emotionaler Erschöpfung und in beiden Veränderungen.
Untersucht wurde dann, ob sich diese individuellen Unterschiede durch die Zughörigkeit zu einer Kohorte erklären lassen. Der
Modellfit für dieses (Mehrgruppen)-Latent-Change-Modell war nicht zufriedenstellend. Für T1, also den Ausgangswert von
emotionaler Erschöpfung, zeigte sich ein signifikanter Unterschied in beiden Kohorten, wobei K2 den minimal höheren Wert
zeigte. Es zeigten sich jedoch keine signifikanten Unterschiede der Change-Variablen und damit im Verlauf von emotionaler
Erschöpfung zwischen beiden Kohorten.
Fazit
Es zeigen sich tatsächlich Indizien für einen zweiten Praxisschock, welcher erneut ein Jahr nach Beginn als selbstständige
Lehrkraft auftritt.
Hinsichtlich der Reform des Vorbereitungsdienstes scheint es gelungen zu sein, potentielle belastende Effekte der Verkürzung
durch die neu eingeführten Elemente zu relativieren.
Schlüsselwörter: emotionale Erschöpfung, Lehrerausbildung, Vorbereitungsdienst Veränderungsmessung
Wird alles besser? Tägliches Stresserleben von Lehramtskandidaten im Vorbereitungsdienst und
Lehrkräften im Vergleich
Juliane Schmidt1, Uta Klusmann1, Mareike Kunter2
1
Leibniz-Institut für die Pädagogik der Naturwissenschaften und M, 2Goethe Universität Frankfurt
Der Übergang in die schulische Praxis stellt für viele Lehrkräfte eine große Herausforderung dar, die mit vielen Veränderungen
einhergeht: Sie sind nicht länger die Lernenden, sondern müssen als Lehrende von Beginn den eigenen Unterricht gestalten,
vor- und nachbereiten, mit Schülerinnen, Schülern und dem Kollegium interagieren, Eltern beraten, sich fortbilden und
organisatorische Aufgaben übernehmen. An diese Veränderungen und neuen Herausforderungen müssen sich die Lehrkräfte
erst anpassen. Huberman (1989) geht in den ersten sechs Berufsjahren von zwei Anpassungsphasen aus: Dem Modell zufolge
sind Lehrkräfte zunächst primär mit dem „Überleben“ und „Entdecken“ beschäftigt. Dabei kennzeichnet das „Überleben“ den
Praxisschocks aufgrund der Konfrontation mit der Komplexität des Unterrichtens, während das „Entdecken“ den initialen
Enthusiasmus der Lehrkraft wiederspiegelt. Daran schließt sich eine Phase der „Stabilisierung“ an, in der Lehrkräfte sich mit ihrer
Rolle als Lehrkraft identifizieren können.
Bisherige längsschnittliche Untersuchungen bei Lehrkräften zeigten einen Anstieg im Stresserleben im ersten Berufsjahr (Hultell,
et al., 2013; Klusmann et al., 2012). Zudem fanden Klusmann und Kollegen (2012) für das zweite Jahr eine leichte Erholung des
Wohlbefindens, während Hultell und Kollegen (2013) von einem weiteren Anstieg des Burnout-Niveaus berichteten. Allerdings
wurde bisher noch nicht untersucht, ob sich auch das tägliche Stresserleben von Lehrkräften verändert. Daher betrachtet die
aktuelle Studie im Rahmen der Untersuchung des Anpassungsprozesses von Lehrkräften nicht nur Veränderungen im
Wohlbefinden sondern auch Unterschiede im täglichen Stresserleben. Das „Stresserleben“ wurde dabei als Verhältnis von
täglichen positiven zu negativen (beruflichen) Ereignissen definiert. Das erste Ziel war es somit, Indikatoren für einen
Anpassungsprozess in Form von Unterschieden im täglichen Stresserleben zwischen Referendarinnen und Referendaren im
ersten und zweiten Jahr des Vorbereitungsdienstes und Lehrkräften zu finden. Als zweites sollte überprüft werden, ob der
Anpassungsprozess im täglichen Wohlbefinden in Form von Unterschieden im Wohlbefinden zwischen den drei Gruppen
reflektiert wird.
Die Analysen basieren auf Daten aus zwei Tagebuchstudien mit insgesamt drei verschiedenen Kohorten von (angehenden)
Lehrkräften: 353 Referendarinnen und Referendaren im ersten, 100 Referendarinnen und Referendaren im zweiten Jahr des
Vorbereitungsdienstes und 141 Lehrkräften in den ersten Berufsjahren. Alle Teilnehmerinnen und Teilnehmer haben an 14 Tagen
in einem Online-Tagebuch Angaben zu ihrem täglichen Stresserleben, ihrer emotionalen Erschöpfung und ihrem Enthusiasmus
zu Lehren gemacht. Um das tägliche Stresserleben zu erfassen, wurden mittels idiographisch-nomothetischem Ansatzes
zunächst die täglichen beruflichen Ereignisse offen berichtet und anschließend als positiv bzw. negativ bewertet. Die offenen
Antworten wurden – entsprechend der Tätigkeitsbereiche von Lehrkräften – in acht Kategorien unterteilt: Unterrichten, Vor- und
Nachbereitung, außerunterrichtliche Interaktion mit Schülerinnen und Schülern, Beraten, Interaktion mit Kollegium, Aus- und
Fortbildung, Organisation und Sonstiges.
Die Ergebnisse zeigen, dass sich die drei Kohorten im täglichen Stresserleben in drei Kategorien statistisch signifikant
unterschieden: “Unterrichten” (F(2,481) = 18.52, p < .001, η² = .072), “außerunterrichtliche Interaktion mit Schülerinnen und
Schülern” (F(2,481) = 4.14, p = .02, η² = .017), und “Organisation” (F(2,481) = 6.05, p = .003, η² = .025). Die Lehrkräfte hatten
dabei ein geringeres Stresserleben beim „Unterrichten“ und der „Organisation“. Zudem zeigten Lehrkräfte sowie Referendarinnen
und Referendare im zweiten Jahr des Vorbereitungsdienstes ein geringeres Stresserleben hinsichtlich der „außerunterrichtlichen
Interaktion mit Schülerinnen und Schülern“ als Referendarinnen und Referendare im ersten Jahr. Bezüglich des Wohlbefindens
zeigten sich weder für die emotionale Erschöpfung (F(2,480) = 2.80, p = .06, η² = .012) noch für den Enthusiasmus zu Lehren
(F(2,480) = 1.13, p = .32, η² = .005) statistisch signifikante Unterschiede zwischen den drei Kohorten. Lehrkräfte in den ersten
Berufsjahren berichteten lediglich in der Tendenz eine geringe emotionale Erschöpfung (M = 1.59) als Lehrkräften im ersten (M
= 1.68) und zweiten Jahr des Vorbereitungsdienstes (M = 1.66). Insgesamt liefert die aktuelle Studie Hinweise auf einen
Anpassungsprozess in den ersten Berufsjahren, der aber wider Erwarten nicht mit Veränderungen im Wohlbefinden einhergeht.
Keywords: (angehende) Lehrkräfte; Anpassungsprozesse; Tagebuchstudie
ID: 410
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Soziologie
Thematisches Cluster: Bildung im Sekundarbereich, Motivation und Emotion
Stichworte: Akademisches Selbstkonzept, Leistungsselbsteinschätzung, Referenzgruppenwechsel, BFLPE
Leistungsselbsteinschätzungen im sozialen und institutionellen Kontext
Chair(s): Malte Jansen (DIPF), Michael Becker (DIPF)
Diskutant(en): Petra Stanat (IQB / HU Berlin)
Soziale Vergleiche gehören zu den wichtigsten Quellen von Wissen über die eigene Person und Identität (Gore & Cross, 2014).
Im schulischen Kontext ist eine zentrale Komponente von Identität das Wissen über die eigenen Kompetenzen. Dabei sind die
Peers (Lerngruppe, Schule) die wichtigste Referenzgruppe, vor deren Hintergrund soziale Leistungsvergleiche stattfinden.
Allerdings gibt es unterschiedliche Hypothesen zur Auswirkung einer starken oder negativ selegierten Referenzgruppe. Zum
einen geht eine starke Referenzgruppe mit einem besonders hohen Vergleichsstandard einher, was zu einem negativen Effekt
der Peer-Leistung auf Selbstkonzepte unter Kontrolle der individuellen Leistung führt (Big-Fish-Little-Pond Effect). Zum anderen
werden aber auch positive Assimilationseffekte innerhalb von leistungsstarken Gruppen und negative Stigmatisierungseffekte
von leistungsschwachen Gruppen (z.B. Schulformen) beschrieben. In diesem Symposium werden vier empirische Beiträge
vorgestellt, die sich mit dem Zusammenspiel von Referenzgruppen und Selbstkonzepten beschäftigen und sowohl Fragen der
Richtung als auch der Generalisierbarkeit und weiteren Bedeutsamkeit von Kontexteffekten ergründen wollen.
Der erste Beitrag betrachtet die Selbstkonzeptentwicklung beim Übergang der Grund- zur Sekundarschule, der mit einem
Referenzgruppenwechsel einhergeht. Er stellt die Frage, wie sich Kontexteffekte weiterentwickeln und auch transsituativ von
Bedeutung sind. Es wird untersucht, inwiefern sich Effekte einer starken Referenzgruppe in der Grundschule auf akademische
Selbstkonzepte auch nach dem Übergang in die Sekundarschule bestehen bleiben und sich über die Referenzgruppeneffekte
innerhalb der Sekundarschule auswirken.
Der zweite Beitrag beschäftigt sich mit einer anderen Art des Referenzgruppenwechsels, des Überspringens einer Stufe in den
Klassenstufen 4 bis 6. Es wird die Selbstkonzeptentwicklung von Überspringerinnen und Überspringern mit der einer durch
Propensity Score Matching balancierten Vergleichsgruppe verglichen und geprüft, ob mögliche Effekte des Überspringens
geschlechtsspezifisch ausfallen.
Im dritten Beitrag werden die Ergebnisse solcher Referenzgruppeneffekte am Ende der Sekundarstufe I fokussiert. Er geht der
Frage nach, in welchem Maße sich Evidenz für negative Stigmatisierungs- und Marienthal-Effekte oder für positive Effekte
Selbstwert schützender Nischen finden lässt. Es werden Selbstkonzepte und Bildungsaspirationen von Zehntklässlerinnen und
Zehntklässlern untersucht, die eine nicht-gymnasiale Schulart besuchen und vor dem Übergang in die Oberstufe bzw. die
berufliche Ausbildung stehen, und die Frage gestellt, wie diese von der besuchten Schulart und dem dort angestrebten Abschluss
beeinflusst werden.
Im vierten Beitrag wird schließlich untersucht wie die Über- oder Unterschätzung der eigenen Kompetenzen im Vergleich zur
sozialen Referenzgruppe (Fremdeinschätzung durch die Peers) die eigene Leistungsentwicklung (Tests und Noten) beeinflusst.
Dazu wird ein Round-Robin-Design genutzt, bei dem alle Schülerinnen und Schüler einer Klasse sich gegenseitig in Bezug auf
ihre Kompetenz beurteilen, und mit einem interpersonellen Ansatz unter Nutzung bayesianischer Verfahren ausgewertet.
Beiträge des Symposiums
Never Forget Where You Come From? Zum Zusammenspiel multipler Big-Fish Big-Fish-Little-Pond
Effekte
Michael Becker, Marko Neumann
DIPF
Theoretischer Hintergrund:
Neben dem Kompetenzerwerb wird auch das akademische Selbstkonzept (ASK) als wichtiges Outcome schulischer
Bildungsprozesse erachtet, sowohl für Lernprozesse selbst als auch für die Entwicklung von Interessen, Aspirationen und
Planung von Bildungskarrieren (Eccles, 1994; Nagengast & Marsh, 2012). Eine Vielzahl von Forschungsarbeiten hat gezeigt,
dass neben individuellen Faktoren auch der Kontext eine wichtige Rolle für die Entwicklung des akademischen Selbstkonzeptes
spielt. Gerade soziale Vergleichsprozesse und kontextspezifische Rückmeldungen über die Leistungen führen dazu, dass sich
Schülerinnen und Schüler mit gleichen individuellen Leistungen, in leistungsstarken Klassen weniger kompetent fühlen als in
weniger leistungsstarken Klassen (ein sogenannter Big-Fish-Little-Pond-Effekt, BFLPE; Marsh, 1987).
Obwohl BFLPE als gut belegt gelten können und generalisierbar erscheinen sowohl über unterschiedliche Bildungsetappen,
Schülergruppen und Kulturkreise (Chmielewski, Dumont, & Trautwein, 2013; Marsh & Hau, 2003; Seaton, Marsh, & Craven,
2009) wurde darauf verwiesen, dass BFLPE in der Regel allein im Querschnitt untersucht wurden und wenig darüber bekannt
ist, wie sie sich im Längsschnitt entwickeln (Dai & Rinn, 2008). Zwar wurde vereinzelt gezeigt, dass BFLPE längsschnittlich
persistieren können (im Überblick vgl. Marsh et al., 2008). Jedoch gibt es nur wenig Forschung zur transkontextuellen Dynamik
von BLFPE, so etwa zur Frage, wie sich BFLPE längerfristig über unterschiedliche Kontexte hinweg entwickeln. Zwar weisen
einige Studien darauf hin, dass BFLPE auch nach Kontextwechseln bestehen bleiben können (Marsh, 1991; Marsh, Trautwein,
Lüdtke, Baumert, & Köller, 2007), jedoch ist das Wissen hierüber bislang eher anekdotisch und darauf beschränkt, lediglich einen
BFLPE zu untersuchen (vgl. auch Wouters, Fraine, Colpin, Van Damme, & Verschueren, 2012).
Fragestellung:
Die Studie untersucht das Zusammenspiel mehrerer BLFPE im Übergang von der Grundschule in die Sekundarstufe. Hierbei
wird geprüft, inwiefern sich für sowohl Grundschule als auch Sekundarschulen BFLPE finden lassen und wie sie sich
längsschnittlich kurz- wie längerfristig nach dem Übergang verändern. Dabei wird die Frage adressiert, ob ein BFLPE eines
früheren Kontextes auch in der Anwesenheit eines BFLPE eines neuen Lernkontextes bestehen bleibt.
Methode:
Die Studie verwendet die Berliner ELEMENT-Studie (Lehmann & Lenkeit, 2008) und greift auf ein random subsample von N =
155 Schülerinnen und Schülern zurück, die drei Mal, kurz vor ihrem (vorzeitigen) Übergang an ein grundständiges Gymnasium
in der Grundschule (Ende 4), kurz nach dem Übergang (Beginn 5) sowie ein Jahr nach dem Übergang (Ende 5), untersucht
wurden (zum Subsample vgl. Becker et al., 2014). Für dieses Subsample liegen neben individuellen Informationen zu Leistung
und akademischem Selbstkonzept auch Kontextinformationen (aggregierte Klassenleistung) zum ersten Kontext (Grundschule)
wie auch zum zweiten Kontext (grundständiges Gymnasium) nach dem Übergang vor.
Statistisch wurden latente Modelle und auf sowohl Individual- als auch Kontextebene mit Leseverständnis, Orthographie und
Mathematik als Leistungsindikatoren (alle Maße mit WLE-Reliabiliät r > .84) geschätzt sowie, nur auf individueller Ebene, eine
latente Modellierung des allgemeinen ASK (zu allen Messzeitpunkten Cronbach’s α > .71; Reteststabilität r > .52; starke
Messinvarianz über die drei Messzeitpunkte) umgesetzt.
Zur simultanen Modellierung der beiden BFLPE wurden die Effekte als latente multivariate hierarchische Regressionsmodelle
gerechnet. Die Umsetzung erfolgte über Mplus 7.11, fehlende Daten wurden auf Indikatorenebene in MICE (van Buuren &
Groothuis-Oudshoorn, 2011) imputiert.
Ergebnisse
Die Analysen ergaben ein differenziertes Muster: Der Grundschulkontext weist in erwartbarer Weise einen starken BLFPE zum
Ende der vierten Klasse (Grundschule) auf, der Sekundarschulkontext zum Ende der 5. Klasse (Gymnasium). Längsschnittlich
lässt der Grundschul-BFLPE unmittelbar nach dem Übergang nach und ist am Ende der 5. Klasse nicht mehr nachweisbar. Die
Wirkung des gymnasialen Kontextes setzt noch nicht direkt nach dem Übergang ein, sondern lässt sich erst nach einem Jahr
nachweisen.
Die Befunde werden hinsichtlich der Bedeutung längerfristige Relevanz von BFLPE diskutiert, da sie darauf hinweisen, dass nicht
in allen Domänen, Alters- und Entwicklungsstufen von längerfristigen Wirkungen von BFLPE auszugehen ist.
Das Überspringen einer Klassenstufe: Analyse geschlechtsspezifischer Effekte auf das schulische
Selbstkonzept
Julia Kretschmann1, Miriam Vock1, Oliver Lüdtke2, Anna Gronostaj1
1
Universität Potsdam, 2IPN / ZIB
Theoretischer Hintergrund:
Angebote zur Förderung besonders leistungsstarker und begabter Schülerinnen und Schüler lassen sich akzelerierenden und
anreichernden Maßnahmen zuordnen (Vock, Preckel, Holling, 2007). Das individuelle Überspringen einer Klassenstufe stellt
dabei eine häufig genutzte und organisatorisch wenig aufwendige Maßnahme der Akzeleration dar. Akzeleration
(„Beschleunigung“) beinhaltet ein schnelleres Durchlaufen der Schullaufbahn und zielt darauf ab, ein Passungsproblem zu lösen,
indem begabte Schülerinnen und Schüler auf einem Anforderungsniveau unterrichtet werden sollen, das ihrem indi-viduellen
Entwicklungsstand entspricht (Holling et al., 2015). Während eine förderliche Wirkung des Überspringens einer Klasse auf die
schulische Leistungsentwicklung der Kinder bereits in einer Reihe von quantitativen Studien nachgewiesen werden konnte, sind
die wenigen Befunde zu den motivationalen Auswirkungen des Springens weitaus uneinheitlicher. Dazu mag auch beitragen,
dass motivationale, soziale und emotionale Konstrukte in bisherigen Untersuchungen gehäuft subsumiert werden. Hinweise auf
geschlechtsspezifische Effekte des Klassenüberspringens liegen bislang v.a. hinsichtlich der sozialen Entwicklung der Kinder vor
(Hoogeveen, Van Hell & Verhoeven, 2009), treten aber in den letzten Jahren in der Forschung zur Hochbegabtenförderung
zudem gehäuft im Zusammenhang mit motivationalen Merkmalen in Erscheinung (z.B. Dai & Rinn, 2008; Dai, Rinn & Tan, 2013).
Das für den Wechsel in eine leistungsstärkere Lerngruppe postulierte Absinken im akademischen Selbstkonzept („Big-Fish-LittlePond-Effekt“) wäre, ausgehend von diesen Befunden, für akzelerierte Mädchen in stärkerem Umfang zu erwarten als für
akzelerierte Jungen. Jedoch liegen auch Ergebnisse vor, die ein Aus-bleiben des Big-Fish-Little-Pond-Effekts im Zusammenhang
mit Maßnahmen zur Förderung besonders begabter Schülerinnen und Schülern durch ausgleichende Assimilationseffekte
aufzeigen (z.B. Preckel & Brüll, 2010).
Fragestellung:
Die vorliegende Untersuchung geht daher der Frage nach, (1) welche Veränderungen im allgemeinen und fachbezogenen
akademischen Selbstkonzept sowie in der leis-tungsbezogenen Schulangst der Schülerinnen und Schüler das individuelle
Überspringen einer Klassenstufe bewirkt, und (2) ob sich geschlechtsspezifische Effekte des Überspringens auf die motivationale
Entwicklung der Kinder nachweisen lassen.
Methode:
Bislang berücksichtigten nur wenigen Studien zu den Auswirkungen akzelerativer Maßnah-men die Unterschiedlichkeit
akzelerierter und nicht-akzelerierter Schülerinnen und Schüler. Belastbare Befunde aus Deutschland fehlen gänzlich. Wurden
Störvariablen kontrolliert, wurden überdies nur wenige konfundierende Merkmale in die Analysen aufgenommen. Problematisch
scheint auch die Anwendung regressionsanalytischer Modelle, da Treatment- und Vergleichsgruppe in vielen Verteilungen der
Kovariaten nur sehr begrenzt überlappen. In dem vorliegenden Beitrag wird daher die Methode des Propensity Score Matchings
zur Bildung einer adäquaten Vergleichsgruppe gewählt. Matchingvariablen und Matchingalgorithmus werden an die
Anforderungen der moderierenden Regression und die mehrebenenanalytische Beschaffenheit der Daten angepasst. Grundlage
der Analysen bilden die Berliner ELEMENT-Daten (N = 4962, davon n = 96 Springer/innen) von Schülerinnen und Schülern der
Klassenstufen 4 bis 6.
Ergebnisse:
Die Ergebnisse zeigen, dass ein Absinken des akademischen Selbstkonzepts im Sinne eines Referenzgruppeneffekts nach
Übertritt in eine höhere Klassenstufe durch Überspringen ausbleibt. Hingegen zeigen sich die Ausprägungen im akademischen
Selbstkonzept teilweise erhöht. Dies spricht für das Vorliegen eines starken Assimilationseffekts („Basking-in-Reflected-GloryEffekt“). Die gefunden Effekte werden jedoch zum Teil durch das Geschlecht moderiert: In der Gruppe der Mädchen zeigen sich
weniger positive Entwicklungen in schulischem Selbstkonzept und leistungsbezogener Schulangst in Folge des Springens als in
der Gruppe der Jungen.
Akademische Selbsteinschätzungen und Wahrnehmungen der eigenen beruflichen Chancen – Das
Zusammenspiel von Schulformzugehörigkeit und Schulabschluss
Hanna Dumont1, Protsch Paula2, Malte Jansen1, Michael Becker1
1
DIPF, 2WZB
Theoretischer Hintergrund
Inwiefern die Schulformzugehörigkeit die akademische Laufbahn von Schülerinnen und Schülern beeinflusst, stellt sowohl in der
Pädagogischen Psychologie als auch in der Bildungssoziologie seit langem eine prominente Forschungsfrage dar. Bezüglich des
Einfluss der Schulformzugehörigkeit auf die Selbsteinschätzungen von Schülerinnen und Schülern kommen die beiden
Disziplinen zu unterschiedlichen Schlüssen. Während in der Soziologie davon ausgegangen wird, dass Schülerinnen und Schüler
in niedrigeren Schulformen „a negative identity construction“ entwickeln (Solga, 2004, S.102), wird in der Psychologie auf der
Basis von empirischen Befunden zum sogenannten Big-Fish-Little-Pond-Effect (BFLPE) im gegliederten Schulsystem (siehe z.B.
Köller, 2004) die Position vertreten, dass niedrigere Schulformen „selbstwertschützende Nischen“ (Trautwein, Baumert & Maaz,
2007, S.7) darstellen. Gleichwohl konnten in einer jüngeren pädagogisch-psychologischen Arbeit Stigmatisierungseffekte bei
Hauptschülerinnen und Hauptschülern auf Ebene der kollektiven Identität gezeigt werden (Knigge, 2009). Somit lässt sich
vermuten, dass hinsichtlich der Schulformzugehörigkeit verschiedene nebeneinander existierende Selbsteinschätzungen
bestehen und daher weitere Dimensionen betrachtet werden sollten, um zu einem umfassenderen Bild des Einfluss der
Schulformzugehörigkeit auf die Selbsteinschätzungen zu gelangen. Dabei scheint die Einschätzung der beruflichen Chancen von
Schülerinnen und Schülern unterschiedlicher Schulformen mit Blick auf ihren weiteren beruflichen Lebensweg von besonderer
Relevanz. Vor dem Hintergrund der zunehmend geringer werdenden Kopplung von Schulform und Schulabschluss und auf der
Basis von soziologischen Studien zum Übergang von der Schule in den Ausbildungsmarkt, in denen die Bedeutsamkeit des
erreichten Bildungszertifikats für die berufliche Laufbahn gezeigt wurde (Protsch, 2014), sollte nicht nur die
Schulformzugehörigkeit, sondern das Zusammenspiel von Schulformzugehörigkeit und Schulabschluss untersucht werden.
Fragestellung
Ausgehend von diesen Befunden und unter Einbezug der unterschiedlichen disziplinären Perspektiven, geht der vorliegende
Beitrag der Frage nach, inwiefern sich akademische Selbsteinschätzungen und die Wahrnehmung von beruflicher Chancen(losigkeit) von Schülerinnen und Schülern mit gleichen individuellen Lernvoraussetzungen in Abhängigkeit ihrer
Schulformzugehörigkeit und ihres voraussichtlichen Schulabschlusses voneinander unterscheiden. Fokussiert wird dabei auf die
nichtgymnasialen Schulformen Hauptschule, Realschule und Gesamtschule, da an diesen Schulformen in dem von uns
fokussierten Schulsystem gleichermaßen der Hauptschul- und der Realschulabschluss erworben werden kann.
Methode
Aufgrund der großen Unterschiede in der konkreten Ausgestaltung der Schulformen zwischen den Bundesländern und der
regionalen Unterschiede in der Arbeitsmarktsituation, wird die empirische Analyse auf das Bundesland Berlin begrenzt. Als
Datenbasis dienten Fragebogenangaben von gut 1100 Schülerinnen und Schüler der 10. Jahrgangstufe im alten Schulsystem
vor der Berliner Schulstrukturreform. Dies bietet in besonderer Weise die Möglichkeit, Schulform und Schulabschlüsse zu
differenzieren. Verwendet wird der Schulabschluss, der voraussichtlich erreicht wird. Als abhängige Variablen dienen das
Fähigkeitsselbstkonzept sowie verschiedene Einschätzungen beruflicher Chancen. Unter Kontrolle differenzieller
Lernvoraussetzungen (z.B. Testleistung, sozialer Hintergrund) wurden sechs Gruppen von Schülerinnen und Schülern
miteinander verglichen: Hauptschulabschluss auf Hauptschule (Referenzkategorie), Hauptschulabschluss auf Realschule,
Hauptschulabschluss auf Gesamtschule, Realschulabschluss auf Hauptschule, Realschulabschluss auf Realschule und.
Realschulabschluss auf Gesamtschule. Die Gruppenzugehörigkeit wurde dabei in Form von Dummy-Variablen in lineare
Regressionen aufgenommen.
Ergebnisse
In Bezug auf das Fähigkeitsselbstkonzept zeigten sich keine Unterschiede zwischen den Gruppen. Die generellen Chancen mit
einem Hauptschulabschluss einen Ausbildungsplatz zu finden schätzten Jugendliche mit Realschulabschluss auf Real- und
Gesamtschulen als schlechter ein als Schülerinnen und Schüler mit Realschulabschluss auf Hauptschulen sowie diejenigen mit
Hauptschulabschluss auf allen Schulformen. Gleichzeitig schätzten jedoch nur die Schülerinnen und Schüler mit angestrebtem
Hauptschulabschluss auf Haupt- und Gesamtschulen ihre eigene Chance einen Ausbildungsplatz zu finden als geringer ein als
die anderen Gruppen. Bezüglich der Einschätzung der eigenen Qualifikationen bei der Ausbildungsplatzsuche waren es die
Schülerinnen und Schüler mit Realschulabschluss auf Gesamtschulen, die positiv von den anderen Jugendlichen abwichen. Die
Befunde zeigen das komplexe Wechselspiel zwischen Schulformzugehörigkeit und Schulabschluss und machen zudem deutlich,
wie wichtig es ist, die Untersuchung der Selbsteinschätzungen von Jugendlichen nicht allein auf Fähigkeitsselbstkonzepte zu
beschränken, sondern auf der Basis verschiedener disziplinärer Perspektiven um weitere Dimensionen zu ergänzen.
Selbstüberschätzung als Prädiktor für akademische Leistung: Ein interpersoneller Ansatz zur
Modellierung der Akkuratheit von Fähigkeitsselbsteinschätzungen
Thomas Lösch1, Oliver Lüdtke2, Alexander Robitzsch3, Augustin Keleva1, Benjamin Nagengast1, Ulrich Trautwein1
1
Eberhard Karls Universität Tübingen, 2IPN / ZIB, 3IPN
Theoretischer Hintergrund
Prominente Theorien der pädagogischen Psychologie kommen zu widersprüchlichen Vorhersagen zu dem Effekt von
Selbstüberschätzung: Überschätzung sollte entweder förderlich (z.B. Ryan & Deci, 2000; Wigfield & Eccles, 2000) oder hinderlich
(z.B. Alexander, 2013; de Bruin & van Gog, 2012) für schulische Leistung sein.
Studien unterscheiden sich jedoch in der Operationalisierung der Selbstüberschätzung. Selbstüberschätzung als sozialer
Vergleich basiert nur auf Selbsteinschätzungen und vernachlässigt tatsächliche Leistungen (Blanton, Buunk, Gibbons, & Kuyper,
1999). Selbstüberschätzung als Selbsteinsicht verrechnet eine Selbsteinschätzung mit einer objektiven Leistung, vernachlässigt
dabei aber individuelle Antworttendenzen (Chiu & Klassen, 2010)
Der interpersonelle Ansatz (Kwan, John, Kenny, Bond, & Robins, 2004) berücksichtigt beide Perspektiven für die Erfassung der
Selbstüberschätzung. Durch die Verwendung eines Round-Robin-Designs (d.h. alle Schülerinnen und Schüler einer Klasse
beurteilen sich gegenseitig) kann die Selbsteinschätzung der eigenen Fähigkeiten in mehrere Komponenten zerlegt werden. Der
Perceiver Effekt repräsentiert eine individuelle Beurteilungstendenz. Der Target Effekt erfasst dagegen, wie eine einzelne
Schülerin bzw. ein einzelner Schüler von Mitschülern bewertet wird. Eine Selbsteinschätzung, die von der gewichteten Summe
von Target und Perceiver Effekt abweicht, kann als Selbstüberschätzung bzw. Selbstunterschätzung verstanden werden.
Fragestellung
Erstens ist zu klären, inwieweit die Überschätzungsmaße des sozialen Vergleichs mit dem Target Effekt, bzw. inwieweit
Selbsteinsicht mit dem Perceiver Effekt konfundiert sind (siehe Kwan et al. (2004). Zweitens soll geklärt werden, wie
Selbstüberschätzung querschnittlich und längsschnittlich mit Leistung (Note und Leistungstest) korreliert.
Methode
Die vorliegende Studie verwendet als Datenbasis die TRAIN Studie (Jonkmann et al., 2013) und berücksichtigt die ersten beiden
Messzeitpunkte (t1 und t2) von zwei Kohorten der Mittelschule in Sachsen. Die Stichprobe bestand aus 1.549 Schülerinnen und
Schülern in 46 fünften Klassen (46.33 % weiblich, mittleres Alter 11.11, SD = 0.54) und 41 achten Klassen (47.06 % weiblich,
mittleres Alter 14.30, SD = 0.65).
Das zentrale Maß der Studie waren interpersonelle Kompetenzeinschätzungen in Mathematik zu t1: In jeder Klasse
beantworteten Schülerinnen und Schüler das Item „Dieser Schüler ist gut in Mathematik“ für alle anderen Mitschüler und sich
selbst auf einer siebenstufigen Skala. Die Selbsteinschätzung wurde als Maß des Fähigkeitsselbstkonzepts verwendet. Als
Leistungsmaße wurden standardisierte Testleistungen sowie Zeugnisnoten zu beiden Messzeitpunkten erfasst.
Drei Maße der Selbstüberschätzung wurden verglichen. Selbsteinsicht war die Differenz zwischen standardisiertem
Selbstkonzept und standardisierter Leistung zu t1 (Chiu & Klassen, 2010). Sozialer Vergleich war das Residuum der Regression
vom Selbstkonzept auf den Perceiver Effekt (Blanton et al., 1999). Interpersonelle Überschätzung war das Residuum der
Regression vom Selbstkonzept auf Perceiver Effekt und Target Effekt (Kwan et al., 2004). Target Effekt und Perceiver Effekt
wurden mit Hilfe von Bayes-Verfahren geschätzt (Lüdtke, Robitzsch, Kenny, & Trautwein, 2013).
Zur Klärung der querschnittlichen Zusammenhänge der Überschätzungsmaße mit Target- und Perceiver-Effekten sowie Leistung
wurden bivariate Korrelationen berechnet. Der längsschnittliche Effekt wurde durch Regressionsmodelle bestimmt, wobei jeweils
die Leistung zu t2 – unter Kontrolle der Leistung zu t1– durch die Überschätzung vorhergesagt wurde.
Ergebnisse
Für die erste Forschungsfrage zeigte sich, dass die Überschätzungsmaße des sozialen Vergleichs und der Selbsteinsicht
konfundiert waren (siehe Kwan et al., 2004). Um Selbstüberschätzung unkonfundiert von Leistung und Antworttendenzen zu
erfassen, schien der interpersonelle Ansatz daher geeignet zu sein.
Interessanterweise unterschied sich je nach verwendetem Maß der Zusammenhang zwischen Leistung und Überschätzung.
Während der soziale Vergleich positiv mit Leistung korrelierte, zeigte sich ein negativer Zusammenhang der Selbsteinsicht mit
Leistung. Die interpersonelle Überschätzung korrelierte positiv mit Leistung, d.h. eher kompetente Schülerinnen und Schüler
überschätzten sich mehr.
In der Vorhersage der Leistungsentwicklung zeigte sich ein kleiner, positiver Effekt der interpersonellen Überschätzung, d.h.
Überschätzung schien eher förderlich für die Leistungsentwicklung zu sein.
Insgesamt lieferte die vorliegende Studie zwei zentrale Ergebnisse. Zum einen machte sie deutlich, dass sich verschiedene
Überschätzungsmaße hinsichtlich zentraler Korrelate unterschieden. Zum anderen zeigte sich in der Studie ein positiver Effekt
für die mittels des interpersonellen Ansatzes erfasste Überschätzung auf die Leistungsentwicklung.
ID: 415
Symposium
Disziplinen-Cluster: Didaktiken der Naturwissenschaften und Technik, Lehrerbildung
Thematisches Cluster: Lehrer(aus)bildung, Trainings- und Evaluationsforschung, Unterrichtsentwicklung/ Unterrichtsqualität
Stichworte: Kommunikation, Interaktion, (Fach)Sprach, Video, Lehreraus- und fortbildung
Kommunikation, Argumentation und (Fach)Sprache: Videoeinsatz zur Erfassung von Interaktionen in
formalen Lernsettings
Chair(s): Ann-Kathrin Schindler (Technische Universität München)
Diskutant(en): Dominik Leiss (Leuphana Universität Lüneburg)
Eine Lehrkraft ist im Rahmen ihrer Profession von formalen Lernsettings in zweierlei Hinsicht umgeben: Zum einen ist sie als
Lehrender im Unterricht tätig, in welchem ihre Schülerinnen und Schüler die Nutzer des formalen Lernsettings Klassenzimmer
sind. Zum anderen besucht sie selbst als Lernender im Rahmen der Aus- und fortbildung das formale Lernsetting Hochschule.
Im Verständnis des lebenslangen Lernens sowie einer gelungenen Theorie-Praxis-Verzahnung (Gröschner, 2014) spielen beide
Lernsettings eine zentrale Rolle. Während im Lehramtsstudium das Lernsetting Hochschule dominierend ist und angereichert
wird durch schulpraktische Erfahrungen, ist im späteren Beruf das Klassenzimmer das zentrale Setting und (meist freiwillige)
Fortbildungen an der Hochschule dienen Lehrkräften als weiterbildendes Lernsetting.
Beide Lernsettings sind in hohem Maße von Interaktionen, Kommunikation und der Verwendung von (Fach)Sprache geprägt. Im
Klassenzimmer von Interaktionen mit Schülerinnen und Schülern, in der Hochschule von Interaktionen mit Peers und Mentoren.
Das Symposium will eine Synergie schaffen, zwischen Lernsettings, in welchen (angehende) Lehrkräfte selbst als Lernende
agieren (Beitrag 1, 2 und 4), und Lernsettings, in welchen die Schülerinnen und Schüler die Rolle der Lernenden einnehmen
(Beitrag 3 und 4). Alle Beiträge setzen dabei das Instrument Video ein, um Interaktionen, Kommunikation und (Fach)Sprache der
beteiligten Akteure zu erfassen (Beitrag 1, 3 und 4) beziehungsweise nutzen Video, um Interaktion und Kommunikation unter
den Lernenden anzuregen (Beitrag 2 und 4). Des Weiteren thematisieren alle Beiträge die Bedeutung von Interaktion,
Kommunikation und (Fach)Sprache für unterrichtliches Handeln und die Wichtigkeit (angehende) Lehrkräfte im Erwerb
diesbezüglicher Kompetenzen zu unterstützen.
Beitrag 1: Der erste Beitrag stellt ein Training im Lernsetting Hochschule vor, in welchem angehende Lehrkräfte über die
Bewertung und argumentativen Nutzen von Evidenz lernen. Die Experimentalgruppe zeigte eine signifikante Steigerung in ihrer
Bewertungs- und Argumentationskompetenz im Rahmen videographierter Gruppendiskussionen.
Beitrag 2: Im zweiten Beitrag wird untersucht, inwiefern angehende Lehrkräfte soziale Interaktionen im Rahmen einer
Mentoringsituation in Abhängigkeit davon wahrnehmen, ob ein Eigenvideo einer unterrichteten Lesestunde als Grundlage für die
Interaktion mit ihrem Mentor diente. Der Beitrag diskutiert, wie der Einsatz von Video im Lernsetting Hochschule Interaktionen
zwischen Mentor und Mentee unterstützt.
Beitrag 3: Der dritte Beitrag untersucht den Umgang mit Fachsprache im Chemieunterricht und liefert damit eine Betrachtung von
Interaktionen im Lernsetting Klassenzimmer aus fachdidaktischer Perspektive. Die Konstruktion und Evaluation des
Kodiermanuals werden diskutiert.
Beitrag 4: Der abschließende Beitrag stellt Befunde einer videobasierten Fortbildung zur produktiven Unterrichtskommunikation
vor. Neben Ergebnissen zur signifikanten Verbesserung der Interventionsgruppen werden individuelle Entwicklungsverläufe der
Lehrkräfte diskutiert und Implikationen bezüglich effektiver Fortbildungsangebote abgeleitet.
Beitrag 5: Diskussion
Beiträge des Symposiums
Training der Kompetenz angehender Lehrkräfte zur Bewertung und argumentativen Nutzung von Evidenz
Sandra Wenglein, Johannes Bauer, Manfred Prenzel
Technische Universität München
Theoretischer Hintergrund
Das Prinzip des evidenzbasierten Handelns, sowie das argumentative Nutzen von Evidenz, spielt im Bildungswesen eine immer
größere Rolle (Fischer et al. 2014; Wiseman, 2010). Der Praxistransfer hat jedoch bisher in vielen Bereichen nicht, oder nur
unzureichend, stattgefunden. Gerade Lehrkräfte begründen ihr Handeln kaum auf Grundlage wissenschaftlicher Evidenz
(Hetmanek et al., 2015; Williams & Coles, 2007), obwohl dies in den Standards für Lehrerbildung gefordert wird (KMK, 2004).
Ein möglicher Grund dafür ist, dass die Kompetenz zur Bewertung und Nutzung bildungswissenschaftlicher Evidenz im
Lehramtsstudium in der Regel kaum systematisch gefördert wird.
Im Anschluss an diese Entwicklungen wurde ein Training für Lehramtsstudierende zum kompetenten Umgang mit Evidenz
entwickelt. Die Grundidee dieses Trainings besteht darin, innerhalb kurzer Zeit in kooperativen Lernsettings (Gräsel, 2006; Collins
et al, 1989) Heuristiken zu zwei Teilkompetenzen zu vermitteln: (a) zur Bewertung und (b) zur argumentativen Nutzen von
Evidenz.
Die Heuristiken zur kritischen Bewertung von Evidenz haben zum Ziel den Studierenden kognitive Strategien zu vermitteln, mit
denen sie die komplexe Aufgabe der Bewertung von Evidenz auch mit geringem Vorwissen bewältigen können (Abelson, 1995;
Elsevier, 2014). Die Heuristiken zum Argumentativen Nutzen von Evidenz beruhen auf Schemata nach Kuhn (1997) und Toulmin
(1996).
Fragestellungen
Ziel der vorliegenden Studie war es, erste Erkenntnisse zu Trainierbarkeit und Nützlichkeit der vermittelten Heuristiken zu
gewinnen. Konkret fokussiert die Studie drei Fragestellungen:
(a) Wie manifestieren sich die erlernten Heuristiken in Gruppendiskussionen und in den schriftlichen Statements während des
Trainings und führt ihre Nutzung zu einer gesteigerten Qualität der Argumentation?
(b) Gelingt der Transfer der Heuristiken aus dem kooperativen Setting (Gruppendiskussion) während des Trainings auf eine
nachfolgende Situation, in der Evidenz individuell bewertet und genutzt werden muss, und lässt sich hier eine Konsistenz in der
Argumentationsqualität feststellen?
(c) Welche Rolle spielen hierfür das wissenschaftstheoretische Vorwissen der Teilnehmenden, die Fachausrichtung, die
Überzeugungen und die Ambiguitätstoleranz der Studierenden?
Methode und Design
Zur Beantwortung der Fragestellung wurde ein 2x2 Experiment (randomisierter Faktor Training vs. Kontrollgruppe, beobachteter
Faktor Fächerkombination: natur- vs. geisteswissenschaftlich) mit _N_ = 167 Lehramtsstudierenden durchgeführt. Analysiert
wurden videografierte Gruppendiskussionen sowie ein auf Fallvignetten basierendes, schriftliches Testinstrument (Wilson, 2005;
Heininger, 2013). Zur Auswertung diente ein in Anlehnung an bestehende Instrumente entwickeltes Kategoriensystem (Kuhn,
1997; Wilson, 2005; Bell, 2010; Felton & Kuhn, 2011). Mit Hilfe dieses Kategoriensystems werteten zwei Rater unabhängig
voneinander sowohl die Gruppendiskussionen als auch die schriftlichen Statements aus (mittlere Interrater-Reliabilität ICC = .87,
Range .70 - .97).
Zudem wurden über Fragebögen Prozess- und Akzeptanzdaten erfasst, die eine zusätzliche Einschätzung der ablaufenden
Lernprozesse und Wirkungen des Trainings erlauben. Als relevante Hintergrundvariablen wurden insbesondere
epistemologische Überzeugungen, Überzeugungen zur Nutzung von Evidenz und die Ambiguitätstoleranz erfasst.
Ergebnisse
Die Ergebnisse zeigten einen großen Effekt des Trainings auf die Bewertungskompetenz (_d_ = 1.55; _p_ < .001) und die
Argumentationskompetenz (_d_ = 1.36 ; _p_ < .001). Teilnehmer der Experimentalgruppe belegten ihr Argumente zudem
signifikant häufiger mit Evidenz (χ² (1) = 21.09; (_p_ = .006) hatten klarer aufgebaute Argumente (χ² (6)= 12.79; _p_ = .003) und
argumentierten häufiger dialektisch (χ² (1)= 4.63; _p_ = .031).
Die Ergebnisse sind über beide Teilkompetenzen und über beide (schriftliche) Statements auf der Individualebene konsistent
(ICC = .90). Die Konsistenz über alle Settings hinweg (schriftliche Statements und Gruppendiskussionen) liegt bei ICC = .54.
Erste Analysen zu Einflussvariablen auf beide Teilkompetenzen zeigen, dass der Fächerhintergrund keine signifikante
Auswirkung auf deren Ausprägung hat (β = .087; _p_ = .356).
Die vorliegende Studie erweitert damit den Stand der Forschung zu Voraussetzungen evidenzbasierter Praxis und zu effektiven
Designprinzipien von Fördermaßnahmen zum evidenzbasierten Argumentieren bei Lehramtsstudierenden.
Literatur
Abelson, Robert P. (1995). Statistics as principled argument. Hillsdale, NJ: Lawrence Erlbaum, pp. 12-14.
Bell, P. (2010). Scientific arguments as learning artifacts: designing for learning from the web with KIE. International Journal of
Science Education, 22, 797-817
Collins, A., Brown, J. S. & Newman, S. E. (1989). Cognitive apprenticeship: teaching the crafts of reading, writing, and
mathematics. In L. B. Resnick (Hrsg.), Knowing, learning and instruction (S. 453-494). Hillsdale, NJ: LEA.
Elsevier Reviewer Guidelines (2014). Verfügbar unter: http://www.elsevier.com/reviewers/reviewer-guidelines#editors-advice
Felton, M., Kuhn, D. (2001). The Development of Argumentive Discourse Skill. Discourse Processes, 32, 135-153
Fischer, F., Kollar, I., Ufer, S., Sodian, B. Hussmann, H., Pekrun, R., Neuhaus, B., Dorner, B. Pankofer, S., Fischer, M., Strijbos,
J., Heene, M., Eberle, J. (2014). Scientific Reasoning and Argumentation: Advancing an Interdisciplinary Research Agenda in
Education. Frontline learning Research (3), 1-18.
Gräsel, C. (2006). Gestaltung problemorientierter Lernumgebungen. In K. H. Arnold, U. Sandfuchs & J. Wiechmann (Hrsg.),
Handbuch Unterricht (S. 335-339). Bad Heilbrunn: Klinkhardt.
Hetmanek, A., Wecker, C., Gräsel, C., Kiesewetter, J., Trempler, K. Fischer, M.R., & Fischer,F. (2015). Ressourcen nutzen
Lehrkräfte wann? Eine Interviewstudie zur Schnittstelle zwischen Unterrichtsalltag und Wissenschaft, Unterrichtswissenschaft,
43 (3).
Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland. (2004). Standards für die Lehrerbildung:
Bildungswissenschaften (Beschluss der Kultusministerkonferenz vom 16.12.2004). Bonn: KMK, verfügbar unter
http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/ 2004_12_16-Standards-Lehrerbildung.pdf
Kuhn, D., Shaw, V., & Felton, M. (1997). Effects of dyadic interaction on argumentive reasoning. Cognition and Instruction, 15,
287–315.
Toulmin, S. (1996). Der Gebrauch von Argumenten. Weinheim: Beltz Athenäum
Williams, D. & Coles, L. (2007). Evidence-based practice in teaching: an information perspective. Journal of Documentation,
63(6), 812-835.
Wilson, M. (2005). Constructing measures. New York: Taylor & Francis.
Wiseman, A. W. (2010). The uses of evidence for educational policymaking: Global contexts and international trends. Review of
Research in Education, 34, 1-24.
Mentoring mit videographierten vs. beobachteten Unterrichtsstunden
Barbara Drechsel, Jana Roder
Otto-Friedrich-Universität Bamberg
Die Verschränkung von in der Lehrerausbildung erworbenem Wissen mit erfahrungsbasiertem Lernen in Praxisphasen während
des Studiums erhöht die Qualität der Ausbildung (Korthagen, 2010). Praxisphasen bieten die Möglichkeit, professionsbezogene
Theorien und Konzepte an der Schulwirklichkeit zu überprüfen sowie sich der eigenen Berufswahl zu vergewissern (Hascher,
2006). Entscheidend für den Erfolg von Praxisphasen ist die Qualität der Lernbegleitung (Gröschner et al., 2013), die eher selten
systematisch und häufig durch eine unzureichende Verknüpfung von Theorie und Praxis gekennzeichnet ist (Brouwer und
Korthagen, 2005). Um Bezüge zu relevantem Theoriewissen herzustellen, werden im Projekt LuPe (Leseförderung und
Praxiserfahrung) Hochschuldozentinnen als Mentoren eingesetzt, die auch die praxisvorbereitenden Kurse unterrichten. Diese
verfügen über theoriebezogenes Expertenwissen im Bereich Lesekompetenzförderung, das für den Erwerb von Kompetenzen in
der Praxis handlungsleitend ist (Borko & Mayfield, 1995). Im Gegensatz zum schulischen Mentoring durch Praxislehrkräfte
existiert hierzu bisher nur wenig Forschung (Arnold et al., 2014). Da sie die Unterrichtsversuche nicht „live“ beobachten können
sind universitäre Mentoren auf Werkzeuge wie die Videographie angewiesen, die ein großes Potenzial für die Ausbildung von
Lehrkräften birgt (Dalehefte & Kobarg, 2013, Krammer & Reusser, 2005, Stadler, 2005; Nitsche, 2014), das nur dann zum Tragen
kommt, wenn eine „aktiv-produktive“ (Vohle & Reinmann, 2012) Bearbeitung des Videomaterials in sozialer Interaktion ermöglicht
wird. Dieses vielversprechende Werkzeug kann jedoch nicht immer eingesetzt werden, da sich Studierende sowie Schülerinnen
und Schüler nicht immer mit dem Aufzeichnen von Unterrichtssequenzen einverstanden erklären. In diesen Fällen muss auf
teilnehmende Beobachtungen zurückgegriffen werden. Je nachdem, welches Medium zur Erfassung der Unterrichtsstunde zur
Verfügung steht, unterscheidet sich auch das Mentoring und es stellt sich die Frage, ob die Erfolge des Mentoring sich in
Abhängigkeit davon unterscheiden.
Der vorliegende Beitrag thematisiert folgende Fragen (1) Wie wirkt sich das Mentoring (Vorbesprechung,
Beobachtung/Videografie, Nachbesprechung) auf verschiedene lernrelevante Faktoren (z.B. Vorbereitungszeit, subjektiver
Lerngewinn, Zufriedenheit) bei Lehramtsstudierenden aus? (2) Unterscheiden sich diese Wirkungen in Abhängigkeit davon, ob
die begleitete Stunde beobachtet oder videographiert wurde?
Es wird angenommen, dass die universitäre Lernbegleitung bei den Studierenden fruchtbare Lernprozesse auslöst und somit bei
der mentorierten im Vergleich zu nicht mentorierten Lesestunden zwar die Arbeitsbelastung und die Vorbereitungszeit höher ist,
aber auch mehr positive Lernergebnisse erreicht werden. Die Befunde zu Vorteilen von Unterrichtsvideos legen die Vermutung
nahe, dass Studierende, deren Lesestunde videographiert wurde, zufriedener sind und den subjektiven Lerngewinn der
begleiteten Stunde höher einschätzen als ihre Kommilitoninnen und Kommilitonen, deren Stunden mittels teilnehmender
Beobachtung erfasst wurden.
Die Fragestellungen werden mittels Daten aus einem Theorie-Praxis-Seminar für Lehramtsstudierende zum Thema
Lesekompetenzförderung bearbeitet. Über die fünf Wochen der Praxisphase des Seminars führten 50 Studierende ein Logbuch
zur Reflexion und zur Vor- und Nachbereitung der Lesestunden. Eine der fünf Lesestunden wurde ausführlich mentoriert.
Angelehnt an das Fachspezifische Unterrichtscoaching (Staub & Kreis, 2013) untergliedert sich das Mentoring zu dieser Stunde
in drei Phasen: Die umfassende Vorbesprechung der Unterrichtseinheit, die in geteilter Verantwortung durchgeführte und
beobachtete Leseförderstunde und eine gemeinsame Nachbesprechung dieser Stunde.
Die Auswertungen von Logbucheinträgen und einer retrospektiven Fragebogenerhebung geben Hinweise zu Zufriedenheit und
Nutzen bezüglich des Mentoring und darauf, wie sich die lernrelevanten Faktoren zwischen der begleiteten und den nicht
begleiteten Lesestunden unterscheiden und (2) ob und wie sich diese Faktoren in Abhängigkeit davon unterscheiden, ob die
begleitete Lesestunde beobachtet oder videographiert wurde.
Aus den Ergebnissen werden Überlegungen für die Weiterentwicklung der universitären Lernbegleitung angestellt sowie
Schlussfolgerungen bezüglich des Einsatzes von Videofeedback im praktischen Teil des Seminars gezogen. Vor dem
Hintergrund der vorliegenden Befunde werden weitere Forschungsfragen diskutiert.
Literatur
Arnold, K.-H., Gröschner, A. & Hascher, T. (Hrsg.) (2014). Pedagogical field experiences in teacher education: theoretical
foundations, programmes, processes, and effects. Münster: Waxmann.
Borko, H. & Mayfield, V. (1995). The roles of the cooperating teacher and university supervisor in learning to teach. Teaching and
Teacher Education, 11, 501-518.
Brouwer, N. & Korthagen, F. (2005). Can Teacher Education Make a Difference? American Educational Research Journal, 42,
153-224.
Dalehefte, I.M. & Kobarg, M. (2013). Aus Unterrichtsbeobachtungen lernen. Publikation des Programms SINUS an Grundschulen.
Kiel: IPN.
Gröschner, A., Schmitt, C. & Seidel, T. (2013). Veränderung subjektiver Kompetenzeinschätzungen von Lehramtsstudierenden
im Praxissemester. Pädagogische Psychologie, 27 (1-2), 77-86.
Hascher, T. (2006). Veränderungen im Praktikum – Veränderungen durch das Praktikum. Zeitschrift für Pädagogik, 52 (51.
Beiheft), 130-148.
Korthagen, F.A.J. (2010). Situated learning theory and the pedagogy of teacher education: Towards an integrative view of teacher
behavior and teacher learning. Teaching and Teacher Education, 26, 98-106.
Krammer, K. & Reusser, K. (2005). Unterrichtsvideos als Medium der Aus- und Weiterbildung von Lehrpersonen. Beiträge zur
Lehrerbildung, 23 (1), 35-50.
Nitsche, Kai (2014): UNI-Klassen - Reflexion und Feedback über Unterricht in Videolabors an Schulen. Dissertation, LMU
München: Fakultät für Psychologie und Pädagogik.
Reusser, K. (2005). Situiertes Lernen mit Unterrichtsvideos. Journal für Lehrerinnen- und Lehrerbildung, 2, 8-18.
Stadler (2005). Intervention durch Forschung. Wege zur Unterstützung der Professionalisierung von Lehrkräften mittels Video.
In: M. Welzel & H. Stadler (Hrsg.). Nimm doch mal die Kamera! Zur Nutzung von Videos in der Lehrerbildung (S. 171-190).
Münster: Waxmann.
Staub, F.C. & Kreis, A. (2013). Fachspezifisches Unterrichtscoaching in der Aus- und Weiterbildung von Lehrpersonen. Journal
für LehrerInnenbildung, 2, 8-13.
Vohle, F. & Reinmann, G. (2012). Förderung professioneller Unterrichtskompetenz mit digitalen Medien: Lehren lernen durch
Videoannotation. In R.Schulz-Zander et al. (Hrsg.), Jahrbuch Medienpädagogik 9 ( S. 413-429). Wiesbaden: Springer.
Fachsprache im Chemieunterricht
Holger Tröger1, Elke Sumfleth1, Oliver Tepner2
1
Universität Duisburg-Essen, 2Universität Regensburg
Theoretischer Rahmen
Fachsprachen dienen dem sprachlichen Austausch von Informationen auf fachlicher Ebene (Rincke, 2007). Das Lernen von
Sprache und Fachsprache ist dabei untrennbar mit dem Lernen im Fach verbunden (Merzyn, 2008) und sowohl erklärtes Ziel
schulischer Bildung im Unterrichtsfach Chemie (KMK, 2005; Ministerium für Schule und Weiterbildung des Landes NordrheinWestfalen, 2014) als auch Gegenstand chemiedidaktischer Forschung (z.B. Busch & Ralle, 2011; Özcan, 2013; SchmölzerEibinger, 2013).
Dieser Symposiumsbeitrag fokussiert auf die Entwicklung, Evaluation und praktische Anwendung eines hoch-inferenten
Videokodiermanuals zum Umgang mit Fachsprache im Chemieunterricht, das im Rahmen des Projekts ProwiN
(Professionswissen in den Na-turwissenschaften) entwickelt wurde (Tröger, Sumfleth & Tepner, 2015).
Videokodiermanual zur Analyse von Fachsprache im Chemieunterricht
_Konstruktion_
Das hoch-inferente Kodiermanual dient der turnbasierten Detailanalyse der Tiefenstruktur des transkribierten
Unterrichtsgesprächs und berücksichtigt die sprachliche und inhaltliche Ebene der unterrichtlichen Äußerungen.
Auf sprachlicher Ebene wird die Äußerung hinsichtlich ihrer medialen Repräsentationsform (mündliche oder schriftliche
Äußerung), ihrem Anlass (Beitrag, Frage, Aufgreifen einer anderen Äußerung) sowie ihrer strukturellen Komplexität untersucht.
Die Analyse der strukturellen Komplexität erfolgt in Anlehnung an die Operationalisierung inhaltlicher Komplexität als
schwierigkeitsbestimmende Dimension von Aufgaben, wie sie z.B. im ESNaS Projekt (Kauertz, Fischer, Mayer, Sumfleth &
Walpuski, 2010) vorgenommen wurde. Dabei wird zwischen Äußerungen unterschieden, die nur aus einzelnen Wörtern, ganzen
Sätzen oder miteinander verbundenen Sätzen bestehen. Weiterhin wird differenziert, ob diese Kodiereinheiten alltagssprachliche
Begriffe, allgemein-wissenschaftssprachliche Begriffe und/oder Fachbegriffe enthalten.
Auf inhaltlicher Ebene werden Äußerungen hinsichtlich ihrer inhaltlichen Komplexität und ihrer fachlichen Korrektheit beurteilt.
_Evaluation_
Zur Evaluation des Videokodiermanuals wurden zehn vorliegende und turnbasiert transkribierte Unterrichtsvideos aus einer
vorherigen Videostudie (Walpuski et al., 2012) von zwei Beobachtern unabhängig voneinander auf Grundlage des Manuals
kodiert. Die durchschnittliche Interrater-Übereinstimmung (Kappa = .88) ist sehr gut und variiert je nach Kategorie zwischen
Kappa = 1.0 und Kappa = .72. Auf Grundlage der quantitativen Auswertung der Evaluation kann das Manual als geeignet
betrachtet werden, Fachsprachenhandlungen im Unterricht zu erfassen. Eine qualitative Analyse des Kodier-manuals konnte
überdies zeigen, dass eine Analyse der Fachsprache die Unterscheidung zwischen fachsprachlicher und fachlicher Richtigkeit
erforderlich macht; beispielsweise ist die Aussage eines Schülers „Salzsäure ist HCl“ zwar fachlich falsch, da „HCl“ nicht
Salzsäure „ist“ sondern als Formelzeichen Salzsäure symbolisiert, wird aber oftmals von der Lehrkraft als fachlich richtig
akzeptiert. Die Abkürzung des Wortes mit der Summenformel kann beispielsweise in der Ökonomie gesprochener Sprache
begründet sein. Durch die Einführung der Unterscheidung von fachsprachlicher und fachlicher Richtigkeit wird solchen Fällen
Rechnung getragen und die an sich falsche Aussage eines Schülers kann als fachsprachlich falsch aber fachlich korrekt gewertet
werden. Die Unterteilung stößt an ihre Grenzen, wenn die fachsprachliche Inkorrektheit auch eine fachliche Inkorrektheit mit
bedingt. In diesem Falle wäre die Aussage sowohl fachlich als auch fachsprachlich falsch. Dieses Beispiel zeigt bereits die hohe
Inferenz der Beschreibung fachsprachlicher Aussagen auf.
Anwendungsbereich und Ausblick
Das Kodiermanual wird verwendet, um den Zusammenhang zwischen der Lernleistung von Schülerinnen und Schülern und dem
Umgang ihrer Lehrkraft mit Fachsprache im Unterricht analysieren zu können. Zu diesem Zweck wurde in den Schuljahren 2014
und 2015 der Unterricht von 29 Lehrkräften an bayrischen und nordrhein-westfälischen Gymnasien videografiert. In der 8.
Jahrgangsstufe wurden von jeder Lehrkraft zwei aufeinanderfolgende Unterrichtsstunden zum Thema Atombau und
Periodensystem der Elemente aufgezeichnet und analysiert. Diese Erhebung wurde von schriftlichen Testinstrumenten zur
Erfassung des Fachwissens der Schülerinnen und Schüler sowie des theoriebasierten fachdidaktischen Wissens der Lehrkräfte
zum Umgang mit Fachsprache begleitet (Strübe, Tröger, Tepner & Sumfleth, 2014).
Der Beitrag stellt die Entwicklung und Evaluation des hoch-inferenten Kodiermanuals zum Umgang mit Fachsprache im
Chemieunterricht detailliert vor und thematisiert Vor- und Nachteile sowie Herausforderungen der Untersuchungsmethode.
Darüber hinaus werden quantitative und qualitative Ergebnisse der Videoanalysen der ProwiN-Stichprobe vorgestellt.
Literatur
Busch, H. & Ralle, B. (2011). Fachbegriffe und ihre Bedeutung. Diagnose fachsprachlicher Kompetenz. NiU Chemie, 22(124/125),
52-55.
Kauertz, A., Fischer, H. E., Mayer, J., Sumfleth, E. & Walpuski, M. (2010). Standardbezogene Kompetenzmodellierung in den
naturwissenschaftlichen Fächern der Sekundarstufe I. Zeitschrift für Didaktik der Naturwissenschaften, 16, 155-166.
KMK / Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (Hrsg.). (2005).
Bildungsstandards im Fach Chemie für den Mittleren Schulabschluss (Jahrgangsstufe 10). München: Luchterhand.
Merzyn, G. (2008). Sprache und Chemie lernen. Naturwissenschaften im Unterricht, 19(106/107), 94–97.
Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (Hrsg.). (2014). Kernlehrplan für die Sekundarstufe
II Gymnasium/Gesamtschule in Nordrhein-Westfalen. Chemie. Düsseldorf.
Özcan, N. (2013). Zum Einfluss der Fahsprache auf die Leistung im Fach Chemie: eine Förderstudie zur Fachsprache im
Chemieunterricht. Berlin: Logos.
Rincke, K. (2007). Sprachentwicklung und Fachlernen im Mechanikunterricht: Sprache und Kommunikation bei der Einführung
in den Kraftbegriff. Berlin: Logos.
Schmölzer-Eibinger. (2013). Sprache als Medium des Lernens im Fach. In M. Becker-Mrotzek (Hrsg.), Sprache im Fach.
Sprachlichkeit und fachliches Lernen (S. 25-41). Münster: Waxmann.
Strübe, M., Tröger, H., Tepner, O. & Sumfleth, E. (2014). Development of a Pedagogical Content Knowledge test of chemistry
language and models. Educatión Química, 25(3), 380-390.
Tröger, H., Sumfleth, E. & Tepner, O. (2015). Der Umgang von Chemielehrkräften mit Fachsprache und Schülerfehlern. In S.
Bernholt (Hrsg.), Heterogenität und Diversität - Vielfalt der Voraussetzungen im naturwissenschaftlichen Unterricht. Gesellschaft
für Didaktik der Chemie und Physik, Jahrestagung in Bremen 2014 (S. 498-500). Kiel: IPN.
Walpuski, M., Tepner, O., Sumfleth, E., Dollny, S., Hostenbach, J. & Pollender, T. (2012). Multiple perspectives on students'
scientific communication & reasoning in chemistry education : VISIONS 2011: Teaching. Acta Didactica Norge, 6(1).
Veränderungen in der Unterrichtskommunikation von Lehrkräften: Befunde einer videobasierten
Interventionsstudie
Alexander Gröschner1, Ann-Kathrin Schindler2, Tina Seidel2
1
Universität Paderborn, 2Technische Universität München
Theoretischer Hintergrund
Unterrichtskommunikation ist ein bedeutsames Element erfolgreicher Lehr- und Lernprozesse. Empirische Studien für den
mathematisch-naturwissenschaftlichen Unterricht zeigen, dass in Deutschland eine enggeführte, lehrerzentrierte
Klassengesprächsführung vorliegt (Jurik, Gröschner, & Seidel, 2013). Diese Engführung wirkt sich wiederum negativ auf das
Lernen der Schülerinnen und Schüler aus (Lipowsky et al., 2007). Demgegenüber zeigen lernwirksame Aktivitäten einer
produktiven Klassengesprächsführung (Walshaw & Anthony, 2008) positive Effekte u.a. auf die Schülermotivation (Kiemer et al.,
2015). Offen ist, inwiefern Lehrkräfte ihre Unterrichtskommunikation tatsächlich im Unterricht im Rahmen einer videobasierten
Fortbildung verändern.
Studien zum Lernen von Lehrkräften in Fortbildungen deuten darauf hin, dass Lehrkräfte sehr unterschiedliche Lernerträge aus
Fortbildungen erzielen und diesbezüglich individuelle Lernerfahrungen eine bedeutsame Rolle für den Lerntransfer von
Fortbildungen für die Gestaltung unterrichtlicher Praxis darstellen (Kazemi & Hubbard, 2008). Die vorliegende Studie hatte
demnach zum Ziel, Effekte einer videobasierten Fortbildung auf die unterrichtliche Gesprächsführung der Lehrkräfte zu
untersuchen sowie mögliche individuelle Unterschiede im Lernen der Lehrkräfte aufzudecken. Die Forschungsfragen lauteten:
1. Inwiefern verändern Lehrkräfte in der Interventionsgruppe (IG) ihre Unterrichtskommunikation zugunsten einer lernwirksamen
Klassengesprächsführung gegenüber Lehrkräften in der Kontrollgruppe (KG) vom prä- zum post-Messzeitpunkt?
2. Inwiefern unterscheiden sich die Lehrkräfte der Interventionsgruppe (IG) untereinander hinsichtlich lernwirksamer Aktivitäten
der Klassengesprächsführung unter Berücksichtigung von vier Messzeitpunkten?
Methode
Im Rahmen der Studie nahmen sechs Lehrkräfte an einer videobasierten Fortbildung, dem „Dialogischen Videozirkel“ (DVZ,
Gröschner et al., 2015) teil, während vier Lehrkräfte 2-3 eher „klassische“ Ein-Tages-Workshops zum Thema besuchten sowie
zweimal an Rundgesprächen mit dem Fortbildungsleiter des DVZ ihre Erfahrungen der Workshops austauschten. Der DVZ
besteht aus drei Workshops (Unterrichtsplanung, Reflexion 1 und 2) und einer videografierten Unterrichtsstunde. Er wurde im
Schuljahr 11/12 zweimal angeboten. Das Fortbildungsangebot in der IG (DVZ) und KG betrug gleichermaßen jeweils 22 Stunden.
In der IG und KG wurde zudem jeweils eine Unterrichtsstunde am Schuljahresanfang sowie -ende videografiert (_N_ Videos
total=32). Die Auswertungen der Frage 1 beziehen sich auf diesen prä-post-Vergleich (= 20 Videos). Für Frage 2 wurden
zusätzlich die videografierten Stunden des DVZ 1 und DVZ 2 ausgewertet. Die Analysen basierten auf einem hochinferten
Ratingschema (Pehmer, Kiemer ,& Gröschner, 2014), das von zwei unabhängigen Beoachtern bearbeitet wurde (ICCs=.77 bis
.91). Eingeschätzt wurden vier Skalen mit jeweils vier Items (α= .75 bis .90): Schülerbeteiligung; Vernetzung von
Schülerbeiträgen; Unterstützung von Schülerideen und Lehrerfeedback.
Ergebnisse
Hinsichtlich Forschungsfrage 1 zeigten sich mittels non-parametrischer Varianzanalyse (Noguchi et al., 2012) signifikante
Unterschiede in allen untersuchten Dimensionen der Unterrichtskommunikation: in der Schülerbeteiligung (_F_=5.56; _df_=1;
_p_=.02), in der Vernetzung von Schülerbeiträgen (_F_=4.90; _df_=1; _p_=.03), im Umgang mit Schülerideen (_F_=11.76;
_df_=1; _p_=.00) sowie im Lehrerfeedback (_F_=11.82; _df_=1; _p_=.00). Friedman-Tests deuten in Bezug auf die zweite
Forschungsfrage auf sehr individuelle Lernverläufe der Lehrkräfte in der IG hin, die jedoch nur in der Skala Umgang mit
Schülerideen (χ2=8.79; _df_=3; _p_=.03) signifikant werden.
Zusammenfassend weist die Studie auf die Wirksamkeit einer videobasierten Fortbildung zur Förderung der produktiven
Unterrichtskommunikation hin. Zugleich deuten die individuellen Unterschiede in den Veränderungen der Lehrkräfte auf den
Bedarf gezielter Transferangebote hin, um Fortbildungen effektiv zu gestalten.
Literatur
Gröschner, A., Seidel, T., Kiemer, K. & Pehmer, A.-K. (2015). Through the lens of teacher professional development components:
the "Dialogic Video Cycle" as an innovative program to foster classroom dialogue. Professional Development in Education, 41(4),
729–756.
Kazemi, E. & Hubbard, A. (2008). New Directions for the Design and Study of Professional Development: Attending to the
Coevolution of Teachers’ Participation Across Contexts. Journal of Teacher Education, 59(5), 428–441.
Kiemer, K., Gröschner, A., Pehmer, A.-K. & Seidel, T. (2015). Effects of a classroom discourse intervention on teachers’ practice
and students’ motivation to learn mathematics and science. Learning and Instruction, 35(2), 94–103
Jurik, V., Gröschner, A., & Seidel, T. (2013). How student characteristics affect girls' and
boys' verbal engagement in physics instruction. Learning and Instruction, 23, 33–42.
Lipowsky, F., Rakoczy, K., Pauli, C., Reusser, K. & Klieme, E. (2007). Gleicher Unterricht -gleiche Chancen für alle? Die
Verteilung von Schülerbeiträgen im Klassenunterricht. Unterrichtswissenschaft, 35(2), 125–147.
Noguchi, K., Gel, Y. R., Brunner, E., & Konietschke, F. (2012). nparLD: An R software package for the nonparametric analysis of
longitudinal data in factorial experiments. Journal of Statistical Software, 50(12), 1–23.
Pehmer, A.-K., Kiemer, K., & Gröschner, A. (2014). Productive teacher-student interactions: A coding scheme for productive
dialogue during whole class and small group conversation. Munich: TUM School of Education.
Walshaw, M., & Anthony, G. (2008). The teacher's role in classroom discourse: A review of recent research into mathematics
classrooms. Review of Educational Research, 78(3), 516–551.
ID: 425
Symposium
Disziplinen-Cluster: Wirtschafts- und Berufspädagogik
Thematisches Cluster: Berufliche Bildung, Kompetenzdiagnostik/ Kompetenzentwicklung
Stichworte: Berufsbildung; Kompetenzdiagnostik; Heterogenität; Differential Item Functioning
Kompetenzdiagnostik in der Berufsbildung bei heterogenen Schülergruppen und Testformaten
Chair(s): Christian Spoden (Friedrich-Schiller-Universität Jena)
Diskutant(en): Andreas Rausch (Otto-Friedrich-Universität Bamberg)
Die Kompetenzdiagnostik hat in den letzten Jahren ihre eigenständige Bedeutung in Abgrenzung zu verwandten Konzepten der
empirischen Bildungsforschung nachgewiesen (Wilhelm & Nickolaus, 2013). Dies gilt auch für die Kompetenzdiagnostik in der
Berufsbildung, wenngleich einige Entwicklungsstränge aufgrund besonderer Anforderungen hier leicht verzögert eingesetzt
haben. So ist der Kompetenzkanon in der Berufsbildung mit allgemeinen, berufsübergreifend arbeitsbezogenen und
fachbezogenen Kompetenzen umfangreicher und durch einen großen Entwicklungsbedarf hinsichtlich diagnostischer
Instrumente begleitet (vgl. Achtenhagen, 2007). Auch das Format der Testinstrumente ist in der Berufsbildung breiter gefächert
und beinhaltet häufiger auch computerisierte Test und berufspraktische Arbeitsproben (z. B. Gschwendtner, Abele & Nickolaus,
2009). Eine weitere Besonderheit der beruflichen Bildung ist die starke Heterogenität der Schülerschaft bezüglich
soziodemographischer Merkmale und schulischer Leistungsfähigkeit (Seeber, 2010; Ernst & Westhoff, 2011). Unterschiede in
Ausbildungskulturen oder Lerngelegenheiten tragen zudem nicht dazu bei, diese Heterogenität im Laufe der Ausbildung zu
reduzieren (vgl. Liedtke & Seeber, 2015).
Diesen Anforderungen steht eine etablierte Methodik auf Basis der Item-Response-Theory (de Ayala, 2009) gegenüber, welche
es ermöglicht, Kompetenzausprägungen der Schülerinnen und -schüler auf kontextuelle und situative Anforderungen
zurückzuführen (Hartig & Klieme, 2006). Ihr Einsatz in der Berufsbildung stellt die Anschlussfähigkeit an vorausgegangene
Studien im allgemeinen Bildungsbereich sicher, ermöglicht aber auch die Identifikation berufsspezifischer wie
berufsübergreifender Merkmale der Struktur- und Niveaukomponenten von Kompetenzmodellen (Seeber et al., 2010). Eine
zentrale Frage beim Einsatz IRT-basierter Methoden lautet allerdings, wie in den heterogenen Strukturen der Berufsbildung in
Bezug auf Kompetenzdomänen, Testformate und Personengruppen eine Vergleichbarkeit der Kompetenzausprägungen
sichergestellt und Benachteiligungen aufgrund soziodemographischer beziehungsweise bildungsbiographie-bezogener
Merkmale vorgebeugt werden kann.
Diese Frage wird in vier Einzelbeiträgen dieses Symposiums aus unterschiedlicher Perspektive analysiert, wobei alle Beiträge
die Bedeutung für die Berufsbildung herausarbeiten. Im Beitrag von Rudeloff wird aus einem wirtschaftspädagogischen
Blickwinkel ein Modell der Finanzkompetenz vorgestellt und dessen Messäquivalenz in verschiedenen Schülergruppen geprüft,
die aufgrund von Migrationsstatus, Geschlecht oder Bildungsherkunft unterschiedliche Lernvoraussetzungen mitbringen. Der
Beitrag von Bernhardt, Spoden und Frey interpretiert Messäquivalenzprüfungen aus psychometrischer Perspektive als Teil eines
umfangreicheren Qualitätssicherungsprozess zur Implementation eines CAT-Itempools und der Vorbereitung adaptiver
Testungen in den Kompetenzbereichen Lesen, Mathematik und Naturwissenschaften. Der Beitrag von Spoden et al. untersucht
Messäquivalenz zwischen Ausbildungsberufen in den zuvor genannten Kompetenzbereichen als Voraussetzung für faire
Leistungsvergleiche zwischen Berufsgruppen und strukturelle Analysen mit fachbezogenen Kompetenzen und plädiert dabei für
eine Verzahnung psychometrischer und inhaltlicher Analysen. Der Beitrag von Sangmeister, Winther und Klotz analysiert die
Messäquivalenz zwischen einer klassischen Paper-Pencil-Präsentation und einer computer-basierten Darbietung der Testitems
und diskutiert diagnostische Implikationen in der Erwachsenenbildung.
Beiträge des Symposiums
Finanzkompetenz von Jugendlichen: Eine Beurteilung der psychometrischen Qualität des eingesetzten
Testinstruments
Michelle Rudeloff
Georg-August-Universität Göttingen
Theoretischer Hintergrund: Heutzutage kommt der Finanzkompetenz eine wachsende Bedeutung zu (Habschick et al., 2003). So
ist diese nicht nur entscheidend für den effektiven Umgang mit Finanzdienstleistungen und das Verständnis geldpolitischer
Entscheidungen, sondern besitzt auch eine berufsqualifizierende Funktion (Reifner, 2003). Zudem spielt die Befähigung im
Umgang mit Geld und Finanzthemen nicht mehr nur für Erwachsene eine Rolle, sondern ist bereits für Jugendliche relevant
(OECD INFE, 2011). Speziell die Phase des Übergangs in die Sekundarstufe II stellt für die Jugendlichen eine Herausforderung
dar (Bender, 2012). Mehrheitlich wird in diesem Zeitraum die Volljährigkeit und damit die uneingeschränkte Geschäftsfähigkeit
erreicht, sodass an die Jugendlichen der Anspruch an eine angemessene und auf eine selbstverantwortete Lebensführung hin
ausgerichtete ökonomische Urteilsfähigkeit gestellt wird. So verdienen bspw. viele Jugendliche, die in die duale Berufsausbildung
einmünden, erstmals eigenes Geld und stehen vor der Herausforderung, mit ihren Einnahmen wirtschaften zu müssen. Vor
diesem Hintergrund werden Forderungen nach einer frühzeitigen Förderung der finanziellen Urteilsfähigkeit im Rahmen eines
schulischen Fächerkanons und Curriculums erhoben. Analysen der aktuellen Lehrpläne aller Bundesländer verdeutlichen jedoch,
dass die Vermittlung von Finanzkompetenz curricular nicht hinreichend verankert ist.
Aktuell kann auf eine Reihe von Studien zur Finanzkompetenz zurückgegriffen werden (Kaminski & Friebel, 2012). Werden diese
Studien unter einer forschungsmethodischen Perspektive verglichen, fällt bei der Überprüfung der eingesetzten Testinstrumente
auf, dass Aussagen zur empirischen Überprüfung der psychometrischen Qualität häufig fehlen (Aprea, 2012). Zudem wird die
Auswahl der Items oft nicht mit entsprechenden konzeptuellen Überlegungen begründet, obwohl die Domänenabgrenzung eine
entscheidende Voraussetzung für die Diagnose von Kompetenzen darstellt (Kaminski & Friebel, 2012; Winther, 2010). Trotz der
Kritik bleibt vor dem Hintergrund der Bildungsgerechtigkeit und Chancengleichheit zu berücksichtigen, dass als entscheidende
Determinanten finanzwirtschaftlicher Kompetenzen neben der Mathe- und Lesekompetenz der Jugendlichen (z. B. Rosendahl &
Straka, 2011) das Geschlecht, der Schulabschluss, die besuchte Schulform, die ethnische Zugehörigkeit sowie der Bildungsstand
der Eltern identifiziert werden konnten (z. B. Lusardi et al., 2009).
Fragestellung und Methode: Im Rahmen des Vortrags wird das Promotionsvorhaben „Informelles Lernen und Finanzkompetenz“
vorgestellt. Den Fokus bilden das Domänenmodell und das auf dessen Basis entwickelte Testinstrument, welches bei N=530
Schülern der Klassenstufe 10 unterschiedlicher Schulformen eingesetzt wurde, um die Finanzkompetenz zu erheben. Im
Vordergrund steht die Frage, ob der Test eine hinreichende psychometrische Qualität aufweist, um eine valide Erfassung der
Finanzkompetenz zu ermöglichen. Hierzu wurden auf Basis der Item Response Theorie die Itemparameter und Itemfitwerte
geprüft sowie Berechnungen zu Differential Item Functioning für das Geschlecht, die Bildungsherkunft, die Bildungsaspiration,
den Migrationshintergrund und die Schulform durchgeführt. Darüber hinaus erfolgten Analysen zur Dimensionalität des
Instruments. Des Weiteren wurden diskriminante Zusammenhangsanalysen (vgl. Bortz & Döring, 2006) zwischen der Mathe- und
Leseleistung der Schüler und deren Finanzkompetenz zur Prüfung der Konstruktvalidität berechnet.
Ergebnisse: Die Auswertung der Daten erfolgte mit dem Programm Conquest (Wu et al., 2007). Eine Skalierung über das PartialCredit-Modell zeigt zufriedenstellende Test- und Itemfitstatistiken (z. B. Weighted MNSQ-Fits: 0.86 bis 1.21; T-values ≤ 1.96;
Item-Total-Correlations zwischen 0.20 und 0.60). Die DIF-Prüfungen zur Lösungswahrscheinlichkeit zeigen bei einigen Items
eine Konfundierung mit der Schulform, dem Geschlecht und der Bildungsherkunft. Im Vortrag wird diesbezüglich diskutiert, ob
Differential Item Functioning es ermöglicht, differentielle Stärken und Schwächen einzelner Schülergruppen im Bereich der
Finanzkompetenz aufzudecken oder lediglich als Einschränkung der Testfairness durch die systematische Benachteiligung
bestimmter Schülergruppen zu sehen ist (z. B. Scheuneman & Gerritz, 1990). Zur Überprüfung der Dimensionalität wurden
verschiedene IRT-Modelle berechnet. Die Ergebnisse zeigen, dass das fünfdimensionale IRT-Modell die Daten signifikant besser
abbildet als bspw. das eindimensionale Modell (Δ Deviance = 124,23; p < .001). In Bezug auf die diskriminante Validität ergeben
sich nur geringe Korrelationen zwischen den Mathe- und Deutschnoten und den Testleistungen der Schüler als Indiz für die
Konstruktvalidität.
Prozesse zur Qualitätskontrolle bei der Etablierung eines CAT-Itempools zur Erfassung von schulisch
erworbenen Kompetenzen
Raphael Bernhardt, Christian Spoden, Andreas Frey
Friedrich-Schiller-Universität Jena
Theoretischer Hintergrund: Schulisch erworbene Grundkompetenzen in den Domänen Mathematik, Lesen und
Naturwissenschaft stellen einen zentralen Bereich beruflicher Handlungskompetenz dar (Baethge, 2010). Sie haben sich als
erklärungsmächtige Prädiktoren für den Ausbildungserfolg erwiesen (z.B. Seeber & Lehmann, 2011) und können somit als ein
Schlüssel für erfolgreiches Lernen in der Berufsausbildung angesehen werden. Um in den Randbereichen der
Kompetenzverteilung bei vertretbaren Testzeiten gut differenzieren zu können, bietet sich computerisiertes adaptives Testen
(CAT) an. Im Rahmen der Entwicklung von drei computerisierten adaptiven Tests für Berufsschülerinnen und Berufsschüler (SuS)
in den aufgeführten Domänen wurde im Projekt „Messung allgemeiner Kompetenzen-adaptiv“ (MaK-adapt) aus bestehenden
Items groß angelegter Vergleichsstudien ein Itempool je Domäne etabliert. Im vorliegenden Beitrag werden Schritte der
Qualitätskontrolle bei der Etablierung der Itempools sowie der Vorbereitung der adaptiven Tests vorgestellt.
Forschungsfragen und Methode: In einem ersten Schritt wurde in einer Kalibrierungsstudie eine Schätzung von Itemparametern
unter Annahme des Rasch-Modells sowie eine Selektion geeigneter Items anhand von Itemfitstatistiken und Differential-ItemFunctioning-Analysen (DIF; z.B. Holland & Wainer, 1993) vorgenommen. Bei der Erstellung eines Itempools spielen Fragen,
inwieweit die Items dem Testmodell entsprechen und ob die Items fair in Bezug auf relevante Kovariaten sind, eine zentrale Rolle.
Die Passung der Itempoole in Bezug auf das Rasch-Modell wurde anhand der Mak-adapt-Kalibrierungsstichprobe (N = 1.632
SuS; 46 % weiblich) mit Hilfe von Mean-Square-Statistiken (MNSQ), die Annahme der Invarianz der Itemparameter in
verschiedenen Personengruppen mithilfe eines Multifacetten-Rasch-Modells analysiert (Linacre, 1994).
In einem zweiten Schritt wurde zuerst in einer Simulationsstudie und später empirisch in einer CAT- Pilotierungsstudie (N=1.093
SuS; 38% weiblich) die Berücksichtigung von Items aus allen Subdomänen, das Content-Balancing, sowie die Messpräzision der
adaptiven Tests geprüft. Das Content-Balancing wurde mit Hilfe des Maximum Priority Index (MPI; Cheng & Chang, 2009)
vorgenommen. Die gleichmäßige Vorgabe von Items aller Subdomänen ist eine wichtige Annahme des theoretischen
Rahmenkonzeptes im Projekt MaK-adapt. Deshalb ist die Frage, ob der MPI die Balancierung der Subdimensionen wie
vorgegeben vornimmt, wesentlich. Aufgrund der beschränkten Anzahl an Items lautet eine weitere zentrale Frage, wie hoch die
zu erzielende Messpräzision bei der Nutzung des DIF-neutralen Itempools und des MPI ist.
Ergebnisse: Die Analyse des gewichteten MNSQ ergab, dass zwei Mathematikitems, ein Leseitem und kein
Naturwissenschaftsitem aufgrund fehlender Passung zum Rasch-Modell aus dem Itempool entfernt werden müssen.
Im Rahmen der DIF-Analysen wurden sechs Mathematikitems, acht Naturwissenschaftsitems und fünf Leseitems identifiziert. Im
Anschluss an die statistische Identifizierung folgte eine inhaltliche Analyse der entsprechenden Items, welche zum Ausschluss
von zwei Items in der Domäne Mathematik, einem Item beim Lesen und drei Items bei den Naturwissenschaften führte.
Bezüglich der zweiten Forschungsfrage wurde festgestellt, dass die Administration von Items aller Subdimensionen vom MPIAlgorithmus wie vorgegeben umgesetzt worden ist; Verletzungen der Content-Balancing-Vorgaben wurden nicht identifiziert.
Die Ergebnisse zur dritten Forschungsfrage zeigen, dass bei Mathematik ab einer Testlänge von 20 Items, bei Lesen ab 21 Items
und bei Naturwissenschaft ab 28 Items eine Reliabilität von >.80 zu erwarten ist. Die zu erwartende Reliabilität aus der
Pilotierungsstudie liegt in der Domäne Naturwissenschaft leicht unter der simulierten Testung; in den Domänen Mathematik und
Lesen sind die Reliabilitäten fast identisch.
Diskussion: Zur Erfassung schulischer Grundkompetenzen bei SuS konnte in kurzer Entwicklungszeit ein qualitativ hochwertiges
CAT-Instrument produziert werden. Qualitätskontrollen in Bezug auf den CAT-Itempool versprechen, dass aus bestehenden
Items von groß angelegten Vergleichsstudien faire Testinstrumente mit hoher Passung zum Rasch-Modell konstruiert werden
können. Wir regen an, diesem Vorgehen für eine schnelle Implementation eines Itempools zu folgen. Die Ergebnisse der
Simulationsstudien weisen zudem aus, dass auf Basis der genutzten Itempools eine hinreichende Messpräzision mit begrenzter
Itemanzahl beim CAT erzielt werden kann. In Übereinstimmung mit den Ergebnissen von Cheng und Chang (2009) kann zudem
der MPI als zuverlässiges Instrument des Content-Balancing beim CAT empfohlen werden.
Differenzielle Domänen- und Itemeffekte zwischen Ausbildungsberufen bei der Erfassung schulischer
Grundqualifikationen von Berufsschülerinnen und Berufsschülern
Christian Spoden, Raphael Bernhardt, Andreas Frey
Friedrich-Schiller-Universität Jena
Theoretischer Hintergrund: Schulische Grundqualifikationen wie Lesen, Mathematik und Naturwissenschaften haben sich als
erklärungsmächtig für den Erfolg der beruflichen Ausbildung erwiesen (z. B. Lehmann & Seeber, 2007; Nickolaus, Geissel, &
Gschwendtner, 2008; Nickolaus et al., 2010; Nickolaus & Norwig, 2009; Seeber & Lehmann, 2011). Um Berufsschülerinnen und
Berufsschüler hinsichtlich dieser Grundqualifikationen zu verorten und schließlich auch strukturelle Zusammenhänge zwischen
diesen Grundqualifikationen und berufsfachlichen Kompetenzdimensionen zu untersuchen, wurden im Rahmen der vom
Bundesministerium für Bildung und Forschung geförderten Forschungsinitiative Technology-based Assessment of Skills and
Competencies in VET (ASCOT) adaptive Tests entwickelt (Ziegler, Frey, Seeber, Balkenhol & Bernhardt, 2015).
Testkonstrukteure standen dabei vor zwei Herausforderungen: Eine erste Herausforderung wurde in der Abstimmung der
Testinstrumente auf das jeweilige berufstypische Leistungsspektrum identifiziert; computerisiertes adaptives Testen (CAT)
ermöglicht bei verhältnismäßig kurzen Testzeiten eine große Leistungsdifferenzierung und erwies sich somit als Methode der
Wahl. Eine zweite Herausforderung bezog sich auf die berufsübergreifenden Einsatzmöglichkeiten der Testinstrumente, da die
Erfassung allgemeiner Grundqualifikationen möglichst einen berufsübergreifenden Vergleich der entsprechenden Kompetenzen
ermöglichen sollte.
Fragestellung: Im Zusammenhang mit der Entwicklung adaptiver Testinstrumente zur Erfassung dieser Kompetenzen wird in
dem vorliegenden Beitrag der Frage nach Domänen- und Item-spezifischen Vorteilen zweier Gruppen von Ausbildungsgängen
(kaufmännisch-verwaltende vs. gewerblich-technische Berufe) nachgegangen und diese zunächst im Rahmen des sogenannten
Differential Item Functioning (DIF) und anschließend auf Basis einer qualitativen Analyse durch Inhaltsexperten untersucht.
Methode: Die nachfolgend beschriebenen Analysen stützen sich auf die Kalibrierungsdaten des Forschungsprojekts MaK-adapt
im Rahmen. Die Stichprobe umfasste Testdaten auf Basis eines rotierten Testheftdesigns von N = 1224 Berufsschülerinnen und
Berufsschülern (33 % weiblich, 91 % Muttersprache Deutsch, 60 % Abschluss der mittleren Reife, zu 68 % im dritten
Ausbildungsjahr) aus den Bundesländern Hessen, Niedersachsen und Thüringen. Um belastbare Aussagen zum DIF zu erzielen,
wurde die Stichprobe in zwei Gruppen von Ausbildungsberufen, kaufmännisch-verwaltend ausgerichtete Berufe und gewerblichtechnisch ausgerichtete Berufe, unterteilt. Die Studierenden bearbeiteten Tests in den Kompetenzbereiche Lesen, Mathematik
und Naturwissenschaften, die sich auf Vorarbeiten aus verschiedenen Large-Scale Assessments stützten (Bernhardt et al, 2013).
In einem ersten quantitativen Analyseschritt wurden in jeder der drei Domänen DIF-Analysen zwischen den zuvor beschriebenen
Gruppen von Ausbildungsberufen mit Hilfe von Mehrfacetten-Rasch-Modellen unter Berücksichtigung von Domain-OrderEffekten bestimmt. In einem zweiten qualitativen Schritt wurde eine Inhaltsanalyse im Hinblick auf schwierigkeitsbestimmende,
konstruktirrelevante Itemmerkmale von Inhaltsexpertinnen vorgenommen; es sollte so beurteilt werden, ob die statistisch
bestimmten DIF-Effekte auf Konstrukt-irrelevante Merkmale zurückzuführen sind und somit im Sinne eines Item Bias interpretiert
werden müssen.
Ergebnisse und Diskussion: Die Ergebnisse verdeutlichen, dass zwar mittlere Leistungsunterschiede zwischen kaufmännischverwaltenden und gewerblich-technischen Ausbildungsgängen vorliegen, jedoch nur einzelne DIF-Effekte in den Domänen Lesen
(Omnibustests im Mehrfacetten-Rasch-Modell: χ2(71) = 95.10, p <.05; signifikanter DIF bei sechs Items) und Mathematik (χ2
(125) = 153.51, p < .05; signifikanter DIF bei neun Items) statistisch identifiziert wurden. Die inhaltliche Analyse dieser Items
offenbarte, dass zwischen den statistisch identifizierten DIF-Effekten und der Einschätzung der Items durch Inhaltsexpertinnen
im Sinne eines Vorteils zugunsten der einen oder anderen Berufsgruppe kein Zusammenhang bestand. Dies weist darauf hin,
dass die wenigen statistisch identifizierten DIF-Effekte nicht auf konstruktirrelevante Itemmerkmale zurückzuführen sind. In der
Domäne Naturwissenschaften fiel bereits der Omnibustest für DIF-Effekte nicht signifikant aus (χ2 (130) = 142.23, p = .219).
Schulische Grundqualifikationen können somit über verschiedene Ausbildungsberufe hinweg mit dem gleichen Instrument fair
erfasst und zueinander in Beziehung gesetzt werden. Dementsprechend wurden die drei CAT-Verfahren inzwischen in bereits
sechs Projekten der ASCOT-Initiative erfolgreich eingesetzt (Bernhardt et al., 2013). Mit der Erfassung schulischer
Grundkompetenzen bei Berufsschülerinnen und –schülern ist eine wichtige Voraussetzung dafür erfüllt, wissenschaftlich
belastbare und beispielsweise auch für die Beratung von Politik und praktisch tätigen Institutionen nutzbare Aussagen tätigen zu
können (Baethge, 2012).
Testformate im Vergleich: Papierbasierte vs. computerbasierte Aufgaben zur Messung kaufmännischer
Kompetenz
Julia Sangmeister1, Esther Winther2, Viola Katharina Klotz1
1
Deutsche Institut für Erwachsenenbildung Bonn, 2Universität Duisburg-Essen
Theoretischer Hintergrund: Dem Einsatz von Technologien und Computern im Rahmen von Assessments kommt, auch in
Deutschland insbesondere im Rahmen von Bildungsvergleichsstudien wie PISA und NEPS , eine immer größere Bedeutung zu
(vgl. Bennett, 2002). Empirisch geprüfte Ergebnisse können dabei helfen, die Stärken und Schwächen computerbasierter
Testformate herauszustellen. Der vorliegende Beitrag vergleicht am Beispiel eines Tests zur Messung kaufmännischer
Kompetenz das klassische Testformat in Papier und Bleistift (PPT) mit einem computerbasierten Assessment (CBA) für die
Ausbildung von Industriekaufleuten . Kaufmännische Kompetenz wird nach Winther & Achtenhagen (2008) definiert als „die
Fähigkeit, auf Grundlage eines systemischen Verstehens betrieblicher Teilprozesse und deren Rekonstruktion aus realen
Unternehmensdaten in berufsrealen Situationen unternehmerische Entscheidungen treffen und diese validieren zu können, um
damit das eigene Wissens- und Handlungspotential vor dem Hintergrund der Entwicklung individueller beruflicher
Regulationsfähigkeit auszubauen“. Das theoretische Modell zur Aufgabenentwicklung differenziert für das Konstrukt der
kaufmännischen Kompetenz zwischen einer domänenspezifischen und einer domänenverbundenen Dimension (vgl. Gelman &
Greeno, 1989). Domänenverbundene Inhalte beziehen sich auf allgemeine sprachliche und mathematische Fähigkeiten, die in
beruflichen Handlungssituationen relevant werden. Sie unterscheiden sich von Inhalten des allgemeinen Bildungsbereichs durch
ihre berufliche Relevanz. Domänenspezifische Inhalte umschließen darüber hinausgehend spezifisches Regel- und
Handlungswissen einer beruflichen Gemeinschaft, das sich exklusiv auf kaufmännischen Berufe bezieht.
Fragestellung: Zunächst soll geprüft werden, ob sich die theoretisch angenommene zweidimensionale Struktur anhand der Daten
empirisch bestätigen lässt. In einem weiteren Schritt erfolgt ein Vergleich von PPT und CBA, um die Frage zu klären, ob ein
Format auf Gesamttestebene und/oder Itemebene systematisch zu besseren oder schlechteren Leistungen führt. Angenommen
wird dabei, dass sich domänenspezifische Aufgaben besser im CBA darstellen und bearbeiten lassen. Theoretisch wird diese
Annahme durch eine Lernortargumentation motiviert: Auszubildenden sind domänenverbundene Aufgaben eher aus dem
schulischen Lernkontext der allgemeinbildenden Schule vertraut. Domänenspezifische Aufgaben beziehen sich dagegen stärker
auf arbeitsplatzbezogene Tätigkeiten, die dort üblicherweise am PC verrichtet werden
Methode & Design: Insgesamt werden 38 Items für das Konstrukt der kaufmännischen Kompetenz papier- und computerbasiert
über vier curriculare Schwerpunktbereiche administriert und den Testpersonen in einem within-persons-Design (vgl. Senkbeil &
Ihme, 2014) über offene und halboffene Antwortformate präsentiert. Die Stichprobe setzt sich aus 387 Auszubildenden zur
Industriekauffrau/zum Industriekaufmann im zweiten Ausbildungsjahr zusammen. Erhoben wurde in drei Bundesländern. Die
Analysen wurden mittels Item Response Theory (IRT) im Programm Acer Conquest durchgeführt (vgl. Wu et al., 2007). Neben
den Modellprüfungen war für den vorliegenden Beitrag vor allem die Berechnung von Differentiellen Itemfunktionen (DIF) von
Bedeutung, mit deren Hilfe ein Vergleich der Testformate ermöglicht wird. Nach Embretson & Reise (2000) liegt dann ein DIFEffekt vor, wenn Testpersonen mit gleicher latenter Personenfähigkeit unterschiedliche Lösungswahrscheinlichkeiten für ein Item
aufweisen. Es wird untersucht, inwieweit die Gruppenunterschiede, hier nicht durch Eigenschaften der Personen selbst (z.B.
Geschlecht), sondern durch das verwendete Testformat hervorgerufen werden.
Ergebnisse & Ausblick: Die Anforderungen zur Modellgüte, gemessen an Itemfit-Werten (weighted mean square) liegen im
zulässigen Bereich zwischen 0,75 ≤ wMNSQ ≤ 1,33 (Adams & Khoo, 1996; Bond & Fox, 2001). Auf Basis der Modellgüte-Maße
AIC, BIC und cAIC kann das theoretisch unterstellte zweidimensionale Modell empirisch bestätigt und repliziert werden. Der
Gruppenunterschied zwischen beiden Testformaten ist auf Gesamttestebene mit einem Wert von 0,112 Logits vernachlässigbar.
Auf Itemebene zeigen sich bei 23 Items mittlere bis hohe DIF-Effekte, von denen 12 Items zugunsten des PPT und 11 Items
zugunsten des CBA interpretiert werden können. Erste Analysen zeigen, dass domänenverbundene Aufgaben im klassischen
PPT besser zu bearbeiten sind und domänenspezifische Aufgaben durch die Simulation besser unterstützt werden. Für die
Prüfungspraxis würde sich auf Basis dieser Befunde eine Mischform beider Testformate empfehlen.
ID: 429
Symposium
Disziplinen-Cluster: Psychologie, Didaktiken der Naturwissenschaften und Technik
Thematisches Cluster: Bildung im Sekundarbereich, Hochschulbildung, Mathematisch-naturwissenschaftlicher Unterricht
Stichworte: beispielbasiertes Lernen, wissenschaftliches Denken, Video-Beispiele.
Lang ist der Weg durch Belehren, kurz und wirksam durch Beispiele: Förderung von wissenschaftlichem
Denken durch beispielbasiertes Lernen
Chair(s): Juliane Kant (Eberhard Karls Universität Tübingen)
Diskutant(en): Maria Opfermann (Universität Duisburg-Essen)
Wissenschaftliches Denken ist eine Schlüsselfertigkeit, die zur Lösung von Problemen in unterschiedlichsten Domänen (z.B.
Biologie, Physik, Medizin) und Kontexten (Schule, Hochschule) notwendig ist (Laugksch, 2002). Wissenschaftliches Denken
umfasst Aktivitäten wie das Aufstellen von Hypothesen, zur Planung und Durchführung von Experimenten und zum Ziehen von
Schlussfolgerungen (Fischer et al., 2014). Empirische Befunde zeigen jedoch, dass Lernende verschiedener Altersstufen und in
unterschiedlichsten Bildungskontexten häufig Schwierigkeiten beim wissenschaftlichen Denken haben (de Jong & van Joolingen,
1998).
Eine Möglichkeit zur Unterstützung des wissenschaftlichen Denkens ist beispielbasiertes Lernen (z.B. Stark, Kopp & Fischer,
2011). Im Vergleich zu (unangeleitetem) Problemlösen verspricht das Studium von Lösungsbeispielen eine effizientere Nutzung
der Arbeitsgedächtniskapazität und dadurch einen erleichterten Schemaerwerb (Sweller, 2006). Ursprünglich für klar
strukturierten Probleme mit eindeutigen Lösungen eingesetzt, werden in jüngerer Zeit die Potenziale des Ansatzes für die
Förderung komplexerer kognitiver Fertigkeiten untersucht. Hierzu möchte dieses Symposium einen Beitrag leisten, indem es (a)
verschiedene Varianten beispielbasierten Lernens präsentiert (z.B. Lernen mit Video-Beispielen; Lernen mit fehlerhaften
Beispielen) und auf ihre Effektivität zur Förderung unterschiedlicher Facetten wissenschaftlichen Denkens untersucht sowie (b)
der Frage nachgeht, inwiefern die Effektivität beispielbasierten Lernens in unterschiedlichen Inhaltsdomänen
(Naturwissenschaften, Medizin, Erziehungswissenschaften) variiert.
Kant, Scheiter und Oschatz verwenden Video-Beispiele, um SchülerInnen in den Naturwissenschaften Experimentierstrategien
zu vermitteln. Es wird untersucht, welche Rolle dabei die Domänenspezifität bzw. -generalität der Video-Beispiele spielt und ob
es einen Unterschied macht, wenn den SchülerInnen die Experimentierstrategie zuvor explizit beschrieben wird oder wenn sie
sich die Experimentierstrategie selbst aus den Beispielen erschließen müssen.
Schmidt-Borcherding, Hänze und Wodzinski beschäftigen sich mit der Frage, ob und wie SchülerInnen beim nachvollziehenden
vs. eigenständigen Experimentieren mit Hilfe von Lösungsbeispielen unterstützt werden können. Dabei wurden
zusammenhängende Lösungsbeispiele mit schrittweise präsentierten Lösungsbeispielen (sog. „gestuften Lernhilfen“) verglichen.
Innerhalb des Hochschulkontexts gehen Strobel, Heitzmann, Strijbos, Kollar und Fischer der Frage nach, inwiefern korrekte vs.
fehlerhafte Video-Beispiele Medizinstudierende bei der Entwicklung von Diagnose- und Fehlererkennungskompetenz als
wissenschaftlichen Denkfertigkeiten unterstützen können. Außerdem wird untersucht, ob es ratsam ist, Studierende zusätzlich
Feedback auf das in den Video-Beispielen gezeigte Verhalten formulieren zu lassen.
Ebenfalls im Hochschulkontext (in der Domäne Erziehungswissenschaften) untersuchen Murböck, Antosch-Bardohn, Strijbos
und Stegmann, inwiefern der Zeitpunkt kognitiver Modellierung in Form von Video-Beispielen (vor oder nach der Bearbeitung
einer Lernaufgabe) sowie die Art der Lernaufgabe für Unterschiede beim Fertigkeitserwerb in empirischen Forschungsmethoden
verantwortlich ist.
Die Ergebnisse der vier Studien unterstreichen die Mächtigkeit beispielbasierten Lernens zur Förderung wissenschaftlichen
Denkens und weisen vielfältige Implikationen für die Gestaltung effektiver Lösungsbeispiele in unterschiedlichen Domänen und
Bildungskontexten auf.
Beiträge des Symposiums
Förderung von wissenschaftlichem Denken und Fachwissen mit Video-Beispielen von simulierten
Experimenten
Juliane Kant1, Katharina Scheiter2, Kerstin Oschatz1
1
Eberhard Karls Universität Tübingen, 2Leibniz-Institut für Wissensmedien
Theoretischer Hintergrund und Fragestellung
Wissenschaftliches Denken ist eines der zentralen Ziele internationaler Bildungsstandards (Kultusministerkonferenz, 2004;
National Research Council, 2011). Es umfasst das Wissen und die Fertigkeiten Probleme zu identifizieren, Fragen zu stellen,
Hypothesen aufzustellen, Artefakte zu erstellen, Evidenzen zu generieren, Ergebnisse auszuwerten, Schlussfolgerungen zu
ziehen und den Verlauf sowie die Ergebnisse dieses Prozesses zu kommunizieren (Fischer et al., 2014). Diese Fertigkeiten
können durch Methoden gefördert werden, die auf entdeckendem Lernen basieren z.B. Lernen mit simulierten Experimenten am
Computer (Ton de Jong, 2006). Es hat sich jedoch gezeigt, dass Schüler dabei angeleitet werden müssen (Alfieri, Brooks, Aldrich,
& Tenenbaum, 2011). Eine mögliche Form der Anleitung ist das beispielbasierte Lernen. Wenn Lernern ein Video-Beispiel zum
Umgang mit simulierten Experimenten gezeigt wurde, verbesserte sich ihr Experimentierverhalten in Physik (Mulder, Lazonder,
& de Jong, 2014). Trotzdem blieb der Lernzuwachs im Fachwissen Physik eher gering. Mulder et al. (2014) schlugen deshalb
eine verbesserte Gestaltung der Video-Beispiele vor. Wichtige Gestaltungsaspekte aus der Forschung zu Lösungsbeispielen
sind die Anordnung mehrerer Beispiele sowie der Instruktionstyp. Die Anordnung bezieht sich darauf, ob ein Prinzip mit Beispielen
aus unterschiedlichen (fächerübergreifend) oder ähnlichen Kontexten (fachspezifisch) beigebracht wird (Quilici & Mayer, 1996).
Der Instruktionstyp kann entweder deduktiv sein (abstraktes Prinzip, gefolgt von Beispielen) oder induktiv (nur Beispiele, aus
denen das abstrakte Prinzip erschlossen werden muss; Renkl, 2015). In der vorliegenden Studie wurde untersucht, ob sich diese
beiden Gestaltungsaspekte auf den Erwerb von wissenschaftlichem Denken und Fachwissen auswirken.
Methode
Wir haben ein computerbasiertes Lernprogramm zum Thema Energie entwickelt und mit 126 Gymnasiasten der achten Klasse
getestet. Das Lernprogramm bestand aus vier Video-Beispielen (2 aus Biologie, 2 aus Physik), in denen zwei Modell-Schüler
Strategien wissenschaftlichen Denkens an simulierten Experimenten demonstrierten. Zusätzlich enthielt das Lernprogramm zwei
simulierte Experimente. Zwei Aspekte wurden bei der Gestaltung der Video-Beispiele variiert. Erstens wurden die Video-Beispiele
entweder fächerübergreifend oder fachspezifisch angeordnet. Bei der fächerübergreifenden Anordnung lernten die Schüler je
eine Strategie wissenschaftlichen Denkens mit einem Video-Beispiel aus Physik und einem Video-Beispiel aus Biologie. Bei der
fachspezifischen Anordnung lernten die Schüler je eine Strategie wissenschaftlichen Denkens mit zwei Video-Beispielen aus nur
einem Fach. Zweitens war der Instruktionstyp entweder deduktiv oder induktiv. Beim deduktiven Instruktionstyp erhielten die
Schüler eine abstrakte Beschreibung der Strategie für wissenschaftliches Denken gefolgt von zwei Video-Beispielen. Beim
induktiven Instruktionstyp erhielten die Schüler lediglich zwei Video-Beispiele und mussten sich die Strategie erschließen. Die
Kombination der Gestaltungsaspekte ergab vier Gruppen, zu denen die Schüler randomisiert zugewiesen wurden. Im Prätest
wurde das Vorwissen der Schüler zum wissenschaftlichen Denken sowie zum Thema Energie mit Leistungstests erhoben. In
zwei Lerneinheiten wurde den Schülern jeweils mit Hilfe zweier Video-Beispiele und eines simulierten Experiments beigebracht,
wie man kontrollierte Experimente durchführt und wie man Hypothesen aufstellt. Im Posttest wurden wissenschaftliches Denken
und Fachwissen mit den Leistungstests des Prätests erhoben. Zusätzlich wurde das wissenschaftliche Denken verhaltensnah
durch Experimentieraufgaben erfasst. Dabei mussten die Schüler zu einer Fragestellung eine Hypothese aufstellen und diese
mit simulierten Experimenten überprüfen. Während des Experimentierens wurde der Bildschirm der Schüler aufgenommen. Zwei
unabhängige Rater kodierten die Anzahl kontrollierter Experimente in den Aufnahmen.
Ergebnisse
Die Video-Beispiele konnten wissenschaftliches Denken fördern. Für alle Gruppen ergab sich ein signifikanter Interventionseffekt
von Prä- zu Posttest für den Leistungstest zu wissenschaftlichem Denken. Gruppenunterschiede ergaben sich bezüglich des
verhaltensnahen Maßes für wissenschaftliches Denken und bezüglich des Fachwissens. Die beiden fächerübergreifenden
Gruppen führten im Posttest mehr kontrollierte Experimente durch als die fachspezifischen Gruppen. Eine fächerübergreifende
Anordnung scheint somit von Vorteil zu sein zur Förderung wissenschaftlichen Denkens. Des Weiteren zeigte sich ein
Interaktionseffekt für Fachwissen. Die fächerübergreifend-deduktive Gruppe sowie die fachspezifisch-induktive Gruppe
verbesserten von Prä- zu Posttest ihr Fachwissen. Die Gestaltung von Video-Beispielen beeinflusst also tatsächlich den Erwerb
von wissenschaftlichem Denken und Fachwissen.
Mit den eigenen Daten rechnet sich’s leichter? Zur Rolle von Lösungsbeispielen und gestuften Lernhilfen
beim Schülerexperiment
Florian Schmidt-Borcherding1, Martin Hänze2, Rita Wodzinski2
1
Universität Bremen, 2Universität Kassel
Experimentieren (im weiteren Sinne verstanden als systematische Herstellung, Kontrolle und/oder Manipulation von
Beobachtungssituationen) ist eine - wenn nicht „die“ - zentrale naturwissenschaftliche Methode. Auch deswegen wird dem
Schülerexperiment im naturwissenschaftlichen Unterricht aus fachlicher wie fachdidaktischer Sicht große Bedeutung
beigemessen. Der mit dem selbstständigen Experimentieren der Schülerinnen und Schüler (SuS) erzielte Lernerfolg bleibt
allerdings oft hinter den Erwartungen zurück (z.B. Bates, 1978; Hofstein & Lunetta, 1982; Hucke & Fischer, 2002). Das erklärt
möglicherweise auch, warum Lehrerinnen und Lehrer oft lieber auf Demonstrationsexperimente, eng strukturierte
Experimentieranleitungen oder die Vorgabe „korrekter“ Messergebnisse zurückgreifen (Tesch, 2005).
Mit dieser Studie soll untersucht werden, (a) welche Rolle die Herstellung eigener Messergebnisse (Experimentieren im weiteren
Sinne) im Vergleich zu vorgegebenen Messergebnissen (Lösungsbeispiel für experimentell gewonnene Daten) beim
Schülerexperiment spielt und (b) ob Maßnahmen zur Öffnung von Lösungsbeispielen auch bei eng strukturierten Anleitungen für
Schülerexperimente lernwirksam sind. Als Maßnahme zur Öffnung von Experimentieranleitungen sollen sog. „gestufte Lernhilfen“
dienen. Gestufte Lernhilfen segmentieren Lösungsbeispiele in einzelne Schritte, denen kognitiv aktivierende Prompts
vorangestellt werden. Die Prompts und Lösungsschritte werden von Lernenden schrittweise und nur bei Bedarf abgerufen. So
gestaltete Lernhilfen haben sich beim naturwissenschaftlichen Problemlösen gegenüber einfachen Lösungsbeispielen als
lernwirksamer erwiesen (z.B. Schmidt-Weigand, Hänze & Wodzinski, 2009).
N = 126 Schülerinnen und Schüler der 8. Jahrgangsstufe einer integrierten Gesamtschule in Nordhessen bearbeiteten in
Partnerarbeit eine Aufgabe zum Hookeschen Gesetz. Über die Ausdehnung einer Feder bei Gegenständen mit bekannter Masse
sollte die unbekannte Masse eines weiteren Gegenstandes bestimmet werden. Für diese Aufgabe wurde eine eng strukturierte
Experimentieranleitung verfasst. In einem 2x2-faktoriellen Versuchsdesign wurde nun variiert, (a) ob die Ausdehnung der Feder
für jeden der Gegenstände bestimmt werden musste (Experimentieraufgabe) oder vorgegeben war (Textaufgabe) und (b) ob die
Anleitung als zusammenhängender Instruktionstext vorgegeben wurde (Lösungsbeispiel) oder schrittweise in Form gestufter
Lernhilfen. Die Schülerpaare wurden zufällig auf die vier resultierenden Untersuchungsbedingungen aufgeteilt. Als abhängige
Variablen dienten Maße des Lernerlebens (basic needs, kognitive Belastung) sowie des Lernerfolgs (Güte der Aufgabenlösung,
Wissenstest zum Hookeschen Gesetz).
Sowohl im Lernerleben als auch im Lernerfolg zeigt sich ein Haupteffekt der Aufgabenart. SuS, die die Federausdehnungen
tatsächlich messen mussten, berichten unabhängig von der weiteren Unterstützung ein positiveres Lernerleben im Sinne höherer
intrinsischer Motivation, kognitiver Aktivierung, Autonomieerleben, Kompetenzerleben und sozialer Einbindung als SuS, die mit
vorgegebenen Messwerten weiter arbeiten mussten. In gleicher Weise erwarben SuS mit selbst erzeugten Messdaten ein
genaueres Verständnis zum Hookeschen Gesetz als SuS mit vorgegebenen Messwerten. Entgegen unseren Erwartungen zeigen
sich keine Unterschiede zwischen enggeführter Anleitung und gestuften Lernhilfen. Für das selbstständige Experimentieren ist
das Ausbleiben eines positiven Effektes gestufter Lernhilfen immerhin noch dadurch erklärbar, dass das Experimentieren Lerner
möglicherweise von den externen Hilfen ablenkt (vgl. Schmidt-Borcherding et al., 2013). Das Fehlen von Unterschieden bei der
Textaufgabe lässt sich damit allerdings nicht erklären.
Das Versagen der Anderen: Erlernen von Diagnostischen Fähigkeiten durch das Geben von Feedback
auf videobasierte fehlerhafte Cognitive Modeling Examples
Christian Strobel1, Nicole Heitzmann1, Jan-Willem Strijbos1, Ingo Kollar2, Martin Fischer1
1
Ludwig-Maximilians-Universität München, 2Universität Augsburg
Theoretischer Hintergrund
Diagnostizieren als eine der komplexesten alltäglichen Aufgaben eines Arztes hat eine Fehlerrate von 10-15% (Graber, Gordon
& Franklin, 2005). Instruktionale Ansätze in der medizinischen Ausbildung sind dringend nötig, um diese Rate zu reduzieren. Bei
deren Erforschung wird bisher meist der Erwerb diagnostischen Faktenwissens allein als Maß der Effektivität betrachtet. Ein
holistisches Diagnosekompetenzmodell vereint unseres Erachtens Diagnosewissen bestehend aus konzeptionellem Wissen über
Fakten einer Krankheit, konditionalem Wissen über ein Diagnoseverfahren und strategischem Wissen über dessen Hintergründe
und Implikationen (Stark, Kopp, & Fischer, 2011) sowie Fehlererkennungskompetenz als Wissen über mögliche Fehlerquellen
einer Diagnose. Letztere wurde bis jetzt noch nicht in das Konzept der Diagnosekompetenz inkorporiert. Dies ist aber
unabdingbar, um eine akkuratere Aussage über die tatsächliche Diagnosefähigkeit von Medizinern machen zu können (Dror,
2011).
Ein erfolgreicher Ansatz zur Vermittlung von Diagnosekompetenz ist das fallbasierte Lernen mit Lösungsbeispielen (Stark, et al.,
2011). Eine authentische Variante fallbasierter Lösungsbeispiele zum Erlernen kognitiver Fähigkeiten sind videobasierte
Cognitive Modeling Examples (Kostons, Van Gog, & Paas, 2012): Videos von Mitstudierenden, die eine Differenzialdiagnose von
Anfang bis Ende durchführen und ihre Überlegungen hinter der Diagnose erklären. Renkl und Atkinson (2003) sehen fehlerhafte
Beispiele als lernförderlicher und motivierender an als fehlerfreie Beispiele – vorausgesetzt, der Fehler wird durch Elaboration
des Gesehenen erkannt. Um Elaboration anzuregen, könnte sich der Auftrag, elaboriertes Peer-feedback auf das Gesehene zu
geben, als effektiv herausstellen (Li, Liu, & Stecklberg, 2010; Cho & Cho, 2011). Aus diesen theoretischen Annahmen ergeben
sich folgende Fragestellungen.
Fragestellungen
Forschungsfrage 1: Wie wirkt sich der Einsatz von Cognitive Modeling Examples verglichen mit Textbuchlernen auf den Erwerb
von Diagnosekompetenz aus?
Forschungsfrage 2: Wie wirkt sich das Geben von Peer-Feedback auf Cognitive Modeling Examples im Vergleich zum Ansehen
allein auf den Erwerb von Diagnosekompetenz aus?
Forschungsfrage 3: Gibt es einen Unterschied zwischen fehlerhaften und korrekten Cognitive Modeling Examples bezüglich des
Erwerbs von Diagnosekompetenz?
Forschungsfrage 4: Gibt es eine Interaktion zwischen dem Geben von Peer Feedback auf fehlerhafte oder korrekte Cognitive
Modeling Examples bezüglich des Erwerbs von Diagnosekompetenz?
Methode
Die Stichprobe bestand aus N=121 Medizinstudierenden der LMU im 7. Semester; alle absolvierten einen Wissens-Pre-Test und
lernten jeder für sich mit drei über die CASUS-Lernsoftware (Fischer, 2000) präsentierten Cognitive Modeling Examples zu
Atemnot und absolvierten einen Wissens-Post-Test.
In einem 2x2 faktoriellen Design mit Kontrollgruppe wurde untersucht ob (a) die Korrektheit der Beispiele (fehlerhafte vs. korrekte)
und (b) das Geben von Peer-Feedback (ja vs. nein) auf die gezeigten Beispiele den Grad der Elaboration und dadurch den
Erwerb von Diagnosekompetenz verbessern. Die Kontrollgruppe lernte aus einem Lehrbuchabschnitt zum Thema Atemnot.
Die Messung der Diagnosekompetenz war operationalisiert als 15 Multiple-Choice-items zu konzeptuellem Wissen (α =.51), 15
Key-Feature-Fragen zu strategischem Wissen (α =.58) und sechs Problemlöseaufgaben zu konditionalem Wissen (α=.59).
Fehlererkennungskompetenz wurde erfasst mit fehlerhaften Lösungsbeispielen mit 15 auffindbaren Fehlern innerhalb der
Diagnose (α =.61)
Ergebnisse
Cognitive Modeling Examples führten zu einem besseren Lernerfolg bei konzeptionellem diagnostischem Wissen als das Lernen
eines Lehrbuchabschnittes, t(40)=2.651 p=.011.
Der Lernerfolg zwischen fehlerhaften und korrekten Beispielen unterschied sich für Diagnosewissen nicht, F(1,95)=.264, p=.609.
Fehlererkennungskompetenz wurde jedoch mit fehlerhaften Beispielen verbessert, F(1,95)=4.290, p=.041, ηp²=.045.
Das Geben von Feedback hatte entgegen unserer Hypothese negative Effekte auf den Erwerb von Diagnosewissen,
F(1,95)=8.866, p=.004, ηp²=.090 sowie auf Fehlererkennungskompetenz, F(1,95)=5.066, p=.027, ηp²=.053. Die kognitive
Anstrengung war höher beim Feedbackgeben (M=3.95, SD=.78) im Vergleich zum Modell-Anschauen (M=3.50, SD=.657),
t(86)=3.040, p=.003. Es wurde kein Interaktionseffekt der Faktoren gefunden. Der Elaboriertheitsgrad des Feedbacks korrelierte
mit konditionalem Wissen (r=.31, p=.035) sowie mit kognitiver Anstrengung (r=.38, p=.011).
Die Ergebnisse untermauern die Effektivität von Cognitive Modeling Video-Examples als Lehrmethode in der medizinischen
Ausbildung. Gerade fehlerhafte Beispiele fördern Fehlererkennungskompetenz der Studierenden. Das Geben von Feedback
sollte jedoch als didaktische Methode mit Vorsicht eingesetzt werden, um die Studierenden nicht kognitiv zu überlasten.
Zeitpunkt kognitiver Modellierung und Art der Lernaufgabe: Effekte auf den Fertigkeitserwerb in
empirischen Forschungsmethoden
Julia Murböck, Jana Antosch-Bardohn, Jan-Willem Strijbos, Karsten Stegmann
Ludwig-Maximilians-Universität München
Vielen Studienanfängern der Erziehungswissenschaften fällt das Erlernen von wissenschaftlichen Fertigkeiten in empirischen
Forschungsmethoden schwer. Beispielbasiertes Lernen ist eine effektive Methode, um den frühen Fertigkeitserwerb zu fördern
(Renkl, 2014). Eine Form beispielbasierten Lernens ist Lernen am Modell (Van Gog & Rummel, 2011). Ein bislang nur wenig
untersuchter Aspekt in der Erforschung beispielbasierter Lernumgebungen ist die Sequenzierung der Lehr- und Lernaktivitäten
und deren Wirkung auf den Fertigkeitserwerb: Soll die Fertigkeit vor oder nach der Bearbeitung von Lernaufgaben modelliert
werden und welche Arten von Lernaufgaben sollen die Studierenden bearbeiten? Sollen sie selbst ein Problem lösen, schon
gelöste Beispiele vergleichen oder ein Problem lösen und sich anschließend selbst mit dem Modell vergleichen? Für die
Modellierung davor spricht, dass dadurch eine (überflüssige) kognitive Belastung vermieden werden kann und dies zu besserem
Fertigkeitserwerb führt (Van Gog et al., 2011). Metaanalytische Befunde liefern jedoch auch einen Beleg, dass die Effektivität
nachfolgender Modellierung von der Art der Lernaufgabe abhängt und besonders bei vergleichenden Aktivitäten wirksam scheint
(Alfieri et al., 2013). Die Lernenden erschließen sich dabei die Prinzipien aktiv, wodurch sie die nachfolgende Instruktion besser
mit ihrem Vorwissen verknüpfen können sollten. Neben dem Vergleich von Beispielen scheint es auch sinnvoll, Vergleiche mit
dem Modell gezielt anzuregen, da angenommen wird, dass der Lerner sich bei der Lösung eines ähnlichen Problems überwacht
und seine Aufmerksamkeit bei der nächsten Modellierung gezielt auf seine Schwachstellen richtet (Bandura, 1977). Die
vorliegende Studie bearbeitet daher die Fragestellung, in wieweit der Zeitpunkt der Modellierung, die Art der Lernaufgabe und
deren Interaktion einen Effekt auf den Fertigkeitserwerb haben.
Zur Bearbeitung der Fragestellungen wurden der Zeitpunkt der Modellierung (vorher vs. nachfolgend) und die Art der Lernaufgabe
(Problemlösen vs. Vergleichen von Beispielen vs. Problemlösen und Vergleich mit Modell) in einem 2x3-faktoriellen-Design
variiert. Im Rahmen der Studie sollten die Studierenden in 60 Minuten mit Hilfe von drei Modellierungen und drei Lernaufgaben
die Fertigkeit erwerben, wie man verschiedene experimentelle Designs darstellt. Die Lernaufgaben bestanden entweder aus (1)
dem Lösen von analogen Problemen, (2) dem Vergleich von zwei gelösten Beispielen oder (3) der Bearbeitung von analogen
Problemlöseaufgaben und dem Vergleich mit der Modelllösung. Pädagogik-Studenten (N=142) im ersten Semester wurden einer
der sechs Bedingungen zufällig zugewiesen. Der Lernerfolg wurde mit Hilfe eines Wissenstests erfasst, bei dem die Lernenden
die einzelnen Teilschritte beim Darstellen eines Designs umsetzen mussten (Cohen’s Kappa=.78).
In den Bedingungen mit vorheriger Modellierung wurde signifikant mehr gelernt als mit nachfolgender Modellierung, F(1,
141)=4.50; p=.036; η²=.032. Auch zeigt sich ein signifikanter Effekt der Art der Lernaufgabe auf den Fertigkeitserwerb, F(2,
141)=7.06; p=.001; η²=.095. Die Lerner, die jeweils zwei gelöste Beispiele verglichen haben, haben signifikant mehr gelernt als
Studierende, die analoge Probleme gelöst haben (p=.025; d=.50) sowie verglichen mit Lernern, die analoge Probleme gelöst
haben und ihre Lösung mit der Modelllösung vergleichen mussten (p<.001; d=.74). Die Interaktion zwischen Zeitpunkt der
Modellierung und Art der Lernaufgabe ist nicht signifikant, F(2, 141)=.068; p=.934; η²=.001.
Im Einklang mit den Befunden von Van Gog et al. (2011) liefert diese Studie Hinweise darauf, dass die Modellierung vor der
Bearbeitung von Lernaufgaben stattfinden sollte anstatt danach. Entgegen der metanalytischen Befunde von Alfieri und Kollegen
(2014) erbrachte diese Studie keinen Hinweis darauf, dass der Zeitpunkt der Modellierung von der Art der Lernaufgabe abhängt.
Der positive Effekt des Vergleichens von Beispielen scheint durch eine bessere Schemabildung zu einem höheren
Fertigkeitserwerb geführt zu haben, da die Problemlöseaufgaben die Lerner womöglich zu Beginn noch überlastet haben (Renkl,
2014). Eine Limitation dieser Studie ist die Art des Lernziels, da es sich hier nicht um eine komplexe Fertigkeit handelt, sondern
um eine strukturierte, regelbasierte Prozedur. Für komplexe Fertigkeiten als Lernziel kann diese Studie daher keine gültigen
Aussagen treffen.
ID: 433
Symposium
Disziplinen-Cluster: Erziehungswissenschaft, Psychologie
Thematisches Cluster: Bildung im Sekundarbereich, Grundschulbildung, Motivation und Emotion
Stichworte: Transition, Sekundarstufe I, Passung, Selbstkonzept, Leistungen
Passung, Selbstkonzept und Leistung beim Übergang in die gegliederte Sekundarstufe I
Chair(s): Markus P. Neuenschwander (Pädagogische Hochschule FHNW)
Diskutant(en): Benjamin Nagengast (Universität Tübingen)
Kinder sind in schulische Kontexte eingebettet, welche die Entwicklung ihrer Fähigkeitsselbstkonzepte und Leistungen
beeinflussen (Lerner et al, 2005). Schulische Kontexte, die den Bedürfnissen der Kinder entsprechen, begünstigen Selbstkonzept
und Leistungen (stage-environment fit, Eccles & Roeser, 2009). Die Analyse von Schulübergängen ermöglicht, den Einfluss der
Schulorganisation auf das Selbstkonzept und die Leistungen der Kinder zu analysieren.
Schulübergänge sind für die Kinder Herausforderungen, deren Bewältigung die Schulkarriere, aber auch die Entwicklung der
Fähigkeitsselbstkonzepte und der Leistungen in den einzelnen Fächern beeinflusst. In schulischen Selektionsprozessen können
erwartete Schulkarrieren korrigiert werden (erwartungswidrige Bildungsverläufe). Es entsteht Durchlässigkeit zwischen
verschiedenen Bildungskanälen. Nach der Selektion müssen sich die Kinder an die neuen Bezugssysteme und Anforderungen
in den Schulformen der Sekundarstufe I anpassen, was ihre Selbstkonzept- und Leistungsentwicklung steuert. In diesem
Symposium wird der Frage nachgegangen, welche erwarteten und erwartungswidrigen Folgen der Übergang in die
Sekundarstufe I auf die individuelle Entwicklung der Passungswahrnehmung, der Fähigkeitsselbstkonzepte, der Leistungen und
der Noten in den einzelnen Fächern hat.
Zur Bearbeitung der Leitfrage berichtet Neuenschwander aus einer entwicklungspsychologischen Perspektive Befunde eines
Schweizer Längsschnittprojekts, wonach mit dem institutionellen Übergang in die Sekundarstufe I die wahrgenommene Passung
Kind-Unterricht reduziert wird. Durch die Gliederung der Sekundarstufe I entstehen leistungshomogenere Lerngruppen, die den
Bedürfnissen der Jugendlichen besser entsprechen sollten.
Hildebrand und Waterman zeigen aus einer pädagogischen Perspektive längsschnittlich, dass die Bewältigung von
Herausforderung und Bedrohung bei Viertklässlern am Ende der Grundschulzeit angesichts der Ungewissheit nach dem
Übergang die Noten in Deutsch und Mathematik in der Sekundarstufe vorhersagt. Sie folgern, dass die Passung zwischen den
kontextuellen Bedingungen und den psychologischen Grundbedürfnisse verbessert werden sollte.
In psychologischer Tradition berichten Rösselet und Neuenschwander längsschnittliche Befunde, dass explizite und implizite
Erwartungen von Lehrpersonen der Primarschule die Leistungsentwicklung vor und nach dem Übergang in die Sekundarstufe I
beeinflussen. Trotz der Selektions- und Anpassungsprozesse erklären Lehrpersonenerwartungen Leistungsveränderungen auch
nach dem Übergang.
Zurbriggen stellt in sonderpädagogischer Tradition Längsschnittbefunde vor, wie sich Selbstkonzepte und Leistungen von
Jugendlichen aus anforderungsreichen Schulformen mit erwartungswidrig tiefen Schulleistungen in der Primarschule entwickeln.
Sie zeigt hypothesenkonform ein deutliches Absinken deren Selbstkonzept und ein Ansteigen deren Leistungen im Vergleich zu
den anderen Jugendlichen. Sie illustriert damit Folgen von erwartungswidrigen Zuweisungen und von Anpassungsprozessen an
die jeweiligen Schulformen der Sekundarstufe I.
Nagengast diskutiert die Befunde auf dem Hintergrund der Leitfrage. Die Ergebnisse zeigen exemplarisch, wie der
Schulübergang zu diskontinuierlichen Veränderungsprozessen von Kindern beiträgt bzw. wie die Leistungsentwicklung nach dem
Übergang frühzeitig vorhergesagt werden kann.
Beiträge des Symposiums
Veränderung der Passungswahrnehmung bei einem frühen oder späten Übertritt in die Sekundarstufe I
Markus P. Neuenschwander
Pädagogische Hochschule FHNW
Schulen begünstigen die Lernmotivation und die Leistungen von Kindern, wenn ihre Angebote mit den altersspezifischen
Bedürfnissen der Kinder korrespondieren (stage-environment-fit, Eccles & Roser, 2009). Passungswahrnehmung bezeichnet die
von den Schülerinnen und Schülern wahrgenommene Passung zwischen sich und dem schulischen Unterricht. Eccles et al.
(1993) postulierten ein starkes Absinken der Passungswahrnehmung beim Übertritt in die US middle school durch die veränderte
Schulorganisation: Die Kinder wechseln von kleinen Schulen in große Schulen mit anonymen Lehrpersonenbeziehungen und
höheren Leistungsanforderungen. Weil die Pubertät bei Mädchen im Durchschnitt früher beginnt als bei Jungen, ist die
Passungswahrnehmung von Mädchen bei einem frühen Schulübertritt wegen der Kumulation von Belastungen tiefer als bei
Jungen (Simmons & Blyth, 1987).
In der Schweiz treten die Kinder in eine gegliederte Sekundarstufe I über mit Schülergruppen, die leistungshomogener als
Primarschulklassen sind. Damit soll die Passung zunehmen. Sinkt die Passungswahrnehmung gleichwohl unabhängig vom Alter
der Kinder in Übereinstimmung mit der Eccles-These beim Übertritt in die Sekundarstufe I in der Schweiz? Wie beeinflusst das
Schülergeschlecht die Veränderung der Passungswahrnehmung zu zwei verschiedenen Übertrittszeitpunkten?
In den Kantonen Aargau und Basel-Landschaft traten die Kinder nach dem 5. Schuljahr in die gegliederte Sekundarstufe I über
(früher Übertritt), in den Kantonen Bern und Luzern nach dem 6. Schuljahr (später Übertritt). Hypothesen: Es wird in der Gruppe
früher Übertritt ein starkes Sinken der Passungswahrnehmung während der Transition vom 5. zum 6. Schuljahr und ein
schwaches Sinken in der Sekundarstufe I vom 6. zum 7. Schuljahr angenommen. Bei der Gruppe später Übertritt wird hingegen
ein schwaches Sinken vom 5. zum 6. Schuljahr der Primarschule und ein starkes Sinken während der Transition vom 6. zum 7.
Schuljahr postuliert.
Methode: Die Hypothesen wurden unter Hinzuziehung von Längsschnittdaten des Projekts „Wirkungen der Selektion WiSel“
überprüft. Es wurden zufällig 50 Klassen mit frühem Übertritt und 49 Klassen mit spätem Übertritt ausgewählt. Die Kinder wurden
im 5., 6. und 7. Schuljahr klassenweise befragt. Die Längsschnittstichprobe umfasste 111 Schülerinnen und 90 Schüler mit
frühem Übertritt und 175 Schülerinnen und 187 Schüler mit spätem Übertritt. Die Passungswahrnehmung wurde reliabel mit 4
Items operationalisiert.
Ergebnisse: Mit Daten des 5. Schuljahres wurden signifikante positive Korrelationen zwischen der Passungswahrnehmung und
Leistungen in Deutsch und Mathematik sowie Lernziel- und Leistungszielorientierung gefunden (Validierung). Die metrische
Messinvarianz der Passungswahrnehmung zwischen den Messzeitpunkten war in beiden Gruppen gegeben. Die Hypothesen
wurden mit latenten Wachstumsmodellen 2. Ordnung getestet. Es wurden nicht-lineare Slopes definiert (früher Übertritt: starkes
Sinken vom 5. zum 6. Schuljahr, schwaches Sinken vom 6. zum 7. Schuljahr; später Übertritt: schwaches Sinken vom 5. zum 6.
Schuljahr, starkes Sinken vom 6. zum 7. Schuljahr). Dieses Wachstumsmodell zeigte für beide Gruppen einen guten Fit. Das
Modell war in beiden Gruppen besser als dasjenige eines Vergleichsmodells mit linearen Slopes. Gruppenvergleiche zeigten,
dass die Passungswahrnehmung (Intercept) bei der Gruppe später Übertritt signifikant höher war als in der Gruppe früher
Übertritt. Die Passungswahrnehmung sinkt in der Gruppe früher Übertritt tendenziell stärker als in der Gruppe später Übertritt
(Slope). Das Geschlecht erklärte nur die Passungswahrnehmung (Intercept) in der Gruppe später Übertritt (Mädchen hatten
höhere Passungswahrnehmung).
Diskussion: In Übereinstimmung mit Eccles & Roeser (2009) ist die Passungswahrnehmung beim frühen Übertritt tiefer als beim
späten Übertritt. Sie nimmt besonders in der Übertrittsphase ab. Die Veränderung der Passungswahrnehmung wird daher nicht
mit dem Alter der Kinder, sondern mit Änderungen der Schulorganisation von der Primar- in die Sekundarstufe I erklärt – trotz
der gegliederten Sekundarstufe I. Der späte Übertritt begünstigt erwartungsgemäß die Passungswahrnehmung von Mädchen.
Beeinflusst das Erleben des Grundschulübergangs als Herausforderung oder Bedrohung die spätere
Leistungsentwicklung in der Sekundarstufe?
Johanna Hildebrandt, Rainer Watermann
Freie Universität Berlin
Der Übergang von der Primarstufe auf die Sekundarstufe I geht einher mit richtungsweisenden Laufbahnentscheidungen und ist
daher von zentraler Bedeutung für die Schulkarrieren junger Schüler (Köller, Watermann & Trautwein, 2004). Wenngleich den
Grundschülern die zahlreichen strukturellen, curricularen, didaktischen und sozialen Veränderungen (Tobbell & O’Donnell, 2013)
nicht vollständig bekannt sein dürften, ist anzunehmen, dass sie dem bevorstehenden Übergang nicht neutral begegnen, sondern
spezifische Erwartungen und Vorstellungen an die neue Schule entwickeln. Vor dem Hintergrund stresstheoretischer
Konzeptionen (z.B. Lazarus & Folkman, 1984) manifestieren sich diese Erwartungen als Herausforderung – verbunden mit
Freude und Zuversicht – aber auch als Bedrohung – verbunden mit Sorgen und Ängsten (z.B. Skinner & Brewer, 2002). Ferner
wird postuliert, dass übergangsbezogene Erwartungen in einem dynamischen Zusammenspiel mit kognitiven, emotionalen und
verhaltensbezogenen motivationalen Merkmalen zu kurz- und langfristigen adaptiven und maladaptiven Anpassungsleistungen
führen (z.B. Lazarus & Folkman, 1984). Hinsichtlich der zunehmenden akademischen Anforderungen auf der Sekundarstufe
(Tobbell & O’Donnell, 2013) sollten sich die Anpassungsleistungen im akademischen Bereich in den Sekundarstufennoten
wiederspiegeln.
Im Vortrag wird auf der Grundlage eines Teildatensatzes der TIMSS-Übergangsstudie (N=1661; TIMSS, Trends in International
Mathematics and Science Study) erstmals der prognostischen Validität von Herausforderung und Bedrohung im Leistungsbereich
hinsichtlich der Leistungsentwicklung (Noten in Deutsch und Mathematik) in der Sekundarstufe nachgegangen. In
Kovarianzanalysen zeigte sich bei Kontrolle der zeitgleich gemessenen Kovariaten zur Grundschule (motivationale Merkmale,
korr
Fly UP