PISA et al.: Nutzung der PISA-Daten aus unterschiedlichen Fachperspektiven
by user
Comments
Transcript
PISA et al.: Nutzung der PISA-Daten aus unterschiedlichen Fachperspektiven
ID: 110 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Ökonomie, Psychologie Thematisches Cluster: Bildung im Sekundarbereich, Kompetenzdiagnostik/ Kompetenzentwicklung Stichworte: PISA, Perspektivenvielfalt, Large-Scale Assessments PISA et al.: Nutzung der PISA-Daten aus unterschiedlichen Fachperspektiven Chair(s): Christine Sälzer (TUM School of Education, ZIB), Jörg-Henrik Heine (TUM School of Education, ZIB) Diskutant(en): Kristina Reiss (TUM School of Education, ZIB) Internationale Large-Scale Assessments liefern eine attraktive Datengrundlage für die psychologische, pädagogische und sozialwissenschaftliche Forschung (Rammstedt & Spinath, 2013). Solche Datensätze, die beispielsweise im Rahmen von PISA generiert und der Öffentlichkeit zur Verfügung gestellt werden, können auf unterschiedliche Weise genutzt werden und bieten zahlreiche Anschlussmöglichkeiten für empirische Forschung. Dieses Symposium verbindet vier Perspektiven aus unterschiedlichen Disziplinen und Forschungsfeldern mit jeweils unterschiedliche Fragen an PISA. Ausgehend von unterschiedlichen theoretischen Ansätzen und den daraus gewonnenen Schlussfolgerungen wird der Mehrwert empirischer Forschung mit PISA-Datensätzen aufgezeigt. Im ersten Beitrag wird aus der Perspektive der empirischen Bildungsforschung kritisch hinterfragt, ob die in PISA gemessenen Kompetenzen tatsächlich weitestgehend in der Schule erworben werden. Die Studie untersucht, inwieweit das absichtliche Versäumen von Unterricht in den Fächern Deutsch, Mathematik und den Naturwissenschaften mit den jeweiligen PISAKompetenzskalen zusammenhängt. Darüber hinaus wird gezeigt, dass sich das fachspezifische Schwänzen von Unterricht auf einer vierdimensionalen Skala abbilden lässt. Die Fächer Sport, Deutsch und Mathematik bilden dabei jeweils eine eigene Dimension, während die naturwissenschaftlichen Fächer Biologie, Physik und Chemie eine gemeinsame Dimension darstellen und demnach häufig alle drei geschwänzt werden. Aus der Sicht der Measurement-Forschung sind die durch PISA gewonnenen Daten insofern begrenzt, als sie keine längsschnittliche Modellierung der erfassten Kompetenzen und ihrer Entwicklung erlauben. Gleichzeitig fehlt bei nationalen Längsschnittuntersuchungen wie dem NEPS in Deutschland oftmals die internationale Verankerung. Eine Verlinkung von PISA 2012 und NEPS steht davon ausgehend im Mittelpunkt des zweiten Beitrags und zeigt auf, inwieweit beispielsweise Schülerinnen und Schüler, welche die Mindeststandards in PISA nicht erreichen bzw. die Regelstandards übertreffen, in der NEPS-Studie längsschnittlich untersucht werden könnten. Die bildungsökonomische Perspektive auf PISA wirft einen vertiefenden Blick auf die Effektivität und mögliche Auswirkungen von Unterrichtsstunden auf die PISA-Ergebnisse in der Schweiz. Der Einsatz ökonometrischer Modelle erlaubt kausale Schlussfolgerungen zur Wirkung von Schulstunden auf Schulleistungen, was im dritten Beitrag auf die Schweizer Daten von PISA 2012 sowie einer Zusatzerhebung übertragen wird. Die signifikanten Unterschiede in den Effekten von Unterrichtsstunden auf die PISA-Ergebnisse zwischen verschiedenen Anforderungsniveaus im Schulsystem der Schweiz werden insbesondere hinsichtlich der Heterogenität der Schulleistungen diskutiert. Die vierte Perspektive dieses Symposiums, Educational Policy, ist ein englischsprachiger Beitrag und widmet sich mit Shanghai einem als „PISA-Sieger“ bekannten Bildungssystem. Es wird untersucht, welchen Mehrwert an Kompetenz dieses Bildungssystem seinen Schülerinnen und Schüler in einem Schuljahr vermittelt. Die Ergebnisse deuten darauf hin, dass innerhalb Shanghais wesentliche Teile des PISA-Erfolgs nicht auf das System, sondern auf die Eingangsvoraussetzungen der Schülerschaft zurückgehen. Dieser Befund wird kritisch diskutiert. Beiträge des Symposiums Wie fachspezifisch ist Schulschwänzen? Analysen zum Antwortverhalten und zum Zusammenhang mit Schülerkompetenzen in PISA 2012 Christine Sälzer, Jörg-Henrik Heine TUM School of Education Large-Scale Assessments wie PISA gehen in der Regel von der Annahme aus, dass die gemessenen Kompetenzen weitestgehend in der Schule erworben werden. Gleichzeitig konzentrieren sich diese Studien meist auf kognitive Kompetenzen. Mittlerweile kommt jedoch den Kontextfragebögen und den darin erhobenen Merkmalen der Schüler, ihrer Schule sowie ihres Umfeldes eine immer größere Bedeutung in Large-Scale Assessments zu (OECD, 2013a; OECD, 2013b). Dass Schülerselbstberichte oftmals die verlässlichste Datenquelle für die Wahrnehmung von Kontextmerkmalen, Einstellungen oder auch Themen mit weitgehend ungesicherter Datenlage sind, stützt diese Entwicklung (Laing, Sawyer & Noble, 1987; Pace, 1985). Das absichtliche, unerlaubte Versäumen von Schulunterricht (‚Schulschwänzen‘, vgl. etwa Ricking, 2006) verletzt unter Umständen die Annahme, dass die in PISA gemessenen Schülerkompetenzen weitestgehend in der Schule erworben wurden. Wenn Schüler absichtlich Unterricht versäumen und sich damit einer institutionellen Lerngelegenheit entziehen, so bleibt zu klären, inwieweit Unterrichtsversäumnisse mit dem Abschneiden im PISA-Test zusammenhängen. Spezifische Fragen zum Schulschwänzen im Schülerfragebogen zu PISA 2012 greifen diese Überlegungen auf und nutzen Schülerselbstberichte als Grundlage für die Analyse zweier Zusammenhänge: (1) Schwänzen Schüler eher gezielt einzelne Fächer oder handelt es sich um ein generalisiertes Verhalten? (2) Inwieweit hängt das fachspezifische Schulschwänzen mit der durchschnittlichen Kompetenz in der entsprechenden PISA-Domäne zusammen? Die Daten für die Analysen in diesem Aufsatz wurden im Rahmen der fünften PISA-Erhebungsrunde (PISA 2012) in Deutschland erhoben (vgl. Prenzel et al., 2013). Die Stichprobe besteht folglich aus den an PISA 2012 beteiligten fünfzehnjährigen Schülerinnen und Schülern (n = 5001). Die durchschnittliche Kompetenz der Jugendlichen in den drei untersuchten Domänen Mathematik, Lesen und Naturwissenschaften wurde anhand der PISA-Kompetenztests erfasst. Alle weiteren Variablen wurden über den Schülerfragebogen erhoben. Ergänzend zu den international vorgegebenen Fragen zum Zu-spät-Kommen oder Schwänzen einzelner Stunden bzw. ganzer Schultage in den beiden vollständigen Schulwochen vor dem PISA-Test wurden dem Schülerfragebogen in Deutschland vertiefende Fragen zum Schulschwänzen in einzelnen Fächern im gesamten laufenden Schuljahr hinzugefügt. Forschungsfrage (1) wurde in zwei Schritten untersucht. Zunächst wurde überprüft, ob sich die einzelnen Items zur Erfassung des Schwänzens in den einzelnen Fächern auf einer eindimensionalen Skala zum Schulschwänzen abbilden lassen. Hierzu wurden sechs fachspezifische Items zum Schulschwänzen mit Hilfe des R-Pakets pairwise (Heine, 2014) skaliert und einer Rasch-Residual-Faktorenanalyse unterzogen (Linacre, 1998). Auf diese Weise kann gezeigt werden, ob Schülerinnen und Schüler, die ein Fach gezielt schwänzen, auch dazu neigen, andere Fächer zu versäumen (was für ein eindimensionales Konstrukt spräche) oder ob es sich beim Schwänzen um ein möglicherweise einzelfachspezifisches Verhalten und damit um ein mehrdimensionales Konstrukt handelt. Forschungsfrage (2) wurde anhand einer Regressionsanalyse zur Vorhersage der durchschnittlichen Kompetenz in Mathematik, Lesen und Naturwissenschaften anhand einiger Kontrollvariablen sowie dem fachspezifischen Schwänzen untersucht. Die Ergebnisse zeigen, dass es sich beim Schulschwänzen um ein vierdimensionales, fachspezifisches Konstrukt handelt. Am häufigsten wird der Sportunterricht geschwänzt (Dimension 1), Deutsch und Mathematik als Kernfächer bilden jeweils eine weitere Dimension. Die vierte Dimension besteht aus den drei naturwissenschaftlichen Fächern Biologie, Chemie und Physik. Wer Sport schwänzt, schwänzt nicht zwingend auch andere Fächer, wohingegen die Positionierung der drei naturwissenschaftlichen Fächer auf einer Dimension nahe legt, dass Schüler ihr Verhalten in Bereich Naturwissenschaften fachübergreifend generalisieren. Ferner weisen die Ergebnisse auf substantielle Zusammenhänge zwischen dem fachspezifischen Schulschwänzen und dem jeweils erreichten Niveau in den einzelnen Kompetenz-Domänen hin. Je weniger Unterricht die Schüler versäumt haben, desto besser schneiden sie in der jeweiligen PISA-Domäne ab. Mathematische Kompetenz in nationalen und internationalen Large Scale Assessments messen: Eine Linking-Studie von PISA und dem nationalen Bildungspanel (NEPS) in Deutschland Ann-Katrin van den Ham1, Timo Ehmke2, Christine Sälzer3, Jörg-Henrik Heine3 1 IPN Kiel, 2Leuphana Universität Lüneburg, 3TUM School of Education, ZIB Im Rahmen der Gesamtstrategie zum Bildungsmonitoring der der Ständigen Konferenz der Kultusminister der Länder (2006) dient PISA als wichtiges Instrument zur Erfassung und internationalen Verankerung der Leistungsfähigkeit von Schülerinnen und Schülern am Ende der Sekundarstufe I. Mit der Perspektive von Bildung als lebenslangem Prozess, welcher als Voraussetzung für eine aktive Partizipation als Bürger in einer demokratischen Gesellschaft gilt, ist jedoch auch die Notwendigkeit für längsschnittliche Bildungsforschung entstanden. Um Einsicht in den Bildungsprozess und die Kompetenzentwicklung zu erhalten, wurde in Deutschland die National Educational Panel Study (NEPS) entwickelt (Blossfeld et al., 2011). Obwohl beide Studien u.a. die mathematische Kompetenz erfassen, lassen sich die Studienergebnisse nicht direkt in Beziehung setzen, da sie auf unterschiedlichen Rahmenkonzeptionen und Berichtsskalen beruhen. Eine Verlinkung der Kompetenzskalen von NEPS und des PISA bietet jedoch die Möglichkeit, die Befunde aus dem NEPS-K9-Mathematiktest in dem internationalen Referenzrahmen von PISA zu interpretieren sowie die Testwerte des NEPS-Tests in den kriterialen Bezugsrahmen aus PISA einzuordnen. Auf diese Weise böte eine Verlinkung zusätzliche Möglichkeiten bildungspolitisch relevanter Interpretation der NEPS-Testwerte. So könnten durch das Multikohortendesign der NEPS-Studie die Verteilungen der Schülerinnen und Schüler aufeinanderfolgender Kohorten auf den Kompetenzstufen miteinander verglichen und Trendaussagen hierzu getroffen werden. Außerdem könnten je nach Stärke des Linking beispielsweise Schülerinnen und Schüler, welche die Mindeststandards nicht erreichen bzw. die Regelstandards übertreffen, in der NEPS-Studie längsschnittlich untersucht werden und etwa geklärt werden, welche Bedingungsfaktoren dafür verantwortlich sind. Ein solches Linking setzt nach Kolen und Brennan (2004) voraus, dass sich die Studien hinsichtlich der (1) Schlussfolgerungen, (2) Population, (3) Messeigenschaften und -bedingungen sowie der (4) operationalisierten Konstrukte hinreichend ähnlich sind. Diese konzeptionelle Ähnlichkeit wurde bereits als erste Voraussetzung für eine mögliche Verortung der NEPS-Testwerte auf der mathematischen Kompetenzskala aus PISA bestätigt (van den Ham, Nissen, Ehmke, Sälzer & Roppelt, 2014). In diesem Vortrag soll nun die Verlinkung der Skalen des NEPS-K9-Mathematiktests und PISA Mathematiktests aus 2012 vorgestellt und die Robustheit des Linking über Subgruppen sowie die Klassifikationskorrektheit auf die Kompetenzstufen aus PISA untersucht werden. Dafür wurde eine Linkingstudie durchgeführt, in welcher N = 1270 Schülerinnen und Schülern der neunten Klassenstufe aus 80 Schulen in einem Single-Group-Design sowohl Mathematikaufgaben aus PISA 2012 als auch aus dem NEPS bearbeiteten. In einem ersten Schritt wurde die statistische Vergleichbarkeit der Verteilungen der Testwerte aus dem PISA-Test und dem NEPS-Test der Linkingstudie analysiert. Anschließend wurde das Linking mit Hilfe eines Equipercentile Equating durchgeführt und die entstehenden Verteilungen der NEPS-Testwerte auf der PISA-Skala für die Gesamtgruppe und für die Subgruppen mit der ursprünglichen Verteilung der Testwerte auf der PISA-Skala verglichen. Abschließend wurde die Klassifikationskorrektheit des Linking bezüglich der Einordnung in die Kompetenzstufen analysiert. Die Ergebnisse zeigen, dass die Studien zwar mit einer latenten Korrelation von r = .90 deutlich miteinander zusammenhängen, sie jedoch nicht untereinander austauschbar sind (keine score interchangeability). Dennoch wird durch das Skalenlinking eine zum PISA-Test vergleichbare Verteilung der äquivalenten Ergebniswerte erzeugt. Die mittlere Klassifikationskorrektheit des Linking auf die Kompetenzstufen beträgt PÜ = 42% und weist auf Ungenauigkeiten in der individuellen Zuordnung hin. In Bezug auf diese Ergebnisse soll abschließend diskutiert werden, inwiefern das Skalenlinking trotz der gefundenen Ungenauigkeiten Interpretationen der NEPS-Testwerte erweitern kann. Die Effektivität von Schulstunden am Beispiel von PISA 2012 Stefan Wolter1, Maria A. Cattaneo2, Chantal Oggenfuss2 1 Universität Bern und SKBF, 2SKBF Anhand der internationalen PISA Daten (2006) hat Lavy (2014) mittels ökonometrischer Modelle die kausale Wirkung von Schulstunden auf Schulleistungen untersucht und zudem Faktoren, welche Unterschiede in der Effektivität der Schulstunden zwischen Ländern zu erklären vermögen. Wir replizieren die Analysen von Lavy mit Schweizer Daten aus der PISA 2012 Erhebung, welche es uns erlaubt, die Heterogenität in den Schulstunden innerhalb der Schweiz für die kausale Identifikation des Effektes von Schulstunden auf PISA-Leistungen zu gebrauchen. Dabei erweitern wir den Ansatz von Lavy, indem wir nicht nur die von den Schülerinnen und Schülern angegebenen Schulstunden für die Analysen verwenden, sondern auch Daten zu den offiziell vorgegebenen Schulstunden. Weiter erlaubt es uns der Schweizer Datensatz eine Anzahl potentiell wichtiger Kontrollvariablen zu verwenden, welche darüber Auskunft geben, ob die Schülerinnen und Schüler Zusatzunterricht genossen haben und falls ja aus welchen Gründen. Zusätzlich enthält der 2012er Datensatz auch detaillierte Angaben zu ausserschulischem Nachhilfeunterricht aus einer Schweizer Zusatzerhebung zum PISA Test von 2012. Nach der Replikation der Untersuchung von Lavy und einem Vergleich der Ergebnisse untersuchen wir die Effektivität der Schulstunden getrennt nach Anforderungsniveau im mehrgliedrigen Schulsystem der Schweiz und potentielle Erklärungen für die gefundenen, signifikanten Unterschiede der Effektivität der Schulstunden in den einzelnen Anforderungsniveaus und diskutieren die sich daraus ergebenden Herausforderungen für das Schulsystem und die Lehrerbildung. Zum Schluss präsentieren wir eine Ausweitung der Methode von Lavy auf den Einfluss der Schulstunden auf die Heterogenität der Schulleistungen in einer Schule. Does Shanghai really have the world’s ‘best schools’? John Jerrim University College London The Programme for International Student Assessment (PISA) is an important cross-national study of secondary school pupils academic achievement. Results from PISA, released every three years, are now eagerly awaited by academics, journalists and public policymakers alike. It has been widely reported that the ‘top-performing’ education system in PISA 2009 and 2012 was the Chinese province of Shanghai. This has led to widespread interest in how Shanghai achieves such high PISA test scores, and what other jurisdictions can do to replicate their success. A common explanation is that this economy simply has the ‘best’ schools and the most effective schooling system. This has led governments, such as England’s, to visit Shanghai to try and important their teaching methods into the West. It is also a view that has been supported by the OECD, with Andreas Schleicher reflecting upon ‘what Asian schools can teach the rest of the world’. Yet such explanations represent a fundamental misunderstanding of the limitations of PISA, and what the data can and cannot show. Specifically, as a cross-sectional study, PISA tells us little about how children progress during their time at school, and thus the ‘value-added’ within any given schooling system. Consequently, PISA actually tells us very little as to which economies have the best (and the worst) schools. In this paper, I will present empirical evidence to illustrate this argument, using PISA 2009 and 2012 data from Shanghai. Using a fuzzy Regression Discontinuity Design (RDD) approach, I illustrate how children within Shanghai make essentially no academic progress during one specific school year. In other words, I demonstrate how ‘the world’s best education system’ actually adds almost no value to children’s mathematics, reading and science test scores. I reflect upon this finding in the conclusions, noting how the PISA study needs to further develop in order to increase its usefulness in informing educational policy. ID: 147 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktik Mathematik Thematisches Cluster: Mathematisch-naturwissenschaftlicher Unterricht, Trainings- und Evaluationsforschung, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Interventionsstudien; Interdisziplinär; Mathematik; Unterricht Psychologische, erziehungswissenschaftliche und fachdidaktische Interventionsansätze im Unterricht mit Modellierungsaufgaben Chair(s): Stanislaw Schukajlow (Universität Münster), Cornelia S. Große (Universität Bremen) Diskutant(en): Alexander Renkl (Universität Freiburg) Die Wissenschaftsdisziplinen Psychologie, Erziehungswissenschaft und Mathematikdidaktik beschäftigen sich u.a. mit Forschung zu wirksamen Interventionen im Unterricht. Allerdings ist nicht abschließend bekannt, inwieweit Erkenntnisse aus anderen Disziplinen rezipiert werden und in welchem Ausmaß die „eigene“ Wissenschaftsdisziplin an entscheidenden Stellen im Forschungsprozess die Oberhand gewinnt. Im Symposium sollen vier Interventionsstudien präsentiert und die Gemeinsamkeiten und Unterschiede darin diskutiert werden. Für das Symposium wurden Studien ausgewählt, die von der DFG im Rahmen verschiedener Förderrichtlinien (DFG-Kolleg, Sachbeihilfe, Schwerpunktprogramm) finanziell unterstützt wurden. Die Studien wurden von einer Psychologin, von einem Fachdidaktiker sowie von zwei interdisziplinären Teams beantragt. Alle diese Studien beschäftigen sich mit der Förderung der Modellierungskompetenz im Unterricht, die im Wesentlichen in anspruchsvollen Übersetzungsprozessen zwischen Realität und Mathematik besteht (Blum et al. 2007). Die Fokussierung auf eine zentrale mathematische Kompetenz soll Vergleiche der Arbeitsweisen verschiedener Arbeitsgruppen erleichtern und so zu einem wissenschaftlichen Diskurs beitragen. Ein weiterer, spezifischer Erkenntnisgewinn des Symposiums ist durch den Austausch zu effizienten Interventionsansätzen (Auswahloptionen, multiple Lösungen, Formatives Assessement bzw. selbsterstellte Repräsentationen) im Unterricht mit Modellierungsaufgaben zu erwarten. Defizite von Lernenden bei der Bearbeitung von anspruchsvollen realitätsbezogenen Problemen wurden vielfach nachgewiesen (Klieme 2010). Eine Konsolidierung der Erkenntnisse zur Förderung der Modellierungskompetenz kann wichtige Anhaltspunkte für weitere Untersuchungen anbieten. Der erste Beitrag greift die Möglichkeit auf, Lernenden Auswahloptionen bei der Bearbeitung von Modellierungsaufgaben anzubieten, um Übersetzungsprozesse zwischen Mathematik und Realität zu erleichtern. Lernenden der Jahrgangsstufe 8 wurden für Übersetzung und Interpretation mehrere Varianten dargeboten, und sie sollten entscheiden, welche jeweils korrekt waren. Auswirkungen auf subjektiven und objektiven Lernerfolg werden dargestellt und diskutiert. Im zweiten Beitrag werden die Wirkungen der Behandlung multipler mathematischer Lösungswege auf Modellierungsleistungen von Lernenden in der Jahrgangsstufe 9 untersucht. Hierfür wurde ein Mediationsmodell angenommen, das bereits für eine andere Art multipler Lösungen positiv evaluiert wurde. Der dritte Beitragbezieht sich auf die Untersuchung des Formativen Assessments im Mathematikunterricht der Sekundarstufe I. In der durchgeführten Interventionsstudie wurden Effekte des prozessorientierten Feedbacks und Wechselwirkungen mit der wahrgenommenen Unterrichtsqualität auf Schülerleistungen beim Modellieren analysiert. Im vierten Beitrag wurden Lernenden der Primarstufe trainiert, verschiedene Repräsentationen zu problemhaltigen Textaufgaben zu erstellen. Im Mittelpunkt des Forschungsinteresses standen der Einfluss eines solchen Trainings sowie die Wirkung verschiedener Repräsentationsarten auf die Leistungen von Schülerinnen und Schüler. Abschließend werden die Beiträge von Alexander Renkl diskutiert. Beiträge des Symposiums Können Auswahloptionen die Bearbeitung von Modellierungsaufgaben unterstützen? Cornelia S. Große Universität Bremen Die Fähigkeit, Mathematik in Alltagssituationen zu nutzen, wird zunehmend betont, und der Erwerb von Modellierungskompetenzen ist ein explizites Ziel des Mathematikunterrichts. Konstruktivistische Theorien betonen die Wichtigkeit von realen Kontexten zur Unterstützung von Verstehen und Transfer und die Bedeutung von situiertem Lernen in konkreten Kontexten (z.B. Reinmann & Mandl, 2006). Kontextgebundene Modellierungsaufgaben stellen allerdings hohe Anforderungen an die Lernenden, da Realsituationen in mathematische Notationen übersetzt werden müssen, und nach der Durchführung von mathematischen Berechnungen die Ergebnisse im Hinblick auf die Realsituation zu inter-pretieren sind. Häufig verlieren Lernende dabei die Realität aus den Augen (z.B. Verschaffel, De Corte & Lasure, 1994) und haben große Schwierigkeiten, Übergänge zwischen Realität und Mathematik zu vollziehen (Blum, 2007). Es wurden einige Versuche unternommen, den Erwerb von Modellierungskompetenzen zu fördern; beispielsweise konnten Schukajlow und Blum (2011) positive Effekte eines auf selbständige Schü¬lerarbeit ausgerichteten, kognitiv aktivierenden Unterrichts auf Modellierungskompetenzen nachweisen. Aus einer pädagogisch-psychologischen Perspektive ist es aussichtsreich, Lernenden ausgearbeitete Lösungsschritte zur Verfügung zu stellen, um Verstehen und Transfer zu fördern. Um die Lernenden einerseits von der Anforderung zu entlasten, Übersetzungsschritte selbst zu leisten, und sie aber dennoch zu „zwingen“, sich aktiv mit Übergängen zu beschäftigen, sollten die Lernenden im hier dargestellten Experiment aus vorgegebenen Auswahloptionen die jeweils korrekten auswählen. Es nahmen 147 Achtklässler (Alter: M = 13.98, SD = .55; 79 Mädchen) in vier Versuchsgrup¬pen teil: In der Gruppe „mit Übersetzungs- und Interpretationsoptionen“ sollten die Lernenden zunächst aus Auswahloptionen eine richtige Übersetzung von der verbalen Beschreibung zur mathematischen Notation auswählen, dann waren innermathematische Berech¬nungen selbständig durchzuführen, und zum Schluss sollte aus Auswahloptionen eine passende Interpretation ausgewählt werden. In der Gruppe „nur mit Übersetzungsoptionen“ bekamen die Teilnehmenden Auswahloptionen nur für den Übersetzungsteil und mussten die restlichen Schritte selbst bearbeiten. In der Gruppe „nur mit Interpretationsoptionen“ begannen die Lernenden mit einer selbständigen Bearbeitung und erhielten Auswahloptionen für den Interpretationsschritt. In der Gruppe „ohne Optionen“ waren alle Schritte selbständig auszuführen. In einem Nachtest wurden von allen Lernenden zwei Modellierungsaufgaben ohne Hilfestellung bearbeitet. In Bezug auf den Erwerb von Übersetzungskompetenzen zeigte sich eine Effektivität der Übersetzungsoptionen in Aufgabe 1 (F(1, 142) = 8.99, p = .003, partial η² = .060), jedoch nicht in Aufgabe 2 (F(1, 142) = .74, p = .392). Für den Erwerb von Interpretationskompetenzen erwiesen sich Interpretationsoptionen als nicht effektiv (in Aufgabe 1: F(1, 142) = .26, p = .611; in Aufgabe 2: F(1, 142) = .12, p = .725). Ergänzend zu einer Analyse des objektiven Lernerfolgs wurde auch die subjektive Sicht der Lernenden untersucht. Die alleinige Präsentation von Interpretationsoptionen wurde am positivsten bewertet, die alleinige Präsentation von Übersetzungsoptionen am negativsten. Dabei erreichte der Haupteffekt „Übersetzungsoption“ die Signifikanzgrenze (F(1, 141) = 5.37, p = .022, partial η² = .037); weder der Haupteffekt „Interpretationsoptionen“ noch der Interaktionseffekt waren signifikant (F(1, 141) = 1.01, p = .316, und F(1, 141) = .30, p = .585). In der Gesamtschau zeigt sich, dass Übersetzungsoptionen hilfreich sein können, aber von den Lernenden nicht gut akzeptiert werden; demgegenüber werden Interpretationsoptionen zwar akzeptiert, sind aber nicht lernförderlich. Dass die Effektivität der Übersetzungs- und Interpretationsoptionen geringer war als erwartet, und dass sich die subjektive Sicht mit der objektiven Sicht kaum deckt, kann daran liegen, dass trotz Auswahloptionen ein hohes Maß an eigener kognitiver Aktivität erforderlich war, und dass die Anforderungen insgesamt sehr hoch waren. Dieses Experiment zeigt, dass beim Erwerb von Modellierungskompetenzen die Förderung von objektivem Lernerfolg und subjektiven Variablen nicht notwendigerweise deckungsgleich sind. Dies ist ein Aspekt, der im Hinblick auf den Mathematikunterricht von großer Relevanz ist. Die Ergebnisse verdeutlichen, wie wichtig es ist, die Diskussion um die Förderung von Modellierungskompetenzen auf eine breitere Basis zu stellen. Der Einfluss multipler mathematischer Lösungswege beim Modellieren auf Schülerleistungen Kay Achmetli, Stanislaw Schukajlow Universität Münster Theoretischer Hintergrund und Fragestellung Die Entwicklung und der Vergleich multipler Lösungen gelten als wichtige Elemente für einen kognitiv aktivierenden Unterricht und sind fest in den Bildungsstandards verankert (National Council of Teachers of Mathematics, 2000). Es konnten mehrheitlich positive Effekte multipler Lösungen empirisch gezeigt werden (Große & Renkl, 2006; Rittle-Johnson & Star, 2007). Ein wichtiges Ziel des Mathematikunterrichts ist die Entwicklung multipler Lösungen zu Aufgaben mit Realitätsbezug. Lösungsprozessanalysen (Blum & Leiss, 2007) zeigen, dass es verschiedene Möglichkeiten gibt, multiple Lösungen zu realitätsbezogenen Aufgaben zu entwickeln. Zum einen können multiple mathematische Lösungswege erstellt werden, indem verschiedene mathematische Verfahren verwendet werden (bspw. Tabelle und Graph). Zum anderen können verschiedene Annahmen zu fehlenden Angaben getroffen und die Aufgabe mit einem mathemati-schen Verfahren gelöst werden (Schukajlow & Krug, 2014). Der Einfluss der Behandlung multipler Lösungen, die durch das Treffen unterschiedlicher Annahmen bei Modellierungsaufgaben entstehen, auf Leistungen wurde bereits untersucht (Schukajlow, Krug, & Rakoczy, 2015). Hierbei konnten indirekte Effekte von multiplen Lösungen auf Leistungen über die Anzahl der entwickelten Lösungen sowie das Kompetenzerleben (Deci & Ryan, 2000) gezeigt werden. Da die Art der multiplen Lösungen eine Rolle für Leistungen spielt (Große & Renkl, 2006), sollen die Effekte der Behandlung der multiplen mathematischen Lösungswege auf Leistungen mittels des Mediationsmodells von Schukajlow et al. (2015) untersucht werden. Dabei soll der folgenden Forschungsfrage nachgegangen werden: • Gibt es indirekte Effekte der Unterrichtsbedingung auf die Leistungen im Nachtest über die Anzahl der Lösungen und das Kompetenzerleben? Methode An der Studie nahmen 307 Lernende (48,26% weiblich, im Mittel 14,6 Jahre alt) aus vier Gesamtschulen teil. Die Klassen wurden leistungs- und geschlechtsverhältnishomogen in zwei Gruppen aufgeteilt und den Unterrichtsbedingungen „multiple mathematische Lösungswege (mmL)“ und „ein mathematischer Lösungsweg (emL) zugewiesen. Die Lernenden wurden vier Stunden lang von geschulten Lehrkräften in separaten Räumen unterrichtet. Um den Einfluss der Lehrerpersönlichkeit in den Bedingungen konstant zu halten, hat jede Lehrkraft die mmL und emL-Bedingungen unterrichtet. In beiden Bedingungen wurden parallele Versionen der gleichen Aufgaben bearbeitet. In der mmL-Bedingung sollten die Lernenden zum Lösen der Aufgaben zwei mathematische Lösungswege und in der emL-Bedingung einen mathematischen Lösungsweg verwenden. Die Analyse des Materials zeigt eine adäquate Umsetzung des Treatment (Achmetli, Schukajlow, & Krug, 2014). Die Leistungen im Vor- und Nachtest wurden mithilfe einer (dichotom skalierten) prozeduralen und einer (partial credit skalierten) konzeptuellen Wissensdimension erfasst. Das Kompetenzerleben (3 Items, Cronbachs Alpha= .74) wurde mithilfe einer 5stufigen Likert-Skala (1=stimmt gar nicht, 5=stimmt genau) erhoben und die Anzahl der entwickelten Lösungen von zwei unabhängigen Ratern mit sehr guter Übereinstimmung (Cohens Kappa >.96) kodiert. Ergebnisse und Diskussion Das aufgestellte Mediationsmodell weist für beide Wissensdimensionen gute fit-Indizes (prozedural: CFI=0.992, SRMR=0.04 konzeptuell: CFI=0.985, SRMR=0.05) und es können 25% der Varianz des prozeduralen Wissens sowie 17% der Varianz des konzeptuellen Wissens im Nachtest erklärt werden. Die indirekten Effekte der Unterrichtsbedingung auf das Kompetenzerleben lassen sich für beide Dimensionen bestätigen (β=0.26, p<.01 bzw. β=0.25, p<.01). Allerdings gibt nur in einer Dimension indirekte Effekte der Unterrichtsbedingung auf die Nachtestleistung (β=0.03, p=.25 bzw. β=0.10, p<.05). Die Ergebnisse von Schukajlow et al. (2015) lassen sich teilweise bestätigen. Wie in anderen Studien (Rittle-Johnson & Star, 2007) lassen sich positive Effekte multipler Lösungen auf Unterrichtswahrnehmungen und Leistungen nachweisen. Allerdings ist die Art der entwickelten Lösungen von Bedeutung für die Effekte auf Leistungen (Große & Renkl, 2006). Ebenfalls erscheinen die gewählten Leistungsdimensionen (konzeptuell, prozedural, Flexibilität usw.) für die Untersuchung von multiplen Lösungen bedeutsam (Star & Rittle-Johnson, 2008). Formatives Assessment im Unterricht zum mathematischen Modellieren - Effekte einer Intervention und Wechselwirkungen mit der wahrgenommenen Unterrichtsqualität auf die Schülerleistung Petra Pinger1, Katrin Rakoczy1, Michael Besser2, Eckhard Klieme1 1 DIPF, Frankfurt, 2PH Freiburg Theoretischer Hintergrund: Formatives Assessment wird insbesondere in der anglo-amerikanischen Literatur als vielversprechende Unterrichtspraktik beschrieben (z.B. Black & Wiliam, 2009). Neben der Diagnose des Lernstandes, stellt die lernförderliche Rückmeldung der Assessmentinformationen ein zentrales Element dar (z.B. Black & Wiliam, 2009). Die prozessorientierte Rückmeldung hat sich unter Laborbedingung als besonders unterstützend erwiesen (z. B. Rakoczy, Harks, Klieme, Blum, & Hochweber, 2013). Bei dieser schriftlichen Rückmeldung erfährt der Lernende, welche für die Aufgabenlösung erforderlichen Prozesse bereits beherrscht werden (Stärken), in Bezug auf welche Prozesse noch Defizite bestehen (Schwächen), sowie Hilfestellungen zur Überwindung der Diskrepanz zwischen Lernstand und Lernziel (Strategien). Für die Leistungsentwicklung von Schülerinnen und Schülern hat sich in der bisherigen Forschung jedoch weniger die eingesetzte Unterrichtspraktik, sondern insbesondere auch die allgemeine Unterrichtsqualität als bedeutsam erwiesen (Kognitive Aktivierung, Unterstützendes Klima und Klassenführung; Klieme, Pauli & Reusser, 2009). In Bezug auf Leistung und Motivation profitieren Lernende von einem Unterricht, der geregelt abläuft, in dem herausfordernde Probleme gestellt werden und in dem sie konstruktiv unterstützt werden (z. B. Lipowsky, 2009). Die Bisherige Forschung weist außerdem auf eine positive Wechselwirkung zwischen der von Lernenden wahrgenommenen allgemeinen Unterrichtsqualität und formativem Assessment hin (Decristan et al., 2015). Ziel der hier dargestellten Studie war es zum einen, prozessorientiertes Feedback in Form einer Intervention zum formativen Assessment in den Mathematikunterricht zum Modellieren zu implementieren. Zum anderen wurden Effekte der Intervention, der wahrgenommenen Unterrichtsqualität und der Wechselwirkung von Unterrichtsqualität und Intervention auf die Leistungsentwicklung untersucht. Methode: Für die Analysen wurden Daten aus der Interventionsstudie des Projekts „Conditions and Consequences of Classroom Assessment (Co²CA)“ genutzt. Insgesamt haben 39 Mathematiklehrkräfte mit ihren 9. Klassen (N = 966 Schüler) an der Studie teilgenommen. Diese wurden zufällig auf zwei Interventionsgruppen (N = 24) und eine Kontrollgruppe (N = 15) verteilt. Alle Lehrkräfte wurden geschult, eine aus 13 Unterrichtsstunden bestehende Unterrichtseinheit durchzuführen. Ziel der Unterrichtseinheit war es, die Schülerinnen und Schüler in vier aufeinander aufbauenden Phasen an die Bearbeitung von Modellierungsaufgaben im Themenbereich „Satz des Pythagoras“ heranzuführen: (1) Beweis und innermathematische Probleme, (2) „eingekleidete“ Textaufgaben, (3) Modellierungsaufgaben, (4) Konsolidierung. Die Lehrkräfte in den Interventionsgruppen wurden darüber hinaus trainiert, zu drei Zeitpunkten (jeweils nach Phase 1-3) die Leistung der Lernenden anhand von Diagnoseaufgaben zu erfassen und schriftliche lösungsprozessbezogene Rückmeldungen zu geben. Die Schülerleistung wurde anhand von einem Prätest (19 Items; EAP/PV Reliabilität = .66) und einem Posttest (17 Items; EAP/PV Reliabilität = .74) erfasst. Die Lernenden wurden darüber hinaus nach ihrer Einschätzung zu den Unterrichtsqualitätsmerkmalen „prozessorientierter Unterricht“ (kognitive Aktivierung; 5 Items; Cronbachs α = .78), „Rückmeldepraxis“ (unterstützendes Klima; 5 Items; Cronbachs α = .82) und „Zeitnutzung“ (Klassenführung; 4 Items; Cronbachs α = .74) befragt. Für die durchgeführten Mehrebenenanalysen in MPlus7 wurden die Unterrichtsqualitätsskalen auf Klassenebene aggregiert. Ergebnisse/Diskussion: Entgegen unserer Erwartungen, wurde kein Effekt der Intervention auf die Schülerleistung gefunden. Die drei Unterrichtsmerkmale zeigten in der Kontrollgruppe die erwartete positive Wirkung. Die gefundene negative Interaktion zwischen der Intervention und allen drei Unterrichtsmerkmalen (prozessorientierter Unterricht: β = -.3, p < .05; Rückmeldepraxis: β = -.21, p < .05; Zeitnutzung: β = -.3, p < .05) weist darauf hin, dass die halbstandardisierte prozessorientierte Rückmeldung unserer Intervention Effekte der Unterrichtsmerkmale kompensiert. Das bedeutet, die Intervention führt bei Lehrkräften, deren Unterricht ursprünglich weniger prozessorientiert ist, eine ungünstigere Rückmeldepraxis aufweist oder die Unterrichtszeit weniger effizient nutzt zu positiverer Leistungsentwicklung. Dagegen scheinen die Lernenden von Unterricht, der von ihnen anhand der genannten Merkmale als qualitativ hochwertig wahrgenommen wird, leistungsmäßig weniger zu profitieren, wenn zusätzlich die Intervention zu formativem Assessment durchgeführt wird. Diese Wechselwirkung kann als Hinweis interpretiert werden, dass die klaren Vorgaben der Intervention für Lehrkräfte, deren Unterricht eine hohe Qualität aufweist, Einschränkungen erzeugen und sich somit negativ auswirken. Problemhaltige Textaufgaben + selbstgenerierte Repräsentationen = Lösungserfolg? Nina Sturm, Renate Rasch, Wolfgang Schnotz Universität Koblenz-Landau THEORETISCHER HINTERGRUND UND FRAGESTELLUNG Die anspruchsvolle mathematische Struktur und Komplexität von Problemaufgaben stellt für viele Grundschulkinder eine Barriere dar, die sie nicht ohne weiteres überwinden können (Bruder & Collet, 2011; Hussy, 1993; Rasch, 2001). Solche herausfordernden, aber lösbaren Aufgaben bewirken eine größere Anstrengungsbereitschaft, wodurch die Zone der nächsten Entwicklung erreicht werden kann (Wygotski, 1964). Das Gelernte muss an die Aufgabensituation angepasst und dabei neu durchdacht, umstrukturiert bzw. miteinander verknüpft werden (Rasch, 2001; Verschaffel, Greer, & De Corte, 2000). Die Konstruktion externer Repräsentation kann helfen diese geforderten Prozesse zu vollziehen (Anderson, 1996; Duncker, 1974; Schnotz, Baadte, Müller, & Rasch, 2011). Sie sind lösungsunterstützend, da sie das Arbeitsgedächtnis entlasten und die Aufgabenbedingungen nicht im Kopf präsent gehalten werden müssen. Die freien Kapazitäten können für die Lösungsfindung verwendet werden (Schnotz u. a., 2011; Sweller, 2005). Trotz ihrer vielfältigen Vorteile greifen die wenigsten Novizen von sich aus beim Lösen von Textaufgaben auf externe Repräsentationen zurück (Groß, 2013; Hohn, 2012; Rasch, 2001). Bevor Lernende Repräsentationen als Hilfsmittel und nicht als Mehraufwand wahr- und annehmen, müssen sie Erfahrungen im Umgang mit ihnen sammeln, eigenständig deren Vorteile kennenlernen und lernen wie man nach adäquaten Repräsentationen für vorliegende Probleme sucht (Rasch, 2001). Nur so entwickelt sich ein Repertoire an externen Repräsentationen, auf welches sie bei der Bearbeitung des gerade zu lösenden Problems zurückgreifen können (Cox, 1999; Kindfield, 1993). Für die Unterrichtspraxis ist von Interesse, ob es bestimmte Repräsentationen gibt, die Lernenden eher helfen Probleme erfolgreich zu bewältigen. Da die Studie einen Beitrag für den Mathematik-unterricht der Primarstufe anstrebt, ergibt sich folgende Forschungsfrage: Welche Repräsentationen sind gute Prädiktoren, um den Erfolg beim Lösen problemhaltiger Textaufgaben vorherzusagen? METHODE An der Untersuchung nahmen 366 Lernenden aus 20 dritten Jahrgangsstufen teil. Jede Klasse bearbeitete in einer Mathematikstunde pro Woche über einen Zeitraum von 12 Wochen eine problemhaltige Textaufgabe. Die Hälfte aller Klassen nahm an einem Repräsentationstraining teil, welches die Kinder anregte externe Repräsentationen zu generieren und für die Lösungsfindung zu nutzen. Die restlichen 10 Klassen bearbeiteten die Aufgaben mit ihrer regulären Lehrkraft. Insgesamt lagen der Auswertung 1071 schriftliche Bearbeitungen der Drittklässler aus dem Nachtest (3 Aufgaben) zugrunde. Die Kodierung des Lösungserfolges einer Testaufgabe entsprach dem Aufgabenscore und erfolgte dichotom mit 0 (falsche oder keine Lösung) und 1 (richtige Lösung). Der Lösungserfolg für den gesamten Test, der Testscore, bildet den Mittelwert aller drei Aufgabenscores ab. Die Kodierung der Schülerrepräsentationen basierte auf einer qualitativen und quantitativen Inhaltsanalyse (Sturm, Wahle, Rasch, & Schnotz, 2015). Die Hauptachsenanalyse (29 Items) identifizierte vier Faktoren: Zeichnung, Rechnung, Tabelle und Begründung (Sturm u. a., 2015). Dabei wurde schlechte (-1), mittlere (0) und hohe Qualität (1) unterschieden (s. ebd.). Einflussfaktoren wie Sprache, Intelligenz, Textverständnis und Mathematikfähigkeiten der Lernenden wurden zusätzlich erhoben. ERGEBNISSE UND DISKUSSION Das aufgestellte Regressionsmodell konnte nahezu 50% der Varianz des Lösungserfolgs erklären. Dabei konnten 36% der Varianz durch das erste Modell, die Voraussetzungen der Lernenden, und 10% der Varianz durch die Verwendung selbstgenerierter Repräsentationen erklärt werden. Die Zeichnungen gehen als stärkster Prädiktor (ß=.239, p<.001) und die Begründungen als schwächster Prädiktor (ß=.093, p =.030) in die Vorhersage des Lösungserfolgs ein. Aber auch die Tabellen (ß=.196, p<.001) und Rechnungen (ß=.207, p<.001) haben einen signifikanten Einfluss auf die Vorhersage des Lösungserfolgs. Aus unterrichtspraktischer Sicht ist es wenig überraschend, dass Zeichnungen als stärkster Prädiktor den Lösungserfolg vorhersagen. Ihr Stellenwert im Mathematikunterricht, als heuristische Strategie des Problemlösens, wird stets betont (Franke & Ruwisch, 2010; Winter, 1994). Rechnungen und Tabellen sind ebenso etablierte Hilfsmittel im Mathematikunterricht (Bruder & Collet, 2011). Dass Begründungen als schwächster Prädiktor zu gelten scheinen, kann dadurch erklärt werden, dass Drittklässler noch als Novizen des Begründens angesehen werden können und sich diese Kompetenzen erst entwickeln müssen (Reiss, Hellmich, & Thomas, 2002). ID: 172 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Lehrerbildung Thematisches Cluster: Grundschulbildung, Lehrerexpertise, Schulentwicklung Stichworte: Grundschulübergang, Übergangsempfehlung, stufenübergreifende Lehrerkooperation Der Grundschulübergang: Herausforderung für individuelles und kooperatives Arbeiten von Lehrkräften Chair(s): Kim Diebig (WWU Münster), Stefanie van Ophuysen (WWU Münster) Diskutant(en): Kai Maaz (DIPF) Der Übergang von der Grundschule zur weiterführenden Schule stellt eine entscheidende Gelenkstelle im Bildungssystem mit weitreichenden Folgen für die individuelle Bildungslaufbahn eines jeden Schulkindes dar (Gresch, Baumert & Maaz, 2010). Doch auch für die Arbeit von Lehrkräften an Grund- und weiterführenden Schulen bedeutet der Übergang eine zentrale Herausforderung. So müssen Grundschullehrkräfte bei der Formation der Übergangsempfehlung neben der Feststellung eines status quo auch das zukünftige schulische Potential ihrer Schülerinnen und Schüler vorhersehen. Welche Kriterien sie dazu letztlich heranziehen sollten, bleibt weitgehend offen. Weiterhin ist die Gestaltung des Übergangs an sich bedeutsam. Hier sind auch die Lehrkräfte der weiterführenden Schule gefragt, ihren „neuen“ Schülerinnen und Schülern einen möglichst reibungslosen Wechsel und einen guten Start zu ermöglichen. Im Sinne des Übergangsqualitätsmodells (van Ophuysen & Harazd, 2014) ist für einen gelingenden Übergang nicht nur jede Einzelschule mit ihren individuellen Lehrkräften entscheidend, sondern es stehen jeweils mehrere Schulen unterschiedlicher Schulstufen gemeinsam in der Verantwortung. Obwohl entsprechend die Wichtigkeit von Lehrerkooperation im Übergang betont wird, wird diese jedoch selten praktiziert (Schürer, Harazd & van Ophuysen, 2006; van Ophuysen, 2005). Im Rahmen des Symposiums werden Beiträge vorgestellt und diskutiert, die sich mit dem individuellen und vernetzten Handeln von Lehrkräften im Kontext des Grundschulübergangs beschäftigen. Um sich den Kriterien der Übergangsempfehlung und deren Relevanz zu nähern, werden im Rahmen des Beitrags von Kim Diebig und Stefanie van Ophuysen unterschiedliche methodische Wege kombiniert. Dabei wird die Kontextabhängigkeit des Relevanzbegriffs berücksichtigt (Case, 2012), indem konkrete, reale Schülerinnen und Schüler, als auch vielfältige Kriterien, die von den Lehrkräften selbst genannt werden, in den Mittelpunkt gestellt werden. Die lehrerseitigen kognitiven Prozesse, die der Erstellung des Übergangsurteils zugrunde liegen, werden in einem Beitrag von Ines Böhmer, Sabine Glock, Cornelia Gräsel, Sabine Krolak-Schwerdt und Thomas Hörstermann in den Blick genommen. Der Frage, wie Lehrkräfte Informationen suchen und in welcher Reihenfolge sie diese abrufen, wird im Rahmen einer experimentellen Studie anhand der ‚Mouselab-Methode‘ nachgegangen. Isabella Wilmanns, Karolin Migas und Johanna Otto blicken auf die von Lehrkräften wahrgenommenen Möglichkeiten, die stufenübergreifende Vernetzung und Hospitation für ein gelingendes Übergangsmanagement beinhalten. Basierend auf leitfadengestützten, teilstruk-turierten Interviews mit Gymnasiallehrkräften können Ziele von Unterrichtshospitationen benannt und Gelingensbedingungen für wechselseitige Hospitationen abgeleitet werden. Welche Kooperationsformen im Kontext des Grundschulübergangs überhaupt genutzt werden, untersucht Katharina Sartory in einem abschließenden Beitrag. Hierbei wird auf das Modell zur Erfassung unterrichtsbezogener Lehrerkooperation von Gräsel, Fußangel und Pröbstel (2006) Bezug genommen und es wird überprüft, ob sich dieses auf die Lehrerkooperation am Grundschulübergang übertragen lässt. Beiträge des Symposiums Forschung zur Relevanz der Kriterien für die Übergangsempfehlung – Verzahnung unterschiedlicher methodischer Zugänge Kim Diebig, Stefanie van Ophuysen WWU Münster Laut § 11 Abs. 5 des Schulgesetztes des Landes Nordrhein-Westfalen erstellt „die Grund-schule (…) mit dem Halbjahreszeugnis der Klasse 4 auf der Grundlage des Leistungsstands, der Lernentwicklung und der Fähigkeiten der Schülerin oder des Schülers eine zu begründende Empfehlung für die Schulform, die für die weitere schulische Förderung geeignet erscheint (…)“ (SchulG vom 15. Februar 2005, GV. NRW. S. 102, zuletzt geändert durch Ge-setz vom 25. Juni 2015, GV. NRW. S. 499). Die beschriebenen, grob festgelegten Bereiche lassen offen, welche Inhalte für die Erstellung der Übergangsempfehlung berücksichtigt werden sollten. Da klar definierte Vorgaben fehlen, können keine Aussagen darüber getroffen werden, welche Kriterien Lehrkräfte für die Empfehlung tatsächlich als relevant erachten. Ein Merkmal kann für eine Entscheidung als relevant bezeichnet werden, wenn Unterschiede in seiner Ausprägung Unterschiede in der Entscheidung bedingen. Relevanz ist insofern kontextabhängig (Case, 2012), als sie durch die Konstellation weiterer Merkmalsausprägungen der zu beurteilenden Person mit beeinflusst wird. Weiterhin ist Relevanz von den subjektiven Theorien der entscheidenden Person abhängig. Bei der Erfassung der Relevanz von Kriterien für die Übergangsempfehlung sollten daher zwei Aspekte berücksichtigt werden: Erstens sollten reale, individuelle Schülerinnen und Schüler im Mittelpunkt stehen und zweitens sollten vielfältige Kriterien in die Analyse aufgenommen werden, die von den Lehrkräften selbst genannt werden. Bisherige Studien nähern sich der Frage nach der Relevanz der Kriterien für die Übergangsempfehlung auf sehr unterschiedlichen Wegen, wobei die beschriebene Kontextabhängigkeit bisher i.d.R. wenig Beachtung findet. In vorrangig quantitativen Studien (zusammenfassend in Glock, Krolak-Schwerdt, Klapproth & Böhmer, 2013) wird die Relevanz vorgegebener Kriterien indirekt über regressionsanalytische Berechnungen abgeleitet. Direkt nach der Relevanz vorgegebener Kriterien werden Lehrkräfte in nur wenigen Studien (u.a. Dietz, 2014; Pohlmann, 2009) gefragt. Zudem ist nur eine Studie (Nölle, Hörstermann, Krolak-Schwerdt & Gräsel, 2009) bekannt, in der Lehrkräfte für sie relevante Kriterien zu vorgegebenen Bereichen nennen und die Relevanz über Häufigkeitsanalysen abgeleitet wird. Eine methodische Verzahnung der unterschiedlichen Wege (direkte vs. indirekte Einschät-zung/vorgegebene vs. selbstgenannte Kriterien) findet bisher nicht statt. Um „ein schrittweises Erweitern der Erkenntnis durch gegenseitiges Vergleichen“ (Mayring, 2001, Abs. 25) zu ermöglichen, werden im vorliegenden Beitrag zwei unterschiedliche methodische Wege gewählt. Dabei wird die beschriebene Kontextabhängigkeit des Relevanzbegriffs stärker als in bisherigen Studien in den Fokus gerückt. In einem ersten Schritt wurden episodische Interviews mit 18 Grundschullehrkräften geführt, die in einer Kombination aus Narration und Befragung jeweils zwei reale Schülerinnen und Schüler ihrer letzten vierten Klasse beschrieben, bei denen sie in Hinblick auf die Übergangsempfehlung zwischen zwei Schulformen – nach Möglichkeit zwischen Gymnasium und Realschule – geschwankt hatten. Um die Relevanz der anhand der qualitativen Inhalts-analyse abgeleiteten inhaltlichen Kategorien indirekt erfassen zu können, wurden sowohl deren Nennungshäufigkeiten als auch die Reihenfolge ihres Auftretens betrachtet. In einem zweiten Schritt wurden dieselben Lehrkräfte im Rahmen telefonischer, teil-standardisierter Nachbefragungen mit den herausgearbeiteten Kriterien konfrontiert und um eine direkte Relevanzeinschätzung mittels fünfstufiger Ratingskala gebeten. Um Zusammenhänge zwischen der indirekten Relevanzerfassung (Nennungshäufigkeiten bzw. Reihenfolge) und der direkten Relevanzerfassung (Rating) zu untersuchen, werden Korrelationsanalysen berichtet. Kriterien, die besonders häufig und früh genannt werden, werden auch in der direkten Einschätzung als besonders relevant bewertet. Bei erwartungswidrigen Korrelationen wird explorativ nach Erklärungen gesucht, indem das qualitative Datenmaterial zu einzelnen Schülerfällen systematisch betrachtet wird. Abschließend wird diskutiert, inwieweit die Befunde methodische Implikationen für die weitere Forschung zur Relevanzeinschätzung haben. Das Übergangsurteil am Ende der Grundschulzeit – Welcher Urteilsstrategien folgen Lehrkräfte bei der Informationssuche? Ines Böhmer1, Sabine Glock1, Cornelia Gräsel1, Sabine Krolak-Schwerdt2, Thomas Hörstermann2 1 Bergische Universität Wuppertal, 2Universität Luxemburg In Deutschland spielt bei der Wahl der weiterführenden Schulform am Ende der Grundschulzeit die Übergangsempfehlung bzw. das Übergangsurteil der Grundschullehrkräfte eine bedeutende Rolle. Bei der tatsächlichen Schulformwahl folgen Eltern häufig dem erteilten Übergangsurteil der Lehrkräfte (siehe u.a. Stubbe & Bos, 2008) und melden ihr Kind an der von den Lehrkräften empfohlenen Schulform an. Korrigierende Schulformwechsel finden trotz der theoretisch vorhandenen Durchlässigkeit des deutschen Schulsystems eher selten statt (Ditton, 2013). Das erteilte Lehrerurteil legt somit in vielen Fällen die weitere Schullaufbahn, den daran anknüpfenden beruflichen Werdegang und damit auch die allgemeine spätere gesellschaftliche Teilhabe der Kinder mit fest. Es ist daher von zentraler Bedeutung die Lehrerurteile am Ende der Grundschulzeit genauer in den Blick zu nehmen. Vermehrt wurde in der bisherigen Forschung der Zusammenhang des Lehrerurteils mit verschiedenen Informationen der Schüler und deren Eltern fokussiert. Zusammenfassend zeigen die Befunde auf, dass die Leistung der Schüler einen bedeutenden Einfluss auf das Lehrerurteil hat (z.B. Bos et al., 2004). Soziale Hintergrundinformationen der Schüler, wie der familiäre sozioökonomische Status, fließen jedoch auch direkt sowie indirekt - vermittelt über die Noten - mit in das Lehrerurteil ein (u.a. Maaz & Nagy, 2009). Die Frage, wie Lehrkräfte ihre Übergangsurteile erstellen, d.h. welche kognitiven Prozesse dem Urteil zugrunde liegen, betrachtete die Forschung bislang nur vereinzelt (u.a. Böhmer, Hörstermann, Gräsel, Krolak-Schwerdt & Glock, 2015). Die vorliegende Studie untersucht daher die Informationssuche der Lehrkräfte als einen kognitiven Teilprozess bei der Erstellung bzw. Bildung des Lehrerurteils. Dabei wird der Frage nachgegangen, welcher Strategie der Urteilsbildung Lehrkräfte bei der Informationssuche folgen und welche Rolle dabei die Einheitlichkeit (Konsistenz) der Schülerinformationen spielt. Als theoretische Rahmung dienen duale Prozessmodelle der sozialen Urteilsbildung (Ferreira, Garcia-Marques, Sherman & Sherman, 2006; Fiske & Neuberg, 1990), die im Allgemeinen zwischen automatischen (spontanen) und kontrollierten (reflektierten) Strategien der Urteilsbildung unterscheiden. Aufgrund der Bedeutsamkeit des Lehrerurteils und des Ziels der Lehrkräfte, eine angemessene Leistungsprognose mit dem Übergangsurteil zu erteilen, wird angenommen, dass Lehrkräfte zur Bildung ihres Urteils weniger auf automatische, sondern eher auf kontrollierte Urteilsstrategien (regelbasierte oder informationsintegrierende Strategie) zurückgreifen. Angenommen wird, dass einheitliche Schülerinformationen zu einer regelbasierten Strategie führen sollen, bei der das Urteil nur auf Informationen zur Leistung (hier Noten und Arbeitsverhalten), welche aufgrund ihrer Relevanz vermehrt und zuerst gesucht werden, und zum Sozialverhalten beruht. Widersprüchliche Informationen sollen in einer informationsintegrierenden Strategie resultieren, die über die Informationen zur Leistung und zum Sozialverhalten hinausgehen. Alle Informationen, auch soziale Hintergrundinformationen, werden zur Urteilsbildung verwendet. Zur Erfassung der Informationssuche wurden 72 erfahrenen Grundschullehrkräften aus NRW anhand der ‚Mouselab-Methode‘ (Johnson, Payne, Schkade & Bettman, 1989) verschiedene Schülerfälle in Form von aufdeckbaren Informationsfeldern an einem Computer dargeboten. Die Lehrkräfte wurden gebeten, diejenigen Informationen der einzelnen Schüler per Mouse-Klick aufzudecken und zu betrachten, die sie zur Erstellung ihres Übergangsurteils benötigen. Die Anzahl, Art, Reihenfolge sowie die Relevanz der betrachteten Informationen wurden als Indikatoren für die verwendete Urteilsstrategie aufgezeichnet und u.a. varianzanalytisch ausgewertet. Zur Auswertung der Reihenfolge, mit der die Informationen von den Lehrkräften betrachtet wurden, wurde zusätzlich ein Unfolding-Modell (Carroll, 1980) berechnet. Die Ergebnisse legen u.a. nahe, dass Lehrkräfte bei der Urteilsbildung bei allen Schülerfällen zuerst regelbasiert vorgehen, indem sie zunächst die Leistungsinformationen gefolgt vom Sozialverhalten abriefen. Die Informationssuche wurde bei allen Schülerfällen allerdings erst nach einem eher informationsintegrierenden Prozess, der auch soziale Hintergrundinformationen berücksichtigt, beendet. Der auch hier gefundene Hinweis, dass soziale Hintergrundinformationen beim Übergangsurteil der Lehrkräfte eine Rolle spielen, wird vor dem Hintergrund eines chancengleichen Bildungserfolges diskutiert. Mögliche praxisrelevante Implikationen werden aufgezeigt. Unterrichtshospitationen im Kontext von Übergangsmanagement: Ziele, Aufgaben und Gelingensbedingungen Isabella Wilmanns, Karolin Migas, Johanna Otto TU Dortmund An der Schnittstelle zwischen Grundschule und weiterführender Schule stehen verschiedene Bildungsakteure gemeinsam in der Verantwortung für einen gelingenden Übergang und eine erfolgreiche Bildungslaufbahn der individuellen Schülerinnen und Schüler. Daher wird von schulpolitischer Seite gefordert, dass dieser gemeinsamen Verantwortung durch institutionelle Vernetzung und ein stufenübergreifendes Übergangsmanagement begegnet wird (MSW NRW 2015). Das Übergangsqualitätsmodell von van Ophuysen und Harazd (2014) benennt entsprechend die stufenübergreifende Vernetzung von Schulen als wichtige Handlungsebene der Qualitätssicherung im Übergang. Der Begriff des schulischen Managements sowie damit einhergehende Prozesse für den Übergang von der Grund- zur weiterführenden Schule sind weitestgehend ungeklärt. Aus der allgemeinen Übergangsforschung lässt sich aber eine erste Arbeitsdefinition für den Übergang von der Grund- zur weiterführenden Schule ableiten. Demnach ist die institutionalisierte Zusammenarbeit von Lehrkräften aller Bildungsinstitutionen und in der Folge eine kontinuierliche Begleitung von Schülerinnen und Schülern in ihrer Bildungslaufbahn Ziel von schulischem Übergangsmanagement (Wilmanns, Migas & Otto, in Vorbereitung). Aus den Wirtschaftswissenschaften lässt sich Bleichers (2004) Konzept des Integrierten Managements mit seinen drei Ebenen (normativ, strategisch, operativ) für den Übergang adaptieren. In diesem Kontext würde das Management-Modell auf normativer Ebene bedeuten, dass die Einzelschule Ziele benennt und Begründungen für geplante Maßnahmen liefert. Auf strategischer Ebene würden diese Ziele in stufenübergreifender Zusammenarbeit konkretisiert und Konzepte für gemeinsame Maßnahmen entwickelt. Auf operativer Ebene wäre die Umsetzung dieser Maßnahmen anzusehen. Empirische Studien zu Übergangsgestaltungsmaßnahmen sind in Deutschland noch rar (Porsch, 2015). Der vorliegende Beitrag soll daher eine erste Annäherung vornehmen, schulisches Übergangsmanagement am Beispiel wechselseitiger Unterrichtshospitationen von Lehrkräften unterschiedlicher Schulstufen genauer zu betrachten, da diese bei der Frage nach konkreten Gestaltungselementen im Übergang immer wieder erwähnt werden (z. B. BMBF, 2010; van Ophuysen, 2005). Vor diesem Hintergrund ergeben sich folgende Forschungsfragen: 1. Inwiefern kann die gemeinsame Konzeptentwicklung und -umsetzung wechselseitiger Unterrichtshospitationen von Lehrkräften als Element schulischen Übergangsmanagements begriffen werden? 2. Welche Ziele und Aufgaben verbinden Lehrkräfte mit einer solchen Vernetzungsmaßnahme? 3. Welche Faktoren nehmen sie als Gelingensbedingungen wahr? Zur Beantwortung der Forschungsfragen wurde ein exploratives Forschungsdesign gewählt. In einem ersten Schritt wurden leitfadengestützte teilstrukturierte Interviews mit drei Lehrkräften von Gymnasien aus dem Projekt Ganz In geführt, die in Kooperation mit Grundschulen Hospitationskonzepte entwickelt und umgesetzt haben. Die Auswertung des Datenmaterials erfolgte mithilfe der qualitativen Inhaltsanalyse (Bos & Tarnai, 1989; Mayring, 2010) mit MAXQDA. Dabei wurde für die ersten zwei Forschungsfragen das Management-Modell von Bleicher (2004) auf den Kontext des Übergangs adaptiert. Für die dritte Forschungsfrage wurde auf das Übergangsqualitätsmodell von van Ophuysen und Harazd (2014) zurückgegriffen. Die Analyse der Interviews zeigt, dass bei der gemeinsamen Entwicklung und Umsetzung wechselseitiger Unterrichtshospitationen zwischen Grundschul- und Gymnasiallehrkräften alle Ebenen schulischen Übergangsmanagements abgedeckt werden. Die Schule agiert dabei sowohl auf der normativen als auch auf der strategischen und operativen Ebene. Ziele liegen vornehmlich in der institutionalisierten Zusammenarbeit von Grundschulen und Gymnasien sowie der kontinuierlichen Begleitung der Schülerinnen und Schüler. Schulische Aufgaben beziehen sich zum einen auf Aushandlungsprozesse innerhalb der Zusammenarbeit der verschiedenen Schulformen und zum anderen auf die Entwicklung gemeinsamer Konzepte und deren Umsetzungsplanung. Als Gelingensbedingungen werden u.a. zeitliche Aspekte und Einstellungen der Lehrkräfte wie Offenheit und der Wille zur Zusammenarbeit auf Inputebene sowie eine gute Kommunikation bei der Zusammenarbeit auf Prozessebene genannt. Die Befunde werden mit Blick auf eine mögliche Ausdifferenzierung und Erweiterung des Übergangsqualitätsmodells um die Entwicklung und Umsetzung gemeinsamer Produkte und Gestaltungsmaßnahmen diskutiert. Implikationen für weitere Forschung werden dargestellt. Formen der Lehrerkooperation am Übergang von der Grund- zur weiterführenden Schule Katharina Sartory TU Dortmund Dem Übergang von der Grund- zur weiterführenden Schule wird innerhalb der empirischen Bildungsforschung seit vielen Jahren vermehrt Aufmerksamkeit geschenkt. Während unter dem Fokus der Reproduktion sozialer Ungleichheit schon zahlreiche Erkenntnisse zu institutionellen Indikatoren und individuellen Merkmalen vorliegen (vgl. Maaz, Baumert, Gresch & McElvany, 2010), sind empirische Studien zur Frage der gemeinschaftlichen und systematischen Übergangsgestaltung rar. Entsprechend bleibt diese Aufgabe für Lehrkräfte an Grundschulen und weiterführenden Schulen eine zentrale Herausforderung (Järvinen, Otto, Sartory & Sendzik, 2012). Auf Basis theoretischer Überlegungen haben van Ophuysen und Harazd (2014) ein integratives Rahmenmodell zur Analyse des Übergangs entwickelt, das die Kooperationen zwischen Grundschulen und weiterführenden Schulen als ein wichtiges Qualitätsmerkmal von Übergängen herausstellt. Der Blick auf die Forschung zur Kooperation am Übergang zeigt, dass die schulübergreifende Kooperation am Übergang von Lehrkräften in der Tat als bedeutsam für einen gelingenden Übergangsprozess erachtet wird (Koch, 2001; van Ophuysen, 2005). Empirische Beschreibungen zu konkreten stufenübergreifenden Kooperationsformen bzw. –prozessen stehen bisher jedoch noch weitestgehend aus (van Ophuysen, 2008). In der Forschung wird zur systematisierenden Beschreibung von Lehrerkooperation vielfach auf das von Gräsel et al. (2006) entwickelte Modell zur Erfassung unterrichtsbezogener Lehrerkooperation zurückgegriffen. Dieses Modell umfasst mit Austausch, Synchronisation und Kokonstruktion drei qualitativ unterschiedliche Formen der Lehrerkooperation. Es wurde mit Fokus auf unterrichtsbezogene Kooperationsprozesse zwischen Lehrkräften gleicher Schulstufen entwickelt. Es stellt sich die Frage, ob die vorgeschlagenen Kooperationsformen in gleicher Weise geeignet sind, Prozesse der stufenübergreifenden Kooperation zu beschreiben. Mit dem vorliegenden Beitrag soll konkret untersucht werden: 1. Ist das Modell auf die Lehrerkooperation am Übergang von der Grund- zur weiterführenden Schule theoretisch übertragbar? 2. Bilden sich die Kooperationsformen empirisch vergleichbar ab? 3. Inwiefern ist eine Modellanpassung für den Übergang von der Grund- zur weiterführenden Schule nötig? Zur Bearbeitung der Fragestellungen wurde auf Daten einer quantitativen Lehrerbefragung aus dem Projekt „Schulen im Team – Übergänge gemeinsam gestalten“ zurückgegriffen. In dem Projekt arbeiten insgesamt 338 Lehrkräfte von Grund- sowie weiterführenden Schulen in 29 schulübergreifenden Netzwerken gemeinsam an der Gestaltung des Übergangs. Für die Analysen der Kooperationsformen konnte dabei auf eine Stichprobe von N = 142 zurückgegriffen werden (Grundschule n = 73; weiterführende Schule n = 69). Zur Erfassung der Kooperation im Kontext des Übergangs wurden die Skalen von Gräsel et al. adaptiert. Die faktorielle Struktur wurde zunächst im Rahmen einer konfirmatorischen Faktorenanalyse überprüft. Da sich der Modellfit als unzureichend erwies, wurden anschließend explorative Analysen berechnet. Erste Analysen der Daten zeigen, dass sich lediglich die Dimension des Austauschs sinnhaft übertragen lässt. Die Dimensionen der Synchronisation und Kokonstruktion finden in den Daten keine Entsprechung. Zusammenfassend weisen die Ergebnisse darauf hin, dass eine Adaption des Modells zur unterrichtsbezogenen Kooperation nicht ohne weiteres auf den Kontext des Übergangs von der Grund- zur weiterführenden Schule übertragbar ist. Überlegungen zu Ursachen dieses Misfits und erste Ideen zu alternativen Kooperationsdimensionen werden vorgestellt. ID: 190 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Sonstige Didaktiken, Lehrerbildung Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung Stichworte: Kompetenzmodelle, Kompetenzerfassung, Hochschulsektor, Lehramtsstudiengänge, Validität Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor (KoKoHs II) – Analyse von Kompetenzen bei Lehramtsstudierenden und -absolventen Chair(s): Olga Zlatkin-Troitschanskaia (Johannes Gutenberg-Universität Mainz), Hans Anand Pant (Humboldt-Universität zu Berlin) Diskutant(en): Kristina Reiss (Technische Universität München), Oliver Lüdtke (Leibniz-Institut für die Pädagogik der Naturwissenschaften und M) Eine valide Erfassung der in der Hochschulbildung erworbenen Kompetenzen kann empirisch fundierte Kenntnisse zu den Bedingungen, zur Entwicklung und Gestaltung sowie zu Wirkungen von akademischen Lernprozessen liefern. Dies stellt hohe konzeptuelle und messmethodische Anforderungen an die Forschung, um eine objektive, zuverlässige und valide Messung akademischer Kompetenzen sicherzustellen. Im Rahmen der ersten Phase der BMBF-Förderlinie „Kompetenzmodellierung und Kompetenzerfassung im Hochschulsektor (KoKoHs I)“ (2011-2015) wurden Kompetenzmodelle sowie dazugehörige Instrumente entwickelt und deutschlandweit empirisch erprobt. Die bisherigen Ergebnisse bieten eine solide Grundlage für künftige vertiefende, längsschnittlich angelegte, mehrere Ebenen umfassende Analysen in (feld-)experimentellen Validierungsstudien, wie sie im neuen Forschungsprogramm „Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor – Validierungen und methodische Innovationen (KoKoHs II)“ (2016-2020) systematisch in den Blick genommen werden. KoKoHs II setzt sich aus 15 Projektverbünden zusammen, die interdisziplinär, methodenintegrativ und standortübergreifend angelegt sind und neben den erforderlichen mehrebenenanalytischen und längsschnittlichen Untersuchungsdesigns und quasiexperimentellen Validierungsstudien auch international innovative Verfahren der Kompetenzerfassung (z.B. computerbasierte adaptive Assessments) einsetzen und weiterentwickeln. Der Fokus liegt dabei auf thematischen Schwerpunkten wie der „Erfassung der Kompetenzentwicklungsverläufe“ und „Methodischen Innovationen“. Vier der Projektverbünde werden an diesem Symposium teilnehmen, um Gemeinsamkeiten bei der Erfassung von Kompetenzen bei Lehramtsstudierenden und -absolventen zu diskutieren. Das Projekt Pro-KomMa, dessen Vorläuferprojekt KomMa Kompetenzen von frühpädagogischen Fachkräften untersuchte, treibt die Validierung der entwickelten Testverfahren weiter voran, um Wirkungsannahmen zur Educational Effectiveness des Studiums und der Transformation der erworbenen professionellen Kompetenz in Performanz im Kindergartenalltag zu testen. Das Projekt TEDS-Validierung erprobt, inwieweit die drei in der internationalen Vergleichsstudie „Teacher Education and Development Study: Learning to Teach Mathematics (TEDSM)“ entwickelten Leistungstests zur Erfassung der in der Lehrerausbildung erworbenen professionellen Kompetenzen valide Vorhersagen von qualitativem Unterricht und Schülerleistungen erlauben. Im Projekt PlanvoLL-D wird untersucht, wie professionelles Wissen von angehenden Deutschlehrkräften, das während der ersten Ausbildungsphase an Hochschulen erworben wurde, mit der Bewältigung der Kernanforderung „Planung von Unterricht“ in der zweiten Phase der Lehrerausbildung (Referendariat/Vorbereitungsdienst) zusammenhängt. Im Projekt ProfiLe-P+ sollen die aus der ersten Förderperiode vorliegenden Kompetenzmodelle und Instrumente vertiefenden Validierungsstudien unterzogen werden. Dafür wird insbesondere untersucht, wie sich im Studium erworbene fachliche und fachdidaktische Kompetenzen in studiumsnahen beruflichen Performanzsituationen (Praxissemester) auswirken. Alle vier Projektverbünde vereint neben den Kompetenzanalysen in der Lehrerbildung auch messmethodische Aspekte der prognostischen Validität, die auch für den Wissenschaftstransfer in die Hochschulpraxis besonders bedeutsam ist. Im Rahmen dieses Symposiums werden die Modelle und Tests aus den vier Projekten vorgestellt und Ergebnisse aus bereits durchgeführten Validitätsanalysen als Grundlage für weitere konzeptuelle und messmethodische Arbeiten diskutiert. Beiträge des Symposiums Von KomMa zu Pro-KomMa: Konvergente, diskriminante und prognostische Validierung von Modellen und Instrumenten zur Professionalisierung des frühpädagogischen Studiums Katja Eilerts1, Lars Jenßen1, Michael Eid2, Thomas Koinzer1, Corinna Schmude3, Sigrid Blömeke4 1 Humboldt-Universität zu Berlin, 2Freie Universität Berlin, 3Alice-Salomon-Hochschule Berlin, 4University of Oslo Theoretischer Hintergrund Grundlage des Projekts „Professionalisierung des frühpädagogischen Studiums: Konvergente, diskriminante und prognostische Validierung der KomMa-Modelle und -Instrumente“ (Pro-KomMa) bildet der mehrdimensionale und anforderungsbezogene Kompetenzbegriff von Weinert (2001), der von Blömeke, Gustafsson und Shavelson (2015) um die Perspektive situationsspezifischer kognitiver Fertigkeiten erweitert wurde, die die Transformation von Kompetenz in Performanz vermitteln. Dieses Kompetenzmodell wurde auf frühpädagogische Fachkräfte übertragen. Im Unterschied zum Vorgängerprojekt KomMa, in dem vor allem kognitive Wissensqualitäten im Bereich Mathematik, Mathematikdidaktik und Pädagogik von angehenden frühpädagogischen Fachkräften im Sinne von Shulman (1986) und deren Erfassung im Zentrum standen, werden in Pro-KomMa auch situationsspezifische Fertigkeiten, z.B. mathematikbezogene Situationswahrnehmung und Handlungsplanung, und Performanz, z.B. konkrete Aktivitäten zur Förderung mathematischer und sozialer Fähigkeiten der Kinder, fokussiert werden. Erste Arbeiten aus KomMa liefern Hinweise, dass die Testinstrumente zur Erfassung des im Verlauf des Studiums erworbenen Wissens im Bereich Mathematik konvergente und diskriminante Validität bezüglich allgemein-kognitiver Fähigkeiten und affektivmotivationaler Konstrukte aufweist sowie prognostische Validität bezüglich situationsspezifischer Wahrnehmungs- und Planungsfertigkeiten (Dunekacke, Jenßen, Eilerts & Blömeke, under revision). Fragestellung Ziel von Pro-KomMa ist somit eine umfassende konvergente, diskriminante und prognostische Validierung der in KomMa entwickelten Testinstrumente zu den Wissensbereichen Mathematik, Mathematikdidaktik und Pädagogik anhand des von Blömeke, Gustafsson und Shavelson (2015) postulierten Modells. Die Validierung schließt somit zum einen die Überprüfung theoretischer Annahmen zur Struktur und Entwicklung der Wissensbereiche im Laufe des frühpädagogischen Studiums und zum anderen die prognostische Validität des im Studium erworbenen Wissens hinsichtlich der Performanz der frühpädagogischen Fachkräfte in der Praxis mit ein. Stützen die Validierungsergebnisse die theoretischen Annahmen, lägen erstmals Instrumente vor, mit denen die Effektivität des frühpädagogischen Studiums erfasst werden kann. Methode Für Pro-KomMa wird auf die Stichprobe aus KomMa (N=1851) zurückgegriffen, in der sowohl Fachschüler/innen und Fachhochschüler/innen jeweils zu Beginn und am Ende ihrer Ausbildung repräsentiert sind. In Pro-KomMa wird ein Teil dieser Stichprobe am Ende ihrer Ausbildung getestet (erwartetes n=300; längsschnittliche Erfassung der Kompetenzentwicklung während der frühpädagogischen Ausbildung und Effekte dieser auf die Kompetenzentwicklung). Der andere Teil wird während der Phase des Berufseinstiegs getestet (erwartetes n=50; prognostische Validierung hinsichtlich der Performanz im Kindergartenalltag). Neben den in KomMa entwickelten Testinstrumenten werden weitere Test- und Fragebogenverfahren zur konvergenten und diskriminanten Validierung eingesetzt (z.B. Lerngelegenheiten, beliefs) sowie viedogestützte Testverfahren und Beobachtungsverfahren zur Erfassung der situationsspezifischen kognitiven Fertigkeiten und der Performanz im Kindergarten. Zusätzlich werden Kinder der betreuenden frühpädagogischen Fachkraft in der Praxis zu numerischen Kompetenzen getestet um somit erstmals die Effekte der Kompetenzen der frühpädagogischen Fachkraft auf die Entwicklung der mathematischen Kompetenzen der Kinder untersuchen zu können. Durch den Vergleich von Fachschulen und Fachhochschulen lässt sich die Effektivität der Ausbildung auch auf institutioneller Ebene feststellen. Die Datenanalysen werden auf Grundlage der Item-Response-Theorie (v.a. 2PL-Modelle zur Skalierung der Tests) und der Klassischen Testtheorie (v.a. längsschnittliche Analysen auf Grundlage latenter Modellierungen, Multilevel-Modelle) durchgeführt. Neben dieser quantitativen Erfassung wird eine kleinere Gruppe von frühpädagogischen Fachkräften, die bereits in der Praxis arbeiten (erwartetes n=12), in der Praxis videographiert. Die so gewonnenen qualitativen Daten werden mit den quantitativen Daten in Verbindung gebracht, um ein feineres Bild zur Effektivität des frühpädagogischen Studiums zu erhalten. Ergebnisse Im Rahmen der Präsentation werden zunächst die theoretische Konzeption des Projekts Pro-KomMa und die Instrumente aus KomMa vorgestellt sowie die Relevanz von Pro-KomMa für die Kompetenzforschung und die frühpädagogische Ausbildung vorgestellt. Anschließend werden aktuelle Ergebnisse der Validierung im Rahmen von KomMa dargestellt (faktorielle Validität der Testbatterie, konvergente und diskriminante Validität zu Intelligenz und Selbstwirksamkeitserwartung und prognostische Validität zu einer videobasierten Erfassung von mathematikbezogener Situationswahrnehmung und Handlungsplanung während der Ausbildung). Validierung der Instrumente aus der internationalen Vergleichsstudie TEDS-M und ihrer Follow-Up-Studie TEDS-FU Gabriele Kaiser1, Johannes König2, Sigrid Blömeke3 1 Universität Hamburg, 2Universität zu Köln, 3University of Oslo Theoretischer Hintergrund Testverfahren für die kognitiven Dimensionen der professionellen Kompetenz von Mathematiklehrkräften wurden in den vergangenen Jahren vor allem in Deutschland und den USA entwickelt. Prominent sind die Arbeiten aus COACTIV (Kunter et al., 2011), die für das deutsche Sekundarstufensystem empirische Belege für den Zusammenhang von Content Knowledge (CK) und Pedagogical Content Knowledge (PCK) von Lehrkräften und den Lernfortschritten ihrer Schülerinnen und Schüler, vermittelt über Maße zu Dimensionen der Unterrichtsqualität erbringen konnten (Baumert et al., 2010) und damit an den internationalen Forschungsstand anschließen (u.a. Hill et al., 2005). Überdies konnten Zusammenhänge zwischen während des im Referendariat vorliegenden pädagogischen Wissens und über Schülerbefragungen erhobenen Maßen der Klassenführung nachgewiesen werden (Voss et al., 2014; König & Kramer, 2016). Allerdings weist der internationale Forschungsstand noch immer erhebliche Lücken auf: • Obgleich alle Studien grundsätzlich von einer Wirkungskette Lehrerbildung – Lehrerkompetenz – Unterrichtsqualität – Schülerleistung ausgehen, wurde bislang noch kein Nachweis erbracht, ob die im Rahmen der Hochschulausbildung erworbenen Kompetenzen einen Einfluss auf Unterrichtsqualität und Lernfortschritt der Lernenden haben. • Keine der genannten Studien hat bislang das Zusammenspiel der Trias von content knowledge (CK), pedagogical content knowledge (PCK) und general pedagogical knowledge (GPK) auf Unterrichtsqualität und Lernfortschritt der Schüler(innen) simultan modelliert. • Eine Kompetenzmodellierung, die sowohl kognitive Dispositionen als auch situationsspezifische Fertigkeiten (z.B. über videobasierte Instrumente) modelliert und als Prädiktoren für Unterrichtsqualität bzw. Leistungszuwachs von Lernenden analysiert, ist bislang nur fachgebunden erfolgt (Kersting et al., 2012). Der Beitrag stellt die KoKoHS-Studie TEDS-Validierung vor, die sich diesen Problemstellungen annimmt. Verwendet werden Wissenstests aus der internationalen Vergleichsstudie zur Effektivität der (Mathematik-)Lehrerbildung TEDS-M sowie videobasierte Testinstrumente zur situationsnahen Erfassung der Wahrnehmung von Unterricht aus der Nachfolgestudie TEDS-FU, um die professionelle Kompetenz von berufstätigen Mathematiklehrkräften zu erfassen und ihren Zusammenhang zur Unterrichtsqualität und Schülerleistungen zu analysieren. Fragestellung Vor dem Hintergrund der Zielsetzungen des vorzustellenden Projekts fokussieren wir folgende Fragen zur prognostischen Validität und zum messtheoretischen Ansatz, mit denen Rückschlüsse auf die Wirksamkeit der Lehrerausbildung – am Beispiel der Mathematik – getroffen werden können: (1) Erweisen sich die im Kontext von TEDS-M und TEDS-FU entwickelten Instrumente zur Messung der während der universitären Lehrerausbildung vermittelten professionellen Kompetenzen als prognostisch valide für qualitativ hochwertigen und erfolgreichen Mathematikunterricht? (2) Trägt die Aufnahme situationsspezifischer Fähigkeiten (gemessen über video-basierte Tests) über die Effekte des in der universitären Lehrerausbildung vermittelten Professionswissens (gemessen über Wissenstests) hinaus substanziell zur Erklärung von Unterrichtsqualität und dem Leistungszuwachs bei Schülerinnen und Schülern bei? Methode Erprobte Testverfahren für kognitive Kompetenzdimensionen von Lehrkräften liegen aus der internationalen Vergleichsstudie TEDS-M vor, in der 2008 erstmals vollständig und mit repräsentativen Länderstichproben die als zentral anzusehende Trias MCK, MPCK und GPK bei der Zielgruppe angehender Mathematik¬lehrkräfte erhoben wurde (Blömeke et al., 2010a, b). Getestet wurden angehende Sekundarstufenlehrkräfte und Primarstufenlehrkräfte im letzten Jahr ihrer Ausbildung (Referendariat/Vorbereitungsdienst). Der Ansatz wurde in weiterführenden Studien auf die erste Phase der Lehrerausbildung und andere Unterrichtsfächer übertragen. Die umfangreichen Arbeiten aus TEDS-M und den Folge- bzw. Anschlussstudien verweisen vor allem auf Inhalts- und Konstruktvalidität der entwickelten Tests (u.a. Blömeke et al., 2010a, b; Hoth et al., 2016; König, 2014). In der Nachfolgestudie TEDS-FU wurden innovative Evaluationsinstrumente in Form von video-basierten Tests entwickelt, um prozedurales Wissen abbilden zu können. Nachweislich sind auch diese Tests reliabel und valide, um eine handlungsnahe Erfassung von situationsspezifischen Fähigkeiten zu ermöglichen. Die Tests bauen auf jenen aus TEDS-M auf, sodass sie inhaltlich mit diesen für die Mathematikdidaktik und die Pädagogik vergleichbar sind (Busse & Kaiser, 2015; Kaiser et al., 2015). Ergebnisse Da die Studie erst am Anfang steht, wird zum einen ein zusammenfassender Überblick über die einzusetzenden Kompetenztests gegeben und ihre psychometrischen Kennwerte, darüber hinaus werden die mit ihnen bisher erzielten zentralen Befunde präsentiert. Zum anderen wird das Studiendesign von TEDS-Validierung vorgestellt und es werden Ziele und Fragestellungen/Hypothesen referiert. PlanvoLL-D: Die Bedeutung des professionellen Wissens angehender Deutschlehrkräfte für ihre Planung von Unterricht Christiane Buchholtz1, Albert Bremerich-Vos2, Johannes König3 1 Humboldt-Universität zu Berlin, 2Universität Duisburg-Essen, 3Universität zu Köln Theoretischer Hintergrund Aus der BMBF-geförderten Studie „Teacher Education and Development Study: Learning to Teach“ (TEDS-LT) liegen reliable Tests zur Messung von Fachwissen Deutsch (Literatur, Linguistik), deutschdidaktischem Wissen (Literatur- und Sprachdidaktik) und pädagogischem Wissen (Bremerich-Vos & Dämmer, 2013; König et al., 2013) vor. Dabei ist es noch eine weitgehend offene Frage, ob die bei Lehramtsstudierenden erfassten Kompetenzen eine Bedeutung für die weitere Kompetenzentwicklung in der zweiten Ausbildungsphase und damit für den weiteren Ausbildungsweg der angehenden Lehrkräfte besitzen, d.h. in dieser Hinsicht prognostisch valide sind. An dieser Problemstelle setzt das vorzustellende und im Rahmen von KoKoHs vom BMBF geförderte Projekt „Die Bedeutung des professionellen Wissens angehender Deutschlehrkräfte für ihre Planung von Unterricht: Validierung und methodische Innovation“ (PlanvoLL-D) an: Konkret zielt es auf die Beantwortung der Frage, wie das professionelle Wissen, das angehende Deutschlehrkräfte während der ersten Phase erworben haben, mit der Bewältigung einer Kernanforderung in der zweiten Phase der Lehrerausbildung zusammenhängen: der Planung von Unterricht. Die Planungskompetenz von angehenden Lehrkräften ist bislang ein völlig unbearbeitetes Feld der Kompetenzmessung und modellierung (z.B. Aufschnaiter & Blömeke, 2010). In dem vorzustellenden Projekt „PlanvoLL-D“ wird daher ein innovativer Messansatz genutzt: Erstmalig wurde in der Studie „Planungskompetenz von Lehrerinnen und Lehrern“ (PlanvoLL; König, Buchholtz & Dohmen, 2015; Buchholtz & König, 2015) ein standardisiertes und reliables Verfahren zur Analyse von schriftlichen Unterrichtsplanungen (Lehrproben) entwickelt, das auf die Anforderung einer adaptiven Unterrichtsgestaltung fokussiert. Da dieses Verfahren fächerübergreifend die didaktische Adaptivität von angehenden Lehrkräften als Aspekt ihrer Planungskompetenz erfasst, erfolgt im Rahmen des vorzustellenden Projekts „PlanvoLL-D“ zudem eine Konkretisierung auf das Fach Deutsch. Fragestellungen Im Projekt PlanvoLL-D werden zwei übergreifende Fragestellungen verfolgt: 1) Gelingt eine Konkretisierung generischer Planungskompetenz (didaktische Adaptivität) im Hinblick auf die Fachdidaktik Deutsch (fachdidaktische Adaptivität)? 2) Lässt sich mithilfe des im Rahmen der universitären Ausbildung erworbenen Wissens Planungskompetenz bzw. die Veränderung von Planungskompetenz vorhersagen und damit ein Beleg für dessen prognostische Validität erbringen? Methode Zielgruppe sind angehende Sekundarstufenlehrkräfte mit Fach Deutsch in Berlin und Nordrhein-Westfalen. Unser Untersuchungsmodell sieht vor, das professionelle Wissen der angehenden Lehrkräfte als Outcome der ersten Lehrerbildungsphase an Hochschulen zu verstehen. Dieses wird zu Beginn ihrer zweiten Phase mit den Tests aus TEDS-LT erfasst. Ihre Planungskompetenz hingegen wird im Längsschnitt zu zwei Zeitpunkten erfasst, indem schriftliche Unterrichtsplanungen (Lehrproben) zu Beginn und am Ende des Referendariats/Vorbereitungsdiensts erhoben und analysiert werden. Dies ermöglicht uns, (a) das Wissen auf die Planungskompetenz querschnittlich (zu Beginn des Referendariats) sowie (b) auf die Veränderung der Planungskompetenz (d.h. Zuwachs) während der zweiten Ausbildungsphase zu beziehen. Ergebnisse Im Vortrag wird zunächst das geplante Projekt dargestellt. Angesichts des Projektstarts in 2016 werden projektrelevante Ergebnisse berichtet, die mit den zu verwendenden Instrumenten bislang erzielt werden konnten. Zu den Wissenstests werden psychometrische Kennwerte vorgestellt, die u.a. ihre Reliabilität an verschiedenen Stichproben belegen. Ergebnisse zur Konstruktvalidität der Tests berichten wir aus Prüfungen der theoretisch angenommenen dimensionalen Struktur, mit denen u.a. das Wissen in Literaturwissenschaft, in Linguistik und in Fachdidaktik strukturell trennen ließ sowie fachdidaktisches von pädagogischem Wissen abgegrenzt werden konnte. Curriculare Validität der Tests für die erste Lehrerausbildungsphase wird mithilfe von Befunden aus Zusammenhangsanalysen mit Lerngelegenheiten im Studium berichtet. Zur Messung von Planungskompetenz wird das Verfahren zur Erfassung von didaktischer Adaptivität vorgestellt, einschließlich psychometrischer Kennwerte aus IRT-Skalierungen. Curriculare Validität wird über Ergebnisse eines Expertenreviews sowie eines Kompetenzzuwachses aus Längsschnittanalysen während der zweiten Ausbildungsphase belegt. Konstruktvalidität sowie prognostische Validität wird aus Analysen berichtet, die über den Einbezug externer Konstrukte erfolgten (u.a. lerntheoretische Überzeugungen, Schülerratings zur Unterrichtsqualität). Professionswissen in der Lehramtsausbildung Physik Andreas Borowski1, Josef Riese2, Christoph Kulgemeyer3, Hans E. Fischer4, Peter Reinhold2, Horst Schecker3 1 Universität Potsdam, 2Universität Paderborn, 3Universität Bremen, 4Universität Duisburg-Essen Theoretischer Hintergrund Im Hinblick auf qualitativ hochwertigen Unterricht benötigen Lehrkräfte hohes Fachwissen und hohes Fachdidaktisches Wissen als fundamentale Bestandteile ihrer professionellen Kompetenz (Baumert & Kunter, 2006). Large-Scale-Studien zu diesen Wissensbereichen sind bislang jedoch weitgehend auf das Fach Mathematik beschränkt (z.B. Blömeke, Kaiser & Lehmann, 2010; Kunter et al., 2011). Für die Physik existieren zwar einige Arbeiten zu Kompetenzmessungen (z.B. Kirschner, 2014; Kröger, Neumann & Petersen, 2013; Riese & Reinhold, 2012), aber auch hier werden vorwiegend Gesamtscores einzelner Wissensbereiche erhoben, die keine Analysen auf Teilskalenebene erlauben. Somit können die vorliegenden widersprüchlichen Hinweise zum Zusammenhang des Professionswissens von Lehrkräften und ihrer Performanz (vgl. z.B. Vogelsang, 2014; Cauet, et al., im Druck) aktuell nicht weiter aufgeklärt werden. Zudem können die vorliegenden Arbeiten keine Aussagen zur Interaktion der o.g. Bereiche machen. Zielsetzung Vor diesem Hintergrund verfolgt der Forschungsverbund ProfiLe-P (vgl. Riese et al., 2015) das Ziel, ein Rahmenmodell und entsprechende Testinstrumente zu entwickeln und zu validieren, welche zentrale Wissensbereiche angehender Physiklehrkräfte differenzierter als bisher überprüfbar machen. Insbesondere sollen Zusammenhänge zwischen Subskalen des Fachwissens, des Fachdidaktischen Wissens und der Perfor¬manz beim Erklären physikalischer Sachverhalte aufgeklärt werden. Methode Das im Forschungsverbund ProfiLe-P entwickelte Rahmenmodell des Professionswissens von Physik-Lehramtsstudierenden (Abb. 1) unterscheidet physikalisches Fachwissen (FW), deklarative und analytische Aspekte des fachdidaktischen Wissens (FDW) und prozedurale Aspekten des FDW beim Erklären physikalischer Sachverhalte, da letzteres eine wichtige Standardsituation im Physikunterricht darstellt. Als normativ-präskriptive Orientierungspunkte der modellbasierten Entwicklung der jeweiligen Messinstrumente wurden normative Setzungen (u.a. GFD, 2004; KMK, 2008; Fachprofil Physik), aber auch Fachphysik- und Physikdidaktikcurricula bzw. Modulbeschreibungen und bisherige Arbeiten (s.o.) herangezogen. Inhaltlich beziehen sich die Entwicklungen auf den Bereich Mechanik. Das Modell für das FW unterscheidet die Facetten Schulwissen, vertieftes Schulwissen und universitäres Wissen (vgl. z.B. Kunter et al., 2011). Die Schwierigkeit der Aufgaben wird über ihre Komplexität (Kauertz et al., 2010) operationalisiert. Insgesamt wurden 143 Aufgaben entwickelt. Zur Erfassung des Einflusses mathematischer Fähigkeiten beim Lösen von Physikaufgaben wurde ein Test zur Erfassung von Rechenfähigkeiten entwickelt. Das Modell für das FDW unterscheidet die Facetten „Instruktionsstrategien“, „Schülervorstellungen“, „Experimente und Vermittlung eines angemessenen Wissenschaftsverständnisses“ sowie „Fachdidaktische Konzepte“. Diese werden als relevant für die Performanz beim Erklären erachtet (vgl. Gramzow, Riese & Reinhold, 2013). Des Weiteren wurden Kognitive Aktivitäten (vgl. Anderson & Krathwohl, 2001) modelliert. Insgesamt wurden 91 Items konzipiert. Das verwendete Modell für die Performanz beim Erklären fokussiert auf dialogisches Erklären in unterrichtsnahen Erklärungssituationen (vgl. Kulgemeyer & Schecker 2013). Es geht davon aus, dass Erklärungen adressatengerecht und sachgemäß variiert werden können, indem der Mathematisierungsgrad, die gewählten Beispiele, das Sprachniveau und die verwendeten Darstellungsformen angepasst werden. Die Performanz wird in einer standardisierten Testsituation erhoben, worin die Probanden ein vorgegebenes physikalisches Phänomen trainierten Schülern erklären sollen. Alle zuvor beschriebenen Instrumente wurden umfassenden Validierungsstudien unterzogen (vgl. Riese et al., 2015) und in Quasi-Längsschnitten und echten Längsschnitten bei rund 300 Physik-Lehramtsstudierenden eingesetzt. Abb.1: Rahmenmodell des Professionswissens bei Physiklehramtsstudierenden Ergebnisse Das FW der Physiklehramtsstudierenden kann empirisch fundiert in den drei o.g. Facetten gemessen werden (Chi-Quadrat-Test, p <.001; Varianzen zwischen .98 und 1.43, EAP/PV-Reliabilitäten zwischen .78 und .83; vgl. Riese et al., 2015). Auch beim FDW fittet ein 4D-Rasch-Modell, welches in die vier o.g. fachdidaktischen Facetten unterteilt, besser (p <.001, Chi-Quadrat-Test). Hier liegen die Varianzen der Subskalen zwischen .50 und .60, die EAP-Reliabilitäten zwischen .55 und .73. Die Performanz beim Erklären lässt sich in einer unterrichtsnahen Situation videobasiert mit Hilfe von Rollenspielen erheben. Die Ausprägung der Performanz profitiert sowohl vom FW als auch vom FDW der Physik-Lehramtsstudierenden. Es zeigen sich Korrelationen mit FW und FDW von r=0,32** bzw. r=0,39** und typenabhängige Zusammenhänge der Wissensbereiche. Der Vortrag fokussiert auf die Darstellung und Diskussion der Ergebnisse aus der Hauptstudie und gibt einen Ausblick auf das Folgeprojekt. ID: 191 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Wirtschafts- und Berufspädagogik Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Methoden der empirischen Bildungsforschung Stichworte: Kompetenzmodelle, Kompetenzerfassung, Hochschulsektor, fachübergreifende Kompetenzen, fachbezogene Kompetenzen Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor (KoKoHs II) – modellbasierte Messung und Analyse fachbezogener und fachübergreifender Kompetenzen Chair(s): Hans Anand Pant (Humboldt-Universität zu Berlin), Olga Zlatkin-Troitschanskaia (Johannes Gutenberg-Universität Mainz) Diskutant(en): Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen, HU Berlin), Martin Brunner (Institut für Schulqualität der Länder, Freie Universität Berlin) Eine valide Erfassung der in der Hochschulbildung erworbenen Kompetenzen kann empirisch fundierte Kenntnisse zu den Bedingungen, zur Entwicklung und Gestaltung sowie zu Wirkungen von akademischen Lernprozessen liefern. Dies stellt hohe konzeptuelle und messmethodische Anforderungen an die Forschung, um eine objektive, zuverlässige und valide Messung akademischer Kompetenzen sicherzustellen. Im Rahmen der ersten Phase der BMBF-Förderlinie „Kompetenzmodellierung und Kompetenzerfassung im Hochschulsektor (KoKoHs I)“ (2011-2015) wurden Kompetenzmodelle sowie dazugehörige Instrumente entwickelt und deutschlandweit empirisch erprobt. Die bisherigen Ergebnisse bieten eine solide Grundlage für künftige vertiefende, längsschnittlich angelegte, mehrere Ebenen umfassende Analysen in (feld-)experimentellen Validierungsstudien, die im neuen Forschungsprogramm „Kompetenzmodelle und Instrumente der Kompetenzerfassung im Hochschulsektor – Validierungen und methodische Innovationen (KoKoHs II)“ (2016-2020) systematisch in den Blick genommen werden. KoKoHs II setzt sich aus 15 Projektverbünden zusammen, die interdisziplinär, methodenintegrativ und standortübergreifend angelegt sind und neben den erforderlichen mehrebenenanalytischen und längsschnittlichen Untersuchungsdesigns sowie quasiexperimentellen Validierungsstudien auch international innovative Verfahren der Kompetenzerfassung (z.B. computerbasierte adaptive Assessments) einsetzen und weiterentwickeln. Der Fokus liegt dabei auf thematischen Schwerpunkten wie der „Erfassung der Kompetenzentwicklungsverläufe“ und „Methodischen Innovationen“. Vier der Projektverbünde werden an diesem Symposium teilnehmen, um Gemeinsamkeiten bei der Erfassung hauptsächlich fachübergreifender Kompetenzen von Studierenden sowie ihrer Abgrenzung zu fachbezogenen Kompetenzen zu diskutieren. Dabei werden je unterschiedliche Facetten, wie epistemische Strategien, Motivationsregulation oder kommunikative Fähigkeiten fokussiert. Ziel des Projekts WiWiKom II ist eine objektive, reliable und valide Erfassung der Kompetenzentwicklung bei Studierenden der Wirtschaftswissenschaften, die valide Testwertinterpretationen erlaubt und den Interessengruppen (z.B. Hochschullehrern) eine Grundlage für diagnostische und prognostische Zwecke bieten kann. Neben fachspezifischen werden auch fachübergreifenden Kompetenzen testbasiert erfasst und ihre Beziehung zueinander im Studienverlauf betrachtet. Im Projekt KOSWO werden Kompetenztests zum Umgang mit wissenschaftlicher Originalliteratur in verschiedenen Fachdisziplinen weiterentwickelt und vertiefend validiert. Dies geschieht primär durch Trainingsexperimente sowie mittels traditioneller Validitätsnachweise. Das übergeordnete Ziel des Projekts PRO-SRL-EVA ist es, ein Modell der Kompetenzen zum selbstregulierten Lernen im Hochschulbereich in verschiedenen Fachdisziplinen und mehrere daraus abgeleitete Messverfahren einer erweiterten Validitätsprüfung zu unterziehen. Dazu wird eine Reihe von korrelativen und experimentellen Studien durchgeführt. Ziel der Nachwuchsforschungsgruppe KomPrü-KomFäh ist die Entwicklung eines psychometrischen Testsettings, durch das kommunikative Fähigkeiten von Studierenden verschiedener Fachrichtungen mit einem standardisierten Beobachtungsbogen bewertet werden können. Alle vier Projektverbünde vereint die Betrachtung von der Rolle fachübergreifender Kompetenzen und deren Beziehung zu fachspezifischen Kompetenzen. Im Rahmen dieses Symposiums werden die Modelle und Tests aus den vier Projekten vorgestellt und Ergebnisse aus bereits durchgeführten Validitätsanalysen als Grundlage für weitere konzeptuelle und messmethodische Arbeiten diskutiert. Beiträge des Symposiums Die valide Erfassung der Entwicklung des wirtschaftswissenschaftlichen Fachwissens im Verlauf des Studiums - eine quasi-experimentelle Längsschnittstudie (WiWiKom II) Olga Zlatkin-Troitschanskaia1, Hans Anand Pant2, Manuel Förster1, Sebastian Brückner1, Dimitar Molerov2 1 Johannes Gutenberg-Universität Mainz, 2Humboldt Universität zu Berlin Relevanz Die nationale und internationale Befundlage zur testbasierten Erfassung des wirtschaftswissenschaftlichen (wiwi) Fachwissens (FW) von Studierenden zeigt zwei Forschungsdefizite auf (Zlatkin-Troitschanskaia et al. 2015): (1) Die Veränderungsmessung des wiwi FWs im Studienverlauf und die experimentell kontrollierte Betrachtung (theoretisch) relevanter Einflussfaktoren wurde (inter)national bislang nur in allerersten Ansätzen vorgenommen (Happ et al. 2015). (2) Keine der vorhandenen Studien nimmt eine umfassende Validierung der Modelle und Instrumente vor, wie es z.B. die aktuellen Standards der AERA et al. (2014) vorsehen. Valide Testwertinterpretationen über die Entwicklung des Fachwissens und ihre Einflussfaktoren sind daher bislang weder möglich noch zulässig. Zielstellung und Validierungsaspekte Um diesen Desiderata zu begegnen, wird im WiWiKom II das Ziel verfolgt, die Entwicklung des wiwi FWs objektiv, reliabel und valide zu erfassen. Damit werden, aufbauend auf den Validierungsarbeiten aus WiWiKom I (Zlatkin-Troitschanskaia et al. 2014), vertiefende Validierungsfragen verfolgt und die bislang im Querschnitt gewonnenen Befunde um eine individuelle Veränderungsmessung im Hochschulstudium erweitert. Folgende konvergente und diskriminante Validierungsfragestellungen werden abgeleitet: (1) Inwieweit können Unterschiede und Veränderungen in den Testwerten durch die absolvierten Lerngelegenheiten im Studium der WiWi erklärt werden? (konvergent längsschnittliche Validierung) (2) Sind die allgemeinen kognitiven Fähigkeiten (AKF) zur Lösung des Fachtests weniger bedeutsam als Lerngelegenheiten im Studium? (längsschnittlich diskriminante Validierung) (3) Inwieweit gelingt es den Übergang in das wiwi Masterstudium durch den Fachtest besser als durch den Intelligenztest vorherzusagen? (inkrementelle und prädiktive Validierung) (4) Inwieweit gelingt es die Verläufe wiwi FWs der Studierenden der WiWi (Zielgruppe) von Studierenden anderer Sozialwissenschaften (Vergleichsgruppe) abzugrenzen. (Diskriminante Validierung mittels des Known-groups-Ansatzes) Test und Auswertungsmethoden Im Rahmen von vier deutschlandweiten Feldstudien wurde der WiWiKom-Test (kalibrierter Itempool mit über 200 Fachaufgaben zu den sieben Inhaltsdomänen) bei 10.217 Studierenden der WiWi an über 40 Hochschulen nach den AERA-Standards geprüft. Im Rahmen der WiWiKom I-Studie, die auch einen Pretest und qualitative Studien einschließt (Curricula- und Lehrbuchanalysen von 98 WiWi Studiengängen an 64 Hochschulen, 32 Experteninterviews, Online-Ratings mit 78 Dozenten, kognitive Interviews mit 20 Studierenden), wurden Hinweise auf die valide Erfassung des wiwi FWs durch den WiWiKom-Test gewonnen. Eine Kurzversion des WiWiKom-Tests wurde auch in der National Educational Panel Study (NEPS) eingesetzt. WiWiKom II basiert auf dem in WiWiKom I entwickelten Fachwissensmodell und dem dort eingesetzten WiWiKom-Instrument. Zur Überprüfung der vier Forschungsfragen werden umfangreiche Datenerhebungen und -analysen durchgeführt. Hierzu werdenanknüpfend an die Datensätze aus den bisherigen Feldstudien in WIWiKom I- in vier längsschnittlich angelegten Erhebungen an 24 Hochschulen zwischen 2016 und 2019 neben dem Fachwissenstest ein Test zur Kontrolle der AKF in Form fluider und kristalliner Intelligenz (BEFKI) (s. Schipolowski et al., in Vorb.) eingesetzt. Die mit diesen Instrumenten generierten Daten werden im Anschluss umfassend ausgewertet. Deskriptive Analysen geben einen Einblick über die Entwicklungsverläufe des FWs sowie der AKF in der Ziel- und Vergleichsgruppe. Die Modellierung des FWs wird auf Basis von IRT- und SEM-Verfahren durchgeführt. Die Möglichkeit der Gruppenvergleiche wird über Messinvarianzanalysen im Quer- und Längsschnitt geprüft. Aufgrund der zu erwartenden Ausfallzahlen in den Daten im Längsschnitt, werden MEM sowie Wachstumskurvenmodelle nach frequentistischen sowie bayesianischen Ansätzen geschätzt. Zudem wird das Propensity Score Matching eingesetzt, um valide Gruppenvergleiche auch bei Gruppen mit verschiedenen Größen und Verteilungen in den Kovariaten (z.B. verschiedene Hochschulen und verschiedene individuelle Merkmale zwischen den Gruppen) im Quer- und Längsschnitt vornehmen zu können. Ergebnisse Im Rahmen der Präsentation wird neben dem theoretischen Modell, den Instrumenten v.a. ein Überblick über die bisherigen Ergebnisse zur Erfassung des wiwi FWs von Studierenden gegeben, um daraus die Implikationen für WiWiKom II abzuleiten und kritisch zu diskutieren. Literaturverzeichnis Epistemische Strategien für einen kompetenten Umgang mit wissenschaftlicher Originalliteratur Sebastian Schmid1, Tobias Richter2, Sarah von der Mühlen2, Kirsten Berthold3 1 Universität Regensburg, 2Universität Kassel, 3Universität Bielefeld Theoretischer Hintergrund In nahezu allen Studienfächern wird von den Studierenden erwartet, dass sie sich mit wissenschaftlicher Originalliteratur auseinandersetzen. Diese Auseinandersetzung geht über eine rezeptive Erarbeitung der Textinhalte hinaus. Spätestens, wenn es darum geht, eine Abschlussarbeit zu verfassen, müssen Studierende geeignete Texte identifizieren und kritisch reflektieren. Eine erfolgreiche wissenschaftliche Sozialisation beinhaltet daher den Erwerb zahlreicher Kompetenzen im Umgang mit wissenschaftlicher Originalliteratur, die in Abhängigkeit vom jeweiligen Verarbeitungsziel flexibel eingesetzt werden können. Im Vordergrund des Beitrags stehen epistemisch-systematische und epistemische-heuristische Kompetenzen im Umgang mit wissenschaftlicher Originalliteratur. Beide Kompetenzbereiche haben gemein, dass sie der Prüfung der Wahrheit bzw. Plausibilität der Textinhalte dienen (Richter, 2003; Richter & Schmid, 2010). Dies geschieht jedoch auf unterschiedliche Weise. Epistemisch-systematische Kompetenzen sind nötig, um die Argumentation des Texts auf ihre Stichhaltigkeit zu prüfen. Sie beinhalten die Identifikation der funktionalen Bestandteile der Argumente (vor allem Behauptung und Begründung, Toulmin, 1958; Britt & Larson, 2003) und die Bewertung der Relevanz der angeführten Begründung für die Behauptung, für die argumentiert wird (Larson, Britt & Kurby, 2009). Damit bilden epistemisch-systematische Kompetenzen eine Voraussetzung für eine rational begründete Beurteilung des Textinhalts. Epistemisch-heuristische Kompetenzen zielen dagegen darauf ab, ein schnelles (vorläufiges) Urteil über die Glaubwürdigkeit des Textinhalts zu fällen. Hierzu zählt die Nutzung von Quelleninformationen (Sourcing) wie Publikationsorgan, Autor(innen) und Textgenre (z.B. Korpan, Bisanz, Bisanz & Henderson, 1997; Bromme, 2010). Diese Prozesse sind besonders dann wichtig, wenn systematische Kompetenzen nicht angewendet werden können, weil relevantes domänenspezifisches Vorwissen fehlt oder kognitive Ressourcen für eine weitergehende epistemisch-systematische Verarbeitung nicht zur Verfügung stehen (Schroeder, Richter & Hoever, 2008). In zahlreichen Untersuchungen konnten Defizite Studierender in beiden Kompetenzbereichen dokumentiert werden (z.B. Wineburg, 1991; Shaw, 1996). Wir vermuten, dass diese Defizite auf den Einsatz unterschiedlicher Strategien bei Studierenden gegenüber Wissenschaftler(inne)n zurückgehen. Hinweise auf derartige Strategieunterschiede könnten genutzt werden, um Trainings zur gezielten Förderung epistemischer Kompetenzen im Studium zu entwickeln. Fragestellung Das Ziel der vorliegenden Untersuchungen bestand darin festzustellen, in welchen Kompetenzbereichen sich Studierende von Wissenschaftler(inne)n unterscheiden. Protokolle lauten Denkens wurden erhoben, um darüber hinaus zu untersuchen, welche Strategieunterschiede den Kompetenzunterschieden zugrunde liegen. Methode Zwanzig Erstsemesterstudierenden und 20 Wissenschaftler(innen) (8 Postgraduierte und 12 Doktorand(inn)en) bearbeiteten Tests zu epistemisch-systematischen und epistemisch-heuristischen Kompetenzen aus dem elektronischen Testsystem Kompetenzen Studierender im Umgang mit wissenschaftlicher Originalliteratur (KOSWO). Epistemisch-systematische Kompetenzen wurden mit den Tests (a) Plausibilitätsbeurteilung und (b) Identifikation von Argumentbestandteilen erfasst. Im ersten Test müssen die Teilnehmer(innen) Argumentationsfehler in zwei längeren Texten identifizieren und unterschiedlichen Kategorien zuordnen, im zweiten Test die funktionalen Bestandteile einzelner Argumente (Behauptung, Begründung, Schlussregel, Stützung und Ausnahmebedingung) identifizieren. Epistemisch-heuristische Kompetenzen wurden mit den Tests (c) Glaubwürdigkeitsbeurteilung und (d) Genreidentifikation erfasst. Im diesen Tests müssen die Teilnehmer(innen) die Glaubwürdigkeit verschiedener Texte einschätzen und sie unterschiedlichen Textgenres (z.B. Originalpublikation, Übersichtsartikel, Lehrbuchtext, populärwissenschaftlicher Text) zuordnen. Die Tests zu heuristischen Kompetenzen wurden mit einem Zeitlimit vorgegeben, um dem Einsatz systematischer Strategien entgegenzuwirken. Die Teilnehmer(innen) bearbeiteten eine Parallelversion jedes Tests im Stillen und die andere unter der Instruktion, laut zu denken. Die Zuordnung der Parallelversionen zu diesen beiden Bedingungen und die Reihenfolge der Bedingungen wurde über die Teilnehmer(innen) ausbalanciert. Ergebnisse Die Wissenschaftler(innen) erzielten in allen Tests bessere Ergebnisse als die Studierenden. Um Strategieunterschiede zwischen beiden Gruppen zu identifizieren, wurden die Protokolle lauten Denkens einer Inhaltsanalyse unterzogen. Dabei zeigte sich, dass die Studierenden ihre Plausibilitätsurteile häufiger intuitiv fällten, während die Wissenschaftler(innen) häufiger die interne Konsistenz der Aussagen beurteilen. Darüber hinaus scheinen die Wissenschaftler(innen) bei ihren Glaubwürdigkeitsurteilen Quelleninformationen stärker zu berücksichtigen als Studierende. Mediatoranalysen und die Berechnung indirekter Effekte sprechen dafür, dass die Leistungsunterschiede zwischen Wissenschaftler(inne)n und Studierenden teilweise auf diese Strategieunterschiede zurückgeführt werden können. Die Ergebnisse liefern erste Hinweise auf Strategien, die in Trainings zur Förderung eines kompetenten Umgangs mit wissenschaftlicher Originalliteratur zu vermitteln sind. Erfassung der Kompetenzen zur Motivationsregulation von Studierenden anhand eines Situational Judgement Tests Gabriele Steuer, Tobias Engelschalk, Markus Dresel Universität Augsburg Kompetenzen zum selbstregulierten Lernen (SRL) sind in der tertiären Bildung erforderlich, u.a. weil von Studierenden erwartet wird sich umfangreiche Wissensbestände eigenständig zu erarbeiten. Hierbei kommt dem Wissen darüber, wie die eigenen Lernmotivation bei Widrigkeiten (wie etwa persönlich wenig bedeutsamen oder sehr schwierigen Lerninhalten) geschützt oder verbessert, d.h. wie die eigene Motivation reguliert, werden kann, eine zentrale Funktion zu. Die große Bedeutung der Motivationsregulation tritt in der Sichtweise von Studierenden und Praxisexperten zutage und spiegelt sich in theoretischen Modellen zum SRL wider. In bisher vorliegenden Instrumenten wird die Motivationsregulation anhand von globalen selbstberichteten Motivationsregulationsstrategien auf Verhaltensebene erfasst. Vor dem Hintergrund der mittlerweile breiten Literatur zur Diagnostik der Selbstregulation des eigenen Lernens scheint es allerdings nicht mehr angemessen den Strategieeinsatz lediglich in seiner Quantität zu berücksichtigen und dabei zudem spezifische Regulationsanlässen zu vernachlässigen. Angesichts der begrenzten Validität globaler Selbstberichte erscheint eine systematische Betrachtung der Situationsspezifität von Motivationsregulationsstrategien angezeigt. In diesem Beitrag werden die Konstruktion sowie erste Ergebnisse der Validierung eines Situational Judgment Tests (SJT) zur Erfassung von Kompetenzen zur Motivationsregulation vorgestellt. Dazu werden neben diversen Vorarbeiten insbesondere zwei Studien berichtet: Studie 1 ist eine Expertenbefragung (N = 14) in der die Eignung von Motivationsregulationsstrategien für unterschiedliche Regulationsanlässen erfragt wurde. Anhand eines Onlinefragebogens wurden spezifische Eignungen von Strategien in sechs verschiedenen Anforderungssituationen (beschrieben in Vignetten) erfragt. Bei der Variation der Anlässe wurden Erwartung (subjektiv schwierige Lerninhalte) und Wert (subjektiv wenig attraktive, jedoch relevante Lerninhalte) sowie drei unterschiedliche Handlungsphasen (präaktional, aktional, postaktional) unterschieden. In den Ergebnissen der Expertenbefragung zeigte sich insgesamt sich nur bei wenigen Strategien hinreichender Konsens bei den Experten, sodass nur bei einer relativ kleinen Anzahl von Strategien davon ausgegangen werden kann, dass diese personübergreifend adaptiv sind. Studie 2 stellt die Erprobung des auf dieser Basis konstruierten SJT an einer studentischen Stichprobe (N = 188, M = 21.8 Jahre, SD = 2.83) in den Fächern Wirtschaftswissenschaften und Mathematik dar. Die Befragung wurde in Paper-Pencil-Form realisiert und nahm etwa 45 Minuten in Anspruch. Zunächst wurden Vignetten präsentiert, in denen der jeweilige Lernkontext („Erstellen einer Semesterarbeit“ oder „Lernen auf eine Prüfung“) thematisiert und kurz skizziert wurde. Im Anschluss wurde der Regulationsanlass („schwierig“ oder „langweilig“ sowie „präaktional“ oder „aktional“) spezifiziert. Durch Kombination der zwei Lernsituationen mit zwei Regulationsanlässen in zwei Phasen der Lernhandlung ergaben sich acht verschiedene Situationen, die in zufälliger Reihenfolge präsentiert wurden. Im Anschluss wurde zunächst der subjektive Regulationserfolg anhand von zwei Items erfragt. Danach wurde das Wissen zum Strategieeinsatz erhoben. Im Anschluss an die situationsspezifischen Messungen folgte eine Reihe an situationsunspezifischen Messungen. So wurde der Fragebogen von Schwinger et al. (2007) eingesetzt, der ein globales und rein quantitatives Messkonzept nutzt, und es wurden die Anstrengung im Studium, der Wert des Studiums, das Fähigkeitsselbstkonzept sowie Schul- und Studienleistungen erfragt. Der finale SJT beruht auf Vergleichen der Antworten der Probanden mit Expertenurteilen. Als Ergebnis zeigte sich, dass der SJT sowohl mit dem Fragebogen von Schwinger er al. (2007) als auch mit der Studienleistung, der Schulleistung, dem Regulationserfolg in den einzelnen Situationen und der Anstrengung korreliert. Des Weiteren zeigte sich eine inkrementelle Varianzaufklärung im Hinblick auf der Kriterium Anstrengung im Vergleich zu dem globalen und quantitativen Regulationsmaß des Fragebogens von Schwinger et al.. Insgesamt weisen diese Ergebnisse darauf hin, dass es mit diesem SJT gelungen ist, ein reliables und valides Messinstrument zur Erfassung der Kompetenzen zur Motivationsregulation zu entwickeln. Zusätzlich können diese Ergebnisse dahingehend interpretiert werden, dass die Nutzung qualitativer Standards der Nutzung quantitativer Standards bei der Messung von Kompetenzen zur Motivationsregulation überlegen ist. Gleichwohl stellen die Befunde von Studie 1 die Annahme einer universellen (d.h. für alle Studierenden geltenden) Eignung von Motivationsregulationsstrategien für bestimmte Regulationsanlässe für einen Großteil der Strategien infrage. Entwicklung eines Messverfahrens zur Erfassung kommunikativer Fähigkeiten Edith Braun, Georgios Athanassiou, Kathleen Pollerhof INCHER Universität Kassel Kommunikation wird in zahlreichen Qualifikationsrahmen als einer der zentralen Lerninhalte eines Hochschulstudiums beschrieben, unter anderem im „Qualifikationsrahmen für deutsche Hochschulabschlüsse“ der Hochschul¬rektoren¬konferenz. Bislang liegen kaum Testverfahren vor um derartige überfachliche Fähigkeiten auf der Individualebene nach anerkannten Gütekriterien zu erfassen. Daher ist das Ziel der hier vorgestellten Forschungsgruppe, die in der KoKoHs Förderlinie angesiedelt ist, die Entwicklung eines Testsettings, durch das kommunikative Fähigkeiten von Studierenden bewertet werden können: Dazu werden Rollenspiele konzipiert, und mithilfe eines standardisierten Beobachtungsbogens kann das kommunikative Verhalten von Studierenden bewertet werden. Als Ausgangslage werden die beiden Studiengänge Wirtschaftswissenschaften und Lehramt verwendet. Zum einen handelt es sich um ausbildungsstarke Studiengänge, in denen zusammen 25% aller Studierenden ausgebildet werden. Zum anderen müssen die Absolvierenden der Studiengänge unterschiedlich in ihren Berufen kommunizieren. Während in den Wirtschaftswissenschaften eher Verhandeln und Überzeugen als kommunikative Anforderungen genannt werden, müssen Lehrer(innen) insbesondere Konflikte lösen, erziehen und lehren. Als theoretischer Bezugsrahmen dienen die von Habermas (1981) entwickelten Typen der Kommunikation. Habermas unterscheidet in seiner soziologischen Theorie des kommunikativen Handelns zwischen strategischer und verständigungsorientierter Kommunikation. In strategischen Gesprächskontexten ist das Ziel ein Mittel zum Zweck und besteht über die Gesprächssituation hinaus. Zudem kann es sein, dass das Gesprächsziel nicht direkt angesprochen wird, da dies nicht zwangsläufig zu einer individuellen, nutzenkalkulierten Erreichung des Ziels beiträgt. In der verständigungsorientierten Kommunikation stehen hingegen eine kooperative Problemlösung und eine gemeinsame Verständigung im Vordergrund. Darüber hinaus wurden weitere Komponenten der Kommunikation in der Literatur identifiziert: Intention, Sachinhalt, soziale Rolle (Gartmeier et al., 2011; Grice 1975; Hinsch und Pfingsten, 2007; Rogers, 1981; Traut-Mattausch und Frey, 2005; Hargie und Dickson, 2004; Watzlawick, 1969). Methode Die Entwicklung des Testverfahrens umfasst mehrere Arbeitsschritte. 1) eine umfassende Literaturrecherche zur Identifikation von relevanten Merkmalen einer Kommunikation; 2) ca. 10.000 Absolventen beschrieben, in welchen beruflichen Situationen sie mit anderen Personen kommunizieren. Diese Daten wurden ausgewertet und dienen als Grundlage zur Entwicklung der Rollenspiele. 3) die Rollenspiele werden basierend auf die ersten beiden Schritte entwickelt (aktueller Arbeitsschritt). 4) die Rollenspiele werden in Lehrveranstaltungen (Wintersemester 2015/ 16) pilotiert, 5) die Rollenspiele werden in einer geplanten Stichprobe von 500 Personen normiert. Ergebnisse und weiteres Vorgehen Die Rollenspiele wurden entlang der identifizierten Kommunikationsmerkmale systematisch variiert: so entstanden jeweils acht Situationen in der die Intention eher eine verständigungsorientierte oder strategische Kommunikation vorsieht. Zudem wurde die soziale Rolle fünfmal als eine schwächere, fünfmal als gleichberechtigt und sechsmal als stärkere Machtposition vorgegeben. Die so entstandenen Rollenspiele erhalten beide Studierendengruppen. Es wird lediglich der situative Kontext an das spätere berufliche Umfeld angepasst. Für die spätere Testdurchführung wurde eine Zufallsstichprobe aus allen Hochschulen in Deutschland gezogen, an denen entweder Wirtschaftswissenschaften oder Lehramt studiert werden kann. In dem Beitrag sollen die Rollenspiele dargestellt und diskutiert werden. Es handelt sich um einen laufenden Forschungsprozess, daher liegen derzeit noch keine empirischen Daten vor. ID: 219 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Sonstige Didaktiken Thematisches Cluster: Lehrer(aus)bildung, Lehrerexpertise, Motivation und Emotion Stichworte: Lehrermotivation; Berufsspanne; Veränderung; Tagebuch; Längsschnitt Auf dem Höhepunkt ihrer Motivation? Wie sich motivationale Merkmale von Lehrkräften im Laufe des Berufslebens entwickeln und verändern. Chair(s): Doris Holzberger (Technische Universität München), Mareike Kunter (Goethe-Universität Frankfurt) Diskutant(en): Ewald Terhart (Westfälische Wilhelms-Universität Münster) Motivationale Merkmale von Lehrkräften gelten als bedeutsam für deren beruflichen Erfolg (Alexander, 2008). In der motivationspsychologischen Grundlagenforschung werden mit dem Begriff „Motivation“ die Gründe einer Person für die Aufnahme, Richtung, Ausdauer und Intensität eines Verhaltens beschrieben (Heckhausen & Heckhausen, 2006). Doch wodurch werden diese Gründe für ein Verhalten bestimmt, wie stabil sind sie und wie verändern sich motivationale Merkmale von Lehrkräften im Laufe des Berufslebens? Während in den letzten Jahren das Forschungsinteresse an motivationalen Merkmalen von Lehrkräften als Prädiktor für deren beruflichen Erfolg stark angestiegen ist, ist bezüglich deren Determinanten, Stabilität bzw. Variabilität und Veränderung über die Berufsspanne weit weniger bekannt (Klassen et al., 2011; Kunter & Holzberger, 2014). Die Frage der Veränderbarkeit motivationaler Merkmale von Lehrkräften ist praktisch höchst relevant, da daraus Konsequenzen für die Selektion oder Unterstützung von Lehrkräften ableitbar sind. Erste Hinweise existieren, dass beispielsweise die Selbstwirksamkeit bei erfahrenen Lehrkräften höher ist als bei Berufsanfänger(innen) (Tschannen-Moran & Woolfolk Hoy, 2007; Wolters & Daugherty, 2007), wobei Klassen und Chiu (2010) eine umgekehrt u-förmige Beziehung fanden, nach der die Selbstwirksamkeit im hohen Berufsalter wieder abnimmt. Eine systematische Betrachtung der Determinanten und Variabilität von motivationalen Merkmalen steht noch aus. Ziel des Symposiums ist es, die Variabilität und die Veränderung motivationaler Merkmale von Lehrkräften in den verschiedenen Phasen des Lehrerberufs zu untersuchen. Dabei werden – im Sinne des Tagungsthemas – individuelle und institutionelle Faktoren untersucht, die positive wie negative Veränderungen im Laufe des Berufslebens vorhersagen. Die vier Beiträge des Symposiums nehmen systematisch jeweils eine Phase des Lehrerberufs in den Blick. In den Beiträgen von König et al. und Holzberger et al. werden die Veränderungen motivationaler Merkmale von Lehramtsstudierenden bzw. –anwärter(innen) im Laufe institutioneller Lerngelegenheiten (Praxissemester bzw. Vorbereitungsdienst bis Berufseinstieg) untersucht. Aldrup & Klusmann gehen der Frage nach, inwieweit tägliche Schwankungen im Enthusiasmus von Berufsanfänger(inne)n durch persönliche Erlebnisse vorhergesagt werden können. Der Beitrag von Keller analysiert wie sich erfahrene Lehrkräfte bzgl. erlebtem und gezeigtem Enthusiasmus unterscheiden. Gemeinsames Kennzeichen aller vier Beiträge ist die spannende Frage nach der Variabilität und Veränderung. Deren Beantwortung geschieht unter Einbezug unterschiedlicher Zeitintervalle (täglich 2-3 Wochen, 5 Monate, 2 Jahre) ebenso wie verschiedener methodischer Zugänge (Tagebuch- und Fragebogendaten). Die Vielfalt des Symposiums zeigt sich außerdem in der interdisziplinären Besetzung, die die Fragestellungen sowohl aus erziehungswissenschaftlicher, didaktischer und psychologischer Perspektive beleuchtet. Die Beiträge werden durch den Diskutanten Ewald Terhart bewertet. Mit seiner Expertise im Gebiet des Lehrerberufs und der Lehrerbildung bringt er eine optimale kritische Außenperspektive in dieses Symposium. Beiträge des Symposiums Veränderung motivationaler Merkmale von angehenden Lehrkräften während des Praxissemesters Kerstin Darge, Johannes König, Charlotte Kramer, Rudy Ligtvoet Universität zu Köln *Theoretischer Hintergrund* Modelle professioneller Kompetenz von (angehenden) Lehrkräften betonen explizit die Erlern- bzw. Veränderbarkeit der berücksichtigten Merkmale (Baumert & Kunter, 2011; Kunter et al., 2011; Terhart, 2011), doch wird in empirischen Studien neben der Entwicklung des Professionswissens die Veränderung motivationaler Orientierungen äußerst selten behandelt. Im Einzelnen deuten die wenigen vorliegenden Befunde aus einschlägigen Untersuchungen auf Veränderungen hin (z.B. Schutz, Crowder & White, 2001; König et al., eingereicht) und lassen motivationale Merkmale angehender Lehrkräfte nicht zwangsläufig als stabil über den Zeitraum ihrer Ausbildung erscheinen. Aktuell lost das Praxissemester an vielen Hochschulen bundesweit die bislang kurzen Fachpraktika ab. Unter den verschiedenen Zielsetzungen finden sich Bezuge zur motivationalen Veränderung, etwa bei der Berufswahlmotivationsüberprüfung oder der Entwicklung eines „professionellen Selbstkonzepts“ (vgl. Lehramtszugangsverordnung NRW). Angesichts der Bedeutung, die verlängerten Praxisphasen vielfach zugeschrieben wird (etwa Arnold et al., 2014), stellt sich die Frage nach Einflüssen auf Veränderungen motivationaler Merkmale angehender Lehrkräfte. Entsprechende Evaluationen berichten zwar über einzelne Veränderungen, insbesondere in den Selbstwirksamkeitserwartungen, die Befunde sind jedoch eher uneinheitlich. *Fragestellung* Im Mittelpunkt des Beitrags steht die Frage nach Veränderungen motivationaler Merkmale von angehenden Lehrkräften während des Praxissemesters – am Beispiel der Ausbildungsregion Köln. Angesichts der mit dem dortigen Praxissemester verbundenen curricularen Zielsetzungen erwarten wir im Sinne einer Lernwirksamkeit einen Zuwachs in motivationalen Variablen wie der intrinsischen Berufswahlmotivation, den Selbstwirksamkeitserwartungen bezogen auf den Lehrerberuf sowie dem Flow-Erleben beim Unterrichten. Weiterführend werden Indikatoren der Prozessqualität (u.a. lernprozessbezogene Tätigkeiten und mentorielle Unterstützung im Praxissemester) als Prädiktoren zur Erklärung von motivationalen Veränderungen einbezogen. Vermutet wird, dass die individuelle Nutzung der im Praxissemester angebotenen Lerngelegenheiten (z.B. die Planung oder Durchführung von Unterricht) sowie die Betreuung durch Mentoren-Lehrpersonen Veränderungen in motivationalen Merkmalen positiv beeinflussen können. *Methode* Der Datensatz entstammt einer Untersuchung angehender Lehrkräfte in der Ausbildungsregion Köln (n=330 Lehramtsstudierende im 2. MA-Semester), die vor (T1) und nach (T2) ihrer 5-monatigen Anwesenheit an Ausbildungsschulen (Februar-Juni 2015) befragt wurden (Projekt „Applaus“). Sie stehen für eine Grundgesamtheit von 460 Lehramtsstudierenden, die im Sommersemester 2015 als erste Kohorte das neu implementierte Praxissemester durchlaufen und zu diversen kognitiven und motivational-affektiven Merkmalen sowie zu ihren Lerngelegenheiten getestet bzw. befragt wurden. Die T1-Erhebungen wurden im Rahmen von Lehrveranstaltungen unter einheitlicher Instruktion durchgeführt, sodass eine individuelle Selbstselektion bei der Stichprobenrekrutierung praktisch ausgeschlossen werden kann. Die T2-Erhebungen wurden auf gleiche Weise durchgeführt, allerdings wurden in diesem Fall motivationale Merkmale aus Zeitgründen erst im Rahmen eines ergänzenden Online-Surveys erhoben. Zur Erfassung motivationaler Merkmale kamen u.a. zum Einsatz (Cronbach’s Alpha für T1/T2): Selbstwirksamkeit (Schwarzer & Schmitz 1999; 5 Items, ɑ = .72/74), Berufswahlmotivation (Watt & Richardson, 2008; intrinsische: 2 Items, ɑ =.59/.78; fachspezifische: 3 Items, ɑ = .88/.92) Flow-Erleben beim Unterrichten (nach Spooner, 2008; 9 Items, ɑ = .83/.76), Überprüfung der Berufswahlmotivation (König et al., 2014, 4 Items, ɑ = .72/.84). Lerngelegenheiten wurden u.a. über ein Instrumentarium ermittelt, das lernprozessbezogene Tätigkeiten sowie mentorielle Unterstützung berücksichtigt (König et al., 2014). *Ergebnisse* Die Längsschnittanalysen über T1 und T2 weisen statistisch signifikante (jeweils p < .001) Mittelwertunterschiede (Zuwachse) für die betrachteten motivationalen Merkmale aus, die auch praktisch bedeutsam sind (Cohen’s d): Selbstwirksamkeit (1.03), intrinsische Berufswahlmotivation (.20), fachspezifische Berufswahlmotivation (.30), Flow-Erleben beim Unterrichten (.52), Überprüfung der Berufswahlmotivation (.31). Zur Prüfung der Veränderung motivationaler Merkmale durch Merkmale der Lerngelegenheiten zeigt sich in ersten schrittweisen Regressionsanalysen, dass die Durchführung pädagogischer Handlungen sowie die mentorielle Unterstützung Zuwachse in der Selbstwirksamkeit und im Flow-Erleben beim Unterrichten statistisch signifikant und positiv beeinflusst (standardisierte Regressionsgewichte zwischen .16 und .34). Zum Zeitpunkt der Tagung werden Ergebnisse aus Pfadanalysen vorliegen, in denen die Modellierung der Veränderung motivationaler Merkmale und Beeinflussung durch Lerngelegenheiten auf latenter Ebene sowie unter Kontrolle von bestimmten Hintergrundmerkmalen (u.a. Geschlecht, Alter, Lehramt) erfolgt. Quantität oder Qualität? Wie Veränderungen motivationaler Merkmale von Lehramtsanwärter(innen) interpretiert werden können. Doris Holzberger1, Tina Seidel1, Mareike Kunter2 1 Technische Universität München, 2Goethe-Universität Frankfurt *Theoretischer Hintergrund* Enthusiasmus für das Unterrichten (als affektiv-motivationales Merkmal) und die Selbstwirksamkeitserwartung (als selbstbezogene Kognition) gelten als günstige motivationale Merkmale, die für den beruflichen Erfolg von Lehrkräften bedeutsam sind (Kunter et al., 2011). Konzeptualisiert als Kompetenzaspekt wird angenommen, dass motivationale Merkmale veränderbar sind. Bislang ist jedoch noch wenig bekannt darüber, ob und wie sich Unterrichtsenthusiasmus und Selbstwirksamkeit von (angehenden) Lehrkräften verändern und unter welchen Bedingungen sie sich im Laufe der Ausbildung entwickeln. Aus theoretischer Sicht gelten für die Entwicklung von Selbstwirksamkeit verschiedene Quellen als bedeutsam (Bandura, 1997), deren Einfluss sich je nach Berufserfahrung unterscheiden kann (Tschannen-Moran & Woolfolk, 2007). Für die Entwicklung oder Veränderung von Enthusiasmus werden theoretisch diejenigen Einflussfaktoren angenommen, die auch intrinsische Motivation beeinflussen können, zum Beispiel das Erleben von Autonomie oder Kompetenz (Evelein et al., 2008; Kunter & Holzberger, 2014). Unabhängig von den jeweiligen Determinanten gilt, dass (angehende) Lehrkräfte auf ausreichend Erfahrungen zurückgreifen können müssen, um ihre Fähigkeiten (Selbstwirksamkeit) ebenso wie ihr affektives Erleben (Enthusiasmus) bei der Ausführung einer Tätigkeit (z.B. Unterrichten) valide einschätzen zu können. So kann angenommen werden, dass zu Beginn des Vorbereitungsdienstes die Einschätzung von Selbstwirksamkeit und Unterrichtsenthusiasmus aufgrund des Mangels an Erfahrungen eher global und ggf. fehlerhaft erfolgt, wohingegen mit Zunahme der eigenen Erfahrungen die Konstrukte stärker ausdifferenziert werden. Um Aussagen darüber treffen zu können, ob und wie sich motivationale Merkmale von Lehrkräften über die Zeit hinweg verändern, ist es entscheidend, nachzuweisen, dass die Vergleichbarkeit der Konstrukte über die Zeit hinweg gegeben ist (Meredith, 1993). Im vorliegenden Beitrag werden somit nicht nur quantitative Veränderungen motivationaler Merkmale im Vorbereitungsdienst analysiert, sondern auch geprüft, inwieweit qualitative Veränderungen in der Erfassung von Unterrichtsenthusiasmus und Selbstwirksamkeit ergeben. *Fragestellung* Insbesondere wird der Frage nachgegangen, wie sich Selbstwirksamkeit und Unterrichtsenthusiasmus im Laufe des Vorbereitungsdienstes bis zum Berufseinstieg verändern. Dabei werden zunächst qualitative Veränderungen in den erfassten Konstrukten geprüft. Zeigt sich, entgegen unserer Erwartung, dass die Konstrukte gleich bleiben, kann die quantitative Veränderung der Merkmale durch Erfahrungen im Vorbereitungsdienst untersucht werden. *Methode* Zur Beantwortung der Fragestellung werden Daten einer Längsschnittstichprobe von 416 Anwärter(inne)n für das Lehramt an allgemein bildenden Schulen analysiert, die an mindestens zwei von vier Messzeitpunkten teilgenommen haben (t1 = zu Beginn, t2 = ein Jahr nach Beginn, t3 = am Ende des Vorbereitungsdienstes und t4 = 1,5 Jahre nach dem Berufseinstieg). Unterrichtsenthusiasmus (4 Items) und Selbstwirksamkeit (10 Items) wurden im Selbstbericht erfasst. Daten wurden mit Mplus 6.1 analysiert, fehlende Werte mittels des Full-Information-Maximum-Likelihood-Verfahrens geschätzt. Um zu überprüfen, ob die Instrumente zu den vier Messzeitpunkten die gleichen latenten Variablen messen, wurden Invarianzanalysen gerechnet (vgl. Meredith, 1993). Zur Analyse der Stabilität wurden anhand von Strukturgleichungsmodellen Autoregressionskoeffizienten berechnet. *Ergebnisse und Diskussion* Die Ergebnisse der Invarianzanalysen unterstreichen, dass im Verlauf des Vorbereitungsdienstes bis zum Berufseinstieg Vergleichbarkeit für Unterrichtsenthusiasmus kaum (lediglich gleiche Faktorstruktur/konfigurale Invarianz) und für Selbstwirksamkeit nur sehr eingeschränkt (gleiche Faktorladungen/schwache faktorielle Invarianz) gegeben ist, sodass quantitative Veränderungsanalysen nicht gerechtfertigt sind. Zwar deuten die Autoregressionskoeffizienten auf mittlere bis hohe Stabilitäten zwischen den vier Messzeitpunkten hin (Unterrichtsenthusiasmus: .45 < β < .74 & leichte Abnahme; Selbstwirksamkeit: .45 < β < .73 & leichte Zunahme), diese sollten jedoch nicht interpretiert werden, da die Instrumente zu den vier Messzeitpunkten scheinbar unterschiedliche Konstrukte erfassen. Die Befunde zeigen, dass sich das Bild von Lehramtsanwärter(innen) über sich und ihre Tätigkeit in der Phase des Vorbereitungsdienstes bis zum Berufseinstieg entscheidend verändert und dies die Einschätzung motivationaler Merkmale beeinflusst. Daraus lässt sich ableiten, dass motivationale Merkmale wirklich im Sinne einer Kompetenz durch bestimmte Lerngelegenheiten formbar sind. Im Vortrag wird diskutiert, über welche Lerngelegenheiten die Konstrukte vergleichbar sind und zu welchem Zeitpunkt Unterrichtsenthusiasmus und Selbstwirksamkeit von (angehenden) Lehrkräften valide gemessen werden können. Dies ermöglicht, die motivationale Entwicklung durch Merkmale der Ausbildung und der Berufserfahrung vorherzusagen. Lieben Lehrkräfte ihren Beruf jeden Tag? Eine Tagebuchstudie zum täglichen beruflichen Enthusiasmus und seinen Einflussfaktoren Karen Aldrup, Uta Klusmann IPN, Kiel *Theoretischer Hintergrund* Beruflicher Enthusiasmus wird als wichtiges Merkmal erfolgreicher Lehrkräfte beschrieben (Long & Hoy, 2006). Zum einen kann Enthusiasmus – das Erleben von Freude und Begeisterung für den Lehrerberuf (Kunter, Frenzel, Nagy, Baumert & Pekrun, 2011) – als Aspekt des beruflichen Wohlbefindens verstanden werden (Kahneman, Diener & Schwarz, 1999; Waterman, 1993). Zum anderen beeinflusst beruflicher Enthusiasmus die Unterrichtsqualität bzw. wird als Teilaspekt guten Unterrichts verstanden und wirkt sich somit auch auf die Motivation und den Lernerfolg der Schüler/innen aus (Kunter et al., 2013; Pelletier, Séguin-Lévesque & Legault, 2002). Doch können Lehrkräfte jeden Tag Begeisterung für ihren Beruf empfinden? Schaufeli, Salanova, González-Romá und Bakker (2002) beschreiben beruflichen Enthusiasmus als relativ stabiles Personenmerkmal. Dabei wird angenommen, dass Personen, die ein hohes Ausmaß beruflicher (z. B. kollegiale Unterstützung; Klusmann, Kunter, Trautwein, Lüdtke & Baumert, 2008) und persönlicher (z. B. Selbstwirksamkeit; Hobfoll, 2002) Ressourcen besitzen, auch in Berufen mit vielen Stressoren enthusiastisch bleiben (Demerouti, Bakker, Nachreiner & Schaufeli, 2001; Hobfoll, 1989). Allerdings weisen verschiedene Autor/innen darauf hin, dass beruflicher Enthusiasmus täglichen intraindividuellen Schwankungen unterliegt (Kunter et al., 2011; Sonnentag, Dormann & Demerouti, 2010). Diese Perspektive erlaubt einen tieferen Einblick in tägliche Einflussfaktoren, die bislang nur wenig untersucht wurden (Sonnentag et al., 2010). In der vorliegenden Untersuchung soll der Fokus auf täglichen positiven (_uplifts_) und negativen (_hassles_) beruflichen Ereignissen liegen. Insbesondere der Einfluss von _hassles_ auf den beruflichen Enthusiasmus ist dabei von Interesse, da bislang vornehmlich Zusammenhänge mit _uplifts_ betrachtet wurden (Bakker & Bal, 2010; Sonnentag et al., 2010). *Fragestellung* Die zentrale Fragestellung der vorliegenden Studie ist, inwieweit der berufliche Enthusiasmus von Lehrkräften als ein stabiles Merkmal angesehen werden kann. Dabei sollen erstens die Varianz des beruflichen Enthusiasmus auf täglicher Ebene sowie die Zusammenhänge zwischen dem Enthusiasmus auf täglicher Ebene und dem Enthusiasmus als Personenmerkmal betrachtet werden. Zweitens soll untersucht werden, ob tägliche _uplifts_ und _hassles_ tägliche Veränderungen vorhersagen. Drittens soll analysiert werden, welche Personenmerkmale (Selbstwirksamkeit, aggregierte _hassles_ und _uplifts_) mit einem über die Tage konstant hohen beruflichen Enthusiasmus assoziiert sind. *Methode* An der zweiwöchigen Tagebuchstudie nahmen 113 Lehrkräfte in den ersten vier Berufsjahren teil. In einem Präfragebogen wurden beruflicher Enthusiasmus und Selbstwirksamkeit als Personenmerkmale erfasst. Im Tagebuch schätzten die Lehrkräfte ihren beruflichen Enthusiasmus auf Tagesebene ein (1 = _trifft nicht zu_ bis 4 = _trifft zu_). Zudem gaben sie in einem offenen Antwortformat Auskunft über berufliche Ereignisse. Diese bewerteten sie auf einer Skala von 1 = _sehr negativ_ bis 5 = _sehr positiv_. Die Valenzratings dienten als Grundlage zur Einteilung in _uplifts_ und _hassles_. *Ergebnisse* Mit Blick auf die erste Fragestellung zeigen Intraklassenkorrelationen, dass nur ein geringer Anteil der Varianz des beruflichen Enthusiasmus‘ auf Personenebene liegt und dass ein substantieller Anteil auf intraindividuelle Veränderungen auf Tagesebene zurückzuführen ist (_ICC_ = .24). Allerdings schwanken die Werte selten zwischen _nicht enthusiastisch_ (Wert < 3) und _enthusiastisch_ (Wert ≥ 3), sondern vornehmlich innerhalb eines Bereichs. Die Mehrheit der Lehrkräfte (54%) ist an mindestens drei von vier Tagen enthusiastisch und nur 13% an höchstens jedem zweiten Tag. Hinsichtlich der Zusammenhänge des mittleren beruflichen Enthusiasmus über die Tage und des Enthusiasmus als Personenmerkmal zeigen sich moderate Korrelationen, wobei der Enthusiasmus auf Tagesebene statistisch signifikant geringer eingeschätzt wird. Wie Mehrebenen-Regressionsanalysen zeigen, steigt der Enthusiasmus an Tagen mit vielen _uplifts_ und wenigen _hassles_. Auch tritt eine Interaktion zwischen _uplifts_ und _hassles_ auf. Es findet sich außerdem ein Effekt des Wochentages: An Freitagen ist der Enthusiasmus höher. Insgesamt berichten diejenigen Lehrkräfte über die Tage hinweg einen hohen Enthusiasmus, die eine hohe Selbstwirksamkeit besitzen, viele _uplifts_ und wenige _hassles_ erleben. Einmal enthusiastisch, immer enthusiastisch? Stundenprofile von Lehrkräften in erlebtem und gezeigtem Enthusiasmus und deren Zusammenhang mit Schüleroutcomes Melanie M. Keller1, Eva S. Becker2 1 Universität Salzburg, 2Universität Konstanz und Universität Zürich *Theoretischer Hintergrund* Lehrkräfte selbst geben an, ihren Beruf als lohnenswert zu empfinden und tatsächlich ist Freude die dominante Emotion im Unterricht (siehe beispielsweise Keller, Frenzel, Goetz, Pekrun, & Hensley, 2014). Freude als unterrichtsbezogenes Emotionserleben spielt auch in der Lehrerenthusiasmusforschung eine Rolle, in der zwischen empfundenem Enthusiasmus ähnlich Freude (Kunter et al., 2008) und behavioral gezeigtem Enthusiasmus als möglicher Ausdruck dieser Freude unterschieden wird. Beide Enthusiasmusformen sind miteinander korreliert (z.B. Frenzel, Goetz, Lüdtke, Pekrun, & Sutton, 2009), sollten jedoch von Situation zu Situation stark schwankend sein, da Emotionen als dynamische Konstrukte gelten, die stark kontextualisiert sind (Frenzel, Becker-Kurz, Pekrun, & Goetz, 2015) und von den Gegebenheiten einer Unterrichtsstunde abhängen (Becker, Keller, Goetz, & Frenzel, 2015). Diese Variabilität allerdings, auch im Hinblick auf Schüleroutcomes, ist bisher in der Forschung noch nicht untersucht. *Fragestellung* In der vorliegenden Studie wird untersucht, inwieweit empfundener und gezeigter Enthusiasmus auf Stundenebene, d.h. über Situationen hinweg aber innerhalb von Lehrpersonen, variieren und inwieweit auftretende Konstellationen beider Variablen (highhigh, high-low, etc.; siehe auch Taxer & Frenzel, 2015, April) mit Freude und intrinsischer Wertüberzeugung auf Schülerseite in der entsprechenden Unterrichtsstunde zusammenhängen. *Methode* Im Rahmen einer Tagebuchstudie haben 39 Mathematiklehrkräfte und deren 9./10. Gymnasialklassen über 2-3 Wochen jeweils im Anschluss an Mathematikstunden (_N_ = 316) einen Kurzfragebogen ausgefüllt und Lehrkräfte über ihren empfundenen Enthusiasmus (Freude; z.B. „In dieser Stunde machte mir das Unterrichten Freude.“) sowie Schüler/innen über den wahrgenommenen Enthusiasmus („In dieser Stunde unterrichtete unser/e Lehrer/in mit Begeisterung.“) sowie ihr eigenes Freudeerleben sowie intrinsische Wertüberzeugung berichtet. Alle Items konnten auf einer fünfstufigen Skala von (1) „stimmt gar nicht“ bis (5) „stimmt genau“ eingeschätzt werden. Profile bezüglich empfundenem und gezeigtem Enthusiasmus wurden auf Basis der _N_ = 316 Unterrichtsstunden mittels latenter Profilanalyse (LPA mit Mplus; Muthén & Muthén, 1998-2012) unter Berücksichtigung der genesteten Datenstruktur extrahiert. *Ergebnisse & Diskussion* Lehrkräfte berichten hohe Werte in empfundenem Enthusiasmus (_M_ = 3.75), was von Schüler/innen entsprechend wahrgenommen wird (_M_ = 3.51). Die Intraklassenkorrelationen zeigen, dass für empfundenen Enthusiasmus nur gut 20% der Varianz zwischen den Lehrkräften liegt, für gezeigten Enthusiasmus aber etwa 70%. Beide Enthusiasmusformen hängen innerhalb von Lehrpersonen moderat zusammen (_r_ = .29, _p_ < .001). Unter Berücksichtigung statistischer Fit-Indizes und Interpretierbarkeit wurden vier Profile mittels LPA extrahiert, wobei Profilgruppe 1 mit einer kleinen Gruppengröße (_N_ = 12) zunächst nicht von weiterem Interesse ist. Profile 2 und 4 (_N_ = 70 bzw. 203) weisen ähnlich hohe Werte in gezeigtem Enthusiasmus auf (_M_ = 3.55 bzw. 3.76), unterscheiden sich aber bezüglich empfundenem Enthusiasmus (_M_ = 2.89 bzw. 4.21): Scheint es also Lehrkräften in den Unterrichtsstunden der Profilgruppe 4 zu gelingen, ihren empfundenen Enthusiasmus sichtbar zu zeigen (_Authentic Enthusiasm_), so werden in Profilgruppe 2 Lehrkräfte enthusiastischer wahrgenommenen als sie es selbst angeben (_Fake Enthusiasm_). Dies spiegelt sich auch wider in höherem Freudeerleben bzw. höheren Wertvorstellungen bei Schüler/innen in _Authentic Enthusiasm_ verglichen mit _Fake Enthusiasm_. Profilgruppe 3 (_N_ = 31) weist hohe Werte in empfundenem Enthusiasmus (_M_ = 4.00), aber niedrige Werte in gezeigtem Enthusiasmus auf (_M_ = 2.40) und lässt sich dementsprechend als _Hidden Enthusiasm_ interpretieren. Im Vergleich zu authentischem Enthusiasmus mit ähnlich hohen Werten im empfundenen Enthusiasmus, geben Schüler/innen in _Hidden Enthusiasm_ allerdings signifikant niedrigere Werte für Freude und intrinsische Wertüberzeugung an. Die stundenbezogenen Profile variieren innerhalb von Personen: Die Mehrheit der Lehrkräfte (_N_ = 24) weisen zwei unterschiedliche Profile auf, 6 Personen weisen nur eines und 9 Personen drei Profile auf. Inwieweit Lehrkräfte also Enthusiasmus erleben und im Verhalten äußern und dementsprechend von ihren Schüler/innen wahrgenommen werden, variiert von Stunde zu Stunde. Implikationen dieser Befunde für Praxis und Forschung werden im Vortrag aufgegriffen. ID: 233 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktiken der Naturwissenschaften und Technik Thematisches Cluster: Lehrerexpertise, Mathematisch-naturwissenschaftlicher Unterricht, Vorschulische Bildung Stichworte: Konzeptverständnis, Biologie, basiskonzeptorientierter Unterricht, Professionswissen Messung und Förderung von Konzeptverständnis im Bildungsbereich Biologie Chair(s): Christian Förtsch (LMU München), Janina Klemm (LMU München) Diskutant(en): Thilo Kleickmann (Christian-Albrechts-Universität zu Kiel) Ein zentrales Problem des Biologieunterrichts stellt die große Menge an isolierten Fakten dar (Wadouh et al., 2014), weshalb 2005 die drei Basiskonzepte System, Struktur und Funktion und Entwicklung im Rahmen der Bildungsstandards für das Fach Biologie eingeführt wurden (KMK, 2005). Sie haben zum Ziel, biologische Fachinhalte zu strukturieren, miteinander zu verknüpfen und so langfristig den Erwerb von konzeptuellem Wissen zu fördern (KMK, 2005). Basiskonzepte können dabei als grundlegende biologische Ideen, die in verschiedenen Kontexten angewendet werden können, verstanden werden (Kauertz et al., 2010; Wood, 2008). Aus konstruktivistischer Sicht spielt das Anknüpfen an Vorwissen und Präkonzepten der Schülerinnen und Schüler (SuS) eine entscheidende Rolle zum Aufbau von konzeptuellem Wissen (Duit, 1995; Mayer, 2004, 2009; Möller, 2002). Gemäß theoretischer Lehr-Lern-Modelle werden sowohl der Unterricht, als auch das fachspezifische Professionswissen von Lehrkräften als Einflussfaktor für Lernen von SuS gesehen (Helmke, 2014; Kunter et al., 2013). Erste Ansätze für die Gestaltung eines basiskonzeptorientierten Unterrichts existieren bereits (Neuhaus et al., 2014; Schmiemann et al., 2012), wurden allerdings noch nicht empirisch überprüft. Wadouh et al. (2014) konnten aber bereits zeigen, dass eine hohe Vernetzung im Biologieunterricht Schülerleistung fördert. Die Relevanz des fachdidaktischen Wissens für das Lernen von SuS wurde hingegen bereits in einigen Studien gezeigt (Fennema et al., 1996; Lange et al., 2015), wohingegen der Einfluss des Fachwissens noch empirisch ungesichert ist (Lange et al., 2015; Ohle et al., 2011). Dieses Symposiums fokussiert daher auf die Messung von konzeptuellem Verständnis bei SuS und Identifikation von Einflussfaktoren auf Unterrichts- und Lehrerebene. Die enthaltenen Teilprojekte diskutieren diese Fragestellung im Hinblick auf verschiedene Altersgruppen. Wenn auch nicht die gesamte Lebensspanne abgedeckt werden kann, so wird doch versucht, mit Studien aus dem Vorschul-, Grundschul- und Sekundarstufenbereich einen möglichst breiten Blick auf das Thema zu ermöglichen. Der erste Beitrag fokussiert auf die Entwicklung biologischer Konzepte im Vorschulalter, speziell Struktur und Funktion, und untersucht den Zusammenhang mit dem frühkindlichen Animismus. Der zweite Beitrag untersucht, ob sich das Konzeptverständnis von Grundschülern durch basiskonzeptorientierten Heimat- und Sachunterricht fördern lässt. Die weiteren beiden Beiträge beziehen sich auf SuS der Sekundarstufe. Während der dritte Beitrag speziell das Systemdenken der SuS und Einflüsse des fachspezifischen Professionswissens der Lehrkraft betrachtet, beleuchtet der vierte Beitrag den Einfluss des fachspezifischen Professionswissens auf die Konzeptorientierung im Unterricht und dessen Effekt auf die Schülerleistung. Die Ergebnisse der Einzelbeiträge werden theoretisch eingeordnet und ihre Praxisrelevanz diskutiert. Hierbei profitiert das Symposium von der interdisziplinären Zusammensetzung aus Biologiedidaktik, Psychologie sowie einem Diskutanten aus der Schulpädagogik. Beiträge des Symposiums Biologisches Konzeptwissen von Vorschulkindern und Zusammenhang mit dem Verständnis von Leben Janina Klemm, Beate Sodian, Lucia Kohlhauf, Birgit J. Neuhaus LMU München Während Chemie- und Physikunterricht häufig so gestaltet wird, dass er grundlegende Konzepte des Faches vermittelt, herrscht in der Biologie häufig nach wie vor die Vermittlung einzelner Fakten vor. Grundlegende Konzepte werden häufig nur unzureichend vermittelt und verstanden. Mit Einführung der Bildungsstandards für Biologie (KMK, 2005) wurde der Ruf nach einem konzeptorientierten Biologieunterricht immer lauter. Grundlegende Konzepte sollen zum Teil bereits in der Grundschule vermittelt werden (Bayrisches Staatsministerium für Unterricht und Kultus, 2000). Unterricht, der grundlegende Konzepte eines Faches gemeinsam mit den Schülern entwickelt, sollte nach Möller (2002) an Vorwissen und Präkonzepte anknüpfen. Es stellt sich daher die Frage, mit welchen grundlegenden biologischen Konzepten die Kinder bereits in die Grundschule kommen. Piaget (1929) stellte fest, dass Kinder Probleme haben mit der Unterscheidung zwischen Belebtem und Unbelebtem, und nahm an, dass dieser Animismus auf ein mangelndes Verständnis von Kausalzusammenhängen zurückzuführen ist. In weiteren Unteruchungen konnte bestätigt werden, dass jüngere Kinder Probleme mit dem Zuordnen zu Lebendig/nicht lebendig haben, insbesondere bei Pflanzen und Naturerscheinungen (Pauen, 1997). Inagaki und Hatano (2004) sprechen nicht mehr von Animismus als falschem Verständnis, sondern vom Vitalismus als Konzept, das sich im Vorschulalter entwickelt und ein funktionales Verständnis von körperlichen Prozessen ermöglicht. Es konnte gezeigt werden, dass das kindliche Verständnis von Belebt-Unbelebt mit dem Verständnis von Funktionen von körperlichen Organen einhergeht (Zaitchik, Iqbal, & Carey, 2014). Dieses Verständnis kann als eine Teilkompetenz vom Basiskonzept der Biologie Struktur und Funktion verstanden werden, deckt dieses aber keinesfalls ganz ab, da es sich lediglich auf den menschlichen Körper bezieht. Zum Struktur-Funktions-Verständnis von Vorschulkindern bei Tieren und Pflanzen gibt es bisher keine Untersuchungen. Fragestellung Haben Vorschulkinder ein allgemeines Verständnis des Basiskonzepts Struktur und Funktion? Inwieweit hängt dieses mit dem Verständnis der Unterscheidung Belebt-Unbelebt zusammen? Methode In der Studie wurden 74 Kinder im letzten Kindergartenjahr aus 5 verschiedenen Kindergärten getestet. Die Stichprobe setzt sich aus 35 weiblichen und 38 männlichen Teilnehmern, der Altersdurchschnitt lag zum Zeitpunkt der Testung bei 5;6 Jahren. Zur Untersuchung des Verständnis für den Begriff des Lebendigen wurde ein Animismusinterview (Zaitchik, Iqbal und Carey, 2014) verwendet. In diesem beurteilen die Kinder für verschiedene Tiere, Pflanzen, Gegenstände und Naturphänomenem, ob diese lebendig sind oder nicht und müssen manche ihrer Einschätzungen zusätzlich begründen. Zur Untersuchung des Verständnis der Probanden für Struktur- und Funktionszusammenhänge biologischer Phänomene wurde ein Struktur-Funktions-Wissenstest entwickelt. Dieser besteht aus neun verschiedene Problemstellungen mit Bildkarten, zu denen je eine Multiple Choice Frage oder Zuordnungsfragen und anschließende Begründung abgefragt wurden. Inhaltlich bezieht sich der Test auf Phänomene aus der Tier- und Pflanzenwelt, sowie auf den menschlichen Körper. Ergebnisse Insgesamt beantworteten die Kinder im Struktur-Funktions-Wissenstest im Mittel 49% der Fragen richtig, wobei sich die Begründungen (29% richtige Antworten) als schwieriger erwiesen als die geschlossenen Antwortformate (68%). Die beiden Subskalen geschlossene Antworten und Begründungen korrelieren mittelstark miteinander (r (74) = .54, p > .001). Wenn die Kinder die Begründungsfrage falsch beantworteten, lag dies an den folgenden Arten der Antworten: keine Antwort (14%), Wiederholung der Frage als Antwort (3%), kein Bezug zur Frage (23%), Vorwissen als Begründung (15%), affektive Interpretation (3%), nicht ausreichend deutliche Begründung (9%). Es konnte kein Zusammenhang zwischen dem kindlichen Verständnis der Unterscheidung belebt-unbelebt und dem StrukturFunktions-Verständnis gefunden werden (r (72) = .22, p > .05), aber mit der Subskala der Begründungen (r (72) = .28, p < .05). Diskussion Die Ergebnisse sprechen dafür, dass Vorschulkinder erste Präkonzepte in Richtung eines Verständnisses von StrukturFunktions-Zusammenhängen haben. Die falschen Antworten deuten dagegen darauf hin, dass Vorwissen ein hemmender Faktor sein kann, diese zu aktivieren. Der erwartete Zusammenhang mit dem kindlichen Verständnis von Belebt-Unbelebt konnte gefunden werden. Biologisches Konzeptverständnis im Heimat- und Sachunterricht der Grundschule Nina Kümpel, Birgit J. Neuhaus LMU München Theoretischer Hintergrund & wissenschaftliche Fragestellung Die Basiskonzepte der Bildungsstandards für das Fach Biologie (KMK, 2005) sollen der Förderung eines Konzeptverständnisses dienen, indem sie die fachlichen Inhalte im Sinne eines kumulativen Lernens miteinander vernetzen, das Fachwissen strukturieren und ein konzeptuelles Wissen aufbauen (Nachreiner et al., 2015; Neuhaus et. al. 2014; Schmiemann et al., 2012). Das Kompetenzmodell des Projekts Evaluation der Standards in den naturwissenschaftlichen Fächern der Sekundarstufe I (ESNaS; Kauertz et al., 2010) beschreibt im Bereich der Komplexität fünf Niveaustufen: Niveau I: 1 Fakt, Niveau II: 2 Fakten, Niveau III: 1 Zusammenhang, Niveau IV: 2 Zusammenhänge und Niveau V: übergeordnetes Konzept. Basiskonzepte lassen sich als übergeordnete Konzepte beschreiben und der höchsten Komplexitätsstufe zuordnen. Konzeptuelles Wissen umfasst demnach nicht nur das Wissen von Fakten, sondern vor allem auch das Wissen von Zusammenhängen und Konzepten (de Jong & Ferguson-Hessler, 1996; Hiebert & Lefevre, 1986). Durch den Einsatz von Kontexten in den naturwissenschaftlichen Unterricht, welche der Verknüpfung von fachlichen und nichtfachlichen Inhalten dienen (Haugwitz, 2009), soll vernetztes und anschlussfähiges Wissen aufgebaut und die Anwendbarkeit des Wissens gefördert werden (Schmiemann et al., 2011; Van Vorst et al., 2014). Um Konzeptverständnis schon früh anzubahnen, soll in dieser Studie basiskonzept- und kontextorientierter Heimat- und Sachunterricht entwickelt und dessen Wirksamkeit empirisch überprüft werden. In einer Interventionsstudie soll untersucht werden, ob der Einsatz von Basiskonzepten (_Struktur und Funktion, Entwicklung, System_) und problemorientierten Kontexten das Konzeptverständnis der Schülerinnen und Schüler im Heimat- und Sachunterricht fördert. Methode Die Interventionsstudie fand in einem unvollständigem 2*2-Design statt, bei der nach Basiskonzept- und Kontextorientierung variiert wurde. Dazu wurden drei 6-stündige basiskonzept- und kontextorientierte Unterrichtseinheiten in drei verschiedenen Varianten (I: Kontrollgruppe, II: basiskonzeptorientierter Unterricht und III: basiskonzeptorientierter Unterricht angereichert mit problemorientierten Kontexten) entwickelt und der Einfluss der drei verschiedenen Treatments auf das Konzeptverständnis der Lernenden untersucht. In der zweiten Jahrgangsstufe nahmen 350 Schülerinnen und Schüler von sechs verschiedenen Grundschulen teil (I: n=115; II: n=116; III: n=119). Die Leistung der Schüler wurde mittels Leistungstest im Prä-Post-Design (NPrä = 35, NPost = 42) erhoben. Beide Tests enthielten drei Skalen zu Faktenwissen (α = 0,63), Zusammenhangswissen (α = 0,78) und Konzeptwissen (α = 0,78). Etwa zehn Prozent der Prä- und Posttests wurden zweitkodiert (κ > 0.83). Die Unterschiede zwischen den drei Treatments wurden mittels ANOVA mit anschließenden Post-Hoc-Tests ermittelt (Bonferroni). Der Prätest wurde berücksichtigt, die Auswertung erfolgte mit den Residuen. Ergebnisse und Diskussion In der zweiten Jahrgangsstufe zeigen sich signifikante Unterschiede hinsichtlich des Zusammenhangs- und Konzeptwissens zwischen der Kontrollgruppe und den Treatments Basiskonzept und Basiskonzept und Kontext. Sowohl bei der Skala Zusammenhang als auch bei der Skala Konzept ist das Wissen bei Treatment II und III signifikant höher als bei der Kontrollgruppe (Zusammenhangswissen: F (90, 348) = 60.81; p < .001; η2 = .26, Konzeptwissen: F (61, 348) = 36.67; p < .001; η2 = .17). Im Erwerb des Faktenwissens zeigen sich keine Unterschiede zwischen den Treatments (Faktenwissen: F(0, 348) = 0.09; p = .91). Die Unterschiede zwischen dem Treatment Basiskonzept und Basiskonzept und Kontext sind nicht signifikant (Zusammenhangswissen: p = 1.0; Konzeptwissen: p = .34 (Bonferroni)). Der Kontext zeigt demnach keine zusätzliche Wirkung. Die Ergebnisse der Interventionsstudie zeigen, dass sich der Einsatz von Basiskonzepten und Kontexten positiv auf das Konzeptverständnis der Schülerinnen und Schüler auswirkt. Die Studie wurde auch in der dritten (n=355) und in der vierten Jahrgangsstufe (n=252) durchgeführt, um die Ergebnisse zu replizieren. Weiterhin zu prüfen ist der Einfluss auf leistungsstarke und leistungsschwache sowie auf weibliche und männliche Schülerinnen und Schüler. Der evaluierte Unterricht stellt einen ersten Ansatz dar, wie Heimat- und Sachunterricht basiskonzept- und kontextorientiert geplant werden kann und wo Probleme und Chancen für Lernende in der Grundschule bestehen. Die Bedeutung des fachbezogenen Professionswissens von Lehrkräften für das konzeptuelle Verständnis biologischer Systeme von Schülerinnen und Schülern Daniela Mahler, Jörg Großschedl, Ute Harms IPN Kiel Theoretischer Hintergrund Das fachbezogene Professionswissen der Lehrkraft wird als Bedingungsfaktor für die Instruktionsqualität und den Lernprozess von Schülerinnen und Schülern (SuS) gesehen (z. B. Baumert et al., 2010). Das fachbezogene Professionswissen setzt sich aus den Domänen Fachwissen (CK) und fachdidaktisches Wissen (PCK) zusammen. CK beinhaltet das Wissen über Fakten, Konzepte und Strukturen eines Faches. PCK beschreibt das Wissen, das nötig ist, um fachliche Inhalte zu vermitteln (Shulman, 1986). Viele Studien konnten zeigen, dass das PCK relevant für das Lernen von SuS ist (z. B. Lange et al., 2015; Fennema et al., 1996). Unklar scheint hingegen die Rolle des CK. Obwohl viele Autoren CK als Bedingungsfaktor für das Lernen beschreiben (z. B. Hill et al., 2007; Ma, 1999), konnten empirische Studien diesen Zusammenhang nicht nachweisen (z. B. Lange et al., 2015; Ohle, Fischer & Kauertz, 2011). Unsere Studie untersucht den Zusammenhang zwischen dem fachbezogenen Professionswissen von Biologielehrkäften und dem Lernen von SuS. Es wird ein spezieller Bereich des Lernens betrachtet: das Systemdenken. Systemdenken ist ein etabliertes Konstrukt in der Lehr-Lernforschung mit Bezug zum Biologieunterricht (Brandstädter, Harms & Großschedl, 2012; Sommer & Lücken, 2010) und Geographieunterricht (z. B. Rempfler & Uphues, 2012), da in diesen Fächern der Umgang mit Systemen elementar ist. Konkret auf den Lernprozess von SuS bezogen kann Systemdenken als konzeptuelles Verständnis (biologischer) Systeme verstanden werden. Systemdenken beschreibt i.e.S. die Fähigkeit, Systeme als Funktionseinheit ihrer Elemente zu begreifen sowie die Stabilität eines Systems als abhängig von den Beziehungen zwischen seinen Elementen zu verstehen (Assaraf & Orion, 2005). Fragestellung Welchen Einfluss haben das CK und das PCK von Lehrkräften auf die Entwicklung des Systemdenkens seitens der SuS? Methode An der Studie nahmen 134 Biologielehrkräfte (Alter: M=43,7 Jahre (SD=10,3), 75,4% weiblich) teil, davon 41 Lehrkräfte mit ihren Klassen (N=1036 SuS, Alter: M=13,5 Jahre (SD= 0,72), 49,4% weiblich). Das fachbezogene Professionswissen (CK: 19 Items, α=,68; PCK: 9 Items, α=,79) sowie das Systemdenken (26 Items, α=,76) wurden mit Fragebögen zu einem biologischen Inhaltsbereich (Ökosystem Wattenmeer) und zu grundlegendem Wissen über Systeme (z. B. Ursache-Wirkungs-Beziehungen) erhoben. Zusätzlich wurde das Systemdenken mit Concept Maps erfasst. Um zu untersuchen, ob CK und PCK als eigenständige Prädiktoren betrachtet werden können, wurde ihre empirische Separierbarkeit im Rahmen einer Rasch-Analyse überprüft. Um zu untersuchen, ob CK und PCK prädiktiv für das Systemdenken sind, wurde ein Mehrebenen-Strukturgleichungsmodell spezifiziert, in dem die Fähigkeit der SuS im Systemdenken nach dem Doubly-Latent Modell von Marsh et al. (2009) auf Lehrerund Schülerebene latent modelliert wurde. Als Indikatoren für diese latente Variable fungieren dabei die Ergebnisse des Fragebogens zum Systemdenken sowie die der Concept Maps. Zusätzlich wurden die kognitiven Fähigkeiten und das Vorwissen im Bereich Systemdenken als Kontrollvariablen auf Schülerebene eingesetzt. Ergebnisse Die Überprüfung der Separierbarkeit bestätigt, dass es sich bei CK und PCK um empirisch trennbare Konstrukte handelt (eindimensionales Modell: AIC=5913,97, CAIC=6097,17, BIC=6050,17; zweidimensionales Modell: AIC=5813,22, CAIC=6004,22, BIC=5955,22; χ²-Differenztest: χ²(2)=104,75, p<,001), die korrelieren (r=,48, p<,001). CK und PCK werden folglich als eigenständige Prädiktoren in das Mehrebenen-Strukturgleichungsmodell eingesetzt. Die Ergebnisse zeigen keinen signifikanten Zusammenhang zwischen CK und dem Systemdenken der SuS (β=,17, p=,36), jedoch einen signifikant positiven Zusammenhang zwischen PCK und dem Systemdenken der SuS (β=,31, p=,04). Das PCK der Biologielehrkraft stellt also einen Prädiktor für das Systemdenken der SuS dar. Fazit Die Ergebnisse unterstützen die Relevanz einer biologiedidaktischen Lehreraus- und Lehrerfortbildung bezüglich des Systemdenkens. Die Bedeutung des PCK konnte in dieser Studie allerdings nur für dieses Konstrukt gezeigt werden. Replikationsstudien sind in Vorbereitung. Förderung der Schülerleistung durch einen konzeptorientierten Biologieunterricht - Einfluss des Professionswissens Sonja Werner, Christian Förtsch, Lena von Kotzebue, Birgit J. Neuhaus LMU München Theoretischer Hintergrund Die 2005 eingeführten Bildungsstandards für die naturwissenschaftlichen Fächer beschreiben u.a. den Kompetenzbereich Fachwissen (KMK, 2005). Innerhalb des Fachwissens wurden biologiespezifische Basiskonzepte definiert, die zur Strukturierung des Unterricht und Förderung des konzeptuellen Wissens genutzt werden können (Beyer, 2006; Neuhaus et al., 2014). Basiskonzepte lassen sich gemäß dem Kompetenzmodell von ESNaS in der Dimension Komplexität als übergeordnete wissenschaftliche Ideen beschreiben (Kauertz et al., 2010; Kremer et al., 2012). Bisher existieren allerdings nur wenige Ansätze zur Umsetzung eines konzeptorientierten Unterrichts (Neuhaus et al., 2014; Schmiemann et al., 2012). Gemäß Förtsch et al. (eingereicht) und Nachreiner et al. (2015) bezieht sich konzeptorientierter Unterricht auf Elemente allgemein psychologischer Theorien und biologiespezifischer Unterrichtsqualitätsmerkmale. Dabei spielt aus konstruktivistischer Sicht das Vorwissen der Schülerinnen und Schüler (SuS) eine zentrale Rolle, da neues Wissen aktiv, basierend auf bereits Bekanntem, konstruiert wird (Duit, 1995, Mayer, 2004, 2009). Zudem ist die Aktivierung von Vorwissen eine Bedingung für einen erfolgreichen Konzeptaufbau basierend auf der Conceptual-Change-Theorie (Özdemir & Clark, 2007) und eine erfolgreiche Vernetzung im Unterricht (Förtsch et al., eingereicht; Lipowsky et al., 2009; Wadouh et al., 2014). Laut dem Fragmentierungsansatz werden vorunterrichtliche Vorstellungen als Ansammlung unverbundener Wissenselemente gesehen. Durch Aufzeigen von Beziehungen kann ein wissenschaftlichen Konzept erreicht werden (diSessa et al., 2004). Für den Biologieunterricht konnte bereits gezeigt werden, dass ein höherer Vernetzungsgrad die Schülerleistung fördert (Wadouh et al., 2014). Erste Ergebnisse zur Steigerung der Schülerleistung durch einen konzeptorientierten Biologieunterricht konnten bereits von Förtsch et al. (eingereicht) gezeigt werden. Theoretische Lehr-Lern-Modelle gehen zudem davon aus, dass die professionelle Handlungskompetenz einer Lehrkraft die Unterrichtsqualität und folglich die Leistung ihrer SuS beeinflusst (Kunter et al., 2011; Helmke, 2014). Einen Teil der professionellen Handlungskompetenz stellt das Professionswissen dar, welches sich u.a. in die fachspezifischen Dimensionen Fachwissen (FW) und fachdidaktisches Wissen (FDW) unterteilen lässt (Kunter et al., 2011). Welchen Einfluss das fachspezifische Professionswissen einer Lehrkraft auf einen konzeptorientierten Unterricht hat ist allerdings noch unklar. Fragestellungen Welche Rolle spielt das fachspezifische Professionswissen für einen konzeptorientieren Biologieunterricht? Welchen Einfluss hat ein konzeptorientierter Biologieunterricht auf die Schülerleistung? Methode Die Studie wurde im Rahmen des BMBF-finanzierten Projekts ProwiN durchgeführt. Es nahmen 43 Biologielehrkräfte (Alter M=35,3 Jahre, SD=8,0; 60,5% weiblich) des bayerischen Gymnasiums mit ihren Klassen der 9. Jahrgangsstufe (N=1138 SuS, 50,0% weiblich) teil. Pro Lehrkraft wurden zwei Stunden zum Themenbereich Neurobiologie videografiert (N=85 Videos). Das fachspezifische Professionswissen der Lehrkräfte wurde mittels eines Paper-Pencil-Test mit vorwiegend offenen Fragen gemessen (Jüttner et al., 2013) und anschließend unter Verwendung des Partial-Credit-Modells Rasch-skaliert (FW: 12 Items; FDW: 9 Items) und wiesen zufriedenstellende fit-Werte auf (alle Infit/Outfit-MNSQ≤1,5; Personenreliabilität: 0,53 (FDW); 0,73 (FW); Itemreliabilität: 0,96 (FDW); 0,99 (FW)). Der Schülerleistungstest wurde im Prä-Post-Design eingesetzt (Prätest: 18 Items, Posttest: 22 Items) und ebenfalls Rasch-skaliert. Die Items zeigten gute fit-Werte (alle Infit/Outfit-MNSQ≤1,3). Personen- (Prätest: 0,63; Posttest: 0,78) und Itemreliabilitäten (Prätest/Posttest: 1,00) wiesen ebenfalls zufriedenstellende Werte auf. Unterrichtsvideos wurden mittels eines theoriebasierenden Ratingmanuals kodiert (23 Items; α=0,95; κ=0,67). Zur Beantwortung der Fragestellungen wurden multiple lineare Regressionsmodelle, sowie Mehrebenenpfadmodelle berechnet. Ergebnisse FDW konnte als signifikanter Prädiktor für einen konzeptorientierten Biologieunterricht identifiziert werden (β=0,26, p=0,046, R²=0,07). Ergebnisse des Mehrebenenpfadmodells (χ²(2)=2,52, p=0,284; CFI=0,996, RMSEA=0,018, SRMR(within)=0,000, SRMR(between)=0,074) zeigten auf der Klassenebene einen tendenziell positiven Effekt des FDW auf einen konzeptorientieren Unterricht (β=0,25, p=0,094, R²=0,06), welcher wiederum einen positiven Einfluss auf die Schülerleistung im Posttest aufwies (β=0,36, p=0,020, R²=0,13). Auf Schülerebene wurden die Leistung im Prätest und die Anstrengungsbereitschaft der SuS kontrolliert. Fazit Unsere Ergebnisse bestätigen erste empirische Hinweise, wonach ein konzeptorientierter Biologieunterricht zu einer höheren Lernleistung der SuS führt. Zudem konnte gezeigt werden, dass ein höheres FDW der Lehrkraft die Konzeptorientierung im Unterricht fördert. Daher scheint die Integration von Konzeptorientierung in die universitäre Lehrerausbildung, sowie in Lehrerfortbildungen sinnvoll. ID: 240 Symposium Disziplinen-Cluster: Didaktiken der Naturwissenschaften und Technik Thematisches Cluster: Bildung im Sekundarbereich, Kompetenzdiagnostik/ Kompetenzentwicklung, Mathematischnaturwissenschaftlicher Unterricht Stichworte: Kontexte, Interesse, Testaufgaben, Lernaufgaben, Naturwissenschaften Kontexteinflüsse auf die Schwierigkeit von (Test-)Aufgaben in den Naturwissenschaften Chair(s): Maik Walpuski (Universität Duisburg-Essen) Diskutant(en): Hans Anand Pant (Humboldt Universität zu Berlin) Der Kompetenzbegriff ist zur Beschreibung der Ziele und Ergebnisse schulischer Bildung zentral (Klieme & Hartig, 2008). Kompetenzen werden dabei als „kontextspezifische kognitive Leistungsdispositionen [aufgefasst], die sich funktional auf Situationen und Anforderungen in bestimmten Domänen beziehen“ (Klieme & Leutner, 2006, S. 879). In diesem Symposium wird aus der Perspektive der drei naturwissenschaftlichen Fächer Biologie, Chemie und Physik beleuchtet, wie sich Kontextmerkmale auf die Leistungen von Schülerinnen und Schülern in Lern- und Testsituationen auswirken. Am Beispiel des Fachs Chemie wird in der ersten Studie „Der Einfluss systematisch variierter Kontexte auf affektive und kognitive Schülerfaktoren“ untersucht, inwiefern sich die drei Variablen Kontextmerkmal, Fachinhalt und Problemorientierung auf das situationale Interesse sowie die Lernleistung und die kognitive Belastung von Lernenden auswirken. Während im Rahmen von Lernaufgaben meist versucht wird, den positiven Einfluss interessanter Kontexte zu nutzen, wird der Einfluss von Kontexten auf Testaufgaben häufig vernachlässigt, obwohl viele Leistungstestaufgaben kontextualisiert eingesetzt werden. Der mögliche Einfluss solcher Kontextualisierungen wird zunächst fachspezifisch für die Fächer Biologie und Physik in den Vorträgen „Motivationale Effekte der Kontextualisierung von Testaufgaben zum ethischen Bewerten“ und „Kompetenzanforderungen kontextualisierter Problemlöseaufgaben“ vorgestellt. In beiden Fällen zeigt sich ein Einfluss der Kontexte auf die Schülerleistungen. Für die Aufgaben zum ethischen Bewerten im Fach Biologie lässt sich eine unterschiedliche Interessantheit und wahrgenommene Relevanz der Kontexte nachweisen. Eine positive Einschätzung der Kontextmerkmale ist dabei mit der gemessenen Personenfähigkeit korreliert. Ähnliches zeigt sich für die Problemlöseaufgaben im Fach Physik. Auch hier hängt die Kontextualisiertheit der Aufgaben positiv mit der gemessenen Schülerkompetenz zusammen. Das vierte hier vorgestellte Forschungsprojekt strebt einen Vergleich zwischen Kompetenzbereichen (Fachwissen und Bewertung) und zwischen Fächern (Biologie und Chemie) an. Hier wurden zu identischen Kontexten Leistungstestaufgaben jeweils für beide Fächer und beide Kompetenzbereiche konstruiert. Weitere Aufgabenmerkmale (Aufgabenformat, Komplexität) wurden konstant gehalten. Hier konnten innerhalb der Fächer Unterschiede in der Interessantheit der Kontexte nachgewiesen werden, nicht aber in der Schwierigkeit. Ergebnisse aus dem Vergleich zwischen den Kompetenzbereichen und zwischen den Fächern werden bis zur Tagung vorliegen. Insgesamt lässt sich festhalten, dass auf Grundlage der hier untersuchten Aufgaben angenommen werden kann, dass sich Kontextmerkmale von Aufgaben auf die Performanz von Schülerinnen und Schülern in Lern- und Leistungssituationen auswirken. Für die Interpretation der Ergebnisse sollten daher affektive Merkmale aufgabenbezogen kontrolliert werden. Beiträge des Symposiums Der Einfluss systematisch variierter Kontexte auf affektive und kognitive Schülerfaktoren Sebastian Habig, Helena van Vorst, Elke Sumfleth Universität Duisburg-Essen *Ausgangslage* Die Bedeutung von Interesse für den erfolgreichen Verlauf schulischer Lernprozesse ist bereits bekannt. Deshalb ist der starke Rückgang des Interesses im Verlauf der Schulzeit in den naturwissenschaftlichen Fächern bedenklich (Potvin & Hasni, 2014). Um dieser Entwicklung entgegen zu wirken, werden vermehrt lebensweltliche Kontexte in den naturwissenschaftlichen Unterricht integriert. Evaluationsergebnisse des Kontexteinsatzes belegen einen positiven Einfluss auf affektive Schülerfaktoren (Ültay & Çalık, 2012), während die Effekte hinsichtlich kognitiver Schülermerkmale noch nicht hinreichend geklärt wurden (Bennett, Lubben, & Hogarth, 2007). Eine nähere Betrachtung der Ergebnisse macht zudem deutlich, dass die Effekte vom verwendeten Kontext abhängen (Fechner, 2009; Sjøberg & Schreiner, 2010). _Kontextmerkmale_ Van Vorst und Kollegen haben aus einer Analyse der Kontextliteratur einen Vorschlag für ein Merkmalsmodell zur Klassifizierung von Kontexten abgeleitet (van Vorst et al., 2014). Von besonderer Bedeutung für die hier vorgestellte Studie ist das Merkmal _Alltagsbezug_, das Gegenstände oder Situationen aus der unmittelbaren Lebenswelt der Schülerinnen und Schüler meint (Bennett, 2003; Campbell & Lubben, 2000), mit denen sie vertraut sind (Kunkel-Razum, Scholze-Stubenrecht, & Wermke, 2007). Dem gegenüber steht das Merkmal _Besonderheit_, welches außergewöhnliche Gegenstände oder Situationen außerhalb der unmittelbaren Lebenswelt beschreibt (Kasanda et al., 2005). Darüber hinaus können Kontexte das gegenwärtige Zeitgeschehen aufgreifen, welches sich meist in der medialen Berichterstattung widerspiegelt, und die damit eine gewisse _Aktualität_ aufweisen (Just, 2001). Van Vorst (2013) hat den Einfluss der drei Kontextmerkmale _Alltagsbezug_, _Besonderheit_ und _Aktualität_ auf das situationale Schülerinteresse untersucht. Sie ließ Schülerinnen und Schüler der Jahrgangsstufe 9 an Gymnasien ihr situationales Interesse an Kontexten zum Inhaltsbereich Organische Chemie mithilfe eines Fragebogens bewerten. Ihre Ergebnisse zeigen, dass besonderen Kontexten eine signifikant höhere emotionale Valenz zugeschrieben wird als alltäglichen Kontexten. Das Merkmal _Aktualität_ hat hingegen keinen Einfluss auf die Kontextbewertung. Eine signifikant höhere wertbezogene Valenz wurde Kontexten mit einer Kombination der Merkmale _Besonderheit_ und _Aktualität_ zugesprochen. Der Einfluss der Kontextmerkmale auf die Lernleistung der Schülerinnen und Schüler wurde bisher nicht untersucht. Auch der chemische Inhalt hat einen Einfluss auf den Effekt eines Kontextes (Kölbach, 2011). Kontextorientiertes Lernen geht häufig mit einer problemorientierten Aufgabenstellung einher. Ergebnisse von Harbach (2013) legen nahe, dass dies mit höherer kognitiver Belastung der Lernenden verbunden ist, was den Effekt kontextorientierten Lernens beeinflussen kann. *Forschungsfragen und Methodik* Aufgrund der beschriebenen Ausgangslage wird in der vorgestellten Studie die Frage nach dem Einfluss der drei Variablen Kontextmerkmal, Fachinhalt und Problemorientierung auf das situationale Interesse sowie die Lernleistung und die kognitive Belastung von Lernenden untersucht. Dazu werden die drei unabhängigen Variablen in einem 2x2x2-Design systematisch miteinander variiert und zu jeder Kombinationsmöglichkeit gezielt Lernaufgaben konstruiert. Für jeden Aufgabentyp werden drei 45-minütige Lerneinheiten auf der Grundlage einer Experimentierbox entwickelt und ihr Effekt auf die oben genannten Faktoren untersucht. Dazu wird eine Interventionsstudie im Prä-Post-Follow up-Design in der Jahrgangsstufe 9 mit etwa 400 Schülerinnen und Schüler am Gymnasium durchgeführt. In einer Vorstudie wurde die Merkmalszugehörigkeit von Kontexten zu den chemischen Inhalten Säure/Base und RedOx ermittelt, sodass nur Kontexte mit eindeutiger Merkmalszugehörigkeit für die Hauptstudie ausgewählt wurden. Gleichzeitig wurden erste Daten zum situationalen Interesse an diesen Kontexten erhoben. *Ergebnisse* Ergebnisse zu den Einflüssen der drei Variablen Merkmal, Fachinhalt und Problemorientierung auf das situationale Interesse, die Lernleistung und kognitive Belastung werden auf der GEBF-Tagung im März präsentiert. Erste Ergebnisse der Voruntersuchung bestätigen bereits, dass sich die wertbezogene und emotionale Valenz von Kontexten in Abhängigkeit des zugrundeliegenden Merkmals unterscheiden. Es kann angenommen werden, dass außergewöhnliche Kontexte eher die Neugier wecken und damit zu höherer emotionaler Valenz führen. Alltägliche Kontexte hingegen scheinen aufgrund des lebensweltlichen Bezugs für Schülerinnen und Schüler persönlich bedeutsamer zu sein. Unabhängig vom Kontextmerkmal bewerten Schülerinnen und Schüler die emotionale Valenz höher als die wertbezogene Valenz. Motivationale Effekte der Kontextualisierung von Testaufgaben zum ethischen Bewerten Julia Schwanewedel1, Melanie Werner2, Jürgen Mayer2 1 IPN an der Universität Kiel, 2Universität Kassel *Theoretischer Hintergrund* Die Fähigkeit naturwissenschaftliche Sachverhalte in verschiedenen Kontexten erkennen und bewerten zu können ist ein bedeutsames Element naturwissenschaftlicher Bildung (KMK, 2004). Entsprechende Kompetenzen werden in den Bildungsstandards für den naturwissenschaftlichen Unterricht im Bereich „Bewertung“ beschrieben und sollen im Rahmen von ländervergleichenden Test gemessen werden (Hostenbach, 2011). Die entsprechenden Testausgaben sind kontextualisiert, d.h. der naturwissenschaftliche Fachinhalt (Tiefenstruktur) ist in eine lebensweltliche Anbindung (Oberflächenstruktur) eingebettet (Löffler & Kauertz, 2014). Somit dienen die Kontexte der Testaufgaben als Ausgangspunkte für die zu messende Bewertungskompetenz der Schülerinnen und Schüler. In der vorliegenden Arbeit werden Bewertungskontexte in Anlehnung an Lee und Grace (2012) als Anwendungssituationen verstanden, die biologische Themen beinhalten und zudem ethisch relevante Problemstellungen aufwerfen. Vier Kontexte mit entsprechendem Bezug zu bioethischen Bewertungsfragen wurden ausgewählt: Tierhaltung (Tierethik), Umwelt & Nachhaltigkeit (Umweltethik), Medizin (Medizinethik) und Gesundheit (Sozialethik). Dabei können Kontexte zum einen ein schwierigkeitsinduzierendes Merkmal sein (Sadler & Zeidler, 2004), zum anderen können sie auf Grund ihrer motivationalen Wirkung Testleistungen positiv beeinflussen (Drechsel et al., 2011). Um die potentiellen motivationalen Effekte eines Kontextes zu erfassen wurden Interessantheit, Bekanntheit, die gesellschaftliche- und persönliche Relevanz als relevante Kontext-Valenzen definiert. Diese beschreiben motivationale Relationen zwischen Person und Kontext, die eine Handlung oder Leistung positiv (positive Valenz), negativ (negative Valenz) oder ambivalent beeinflussen können. *Fragestellung* Es wurden die folgenden zentralen Forschungsfragen untersucht: (1) Welchen Einfluss haben Kontexte auf die Schwierigkeit von naturwissenschaftlichen Testaufgaben zum Kompetenzbereich Bewerten? (2) Unterscheiden sich unterschiedliche Kontexte im Bezug auf ihre motivationalen Anregung (Kontext-Valenzen)? (3) Welchen Einfluss haben die Kontext-Valenzen Interessantheit, Bekanntheit, gesellschaftliche- und persönliche Relevanz auf die Testleistung zur Bewertungskompetenz? *Methode* Die Bewertungskompetenz von Schülerinnen und Schülern (9./10. Jahrgang) wurde in einer Vor- und Hauptstudie (N = 252, N = 742) durch ein aufgabenbasiertes paper-pencil Testinstrument (187 Items, multi-matrix-design) erfasst. Die Aufgaben wurden nach dem BISTA-Kompetenzmodell konstruiert (Hostenbach et al., 2011; Schwanewedel & Mayer, 2012)) und die erforderliche Teilkompetenz, die Aufgabenkomplexität sowie die erforderlichen kognitiven Prozesse systematisch kontrolliert. Die Kontexte der Aufgaben wurden systematisch über die vier Kontexte Tiere, Umwelt & Nachhaltigkeit, Medizin und Gesundheit variiert. Mit einem Fragebogen wurden die Einschätzung der Kontext-Valenzen Interessantheit, Bekanntheit, gesellschaftliche- und persönliche Relevanz erhoben (28 Items, 4-stufige Likert-Skalen). Der Fragebogen wurde nach jeder Testaufgabe eingesetzt (embedded measurement). Das Testinstrument weist zufriedenstellende Itemkennwerte auf (.70 ≤ MNSQ ≤ 1.3; ZSTD < 2). Die Datenauswertung erfolgt auf Basis der Item-Response-Theorie und der klassischen Testtheorie. *Ergebnisse* Die Ergebnisse der Hauptstudie zeigen, dass sich Aufgaben in den vier Kontextbereichen in ihrer mittleren Schwierigkeit statistisch nicht signifikant unterscheiden (p > .05). Allerdings unterscheiden sich die Aufgaben der vier Kontexte in der Ausprägung ihrer motivationalen Valenzen (Interessantheit, Bekanntheit, gesellschaftliche- und persönliche Relevanz). Beispielweise werden Aufgaben zum Bereich _Tierhaltung_ als am interessantesten und Aufgaben zum Bereich _Umwelt & Nachhaltigkeit_ als am wenigsten interessant beurteilt; Aufgaben zum Bereich _Gesundheit_ beurteilen die Lernenden als am bekanntesten und am relevantesten für ihren persönlichen Alltag. Die Untersuchung des Einflusses der vier Kontext-Valenzen auf die Bewertungskompetenz zeigt, dass alle Valenzen positiv mit der Personenfähigkeit korrelieren. Die höchsten Zusammenhänge zeigen sich dabei mit der _Gesellschaftsrelevanz_ (r = .33**) und der _Bekanntheit_ (r = .26**). Die vier Kontextvalenzen der Testaufgaben erklären 14% der Leistungsunterschiede im Kompetenzbereich Bewerten. Kompetenzanforderungen kontextualisierter Problemlöseaufgaben Florian Gigl, Patrick Löffler, Alexander Kauertz Universität Koblenz-Landau *Hintergrund* Kontextualisiertes Problemlösen ist eine Möglichkeit, gelernte Inhalte anzuwenden. Zum anderen ist es im Sinne der Bildungsstandards und der scientific literacy selbst Bildungsziel. Entsprechende Aufgabenstellungen bestehen meist aus einer lebensnahen Problemgeschichte – der Surface Structure (Mestre, 2002) - und einem, dem Problem zugrunde liegenden, abstrakten (konzeptualisierten) fachlichem Modell - der Deep Structure (Löffler & Kauertz, 2014). Die Fähigkeit zum Problemlösen besteht aus vier Aspekten (Löffler & Kauertz, 2014): (1) Verstehen des Problems, (2) Planen der Lösung, (3) Durchführen des Lösungswegs und (4) Reflektieren über das Ergebnis. Im ersten Schritt wird das kontextgebundene Problem strukturiert und dabei mit der Deep Structure verbunden. Im zweiten Schritt wird die Lösung des Problems geplant und in Schritt 3 durchgeführt. Dabei werden bekannte Fakten und Lösungsstrategien genutzt. Schritt 4 erfordert die systematische Analyse des Lösungsversuchs. Da die Aspekte eng aufeinander bezogen sind, ist davon auszugehen, dass die zugrundeliegende Fähigkeit eindimensional ist. Nach Leiss et al. (2010) beeinflussen unter Anderem Fachkompetenz und Lehrerimpulse die Performanz im gesamten Problemlöseprozess. Kognitive Fähigkeiten haben prinzipiell einen positiven Einfluss auf das Problemlösen (Heller & Hollabaugh, 1992). *Fragestellungen* Hieraus ergeben sich folgende Forschungsfragen: (1) Bildet das entwickelte Instrument die Fähigkeit des Problemlösens valide ab? (2) Welchen Einfluss haben Vorwissen über Fachinhalte und dessen zielgerichtete Einbindung auf den Problemlöseprozess? *Methode* Die Problemlösefähigkeit wird mit 6 Items zu einem Problem aus der Thermodynamik erfasst. Damit wurden N=211 Zehntklässler (49,8% weiblich) an drei Gymnasien in Rheinland-Pfalz getestet. Das Problem wird dabei systematisch in den dichotomen Variablen Transparenz, Kontextualisiertheit und Komplexität variiert (2x2x2 – Design, Löffler & Kauertz, 2015). Als Prädiktoren werden kognitive Fähigkeiten mit Subskalen des IST 2000R (Liepmann et al., 2001) sowie konzeptuelles Vorwissen mithilfe einer Übersetzung des „Thermal Concept Evaluation“ (TCE, Yeo, 2001) gemessen. Die Problemlösefähigkeit wird durch ein eindimensionales Rasch-Modell (EAP-Schätzer) berechnet. Die kriteriale, konstruktbezogene und prädiktive Validität werden diskriminant durch Korrelationen und Regressionen zu den erhobenen Prädiktoren Intelligenz, Vorwissen berechnet. Aufgrund der Stichprobenstruktur wird zusätzlich die Kovariate Schulort berücksichtigt. *Ergebnisse* Das eindimensionale Raschmodell weist eine akzeptable EAP/PV-Reliabilität von .79 auf, die mittlere latente Fähigkeit beträgt M=-0.36 (SD=0.97). Zur kriterialen Validierung zeigt sich ein mittlerer Zusammenhang der Performanz im Problemlöseprozess mit dem Fachwissen (Gesamtscore TCE, r=.43, p <.001) sowie der Subskala _Ähnlichkeiten_ der verbalen Intelligenz (r=.33, p <.001). Ein großer Zusammenhang zeigt sich mit dem Schulstandort (ρ=.57, p <.001), der Subskala _Analogien_ (r=.59, p <.001), jedoch kein Zusammenhang zum räumlichen Vorstellungsvermögen (r=0.11, p=.11). Der Schulstandort korreliert zudem nicht mit dem Score im TCE (ρ=.04, p=.52). Das Fachwissen klärt rund ein Fünftel der Varianz auf (R²=.18, F(1,209)=47.02, p<.001), die verbale Intelligenz (R²=.35, F(1,208)=56.88, p<.001) und deren Subskala _Analogien_ (R²=.34, F(1,209)=109.5, p<.001) etwa ein Drittel, die Skala _Ähnlichkeiten_ (R²=.11, F(1,209)=25.55, p<.001) klärt weniger und das räumliche Vorstellungsvermögen keine Varianz auf. Die weitere Zusammenhangsanalyse zeigt, dass Kontextualisiertheit (ρ=.19, p=.006) und Transparenz (ρ=.18, p=.01) die Problemlösefähigkeit beeinflussen, die Komplexität jedoch nicht (ρ=-0.08, p=.27). Ein stark positiver Zusammenhang mit über 50% Varianzaufklärung zeigt sich zwischen dem selbstständigen Einbringen von Deep Structure Elementen in den Problemlöseprozess und der latenten Fähigkeit (ρ=.72, p<.001, R²=.56, F(1,186)=117.3, p<.001). Gemeinsam mit der Performanz im TCE klärt dieser Effekt 60% der Varianz auf (R²=.60, F(1,185)=93.69, p<.001). Diskussion Die gefundenen Zusammenhänge zeigen die Kriteriumsvalidität des Instruments und grenzen es von den Konstrukten Intelligenz und Fachwissen ab. Das Fachwissen und die Fähigkeit zu dessen zielgerichteter Anwendung sind ein wesentlicher Bestandteil des Problemlöseprozesses. Der Unterschied verschiedener Schulen in der Problemlösefähigkeit spiegelt sich nicht im zugehörigen Fachwissenstest oder den kognitiven Voraussetzungen wieder. Dieser lässt sich möglicherweise erklären durch die Rolle prozessbezogener Kompetenzen im Problemlöseprozess (Digel et al., 2016) und deren unterschiedlicher Ausprägung. Der Einfluss von Kontexten in Testsituationen in Biologie und Chemie Vanessa Pupkowski1, Mariella Roesler2, Jürgen Mayer2, Elke Sumfleth1, Maik Walpuski1, Nicole Wellnitz2 1 Universität Duisburg-Essen, 2Universität Kassel *Theoretischer Hintergrund *Während zahlreiche Studien einen positiven Effekt auf die Ausbildung von Interesse durch den Einsatz von Kontexten in Lernaufgaben zeigen (z. B. Fechner, 2009; Bennett, Hogarth & Lubben, 2003), ist der aufgabenbezogene Einfluss des Kontextes und der Einfluss der damit verbundenen Interessantheit bei der Messung von Kompetenzen weitestgehend unerforscht. Untersuchungen zum Interesse in Testsituationen zeigen, dass sich das Interesse sowie die Motivation bei der Bearbeitung von Aufgaben insgesamt positiv auf das Ergebnis auswirken (Prenzel et al., 2007; Liu et al., 2012). Es lässt sich vermuten, dass neben den Dimensionen _Komplexität_ und _kognitive Prozesse_ (Walpuski et al., 2010) Interesse und Motivation einen zusätzlichen Einfluss auf die Aufgabenschwierigkeit haben. Das Interessenskonstrukt ist in diesem Projekt nach Prenzel (1988) als Personen-Gegenstands-Beziehung definiert, unterschieden nach situationalem Interesse als motivationaler Zustand in einer bestimmten Umgebung (Krapp & Prenzel, 1992) und Relevanz als wertbezogene Valenz (Krapp, 1998). Bezogen auf das Motivationskonzept wird auf die Leistungsmotivation als spezifische Form der Motivation fokussiert, die nach Wigfield & Eccles (2002) durch das Erwartungs-Wert-Modell beschrieben wird. Die Erwartung wird ausgedrückt als die Aussicht auf Erfolg, der Wert unter anderem durch die Wichtigkeit und den Nutzen. Empirische Untersuchungen zeigen, dass unterschiedliche Kontexte von Schülerinnen und Schülern unterschiedlich interessant empfunden werden (z. B. Sjøberg, 2000; Hoffmann, Häußler & Lehrke, 1998). Auch gibt es Anhaltspunkte dafür, dass Aufgaben zur Bewertung als interessanter beurteilt werden als Aufgaben zum Fachwissen (Holstermann & Bögeholz, 2008). *Forschungsfragen* 1. Welche Bedeutung haben Kontexte in Aufgaben für die Ausprägung von Interesse und Motivation sowie für die Leistung? 2. Differieren die Zusammenhänge von kognitiven und affektiven Faktoren zwischen den Fächern Biologie und Chemie sowie zwischen den Kontexten? *Methode* Zur Beantwortung der Forschungsfragen wurden zunächst 306 Aufgaben im offen und geschlossenen Aufgabenformat entwickelt, die die Kompetenzen in den Fächern Biologie und Chemie in den Kompetenzbereichen Fachwissen und Bewertung getrennt voneinander erfassen. Die Aufgaben wurden unter Berücksichtigung vier verschiedener Kontexte (Gesundheit, Umwelt, Technik, Natürliche Ressourcen) parallel für beide Fächer und Kompetenzbereiche entwickelt. Jeder Kontext wurde in 2 weitere Subkontexte gliedert, zu denen wiederum je zwei Aufgaben entwickelt wurden. Um den Einfluss der Aufgabenschwierigkeit auf das situationale Interesse, die wahrgenommene Relevanz und die Motivation zu kontrollieren, wurden die Aufgaben auf Grundlage des ESNaS-Modells mit mittlerer Schwierigkeit konstruiert. In einer Vorstudie wurde eine Querschnittstudie im MultiMatrix-Design (N=1235, MAlter=15.36, SD=0.77; ♂=50.3 %) durchgeführt. Das Testinstrument weist zufriedenstellende Itemkennwerte auf (0.80<MNSQ<1.20, T<2.0). Für die Hauptstudie wurden 272 Items ausgewählt und im Multi-Matrix-Design eingesetzt (N=1899, MAlter=15.18, SD=0.87; ♂=51.8 %). Nach jeder Aufgabe wurden zusätzliche Items eingesetzt (embedded Design), um das situationale Interesse und die wahrgenommene Relevanz am Kontext und an der Aufgabe getrennt voneinander, sowie die Motivation (unterschieden nach Erwartung und Wert) zu erfassen. Die Items wurden auf Basis validierter Testinstrumente ausgewählt (Boekarts, 2002; Sundre, 2007). *Ergebnisse* Es wurden 263 Items in die Analyse einbezogen. Ein Vergleich der Itemschwierigkeiten zeigt, dass innerhalb der Fächer die Kontexte nicht signifikant unterschiedlich schwierig sind (FBIO(3, 135) = 2.49, p=.06, ηp2=.05; FCH(3, 120) = 0.911, p=.44, ηp2=.02) während sich das Interesse an den Kontexten jedoch innerhalb der Fächer signifikant voneinander unterscheidet (FI_BIO(3, 68) = 139.27, p<.001, ηp2=.86; FI_CH(3, 28) = 42.653, p<.001, ηp2=.82). Auch können innerhalb der Fächer signifikante Unterschiede bezüglich der Motivation zwischen den Kontexten identifiziert werden (FM_BIO(3, 135.58) = 16.62, p<.001, ηp2=.19; FM_CH(3, 220) = 5.169, p<.01, ηp2=.07). Auf Grundlage dieser Ergebnisse lässt sich vermuten, dass Kontexte keinen direkten Einfluss auf die Aufgabenschwierigkeit in Testsituationen haben, sehr wohl aber auf das Interesse und die Motivation. Auf der Tagung werden weitere Detailanalysen innerhalb der Fächer präsentiert sowie der Vergleich zwischen den Fächern berichtet. Auch Mediationsanalysen auf Basis der Interessensdaten werden durchgeführt. ID: 249 Symposium Disziplinen-Cluster: Psychologie, Didaktik Mathematik, Lehrerbildung Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Methoden der empirischen Bildungsforschung Stichworte: Wissensstrukturmodelle, Kompetenzmodellierung, latente Variablenmodelle, Strukturgleichungsmodelle, Mehrebenenmodelle Neuartige methodisch-statistische Verfahrensweisen der Kompetenzmodellierung und komplexe Prognosemodelle in der Empirischen Bildungsforschung Chair(s): Augustin Kelava (Eberhard Karls Universität Tübingen) Diskutant(en): Augustin Kelava (Eberhard Karls Universität Tübingen) Das Symposium widmet sich den Fragen, wie traditionelle methodisch-statistische Verfahrensweisen der Kompetenzmodellierung und Betrachtung von Merkmalszusammenhängen in der Empirischen Bildungsforschung verbessert werden können oder neue Verfahrensweisen angewandt werden können, die a) eine stärker inhaltsvaldititäsbezogene Definition und Betrachtung von Kompetenzen erlauben und b) neue Möglichkeiten zur differenzierteren Modellierung und Prognose von individuellen Kompetenzen oder von Merkmalszusammenhängen ermöglichen. Der erste Vortrag des Symposiums widmet sich der Lern- und Wissensraumtheorie. Die Lernraumtheorie liefert eine alternative Zugangsweise, bspw. zur üblichen Praxis durch Item-Response-Theorie, zur Modellierung, Testung und Vermittlung von Wissen oder Kompetenz. Im Vortrag werden die Grundbegriffe vorgestellt und die inhaltlich-konzeptuellen Möglichkeiten beschrieben (z.B. die Formulierung einer Wissensdomäne durch repräsentative Grundmengen von Testaufgaben oder das graduelle, Itemweise Lernen von Schülerinnen und Schülern). Abgerundet wird der Vortrag durch einen Vergleich der Lern- und Wissensraumtheorie mit angrenzenden Verfahrensklassen. Im zweiten Vortrag wird eine Anwendung von Wissensstrukturmodellen vorgestellt, welche die Modellierung der mathematischen Fachkompetenz von Studierenden der Naturwissenschaften vorsieht. Grundsätzlich stellt sich die Frage, welche Zustände (Stufen) beim Kompetenzerwerb erreicht werden können und wie sich Mathematikkompetenz bei Naturwissenschaftlern inhaltsvalide-aufgabenbezogen strukturell abbilden lässt. Unter Einbindung von FachwissenschaftlerInnen ist ein Kompetenzmodell entstanden, dessen Überprüfung anhand von Klausurdaten von 426 Studierenden aus der Vorlesung „Mathematik für Naturwissenschaftler“ erfolgte. Ergebnisse zeigen, dass sich die angenommenen diskreten Kompetenzstufen sehr gut bestätigen lassen. Der dritte Vortrag beschreibt einen neuen Ansatz (GNM-SEMM Framework; Kelava & Brandt, 2014), der verschiedene traditionelle Ansätze wie Strukturgleichungsmodelle, Item-Response-Modelle, Mischverteilungmodelle, nicht-lineare Modelle und Mehrebenenmodelle zu einem Rahmenmodell integriert. Der Mehrwert des Ansatzes liegt in der simultanen Möglichkeit zur Modellierung von funktionalen Zusammenhängen über verschiedene Datenebenen hinweg und zur Berücksichtigung unbeobachteter Heterogenität und Nicht-Normalität. Um die Nützlichkeit des Ansatzes zu beschreiben, werden Mathematikleistungsdaten aus PISA 2009 in Abhängigkeit von diversen Maßen auf Individual- und Schulebene modelliert (z.B. anhand von latenten Splines). Der vierte Vortrag widmet sich dem Problem der Multikollinearität in Prognosemodellen, die insbesondere dann entsteht, wenn viele Prädiktoren sowie deren Wechselwirkungen (Interaktionseffekte) zur Vorhersage von z.B. Kompetenzen verwendet werden. Es wird ein neues Verfahren aus dem Bereich der Strukturgleichungsmodelle vorgestellt, das die Probleme bisheriger Verfahren hinsichtlich der Power zur Aufdeckung von Interaktionseffekten substantiell verringert. Der neue Ansatz wird anhand von Leseleistungsdaten von SchülerInnen aus PISA 2009 illustriert. Hierbei wird das neue Verfahren mit traditionellen SEM-Verfahren zur Aufdeckung von Interaktionseffekten verglichen. Die vorgetragenen inhaltlichen und methodologisch-statistischen Forschungsergebnisse beruhen auf einer fruchtbaren, interdisziplinären Zusammenarbeit von ForscherInnen aus der mathematischen Fachwissenschaft und der mathematischen Fachdidaktik und MethodikerInnen der Empirischen Bildungsforschung. Beiträge des Symposiums Wissens- und Kompetenzmodellierung durch Lernraumtheorie Ali Ünlü TUM School of Education Die Lernraumtheorie interpretiert diskrete Ordnungsstrukturen im wissenspsychologischen Kontext. Diese Theorie bietet auch kompetenzbasierte Erweiterungen und hat sich als dynamisches Forschungsfeld etabliert (Doignon & Falmagne, 1999; Falmagne & Doignon, 2011; Ünlü et al., 2013). Jedoch ist das hohe und breite Anwendungspotenzial der Lernraumtheorie und ihrer Erweiterungen bei weitem noch nicht ausgeschöpft, gerade auch in Hinblick auf Anwendungen in den Fachdidaktiken (bspw. Mathematikdidaktik) oder in der Bildungsforschung. Bisher beschränken sich die Anwendungen weitgehend auf die Entwicklung von mathematisch-psychologisch fundierten, computergestützten adaptiven Lehr-/Lernsystemen. Die Grundüberlegung der Wissensraumtheorie orientiert sich an dem Vorgehen eines/r Lehrers/erin, bei dem die Erfahrungen und Kenntnisse über Voraussetzungsbeziehungen zwischen Wissenseinheiten genutzt werden, um dem/der Schüler/in z.B. unterfordernde, also zu leichte, oder überfordernde, also zu schwierige, Aufgaben zu ersparen und an der Grenze von Wissen und Nichtwissen zu operieren. Die Lernraumtheorie liefert eine alternative Zugangsweise, bspw. zur üblichen Praxis durch Item-Response-Theorie, zur Modellierung, Testung und Vermittlung von Wissen oder Kompetenz. Daher werden in diesem Überblicksvortrag die Grundideen und Hauptbegriffe der Lernraumtheorie und ihre Erweiterungen aus historischer Sicht motiviert und inhaltlich rekapituliert. Die nicht-numerische Formalisierung einer Wissensdomäne (bspw. Rechnen mit natürlichen Zahlen) durch repräsentative Grundmengen von Testaufgaben, mit den darin möglichen Wissenszuständen als die von den Schüler/innen beherrschten Aufgaben der Wissensdomäne, werden diskutiert, sowie der daraus resultierende Begriff eines Lernpfades in einer Wissensstruktur. Letzterer erlaubt die Modellierung von graduellem, d.h. Item-weisen, Lehren und Lernen. Es werden die sogenannten äußeren und inneren Ränder des Wissenszustandes eines/einer Schülers/erin behandelt, als wichtige Modellierungsgrößen, die all jene Probleme subsumieren, die ein Prüfling unmittelbar als nächstes aus seinem Wissenszustand heraus lernen kann, bzw. unmittelbar zuvor als letztes gelernt hat. Sie dienen zur diagnostischen und dynamischen Navigation des Lehr-/Lernprozesses. Ein Ausblick über probabilistische Generalisierungen dieser Ansätze durch restringierte Latent-ClassModelle runden den Vortrag ab. Modellierung mathematischer Fachkompetenz von Studierenden der Naturwissenschaften mithilfe von probabilistischen Wissensstrukturen Nora Umbach, Dirk Miller, Pascal Kilian, Frank Loose, Augustin Kelava Eberhard Karls Universität Tübignen Sowohl in der Schule als auch an der Universität wird Mathematik oft als ein besonders großes Hindernis empfunden. Mathematische Fähigkeiten zu erfassen und zu modellieren ist daher in vielen Gebieten der Bildungsforschung von zentraler Bedeutung. Didaktische Konzepte zur Förderung mathematischer Kompetenzen, benötigen ein gutes Verständnis davon, welche Zustände (Stufen) beim Kompetenzerwerb erreicht werden können und wie sich dieses Merkmal inhaltsvalide strukturell abbilden lässt. Darüber hinaus sind z.B. im Kontext MINT-Fächer in der Hochschulbildung studiengangsspezifische Inhalte zu berücksichtigen. Im Folgenden soll ein Modell speziell für die mathematische Kompetenz angehender Naturwissenschaftler vorgestellt werden. Inhalte, die in Mathematikvorlesungen für Studienanfänger von naturwissenschaftlichen Studiengänge gelehrt werden, unterscheiden sich zum Teil deutlich von den Inhalten der Vorlesungen für Studierende der Mathematik. Während z.B. in den Vorlesungen Analysis I und Lineare Algebra I die Mathematik axiomatisch aufgebaut und Sätze präzise ausgehend von den Definitionen bewiesen werden, liegt der Fokus in den Mathevorlesungen für Naturwissenschaftler eher auf der Vermittlung von Rechentechniken, die in den Naturwissenschaften relevant sind. Durch diesen Sachverhalt unterscheidet sich ein Kompetenzmodell für solch eine Vorlesung z.B. von einem Kompetenzmodell für Vorlesungen wie Analysis I oder Lineare Algebra I. Für diese Art der mathematischen Kompetenz in der Hochschulbildung gibt es bisher kaum theoretisch motivierte Kompetenzmodelle. Traditionelle Skalierungsverfahren gehen davon aus, dass es ein oder mehrere latente Kontinua der mathematischen Kompetenz gibt. Grundsätzlich ist diskutierbar, inwiefern sich mathematische Kompetenz auf einem (latenten) Kontinuum abbilden lässt. Darüber hinaus stellt sich die Frage nach einem mathematischen Kompetenzmodell, welches sich an naturwissenschaftlichen Studiengängen orientiert. Angesichts der Heterogenität der zu vermittelnden Konzepte, erscheinen latente diskrete Modelle, die Abhängigkeitsstrukturen der Inhalte abbilden können, als eine sinnvolle Alternative. Eine solche Alternative bietet die Theorie der probabilistischen Wissensstrukturen (z.B. Falmagne, Doignon, Koppen, Villano & Johannesen, 1990; Heller, Ünlü & Albert, 2013). Aufbauend auf der Theorie der probabilistischen Wissensstrukturen wurde gemeinsam mit Fachwissenschaftlern aus der Mathematik ein Modell der mathematischen Kompetenz für Studierende der Naturwissenschaften entwickelt. Dieses Modell formuliert Sets von Skills, die benötigt werden um unterschiedliche Aufgaben lösen zu können. Aus dieser Skillfunktion lässt sich direkt eine Wissensstruktur ableiten, die hierarchisch aufgebaut ist und aus theoretischen Annahmen über das Zusammenhängen von mathematischen Fähigkeiten entwickelt wurde. Dadurch lassen sich Abhängigkeiten zwischen Aufgaben klar definieren und darstellen. Durch diese Abhängigkeiten können Wissenszustände der Studierenden mit nur wenigen Aufgaben erfasst werden. Dadurch wird z.B. auch eine adaptive Diagnostik ermöglicht, die den jeweiligen individuellen Wissenszustand berücksichtigt. Das Modell wurde an die Ergebnisse der Hauptklausuren aus dem WS 2012/13 und 2013/14 für die Vorlesung "Mathematik für Naturwissenschaftler" angepasst. Diese Vorlesung wird von Studienanfängern der Studiengänge Chemie (B.Sc.), Biochemie (B.Sc.), Nanoscience (B.Sc.) und Physik (Lehramt) an der Universität Tübingen besucht. Die Klausuren bestanden aus 30 bzw. 35 Teilaufgaben und wurden von insgesamt n = 235 bzw. n = 191 Personen geschrieben. Von jeder Person steht bei jeder Teilaufgabe die erreichte Punktzahl zur Verfügung. Es wurden insgesamt 10 Teilaufgaben, die in beiden Klausuren vergleichbar sind, ausgewählt um eine Skillfunktion aufzustellen und daraus eine Wissensstruktur abzuleiten. Die Ergebnisse zeigen, dass sich die angenommenen diskreten Kompetenzstufen sehr gut durch die Daten abbilden lassen. Damit wird deutlich, dass die Theorie der probabilistischen Wissensstrukturen sehr gut geeignet ist, Wissenszustände der mathematischen Kompetenz von Studierenden der Naturwissenschaften abzubilden. Dabei wird kein zugrundeliegendes latentes Kontinuum mathematischer Kompetenz angenommen, sondern es werden latente Stufen mathematischer Kompetenz identifiziert. Der hierarchische Aufbau dieser latenten Wissensklassen erlaubt eine präzise und einfache Diagnostik der mathematischen Kompetenz, ebenso wie Ansätze zu gezielten Interventionen, die auf einer belastbaren Individualdiagnostik aufbauen. Mögliche didaktische Konzepte und Diagnoseverfahren werden diskutiert. A general non-linear multilevel structural equation mixture model Augustin Kelava, Holger Brandt, Nora Umbach Eberhard Karls Universität Tübignen Zu den am häufigsten angewandten Analyseverfahren der Empirischen Bildungsforschung zählen zwischenzeitig latente Variablenmodelle (Strukturgleichungsmodelle, Item-Response-Modelle) und Mehrebenenmodelle. Darüber hinaus haben sich in den vergangen Jahren sowohl Mischverteilungsmodelle als auch nicht-lineare latente Modelle zunehmend etabliert (für Einführungen in diese Verfahren s. Bauer, 2005; Schumacker & Marcoulides, 1998). Die Kombination von Teilmengen obiger Verfahrensklassen wurde in jüngerer Vergangenheit angestrebt (e.g., Muthén & Asparouhov, 2009; Rabe-Hesketh, Skrondal, & Pickels, 2004), um möglichst flexible Möglichkeiten zur Modellierung von komplexen quer- und längsschnittlichen Datensätzen mit Abhängigkeitsstrukturen zu ermöglichen. Eine vollständige Integration unter Berücksichtigung von a) nicht-normalen Verteilungen, b) der Nicht-Linearität/Differenziertheit von funktionalen Zusammenhängen der beteiligten Variablen und c) unbeobachteter Heterogenität auf allen Datenebenen ist zuvor nicht erfolgt. Im Vortrag wird daher ein jüngst publizierter allgemeiner Ansatz (GNM-SEMM; „A general non-linear multilevel structural equation mixture model“; Kelava & Brandt, 2014) vorgestellt. Der GNM-SEMM Ansatz integriert parametrische und semiparametrische nicht-lineare latente Variablenmodelle (z.B. Kelava, Nagengast, & Brandt, 2014) sowie (latente) Mehrebenenmodelle unter Berücksichtigung möglicher nicht-normaler Verteilungen der Daten. Er kennzeichnet sich durch eine flexible Modellierung der Zusammenhänge auf allen Datenebenen aus (z.B. auf Schulebene oder Schülerebene), indem latente Spline-Modelle für die Mess- und Strukturmodelle ermöglicht werden. Eine Veranschaulichung der Möglichkeiten im GNM-SEMM Ansatz und seiner Anwendbarkeit erfolgt anhand von PISA-2009Daten (Organisation for Economic Co-Operation and Development, 2010). Dazu wird eine deutsche Stichprobe von N=1474 Schülerinnen und Schülern aus 226 Schulen zur Modellierung der Mathematikleistung herangezogen. Zusätzliche Kovariaten auf der Individual- und Schulebene liegen vor. Es wird u.a. der Zusammenhang der Mathematikleistung und der Einstellung zum Lesen untersucht (Ebene 1). Darüber hinaus wird die durchschnittliche Leistung der Schule und ihr Zusammenhang zu strukturellen Problemen in der Schule sowie Umfeldvariablen der Schule beschrieben (Ebene 2). Es zeigt sich, dass auf den unterschiedlichen Datenebenen verschiedene Modelltypen (Splines auf Ebene 1; Interaktion auf Ebene 2) die Zusammenhänge differentiell abbilden und Heterogenität der Merkmale (latenten Mischungen, auf Ebene 2) eine differenziertere Analyse der Daten ermöglicht und somit neue Möglichkeiten auch zur Dateninterpretation eröffnet. Das empirische Beispiel soll nicht erschöpfend die Parametrisierungsmöglichkeiten behandeln, sondern vielmehr veranschaulichen, dass der neue GNM-SEMM Ansatz als ein statistischer Werkzeugkasten (Framework) im Dienste differenzierter theoretischer Überlegungen in der empirischen Bildungsforschung und angrenzenden Disziplinen stehen kann. Vor diesem Hintergrund werden Implikationen für die Empirische Forschung und die Verfahrensentwicklung diskutiert. Nicht zuletzt trägt auch die Flexibilität des Ansatzes zur Generierung neuer inhaltlicher Fragestellungen in komplexen Inhaltsgebieten bei. Analyzing interaction effects and the problem of multicollinearity: A lasso estimator as an alternative to traditional approaches Holger Brandt1, Nora Umbach1, Kevin Fischer2, Jenna Cambria3, Augustin Kelava1 1 Eberhard Karls Universität Tübignen, 2Goethe Universität Frankfurt, 3University of Arkansas Substantive researchers often predict achievement in school is often conducted by including a variety of sources of information that may influence the achievement, for example, values, beliefs, and goals (Wigfield & Cambria, 2010). Typically many assume that in addition to the additive effects of these sources, interaction effects can also increase the predictive power of the model (Nagengast, Marsh, Scalas, Xu, Hau, & Trautwein, 2011). By increasing number of predictor variables, these models become increasingly complex and the power to detect effects decreases. As a consequence, researchers tend to analyze simpler models, for example, they analyze separate models for subsets of predictors and include only single or a small number of interaction effects. As we will show in this talk, this procedure is associated with a highly inflated Type I error rate and cannot be improved by corrections for multiple testing (e.g., Bonferroni). Since theories focused on predicting school achievement include a variety of sources that cannot be neglected, new latent variable methods are needed that can account for such model complexity. In this talk, we present a new lasso estimator for structural equation models that is more efficient in revealing latent interaction effects in situations with many latent predictors as well as in situations with increased multicollinearity. The lasso is a shrinkage method for regression models that imposes a penalty on the regression coefficients which shrinks small effects to zero and thus reduces problems associated with multicollinearity. The advantage of this estimator is that it can be used directly for variable selection without comparing models or stepwise procedures, which are known to have inflated Type I error rates. Results of our simulation study show that the estimator has a higher power than standard procedures for testing parametric structural equation models with interaction effects (e.g., product indicator approaches or LMS in Mplus). The advantage of the lasso estimator in comparison to other estimators increases substantially in situations with high multicollinearity, which is a common problem in education sciences. We illustrate the new model with a data set from the Program for International Student Assessment 2009 (Organisation for Economic Co-Operation and Development, 2010) with Austrian students who took part in a reading test (N=1092). We predict the pupils reading skill by a large set of predictors and apply the new model to the data. We show the pitfalls of analyzing subsets of the relevant predictors and the resulting artificial effects. Finally, we discuss possible guidelines for the appropriate application of the lasso estimator and its limitations. ID: 251 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Sonderpädagogik Thematisches Cluster: Bildung im Sekundarbereich, Grundschulbildung, Inklusion Stichworte: Sonderpädagogischer Förderbedarf, Large-Scale-Assessments, Gütekriterien, Bildungsdisparitäten Inklusion von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf in bundesweiten Schulleistungserhebungen Chair(s): Cornelia Gresch (Institut zur Qualitätsentwicklung im Bildungswesen), Poldi Kuhl (Institut zur Qualitätsentwicklung im Bildungswesen (IQB)), Katharina Müller (Technische Universität München (TUM)) Diskutant(en): Michael Grosche (Bergische Universität Wuppertal) Im Zuge der im Jahr 2008 in Kraft getretenen UN-Behindertenrechtskonvention zeichnet sich in Deutschland zum einen eine Zunahme inklusiver Beschulung von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf (SPF) an Regelschulen ab, zum anderen ist das Thema Inklusion auch in den Blickpunkt der empirischen Bildungsforschung gerückt. So beziehen nationale und internationale Schulleistungsvergleichsstudien wie z.B. PISA, TIMSS, das NEPS oder die IQB-Ländervergleiche Schülerinnen und Schüler mit SPF in die Erhebungen ein, stehen dabei jedoch vor besonderen Herausforderungen: Zum einen unterscheiden sich die Rahmenbedingungen und Prozesse inklusiver Beschulung zwischen den Bundesländern, wodurch bereits die länderübergreifend einheitliche Identifikation der Schülergruppe eine Schwierigkeit darstellt (vgl. Gresch & Piezunka, 2015). Zum anderen werden Schülerinnen und Schüler mit und ohne SPF oftmals gemeinsam und anhand standardisierter Verfahren untersucht. Dabei sind vielfältige methodische Fragen bezüglich der Güte der Messung, der Vergleichbarkeit der Schülergruppen oder des Einsatzes von Akkommodation noch weitgehend ungeklärt (vgl. Heydrich et al. 2014). Um sich diesen Herausforderungen der Einbeziehung von Schülerinnen und Schülern mit SPF in Large-Scale-Assessments (LSAs) gemeinschaftlich zu stellen, hat sich 2012 eine Gruppe von Kolleginnen und Kollegen, die im Kontext nationaler bzw. internationaler Schulleistungsvergleichsuntersuchungen mit dieser Schülerschaft befasst ist, zum Netzwerk NELSEN (Network of Large-Scale-Studies including Students with Special Educational Needs) zusammengeschlossen. In dem Symposium werden vier aktuelle Arbeiten aus dem NELSEN-Netzwerk vorgestellt und diskutiert: Das Symposium beginnt in einem ersten Beitrag mit einer methodischen Auseinandersetzung auf der Grundlage von Daten des IQB-Ländervergleichs in der Sekundarstufe I zu der Frage, inwieweit die mathematische Kompetenz bei Kindern mit SPF valide erfasst wird. In dem anschließenden zweiten Beitrag wird anhand von Daten einer PISA-Zusatzstudie gezeigt, welche schulischen Kompetenzen die an Förderschulen unterrichteten Schülerinnen und Schülern mit SPF am Ende der Pflichtschulzeit in den PISA-Tests erzielen und diskutiert welche Limitationen sich bei der Interpretation der Befunde aufgrund der psychometrischen Eigenschaften des Tests ergeben. Mit den Folgen des Beschulungsortes setzt sich der dritte Beitrag auseinander, der auf Datenbasis des NEPS prüft, inwiefern das akademische Selbstkonzept der Kinder mit SPF vom mittleren Kompetenzniveau einer Klasse geprägt ist (Big-Fish-Little-Pond-Effekt) und ob hier Unterschiede zwischen segregierten und inklusiven Schulsettings vorliegen. Im vierten Beitrag liegt der Fokus auf zuwanderungsbedingten Disparitäten. Der Beitrag geht auf der Datengrundlage des IQB-Ländervergleichs in der Grundschule der Frage nach, inwiefern über die schulischen Leistungen und den sozialen Hintergrund hinaus der Zuwanderungshintergrund mit der Zuweisung eines SPF im Bereich Lernen zusammenhängt. Die Beiträge werden anschließend von Michael Grosche aus Perspektive der Sonderpädagogik diskutiert. Beiträge des Symposiums Aspekte der Testgüte bei der Erfassung mathematischer Kompetenzen bei Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf in der Sekundarstufe I Nicole Haag, Aleksander Kocaj Institut zur Qualitätsentwicklung im Bildungswesen (IQB) Large-Scale-Assessments (LSA) im Bildungsbereich sind vor die Herausforderung gestellt, schulische Kompetenzen in heterogenen Schülergruppen vergleichbar und valide zu erfassen. Insbesondere die Gruppe der Schülerinnen und Schüler mit sonderpädagogischem Förderbedarf (SPF) wird hierbei in den letzten Jahren verstärkt in den Fokus genommen. Die zur Kompetenzmessung verwendeten Aufgaben wurden jedoch ursprünglich für Schülerinnen und Schüler ohne SPF entwickelt, sodass die Testgüte für Schülerinnen und Schüler mit SPF untersucht werden muss. Der Beitrag prüft ausgewählte Aspekte der Testgüte der Mathematikaufgaben des in der 9. Klassenstufe durchgeführten IQBLändervergleichs 2012 (Pant, Stanat, Schroeders, Roppelt, Siegle & Pöhlmann, 2013). Der Beitrag knüpft inhaltlich und methodisch an vorangegangene Untersuchungen zur Testgüte für Schülerinnen und Schüler mit SPF in LSAs wie NEPS (Südkamp, Pohl, Hardt, Jordan & Duchhard, 2015) und dem IQB-Ländervergleich der Primarstufe 2011 (Kocaj, Haag, Weirich, Kuhl, Pant & Stanat, eingereicht) an und prüft, ob sich die Testbearbeitung von Schülerinnen und Schülern mit SPF bedeutsam von Schülerinnen und Schülern ohne SPF unterscheidet. Hierbei wird ein Fokus auf Schülerinnen und Schüler in Förderschulen gelegt, deren Testbearbeitung mit zwei nach angestrebtem Abschluss differenzierten Teilgruppen von Schülerinnen und Schülern an nicht-gymnasialen Schulformen verglichen wird. Es wurden drei Gruppen von Schülerinnen und Schülern betrachtet: (1) Schülerinnen und Schüler an Förderschulen mit den Förderschwerpunkten _Lernen_, _Sprache_, oder _emotionale und soziale Entwicklung_ (_N_ = 482), (2) Schülerinnen und Schüler an nicht-gymnasialen Schulformen, die einen Hauptschulabschluss (HSA) anstreben (_N_ = 3955) und (3) Schülerinnen und Schüler an nicht-gymnasialen Schulformen, die einen Mittleren Schulabschluss (MSA) anstreben (_N_ = 11781). Die Testdauer betrug für jede der drei Gruppen 120 Minuten. Die an Förderschulen eingesetzten Testhefte enthielten jedoch um ein Drittel weniger Items, sodass Schülerinnen und Schüler an Förderschulen pro Item eine längere Bearbeitungszeit zur Verfügung gestellt bekamen. Es zeigte sich erwartungsgemäß, dass die Items von Förderschülerinnen und -schülern deutlich seltener gelöst wurden als von Schülerinnen und Schülern ohne SPF. Die Analysen der fehlenden Werte zeigten, dass Schülerinnen und Schüler an Förderschulen insgesamt ca. 17% der ihnen vorgelegten Items nicht beantworten. Für Schülerinnen und Schüler, die einen HSA anstreben, lag dieser Wert mit 24% sogar noch etwas höher. Schülerinnen und Schüler, die einen MSA anstreben, bearbeiten hingegen lediglich 15% der Items nicht. Auslassungen einzelner Items bildeten in allen drei Gruppen den größten Anteil fehlender Werte, wohingegen der Anteil fehlender Werte am Ende des Testhefts ebenfalls übereinstimmend eher gering ausgeprägt war. Ferner wurde festgestellt, dass für Schülerinnen und Schüler an Förderschulen im Vergleich zu Schülerinnen und Schülern, die einen HSA anstreben, ca. 35% der Items moderates und 6% der Items substanzielles differenzielles Itemfunktionieren (DIF) aufwiesen. Zwischen Schülerinnen und Schülern, die einen HSA anstreben und Schülerinnen und Schülern, die einen MSA anstreben, bestand ein vergleichbar hoher Anteil an moderatem DIF (32%), wohingegen der Anteil an Items mit substanziellem DIF sogar etwas höher lag (10%). Die Befunde deuten darauf hin, dass der verwendete Test mit Einschränkungen dazu geeignet ist, die Leistungen von Schülerinnen und Schülern an Förderschulen vergleichbar zu Schülerinnen und Schülern an nicht-gymnasialen Schulformen zu erfassen. In weiterführenden Analysen soll geprüft werden, ob sich die Unterschiede in der Itembearbeitung zwischen den betrachteten Gruppen durch Eigenschaften der Items oder durch soziodemografische und motivationale Merkmale der Personen erklären lassen. Wie schneiden Schülerinnen und Schüler an Förderschulen bei PISA ab - Ergebnisse aus der PISA 2012Zusatzerhebung zu Jugendlichen mit sonderpädagogischem Förderbedarf Katharina Müller, Manfred Prenzel, Christine Sälzer, Julia Mang, Markus Gebhardt Technische Universität München (TUM) Der in Deutschland zunehmend virulent geführten Debatte zum Beschulungsort Förderschule steht ein auffallender Mangel an empirischen Befunden zum Wissen und Können der dort unterrichteten Schülerinnen und Schüler gegenüber. Die bislang vorliegenden Untersuchungen in der Sekundarstufe sind meist regional oder auf Landesebene begrenzt und vergleichen Schülerinnen und Schüler aus Förderschulen mit SPF mit einer jüngeren Schülergruppe ohne SPF. Ein bundesländerübergreifendes Bildungsmonitoring mit vergleichenden Analysen zwischen den an Förderschulen der Sekundarstufe unterrichten Schülerinnen und Schülern mit SPF und Gleichaltrigen ohne SPF befindet sich bislang - nicht zuletzt aufgrund der mit einer reliablen und validen Testung dieser Schülergruppe verbundenen Herausforderungen (etwa Heydrich, Weinert, Nusser, Artelt, & Carstensen, 2013; Pohl & Carstensen, 2013; Südkamp, Pohl & Weinert, 2015) - noch in den Anfängen. In PISA gehen Schülerinnen und Schüler mit SPF als Teilstichprobe in alle Analysen der Gesamtstichprobe ein, um die Zielpopulation repräsentativ abzubilden. Allerdings war die Größe der Teilstichprobe bislang zu klein, um auf die Grundgesamtheit der Fünfzehnjährigen schließen zu können, die an Förderschulen unterrichtet wird. Ziel der vorliegenden Studie war es daher, die Teilstichprobe Fünfzehnjähriger, die an Förderschulen in Deutschland unterrichtet wird und die PISA-Teilnahmekriterien (OECD, 2014) erfüllt, für eine PISA-Testung so zu erweitern, dass für diese Gruppe ebenfalls Aussagen zum Kompetenzniveau getroffen werden kann. Dabei sollten die in der Zusatzerhebung getesteten Schülerinnen und Schüler an Förderschulen mit den an regulären Sekundarschulen unterrichteten aus der PISA-Haupterhebung verglichen werden. Im Vordergrund der hier vorgestellten Analysen stehen folgende Forschungsfragen: - Wie hoch ist das durchschnittliche Kompetenzniveau in den PISA-Tests für Mathematik, Lesen und Naturwissenschaften bei den an Förderschulen unterrichteten Fünfzehnjährigen mit SPF in Deutschland? - Wie groß sind die Unterschiede im PISA-Kompetenzniveau zwischen den an Förderschulen unterrichteten Fünfzehnjährigen mit SPF und den an den übrigen allgemeinbildenden Sekundarschularten unterrichteten (ohne SPF)? Beleuchtet werden dabei auch die zur Beantwortung der Fragen relevanten Merkmale der Testgüte. Die Stichprobe bestand aus _N_ = 61 Förderschulen und darin unterrichteten _N_ = 691 Fünfzehnjährigen (40.6% weiblich). Das Vorgehen bei der Skalierung in der Zusatzerhebung entsprach dem der PISA 2012-Hauptstudie mit den in PISA üblichen Schätzprozeduren auf Basis der Item Response Theory (Adams & Wu, 2007; Adams, Wilson & Wang, 1997). Unter Anwendung desselben Hintergrundmodells wie in der PISA 2012-Hauptstudie (OECD, 2014) und der dort berechneten Itemparameter wurden in der Zusatzstichprobe Plausible Values zur Bestimmung der Populationsparameter für die Kompetenzbereiche ermittelt. Zur Beurteilung der psychometrischen Eigenschaften wurden EAP/PV-Reliabilitäten berechnet, der Umfang fehlender Werte analysiert, Item- und Personenfitstatistiken herangezogen und Unterschiede in den Itemschwierigkeiten zwischen Haupt- und Förderschule mittels Differential Item Functioning (_DIF_) geprüft. Neben einer deskriptiven Darstellung der Befunde wurden Unterschiede zwischen den Schularten getestet (zweiseitige _t_-Tests für unabhängige Stichproben) und Effektstärken (Cohens _d_) berichtet. Bei den Fünfzehnjährigen an Förderschulen zeigte sich im Vergleich zu den an den übrigen allgemeinbildenden Schularten unterrichteten Jugendlichen ohne SPF erwartungsgemäß ein deutlich niedrigeres Kompetenzniveau (Mathematik _M_ = 340; Nawi _M_ = 341; Lesen _M_ = 332). Der größte Anteil der Jugendlichen in der Zusatzerhebung liegt bei den in PISA verwendeten Kompetenzstufen auf oder unter Stufe I. Damit ist in der Gruppe der an Förderschulen unterrichteten Fünfzehnjährigen mit einem erheblichen Anteil zu rechnen, der in allen drei Domänen nicht über grundlegende Kompetenzen verfügt. Bei der Skalierung und Prüfung des dreidimensionalen Modells zeigte sich, dass die Aufgaben für die Schülerinnen und Schüler mit SPF vergleichsweise schwer sind und diese Gruppe in den Personen-Fit-Statistiken einen leichten Overfit (_Outfit MNSQ_ = .746) aufwies. Ferner wurde deutlich, dass bei rund 10% der zum Einsatz kommenden Items substantielle Unterschiede in den Itemschwierigkeiten vorliegen, die z.T. mit geringer Itemdiskrimination (_wMNSQ_ ≥ 1.20) einhergehen. Die Befunde werden vorbehaltlich dieser Limitationen dargestellt und kritisch diskutiert. There's plenty more fish in the sea. Das akademische Selbstkonzept von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf. Lernen in integrativen und segregierten Schulsettings Ilka Wolter1, Lena Nusser2, Cordula Artelt2, Sabine Weinert2 1 Leibniz Institut für Bildungsverläufe, 2Universität Bamberg In empirischen Arbeiten zur Leistungsentwicklung und den Selbstkonzepten von Kindern mit sonderpädagogischem Förderbedarf (SPF) sind vergleichende Forschungsarbeiten über Lernende in Förderschulen und integrativen Settings in Regelschulen von steigendem Interesse. Kinder in Regelschulen weisen im Mittel bessere Leistungen in standardisierten Test auf als Kinder mit einem sonderpädagogischen Förderbedarf Lernen (SPF-L) in Förderschulen (Kocaj, Kuhl, Kroth, Pant & Stanat, 2014). Allerdings unterscheiden sich die Selbstkonzepte von Kindern mit SPF-L in Förderschulen von denen in Integrationsklassen teilweise deutlich und in umgekehrter Richtung. Als ein Mechanismus dieses Effekts werden die unterschiedlichen Vergleichskontexte in segregierten und inklusiven Klassen diskutiert (vgl. Möller, 2013). Der vielfach nachgewiesene Big-Fish-Little-Pond-Effekt (BFLPE; z. B. Marsh, 2005) beschreibt, dass das akademische Selbstkonzept von Lernenden nicht nur durch die eigene Leistungen geformt, sondern auch negativ von den Leistungen der Klassengemeinschaft beeinflusst wird. In dieser Studie gehen wir der Frage nach, ob der BFLPE in der Domäne Mathematik für Lernende mit sonderpädagogischem Förderbedarf Lernen in segregierten und inklusiven Settings gleichermaßen aufzuzeigen ist. Wir nehmen hierbei zunächst an, dass die Mechanismen des sozialen Vergleiches auch in segregierten Schulsettings ihre Wirkung entfalten und sich ein negativer Effekt des mittleren Leistungsniveaus der Klasse auf das individuelle akademische Selbstkonzept nachweisen lässt. Da es sich allerdings bei integrativen Klassen für die Kinder mit einem sonderpädagogischen Förderbedarf Lernen um einen vergleichsweise leistungsstärkeren Kontext handeln sollte, wird weiterhin angenommen, dass der negative Effekt auf das akademische Selbstkonzept für Integrationskinder in Regelschulen stärker ausfällt als für Lernende an Förderschulen. In einer Stichprobe von Schülerinnen und Schülern der 5. Klasse in Förderschulen Lernen (_n_ = 587 in 91 Klassen) sowie in Integrationsklassen in Regelschulen (_n_ = 148 in 103 Klassen), die im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld, Roßbach & von Maurice, 2011) untersucht wurden, wurden das akademische Selbstkonzept im Fach Mathematik sowie die Noten im letzten Zeugnis für das Fach Mathematik erhoben. Zur Überprüfung differenzieller Effekte unserer Ergebnisse wurde dieser Effekt auch in der Stichprobe von Kindern ohne SPF-L in den 103 Integrationsklassen (_n_ = 1250) überprüft. In Mehrebenenanalysen zeigte sich, dass entgegen unserer Erwartungen in Förderschulklassen das mittlere Leistungsniveau der Klasse (d. h. Notendurchschnitt der Klasse) unter Berücksichtigung der individuellen Leistung keinen Einfluss auf das akademische Selbstkonzept hatte, während in Integrationsklassen ein deutlicher Kontexteffekt in erwarteter Richtung zu finden war. Es zeigte sich, dass der BFLPE in Integrationsklassen für die Kinder mit SPF-L sehr hoch ausfiel (BFLPE = 1.207, _p_<.001), tendenziell auch höher als für die Kinder ohne SPF-L (BFLPE = 0.803, _p_<.001) in diesen Klassen. Der ausbleibende BFLPE in Förderschulklassen lässt vermuten, dass der Mechanismus sozialer Vergleiche bezogen auf die erreichten Noten in Mathematik keine bedeutsame Rolle bei der Ausprägung des akademischen Selbstkonzeptes von Kindern mit SPF-L in Förderschulen spielt. Eher deuten unsere Ergebnisse darauf hin, dass individuelle Leistungen herangezogen werden, um das Selbstkonzept zu etablieren (vgl. Valentine, DuBois & Cooper, 2004). Im Vergleich dazu spielt für Schülerinnen und Schüler mit SPF-L, die eine Integrationsklasse an einer Regelschule besuchen, der Kontext eine weitaus größere Rolle. Die stärkere Klassengemeinschaft dieser Schülergruppe führt zu einem geringer ausgeprägten akademischen Selbstkonzept für das Fach Mathematik (siehe hierzu Bos, Müller & Stubbe, 2010). Es werden pädagogische Implikationen der Berücksichtigung solcher Referenzgruppeneffekte und damit einhergehende Einflüsse auf das Interesse und den Wissenszuwachs von Lernenden diskutiert, vor allem vor dem Hintergrund der aktuellen Debatte um die integrative Beschulung von Kindern mit sonderpädagogischem Förderbedarf. Zuwanderungsbedingte Disparitäten bei Grundschüler/innen mit sonderpädagogischem Förderbedarf im Schwerpunkt Lernen – Die Rolle des sozioökonomischen Hintergrunds sowie kognitiver und schulischer Kompetenzen Jenny Kölm, Cornelia Gresch, Poldi Kuhl Institut zur Qualitätsentwicklung im Bildungswesen (IQB) Kinder mit einer ausländischen Staatsbürgerschaft sind an Förderschulen häufig überrepräsentiert und werden auch an Regelschulen häufiger sonderpädagogisch gefördert als Kinder mit deutscher Staatsbürgerschaft (KMK, 2014). Dies betrifft insbesondere den Förderschwerpunkt Lernen (ebd.). Die Interpretation der amtlichen Statistik auf Bundesebene birgt jedoch Schwierigkeiten: Zum einen liegen diesbezüglich nicht für alle Länder belastbare Informationen vor, zum anderen werden in den einzelnen Ländern verschiedene Kriterien zur Erfassung von sonderpädagogischer Förderung herangezogen (vgl. Malecki, 2013). Darüber hinaus wird über die Staatsbürgerschaft als Kriterium nur ein Teil der Kinder erfasst, die einen Zuwanderungshintergrund aufweisen (vgl. Gresch & Kristen, 2011). Nicht zuletzt erlaubt die amtliche Statistik keine vertiefenden Analysen zu möglichen Ursachen des Befundmusters, dass Kinder mit ausländischer Staatsbürgerschaft häufiger einen sonderpädagogischen Förderbedarf (SPF) aufweisen als Kinder mit deutscher Staatsbürgerschaft. Eine mögliche Erklärung für die Überrepräsentation könnte in einer systematischen Benachteiligung von Schüler/innen mit Zuwanderungshintergrund bei der Feststellung eines SPF liegen (z. B. Gomolla & Radtke, 2009). Obwohl gerade im Förderschwerpunkt Lernen vor allem die schulischen Kompetenzen dafür ausschlaggebend sein sollten, ob ein Kind die Diagnose eines SPF erhält, ist nicht auszuschließen, dass über die Leistung hinaus weitere Kontextfaktoren wirksam werden. Bislang ebenfalls ungeklärt ist, inwiefern mögliche Benachteiligungen von Kindern mit Zuwanderungshintergrund auf den in dieser Gruppe häufig niedrigeren sozioökonomischen Status zurückgeführt werden können oder ob zuwanderungsspezifische Ursachen zugrunde liegen. Die vorliegende Untersuchung geht diese offenen Fragen auf der Datengrundlage des IQB-Ländervergleichs 2011 in der Primarstufe am Ende der vierten Klasse (_N_ = 27.081) an. In die Analysen einbezogen werden Kinder mit einem Förderschwerpunkt Lernen an Regel- und an Förderschulen (_N_ = 726). Zunächst wird gezeigt, dass sich der Befund der Überrepräsentation von Kindern mit ausländischer Staatsbürgerschaft unter den Kindern im Förderschwerpunkt Lernen replizieren lässt. Bei abweichender Operationalisierung des Zuwanderungshintergrunds, beispielsweise über die Herkunft der Eltern, ergeben sich jedoch veränderte Befundmuster. Weiterhin wird untersucht, inwiefern über die schulischen Leistungen und kognitiven Grundfähigkeiten hinaus ein Zusammenhang des Zuwanderungshintergrunds mit der Zuweisung eines SPF Lernen besteht. Anhand schrittweiser logistischer Regressionsmodelle wird geprüft, ob Kinder mit Zuwanderungshintergrund bei vergleichbaren kognitiven und schulischen Kompetenzen und unter Kontrolle des sozioökonomischen Status häufiger einen diagnostizierten SPF im Schwerpunkt Lernen aufweisen als Kinder ohne Zuwanderungshintergrund. Erste Analysen deuten darauf hin, dass der Zuwanderungshintergrund für sich genommen nicht mit der Zuweisung eines SPF im Lernen zusammenhängt. Nach Kontrolle der kognitiven und schulischen Kompetenzen des Kindes sowie des sozioökonomischem Hintergrundes der Familie weisen jedoch Kinder mit einem Zuwanderungshintergrund seltener einen diagnostizierten SPF Lernen auf als Kinder ohne Zuwanderungshintergrund. Die Ergebnisse werden abschließend vor dem Hintergrund ethnischer Ungleichheiten und der Chancengerechtigkeit im deutschen Bildungssystem diskutiert. ID: 260 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung Thematisches Cluster: Bildung im Sekundarbereich, Kompetenzdiagnostik/ Kompetenzentwicklung, Trainings- und Evaluationsforschung Stichworte: Reformen, G8, Oberstufe, Implementation, Evaluation Reformen im Bildungswesen: Aktuelle Befunde und Perspektiven Chair(s): Nicolas Hübner (Universität Tübingen), Ulrich Trautwein (Universität Tübingen) Diskutant(en): Marko Neumann (Deutsches Institut für Internationale Pädagogische Forschung) Die Implementation von Bildungsreformen ist ein zentrales Instrument bildungspolitischen Handelns, und kaum ein Jahr vergeht ohne neue Reformbestrebungen. Trotz der großen Bedeutung bildungspolitischer Reformen ist bisher nur wenig zu konkreten Wirkungsweisen im Bildungssystem bekannt. Dies lässt sich auch auf die hohen Anforderungen an Studiendesigns und statistische Methoden zurückführen, derer es bedarf, um Reformeffekte hinreichend klar zu isolieren und zu quantifizieren. Das vorliegende Symposium bietet einen Überblick zu aktuellen Ergebnissen zentraler Reformstudien des letzten Jahrzehnts, namentlich der G8-Reform und der großen Oberstufenreform. Dabei findet neben den strukturellen Änderungen auch die Relevanz weiterer Variablengruppen bzw. Akteure (z.B. die Lehrerschaft) einige Beachtung. Hierzu werden im ersten Beitrag die Wirksamkeit der G8-Reform im Hinblick auf das Alter beim Erwerb des Abschlusses sowie Klassenwiederholungs- und Abschlussquoten untersucht. Hierbei zeigt sich, dass die Schulzeitverkürzung im Mittel zu einer Reduktion des Abschlussalters von rund 10 Monaten führt. Eine mögliche Erklärung hierfür sind Anstiege in den Wiederholungsquoten um 21% (Beitrag 1). Im zweiten Beitrag werden die jüngsten Befunde zur G8-Reform in BadenWürttemberg dargestellt. Hier finden sich Leistungsunterschiede in den Bereichen Englisch-Lesen und Biologie, während Schülerinnen und Schüler aus G8- und G9-Jahrgängen in den Bereichen Mathematik und Physik gleich gut abschneiden. In den untersuchten Bereichen zum Wohlbefinden zeigen sich Unterschiede zuungunsten der G8-Schülerinnen und Schüler (Beitrag 2). Anschließend rückt ein dritter Beitrag die Akteursgruppe der Lehrer näher in den Fokus. Konkret wird untersucht, wie Lehrkräfte und Schulleitungen von Gymnasien die Einführung des achtjährigen Bildungsgangs in NRW erlebt haben und welche Herausforderungen und Handlungsstrategien eingesetzt worden sind. Hierbei zeigt sich, dass insbesondere die Verkürzung der Sekundarstufe I unter Beibehaltung einer dreijährigen Oberstufe als zentrale Herausforderung wahrgenommen worden ist (Beitrag 3). Abschließend werden Befunde zur Oberstufenreform in Thüringen vorgestellt. Dieser Beitrag zeigt zunächst, dass sich insgesamt wenige Leistungsunterschiede vor und nach der Reform finden lassen. Gleichzeitigt legt er nahe, dass sich Unterschiede in der Leistung der Schülerinnen und Schüler durch Schulunterschiede erklären lassen (Beitrag 4). Beiträge des Symposiums The impact of compressing instructional time on graduation age, grade repetitions and graduation rates Mathias Hübener1, Jan Marcus2 1 DIW Berlin, 2DIW Berlin; Universität Hamburg *Background* Policy-makers face a trade-off choosing the optimal length of schooling. While more years of education entail monetary and nonmonetary advantages for individuals and for society (Card, 1999; Grossman, 2006; Lochner, 2011), they also delay labour force participation (Brugiavini & Peracchi, 2005). This trade-off is particularly crucial given ageing populations in industrialised countries. Earlier labour market entries could mitigate consequences of demographic ageing (Börsch-Supan et al., 2014). Several industrialised countries try to achieve this by lowering the school starting age. Similarly, the current Europe-wide harmonisation of university systems (Bologna process) aims at reducing the time spent in formal education (Bologna Declaration, 1999). Between 2001 and 2007, 13 out of 16 German federal states passed laws for a novel policy approach that reduces the length of the Gymnasium track by one year, while redistributing the same instructional time over the remaining fewer school years. *Literature & Research Hypotheses* This so-called G8-reform is a controversial and highly debated policy in Germany. The first G8 evaluations are based on a survey of the double graduation cohort in one specific state (Meyer & Thomsen, 2012; Thiel et al., 2014; Büttner & Thomsen, 2015). Only few evaluation studies use the regional and temporal variations in the reform implementation for the identification of treatment effects (for a review of the existing evidence, see Huebener & Marcus, 2015). We examine indicators of the overall effectiveness of the G8-reform by looking at the impact of the reform on the high school graduation age, grade repetitions and graduation rates. Increased learning intensity imposes higher requirements on students to follow class material. Some students may need to repeat a school year, or may consequently even be unable to cope with the new conditions and drop out from Gymnasium. The overall reform benefits would be lowered. Our analysis also aim at constituting an important grounding for other G8-studies that focus on comparisons of specific cohorts, as increased grade repetition rates may lead to compositional changes between cohorts and may severely bias reform effect estimates. *Data and Research Design* We employ administrative data from the Federal Statistical Office, covering all students from the graduation cohorts 2002-2013 in Germany. We exploit the regional and temporal variations in the reform implementation with a difference-in-differences approach (Borjas, 2007). We carefully examine the crucial common trend assumption through graphical inspections of pretreatment trends and several placebo regressions. We also conduct extensive sensitivity tests, including different sample restrictions, econometric model specifications and standard error adjustments. *Results* We find that the G8-reform reduces the mean graduation age by about 10 months, suggesting that the reform falls short of its potential of one full year. One possible explanation are increased grade repetitions, which go up by 21 percent (3 percentage points). However, there is no evidence of adverse effect of the reform on the share of students attending the Gymnasium track and on the share of students graduating from high school with university entrance qualifications. Our results show that grade repetitions increase more for boys and occur mainly in the final years at high school. Summing up, compressing instructional time into fewer years of schooling can decrease the school leaving age without adverse effects on the high school graduation share. Most students graduate more quickly, though some cope with the increased learning intensity by repeating a grade. Our results are important for countries in which ageing populations trigger the trade-off between high education levels and early labour market entries. They are also important for the interpretation of G8-studies that compare specific cohorts, especially when reform effects on grade repetitions are neglected. Die G8-Reform in Baden-Württemberg: Unterschiede in der Leistung und dem Wohlbefinden vor und nach der Reform Wolfgang Wagner, Nicolas Hübner, Jochen Kramer, Benjamin Nagengast, Ulrich Trautwein Universität Tübingen _Theoretischer Hintergrund_. Im letzten Jahrzehnt fand in vielen Bundesländern eine Schulzeitverkürzung im Gymnasium um ein Jahr bei gleichzeitiger Erhöhung der Schülerwochenstunden statt (Trautwein & Neumann, 2008), die als G8-Reform breite Aufmerksamkeit auf sich zog und nicht unumstritten war und ist. Dies zeigt sich beispielsweise daran, dass Niedersachsen mit dem Schuljahr 2015/2016 flächendeckend zum G9 zurückkehrt (KMK, 2014). Die Diskussion der G8-Reform wird noch immer auf einer überschaubaren empirischen Basis geführt. Der wissenschaftliche Forschungsstand zu den intendierten und nichtintendierten Reformeffekten der Schulzeitverkürzung kann derzeit als unbefriedigend bezeichnet werden (vgl. Kühn, van Ackeren, Bellenberg, Reintjes & im Brahm, 2013). Eine häufig geäußerte Kritik am achtjährigen Gymnasium bezieht sich auf erwartete negative Effekte im Hinblick auf die Leistungsentwicklung und in Bezug auf das Wohlbefinden der Schülerinnen und Schüler (vgl. Kühn et al., 2013). In ersten empirischen Studien zeigten sich diesbezüglich keine oder geringfügige Unterschiede zuungunsten der G8-Schülerinnen und Schüler (Büttner & Thomsen, 2015; Böhm-Kasper & Weißhaupt, 2002; Milde-Busch, et al. 2010). _Fragestellung_. Der Beitrag behandelt die Frage, ob sich Leistungsunterschiede für Schülerinnen und Schüler aus G8- und G9Jahrgängen in Baden-Württemberg im Hinblick auf die Domänen Mathematik, Englisch (Lesekompetenz), Biologie und Physik ergeben. Diesbezüglich wurden auf Basis von Daten des Nationalen Bildungspanels (NEPS Zusatzstudie Baden-Württemberg; Blossfeld, Rossbach & Maurice, 2011; Wagner et al., 2011) drei Abschlussjahrgänge eingehend miteinander verglichen. Zusätzlich wurde untersucht, ob sich Unterschiede in Bezug auf die Bereiche des Beanspruchungserlebens und des gesundheitlichen Wohlbefindens zeigen. _Methode_. Bei den untersuchten Kohorten handelt es sich um den letzten G9-Abschlussjahrgang aus dem Jahr 2011, den aus G8- und G9-Schülerinnen und Schülern bestehenden Abschlussjahrgang („Doppeljahrgang“) aus dem Jahr 2012 sowie den ersten ausschließlichen G8-Abschlussjahrgang aus dem Jahr 2013. Berücksichtigt wurden Daten von insgesamt _N_ = 5210 Schülerinnen und Schülern aus 48 Schulen. Zur Auswertung der Daten wurden verschiedene mehrdimensionale MehrgruppenIRT-Modelle mit und ohne Adjustierung für relevante Hintergrundmerkmale spezifiziert. Die hierarchische Struktur der Daten sowie fehlende Werte wurden bei den Analysen durch Verwendung von robusten Schätzverfahren sowie Full-InformationMaximum-Likelihood-(FIML-)Verfahren berücksichtigt. Zusätzlich wurden Stichprobengewichte verwendet, um das Sampling Design adäquat zu berücksichtigen. _Ergebnisse_. In den Bereichen Englisch-Lesen und Biologie zeigten sich geringfügige Leistungsvorteile für die G9-Schülerinnen und Schüler. Für die Domänen Mathematik und Physik fanden sich hingegen keine Unterschiede. In Bezug auf das Beanspruchungserleben und das gesundheitliche Wohlbefinden ergaben sich je nach Vergleichsgruppe teilweise deutliche Unterschiede zuungunsten von Schülerinnen und Schülern aus G8-Jahrgängen. Die Ergebnisse werden vor dem Hintergrund der Rahmenbedingungen der G8-Reform diskutiert. „Wir machen erst mal gar nichts.“ – Eine prozessorientierte Betrachtung der Schulzeitreform am Gymnasium aus Sicht der Implementationsforschung Mirko Krüger, Svenja Kühn, Isabell van Ackeren Universität Duisburg-Essen *Theoretischer Hintergrund und Fragestellungen* Kaum ein anderes bildungspolitisches Thema wurde und wird in der Öffentlichkeit so anhaltend und intensiv diskutiert wie die Einführung des achtjährigen Bildungsgangs am Gymnasium. In Anlehnung an Altrichter und Wiesinger (2004) sowie Zapf (1994) kann sie als eine Neuerung betrachtet werden, die in ihrer Anlage auf mehreren Ebenen des Bildungssystems Veränderungen vorsieht. So intendiert sie z.B. auf Einzelschulebene im Kontext der erforderlichen curricularen Entwicklungsarbeit eine auf Unterrichtsebene anzubahnende veränderte Handlungspraxis der Lehrkräfte (z.B. Anbahnung von Kompetenzen auf der Grundlage neuer Lehrwerke). Damit verschränkt sind Veränderungen in der Dimension Wissen und Einstellungen (z.B. im Hinblick auf neu zu implementierende Lernkonzepte) und materielle Aspekte (z.B. neue schulinterne Lehrpläne). Zugleich ist im Zuge der Einführung der Reform potenziell von Veränderungen in den sozialen und organisationalen Strukturen der Gymnasien auszugehen (z.B. bei der Gestaltung des Ganztages). Unter Bezugnahme auf Ansätze der schulbezogenen Implementationsforschung (z.B. Fullan, 2001; Gräsel, 2010; Hasselhorn et al., 2014; Euler & Sloane, 1998) muss angenommen werden, dass die tatsächliche Umsetzung der Schulzeitreform divergieren und zu differenziellen Wirkungen bei verschiedenen Akteursgruppen auf unterschiedlichen Ebenen des Bildungssystems führen kann. Inwiefern in diesem Kontext reformkonformes Handeln zu beobachten ist, ist noch ungeklärt. Bisherige Studien verfolgen einen wirkungsorientierten Ansatz (zusammenfassend Kühn et al., 2013; Huebener & Marcus, 2015). Es fehlen jedoch Hinweise auf die den Wirkungen zugrunde liegenden reformbezogenen Sichtweisen der an der Umsetzung beteiligten Akteure. Außerdem liegen derzeit keine Erkenntnisse über die damit verbundenen Interpretationen und Übersetzungsprozesse auf Einzelschulebene vor. Demnach sind in dieser Studie folgende Forschungsfragen handlungsleitend: (1) Wie haben Lehrkräfte und Schulleitungen von Gymnasien mit achtjährigem Bildungsgang dessen Einführung erlebt? (2) Welche schulischen Herausforderungen traten in diesem Kontext auf und welche Handlungsstrategien kamen bei deren Bewältigung zum Tragen? *Methode* Es wurden Interviews mit Schulleitungen (17 Schulleitungen und stellvertretende Schulleitungen) und Lehrkräften (67 Lehrkräfte) aus dreizehn Gymnasien mit unterschiedlichen schulischen (z.B. Schulgröße) und kontextuellen Merkmalen (z.B. soziale Lage) in Nordrhein-Westfalen durchgeführt. An den Interviews nahmen Lehrkräfte beiden Geschlechts mit unterschiedlichen Fächerkombinationen, schulischen Funktionen und Lehrdeputaten in der Einführungsphase, Mittel- und Oberstufe teil. In den Gesprächen wurde nach dem Verfahren des problemzentrierten Interviews nach Witzel (2000) vorgegangen. Die Auswertung der Transkripte erfolgte mit Hilfe der zusammenfassenden Inhaltsanalyse nach Mayring (2015), um Argumentations- und Deutungsmuster zu den angesprochenen Themenbereichen identifizieren zu können. *Ergebnisse* Die Befragten haben weniger pädagogische Erwägungen als vielmehr ökonomische Gründe, auch als Reaktion auf aktuelle demografische Entwicklungen in Deutschland, sowie politische Profilierungsabsichten als maßgeblich für die Einführung des achtjährigen Bildungsgangs in Nordrhein-Westfalen wahrgenommen. Sowohl die befragten Lehrkräfte als auch die interviewten Schulleitungen erachten die Reform in der Rückschau als nicht durchdacht und übereilt eingeführt. Vor diesem Hintergrund berichten die schulischen Akteure von mehreren schulischen Herausforderungen bei der Umsetzung der im Zuge des achtjährigen Bildungsgangs erforderlichen Entwicklungsaufgaben. Als besonders herausfordernd wird die Verkürzung der Sekundarstufe I unter Beibehaltung einer dreijährigen Oberstufe erachtet, da sich diese nach Ansicht der Interviewten negativ auf die Entwicklung während der Pubertät der Schülerinnen und Schüler niederschlage. Weiterhin wird die unzureichende materielle, personelle und ideelle Unterstützung durch die Schulaufsicht bei den Entwicklungsaufgaben thematisiert. Dabei berichten die Befragten insbesondere von den mit der Erstellung kompetenzorientierter schulinterner Lehrpläne verbundenen Schwierigkeiten. Diese ergaben sich durch die den Schulen zu Beginn der Reform noch nicht vorliegenden ministeriellen Vorgaben, eine so wahrgenommene unzureichende Einführung und Begleitung im curricularen Entwicklungsprozess sowie ein mangelndes Verständnis über das den neuen Kernlehrplänen zugrunde liegende Unterrichtsprinzip der Kompetenzorientierung. Insgesamt lassen sich vier verschiedene Handlungsstrategien im Umgang mit den Herausforderungen der Schulzeitverkürzung identifizieren. In ihnen kommen unterschiedliche Reaktionen und Aktivitätsgrade im Zusammenhang mit den durch die Einführung des achtjährigen Bildungsgangs bedingten Entwicklungsaufgaben zum Vorschein. Die Oberstufenreform in Thüringen: Leistungsunterschiede und Einflussfaktoren auf die Leistung auf Kurs- und Schulebene vor und nach der Reform Nicolas Hübner, Wolfgang Wagner, Benjamin Nagengast, Ulrich Trautwein Universität Tübingen _Theoretischer Hintergrund_. In der ersten Dekade des 21. Jahrhunderts ließ sich in zahlreichen Bundesländern ein bildungspolitischer Trend verzeichnen, der sich u.a. in einer Umstrukturierung der gymnasialen Oberstufe ausdrückte (Trautwein, Neumann, Nagy, Lüdtke & Maaz, 2010). Der gymnasialen Oberstufe kann eine besondere Bedeutung als Gelenkstelle zwischen der schulischen Ausbildung und einem Studium zugesprochen werden (Trautwein & Neumann, 2008). Grundlage der Veränderung der gymnasialen Oberstufe bildeten die von der KMK 1999 verabschiedeten Husumer Beschlüsse, die eine Erweiterung der Anzahl der Prüfungsfächer im Abitur auf maximal fünf Fächer ermöglichten. Im Anschluss an die Beschlüsse reformierten zahlreiche Bundesländer ihre gymnasiale Oberstufe, beginnend mit Baden-Württemberg im Jahr 2002. In Thüringen trat die Oberstufenreform 2009 in Kraft. Vor der Oberstufenreform waren zwei Leistungsfächer, jeweils sechsstündig zu belegen sowie zwei Grundfächer, davon ein schriftliches Grundfach vierstündig und ein mündliches Grundfach drei-stündig (Kultusministerium Thüringen, 2007). Nach der Reform mussten Schülerinnen und Schüler insgesamt fünf vierstündige Abiturfächer belegen, davon zwei Kernfächer (Mathematik und Deutsch) sowie drei weitere Fächer mit erhöhtem Anforderungsniveau. (Kultusministerium Thüringen, 2008). Ein zentrales Ziel der Veränderung war eine Vereinheitlichung der Abiturprüfung (Trautwein & Neumann, 2008), die im Wesentlichen durch eine obligatorische Belegung der Fächer Deutsch und Mathematik auf erhöhtem Anforderungsniveau umgesetzt wurde. _Fragestellung_. Der vorliegende Beitrag untersucht die Frage, ob sich Unterschiede zwischen Schülerinnen und Schülern vor und nach der Oberstufenreform in Thüringen in Bezug auf die Leistungen in den Domänen Mathematik, Englisch (Lesekompetenz), Biologie und Physik finden lassen. Anschließend wird für die Bereiche Englisch und Mathematik – die (nahezu) durchgängig belegt wurden – untersucht, inwieweit sich Unterschiede zwischen den Leistungen der Schülerinnen und Schüler auf Kurs- und Schulebene zeigen und ob sich diese Unterschiede durch (aggregierte) Lehrermerkmale erklären lassen. _Methode_. Zur Beantwortung der vorliegenden Fragestellung wurde auf Daten des Nationalen Bildungspanels (NEPS) der Zusatzstudie Thüringen zurückgegriffen (Blossfeld, Rossbach & Maurice, 2011; Wagner et al., 2011). In diesem Datensatz liegen Informationen aus insgesamt 32 Schulen des letzten Jahrgangs vor der Reform und aus 31 Schulen nach der Reform vor, die im Rahmen eines Kohorten-Kontroll-Designs erhoben wurden (Shadish, Cook & Campbell, 2002). Zur Analyse der Daten wurde ein mehrschrittiges Vorgehen gewählt: Zunächst erfolgte die Untersuchung von Leistungsunterschieden vor und nach der Reform auf Basis von Mehrgruppen-IRT-Modellen. Hierbei wurden unadjustierte Modelle ohne Kovariaten und adjustierte Modelle mit Kovariaten (z.B. dem Geschlecht, Sozioökonomischen Status, etc.) berechnet. Darüber hinaus wurden mögliche Interaktionen des Geschlechts mit der Reform untersucht. Eine Berücksichtigung des Sampling Designs erfolgte durch die Schätzung robuster Standardfehler und die Verwendung von Stichprobengewichten. Fehlende Werte wurden mit der Full Information Maximum Likelihood-Methode (FIML) behandelt. Zur Beantwortung der zweiten Teilfragestellung wurden Mehrebenenmodelle eingesetzt, mit deren Hilfe separate Effekte auf unterschiedlichen Ebenen untersucht wurden. _Ergebnisse_. Für die untersuchten Leistungsbereiche zeigten sich mit Ausnahme der Englisch-Lesekompetenz zunächst keine statistisch signifikanten Unterschiede zwischen den beiden Kohorten in Modellen ohne Kontrolle weiterer Kovariaten. In den adjustierten Modellen wurde auch der Unterschied in der Englisch-Lesekompetenz nicht mehr statistisch signifikant. Darüber hinaus fanden sich Hinweise auf Geschlechterunterschiede: So schnitten Schülerinnen vor der Reform in den Bereichen Mathematik und Physik schlechter ab, während sie in Englisch-Lesen bessere Leistungen erzielten als Schüler. Nach der Reform fand sich ein ähnliches Bild, wobei hier der Unterschied zwischen Schülerinnen und Schülern in der Englischleistung signifikant geringer ausfiel. Erste Analysen im Rahmen der Mehrebenenmodelle legen nahe, dass sich Unterschiede in der Leistung der Schülerinnen und Schüler durch Schulunterschiede erklären lassen. ID: 274 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung Thematisches Cluster: Gesundheit/ Stress/ Belastung, Motivation und Emotion, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Professionelle Kompetenz von Lehrkräften; Wohlbefinden; Burnout; Unterrichtsqualität Professionelle Kompetenz und berufliches Wohlbefinden von Lehrkräften: "Beating the Odds" Chair(s): Anna Katharina Praetorius (Deutsches Institut für Internationale Pädagogische Forschung), Fani Lauermann (Rheinische Friedrich-Wilhelms-Universität Bonn) Diskutant(en): Detlev Leutner (Universität Duisburg-Essen) Der Lehrberuf gilt als äußerst herausfordernd, da Lehrkräfte viele verschiedene Aufgaben – und dies zum Teil zeitgleich – bewältigen müssen (Doyle, 1977). Aufgrund dieser vielfältigen Herausforderungen sowie aufgrund der sozialen Orientierung des Lehrberufs gelten Lehrkräfte als besonders anfällig für chronischen Stress, psychische Beeinträchtigungen und Burnout (Aktionsrat Bildung [ARB], 2014; Maslach, 2003). Dies ist problematisch: Das berufliche Wohlbefinden von Lehrkräften—deren Erleben von Stress und Burnout, aber auch Berufszufriedenheit—hat weitreichende Konsequenzen nicht nur für Lehrkräfte, sondern auch für ihre Schülerinnen und Schüler. Burnout ist unter anderem negativ mit der Unterrichtsqualität von Lehrkräften assoziiert (Butler & Shibaz, 2015; Klusmann, Kunter, Trautwein, & Baumert, 2006) und steht in positivem Zusammenhang mit unerwünschten Erscheinungen wie Frührente, Fehlzeiten sowie somatischen und psychischen Problemen (ARB, 2014). Vor diesem Hintergrund stellt sich die Frage: Welche Faktoren können Lehrkräfte dabei unterstützen, mit Berufsbelastungen produktiv umzugehen, um ihr berufliches Wohlbefinden zu stärken und somit zu ihrem beruflichen Erfolg beizutragen? Die vier Beiträge des Symposiums nutzen verschiedene Herangehensweisen, um diese Frage zu beantworten. Die Vortragenden demonstrieren, dass Elemente des beruflichen Wohlbefindens von Lehrkräften wie Burnout (Beiträge 1-2) und Berufszufriedenheit (Beiträge 3-4), aber auch deren Unterrichtsqualität (Beiträge 3-4), in einem Zusammenhang stehen mit persönlichen Ressourcen wie pädagogisch-psychologischem Wissen (Beiträge 1-2), berufsrelevanten Überzeugungen und motivationalen Orientierungen (Beiträge 1-4), Selbstregulationsfähigkeiten (Beitrag 1) sowie Persönlichkeitsmerkmalen wie Perfektionismus (Beitrag 3). Von besonderem Interesse sind mögliche Wirkmechanismen, durch die die professionelle Kompetenz von Lehrkräften (deren Wissen, Motivation und Selbstregulationsfähigkeiten) und Persönlichkeitsmerkmale (Perfektionismus) mit dem beruflichen Wohlbefinden und der Unterrichtsqualität von Lehrkräften verknüpft sind (z. B. direkte vs. indirekte Effekte sowie mögliche Moderationseffekte). Methodenartefakte, die die Schätzung dieser Zusammenhänge beeinflussen können, werden im Symposium ebenfalls berücksichtigt und diskutiert (Beitrag 4). Die einzelnen Beiträge nutzen diverse methodische Herangehensweisen und Studiendesigns: (a) längsschnittlich (Beitrag 1) und querschnittlich erhobene Daten (Beiträge 1-4), (b) verschiedene Datenquellen wie Wissenstests (Beiträge 1-2), Lehrerselbstberichte (Beiträge 1-4) und Schülereinschätzungen der Lehrkräfte (Beitrag 3), (c) Stichproben mit angehenden (Beitrag 1) und erfahrenen (Beiträge 3-4) Lehrkräften sowie (d) nationale (Beiträge 1-3) und internationale (Beitrag 4) Datensätze. Zusammenfassend stellen die AutorInnen fest, dass die professionelle Kompetenz von Lehrkräften eine vielversprechende Grundlage für weitere Forschung zur Stärkung des beruflichen Wohlbefindens und Erfolgs von Lehrkräften darstellt und somit eine Grundlage für „Beating the Odds“ gegen Stress, Belastungen, Burnout und beruflichen Misserfolg darstellt. Beiträge des Symposiums Mehr Wissen = weniger Stress? Professionelle Kompetenz und Beanspruchungserleben von Lehrkräften im Vorbereitungsdienst Uta Klusmann1, Oliver Lüdtke2, Thamar Voss3, Mareike Kunter4 1 IPN Kiel, 2IPN Kiel; ZIB, 3Eberhard-Karls-Universität Tübingen, 4Goethe-Universität Frankfurt am Main Theoretischer Hintergrund Der Beginn der beruflichen Praxis stellt für viele Lehrkräfte eine große Herausforderung dar und wird häufig auch als „Praxisschock“ bezeichnet (Goddard, O’Brien & Goddard, 2006). Entsprechende empirische Arbeiten weisen auf erhöhte Beanspruchung insbesondere im ersten Jahr der beruflichen Praxis hin (Klusmann et al., 2012). Vor dem Hintergrund klassischer Stress-Modelle ist anzunehmen, dass neben Umweltmerkmalen auch Merkmale der Lehrkräfte eine Rolle für das Beanspruchungserleben spielen (Lazarus & Folkman, 1984). Die bisherige Forschung untersucht als personale Einflussgrößen überwiegend situationsübergreifende Persönlichkeitseigenschaften wie Neurotizismus (Rothland & Klusmann, 2012). Dabei kann angenommen werden, dass auch situationsspezifische Kompetenzen dafür relevant sein können, ob berufliche Anforderungen als bedrohlich erlebt werden (Lazarus & Folkman, 1984). Die professionelle Kompetenz von Lehrkräften beschreibt die Voraussetzungen für die erfolgreiche Bewältigung der Anforderungen im Lehrerberuf (Kunter et al., 2011). Neben dem Professionswissen von Lehrkräften (fachlich, fachdidaktisch und pädagogisch-psychologisch) werden auch motivationale Orientierungen und berufliche Selbstregulation als Kompetenzaspekte postuliert. Insbesondere die Fähigkeit zur beruflichen Selbstregulation wird als zentral für die Vermeidung beruflicher Beanspruchung angesehen (Klusmann et al., 2008). In der aktuellen Studie wird untersucht, inwieweit die professionelle Kompetenz beim Einstieg in die berufliche Praxis das Beanspruchungserleben von Lehrkräften vorhersagen kann. Zur Beantwortung dieser Frage kombinieren wir einen 1-Jahres Längsschnitt im ersten Jahr des Vorbereitungsdiensts mit den Daten einer Tagebuchstudie, in welcher die angehenden Lehrkräfte ihre täglichen positiven (uplifts) und negativen Ereignisse (hassles) bei ihren beruflichen Tätigkeiten beschreiben. Fragestellungen 1) Kann die professionelle Kompetenz zu Beginn der praktischen Tätigkeit das Beanspruchungserleben zum Ende des ersten Jahres im Vorbereitungsdienst vorhersagen? 2) Wird der Zusammenhang zwischen professioneller Kompetenz und Beanspruchungserleben durch das Erleben von positiven (uplifts) und negativen (hassles) Ereignissen im beruflichen Alltag mediiert? Methode Die Datengrundlage für die vorliegende Untersuchung bildet die Studie COACTIV-Referendariat (COACTIV-R; Kunter et al., 2011). Die aktuellen Analysen berücksichtigen die Lehramtskandidaten, die sich im ersten Jahr des Vorbereitungsdienstes befanden und zu Beginn (T1) und am Ende (T2) des ersten Schuljahres befragt wurden. Zusätzlich fand in der Mitte des Schuljahrs eine zweiwöchige Tagebuchstudie statt, in welcher die Teilnehmer jeden Abend über ihre täglichen positiven und negativen Ereignisse berichteten. Die verwendete Teilstichprobe besteht aus N = 239 angehenden Lehrkräften, die alle als ein Fach Mathematik haben. Beanspruchungserleben wurde mittels emotionaler Erschöpfung operationalisiert und zu T1 und T2 erfragt (Baumert et al., 2009). Professionelle Kompetenz. Es wurden vier Kompetenzaspekte berücksichtigt, die zu T1 erfasst wurden: das fachdidaktische Wissen in Mathematik (Testverfahren; Krauss et al., 2008), das Pädagogisch-Psychologische Wissen (Testverfahren, Voss et al., 2011), die Selbstwirksamkeit (Schwarzer & Jerusalem, 1999) und die berufliche Selbstregulation (Schaarschmidt und Fischer, 1996). Hassles und uplifts. Es konnten in der Tagebuchstudie mittels eines offenen Antwortformats täglich bis zu 10 positive (uplifts) und negative (hassles) berufliche Ereignisse genannt werden. Die Anzahl der Hassles und uplifts einer Person wurde pro Tag aufsummiert. Ergebnisse Aufgrund der hierarchischen Datenstruktur (Messungen der Tagebuchstudie geschachtelt innerhalb von Lehrkräften) wurden Mehrebenen-Pfadanalysen durchgeführt (Bolger & Laurenceau, 2013). Die Ergebnisse zeigten, dass - unter Kontrolle der emotionalen Erschöpfung zu T1 - Lehrkräfte, mit einem höheren pädagogisch-psychologischen Wissen und einer adaptiven Selbstregulation zu Beginn des Schuljahres, geringere emotionale Erschöpfung zum Ende des ersten Schuljahres aufwiesen. Dieser Zusammenhang wurde durch die täglichen hassles und uplifts mediiert, d.h. Personen mit höheren Kompetenzwerten berichteten in ihrem beruflichen Alltag weniger hassles als uplifts. Keine signifikanten Effekte zeigten sich für das Fachdidaktische Wissen. Die Studie verdeutlicht, dass die professionelle Kompetenz der Lehrkräfte nicht nur für das Lernen der Schüler (Kunter et al., 2013), sondern auch für die Lehrkräfte selbst Relevanz hat. Die Tatsache, dass neben den Fähigkeiten zur Selbstregulation das pädagogisch-psychologische Wissen die Güte der Bewältigung alltäglicher beruflicher Ereignisse vorhersagen kann, weist auf die Bedeutsamkeit einer guten theoretischen Grundlage für das erfolgreiche Handeln im Lehrerberuf. Professionelle Kompetenzen und Wohlbefinden von Lehrkräften: Eine Analyse der Zusammenhänge zwischen Pädagogisch-Psychologischem Wissen, Selbstwirksamkeit und Burnout Fani Lauermann1, Johannes König2 1 Rheinische Friedrich-Wilhelms-Universität Bonn, 2Universität zu Köln Theoretischer Hintergrund Burnout von Lehrkräften—das Erleben emotionaler Erschöpfung, Depersonalisierung von Schülerinnen und Schülern und die Wahrnehmung reduzierter Leistungsfähigkeit—hat gravierende Konsequenzen für den beruflichen Erfolg und das Wohlbefinden von Lehrkräften (e.g., Butler & Shibaz, 2015; Klusmann, Kunter, Trautwein, Lüdtke, & Baumert, 2008; Maslach, 2003). Burnout hängt mit unerwünschten Ergebnissen zusammen wie Fehlzeiten, Frührente, unzureichenden beruflichen Leistungen und Depression (ARB, 2014; Swider & Zimmerman, 2010). Eine wesentliche Ursache für Burnout ist die chronische Belastung, die zum Beispiel aus dem Missverhältnis zwischen Arbeitsanforderungen und den persönlichen Ressourcen, die für die Erfüllung dieser Anforderungen benötigt werden, resultiert (Maslach, 2003). Lehrkräfte mit stärker ausgeprägten persönlichen Ressourcen—z.B. hohe Selbstwirksamkeit (Vertrauen in die eigenen Fähigkeiten), adaptive Problembewältigungsstrategien und pädagogisch-psychologisches Wissen—sind eher in der Lage die Anforderungen des Lehrerberufs zu erfüllen; es ist daher auch weniger wahrscheinlich, dass sie Burnout erleiden (Durr, Chang, & Carson, 2014). Nur wenige Studien haben jedoch bisher die kombinierten prädiktiven Effekte von persönlichen Ressourcen wie pädagogischpsychologisches Wissen (general pedagogical-psychological knowledge, GPK) und Selbstwirksamkeit von Lehrkräften auf das Erleben von Burnout untersucht, wobei diese sich weitgehend auf angehende Lehrkräfte und auf lediglich eine Burnoutdimension, nämlich emotionale Erschöpfung, beschränken (Dicke et al., 2015; Klusmann, Kunter, Voss, & Baumert, 2012). Aufbauend auf diese Evidenz fokussiert sich die vorliegende Studie dagegen auf erfahrene Lehrkrafte und auf drei Burnoutdimensionen: emotionale Erschöpfung, reduzierte Leistungsfähigkeit und Depersonalisierung. Mögliche Geschlechtsunterschiede und die Rolle von Lehrerfahrung werden ebenfalls berücksichtigt, da solche persönlichen Merkmale oft mit den Überzeugungen und dem Wissen von Lehrkräften zusammenhängen (z.B. Klassen & Chiu, 2010; König et al., 2014). Fragestellungen Die folgenden Zusammenhänge werden untersucht: (F#1) die Beziehungen zwischen Geschlecht und Lehrerfahrung auf der einen Seite und GPK, Selbstwirksamkeit und Burnout auf der anderen Seite; (F#2) die Beziehungen zwischen GPK und lehrerspezifischer versus allgemeiner Selbstwirksamkeit; und (F#3) die direkten und indirekten prädiktiven Effekte von GPK auf Burnout, die eventuell über Lehrerselbstwirksamkeit vermittelt werden. Methode Daten von 119 Lehrkräften wurden mittels Pfadanalysen ausgewertet (König, 2015). GPK wurde mit einer IRT-skalierten Testbatterie aus der TEDS-M Studie gemessen (König, Blömeke, Paine, Schmidt, & Hsieh, 2011). Allgemeine Selbstwirksamkeit wurde mit einer 10-Item-Skala nach Schwarzer and Jerusalem (1995) erfasst, und Lehrerselbstwirksamkeit wurde mit einer 10Item-Skala nach Schwarzer und KollegInnen erfasst (Schwarzer & Hallum, 2008). Burnout wurde mit dem Maslach Burnout Inventory erfasst (Maslach, Jackson, & Leiter, 1996). Ergebnisse Zu F#1. Pfadanalysen zeigten keine signifikanten Geschlechtsunterschiede; Lehrkräfte mit mehr Lehrerfahrung berichteten jedoch geringere allgemeine und lehrspezifische Selbstwirksamkeit. Darüber hinaus gab es einen kurvilinearen Zusammenhang zwischen Lehrerfahrung und GPK; wenig und hoch erfahrene Lehrkräfte hatten geringere GPK-Werte als Lehrkräfte mit mittlerem Niveau an Erfahrung. Zwischen Lehrerfahrung und Burnout wurde kein signifikanter Zusammenhang festgestellt. Zu F#2. Erwartungsgemäß war GPK positiv mit Lehrerselbstwirksamkeit assoziiert, aber nicht mit allgemeiner Selbstwirksamkeit, was darauf hindeutet, dass dieser Effekt berufsspezifisch ist. Zu F#3. GPK hatte außerdem negative indirekte (über Lehrerselbstwirksamkeit vermittelt) prädiktive Effekte auf alle drei Burnoutdimensionen. Weiterhin hatte GPK einen direkten negativen prädiktiven Effekt auf Depersonalisierung. Die vorliegende Studie trägt somit zu einem expandierenden Forschungbereich bei, der darauf hindeutet, dass GPK nicht nur auf die Unterrichtsqualität von Lehrkräften (Pflanzl, Thomas, & Matischek-Jauk, 2013; Voss, Kunter, & Baumert, 2011), sondern auch auf ihr berufliches Wohlbefinden eine positive Auswirkung haben kann (Dicke et al., 2015; Klusmann et al., 2012). Dieser Effekt bezieht sich nicht nur auf angehende (vgl. Dicke et al., 2015), sondern auch auf erfahrene Lehrkräfte. Darüber hinaus indizieren die Ergebnisse dieser Studie, dass GPK unter anderem dadurch positive Auswirkungen auf das berufliche Wohlbefinden von Lehrkräften haben kann, dass GPK positiv mit Lehrerselbstwirksamkeit assoziiert ist. Somit haben beide Konstrukte—GPK und Selbstwirksamkeit—eine hohe Relevanz für die weitere Interventionsforschung zur Burnoutprävention. Zusammenhänge funktionaler und dysfunktionaler Komponenten des Perfektionismus mit motivationalen Aspekten, Unterrichtsqualität und Belastungserleben bei Lehrkräften Gerlinde Lenske1, Anna-Katharina Praetorius2, Katharina Drexler3, Oliver Dickhäuser4, Markus Dresel3 1 Universität Koblenz-Landau, 2Deutsches Institut für Internationale Pädagogische Forschung, 3Universität Augsburg, 4 Universität Mannheim Theoretischer Hintergrund Perfektionismus gilt als ein wichtiger Einflussfaktor für die Gesundheit von Menschen (z. B. Dunkley, Zuroff & Blankstein, 2003). Während Einigkeit über die Mehrdimensionalität von Perfektionismus besteht, finden sich unterschiedliche Konzeptualisierungen in der Fachliteratur, wobei zwischen dysfunktionalen und funktionalen Facetten unterschieden wird (z. B. Frost, Marten, Lahart & Rosenblate, 1990; Hewitt & Flett, 1991; Slaney, Rice, Mobley, Trippi & Ashbey, 2001). Als funktionale Facetten gelten hohe selbstbezogene Standards sowie die Wertschätzung von Ordnung und Struktur, als dysfunktional eine ausgeprägte Fehlersensibilität, Zweifel an der eigenen Leistungsfähigkeit, wahrgenommene Diskrepanzen zwischen den eigenen Standards und dem Erreichten sowie die Wahrnehmung, dass die hohen Standards fremdgesetzt sind (Altstötter-Gleich & Bergemann, 2006). Während funktionaler Perfektionismus mit adäquaten Copingstrategien, höherem Selbstwertgefühl und höherer Leistungsmotivation einhergeht und daher als präventiv in Bezug auf Stresserleben, Depression und Belastungserleben sowie als leistungsförderlich beschrieben wird (z. B. Accordino, Accordino & Slaney, 2000; Ashby & Rice, 2002; Dunkley et al., 2003; Slaney et al., 2001; Stoeber & Rennert, 2008), erweist sich dysfunktionaler Perfektionismus als gesundheitsgefährdend (z. B. Bieling, Israeli & Antony, 2004; Edington, 2014; Smyth, 2002; Stumpf & Parker, 2000; Dunkley et al., 2003; Sumi & Kanda, 2002 ). Auch für Lehrkräfte liegen bereits erste theoriekonforme Befunde zur Bedeutsamkeit von Perfektionismus hinsichtlich Stresserleben und Burnout vor (Stoeber & Rennert, 2008; Gordon, Hewitt, Hallett; 1995). Über Zusammenhänge von Perfektionismus und Unterrichtsqualität von Lehrkräften ist bislang jedoch nichts bekannt. In Bezug auf die leistungsförderliche Wirkung der funktionalen Komponente sind positive Zusammenhänge denkbar. Unklar sind zudem vermittelnde Mechanismen zwischen Perfektionismus und dem Erleben und Verhalten von Lehrkräften. Ein solcher möglicher Mechanismus stellt die Motivation von Lehrkräften dar, die im Gegensatz zu Perfektionismus als relativ stabilem Konstrukt der Persönlichkeit (Rice & Aldea, 2006) kontextspezifischer ist (Dresel & Lämmle, 2011). Fragestellung In der vorliegenden Studie wird der Frage nach den Zusammenhängen der funktionalen und dysfunktionalen Komponenten von Perfektionismus mit Aspekten der Lehrermotivation, Unterrichtsqualität und dem Belastungserleben nachgegangen. Methode Insgesamt wurden 43 Lehrkräfte (62% weiblich, Berufserfahrung M = 12.65 Jahre, SD = 7.56) sowie deren 43 Schulklassen einbezogen. Funktionale und dysfunktionale Perfektionismuskomponenten wurden mit der deutschen Übersetzung der multidimensionalen Perfektionismusskala von Frost und Kollegen erfasst (Altstötter-Gleich & Bergemann, 2006), wobei sich auf die von den Autoren als konstruktvalide eingestuften drei Facetten hohe Standards, Fehlersensibilität und leistungsbezogene Zweifel beschränkt wurde. Belastungserleben wurde mit der Skala von Maslach & Jackson (1986), Zielorientierungen mit den Skalen von Nitsche und Kollegen (2011) und unterrichtsbezogene Selbstwirksamkeit mit den Skalen von Pfitzner-Eden, Thiel & Horsley (2014) erhoben. Unterrichtsqualität wurde anhand von Schülerratings bezogen auf die drei Basisdimensionen nach Klieme und Kollegen (2001; 2006) erfasst, wobei bei der Dimension unterstützendes Klima auf den Umgang mit Fehlern fokussiert wurde (Fehlerklima: Steuer, Rosentritt-Brunn & Dresel, 2013; Klassenführung und kognitive Aktivierung: COACTIV). Analysiert wurden die Daten unter Anwendung von Bootstrapping in Mplus 7mittels Korrelationsanalysen sowie Mediationsmodellen. Ergebnisse In Bezug auf die funktionale Komponente von Perfektionismus zeigten sich erwartungsgemäß mittlere positive Zusammenhänge mit der Lernzielorientierung, der Selbstwirksamkeit, der kognitiven Aktivierung und dem Fehlerklima sowie schwach negative Zusammenhänge mit dem Belastungserleben. Zur Klassenführung ergaben sich keine signifikanten Zusammenhänge. Der dysfunktionale Perfektionismus wies erwartungsgemäß mittlere bis hohe Zusammenhänge zur Annäherungsleistungs-, der Vermeidungsleistungszielorientierung und der Arbeitsvermeidung auf. Zur Selbstwirksamkeit bestand ein mittlerer negativer Zusammenhang. Darüber hinaus ergaben sich – ebenfalls erwartungskonform –hohe positive Zusammenhänge mit dem Belastungserleben. Ein indirekter Effekt über motivationale Aspekte ließ sich weder bezogen auf die Unterrichtsqualität noch auf das Belastungserleben nachweisen. Die gefundenen Zusammenhänge machen deutlich, dass auch im Lehrberuf Perfektionismus eine wesentliche Rolle spielt und hinsichtlich der funktionalen und dysfunktionalen Komponenten differenziert betrachtet werden sollte. Die Befunde lassen vermuten, dass Perfektionismus nicht nur in Bezug auf die Lehrergesundheit, sondern auch hinsichtlich der Unterrichtsqualität bedeutsam ist. Schein oder Sein? Zur Vorhersagbarkeit des Zusammenhangs von Lehrerselbstwirksamkeit, Berufszufriedenheit und selbstberichteter Unterrichtsqualität durch Methodenartefakte Anna-Katharina Praetorius1, Fani Lauermann2, Doris Holzberger3 1 Deutsches Institut für Internationale Pädagogische Forschung, 2Rheinische Friedrich-Wilhelms-Universität Bonn, 3Technische Universität München Theoretischer Hintergrund Die Selbstwirksamkeit von Lehrkräften gilt als bedeutsamer Prädiktor für die Berufszufriedenheit sowie die Unterrichtsqualität von Lehrkräften (zsf. siehe Klassen, Tze, Betts & Gordon, 2011). Der Großteil der diesbezüglichen empirischen Evidenz basiert jedoch auf Lehrerselbstberichten. Dies wird in letzter Zeit vermehrt kritisiert (z. B. Holzberger, Philipp & Kunter, 2013; Klassen & Tze, 2014): Da zur Messung aller interessierenden Variablen dieselbe Methode verwendet wurde, könnten die gefundenen Zusammenhänge nicht nur inhaltlich, sondern auch durch einen sogenannten „common method bias“ bedingt sein. Eine empirische Überprüfung inwiefern dies der Fall ist, ermöglicht der latente Markervariablen-Ansatz von Williams, Hartman und Cavazotte (2010). Dabei wird zunächst die Art der Verzerrung von Prädiktor sowie Kriterium festgelegt (z.B. soziale Erwünschtheit, Ja-Sage-Tendenz und andere Antworttendenzen); nur bei einer Verzerrung beider Variablen handelt es sich um einen common method bias. In einem zweiten Schritt wird dann eine Variable identifiziert, die in keinem theoretischen Zusammenhang zu den interessierenden Variablen steht, gleichzeitig aber ebenfalls durch die zuvor bestimmten Verzerrungen beeinflusst wird. In einem dritten Schritt wird der Einfluss von Methodenartefakten mittels konfirmatorischer Faktorenanalysen empirisch geschätzt. Fragestellung Im vorliegenden Beitrag gehen wir der Frage nach, in welchem Ausmaß der Zusammenhang von Lehrerselbstwirksamkeit, Berufszufriedenheit und selbstberichteter Unterrichtsqualität durch common method bias beeinflusst wird. Methode Dazu wurden Daten der internationalen TALIS-Studie 2013 (OECD, 2014) analysiert. Für die Analysen des Zusammenhangs zwischen Selbstwirksamkeit und Berufszufriedenheit wurden Daten von 120652 Lehrkräften aus 34 Ländern einbezogen, die an regulären Sekundarschulen unterrichten. Für die Analysen des Zusammenhangs zwischen Selbstwirksamkeit und Unterrichtsqualität wurden Daten von 3798 Lehrkräften in acht Ländern einbezogen, da die Unterrichtsqualität-Items zum Teil nur in einem TALIS-Zusatzmodul erfasst wurden. Zur Messung von Selbstwirksamkeit wurden drei Subskalen eingesetzt (Instructional Strategies, Classroom Management, Student Engagement), zur Erfassung der Berufszufriedenheit vier Items und zur Erfassung von Unterrichtsqualität drei Skalen (Klassenführung, kognitive Aktivierung, konstruktive Unterstützung). Die verwendeten Skalen wiesen hinreichende interne Konsistenzen sowie metrische Invarianz zwischen Ländern auf. Als Markervariable wurden zwei Items gewählt, die sich auf Hindernisse bezüglich der Teilnahme an Fortbildungen beziehen (keine Anreize; zu hohe Kosten), unter der Annahme, dass diese Items in keinem theoretischen Zusammenhang mit den interessierenden Variablen stehen, aber dennoch von ähnlichen Antworttendenzen verzerrt sein könnten. Fünf konfirmatorische Faktorenanalysen mit verschiedenen Ladungs- und Korrelationsrestriktionen wurden durchgeführt, durch deren Vergleich die Effekte von Methodenartefakten bestimmt werden können (siehe Williams et al., 2010). Ergebnisse In Bezug auf den Zusammenhang zwischen Selbstwirksamkeit und Berufszufriedenheit zeigten sich lediglich Ladungen der Items von Berufszufriedenheit auf dem Methodenfaktor (.16 ≤ λ ≤ .31), nicht jedoch bei den Subskalen der Lehrerselbstwirksamkeit (.04 ≤ λ ≤ .08). Dementsprechend wurde auch der Zusammenhang zwischen Berufszufriedenheit und Selbstwirksamkeit nur um r = .02 verschätzt (r = .24 anstelle r = .22). Für die Modelle bezüglich Selbstwirksamkeit und Unterrichtsqualität fand sich eine signifikante Ladung der Subskalen von Selbstwirksamkeit (.06 ≤ λ ≤ .15), keine signifikanten Ladungen bei kognitiver Aktivierung (-.04 ≤ λ ≤ .01) und teilweise signifikante Ladungen bei Klassenführung (.10 ≤ λ ≤ .18) und konstruktiver Unterstützung (.03 ≤ λ ≤ .12). Der Zusammenhang zwischen Unterrichtsqualität und Selbstwirksamkeit wurde dementsprechend lediglich bei Klassenführung verschätzt, und auch hier wiederum um nur r = .02 (r = .39 anstelle r = .37). Die Befunde deuten darauf hin, dass die Problematik eines common method bias bei der Untersuchung des Zusammenhangs von Lehrerselbstwirksamkeit und Berufszufriedenheit sowie Unterrichtsqualität unter Umständen nicht so gravierend ist wie oftmals angenommen. Einschränkend muss jedoch gesagt werden, dass die Befunde sich nur auf solche Verzerrungen beziehen, die über die gewählte Markervariable erfasst wurden. Dabei bleibt zum einen offen, in welchem Ausmaß die Markervariable tatsächlich die intendierten Verzerrungen abbilden kann und zum anderen, inwiefern andere Verzerrungen die Zusammenhänge zwischen den interessierenden Variablen beeinflussen. Weitere Studien zur Überprüfung der Robustheit der Befunde sind daher notwendig. ID: 276 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Sonstige Didaktiken, Lehrerbildung Thematisches Cluster: Bildungsgerechtigkeit/ Migration, Lehrer(aus)bildung, Lese- und Sprachförderung Stichworte: Mehrsprachigkeit, Deutsch als Zweitsprache, Lerngelegenheiten, Einstellungen, linguistically responsive teaching Umgang mit Mehrsprachigkeit im Unterricht – Die Bedeutung von Lerngelegenheiten im Lehramtsstudium und in der Lehrerfortbildung Chair(s): Timo Ehmke (Leuphana Universität Lüneburg) Diskutant(en): Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen (IQB)) Der Umgang mit mehrsprachigen Schülerinnen und Schülern ist eine zentrale Herausforderung an die Schulen in Deutschland, aber auch in anderen Staaten. Lehrkräften kommt damit die wichtige Aufgabe zu, diese Schülerinnen und Schüler mit Deutsch als Zweitsprache gezielt durch eine sprachlich-sensitive Unterrichtsgestaltung zu fördern. Überlegungen dazu, welche Kompetenzen und Einstellungen Lehrkräften hinsichtlich des „linguistically responsive teaching“ erreichen sollten, wurden etwa von Lucas & Grinberg (2008), Lucas (2011) oder Bunch (2013) vorgeschlagen. In einigen Bundesländern Deutschlands (z.B. NRW, Berlin) sehen die Lehrerausbildungsgesetze daher mittlerweile vor, dass angehende Lehrerinnen und Lehrer aller Unterrichtsfächer eine Ausbildung im Bereich Deutsch als Zweitsprache (DaZ) zusätzlich zu ihrem fachlichen, fachdidaktischen und bildungswissenschaftlichen Studium durchlaufen. Es liegen bisher aber keine systematischen empirischen Forschungsarbeiten über die dazu notwendigen professionellen Kompetenzen von Lehrkräften und damit auch keine empirisch abgesicherten Hinweise auf die Ausgestaltung von Lerngelegenheiten in der universitären Lehrerausbildung vor. Vor diesem Hintergrund sollen in dem Symposium vier Beiträge präsentiert werden, die sich mit Kompetenzen und Einstellungen von angehenden und praktizierenden Lehrkräften hinsichtlich des Umgangs mit DaZ-Schülerinnen und Schülern bzw. multilingual learners (MLL) befassen und dabei insbesondere die Bedeutung von Lerngelegenheiten herausarbeiten. Der erste Beitrag von Hammer, Fischer und Ehmke stellt Ergebnisse einer Studie an Lehramtsstudierenden vor, die hinsichtlich ihrer DaZ-Kompetenz und ihren Einstellungen gegenüber Mehrsprachigkeit im Unterricht getestet und befragt worden sind. Die Ergebnisse zeigen, dass die DaZ-Kompetenz und die Einstellungen gegenüber Mehrsprachigkeit im Unterricht von Lehramtsstudierenden im positiven Zusammenhang mit der Nutzung von universitären Lerngelegenheiten stehen. In dem zweiten Beitrag von Wagner, Paetsch und Darsow steht die DaZ-Kompetenz von Lehramtsstudierenden an Berliner Universitäten im Mittelpunkt. In dieser Studie wird untersucht, inwieweit diese durch universitäre Lerngelegenheiten im Bereich DaZ gefördert werden kann. Erste Ergebnisse bestätigen die Bedeutung von Lerngelegenheiten insbesondere zu den Themen Linguistik, Migration, Mehrsprachigkeit und Scaffolding. Der dritte Beitrag berichtet Ergebnisse einer Studie durchgeführt von einer Arbeitsgruppe an der Universität in Turku, Finnland, über das Wissen von Lehrkräften hinsichtlich sprachsensiblen Unterrichts. Dazu wurden die Daten aus mehreren online-basierten Lehrerfortbildungsmaßnahmen zum „linguistically and culturally responsive teaching“ ausgewertet. Ergebnisse zeigen, dass bereits kurze Fortbildungsmaßnahmen die Sensitivität von Lehrkräften hinsichtlich eines sprachförderlichen Unterrichts verbessern können. Der vierte Beitrag berichtet über die Ergebnisse einer Studie von Viesca von der University of Denver, Colorado, USA. In einer Dokumentenanalyse von Lernmaterialien, die im Rahmen von online-basierten Lehrerfortbildungen zum linguistically responsive teaching erhoben wurden, konnte gezeigt werden, dass sich Einstellungen von Lehrkräften hinsichtlich Mehrsprachigkeit im Unterricht positiv durch die Lehrerfortbildungsmaßnahme entwickeln konnten. Beiträge des Symposiums Zusammenhänge zwischen Deutsch als Zweitsprache Kompetenz und Einstellungen zu Mehrsprachigkeit Svenja Hammer, Nele Fischer, Timo Ehmke Leuphana Universität Lüneburg Zahlreiche Schulleistungsstudien haben signifikante Unterschiede zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund in schulischen Leistungen aufgezeigt (OECD, 2013; Blossfeld et al., 2007). Dass ein Zusammenhang zwischen Schulerfolg und ausreichender Kompetenz in der Unterrichtssprache Deutsch sowie anderen Faktoren wie dem sozioökonomischen Hintergrund besteht, kann daher als unbestritten gelten. Um Schülerinnen und Schülern nichtdeutscher Herkunftssprachen größere Erfolgschancen im Bildungssystem zu verschaffen, ist deren Förderung, vor allem im sprachlichen Bereich, daher nötig. Um diese Aufgabe wahrnehmen zu können, bedürfen Lehrkräfte entsprechender Kompetenzen, die sie größtenteils bislang nicht in ihrem Studium erwerben konnten und sich dementsprechend nicht angemessen auf diese Aufgabe vorbereitet fühlen. Darüber hinaus fühlen sich viele Lehrkräfte nicht zuständig für die Sprachförderung ihrer Schülerinnen und Schüler (Becker-Mrotzek et al., 2012). Daher müssen bereits im Lehramtsstudium Lerngelegenheiten geschaffen werden, die sowohl die nötigen Kompetenzen vermitteln als auch eine Auseinandersetzung mit den eigenen Einstellungen zu Mehrsprachigkeit ermöglicht. Dies wirft die folgenden Fragen auf: (1) Welches DaZ-Kompetenzniveau weisen Lehramtsstudierende in Bezug auf Mindest- und Regelstandards auf? (2) Welche Einstellungen zu Mehrsprachigkeit zeigen Lehramtsstudierende für die Bereiche Sprachsensibilität im Fachunterricht, Zuständigkeit für Sprachförderung und Wertschätzung von Mehrsprachigkeit? (3) Welche Zusammenhänge lassen sich zwischen DaZ-Kompetenz und Einstellungen zu Mehrsprachigkeit zeigen? Zur Erfassung der DaZ-Kompetenz sowie der Einstellungen zu Mehrsprachigkeit wurde im Projekt DaZKom ein theoretisches Modell für Deutsch-als-Zweitsprache Kompetenz angehender Lehrkräfte mit den drei Dimensionen (1) Fachregister, (2) Mehrsprachigkeit und (3) Didaktik (Köker et al., 2015) entwickelt. Basierend auf diesem Modell steht nun ein paper-pencil-Test mit 51 Items zur Verfügung, der es ermöglicht, differenzierte Aussagen über die Kompetenz Studierender im Bereich Deutsch als Zweitsprache zu treffen (Hammer et al., 2015). Anhand eines Standardsettings wurden für DaZ-Kompetenz Niveaustufen beschrieben, die sich aufgliedern in Mindest- und Regelstandards. Neben diesem Instrument wurde eine Skala mit 31 Items (EAP Reliabilität = 0.84) für die Erfassung von Überzeugungen zu Mehrsprachigkeit entwickelt, die die inhaltlichen Bereiche (a) Sprachsensibilität im Fachunterricht, (b) Zuständigkeit für Sprachförderung und (c) Wertschätzung von Mehrsprachigkeit umfasst. Diese wurde anhand einer 4-stufigen Likert-Skala erfasst. An einer Stichprobe von N = 427 Lehramtsstudierenden von 12 deutschen Universitäten wurden sowohl die DaZ-Kompetenz als auch die Einstellungen zu Mehrsprachigkeit erhoben. Die Item- und Skalenanalysen wurden auf der Basis des Raschmodells mit dem Programm ConQuest durchgeführt (Adams, Wu, & Wilson, 2012). Die Ergebnisse der Analysen zeigen, dass sich 27,2% der Lehramtsstudierenden unterhalb des Mindeststandards für DaZKompetenz befinden und nicht sensibilisiert sind für die sprachlichen Belange ihrer Schülerinnen und Schüler. 59,4% der Studierenden erreichen den Mindeststandard an DaZ-Kompetenz und nur 13,4% gehören zu den informierten Studierenden, die aus Expertensicht ein wünschenswertes Niveau an DaZ-Kompetenz aufweisen. Die Ergebnisse zu den Einstellungen weisen darauf hin, dass 75% der befragten Studierenden sprachsensible Überzeugungen in Bezug auf Fachunterricht haben. 82% der Studierenden fühlen sich zuständig für Sprachförderung, wohingegen nur 58% der Studierenden Wertschätzung für die Herkunftssprachen der Schülerinnen und Schüler zeigt. Betrachtet man nun den Zusammenhang zwischen den Einstellungen zu Mehrsprachigkeit der Studierenden und der DaZKompetenz, so zeigt sich, dass Studierende, die den Mindeststandard erreichen über positivere Einstellungen zu Mehrsprachigkeit verfügen als Studierende, die unter dem Mindeststandard bleiben. In weiteren Schritten muss nun noch analysiert werden, welche Lerngelegenheiten sich besonders eignen, um die Standards zu erreichen. Universitäre Lerngelegenheiten und Kompetenzen von angehenden Lehrkräften im Bereich Deutsch als Zweitsprache Fränze Sophie Wagner, Jennifer Paetsch, Annkathrin Darsow Humboldt-Universität zu Berlin Da neben dem sozioökonomischen Status der Familie und dem Bildungshintergrund der Eltern auch unzureichende Zweitsprachkenntnisse für den durchschnittlich geringeren Bildungserfolg von Schülerinnen und Schülern aus zugewanderten Familien verantwortlich gemacht werden (Stanat, Rauch, Segeritz 2010), wird der Sprachbildung in Kita und Schule ein hoher Stellenwert beigemessen. Universitäten stehen deshalb vor der Herausforderung, die angehenden Lehrkräfte in den Bereichen Sprachbildung und Deutsch als Zweitsprache (DaZ) auszubilden. In Deutschland sind noch nicht in allen Bundesländern universitäre Lerngelegenheiten in den Bereichen Sprachbildung und DaZ fester Bestandteil der Lehrkräfteausbildung. Wie eine aktuelle Studie zeigt, unterscheiden sich die Ausbildungselemente sehr stark zwischen den Bundesländern und auch zwischen einzelnen Universitäten (Baumann & Becker-Mrotzek, 2014). Dies überrascht kaum, denn auch wenn unumstritten ist, dass alle Lehramtsstudierenden in diesen Bereichen qualifiziert werden müssen, stehen die theoretische Modellierung und empirische Überprüfung von Kompetenzen im Bereich DaZ noch am Anfang. In Anlehnung an Befunde der Unterrichtsforschung wird auch in der Lehrerbildungsforschung angenommen, dass der Kompetenzerwerb angehender Lehrkräfte durch den Umfang an universitären Lerngelegenheiten beeinflusst wird (z.B. Kleickmann & Anders 2011; König, Blömeke & Kaiser, 2010). So konnten Blömeke et al. (2010) in ihrer international vergleichenden Untersuchung für das Fach Mathematik zeigen, dass der Umfang an Lerngelegenheiten signifikant positiv sowohl mit dem fachlichen Wissen als auch mit dem didaktischen Wissen der angehenden Lehrkräfte zusammenhängt. Bei Betrachtung von Lerngelegenheiten lässt sich eine Unterscheidung nach dem inhaltlichen Umfang, der ein Hinweis auf die Breite der Ausbildung ist, und dem zeitlichen Umfang, der ein Hinweis auf die Tiefe der Ausbildung ist, treffen. Dabei wird angenommen, dass diese beiden Merkmale in einem engen Zusammenhang stehen (Blömeke et al., 2010): Wenn mehr Zeit für die Ausbildung in einem Themenbereich zur Verfügung steht können hier auch mehr Inhalte vermittelt werden. Zum Zusammenhang von universitären Lerngelegenheiten mit Kompetenzen von Lehramtsstudie-renden im Bereich DaZ liegen bisher keine belastbaren empirischen Ergebnisse vor. Ziel dieses Bei-trags ist es deshalb, den Zusammenhang der DaZKompetenzen der Studierenden mit ihren universitären Lerngelegenheiten im Bereich DaZ näher zu untersuchen. Dabei wird erwartet, dass Kompetenzunterschiede zwischen Bachelor- und Master-Studierenden aufgrund der Unterschiede im Umfang der besuchten Lehrveranstaltungen in den DaZ-Modulen festzustellen sind. Zudem wird untersucht, inwieweit der von den Studierenden selbst angegebene Umfang an Lerngelegenheiten zu bestimmten DaZ-Themen mit ihren Leistungen zusammenhängt. Die Daten wurden in 2015 im Rahmen des Projektes Sprachen-Bilden-Chancen: Innovationen für das Berliner Lehramt erhoben. Das DaZ-Modul der Berliner Universitäten vermittelt Basiskenntnisse sowie fachspezifische Kompetenzen bei einem Umfang von je 3 ECTS im Bachelor mit Lehramtsoption und im Master of Education. Die DaZ-Kompetenzen der Studierenden (N=134) wurden mit dem standardisierten Test „DaZKom“ (Köker et al., in Druck) erfasst. Zudem wurde ein Fragebogen zur Erfassung der themenspezifischen Lerngelegenheiten und der Zufriedenheit mit dem DaZ-Modul eingesetzt. Die untersuchte Stichprobe setzt sich aus 60 Bachelor- und 70 Masterstudierenden unterschiedlicher Lehramtsstudiengänge aus drei Berliner Universitäten zusammen. Das mittlere Alter liegt bei 27,3 Jahren (SD=4,4). Eine RaschSkalierung der Tests erfolgte auf Grundlage der Daten der Gesamtstichprobe. Als Schätzer für die Fähigkeitsparameter wurden Warm's Mean Weighted Likelihood Estimates (WLE) gebildet. Die Reliabilität (Kuder-Richardson-Formula 20) des DaZKomTestes beträgt r = .84. Erste Ergebnisse zeigen, dass sich die Bachelor- und Masterstudierenden in den DaZ-Kompetenzen nicht unterscheiden. Es ließen sich jedoch Zusammenhänge zwischen den von den Studierenden selbst berichteten Lerngelegenheiten (z.B. zu den Themen Linguistik, Migration und Mehrsprachig-keit, Scaffolding) und ihren Leistungen im DaZKom-Test feststellen. In weitergehenden Analysen sollen zusätzlich die berichteten außeruniversitären Lerngelegenheiten und die Zufriedenheit der Studierenden mit der Lehre im DaZ-Modul als Kontrollvariablen einbezogen werden. Finnish Teachers’ Knowledge about Linguistically and Culturally Responsive Teaching Emmanuel O. Acquah1, Jenni Alisaari1, Tuija Niemi1, Nancy Commins2 1 Department of Teacher Education, University of Turku, 2University of Colorado Denver and University of Turku Objectives: Examine notions of diversity and diverse learners among practicing and beginning teachers in 3 contexts in Finland: an ethnically & culturally diverse teacher training school, 5 other schools in the municipality; and teacher trainees at the beginning of their studies, and responses of a smaller group of trainees who participated in an interactive 6 week on line module on second language acquisition developed in the U.S.. This paper will compare and contrast the patterns in the data among the three groups and relate them to the learning of module participants. Theoretical Framework: Finland’s education system is viewed as highly effective, based on the level of student performance in international comparisons (PISA, 2003, 2006), as well as parity in achievement in terms of sex, domicile, and socio-economic background (Kivirauma & Ruoho, 2007). Soilamo (2008) however found that Finnish teachers do not have the appropriate knowledge base and strategies to address the needs of multilingual learners. Itkonen and Jahnukainen, (2007) suggest that increasing diversity is resulting in growing gaps in achievement between immigrants and native Finnish students. To address these gaps Finnish teachers need a grounding in both linguistically (Lucas & Villegas, 2013) and culturally responsive practices (Gay, 2010). Methods and Data Sources: In three different contexts, 400 participants completed questionnaires with both open and closed ended questions regarding their awareness of and ability to use strategies for teaching students learning content and literacy through their second (or third) languages. Informants were asked to rate their levels of knowledge and skill on a six-point Likert-type scale as follows: 1= extremely low to 6= extremely high. Open-ended question solicited teachers’ understanding of how to support multilingual learners and in what areas they felt they would need support. Quantitative data were analyzed using SPSS Statistics for descriptive statistics and frequencies. Multilevel analysis including MANOVA and Cluster analysis were used to identify profiles of teachers and examine associations between awareness of diversity and strategies for teaching. Qualitative data were analyzed by coding and creating categories based on participants’ responses (Corbin & Strauss, 2008). On-line postings of 5 teacher trainees who participated in the second language acquisition module were analyzed qualitatively by focusing on the categories found in the analysis of the open-ended questions in questionnaires. Results: Data from the teacher training school suggest that most teachers were highly aware that academic outcomes of their diverse learners were influenced by factors related to language, culture, race, and ethnicity. However even veteran teachers did not have in-depth knowledge about strategies that could help them work successfully with this population. In particular, they were unfamiliar with ways to use learners’ prior knowledge and experiences as well as their linguistic resources. Results from teachers in the broader municipality suggest that they had comparatively lower awareness and less knowledge of specific strategies. Beginning teachers reported the lowest levels of awareness despite having what appeared to be a positive attitude toward culturally responsive pedagogy. Initial findings from the online course suggest that even short term interventions can help build beginning teachers’ awareness of linguistically and culturally responsive teaching. Scholarly Significance: The findings provide insight into aspects of teachers’ knowledge about both the linguistic and cultural needs of their students, as well as what constitutes a repertoire of approaches and strategies to assure students’ academic success. These findings supports the development of the Competency Based model and can be used to frame the studies of preservice teachers, as well as the professional development of practicing teachers in nations facing demographic shifts and increasing student diversity. Teacher Ideologies and Perspectives on Multilingual Learners (MLLs) and Multilingualism Expressed in Online Professional Development Kara Viesca University of Colorado Denver, USA Pettit (2011) conducted a comprehensive review of the literature regarding teacher’s beliefs about MLLs in mainstream classrooms and suggested that teachers of MLLs in content classrooms should have beliefs that include high expectations for MLLs, personal responsibility for MLL learning, value of home languages for both home and school, acceptance of the time second language acquisition requires, particularly for academic language, and motivation to continue professional learning regarding working with MLLs. Pettit also called for future research focused on changing teachers’ beliefs and the association between beliefs and practices. This study seeks to identify teacher beliefs and attitudes in relation to those defined as necessary in the literature as well as any changes to those beliefs and attitudes that occur through participating in online professional learning. Grounded in the theory of holistic bilingualism (Grosjean, 1989) that argues that bilingualism/multilingualism exists as a unified whole within individuals rather than something that can be de-composed into two (or more) separate parts and building off of the more recent work representing the multilingual turn in second language acquisition and languaging/translanguaging (e.g. García, 2009; García & Wei, 2014; Ortega, 2013), this study examined teacher ideologies and perspectives. Frame analysis (Goffman, 1974; Oliver & Johnston, 2000) and e-ethnography (Poynter, 2010) were utilized through a document analysis drawing from the work of qualitative media researchers Altheide and Schneider (2013). This study identified the frames, messages, and imbued ideologies within and across the teacher created digital documents to understand both the ideologies and perspectives demonstrated through the engagement with online professional learning as well as the changes that did (or did not) occur. The digital documents that were analyzed include the online postings within threaded discussion as well as learning artifacts related to the learning content of the professional learning module submitted by teacher participants. Across ten different modules that strive to promote similar learning outcomes, from Spring 2013-Summer 2015, 24 groups of teachers participated (n = 160) and contributed digital documents for analysis (~600 digital documents). The findings suggest that changes did appear to occur within the course of the online professional learning related to teacher perceptions of bilingualism and the value of home languages in home and school. Teachers appear to have largely started the professional learning already motivated to advance their professional learning as well as feeling responsible for MLL learning in their classes. However, the instances of little to no change in ideologies or perspectives towards desired attitudes and beliefs often were grounded in frames supported by staunch assimilationist and standard language ideologies. Due to the changes that were seen in the data, this study suggests that the online professional learning does offer positive opportunities to impact teacher ideologies and perspectives regarding multilingual learners and multilingualism. However, due to the changes that were also not seen in the data, further research is necessary to examine the relationship of teacher held assimilationist and standard language ideologies on the learning opportunities of multilingual students as well as the ability for those ideologies to be shifted. ID: 287 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Motivation und Emotion, Vorschulische Bildung Stichworte: frühe Kindheit, Jugendalter, häusliche Lernumwelt, soziale Kompetenzen, Lern- und Leistungszielorientierung Langfristige Effekte kindlicher Entwicklungen und Bildungserfahrungen - aktuelle Befunde der Längsschnittstudien BiKSplus[3-13] und [8-18] Chair(s): Simone Lehrl (Otto-Friedrich-Universität Bamberg) Diskutant(en): Marcus Hasselhorn (DIPF Frankfurt) Wie entwickeln sich schulrelevante Kompetenzen und welche Rolle spielen dabei Elternhaus, Kindergarten und Schule? Diese Fragestellungen waren Ausgangspunkt der 2005 ins Leben gerufenen Längsschnittstudien Bildungsprozesse, Kompetenzentwicklungen und Selektionsentscheidungen im Vorschul- und Schulalter 3-10 und 8-14. Bislang konnte z.B. gezeigt werden, dass soziale Disparitäten des Kompetenzerwerbs schon im Alter von 3 Jahren nachweisbar sind (Weinert et al., 2010), dass die Erfahrungen von Kindern in den Lernumwelten Familie, Kindergarten und Grundschule hinsichtlich ihrer Qualität der Interaktionen stark variieren (Kuger & Kluczniok, 2008; Lehrl, 2013; Große et al., 2015), dass die Qualität in Kindergarten und Familie im Alter zwischen 3 und 6 Jahren eine bedeutende Rolle bei der Erklärung von Kompetenzunterschieden im mathematischen und sprachlichen Bereich spielt (Anders et al., 2012; Ebert et al., 2013) und Effekte der Kindergartenqualität für den mathematischen Bereich sogar noch am Ende der Grundschulzeit nachweisbar sind (Lehrl et al., 2015). Darüber hinaus konnte für den Altersbereich zwischen Grund- und Sekundarschule gezeigt werden, dass sich Lesekompetenzen im mehrgliedrigen Schulsystem differentiell entwickeln und den individuellen Eingangsvoraussetzungen aus der Grundschulzeit dabei eine bedeutsame Rolle zukommt (Pfost et al., 2010). Im Fokus der Studien standen dabei nicht nur akademische Kompetenzen, sondern auch soziale, emotionale und motivationale Aspekte (Schurz et al., 2014; von Maurice et al., 2013; Richter & Lehrl, in Druck; Rose et al., in Druck). Offene Fragen der beiden Längsschnittstudien betreffen insbesondere die langfristigen Effekte früher Kompetenzen und Bildungserfahrungen, die Frage nach kumulativen Lernumwelterfahrungen sowie das Zusammenspiel akademischer und sozial-emotionaler Kompetenzen. Hier setzt das vorliegende Symposium an und stellt Arbeiten aus den beiden Anschlussprojekten BiKSplus[3-13] und [8-18] vor. Die ersten drei Beiträge beruhen auf Daten der Längsschnittstudie BiKSplus [3-13]. Rose, Lehrl und Weinert untersuchen das Zusammenspiel sprachlicher und sozialer Kompetenzen im Alter zwischen 4 und 8 Jahren und die Bedeutung der häuslichen Lernumwelt in diesem Gefüge. Der Beitrag von Lehrl, Mursin und Roßbach thematisiert die Bedeutsamkeit der frühen Lernumwelten Kindergarten und Familie für die mathematischen Kompetenzen im Alter von 12 Jahren. Blaurock, Große und Roßbach, untersuchen die Erfahrungen von Kindern im Alter zwischen 3 und 12 Jahren in außerschulischen Lernorten. Dabei wird der Frage nachgegangen, inwiefern sich bei den Kindern spezifische Aktivitätenprofile zeigen und wie sich diese über die Zeit ändern. Auf Grundlage der Daten der Längsschnittstudie BiKSplus[8-18] untersuchen Becker, Schiefer und Artelt die Entwicklung von Zielorientierungen nach dem Übergang ins duale Ausbildungssystem und die Bedeutung früherer Leistungszielorientierungen zu Beginn der Sekundarschulzeit. Abschließend werden die Beiträge von Marcus Hasselhorn diskutiert. Beiträge des Symposiums Die Bedeutung der häuslichen Lernumwelt für das Zusammenspiel zwischen sprachlicher und sozialemotionaler Entwicklung vom vierten bis zum achten Lebensjahr Elisabeth Rose, Simone Lehrl, Sabine Weinert Otto-Friedrich-Universität Bamberg Sprachliche Kompetenzen bilden eine wichtige Grundlage für die Sozialentwicklung. Diese Annahme wird empirisch durch Zusammenhänge zwischen Defiziten in der Sprachentwicklung und negativ auffallendem Sozialverhalten der Kinder gestützt (Stowe, Arnold & Ortiz, 2000). Beispielsweise gehen geringere sprachliche Kompetenzen mit geringeren Fremdeinschätzungen des prosozialen Verhaltens einher (Cassidy, Werner, Rouke & Zubernis, 2003), bilden einen Risikofaktor für aggressives Verhalten (Brownlie et al., 2004) und führen zu einer schlechteren Einbindung in die Peer-Group (Durkin & Conti-Ramsden, 2007). Im längsschnittlichen Entwicklungsverlauf findet sich dabei ein gerichteter Wirkzusammenhang: Im Alter zwischen drei und sieben Jahren sind die frühen sprachlichen Kompetenzen kurz nach Eintritt in den Kindergarten prädiktiv für die Veränderungen im kooperativen Umgang, im aggressiven Verhalten sowie der emotionalen Selbstregulation, nicht aber umgekehrt (Rose, Ebert & Weinert, in Druck). Bei der Frage nach Erklärungsmechanismen, die dem Zusammenspiel zwischen sprachlichen und sozial-emotionalen Kompetenzen zugrunde liegen, liegt – neben direkten Zusammenhängen über sprachliche Kommunikationsprozesse – auch als vermittelnde Drittvariable die Rolle der Eltern als primäre Sozialisationsinstanz auf der Hand: Es wird immer wieder betont, dass sich domänenübergreifende Prozessmerkmale der Familie, wie das Familienklima oder die sprachliche Anregung durch die Eltern – oft zusammengefasst als häusliche Lernumwelt – sowohl auf die soziale als auch auf die sprachliche Entwicklung des Kindes auswirken. Beispielsweise zeigten Foster und Kollegen (2005), dass regelmäßiges gemeinsames Vorlesen nicht nur den Sprachzuwachs der Kinder begünstigt, sondern auch deren Sozialverhalten positiv beeinflusst. Dennoch wurde bis dato kaum erforscht, ob und inwiefern sich die häusliche Lernumwelt auf den Zusammenhang zwischen frühen sprachlichen Kompetenzen und verschiedenen Facetten späterer sozial-emotionaler Kompetenzen auswirkt. Auf Grundlage der Längsschnittstudie BiKS-3-10 wird das genaue Zusammenspiel zwischen der häuslichen Lernumwelt, operationalisiert anhand eines Globalindikators, der sowohl ein Beobachtungsmaß der sprachlichen Interaktion als auch Interview-Fragen zum Zugang zu Büchern beinhaltet, den frühen sprachlichen Kompetenzen zu Beginn des Kindergartenbesuchs sowie der Entwicklung von drei Facetten sozial-emotionaler Kompetenzen – dem kooperativen Umgang mit andern Kindern, der emotionalen Selbstregulation sowie des aggressiven Verhaltens – über den Zeitraum von vier Jahren analysiert. Vorläufige Befunde zeigen, dass die häusliche Lernumwelt prädiktiv für die sprachlichen, nicht aber für die sozialen Kompetenzen im Alter von drei Jahren ist. Allerdings moderiert die häusliche Lernumwelt den Zusammenhang zwischen frühen sprachlichen Kompetenzen und der Entwicklung der sozial-emotionalen Kompetenzen über den Zeitraum von vier Jahren, selbst wenn relevante Kontrollvariablen (wie z. B. der sozio-ökonomische Hintergrund oder die non-verbalen kognitiven Fähigkeiten) berücksichtigt werden. Dabei zeigt sich, dass der Zusammenhang zwischen Sprache und sozio-emotionaler Entwicklung bei den Kindern, die eine bessere häusliche Lernumwelt erfahren, stärker ausfällt. Die Ergebnisse werden mit Blick auf mögliche Wirkzusammenhänge und praktische Implikationen diskutiert. Effekte früher Lernumwelten in Kindergarten und Familie auf mathematische Kompetenzen im Jugendalter Simone Lehrl1, Katharina Mursin1, Hans-Günther Roßbach2 1 Otto-Friedrich-Universität Bamberg, 2Leibniz-Institut für Bildungsverlaufforschung Relevanz und theoretischer Hintergrund: Schon vor dem Schuleintritt machen Kinder umfassende Erfahrungen mit mathematischen Inhalten. Dazu gehören z.B. das Abzählen von Gegenständen, der Vergleich von Mengen, Wiegen und Messen unterschiedlicher Gegenstände oder Personen sowie einfache Rechenoperationen. Je nach Häufigkeit dieser Aktivitäten in den Lernumwelten Familie und Kindergarten machen Kinder somit ganz unterschiedliche Erfahrungen mit mathematischen Inhalten bereits vor der Einschulung. Dass diese Unterschiede bedeutsam bei der Vorhersage mathematischer Kompetenzen im Vorschulalter und teilweise darüber hinaus bis zum Ende der Grundschulzeit sind, konnte in einigen Studien gezeigt werden (Niklas & Schneider, 2014; Anders et al., 2012; Lehrl et al., 2015). In einer der wenigen, über die Grundschulzeit hinausreichenden Studien, konnte auf Grundlage der Daten der NICHD-Studie gezeigt werden, dass Effekte der Kindergartenqualität, vermittelt über frühe Kompetenzen im Kindergarten- und Grundschulalter, noch im Alter von 15 Jahren nachweisbar sind (Vandell et al., 2010). Auf ähnliche Zusammenhänge deuten die Befunde der EPPSE-Studie aus England (Sylva et al., 2014). Für eine deutsche Stichprobe wurden über einen ähnlich langen Zeitraum bislang keine Daten gesammelt. Die Befunde zur frühen häuslichen Lernumwelt deuten eher in die Richtung, dass diese die Kompetenzen der Kinder schon sehr früh beeinflussen und darüber hinaus keine Effekte mehr zeigen (Sylva et al., 2014; Anders et al., 2012), gleichwohl auch Befunde bestehen, die darauf deuten, dass die häusliche Lernumwelt nicht nur den Entwicklungsstand in mathematischen Kompetenzen zu einem frühen Zeitpunkt, sondern auch dessen Entwicklungsverlauf bis in die Grundschulzeit vorhersagt (Niklas & Schneider, 2014). Damit ist die Befundlage für den deutschsprachigen Raum nicht nur insgesamt unzureichend sondern auch heterogen. Darüber hinaus besteht wenig empirische Evidenz zum Zusammenspiel der verschiedenen, über die Altersspanne von Kindergarten zum Jugendalter durchlaufenen Lernumwelten bei der Vorhersage mathematischer Kompetenzen im Jugendalter. Fragestellung: Im vorliegenden Beitrag wird daher der Frage nachgegangen, inwiefern Qualitätserfahrungen in den Lernumwelten Familie und Kindergarten im Kindergartenalter für mathematische Kompetenzen im Jugendalter relevant sind und welche Rolle dabei die mathematischen Kompetenzen im Vorschul- und Grundschulalter spielen. Darüber hinaus wird geprüft, ob subgruppenspezifische Effekte (z.B. Kinder mit Migrationshintergrund) vorliegen. Methode: Datengrundlage ist die Längsschnittstudie BiKS 3-10 und die Anschlussstudie BiKSplus[3-13], welche (ursprünglich) 554 Kinder aus 97 Kindergärten in Bayern und Hessen im Alterszeitraum von 3 – 13 Jahren begleitet. Die mathematischen Kompetenzen wurden im Alter von 12 Jahren mittels eines erstmals für NEPS entwickelten standardisierten Tests in einer Einzeltestung erfasst. Der Indikator für die häusliche Lernumwelt beinhaltet Angaben der Eltern z.B. zum Buchbesitz, Häufigkeit des gemeinsamen Vorlesens und Vorhandensein von Spielmaterial sowie Aspekte der Qualität der ElternKind-Interaktion, erfasst während der Beobachtung einer halbstandardisierten Vorlesesituation zwischen dem Elternteil und dem Kind. Die Qualität des Kindergartens wird in der vorliegenden Studie mit der Skala „Mathematik“ der KES-E berücksichtigt. Hierbei handelt es sich um ein Rating-Verfahren, welches während einer mehrstündigen Beobachtung in den Kindergärten zum Einsatz kam. Ergebnisse: Mit Hilfe von Pfadmodellen kann gezeigt werden, dass die Kindergartenqualität unter Kontrolle von familiären Hintergrundmerkmalen die mathematischen Kompetenzen im Alter von 12 Jahren vorhersagt. Diese Effekte werden teilweise durch die mathematischen Kompetenzen im Grundschulalter mediiert. Darüber hinaus zeigen sich der Migrationshintergrund des Kindes als auch die mütterliche Bildung in der Richtung als prädiktiv für die mathematischen Kompetenzen im Alter von 12 Jahren, dass Kinder mit Migrationshintergrund und geringerer mütterlicher Bildung auch unter Kontrolle der frühen mathematischen Kompetenzen, schlechtere Werte aufweisen. Die frühe häusliche Lernumwelt ist nicht bedeutsam mit den mathematischen Kompetenzen assoziiert. Die Ergebnisse werden vor dem Hintergrund der Bedeutung früher, qualitativ hochwertiger institutioneller Betreuung und unterschiedlicher Bildungschancen diskutiert. Kumulative Erfahrungen in außerschulischen Lernumwelten von der frühen Kindheit bis ins frühe Jugendalter Sabine Blaurock1, Christiane Große1, Hans-Günther Roßbach2 1 Otto-Friedrich-Universität Bamberg, 2Leibniz-Institut für Bildungsverlaufforschung Die Jugend der Gegenwart bewerkstelligt nicht nur „schulbezogene Laufbahnen und Abschlüsse“ (Zinnecker, 1991, 10), sondern parallel auch „außerschulische Karrieren“ (ebd., 10). Die ‚neue‘ Jugendphase zeichnet sich demnach durch den Erwerb von Bildungstiteln im Besonderen und von kulturellem Kapital (Bourdieu) im Allgemeinen aus, welche eine gute Ausgangslage für die spätere berufliche Position (Stecher, 2005) und gesellschaftliche Teilhabe begünstigen sollen. Für die spezifische und ausgedehnte Phase des Bildungserwerbs prägte Zinnecker (Zinnecker, 1991; Zinnecker & Stecher, 1996) die Begrifflichkeit „Jugend als Bildungsmoratorium“. Vor diesem Hintergrund weitet sich die bildungspolitische Diskussion um eine ungleiche Inanspruchnahme von Bildungsangeboten zunehmend auch auf außerschulische Lerngelegenheiten, in- und außerhalb der Familie, aus. Nach Bourdieus theoretischem Ansatz (Bourdieu, 1982) spiegelt sich das in einer Familie kumulierte Kapital in schichtspezifischen Bildungs- und Erziehungsstrategien wider und wird generationenübergreifend weitergegeben. Insbesondere das Kulturkapital wird durch familiale Alltagspraxen vermittelt (Becker, 2010; Klein & Biedinger, 2009), wobei diese oftmals nicht intentional bildungsorientiert ablaufen (Büchner & Brake 2006). Gezielte bildungsbezogenen Anstrengungen von Eltern werden hingegen unter dem Begriff „concerted cultivation“ zusammengefasst (Lareau 2003; von der Hagen-Demszky 2011), worunter z.B. Bemühungen von Eltern verstanden, die Inanspruchnahme von Freizeit- und Förderangeboten ihrer Kinder zu organisieren. Ergebnisse der BiKS-Studie haben bereits gezeigt, dass der familiale Hintergrund nur geringfügig mit der Intensität außerschulischer Aktivitäten zusammenhängt (Mudiappa & Kluczniok 2012; Blaurock, 2015). Außerschulische Lerngelegenheiten stellen somit ein kompensatorisches Potenzial für Kinder dar, die geringere Anregungen im Familien- oder Schulkontext erfahren. Einige Studien heben die Relevanz des Typs der Aktivität (z. B. Eccles et al., 2003) und der unterschiedlichen Teilnahmeprofile hinsichtlich der einzelnen Angebote hervor (Fischer & Theis, 2014), die möglicherweise eine differenzielle akademische und non-kognitive Entwicklung fördern. Insgesamt ist die Befundlage der über die Lebensspanne kumulativ gewonnenen außerschulischen Erfahrungen jedoch relativ schmal. Der vorliegende Beitrag geht daher den Fragen nach, - ob verschiedene Kindheitsprofile in Bezug auf non-formale und informelle außerschulische Bildungserfahrungen über die Kindergarten- und Grundschulzeit hinweg identifiziert werden können. - welche Profile im Sinne des „Bildungsmoratoriums“ wiederum häufige außerschulische Erfahrungen im frühen Jugendalter vorhersagen können. Datengrundlage ist die Längsschnittstudie BiKS 3-10 und die Anschlussstudie BiKSplus[3-13]. Die Häufigkeit der außerschulischen Aktivitäten wurde über die gesamte Kindergarten- und Grundschulzeit jährlich in der Elternbefragung, in der 7. Klassenstufe mit dem SchülerInnen-Fragebogen erfasst. Erfragt wurden einerseits informelle, kulturelle Aktivitäten innerhalb der Familie (der Besuch von Theater, Museum, Bücherei und Zoo), andererseits non-formale, organisierten Aktivitäten außerhalb der Familie (z. B. Mitgliedschaft im Sportverein, Musikunterricht). Erste Ergebnisse der Klassenanalysen zeigen für informelle und non-formale Aktivitäten unterschiedliche Kindheitsprofile. Häufige informelle Aktivitäten im Jugendalter scheinen unabhängig von der Häufigkeit der Aktivitäten im Kindergartenalter zu sein, sofern in der Grundschulzeit häufig informelle, kulturelle Aktivitäten wahrgenommen werden. Jugendliche des Profils mit der höchsten Aktivitätenhäufigkeit nehmen noch zu Beginn der Kindergartenzeit vergleichsweise selten non-formale Aktivitäten wahr, wobei diese kontinuierlich über die Grundschulzeit ansteigen. Im Vergleich üben die Jugendlichen des Profils mit der höchsten Aktivitätenhäufigkeit im Kindergartenalter, weniger Aktivitäten im Grundschulalter und Jugendalter aus. Die Kindheitsprofile unterscheiden sich in der Intensität außerschulischer Erfahrungen im Jugendalter sowohl bei non-formalen, organisierten Aktivitäten außerhalb der Familie (F(2,101)=7.551, p=.001) als auch bei informelle, kulturellen Aktivitäten innerhalb der Familie (F(2,84)=9.009, p=.000) signifikant voneinander. Anhand der Ergebnisse wird deutlich, dass eine Differenzierung sowohl zwischen den Aktivitäten als auch zwischen den unterschiedlichen Kindheitsprofilen im Zeitverlauf sinnvoll ist, um den Stand der kulturellen Bildung und gesellschaftlichen Teilhabe im Jugendalter zu ermitteln. Laufende latente Transitions-Analysen und Pfadanalysen sollen differenzierteren Aufschluss darüber geben, wie sich die Kindheitsprofile im Kindergarten, - Grundschul- und Jugendalter zusammensetzen und warum sie sich aus längsschnittlicher Perspektive möglicherweise neu formieren. Entwicklung von Zielorientierungen nach dem Übergang ins duale Ausbildungssystem Sarah Becker, Irene Schiefer, Cordula Artelt Otto-Friedrich-Universität Bamberg Zielorientierungen, im Sinne von Lern- und Leistungszielen, sind wichtige motivationale Determinanten bezogen auf das Lernund Leistungsverhalten von Kindern und Jugendlichen im Schulalltag (Harackiewicz, Barron, Carter, Lehto, & Elliot, 1997; Wolters, 2004). Lernzielorientierung meint dabei die Erweiterung eigener Kompetenzen, wohingegen Leistungszielorientierung mit dem Präsentieren eigener Fähigkeiten assoziiert ist. Weitere Studien zeigen, dass sich besonders eine hohe Lernzielorientierung positiv auf motivationale und emotionale Konstrukte wie z.B. intrinsische Motivation (Spinath & Steinmayr, 2012), positive Affekte (Huang, 2011) und höheres Interesse bezogen auf den Lerngegenstand (Hulleman, Durik, Schweigert, & Harackiewicz, 2008) auswirkt. Studien zu Zielorientierungen finden häufig im Kontext von Schule oder Studium statt. Inwiefern sich Zielorientierungen bei Jugendlichen nach dem Übergang vom allgemeinbildenden Schul- ins duale Ausbildungssystem verhalten, wurde hingegen kaum untersucht. Auch der Vergleich der Zielorientierungen von gleichaltrigen Jugendlichen, die sich entweder im Ausbildungssystem oder in den höheren Klassen des allgemeinbildenden Schulsystems befinden, wird selten berichtet. Der Übergang vom allgemeinbildenden Schulsystem in das duale Ausbildungssystem ist mit vielen Veränderungen verbunden. Unter anderem haben Jugendliche nun die Chance, ihren weiteren beruflichen Weg entsprechend ihrer Kompetenzen und Interessen selbst zu wählen. Innerhalb der beruflichen Ausbildung ist es Ziel, die eigenen Kompetenzen bezogen auf den zu erlernenden Beruf weiter zu entwickeln. Altersgenossen, die weiterhin das allgemeinbildende Schulsystem besuchen, mit dem Ziel das (Fach-)Abitur zu erreichen, haben hingegen deutlich weniger interessens- und kompetenzorientierte Wahlmöglichkeiten, da sie an die vorgegebene Fächerauswahl gebunden sind. Der Fokus liegt hier vorrangig auf dem Erbringen von Leistungen, um einen guten Abschluss zu erreichen. Der Vergleich der beiden Ausbildungssituationen führt zu der Frage, ob Jugendliche im Ausbildungssystem höhere Lernzielorientierungen und ihre Altersgenossen im allgemeinbildenden Schulsystem höhere Leistungszielorientierungen zeigen. Im vorliegenden Beitrag werden Lern- und Leistungsziele in Abhängigkeit der momentanen Ausbildungssituation (Allgemeinbildendes Schulsystem vs. Ausbildung) verglichen. Als Grundlage dafür dient die Stichprobe der längsschnittlichen BiKS-Studie[8-14] bzw. BiKSplus[8-18]-Studie. Im Rahmen der BiKS-Studie wurden jährlich Daten von Schülerinnen und Schülern seit der 3. Klasse zu Bildungsprozessen, Kompetenzentwicklung und Selektionsentscheidungen in den Bundesländern Bayern und Hessen erhoben. Für den vorliegenden Beitrag wurden Daten von N = 943 Schülerinnen und Schülern, bzw. Auszubildenden zu drei Messzeitpunkten in den Klassen 5 (Messzeitpunkt 4), 6 (Messzeitpunkt 5) und 11 bzw. im ersten Ausbildungsjahr (Messzeitpunkt 9) analysiert. Verglichen wurden die Daten von N=139 Azubis und N=804 Schülerinnen und Schülern im allgemeinbildenden Schulsystem (Gesamtschulen, Gymnasien, Fachoberschulen, berufliche Gymnasien). Zielorientierungen wurden mit Hilfe der Skalen zur Erfassung der Lern- und Leistungsmotivation „SELLMO“ (Spinath, Stiensmeier-Pelster, Schöne, & Dickhäuser, 2012) erfasst. Eine Varianzanalyse zeigt signifikante Unterschiede der Lern- und Leistungszielorientierung zum neunten Messzeitpunkt in den Gruppen der Auszubildenden und der gleichaltrigen Studienteilnehmer, die sich noch im allgemeinbildenden Schulsystem befinden. Dabei zeigen Auszubildende deutliche höhere Werte sowohl bei Lern- (F(1,943) =19,07, p < .00), als auch bei Leistungszielen (F(1,943) = 40,63, p < .00). Betrachtet man die Lern- und Leistungszielorientierungen beider Gruppen zu den Messzeitpunkten in den Klassen 5 und 6 lassen sich hingegen keine signifikanten Unterschiede zeigen. Weitere Analysen der Zielorientierungen innerhalb der Gruppe der Auszubildenden zeigen, dass sich keine signifikanten Unterschiede bezogen auf die Schulform finden lassen, die die Jugendlichen vor dem Wechsel ins duale Ausbildungssystem besucht haben. Des Weiteren lassen sich positive Zusammenhänge der Lernzielorientierung mit soziopsychologischen Konzepten wie Lebenszufriedenheit, Selbstwirksamkeit und Zielbindung bezogen auf die berufliche Zukunft finden. Der Eintritt in das Ausbildungssystem scheint also generell mit einer Motivationssteigerung, sowohl bezogen auf Lern- als auch auf Leistungsziele, einherzugehen. ID: 289 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie Thematisches Cluster: Bildungsgerechtigkeit/ Migration Stichworte: migrant children, academic adjustment, well-being, protective factors The Academic and Psychosocial Adjustment of Children of Migrant Background: Family and Classroom Protective Factors Chair(s): Linda Juang (University of Potsdam) Diskutant(en): Bernhard Nauck (Technical University of Chemnitz) Children of migrant and refugee background comprise an increasing proportion of the population in Germany and worldwide. Undoubtedly, the success of these children in education, work, and society is crucial not only for them as individuals, but for society as a whole (Masten, Liebkind, & Hernandez, 2012, OECD, 2012). This symposium brings together four presentations that address both the academic and psychosocial adjustment of children of migrant background. Our aim is to emphasize the variation in adjustment of migrant children (not all of them do poorly) and focus on protective factors that can contribute to positive adjustment. Collectively, we adopt an ecological perspective to child development by considering key contexts—family, classroom, school, and culture. The first paper sets the stage by offering an overview of how the acculturation process contributes to the school adjustment of children of migrant backgrounds. The review of studies shows that their school success depends, in part, on how well they can negotiate the acculturation demands of both the family and school. The second presentation focuses on classroom diversity climate among migrant and non-migrant background German school children. The findings show that the messages of cultural diversity that schools promote are linked to students’ attitudes towards one another and, importantly, to students’ perceived discrimination. The third presentation focuses on Chinese American adolescents and perceived discrimination. The study shows that greater family cohesion can buffer (and family conflict can exacerbate) the negative effects of discrimination on adolescent loneliness and somatization, but not grades. The fourth presentation examines father involvement for Turkish and German children who are transitioning into the first grade. The results show that more father involvement predicts greater wellbeing for children, but only for those whose fathers reported higher fathering self-efficacy. Finally, the discussant, a leading sociologist and acculturation researcher, will situate the four studies in the larger societal and global contexts and provide directions for future research for understanding how children of migrant backgrounds can do well. Our symposium brings together presenters of different disciplines from education, psychology, and sociology. We also showcase studies of children of migrant background from Europe and the United States, allowing for a cultural contrast. Two of the presentations use longitudinal data and all four presentations emphasize the important links between family, classroom, school, and cultural contexts to better understand the academic and psychosocial adjustment of children of migrant backgrounds. Beiträge des Symposiums Minority youths’ acculturation and their school adjustment: Successful ways to bridge an acculturation gap Elena Makarova1, Dina Birman2, Judith Gilde1 1 University of Vienna, 2University of Miami Introduction: The discourse on the school failure of immigrant youth and their high risk of school dropout is a pressing topic on researchers’ agendas in many countries (e.g. Lamb, & Markussen, 2011). The academic achievement and psychological adjustment of minority youths is closely linked to the process of their acculturation in the host country (e.g. Garcia-Coll & Marks, 2011). The contextual perspective in research on acculturation has highlighted the importance of addressing youths’ acculturation in particular life domains (Birman, 2011; Trickett & Birman, 2005; Birman et al., 2007; Birman et al., 2013). In the school context, studies have shown discrepancies between teachers’ and minority youths’ acculturation preferences (Makarova & Herzog, 2011; 2013). Within the family context they have revealed the existence of an acculturation gap between immigrant parents and their children (Birman, 2006). Moreover, based on the ecological framework of human development (Bronfenbrenner, 1977), a study by Birman and Espino (2007) highlighted the importance of addressing immigrant youths’ adaptation across family and school life domains as the expectations on youths’ acculturation at home and at school are frequently divergent, making it challenging for youth to manage the conflict between the two. Focus of the study: The increasing number of publications on minority youths’ acculturation is evidence for the rising interest of scholars in this topic. However, there is a lack of systematic review of empirical research with respect to the impact of “acculturative press” (Trickett & Birman, 2005) across school and family domains on youth’s acculturation and school adjustment in the host country. Thus, this study aims to systematize and integrate findings on the effects of teachers’ and parents’ expectations on minority youths’ school adjustment reported in empirical research on minority youths’ acculturation. The study is important to the field as it is the first to provide such a review. Methods: For purposes of this study 348 articles published between 2000 and 2013 in peer-reviewed journals on youths’ acculturation in the database of the Education Resources Information Centre were selected according to inclusion criteria postulated for this study. The articles were analysed by applying the method of qualitative content analysis, using MAXQDA software. The findings presented in the selected articles were analysed and integrated according to a deductively developed and inductively enriched category system. Results: The results of our study indicate that among 72 articles reporting on quantitative research only 2.8% addressed issues of minority youths’ academic achievement and/or their psychological adjustment in relation to teachers’ expectations, while 13.9% did so in relation to parental expectations. In contrast, of the 74 articles reporting on qualitative research, 35.1% addressed issues of minority youths’ academic achievement and/or their psychological adjustment in relation to teachers’ expectations, and 25.7% in relation to parental expectations. These are the focus of the study. Overall, content analysis of the two categories of teachers’ expectations and parents’ expectations addressed in qualitative studies has indicated various ways in which teachers’ and parents’ support or hamper minority youth’ school adjustment. Our results have also shown that youths’ school adjustment is often embedded in an acculturation dilemma shaped by the specific requirements of the family and school domain. Finally, our findings have indicated successful strategies applied by minority youth in order to bridge an acculturation gap between family and school life domains. Two sides of the same coin? Diversity effects on interethnic attitudes and discrimination in multiethnic classrooms Miriam Schwarzenthal1, Maja Schachner1, Fons J. R. van de Vijver2, Linda Juang1 1 University of Potsdam, 2University of Tilburg In 2013, 1 in 3 students in German schools had a migration background (Statistisches Bundesamt, 2014). As this year Germany has welcomed an unprecedented number of refugees, this number will further increase. In order to sustain a peaceful and harmonious society, it is essential to build good intergroup relations between students from diverse cultural groups from an early age. Previous research assessing the impact of structural diversity at school on intergroup relations has produced diverging results (Thijs & Verkuyten, 2014). In order to find out under what conditions positive intergroup relations can be achieved in schools, one needs to look beyond structural diversity and examine how schools deal with this diversity. Two types of cultural diversity climate have been distinguished at school (Schachner, Noack, Van de Vijver, & Eckstein, 2015) – equality and inclusion and cultural pluralism. Equality and inclusion is based on intergroup contact theory (Allport, 1954). Schools pursuing an equality and inclusion approach promote equal treatment of students from different ethnic backgrounds and try to reduce discrimination. However, a mere emphasis on reducing prejudice by promoting equality between cultural groups has been criticized as being “colour-blind”, i.e. neglecting cultural differences, if not complemented by an appreciation of cultural pluralism (Park & Judd, 2005). Cultural pluralism goes beyond the prevention of prejudice and discrimination by valuing diversity as an asset and a resource that can enrich students’ learning. This study goes beyond previous research on the impact of structural diversity and diversity climate on intergroup relations in the following ways: (1) While previous studies have usually focused on either structural diversity or diversity climate, and have not differentiated between equality and cultural pluralism, we include indicators of structural diversity as well as measures of the two types of diversity norms. (2) The impact of context diversity on intergroup outcomes has often been studied separately for majority and minority members, the former focusing on intergroup attitudes, the latter on perceived discrimination as an outcome. In this study, we simultaneously investigate the relation between diversity at school and these two intergroup outcomes in adolescents of immigrant background and ethnic German adolescents. Our sample consists of 1591 6th graders, of whom 965 students had an immigrant background (at least one parent born in a different country, 83 countries of origin). Data were collected as part of a questionnaire study in culturally diverse secondary schools in Baden-Württemberg. The average age of the students was 11.5 years. We applied a multilevel framework, including individual perceptions of diversity norms on level 1, as well as the classroomaggregated perceptions of these norms on level 2. In order to investigate whether relations differ between ethnic German students and students of immigrant background, we treated immigrant background as a moderator. Our results showed that a higher proportion of students of immigrant background was associated with a higher outgroup orientation. As expected, stronger perceived equality norms were associated with higher outgroup orientation. Both perceived equality norms as well as the aggregated equality climate were associated with lower perceived discrimination. Stronger perceived pluralism norms were also associated with a higher outgroup orientation but at the same time more perceived discrimination. Compared to students of immigrant background, ethnic Germans showed higher increases in perceived discrimination, but also in outgroup orientation, when the proportion of adolescents of immigrant background in a classroom was higher. Perceived equality norms were more strongly associated with outgroup orientation for ethnic Germans, whereas they were associated more strongly with lower perceived discrimination for students of immigrant background. The results are discussed with regard to implications for educational research and practitioners. Family as a protective factor for Chinese American adolescents experiencing discrimination Linda Juang1, Alvin Alvarez2 1 University of Potsdam, 2San Francisco State University In the United States, Asian Americans are one of the fastest growing populations, with Chinese Americans comprising the largest portion of this group (Pew Research Social and Demographic Trends, 2012). Cultural/ethnic discrimination is one of the most significant stressors facing adolescents of migrant families, especially those who are ethnic minorities. Berry et al.’s (2006) largescale, cross-national study of migrant adolescents from 13 countries showed that perceived discrimination was by far the strongest predictor of adjustment. Greater perceived discrimination related to poorer psychological (e.g., life satisfaction, selfesteem, psychological distress) and sociocultural (e.g. school adjustment, behavior problems) adaptation. Subsequently, studies of discrimination are vital to understanding migrant adolescent adaptation and integration into the larger society (European Union Agency of Fundamental Rights, 2010) and their more immediate social contexts such as school. Studies of Asian American adolescents show that they report higher levels of peer discrimination compared to their African American and Latino counterparts (Greene, Way, & Pahl, 2006; Rosenbloom & Way, 2004). Thus, this study focuses on the discrimination experiences of Chinese American adolescents. We examine how discrimination is linked to academic adjustment (grade point average, GPA) and psychosocial adjustment (i.e., loneliness and symptomatic distress) and test whether family relations can buffer or exacerbate these links. The sample included 181 Chinese American adolescents and parents (87% mothers) recruited from San Francisco, California. The adolescents’ mean age was 14.8 years (SD = .74), ranged from 13 to 17 years, and 63% were female. A majority (66%) of the adolescents were U.S. born while 29% percent were foreign-born. Descriptives showed that the sample did well academically with a mean grade point average of 3.26 (SD = .52, range 1 to 4 with 4 being the best score). Preliminary analyses also showed that age, migration status, and parent education was related to perceived discrimination. Adolescents who were older perceived greater discrimination (r = .18, p = .01), U.S. born adolescents (M = 1.74, SD = .63) reported less discrimination than foreign-born adolescents (M = 2.10, SD = .72, t (178) = 3.48, p = .001), and parents with higher education had adolescents who reported less discrimination (r = -.20, p = .007). For the main analyses we used hierarchical multiple regression and controlled for adolescent’s age, gender, migrant status, and parent education. The results showed that greater perceived discrimination was related to poorer adjustment in terms of loneliness and symptomatic distress. Discrimination, however, was not related to grade point average. The relations between discrimination and psychosocial adjustment were either exacerbated or buffered by family conflict and cohesion. More specifically, greater family conflict exacerbated the negative effects of discrimination, acting as a vulnerability factor. In contrast, greater family cohesion buffered the negative effects of discrimination, acting as a protective factor. Importantly, at higher levels of discrimination, family interactions matter. Findings highlight the importance of identifying moderators such as family-level characteristics to help adolescents and their families best deal with experiences of discrimination. Doing so moves us beyond targeting only individual-level characteristics (such as developing a stronger ethnic identity or personal coping strategies) in helping adolescents deal with discrimination. Although discrimination at any point of life is hurtful, adolescents may be particularly vulnerable because of the developmental issues that define adolescence (e.g., emerging sense of identity, self-esteem, importance of peers). To effectively address discrimination in the schools, both inside and outside school factors should be considered. Turkish immigrant families: Paternal involvement fosters mothers’ marital satisfaction and children’s well-being Birgit Leyendecker, Alexandru Agache Ruhr Universität Bochum Research on parenting is often focused only on mothers, whereas the role of fathers is often ignored. This is especially true for research on fathers in the context of immigration. Immigrant fathers are often either completely neglected or the focus is on a deficit perspective, e.g., on the loss of social status or other risk factors (Strier & Roer-Strier, 2010). In our project, we were interested in understanding how paternal involvement can promote family cohesion and children’s well-being. Specifically, we examined paternal involvement in parenting, the association between parents’ perception of mutual support, and the relation to their children’s well-being before (T1) and after the transition to first grade (T2). Participants were first and second generation immigrant families from Turkey (n = 135). In addition, German families (n= 45) were included for the comparison of paternal involvement. The percentage of highly involved fathers was higher in the German sample (52%) than the Turkish sample (36%), but we found no influence of parents’ education, household income, employment status, or children’s gender. First generation fathers were more likely to be highly involved than second generation fathers. Analyses of the longitudinal data revealed that mothers with highly involved fathers were more likely to report higher marital support. This pattern was less clear for fathers. Children with highly involved fathers reported significantly higher well-being at T1. For T2, a moderator analysis revealed a positive effect on children’s well-being only for those fathers who were both highly involved and reported the highest fathering self-efficacy. Among other variables, we controlled for children’s well-being at T1, their health status, fathers’ work hours and mothers’ marital satisfaction. ID: 294 Symposium Disziplinen-Cluster: Erziehungswissenschaft Thematisches Cluster: Schulentwicklung, Trainings- und Evaluationsforschung, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Schulinspektion, Qualität, Wirkung Qualität von Schulinspektion Chair(s): Holger Gärtner (Freie Universität Berlin) Diskutant(en): Hans Anand Pant (Humboldt Universität zu Berlin) Schulinspektion entwickelt sich zunehmend zum europäischen Standardverfahren der externen Evaluation von Schulen (Ehren, Perryman & Shackleton, 2014). ). Inspektionen sollen die Qualität von Schulen objektiv feststellen und durch die Rückmeldung ihrer Ergebnisse an verschiedene Akteure Entwicklungsaktivitäten auslösen (Ehren, Altrichter, McNamara & O’Hara, 2013). Schwerpunkte aktueller Inspektionsforschung sind zum einen Fragen von Wirkung und Nebenwirkungen sowie Fragen zur Qualität von Schulinspektionen als diagnostischem Verfahren (Gärtner & Pant, 2011). Im vorliegenden Symposium werden unterschiedliche Aspekte der Qualität von Schulinspektion als diagnostischem Verfahren untersucht. Der erste Beitrag von Kemethofer und Altrichter untersucht die Effekte von Schulinspektion in Abhängigkeit der Rahmenbedingungen, unter denen sie arbeitet. Hierzu nutzen sie Daten einer europäischen Längsschnittstudie. Ihre Ergebnisse deuten darauf hin, dass mit Zunahme des Rechenschaftsdrucks, der innerhalb eines Landes existiert, Schulleitungen nach Inspektionen verstärkt Entwicklungsaktivitäten einleiten, aber auch verstärkt von negativen Nebenwirkungen berichten. Der zweite Beitrag von Vaccaro und Lankes untersucht die einer Schulinspektion zugrundeliegenden Datenquellen. Konkret geht es um die Wahrnehmungen von Lehrkräften, Eltern und Schülerinnen und Schülern ihrer Schule und in wie fern diese Wahrnehmungen übereinstimmen. Erste Ergebnisse belegen eine deutliche Perspektivenabhängigkeit der Wahrnehmung von Schulqualität. Die Beiträge Drei und Vier gehen anhand von Inspektionsdaten Fragen der Schuleffektivitätsforschung nach. Diese Analysen untersuchen neben einer inhaltlichen Fragestellung auch, ob Inspektionsdaten die Qualität aufweisen, um Fragestellungen der Schulqualitäts- bzw. Effektivitätsforschung zu untersuchen. Pietsch und Kollegen untersuchen im dritten Beitrag, ob es einen Zusammenhang zwischen der Effektivität einer Schule (im Sinne der Lernentwicklung der Schülerinnen und Schüler) und dem Führungsstil der Schulleitung (gemessen im Rahmen der Schulinspektion) gibt. Hierzu bilden Sie durch ein propensity-score-matching Paare von Schulen, die zwar unter gleichen Rahmenbedingungen arbeiten, sich jedoch hinsichtlich ihrer Effektivität unterscheiden. Gärtner untersucht im abschließenden Beitrag, ob es einen Zusammenhang zwischen Organisationsmerkmalen wie Schulmanagement, Kooperation oder Personalentwicklung und der Qualität des Unterrichts gibt. Etliche Modelle von Schulqualität formulieren diesen positiven Zusammenhang zwischen Organisationsmerkmalen und Unterrichtsqualität. Anhand von Brandenburger Inspektionsdaten wird dieser Zusammenhang überprüft. Vorliegende Ergebnisse deuten darauf hin, dass 1) nur wenige Organisationsmerkmale die Qualität des Unterrichts erklären können (u.a. Personalentwicklung und Schulmanagement) und 2) sich die erklärenden Merkmale zwischen den Schulformen unterscheiden. Die vorliegenden Beiträge repräsentieren unterschiedliche Strömungen aktueller Inspektionsforschung und liefern Hinweise zur Qualität von Schulinspektion als diagnostischem Verfahren (Einflüsse auf die Wirksamkeit des Verfahrens) als auch Hinweise darauf, welchen Nutzen Inspektionsdaten für die Schulqualitäts- und Schuleffektivitätsforschung haben. Beiträge des Symposiums Der Einfluss der Schulinspektion auf die Gestaltung von Lehr-Lernbedingungen David Kemethofer1, Herbert Altrichter2 1 BIFIE Salzburg, 2Johannes Kepler Universität Linz In den vergangenen Jahren wurde die Schulinspektion in vielen europäischen Ländern als Verfahren schulischer Qualitätsentwicklung und –sicherung eingeführt bzw. bereits bestehende Verfahren an die Anforderungen eines evidenzbasierten Steuerungsregimes angepasst. Schulinspektionen sollen zum einen schulische Qualitätsentwicklung unterstützen und begleiten, zum anderen stellt die Schulinspektion auch ein Instrument der Rechenschaftslegung von Schulen dar. Im internationalen Kontext ist das Verhältnis zwischen Kontrolle und Qualitätsentwicklung keinesfalls einheitlich, vielmehr werden in der bildungspolitischen Praxis unterschiedliche Schwerpunkte gesetzt (vgl. z.B. Dedering, 2012). Ehren, Altrichter, McNamara und O‘Hara (2013) werten die Programme von Inspektionsverfahren in sechs europäischen Ländern aus und kommen zu dem Schluss, dass sich diese in einer Reihe von Charakteristika (z. B. Konsequenzen, Berichterstattung) unterscheiden. Ein Fallvergleich verdeutlicht aber auch, dass die verschiedenen Inspektorate offenbar systemübergreifend gemeinsame Mechanismen annehmen, die den Prozess schulischer Qualitätsentwicklung stimulieren sollen. Die bisherige empirische Forschung zu den Wirkungen der Schulinspektion konzentriert sich fast ausschließlich auf jeweils ein spezifisches Verfahren, das dann im Querschnitt untersucht wird. Sowohl die Analyse von Längsschnittdaten als auch vergleichende Untersuchungen stellen derzeit Forschungsdesiderate dar. Der geplante Beitrag setzt an diesen Lücken an und untersucht den Zusammenhang zwischen Schulinspektion und Aktivitäten der Schulentwicklung (1) in vergleichender Perspektive am Beispiel von Österreich und Schweden sowie (2) in der Perspektive eines dreijährigen Längsschnitts. Dabei wird auf die Arbeit von Ehren et al. (2015) aufgebaut, die unterschiedliche Folgemaßnahmen nach Schulinspektionen entsprechend unterschiedlicher Inspektionscharakteristika nachweisen konnten. Weiters wird auf die Studie von Altrichter und Kemethofer (2015) aufgebaut, die zeigen konnten, dass die Schulinspektion in Österreich als klassisches Low-Stakes-Verfahren ohne Sanktionen oder Schwellenwerte einzuschätzen ist. Demgegenüber greift die Schulinspektion in Schweden auf ein differenziertes Inspektionsmodell mit Sanktionen und einer Veröffentlichung der Ergebnisse zurück und repräsentiert damit ein Medium bis HighStakes-System. Die beiden divergierenden Ansätze spiegeln sich in einer unterschiedlichen Wahrnehmung von Inspektionsverfahren durch Schulleitungen in Schweden und Österreich wider. In dem hier vorgeschlagenen Beitrag kann die Effektivität von Schulinspektionen im Sinne der Fragestellung geprüft werden, welchen Einfluss die Schulinspektion auf die Gestaltung von Lehr-Lernbedingungen in Österreich und Schweden in einer Längsschnittperspektive hat. Von Interesse ist, ob die Entwicklungsaktivitäten mittel- bis längerfristig nachhaltig sind und ob in beiden Ländern dieselben Mechanismen Entwicklungsaktivitäten stimulieren. Die Daten stammen aus dem EU-Projekt „Impact of School Inspection on Teaching and Learning“ (ISI-TL; Ehren et al., 2013) und bieten die Möglichkeit aufzuzeigen, ob und wie die Schulinspektion unter Berücksichtigung unterschiedlicher bildungspolitischer Rahmenbedingungen die Qualitätsentwicklung an Schulen beeinflusst. In den Schuljahren 2010/11, 2011/12 und 2012/13 wurden Schulleitungen in Österreich und Schweden aus dem Primar- und Sekundarbereich mittels standardisiertem Fragebogen zu ihren Erfahrungen mit Schulinspektionen und den an ihren Schulen stattgefundenen Entwicklungsaktivitäten befragt. Innerhalb des Befragungszeitraumes wurden die Schulen zu unterschiedlichen Zeitpunkten inspiziert, was eine Analyse der Effekte der Schulinspektion mittels Längsschnittdesign erlaubt. Kontrollierend existiert eine Subgruppe von Schulen, welche während des Zeitraums der Untersuchung keine Schulinspektion hatte. Erste Ergebnisse deuten an, dass von der Schulinspektion kurzfristige direkte Effekte auf die Kenntnisse und Handlungen von Bezugsgruppen und die Akzeptanz von Feedback ausgehen. Beide Mechanismen beeinflussen die Entwicklungsaktivitäten an Schulen positiv. Mittel- bis langfristige Effekte scheinen indirekt durch die Erwartungshalten der Schulinspektion aufzutreten, ein direkter Zusammenhang mit dem Inspektionsbesuch ist in unseren ersten Auswertungen nicht zu erkennen. Bisherige Analysen zeigen ebenfalls den systemischen Einfluss, der durch Rechenschaftsdruck auf die Schulen ausgeübt wird. Demnach scheint der wahrgenommene Druck, den Schulleitungen durch die Inspektion verspüren, sowohl mit Entwicklungsaktivitäten als auch mit nicht-intendierten Konsequenzen assoziiert. Zielgruppenspezifische Perspektiven der Schulqualität: fehlende Übereinstimmung der Bewertungstendenzen von Lehrkräften, Eltern sowie Schülerinnen und Schülern im Kontext von externer Evaluation Didier Vaccaro, Eva-Maria Lankes Bayerisches Staatsinstitut für Schulqualität und Bildungsforschu Bei der Schulinspektion werden zur Bewertung der Qualität meist unterschiedliche Quellen berücksichtigt, neben Befragungsergebnissen von Schülerinnen und Schülern etwa auch die von Lehrkräften (Sanders & Beywl, 2000). Untersuchungen aus der Schuleffektivitätsforschung finden jedoch teilweise nur geringe Übereinstimmungen der Einschätzungen unterschiedlicher Zielgruppen (Feldmann, 1989). Angesichts dieses Mangels an Konvergenz stellt sich die Frage nach der Validität eines solchen multiperspektivischen Qualitätskonstruktes. Wie Clausen (2002) feststellt, erfassen die Items zu den einzelnen Qualitätskriterien u. U. andere Aspekte, je nachdem, welche Zielgruppe befragt wird. Die fehlende perspektivenübergreifende Konvergenz der Daten wäre demnach auf inhaltliche Unterschiede auf Konstruktebene zurückzuführen. Dies setzt jedoch voraus, dass unabhängig von der jeweiligen Faktorstruktur der Daten perspektivenspezifische Verzerrungstendenzen weitgehend ausgeschlossen werden können (z.B. Benton & Cashin, 2011). D.h. in der Einschätzung der Qualitätskriterien durch Schüler/-innen, Lehrkräften und Eltern sollten sich keine perspektivenabhängigen Antwortmuster zeigen (z.B. Positiv-Bias bei Lehrkräften). Eine perspektivenunabhängige Faktorstruktur in Kombination mit perspektivenabhängigen Antwortmustern spräche demnach für mangelnde Validität des multiperspektivischen Qualitätskonstrukts. Umgekehrt wäre eine perspektivenabhängige Faktorstruktur bei Vorliegen perspektivenunabhängiger Qualitätsprofile ein Hinweis dafür, dass die Informationen aus den verschiedenen Quellen wechselseitig ergänzend interpretiert werden können. In vorliegender Studie wurde untersucht, (a) ob die Items zur Erfassung von Qualitätskriterien bei Befragung verschiedener Zielgruppen (Schüler/-innen, Lehrkräfte und Eltern) perspektivenspezifische Konstrukte repräsentieren, die inhaltlich voneinander abgrenzbare Aspekte abbilden. Und (b) in wieweit in den Daten Antwortmuster identifizierbar sind, die sich als perspektivenunabhängige Qualitätsprofile (vs. Verzerrungsprofile) interpretieren lassen. Grundlage für die Analyse waren die Befragungsergebnisse von 117.326 Eltern, 105.566 Schüler/-innen und 12.304 Lehrkräften, welche im Rahmen der externen Evaluation bayerischer Schulen von 2010/11 bis Ende 2014 befragt wurden. Jeder Datensatz wurde getrennt nach Zielgruppe einer Faktorenanalyse mit obliquer Rotation (promax) unterzogen. Für die resultierenden Skalen wurden Faktorwerte berechnet und skalenweise auf Schulebene aggregiert, so dass für jede Zielgruppe mehrere Skalenmittelwerte pro Schule vorlagen. Die so aufbereiteten Daten wurden über die Schulnummer miteinander verknüpft (insgesamt 791 vollständige Datensätze). Die Skalenmittelwerte wurden anschließend durch Trichotomisierung (Einteilung des Range der Skalenmittelwerte in gleichgroße Wertebereiche) in diskrete Werte überführt (1 = niedrige Skalenmittelwerte, 2 = mittlere Skalenmittelwerte, 3 = hohe Skalenmittelwerte) und einer Latent Class Analyse unterzogen. Die Ergebnisse weisen darauf hin, dass in Übereinstimmung mit Clausen (2002) die Befragungsergebnisse zu den einzelnen Qualitätskriterien je nach Zielgruppe inhaltlich weitgehend unterschiedliche Konstrukte abbilden (5-6 Skalen pro Gruppe, Alphawerte zwischen .58 und .91). Die Latent Class Analyse legt aufgrund des BIC-Wertes 7 latente Klassen (typische Antwortmuster) nahe, welche als quellenunabhängige Qualitätsprofile interpretierbar sind. Die Ergebnisse stellen erneut die Bedeutung der Perspektivenabhängigkeit von Daten für die Interpretation von Fragebogenergebnissen im Evaluationskontext heraus. Die Analyse verweisen zudem darauf, dass perspektivenübergreifende Widersprüche nicht unbedingt als mangelnde Validität zu interpretieren sind. Interessanterweise verlaufen bei vorliegender Studie die Einschätzungstendenzen auf verschiedene Skalen innerhalb einer Quelle bzw. Zielgruppe meist konstant, was Clausens (2002) Befund bestätigt, dass Beurteilungen tendenziell einem globalen Schema folgen. Außerdem zeigt sich ein Zusammenhang zwischen Schulart und Auftretenswahrscheinlichkeit einer latenten Klasse, was möglicherweise auf schulartspezifische Qualitätsprofile verweist. Schulleitungshandeln an hochperformanten Schulen Marcus Pietsch1, Markus Lücken2, Franziska Thonke2, Stefan Klitsche2 1 Universität Lüneburg/ifbq Hamburg, 2ifbq Hamburg Schulinspektionen in Deutschland evaluieren schulische und unterrichtliche Prozessmerkmale. Die zu evaluierenden Prozessstandards sind in der Regel in Qualitätsrahmen oder –tableaus dokumentiert, die wiederum als Grundlage für die Entwicklung von Qualitätsindikatoren und Messinstrumenten herangezogen werden. Wenn auch häufig nicht explizit benannt, rekurrieren die dort beschriebenen Aspekte von Schulqualität auf Befunde aus der Forschung zur Effektivität von Schule und Unterricht (School- und Teacher-Effectiveness-Research, vgl. Ehren & Scheerens, 2015). Es wird somit angenommen, dass ein Zusammenhang zwischen den im Rahmen von Schulinspektionen gemessenen und berichteten Prozessmerkmalen und Schülerleistungen besteht. Eine Annahme, die sowohl international als auch im Rahmen deutscher Schulinspektionen bislang kaum untersucht, geschweige denn bestätigt wurde. Der Beitrag geht daher der Frage nach, ob sich ein Zusammenhang von Schülerleistungen und Prozessmerkmalen nachweisen lässt. Als Analysegrundlage dienen Daten, die in den Jahren 2012 bis 2015 systematisch an Schulen in Hamburg erhoben wurde. In einem ersten Schritt werden anhand von Daten der längsschnittlich angelegten und alljährlich mit jeder Schülerkohorte neu durchgeführten Studie KErmit (Kompetenzen Ermitteln) Schulen identifiziert, deren Schülerschaft im Rahmen der Untersuchung regelmäßig und wiederholt (d.h. über verschiedene Untersuchungskohorten) auffallend hohe Lernzuwächse in Mathematik und Lesen erzielt haben. Diese Schulen werden mithilfe eines Propensity-Score-Matching mit Schulen verglichen, die unter ähnlichen Bedingungen arbeiten (Kontrolle: Sozialer Hintergrund der Schülerschaft, Schulgröße etc.), deren Schülerschaft jedoch vergleichsweise geringere Lernzuwächse erzielt. In einem zweiten Schritt wird geprüft, ob sich Treatment- und Kontrollgruppe mit Blick auf das Schulleiterhandeln, dass sich im Rahmen der Schulinspektion Hamburg dezidiert an den Konzepten der Schuleffektivitätsforschung orientiert, unterscheiden. Schulleitungen, die zum Bildungserfolg der Schülerinnen und Schüler an ihren Schulen beitragen, sollten der Schuleffektivitätsforschung zufolge die Schwerpunkte ihrer Arbeit vor allem darauf legen, 1) den Schulbeteiligten Wege und Ziele vorzugeben, 2) Mitarbeiterinnen und Mitarbeiter (weiter) zu entwickeln, 3) die Schule (neu) zu gestalten und 4) das Lernen und Lehren an der Schule aktiv zu steuern (vgl. Leithwood & Jantzi, 2008). Die Schuleffektivitätsforschung unterscheidet hier zwei Konzepte voneinander: instruktionale und transformationale Führung (vgl. Hallinger, 2003). Pädagogische Führung umfasst vor allem Managementaspekte, erfolgt primär aufgaben- und produktorientiert, zielt auf die Optimierung vorhandener Strukturen und Prozesse ab und führt im Idealfall zu einer Verbesserung bereits vorhandener Prozesse und Mechanismen. Die Schulleitung kontrolliert und koordiniert entsprechend gezielt Aspekte des Schul‐ und Unterrichtsgeschehens, die den Lernfortschritt der Schülerinnen und Schüler betreffen, und nimmt direkten Einfluss auf den Unterricht und das Curriculum, z.B. durch die aktive Anleitung von Lehrkräften mittels Zielvorgaben, abgestimmten Fortbildungsmaßnahmen und der Evaluation von Schülerleistungen. Transformationale Führung hingegen umfasst in der Regel Führungsaspekte, erfolgt meist mitarbeiterorientiert und zielt auf die nachhaltige Veränderung der schulischen Lern- und Arbeitskultur ab. Dieser Führungsstil soll daher primär zu innerschulischen Innovationen und Veränderungen führen und ist maßgeblich dadurch geprägt, dass die Schulleitung eine sinnstiftende Zukunftsvision für die Schule entwickelt, Lehrkräfte inspiriert und motiviert, einzelne Lehrerinnen und Lehrer gezielt unterstützt und fördert sowie ihnen intellektuelle Herausforderungen bietet. Ein besonders relevanter Aspekt von Führung an Schulen ist darüber hinaus die kooperative bzw. partizipative Führung, die auf Beteiligung und Empowerment von Lehrkräften abzielt (vgl. Harris, 2013, Huber, Ahlgrimm, Hader-Popp, 2012). Kooperative Führung zeichnet sich dadurch aus, dass Schulleitung und Lehrkräfte eng zusammenarbeiten und sich in ihren Kompetenzen ergänzen. Verantwortlichkeiten und Aufgaben werden aufgeteilt. Die Analysen zeigen, dass sich stabil hoch performante Schulen vor allem durch eine ausgeprägte instruktionale Führung auszeichnen (Cohen’s d=0.46), wobei für eine passiv-vermeidende Führung negative Zusammenhänge nachweisbar sind (Cohen’s d=-0.26). Auch für alle weiteren Führungsstile und Praktiken lassen sich bedeutsame Zusammenhänge feststellen (Cohen’s d für Transformationale Führung=0.21, für Transaktionale Führung=0.26 und für partizipative Führung=0.37). In der Konsequenz zeigt sich, dass stabile und hohe Leistungszuwächse vor allem an Schulen zu erwarten sind, an denen sich Schulleitungen aktiv in das Schul- und Unterrichtsgeschehen einbringen. Welche schulischen Merkmale beeinflussen die Unterrichtsqualität? Sekundäranalysen auf Grundlage von Schulinspektionsdaten Holger Gärtner Institut für Schulqualität Berlin-Brandenburg an der FU Berlin Schulinspektion als europäisches Standardverfahren der externen Evaluation von Schulen (Ehren, Perryman & Shackleton, 2014) eignet sich aufgrund umfänglicher Diagnostik, um Modelle von Schulqualität empirisch zu überprüfen (Wurster & Gärtner, 2013). Modelle von Schulqualität (u.a. Ditton, 2007; Slavin, 1995; Scheerens & Bosker, 1997) postulieren, dass bestimmte Merkmale der Organisation Schule wie z.B. das Schulmanagement, die Personalentwicklung oder die Kooperationsstrukturen im Kollegium die Qualität der Lehr-Lern-Prozesse im Unterricht beeinflussen. Im vorliegenden Beitrag wird untersucht, ob Schulinspektionsdaten Erkenntnisse über den Zusammenhang zwischen Qualitätsmerkmalen auf der Organisationsebene und der Unterrichtsqualität liefern können. Durchgeführt wird eine Sekundäranalyse Brandenburger Schulinspektionsdaten. Abhängige Variablen sind die Wahrnehmungen der Unterrichtsqualität aus Sicht der Inspektion sowie aus Schülersicht. Beide Perspektiven erfassen fünf Bereiche von Unterrichtsqualität: Klassenmanagement, Schüleraktivierung, Strukturiertheit, Klassenklima und Differenzierung. Da die Beurteilungen der Inspektorinnen und Inspektoren (.57 < r < .75) bzw. die Wahrnehmungen der Schülerinnen und Schüler (.69 < r < .89) der einzelnen Teilaspekte hoch interkorrelieren, kann jeweils ein Globalfaktor Unterrichtsqualität gebildet werden. Unabhängige Variablen sind die auf Schulebene beurteilten Qualitätsaspekte (u.a. Partizipationsmöglichkeiten, Schulmanagement, Unterrichtsorganisation, Qualitätsentwicklung,…) aus Sicht der Inspektion, aus Sicht der Eltern sowie aus Sicht der Lehrkräfte. Diese Informationen liegen für Grundschulen (N=384), Oberschulen (N=116), Gesamtschulen (N=21) und Gymnasien (N=77) vor. Erfasst sind nahezu alle öffentlichen Schulen dieser Schulformen in Brandenburg. Alle Daten lagen von vornherein auf Schulebene vor oder wurden auf Schulebene aggregiert (Unterrichtsbeobachtungen, Fragebogen). Die Wahrnehmungen der Schülerinnen und Schüler zum Unterricht sind auf Schulebene äußerst reliabel (ICC2 > .90), die Beobachtungsdaten aufgrund der relativ geringen Anzahl an Beobachtungen pro Schule weniger (.50 < ICC2 < .79) (Wurster & Gärtner, 2013). Erste Analysen zeigen, dass die Wahrnehmung der Unterrichtsqualität von Inspektoren und Schülerinnen und Schülern positiv zusammenhängt (.36 < r < .54). Nur wenige der auf Schulebene beurteilten Qualitätsaspekte können jedoch Unterschiede in der Unterrichtsqualität erklären, zudem fällt diese Erklärung perspektiven- als auch schulformspezifisch aus. Unterschiede in den Bewertungen der Unterrichtsqualität können durchschnittlich zu 26% durch Schulmerkmale erklärt werden, wobei je nach Schulform andere Merkmale zur Varianzaufklärung beitragen. In Grundschulen können z.B. die Ausprägung von 1) Förderangeboten, 2) der Teamentwicklung im Kollegium, 3) der Partizipationsmöglichkeiten sowie die 4) Strategien der Qualitätsverbesserung Unterschiede in der Unterrichtsqualität erklären (insgesamt 27%). In Gymnasien trifft dies auf die Qualität der schulinternen Curricula, der Ausprägung der Teamentwicklung und der Transparenz über Leistungsanforderungen, kontrollen und –bewertungen zu (R² = 30%). Die Aufklärung von Unterschieden in der Schülerwahrnehmung durch Schulmerkmale ist in derselben Größenordnung möglich (ja nach Schulform zwischen 12 und 28%); auch hier gilt, dass je nach Schulform unterschiedliche Merkmale zur Varianzaufklärung beitragen. Im Gegensatz zu den Beurteilungen der Inspektoren stehen die Eltern- und Lehrerwahrnehmungen von Organisationsmerkmalen in viel stärkerem Zusammenhang zur Schülerwahrnehmung des Unterrichts. Obwohl Eltern nur wenige Aspekte von Schulqualität aus ihrer Sicht heraus beantworten, kann die Elternwahrnehmung 52% der Unterschiede in der Schülerwahrnehmung des Unterrichts erklären, die Lehrerwahrnehmung zu 44%. Weit weniger Erklärungskraft haben diese beiden Perspektiven zur Erklärung von Unterschieden in den Unterrichtsbewertungen der Inspektoren (35% bzw. 14%). Die explorativen Analysen deuten darauf hin, dass sich unter den Beteiligten an einer Schule (Eltern, Lehrkräften und Schülerinnen und Schülern) gemeinsame Eindrücke der Schulrealität manifestieren und die Wahrnehmungen von Externen wie Inspektorinnen und Inspektoren sich deutlicher davon unterscheiden. Zum anderen unterstützen die Ergebnisse bisherige Erkenntnisse der Schulqualitätsforschung über relevante Qualitätsmerkale auf Schulebene, z.B. Ditton (2007), dessen Modell ebenfalls die Relevanz von Personalentwicklung und Schulmanagement unterstreicht. Im Gegensatz zu den bekannten Modellen von Schulqualität deuten die bisherigen Ergebnisse jedoch auf einen starken Einfluss der Schulform hin, d.h. möglicherweise sind je nach Schulform andere Merkmale der Organisation wichtig, um einen qualitätsvollen Unterricht realisieren zu unterstützen. ID: 295 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Soziologie Thematisches Cluster: Schulentwicklung, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Ganztagsschule, Leseverstehen, Hausaufgabenbetreuung, Angebotsqualität Potenziale und Wirkungen ganztagsschulischer Bildung – empirische Befunde aus der Studie zur Entwicklung von Ganztagsschulen (StEG) Chair(s): Eckhard Klieme (Deutsches Institut für Internationale Pädagogische Forschung) Diskutant(en): Oliver Böhm-Kasper (Universität Bielefeld) Der bundesweite Ausbau von Ganztagsschulen erfolgte vor allem mit den Zielen, die Vereinbarkeit von Beruf und Familie zu verbessern und Schülerinnen und Schüler stärker individuell zu fördern (KMK, 2002). Ganztagsschulen bieten hierfür durch erweiterte (vgl. time on task; Carroll, 1963) und flexiblere Zeitstrukturen, Angebote zu Hausaufgaben und Lernzeiten sowie die Verknüpfung verschiedener Lernformen von Unterricht und extracurricularen Angeboten günstige Voraussetzungen. Damit ist u. a. die Erwartung verknüpft, dass zentrale schulische und gesellschaftliche Bildungsziele gefördert werden, und dass auch soziale Ungleichheit und damit einhergehende unterschiedliche Möglichkeiten, auf Ressourcen der Gesellschaft zuzugreifen, verringert werden (Willems & Becker, 2015). Darüber hinaus zeigen Befunde aus der anglo-amerikanischen Forschung, dass die in außerunterrichtlichen Angeboten erworbenen Kompetenzen auch eine Ressource für den weiteren Bildungsverlauf sein können (Feldman & Majasko, 2005). Aktuelle Befunde der Ganztagsschulforschung weisen zudem die Angebotsqualität als ein wichtiges Forschungs- und Handlungsfeld aus (z. B. Fischer et al., 2011). Hierbei wird theoretisch und empirisch an Befunde der aktuellen Unterrichtsforschung angeknüpft (Klieme, Pauli & Reusser, 2009). Im Symposium werden die genannten aktuellen Forschungsfelder systematisch anhand der vier Teilstudien der Studie zur Entwicklung von Ganztagsschulen (StEG) aufgegriffen. Im Kern der Beiträge steht die Frage nach den Wirkungen der Teilnahme an Ganztagsschule und der Qualität ganztagsschulischer Angebote. Dazu werden Befunde vorgestellt, die sich auf verschiedene Abschnitte im schulischen Bildungsverlauf beziehen. Im ersten Beitrag wird auf Basis einer multiperspektivischen, längsschnittlichen Fallstudie in der Primarstufe untersucht, wie sich Qualität eines ausgewählten Hausaufgabenangebots durch die Implementation einer didaktisch-konzeptionellen Neuerung – genauer gesagt: eines Wochenplans – in der Primarstufe verändern. Der zweite Beitrag aus der Primarstufe analysiert im Längsschnitt, welche Wirkungen einer Teilnahme an Ganztagsangeboten sich auf das Leseverstehen zeigen und ob sich differenzielle Bildungserfolge identifizieren lassen. Der dritte Beitrag aus der Sekundarstufe prüft, welche Effekte sowohl die Teilnahme als auch die pädagogische Qualität der Angebote auf das Leseverstehen nach dem Übergang in die Sekundarschule I aufweisen. Im letzten Beitrag wird für Schülerinnen und Schüler am Ende der Pflichtschulzeit untersucht, welchen Einfluss die retrospektiv erhobene Ganztagsbiografie von Nicht-Gymnasiasten auf die Bewältigung des Übergangs hat. Die über die Lebensspanne hinweg betrachteten Fragestellungen werden unter Nutzung quantitativer und qualitativrekonstruktiver Forschungsmethoden von einem interdisziplinär zusammengesetzten Team aus Erziehungswissenschaft, Schulpädagogik, Soziologie und Psychologie bearbeitet. Beiträge des Symposiums Hausaufgaben- und Lernzeiten an Ganztagsschulen. Eine längsschnittliche Fallstudie zur Implementation selbstbestimmter und schüleraktiver Hausaufgabenpraktiken Johanna M. Gaiser, Stephan Kielblock, Ludwig Stecher Justus-Liebig-Universität Gießen Der erweiterte Zeitrahmen von Ganztagsschulen macht eine konzeptionelle Überarbeitung der konventionellen Hausaufgabenpraktiken – als Aufgaben, die nach der Schule zu Hause von den Schüler/ innen erledigt werden – notwendig. Dass mehr als die Hälfte der Schulen in Deutschland bereits als Ganztagsschulen zu bezeichnen sind, und der Ausbautrend weiter anzuhalten scheint (Kielblock & Stecher, 2014), macht das Thema Hausaufgabenpraktiken an Ganztagsschulen (zur Übersicht vgl. z. B. Höhmann & Schaper, 2008; Rabenstein, 2015) besonders relevant, um erfolgreiches Lernen zu ermöglichen und zu fördern. Theoretischer Hintergrund Literatur. Bundesweit repräsentative Zahlen von Ganztagsschulleitungen belegen, dass an gut 90 Prozent der Ganztagsschulen im Primar- und Gymnasialbereich und gut 80 Prozent der nichtgymnasialen Sekundarschulen Hausaufgabenbetreuung ein Bestandteil des Ganztagsprogramms ist (StEG Konsortium, 2013). Die Hausaufgabenpraktiken an Ganztagsschulen scheinen in einigen Fällen denen an Halbtagsschulen ähnlich zu sein, lediglich sind sie teilweise zu Schulaufgaben geworden (Markert, 2011; Zepp, 2009), wobei die praktischen Routinen in manchen Fällen deutlich ‚unterrichtliche‘ – im Sinne von: fremdbestimmte und reglementierte – Züge aufweisen (Kielblock, im Druck; Nordt & Röhner, 2008). Teils scheint das ‚Mehr an Zeit‘ in dieser Weise eher als ‚time on task‘ gesehen zu werden, was beispielsweise zu Lasten der Autonomie der Schüler/ innen gehen kann (Rabenstein & Podubrin, 2015). Neben didaktischen Konzepten (Knapp, 2007; Rütz, 2004, 2006; Wolf, 2008), finden sich in der Literatur zu Hausaufgabenpraktiken an Ganztagsschulen zudem (multiprofessionelle) Kooperation (Haenisch, 2009; Höhmann & Schaper, 2008), Erziehungspartnerschaften zwischen Eltern, Lehrer/ innen und Kooperationspartnern (Wild, 2009; Wild & Gerber, 2007), Einblicke von Lehrkräfte in den nicht-unterrichtlichen Bereich (Haenisch, 2009) sowie die Beziehungsqualität (Kaufmann, 2013) als zentrale Aspekte. Es zeigen sich Forschungsdesidarate. Eines liegt in der Erforschung längerfristiger Prozesse von Hausaufgabenbetreuungen bzw. in der prozessualen Begleitung von Implementationsprozessen neuer Praktiken. Zudem scheint der Übergang von konventionellen Hausaufgabenpraktiken zu selbstbestimmten, schüleraktiven Formen (Rütz, 2006; Standop, 2013) besonderer Aufmerksamkeit zu bedürfen. Theoretischer Rahmen. Das hier Verwendung findende Rahmenmodell von Kielblock (im Druck) beschreibt ablaufende Prozesse dieser Art im Hinblick auf Schüler/ innen. Besonders betont die Modellvorstellung die individuelle Wahrnehmung der Schüler/ innen, sowie ihre individuellen Bildungs- und Lernpraktiken. Fragestellung An einer ausgewählten Schule (im Sek. I Bereich) wird in einem ausgewählten Hausaufgabenangebot die Implementation eines Wochenplans (Knapp, 2007; Rütz, 2004, 2006) über einen Zeitraum von eineinhalb Jahren multiperspektivisch rekonstruiert. Damit stellt sich die Frage: Wie verändert sich die Qualität und Wirkung des Hausaufgabenangebots durch die Implementation des Wochenplans? Diese Fragestellung ist für die Schul- und Ganztagsschulforschung wichtig, um die ablaufenden Prozesse bei der Implementation selbstverantwortlicher und selbstgesteuerter Hausaufgaben- und Lernangebote besser zu verstehen. Von ersten Hinweisen auf Gelingens- und Misslingensbedingungen für die Implementation könnte insbesondere auch die Ganztagsschulpraxis profitieren. Methode Die zugrunde liegende Fragestellung wird mit empirischem Material aus dem Gießener Teilprojekt der Studie zur Entwicklung von Ganztagsschulen (StEG-Q) bearbeitet. Die Daten enthalten Interviews mit Schüler/ innen sowie mit Lehrer/ innen und Personen des weiteren pädagogisch tätigen Personals. Zudem wurden an der ausgewählten Schule Gruppendiskussionen mit Schüler/ innen geführt, die die Hausaufgabenpraxis thematisieren. Und es wurden teilnehmende Beobachtungen in dem Hausaufgabenangebot durchgeführt. All diese Methoden wurden in drei Feldphasen mit halbjährlichem Abstand eingesetzt, sodass sich das Potenzial für eine multiperspektivische, längsschnittliche Fallstudie (vgl. Stake, 1995; Yin, 1984) ergibt. Ergebnisse Erste Analysen deuten an, dass die Implementation des Wochenplans den zuvor gesetzten (Hausaufgaben-)Alltag in Frage stellt und sogar stört. Die Einführung des Wochenplans scheint nicht ‚ad hoc‘ zu funktionieren. Ablaufende Prozesse werden – unter Nutzung des theoretischen Rahmenmodells – analysiert und beschrieben. Es werden Gelingens- und Misslingensbedingungen herausgearbeitet und vor dem Hintergrund des Wissens über besondere Dynamiken der Implementation aus der Implementationsforschung (vgl. z. B. Hall, 2010) diskutiert. Wirkungen der Schülerteilnahme an Leseangeboten in Ganztagsschulen auf die Kompetenzentwicklung von Grundschulkindern? Analysen zu differenziellen Effekten auf die Leseleistung Heinz Günter Holtappels1, Karin Lossen1, Ariane S. Willems2, Janine Hannemann1, Lea Spillebeen1, Katja Tillmann1, Wolfram Rollett3 1 Institut für Schulentwicklungsforschung, TU Dortmund, 2Georg-August-Universität Göttingen, 3Pädagogische Hochschule Freiburg Mit der Beschulung von Grundschulkindern in Ganztagsschulen werden vor allem Ziele in der Lernförderung und der Verbesserung sozialer Chancengleichheit verfolgt (Holtappels, 2006). Belege für leistungswirksame Vorteile von Ganztagsschulen gegenüber Halbtagsschulen sind ebenso rar, wie im Vergleich von Ganztagsteilnehmern und Nichtteilnehmern. Die Schweizer Studie EduCare konnte für die ersten drei Grundschuljahre einen stärkerer Zuwachs der sprachlichen und mathematischen Kompetenzen bei Tagesschulkindern gegenüber Halbtagsschulkindern belegen (Schüpbach, Herzog & Ignaczewska, 2013; Schüpbach, 2012). Holtappels, Radisch, Rollett und Kowoll (2010) belegen in ihren Sekundäranalysen zu IGLU 2006, dass die Leseleistungen der Schülerschaften an Ganztagsgrundschulen querschnittlich betrachtet schwächer ausfallen als an Halbtagsgrundschulen. Allerdings lässt sich dieser Unterschied größtenteils durch Unterschiede in den Hintergrundvariablen der Schüler/innen erklären. Eine neue Auswertung der Daten aus IGLU 2006 und TIMSS 2007 in Grundschulen stellt in einer, allerdings wiederum nur querschnittlichen, Vergleichsanalyse von Halb- und Ganztagsschüler/-innen fest, dass es bei nach sozialer Herkunft vergleichbaren Gruppen keinen Effekt der Ganztagsschulteilnahme zum Erhebungszeitpunkt auf die Schülerleistung gibt (vbw, 2013). Dass über die Ganztagsschulteilnahme Fördereffekte erreicht werden können, zeigen die Ergebnisse der Längsschnittstudie „Ganztagsorganisation im Grundschulbereich“ (GO) vor allem für die Lernentwicklung von Kindern mit Sprachrückständen (Bellin & Wegner 2010; Merkens, Schründer-Lenzen & Bellin 2010). Die Befunde zur Leseentwicklung in den ersten beiden Grundschuljahren zeigen einen schwachen Effekt der generellen Teilnahme am Ganztagsbetrieb auf die Kompetenzentwicklung; Lernrückstände aufgrund sozialer Herkunftsbedingungen werden zwar nicht ausgeglichen, allerdings nehmen Schüler/-innen mit nichtdeutscher Herkunftssprache eine etwas bessere Entwicklung in ihren Leseleistungen, wenn sie am Ganztagsangebot ihrer Schulen teilnehmen (Bellin & Tamke, 2010). Diese Befundlage macht deutlich, dass weitere empirische Untersuchungen zur Wirkung des Besuchs vor allem fachbezogener Ganztagsangebote, auf die Kompetenzentwicklung und die Chancengleich-heitsgewinne für Kinder aus sozioökonomisch benachteiligten Familien und niedrigem Bildungs-hintergrund erforderlich sind. Aus diesem Grund wird in diesem Beitrag untersucht, inwieweit die Teilnahme an lesethematisch ausgerichteten extracurricularen Angeboten Einfluss auf die Lesekompetenzentwicklung von Grundschulkindern hat und welche Rolle individuelle Hintergrundvariablen (Geschlecht, Migrations-hintergrund, sozioökonomischer Status und Schulbildung in der Familie) für den Effekt der Angebotsteilnahme auf die Lesekompetenz spielen. Diesen Fragen wird anhand der Längsschnittdaten der Studie StEG-P, die über eineinhalb Jahre (Mitte Klasse 3 bis Ende Klasse 4) bei 2.149 Schüler/-innen an 67 Ganztagsgrundschulen erhoben wurden, nachgegangen. Die Lesekompetenz wurde mit standardisierten Leistungstestaufgaben aus IGLU zu Beginn und zum Ende der Studie erfasst. Außerdem haben die teilnehmenden Schüler/-innen zu jedem Schulhalbjahresende Angaben zu den von ihnen besuchten Angeboten gemacht. Um verschiedene mögliche Teilnahmemuster abzubilden wurden Variablen zur generellen Teilnahme an Leseangeboten und zur Intensität der Teilnahme gebildet sowie die Angebote zu Lesen in fachlich gerichtete (Leseförderung, Lesen macht Spaß, etc.) und unspezifische Leseangebote (Theater, Schülerzeitung, etc.) unterteilt. Mittels multipler Regressionsanalysen wurde der Einfluss dieser Angebotsteilnahmevariablen allein sowie unter Berücksichtigung individueller Hintergrundvariablen (Geschlecht, Migrationshintergrund, Familiensprache, Schulbildung in der Familie und HISEI) auf die Lesekompetenzentwicklung überprüft. Deskriptiv zeigt sich, dass über alle drei Messzeitpunkte lediglich 534 der untersuchten Kinder an Angeboten im Bereich Lesen teilnehmen. Die Teilnahme von Schüler/-innen an lesespezifischen Angeboten, die die Primarstufenschulen in ihrem Ganztagsbetrieb gestalten, ergibt für die untersuchte Stichprobe nicht die erwarteten Effekte auf die Entwicklung der Lesekompetenz. Diese Befundlage ändert sich auch nicht wenn Hintergrundvariablen berücksichtigt werden (Ausgangsleistung, Geschlecht, sozialer Hintergrund, Familiensprache, Migrationshintergrund) oder die Intensität bzw. die Persistenz der Teilnahme kontrolliert wird. Das Fehlen der erwarteten Wirksamkeit des Besuchs von Leseangeboten könnte zum einen an Schwächen im didaktischen Konzept beziehungsweise der Qualität der Angebote liegen, zum anderen beziehen sich die verwendeten Kompetenztests zu wenig auf das realisierte Curriculum. Zudem zeigt sich, dass Lernende mit höherer Leseausgangskompetenz signifikant häufiger lesespezifische Angebote besuchen, was Leistungszuwächse begrenzen könnte. Man kann dies auch dahingehend interpretieren, dass eine neigungsbestimmte Auswahl der Angebote dazu führen könnte, dass das Förderpotenzial von Ganztagsangeboten nicht ausgeschöpft wird. Potenziale von Ganztagsangeboten zur Förderung des Leseverstehens Markus Sauerwein1, Désirée Theis1, Natalie Fischer2, Anett Wolgast1, Katrin Heyl1 1 Deutsches Institut für Internationale Pädagogische Forschung, 2Universität Kassel Lesen gilt sowohl als notwendige Kompetenz für eine spätere Erwerbstätigkeit als auch als Vorrausetzung für die Teilhabe am gesellschaftlichen Leben (Friebertshäuser, 2008). Es wird davon ausgegangen, dass der Schriftspracherwerb maßgeblich im Deutschunterricht der Grundschule erfolgt. Dementsprechend liegt der Fokus in der Sekundarstufe in der Regel nicht auf dem Erwerb von Lese- bzw. Textverstehens-Kompetenzen, obwohl ein Teil der Schüler/-innen in diesen Bereichen noch Defizite aufweist (Artelt et al., 2007). Die Einführung von Ganztagsschulen ist u. a. mit der Hoffnung verbunden, dass durch den erweiterten Zeitrahmen Schüler/-innen besser gefördert und Leistungsdefizite kompensiert werden können (Stecher et al., 2009; Palentin, 2007; Rauschenbach & Otto, 2008). Ganztagsangebote, die das Leseverstehen explizit fördern sollen, oder in denen Leseverstehenskompetenzen informell angeeignet werden können, sollen Schüler/-innen zusätzliche Bildungsgelegenheiten bieten. Voraussetzung hierfür ist erstens, dass (leistungsschwächere) Schüler/-innen auch tatsächlich an entsprechenden Ganztagsangeboten teilnehmen, sowie zweitens, dass sie die Lehrprozesse in den Leseangeboten nutzen, um ihre Kompetenzen zu erhöhen. Basierend auf dem Angebots-Nutzungs-Modell (Fend, 1981; Helmke & Weinert 1997) kann zwischen der Qualität des Angebots und der Qualität der Nutzung unterschieden werden. Nach Seidel (2014) werden im Angebots-Nutzungs-Modell Forschungsansätze1, die auf das Lehren fokussieren, mit Forschungsansätzen des Lernens zusammengeführt. Lehrprozesse im Unterricht können als Angebot an die Schüler/-innen verstanden werden, welches von den individuellen Schüler/-innen „genutzt“ werden muss, um Lernerfolg zu erzielen. In Bezug auf Ganztagsangebote darf von einem doppelten AngebotsNutzungs-Modell ausgegangen werden. So muss zunächst ein entsprechendes Angebot bereitgehalten werden (Angebot), dass die Schüler/-innen auch besuchen (Nutzung). In dem Angebot selbst müssen die Schüler/-innen die Lehrprozesse der Angebotsleiter/-innen (Angebot) für sich individuell nutzen und in Lernprozesse transferieren. Um die Qualität in Ganztagsangeboten empirisch zu erfassen, wurde ein erweitertes Qualitätskonzept zugrunde gelegt, welches neben den Basisdimensionen guten Unterrichts (Zeitnutzung, kognitive Aktivierung, Motivationsunterstützung) auch Qualitätsaspekte der außerschulischen Bildung beinhaltet wie Partizipationsmöglichkeiten, Lebensweltorientierung sowie die Anerkennung der Betreuer/-innen (Sauerwein, in Begutachtung). Damit soll der Eigenheit der pädagogischen Gattung Ganztagsangebot Rechnung getragen werden, die weder Schulunterricht noch außerschulisches Bildungsangebot ist, sondern eine Mischform aus beidem. Ziel dieses Beitrags ist es, zu untersuchen, inwiefern Schüler/-innen von Ganztagsangeboten profitieren, die gezielt die Lesekompetenz fördern sollen (z. B. Lesetrainings) und Angebote, in den Lesekompetenzen informell entwickelt werden sollen (z.B. Theater-AG). Hierfür wird erstens deskriptiv betrachtet, welche Schüler/-innen an diesen zwei Angebotsarten partizipieren. Darauf aufbauend wird der Frage nachgegangen, ob die Teilnahme in diesen Angeboten einen Effekt auf das Leseverstehen der Schüler/-innen hat. Zudem werden Effekte der wahrgenommenen Qualität des Angebots auf das Leseverstehen betrachtet. Diese Frage wird mit einer Teilstudie, der Studie zur Entwicklung von Ganztagsschulen, beantwortet. Die Stichprobe umfasst 2105 Schüler/-innen aus 66 Schulen der fünften Jahrgangsstufe. Diese wurden von Beginn bis Ende des Schuljahres 2013/14 drei Mal computerbasiert u. a. zur Angebotsnutzung und Prozessqualität in Ganztagsangeboten befragt. Ein deskriptiver Vergleich der Teilnehmer/-innen in den Ganztagsangeboten der Kategorien Lesen und Medien mit der Gesamtstichprobe zeigt, dass insgesamt nur wenige Schüler/-innen an Ganztagsangeboten der Kategorie Medien (142) oder Lesen (115) teilnehmen. Schüler/-innen, die zu Beginn der fünften Klasse eine schlechtere Leseleistung aufweisen nehmen häufiger an Leseangeboten teil, Schüler/-innen mit besseren Leseleistungen in Medienangeboten. Regressionsanalysen zeigen jedoch, dass eine reine Teilnahme an den Ganztagsangeboten keinen Effekt auf die Leseleistung der Schüler/-innen hat. Darüber hinaus scheinen lediglich Partizipationsmöglichkeiten in Medienangeboten positiv mit der Leseleistung zusammenzuhängen. Nur wenige Schüler/-innen an den untersuchten Ganztagsschulen nehmen an Medien- oder Leseangeboten teil. Zudem scheinen die Schüler/-innen die Qualität der Angebote nicht in erfolgreiche Lernprozesse hinsichtlich einer Verbesserung ihrer Lesekompetenzen transferieren zu können. Dies scheint dafür zu sprechen, dass Ganztagsangebote nicht die in sie gesetzten Erwartungen erfüllen und konkrete Kompetenzen jenseits des Unterrichts fördern. Zur Relevanz der Ganztagsteilnahme bei der Bewältigung kritischer Passagen am Ende der Schullaufbahn Bettina Arnoldt, Peter Furthmüller, Christine Steiner Deutsches Jugendinstitut Außerhalb des Unterrichts stattfindende Bildungsangebote werden inzwischen als vielversprechende Gelegenheiten des Kompetenzerwerbs von Kindern und Jugendlichen angesehen. Vorliegende Befunde zeigen, dass die Inanspruchnahme außerunterrichtlicher Angebote schulische Bildungsprozesse unterstützen (Fischer u.a. 2011). US-amerikanische Forschungen lassen vermuten, dass die mit der Inanspruchnahme von außerunterrichtlichen Angeboten vermittelten Kompetenzen, Fähigkeiten oder auch Erfahrungen durchaus auch zu relevanten Ressourcen für den weiteren Bildungsverlauf werden können (Feldman & Matjasko 2005). In theoretischer Hinsicht lässt sich hier an die Kapitaltheorie von Pierre Bourdieu (1979, 1983) anknüpfen. Bourdieu zeigte, dass kulturelle Güter nicht nur den Handlungsspielraum von Personen erweitern, sondern auch verwertet, d.h. in Abschlüsse aber auch in ökonomische Vorteile wie bessere Berufschancen umgesetzt werden können (dazu auch Baumert, Watermann & Schümer, 2003, S. 54ff.). Inwieweit dies auf die Nutzung von außerunterrichtlichen und ganztägigen Angeboten zutrifft, wurde im deutschsprachigen Raum bisher noch nicht untersucht. Ziel des am DJI angesiedelten Teilprojekts „Stabilisierung von Bildungsverläufen durch die Ganztagsschule“ des StEGVerbundes ist es, diese Forschungslücke zu schließen. Dazu wurden zwischen 2013 und 2014 insgesamt drei Befragungen von Schüler/-innen in Abschlussklassen nichtgymnasialer Schulen der Sekundarstufe I durchgeführt, um vor allem benachteiligte Schüler/-innen zu erreichen. Auf Basis dieser in Teilen retrospektiv angelegten Befragungen ist es möglich, die Schullaufbahn sowie die Beteiligung an non-formalen schulischen und außerschulischen Angeboten detailliert nachzuzeichnen und den Zusammenhang mit den Bildungsaspirationen und dem tatsächlichen Verbleib der Jugendlichen im Anschluss an die Sekundarstufe I zu analysieren. Im geplanten Vortrag wird der Frage nachgegangen, welchen Einfluss die Ganztagsbiografie auf die Bewältigung des Übergangs am Ende der Schulzeit hat. Hierfür liegen die Daten von 1901 Schüler/-innen aus der ersten Welle vor sowie Längsschnittdaten von 413 Schüler/-innen über zwei Wellen bzw. 319 Schüler/-innen über drei Wellen vor. Auf Basis der retrospektiv erhobenen Angaben wurden mithilfe von Sequenzmusteranalysen zunächst Cluster der Angebotsteilnahme gebildet, die thematische Schwerpunkte und Dauern der Teilnahme miteinander verbinden. Diese Cluster werden als Indikator der Ganztagsbiografie herangezogen. Anhand von schrittweisen logistischen Regressionsanalysen wird gezeigt, welchen Einfluss die Cluster der Angebotsteilnahme unter Kontrolle individueller, schulbezogener und regionaler Merkmale auf die Bildungspläne und den weiteren tatsächlichen Bildungsverlauf haben. Dabei zeigt sich, dass die Zugehörigkeit zu den Clustern der Angebotsteilnahme sozial selektiv ist, wobei Leistungsmerkmale und das Geschlecht vorherrschend sind. In Bezug auf den Einfluss der Ganztagsbiografie beim Übergang wird deutlich, dass die reine Teilnahme bzw. die Dauer der Teilnahme allein nicht entscheidend ist, sondern insbesondere die Inhalte der genutzten Angebote. So geht die verstärkte Teilnahme an musisch-kulturellen Angeboten und fachnahen Zusatzangeboten mit dem Erwerb eines höherwertigen Schulabschlusses einher. Im Vergleich dazu haben Jugendliche, die eine Ausbildung begonnen haben, deutlich weniger solcher Angebote besucht. ID: 296 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie Thematisches Cluster: Genderforschung Stichworte: Geschlechtsunterschiede, Schulleistung, Determinanten der Schulleistung Geschlechtsunterschiede in Schulleistung und Schulleistungsdeterminanten Chair(s): Sebastian Bergold (TU Dortmund), Anke Heyder (FU Berlin) Diskutant(en): Jörn Sparfeldt (Universität des Saarlandes) Geschlechtsunterschiede im Bildungserfolg gehören zu den meistdiskutierten Themen der Bildungsforschung. Unser Symposium vereint vier aktuelle erziehungswissenschaftliche und psychologische Forschungsarbeiten, die aus unterschiedlichen theoretischen Perspektiven und mit verschiedenen Forschungsdesigns Geschlechtsunterschiede in Schulleistungen und ihren kognitiven und motivationalen Determinanten untersuchen. Übergreifendes Ziel unseres Symposiums ist, durch das Zusammenbringen dieser Perspektiven neue Erkenntnisse zur Entstehung schulerfolgsbezogener Geschlechtsunterschiede zu gewinnen. Im ersten Beitrag (Lazarides, Rubach & Ittel) wird auf Basis von Längsschnittdaten von 475 Jugendlichen untersucht, inwiefern wahrgenommene mathematikbezogene Wertüberzeugungen der Eltern und der Jugendlichen mathematikbezogene Berufswünsche der Jugendlichen beeinflussen. Mädchen zeigen geringere mathematikbezogene Berufswünsche und Wertüberzeugungen als Jungen und nehmen auch bei ihren Eltern eine geringere Wertschätzung der Mathematik wahr. Die wahrgenommenen Wertüberzeugungen der Eltern sagen die Wertüberzeugungen von Jungen vorher, jedoch nicht die der Mädchen. Die Wertüberzeugungen der Jugendlichen haben wiederum bei beiden Geschlechtern einen positiven Effekt auf die mathematikbezogenen Berufswünsche. Heyder und Kessels untersuchen in einer experimentellen Studie mit 216 Neuntklässler/-innen, ob Jungen beim Lernen Wiederholungsstrategien eher einsetzen, wenn diese mit einer männlich konnotierten Metapher gelabelt sind, als wenn diese mit einer weiblich konnotierten Metapher gelabelt sind. Konfigurationsfrequenzanalysen zeigen, dass Jungen in einer diagnostischen Situation und weiblich konnotiertem Labeling Wiederholungsstrategien seltener wählen, als bei Unabhängigkeit der Merkmale Geschlecht, Bedrohungsgrad, Labeling und Strategiewahl zu erwarten wäre. Dies ist nicht der Fall, wenn die Wiederholungsstrategien männlich gelabelt sind. Im dritten Beitrag untersuchen Steinmayr und Spinath mit zwei experimentellen Studien mit 666 bzw. 542 Jugendlichen, ob und über welche Prozessvariablen vermittelt Zeitrestriktionen Mädchen beim Abruf ihres Leistungspotentials in numerischen Intelligenztests behindern und somit Geschlechtsunterschiede in der Messung zugunsten von Jungen vergrößern. Ohne Zeitrestriktion zeigen sich geringere Geschlechtsunterschiede im numerischen Reasoning als mit Zeitrestriktion. Dieses Ergebnis wird in der zweiten Studie mit einem Within-subject-Design repliziert, insbesondere bei Mädchen mit mittlerer und hoher Leistungsfähigkeit. Deckeneffekte bei den Jungen können als Alternativerklärung ausgeschlossen werden. Der Effekt wird teilweise durch motivationale und emotionale Variablen erklärt. Bergold, Kasper, Wendt und Steinmayr untersuchen im vierten Beitrag auf der Basis von 74.868 Viertklässlern aus 17 europäischen Ländern, wie sich die Leistungstestergebnisse zu Lesen, Mathematik und Naturwissenschaften aus den gemeinsamen TIMSS- und PIRLS-Erhebungen von 2011 zu Profilen zusammenfassen lassen. Latente Profilanalysen zeigen, dass sich die Profile ausschließlich nach domänenübergreifendem Fähigkeitsniveau und nicht nach domänenspezifischen Stärken und Schwächen unterscheiden lassen. Im leistungsstärksten Profil sind Jungen in 14 der 17 Länder überrepräsentiert. Über alle Länder hinweg betrachtet kommen hier auf ein Mädchen durchschnittlich 1,24 Jungen. Die Beiträge werden von Jörn Sparfeldt diskutiert. Beiträge des Symposiums Motivation und Berufswünsche von Mädchen und Jungen in Mathematik: Welche Rolle spielen wahrgenommene Überzeugungen der Eltern zum Fach und karrierebezogene Eltern-Kind Gespräche? Rebecca Lazarides, Charlott Rubach, Angela Ittel TU Berlin Die aktuelle empirische Befundlage verdeutlicht persistierende Geschlechterunterschiede im Mathematikinteresse (Watt, 2004), im wahrgenommenen Nutzen von Mathematik (Steinmayr & Spinath, 2010) sowie in den mathematikbezogenen Berufswünschen Jugendlicher (Watt, 2006). Basierend auf dem Eccles et al. model of parent socialization (Eccles, 1993) zeigen Forschungsarbeiten, dass in der häufig als männlich stereotypisierten Domäne Mathematik geringere elterliche Leistungserwartungen und Wertüberzeugungen zur geringeren Motivation von Mädchen in Mathematik beitragen, die wiederum ihre Wahl mathematikbezogener Berufe prägt (Lazarides, Harackiewicz, Pesu, & Viljaranta, 2015). Nur wenige Studien widmen sich dabei bislang der Frage nach reziproken Effekten in solchen intergenerationalen Transmissionsprozessen (Simpkins, Fredricks, & Eccles, 2015). Auch wird bislang eher selten untersucht, inwieweit die Relationen zwischen elterlichen Wertüberzeugungen und den fachbezogenen Werten zwischen Mädchen und Jungen im Jugendalter variieren (Taskinen, Dietrich, & Kracke, 2015). Die Studie geht der Frage nach, inwieweit die von Jugendlichen wahrgenommenen elterlichen mathematikbezogenen Wertüberzeugungen, karrierebezogene Gespräche mit den Eltern und die mathematikbezogenen Wertüberzeugungen der Jugendlichen sich wechselseitig beeinflussen und durch diese Prozesse die mathematikbezogenen Berufswünsche der Jugendlichen prägen. Neben der Frage nach Geschlechtsunterschieden in den mathematikbezogenen Wertüberzeugungen und Berufswünschen wurde auch analysiert, inwieweit die Zusammenhänge zwischen Mädchen und Jungen variieren. In der Studie wurden Fragebogendaten einer Teilstichprobe der Berliner BeBest Studie zur Berufs- und Studienorientierung von 475 Jugendlichen aus der elften und zwölften Jahrgangsstufe ausgewertet (Mädchen: 50.3 %; Alter in Jahren: M = 16.77, SD = 0.97). Die Jugendlichen aus 31 Schulklassen nahmen an zwei Messzeitpunkten (Schuljahresbeginn; Mitte des Schuljahres) an der Studie teil. Zur Auswertung der Fragestellungen wurden längsschnittliche Strukturgleichungsmodelle und Multiple Gruppenanalysen durchgeführt. Der Vergleich latenter Mittelwerte zeigte signifikant geringere mathematikbezogene intrinsischer Werte (Mädchen: M = 2.69, SE = 0.11; Jungen: M = 3.09, SE = 0.16, z = -0.374, p = .01) und Nutzenwerte (Mädchen: M = 2.46, SE = 0.08; Jungen: M = 2.79, SE = 0.14, z = -0.381, p < .01) Mädchen nahmen geringere mathematikbezogene Nutzenüberzeugungen ihrer Eltern wahr (Mädchen: M = 2.08, SE = 0.10; M = 2.49, SE = 0.08, z = -.460, p <.001). Des Weiteren berichteten Mädchen signifikant geringere mathematikbezogene Berufswünsche als Jungen (Mädchen: M = 51.96, SE = 2.51; Jungen: M = 61.85, SE = 2.03, t = 2.97, p < .001). Wahrgenommene elterliche mathematikbezogene Nutzenüberzeugungen zu T1 hatten einen signifikanten Effekt auf den Nutzenwert der Jugendlichen zu T2 (β = .129, SE = .06, p < .05). Der mathematikbezogene Nutzenwert zu T2 stand in signifikantem Zusammenhang zu mathematikbezogenen Karriereplänen zu T2 (β = .401, SE = .10, p < .001). Mädchen berichteten einen geringeren Nutzenwert zu T1 – indirekt wirkte über diesen Effekt das Geschlecht der Jugendlichen auch auf den Nutzenwert zu T2 (βind = -.073, SE = .04, p < .05 [90% CI = -.13 - -.02]). Der Nutzenwert zu T1 wirkte indirekt auf die mathematikbezogenen Karrierepläne zu T2 durch den Nutzenwert zu T2 (βind = .192, SE = .06, p = .001 [90% CI = .10 – 2.87]). Das Modell erklärte u.a. signifikante Varianzanteile der Karrierepläne (R² = .29), des intrinsischen Wertes (T2: R² = .63) und des Nutzenwertes (T2: R² = .49). Nur bei Jungen hatte die wahrgenommene elterliche Nutzenüberzeugung zu T1 einen Effekt auf den mathematikbezogenen Nutzenwert zu T2 (Δχ² (1) = 4.89). Nur bei Jungen hatte der mathematikbezogene intrinsische Wert zu T1 einen signifikanten Effekt auf die wahrgenommenen karrierebezogenen Gespräche mit Vätern zu T2 (Δχ² (1) = 4.09). Training macht den Meister. Geschlechtsspezifische Labeling-Effekte auf die Lernstrategiepräferenzen von Jugendlichen Anke Heyder, Ursula Kessels FU Berlin Die gegenwärtig besseren Noten von Mädchen im Vergleich zu denen von Jungen können zu einem bedeutenden Teil darauf zurückgeführt werden, dass Mädchen sich in der Schule stärker engagieren und mehr lernförderliches Verhalten zeigen. Diese Geschlechtsunterschiede im Lernverhalten werden z.B. damit erklärt, dass Jungen solche lernförderlichen Verhaltensweisen wie Fleiß und Anstrengung ablehnen, weil sie diese als typisch weiblich und damit nicht zu ihrem maskulinen Selbstbild passend ansehen (Kessels, Heyder, Latsch & Hannover, 2014). Eine Geschlechtstypisierung liegt auch im Bereich der Lernstrategien vor: Mädchen geben in Befragungen an, häufiger Wiederholungs- und Kontrollstrategien zu nutzen als Jungen, welche wiederum nach eigenen Angaben häufiger Elaborationsstrategien anwenden (z.B. Artelt, Naumann & Schneider, 2010). In einer Vorstudie konnten wir zudem belegen, dass insbesondere Wiederholungs- und Kontrollstrategien (wie z.B. etwas fleißig auswendig lernen) unter Jugendlichen als typisch für Mädchen gelten. Unsere Studie untersucht, ob schon die Benennung der Wiederholungsstrategie (Labeling) beeinflusst, ob Jungen diese Strategie wählen. Basierend auf der großen Wichtigkeit von Sport für Jungen (Lampert, Mensink, Romahn & Woll, 2007) und der maskulinen Konnotation des Faches Sport (Hannover & Kessels, 2002) nahmen wir an, dass Jungen eher eine (gemäß bevorstehender Testsituation zielführende) Wiederholungsstrategie wählen werden, wenn diese mit der Metapher des „Trainierens“ beschrieben wird als wenn diese mit dem weiblich konnotierten „Fleiß“ bezeichnet wird. Konkret erwarteten wir, dass Jungen es in einer selbstwertbedrohlichen, als diagnostisch bezeichneten Lernsituation ablehnen, Inhalte „fleißig auswendig zu lernen“ (und stattdessen die in diesem Kontext riskantere Elaborationsstrategie „nachdenken, bis ich es richtig verstanden habe“ präferieren), wohingegen sie häufiger die Wiederholungsstrategie wählen sollten, wenn diese als „konsequent trainieren“ bezeichnet wird. In einer Bedingung mit niedriger Selbstwertbedrohung ohne Ankündigung eines diagnostischen Tests sollten Jungen sich immer häufiger für „nachdenken“ entscheiden, unabhängig davon, ob „auswendig lernen“ oder „trainieren“ die Alternative darstellt. Bei Mädchen sollte sich dieses differentielle Muster nicht zeigen. In einem 2 (between: Geschlecht männlich vs. weiblich) x 2 (between: diagnostischer Test ja vs. nein) x 2 (between: Labeling der Wiederholungsstrategie „auswendig lernen“ vs. „trainieren“)–faktoriellen Experiment wurde die Wirkung des Labelings der Wiederholungsstrategie auf die Lernstrategiewahlen von Jungen und Mädchen in einer selbstwertbedrohlichen und in einer nichtselbstwertbedrohlichen Situation untersucht. Den teilnehmenden 216 Jugendlichen der 9. Jahrgangsstufe zweier Gymnasien wurde in einem Fragebogen zunächst eine Aufgabe angekündigt, welche entweder dazu diene, die Fähigkeiten der Person zu messen (Bedrohung durch diagnostischen Test) oder die Qualität des Lernmaterials zu bewerten (keine Bedrohung). Zur Vorbereitung auf die Aufgabe wurden ihnen zwei Lernstrategien zur Auswahl gestellt (entweder „nachdenken“ versus „auswendig lernen“ oder „nachdenken“ versus „trainieren“), von denen die Jugendlichen eine Lernstrategie auswählen mussten. Die Jugendlichen wählten in allen Bedingungen häufiger „nachdenken“ als die Wiederholungsstrategie. Mithilfe einer Konfigurationsfrequenzanalyse wurde geprüft, ob das Labeling und die Testsituation die Strategiewahl von Jungen und Mädchen beeinflussten. Wie erwartet, wählten Jungen in der Bedrohungssituation signifikant häufiger die Strategie „nachdenken“, wenn die Alternative „auswendig lernen“ lautete, als bei vollständiger Unabhängigkeit der Merkmale Geschlecht, Bedrohung, Labeling und Strategiewahl zu erwarten gewesen wäre. Unserer Hypothese entsprechend bestand dieser Zusammenhang nicht, wenn die Alternative zu „nachdenken“ als „trainieren“ bezeichnet worden war. Auf die Strategiewahl der Mädchen hatten das Labeling der Wiederholungsstrategie und die Bedrohung keinen Einfluss. Unsere Ergebnisse zeigen zusammengefasst, dass durch die Vermeidung weiblich stereotypisierter Bezeichnungen für Lernverhalten dieses für Jungen attraktiver wird, ohne dass es von Mädchen als weniger attraktiv wahrgenommen wird. In weiteren Studien gilt es zu prüfen, ob sich die hier gezeigten Veränderungen der Präferenzen von Jungen auch in entsprechenden Veränderungen im tatsächlich gezeigten Lernverhalten und Lernerfolg manifestieren. Zeitrestriktionen vergrößern Geschlechtsunterschiede in numerischen Intelligenztests Ricarda Steinmayr1, Birgit Spinath2 1 TU Dortmund, 2Universität Heidelberg Die Größe von Geschlechtsunterschieden in mathematischen Fähigkeiten hängt wesentlich von der Erfassungsmethode ab. So treten z. B. größere Geschlechtsunterschiede zugunsten von Jungen in numerischen Intelligenztests als in mathematischen Schulleistungstests auf. Ein wesentlicher Grund hierfür könnten Zeitrestriktionen in numerischen Intelligenztests sein. So fanden Tsui und Maziocco (2007) bei hochbegabten Schülerinnen und Schülern, dass sich die Leistung von Mädchen, nicht jedoch von Jungen, in einer Power-Version eines mathematischen Leistungstests gegenüber einer Version mit zusätzlicher SpeedKomponente verbesserte. Dies könnte zumindest teilweise durch motivationale und emotionale Faktoren erklärt werden. Studien haben bereits gezeigt, dass Variablen wie Leistungsängstlichkeit, Fähigkeitsselbstkonzept oder intrinsische Werte den Zusammenhang zwischen Geschlecht und numerischen Testleistungen mediieren (z. B. Ganley & Vasilyeva, 2014; Steinmayr, Wirthwein & Schöne, 2014). Insbesondere leistungsängstliche Testteilnehmer/innen werden durch Zeitrestriktionen in ihrer Leistung gehemmt (Hill & Wigfield, 1984). In zwei experimentellen Studien untersuchten wir daher, ob und über welche vermittelnden Variablen Zeitrestriktionen Mädchen beim Abruf ihres Leistungspotenzials in numerischen Intelligenztests behindern und somit Geschlechtsunterschiede in der Messung zugunsten von Jungen vergrößern. Zudem überprüften wir, ob insbesondere Mädchen mit hoher Leistungsfähigkeit durch Zeitrestriktionen benachteiligt werden und ob sich Effekte der Zeitrestriktion auch in anderen Testinhalten zeigen. In Studie 1 bearbeiteten N = 666 Elft- und Zwölftklässler/innen (333 Mädchen; Alter: M = 17.06, SD = 0.88) aus sechs zufällig ausgewählten Gymnasien die verbalen, numerischen und figuralen Reasoning-Skalen des Grundmoduls des Intelligenz-StrukturTests 2000 R (IST 2000 R; Liepmann, Beauducel, Brocke & Amthauer, 2007). Die Teilnehmer/innen wurden randomisiert einer Bedingung ohne Zeitveränderung (n = 365; verbal: 21 Min.; numerisch: 30 Min.; figural: 27 Min.; „Speed“-Bedingung) oder einer Bedingung mit Zeitveränderung (n = 301; verbal: 10.5 Min.; numerisch: 40 Min.; figural: 37 Min.; „Power“-Bedingung) zugewiesen (Between-subject-Design). Die Auswertung geschah mit einer 2x2 MANOVA und nachfolgenden ANOVAs. Unabhängige Variablen (UVn) waren das Geschlecht und die Zeitrestriktionsbedingung, abhängige Variablen (AVn) waren verbales, numerisches und figurales Reasoning. In der Power-Bedingung zeigten sich geringere Geschlechtsunterschiede zugunsten der Jungen im numerischen Reasoning als in der Speed-Bedingung (Zeitrestriktion x Geschlecht: F(1, 662) = 7.52, p = .006, η² = .01; dPower = 0.48, dSpeed = 0.89). Im verbalen und im figuralen Reasoning zeigte sich kein signifikanter Interaktionseffekt. Dieses Ergebnis steht in Einklang mit der Hypothese, dass Zeitrestriktionen Mädchen daran hindern, ihr Leistungsmaximum abzurufen. Um Deckeneffekte bei den Jungen als Alternativerklärung für den gefundenen Effekt ausschließen zu können und mögliche Mediationen durch motivationale und emotionale Variablen zu untersuchen, bearbeiteten in Studie 2 weitere N = 542 Elft- und Zwölftklässler/innen (283 Mädchen; Alter: M = 17.60, SD = 1.05) in randomisierter Reihenfolge Parallelversionen der numerischen Reasoning-Skala aus dem IST 2000 R ohne (30 Min.) und mit (51 Min.) Zeitzugabe (Within-subject-Design). Zudem füllten sie Fragebögen zu verschiedenen motivationalen und emotionalen Konstrukten aus (mathematisches Fähigkeitsselbstkonzept, Leistungsängstlichkeit in Mathematik, selbsteingeschätzte numerische Intelligenz, Leistungsmotiv, intrinsischer Wert von Mathematik sowie Erfolgserwartung). Die Auswertung erfolgte durch eine 2x2x2 AN(C)OVA mit Messwiederholung (Withinsubject-Bedingung: Speed- vs. Power-Test; UVn: Geschlecht, Testreihenfolge; AV: numerisches Reasoning; Kovariaten: motivationale und emotionale Variablen). In der Power-Bedingung verbesserten die Teilnehmer/innen ihre Leistung, Mädchen jedoch stärker als Jungen, so dass wie in Studie 1 die Geschlechtsunterschiede in der Power-Bedingung geringer ausfielen als in der Speed-Bedingung (Zeitrestriktion x Geschlecht: F(1, 538) = 31.23, p < .001, η² = .06; dPower = 0.43/0.48 vs. dSpeed = 0.59/0.74). Dies traf insbesondere auf Mädchen im mittleren und oberen Leistungsbereich zu, so dass Deckeneffekte bei den Jungen als Alternativerklärung für die gefundenen Effekte ausgeschlossen werden können. Der Effekt konnte teilweise durch motivationale und emotionale Faktoren erklärt werden. Aus diesen Ergebnissen kann geschlossen werden, dass eine hohe Speed-Komponente in numerischen Intelligenztests Mädchen (insbesondere solche mit hoher Fähigkeit), teilweise vermittelt über motivationale und emotionale Variablen, daran hindert, ihr volles Leistungspotential zu demonstrieren. Geschlechtsunterschiede im oberen Bereich schulischer Leistungsfähigkeit: Eine personenzentrierte Analyse Sebastian Bergold, Daniel Kasper, Heike Wendt, Ricarda Steinmayr TU Dortmund Studien zeigen, dass Jungen im oberen Intelligenzbereich überrepräsentiert sind (z. B. Deary, Thorpe, Wilson, Starr & Whalley, 2003; Rost, 1993; Strand, Deary & Smith, 2006). Dies ist auch bereits für einzelne schulische Kompetenzen wie mathematische und naturwissenschaftliche Fähigkeiten gezeigt worden (z. B. Guiso, Monte, Sapienza & Zingales, 2008; Hedges & Nowell, 1995; Reilly, 2012). Bei Lesefähigkeit zeigte sich eine Überrepräsentation von Mädchen im oberen Leistungsbereich (z. B. Nowell & Hedges, 1998; Machin & Pekkarinen, 2008). Bislang wurden diese schulischen Kompetenzen jedoch meist getrennt voneinander untersucht, womit implizit angenommen wird, dass sie nicht miteinander korreliert sind und schulische Kompetenztests ausschließlich die jeweils angezielte Kompetenz erfassen. Diese Annahmen entsprechen jedoch nicht den Befunden und aktuellen Modellen der Intelligenzforschung, die von einer hierarchischen Organisation kognitiver Fähigkeiten ausgehen (z. B. Carroll, 1993; s. auch Neisser et al., 1996). Zudem haben internationale Schulleistungsstudien bereits gezeigt, dass verschiedene schulische Kompetenztests substanziell interkorreliert sind (vgl. z. B. Bos et al., 2012; Reilly, 2012). Schulische Kompetenzen existieren somit nicht voneinander isoliert, sondern Schülerinnen und Schüler vereinen mehrere schulische Kompetenzen in sich. Somit erscheint eine personenzentrierte Analyse als vielversprechender Zugang zur genaueren Untersuchung von Geschlechtsunterschieden in schulischen Kompetenzen. Wir untersuchten daher, inwiefern sich mathematische, naturwissenschaftliche und Lesekompetenzen zu Profilen zusammenfassen lassen. Die Annahme war, dass sich die Profile allein im Gesamtfähigkeitsniveau der zugehörigen Schülerinnen und Schüler unterscheiden und nicht in domänenspezifischen Stärken und Schwächen. Wir untersuchten außerdem das Geschlechterverhältnis im leistungsstärksten Profil mit der Erwartung, dass sich analog zu den Ergebnissen aus der Intelligenzforschung ein Geschlechterverhältnis zugunsten der Jungen zeigt. Zu diesem Zweck analysierten wir repräsentative Daten von N = 74.868 Viertklässlern (36.655 Mädchen, 38.213 Jungen) von 2704 Schulen aus 17 europäischen Ländern, die an den im Jahr 2011 gemeinsam durchgeführten Erhebungen der TIMS-Studie und der PIRL-Studie teilgenommen hatten. Wir führten latente Profilanalysen (LPA) auf Basis der Testleistungen in Lesen, Mathematik und Naturwissenschaften durch. Zunächst wurde auf Basis aller Daten das Modell mit dem besten Fit (indiziert durch CAIC und BIC) ausgewählt (internationales Modell; Modell 1). Anschließend wurden die Anzahl der Profile von Modell 1 und ihre konditionalen Mittelwerte fixiert (Modell 2) und der Fit für jedes einzelne Land separat inspiziert, um die Gültigkeit des internationalen Modells für jedes Land zu überprüfen. Im letzten Schritt wurden die konditionalen Mittelwerte wieder frei geschätzt und das Geschlecht als zusätzliche Variable aufgenommen (Modell 3), um das Geschlechterverhältnis in den einzelnen Profilen in jedem Land zu ermitteln. Die LPA ergab die beste Lösung für ein internationales Modell mit sieben Profilen. Dieses erwies sich ebenfalls als hinreichend valide (Klassifikationsfehlerrate < 25%) für 15 der 17 Länder. Die Leistungen in allen drei Kompetenztests stiegen von Profil 1 zu Profil 7 kontinuierlich und konsistent an. Es konnten keine weiteren systematischen Muster beobachtet werden. Somit unterschieden sich die Profile wie angenommen ausschließlich im domänenübergreifenden Leistungsniveau. Über alle Länder gemittelt gehörten 4,4% aller Schülerinnen und Schüler zum leistungsstärksten Profil (Profil 7) ihres jeweiligen Landes. Jungen waren in 14 der 17 Länder in diesem Profil überrepräsentiert. Das Geschlechterverhältnis bewegte sich in diesen Ländern zwischen 1,14 (Finnland) und 1,67 (Tschechien) Jungen für jedes Mädchen. In nur zwei Ländern (Nordirland und Schweden) zeigten sich keine Unterschiede, und in einem Land (Irland) zeigte sich ein leichter Unterschied zugunsten von Mädchen (0,96). Das mittlere Geschlechterverhältnis über alle Länder hinweg lag bei 1,24 zugunsten der Jungen. ID: 310 Symposium Disziplinen-Cluster: Wirtschafts- und Berufspädagogik, Didaktik Mathematik, Didaktiken der Naturwissenschaften und Technik Thematisches Cluster: Lehrerexpertise, Methoden der empirischen Bildungsforschung, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Professionswissen, Pedagogical Content Knowledge, Entwicklung und Effekte von Lehrerkompetenzen Determinanten und Effekte des Lehrerwissens - Studien zur fachlichen, fachdidaktischen und pädagogischen Kompetenz von Lehrpersonen unterschiedlicher Disziplinen Chair(s): Christoph Helm (Johannes Kepler Universität Linz) Diskutant(en): Eveline Wuttke (Goethe-Universität Frankfurt am Main) Das Symposium stellt vier Beiträge vor, die die Bedeutung der Lehrerkompetenzen für den Unterricht in den Disziplinen Mathematik, Naturwissenschaft sowie politische und kaufmännische Bildung erforschen: Welche Rolle spielt die Lehrerkompetenz für die kognitive Aktivierung im Unterricht und die Entwicklung der Schülerkompetenzen? Wodurch ist die Entwicklung der Lehrerkompetenzen determiniert? Insbesondere jüngere Forschung (COACTIV, TEDS-M, EMW, …) belegt die hohe Bedeutung kompetenter Lehrpersonen für die Entwicklung der Lernenden. Es ist daher unbestritten, dass dieses Forschungsfeld einen zentralen Beitrag zum Wissen über die Entstehung von Bildungserfolgen leistet. Im Besonderen hervorzuheben ist die Interdisziplinarität des Symposiums, das erstmals allgemeinbildende und berufsbildende Domänen in diesem Forschungsfeld vereint. Beitrag 1 widmet sich der Identifikation von Prädiktoren des fachspezifischen und pädagogischen Wissens angehender Lehrkräfte im Fach Mathematik. Mit Hilfe von hierarchischen Modellen wird anhand der deutschen TEDS-M-Stichprobe untersucht, ob sich die in der Schulforschung erforschten Beziehungsmuster – zwischen den individuellen (z.B. Vorwissen) und institutionellen Merkmalen (z.B. Lerngelegenheiten) einerseits und dem fachlichen, fachdidaktischen und pädagogischen Wissen der künftigen Mathematiklehrer/innen andererseits – auf die Lehrerausbildung übertragen lassen. Ökonomische Bildung als Teil der Allgemeinbildung sollte den notwendigen Raum in der Schule erhalten und zudem nicht durch Defizite in der Ausbildung der dafür vorgesehenen Lehrpersonen beeinträchtigt werden. Bislang ist diese sehr heterogen und teilweise ausgesprochen defizitär. Ergebnisse einer Interventionsstudie in Beitrag 2 zeigen einen ersten Schritt zu mehr Raum für ökonomische Bildung. In Beitrag 3 diskutieren die Autor/inn/en Probleme, die sich bei der Untersuchung der Zusammenhänge zwischen dem Professionswissen von Lehrkräften und ihrer realisierten Unterrichtsqualität in den Fächern Biologie, Chemie und Physik ergeben. Im Rahmen der ProwiN-Studie (23 Gymnasiallehrkräfte und -klassen aus NRW wurden getestet und videografiert) wird der Frage nachgegangen, ob das CK und das PCK – über die kognitiven Fähigkeiten hinaus – die Entwicklung der Schülerleistungen vorhersagen. Die Ergebnisse werden vor dem Hintergrund der Herausforderungen derartiger Studien diskutiert. Vergleichbare Fragen werden in Beitrag 4 für das Fach Rechnungswesen präsentiert. Es interessiert, inwiefern die fachdidaktische Expertise von Lehrkräften dieses Faches mit der kognitiven Aktivierung und der Kompetenzentwicklung der Schüler/innen berufsbildender Schulen in Österreich zusammenhängt. Dazu wurden im Rahmen einer Studie 20 Schulklassen dreimal (jeweils am Schuljahresende) befragt bzw. getestet. Zusätzlich wurde die Fachdidaktikkompetenz der Lehrpersonen nach dem Modell von Berger et al. (2013) erfasst. Die Ergebnisse werden entlang domänespezifischer Merkmale des Rechnungswesenunterrichts diskutiert. Eveline Wuttke reflektiert abschließend alle vier Beiträge, indem sie sowohl inhalts- als auch forschungskritisch Bezug auf die Studien nimmt. Beiträge des Symposiums Individuelle und institutionelle Prädiktoren des fachspezifischen und pädagogischen Wissens angehender Mathematiklehrkräfte für die Sekundarstufe I in Deutschland Christin Laschke1, Sigrid Blömeke2 1 Humboldt-Universität zu Berlin, 2University of Oslo Theoretischer Hintergrund Lehrkräfte stehen vor der Herausforderung, den Erwerb fachlichen Wissens bei Schülerinnen und Schülern mit adäquaten Methoden anzuregen und zu unterstützen. Dies muss unter unterschiedlichen Rahmenbedingungen geschehen können. Insofern ist es wichtig, dass Lehrkräfte nicht nur Experten ihrer Fächer, sondern auch fachdidaktisch und pädagogisch befähigt sind. Der Lehrerausbildung kommt die Aufgabe zu, zukünftige Lehrkräfte mit entsprechender Expertise auszustatten und die dazu notwendigen Lerngelegenheiten in Form geeigneter Lehr-Lernmethoden zu bieten. Dies ist eine wichtige Voraussetzung für das Handeln der Lehrkräfte in der Schule (Blömeke et al., 2014). Um sich der Frage zu nähern, welche Faktoren den Kompetenzerwerb im Rahmen der Lehrerausbildung bedingen, geben Befunde aus der Schulforschung Hinweise. Demzufolge sind Leistungen von Lernenden abhängig von einem komplexen Gefüge von individuellen Merkmalen der Lernenden und institutionellen Rahmenbedingungen. So beeinflussen individuelle Merkmale, wie Geschlecht, soziale und kulturelle Herkunft, Motivation und Vorwissen, die Leistungen von Schülerinnen und Schülern. Darüber hinaus sind institutionelle Faktoren wie Lerngelegenheiten und die Zusammensetzung von Lerngruppen ausschlaggebend für Schulleistungen in Deutschland (Ehmke & Jude, 2010; Stanat, Rauch & Segeritz, 2010; Helmke & Schrader, 2006; Möller, 2008; Helmke, 2004). Entsprechend bisheriger Befunde basierend auf den Daten der Teacher Education and Development Study-Learning to Teach Mathematics (TEDS-M, Tatto 2008) gilt dies auch für den Wissensstand angehender Primar- und Sekundarlehrkräfte über alle TEDS-M-Länder hinweg (Blömeke, Suhl, Kaiser & Döhrmann, 2012; Blömeke, Kaiser & Döhrmann, 2011). Sowohl institutionelle Merkmale wie die Lerngelegenheit als auch individuelle kognitive und affektive Merkmale sowie im Fall der Primarlehrkräfte der sozio-demographische Hintergrund erklären Unterschiede im Wissensniveau. Fragestellung Inwiefern sich Beziehungsmuster, die im schulischen Kontext und für die Mathematiklehrerausbildung über alle TEDS-M-Länder hinweg gelten, auf die Mathematiklehramtsausbildung in Deutschland übertragen lassen, wurde bisher nicht untersucht. Vor diesem Hintergrund wird der Frage nachgegangen, inwieweit fachliches, fachdidaktisches und pädagogisches Wissen, die als wesentliche Facetten des Professionswissens von Lehrkräften zu verstehen sind (Weinert, 1999), abhängig von individuellen Merkmalen der angehenden Lehrkräfte ist und welche Rolle institutionelle Rahmenbedingungen spielen. Methode Auf Basis der deutschen TEDS-M-Stichprobe für angehengende Lehrkräfte für die Sekundarstufe I wird mit Hilfe von hierarchischen linearen Modellen untersucht, inwieweit das fachliche, fachdidaktische und allgemein-pädagogische Wissen abhängig ist von den individuellen Merkmalen Geschlecht, Bildungshintergrund und Sprachgebrauch sowie den Motiven für die Aufnahme des Studiums, dem allgemeinen und fachspezifischen Vorwissens sowie den Studienumständen in Bezug auf familiäre und finanzielle Hinderungsgründe. Darüber hinaus wird die Bedeutung institutioneller Merkmale in den Blick genommen. Dabei wird neben dem Studiengang, den Lerngelegenheiten und den erfahrenen Lehr-Lernmethoden auch die Komposition der Studierendenschaft in Bezug auf ihr Vorwissen berücksichtigt. Ergebnisse Zentrale Befunde lassen sich wie folgt zusammenfassen. In allen drei Domänen geht ein höheres generisches Vorwissen mit besseren Leistungen am Ende des Studiums einher. Darüber hinaus zeigen sich Vorteile in Bezug auf das mathematische und mathematikdidaktische Wissen für diejenigen, die vor Eintritt in die Lehrerausbildung einen Leistungskurs Mathematik besucht haben. Dies gilt auch für angehende Lehrkräfte, die das Studium aufgrund einer starken fachbezogenen Motivation ergriffen haben. Zudem zeigen sich Unterschiede im Wissensniveau nach Geschlecht. Männer schneiden im Mathematiktest besser ab, Frauen im Pädagogiktest. Als hinderlich empfundene familiäre und finanzielle Verpflichtungen gehen sowohl mit geringerem Mathematikwissen als auch mit geringerem Pädagogikwissen einher. In Bezug auf die institutionellen Rahmenbedingungen hat sich insbesondere gezeigt, dass wesentliche Unterschiede im fachbezogenen Wissensniveau nach Studiengängen bestehen. Angehende Lehrkräfte mit Lehrberechtigung für die gymnasiale Oberstufe zeichnen sich durch umfangreicheres Wissen in Mathematik und Mathematikdidaktik aus als Lehrkräfte ohne Gymnasialberechtigung. Dies begründet sich v. a. dadurch, dass den angehenden Gymnasiallehrkräften ein größerer Umfang an fachbezogenen Lerngelegenheiten geboten wird. Die Ergebnisse replizieren Befunde aus der Schulforschung und der Studien von Blömeke et al. (2011, 2012), wonach u. a. Motivation, Vorwissen und Lerngelegenheiten wichtige Prädiktoren für das Wissensniveau sind. Evaluation professionellen ökonomischen Lehrerwissens Christin Siegfried Goethe-Universität Frankfurt am Main Theorie Das aktive Interesse an politischen wie wirtschaftlichen Themen ist eine unabdingbare Prämisse für das nachhaltige Wirken einer Gesellschaft und die Bewältigung des täglichen Lebens des Individuums (z.B. Kaminski & Eggert 2008). Im Rahmen des Faches „Politik und Wirtschaft“ wurde diese Prämisse in die Curricula allgemeinbildender Schulen aufgenommen und damit ein Anfang für den angestrebten Bildungserfolg im Bereich ökonomischer Kompetenz geschaffen. Dennoch zeigen die Ergebnisse verschiedene Studien eher ökonomische „Inkompetenz“ von jungen Erwachsenen (z.B. Schumann et al., 2010, Retzmann, Seber, Remmele & Jongebloed 2012). Unter Berücksichtigung der Wirkungskette zwischen professionellem Lehrerwissen, welches sich insbesondere in den Komponenten Fachwissen und fachdidaktisches Wissen (Shulman, 1986) äußert, und dem Lernerfolg von Schülerinnen und Schülern (z.B. Baumert & Kunter, 2011) lassen solche Befunde vermuten, dass das professionellen Lehrerwissen möglicherweise unzureichend ist. Verschiedene Studien wie COACTIV (Kunter et al., 2009) oder auch TEDS-M (Biedermann & Oser, 2001) nehme sich international die Wirksamkeit der Lehrerausbildung in den Blick, allerdings für den allgemeinbildenden Bereich. Die Übertragbarkeit der geleisteten Beiträge auf andere Unterrichtsfächer wie den Politik- und Wirtschaftsunterricht ist zu prüfen. Die vorliegende Studie nimmt deshalb in einem ersten Schritt das professionelle Lehrerwissen in Ökonomie in den Blick. Während für das wirtschaftliche Fachwissen bereits ausreichend erprobte Messinstrumente zur Verfügung stehen (Wirtschaftskundlicher Bildungstest (WBT): Beck et al., 1998, OEKOMA: Schumann et al., 2010) fehlen Instrumente für die Messung wirtschaftsdidaktischer Fähigkeiten im allgemeinbildenden Bereich. Die Entwicklung eines solchen fachdidaktischen Tests soll diese Lücke schließen und damit detaillierteren Aufschluss über das professionelle ökonomische Lehrerwissen bieten. Fragestellung Wie ist das Fachwissen von Lehramtsstudierenden in Politik und Wirtschaft ausgeprägt? Wie lässt sich Fachdidaktisches Wissen zur Vermittlung ökonomischer Inhalte im Rahmen der Allgemeinbildung operationalisieren? Methode Für die Analyse des Fachwissens als einer wichtigen Voraussetzung für fachdidaktisches Handeln wurde in einem ersten Schritt eine Studie sowohl mit Lehramtsstudierenden des Faches Politik und Wirtschaft (N=42), als auch Lehramtsstudierenden anderer Fächerkombination wie Biologie und Mathematik (N=15) durchgeführt. Die Ergebnisse zeigen keinen signifikanten Unterschied im Wirtschaftswissen zwischen den beiden Gruppen (t(55)= 1.582, p=119). In einem zweiten Schritt wurde deshalb ein wirtschaftswissenschaftliches Training für angehende Lehrpersonen des Faches „Politik und Wirtschaft“ entwickelt und durchgeführt. Um das Lehrangebot zu evaluieren, wurde eine Interventionsstudie mit Lehramtsstudierenden dieses Faches an der Goethe Universität Frankfurt im quasiexperimentellen Design mit einer Interventionsgruppe (N=61) und einer Kontrollgruppe (N=38) unter Verwendung des WBT (Beck et al., 1998) und OEKOMA (Schumann et al., 2010) realisiert. In einem zweiten Schritt soll nun das fachdidaktische Wirtschaftswissen mithilfe eines selbstentwickelten Fragebogens erfasst werden. Die Items wurden auf der Basis curricularer Vorgaben (die festlegen, was Lehrpersonen vermitteln können müssen) vorgenommen (Hessisches Kultusministerium, 2010). Die didaktische Rahmenkonstruktion fand unter Anwendung des Berliner Modells und dessen Kernstück, die Strukturanalyse statt (Jank & Meyer, 2002). Ergebnisse Die Ergebnisse für das Fachwissenstraining zeigen einen signifikanten Anstieg des wirtschaftlichen Wissens in die Interventionsgruppe (F (1,97) = 15.747, p < .001, η2 = .140). Was allerdings nicht über den Fakt hinweg täuschen darf, dass die durchschnittlich erreichte Punktzahl z.B. im WBT von möglichen 46 bei lediglich M=24.52 (SD=6.61) Punkten lag (Interventionsgruppe: M=26.03, SD=6.43, Kontrollgruppe: M=22.13, SD=6.24) und damit dem Wert Ihrer zukünftigen Schüler entspricht (M=24.9, SD=6.6; Beck et al., 1998). Wenn man Fachwissen als notwendige Voraussetzung für fachdidaktisches Wissen betrachtet (Baumert & Kunter, 2006), legen diese Befunde ähnliche Defizite für das fachdidaktische Wissen nahe. Erste Erhebungen zur Erfassung der Güte des entwickelten fachdidaktischen Tests finden im Oktober 2015 statt, die Befunde werden in der Präsentation vorgestellt. Schwierigkeiten bei der Untersuchung von Zusammenhängen zwischen Professionswissen, Unterrichtsqualität und Unterrichtserfolg Eva Cauet1, Andreas Borowski2, Hans E. Fischer1 1 Universität Duisburg-Essen, 2Universität Potsdam In den vergangenen Jahren wurden in verschiedenen Fachdisziplinen Tests zur Erhebung des Professionswissens von Lehrkräften entwickelt (z.B. Brovelli, Bölsterli, Rehm & Wilhelm, 2013; Krauss et al., 2008; Kröger, Neumann & Petersen, 2015; Riese, 2009; Schmelzing, 2010), das seit Langem als wichtige Voraussetzung für gutes und erfolgreiches Unterrichten diskutiert wird (vergl. z.B. Abell, 2007). Obwohl die Handlungsrelevanz des explizierbaren Professionswissens nicht empirisch abgesichert ist, werden derartige Testinstrumente oft mit dem Ziel eingesetzt, Aussagen über die Wirksamkeit der Lehrerausbildung zu treffen (vergl. z.B. Blömeke, Kaiser, Döhrmann und Lehmann, 2010). Bevor die prädiktive Validität dieser Testinstrumente für gutes oder erfolgreiches Unterrichten nicht nachgewiesen wird, können diesbezüglich allerdings keine validen Aussagen getroffen werden. Bisher existieren wenige Studien, die Zusammenhänge zwischen Professionswissen, Unterrichtsqualität und Unterrichtserfolg untersuchen. Außerdem liefern diese Studien heterogene Ergebnisse, deren Interpretation mit zahlreichen Unsicherheiten verbunden ist (vergl. Baumert et al., 2010; Ohle, 2010; Ergönenç, Neumann & Fischer, 2014; Vogelsang, 2014, Sadler, Sonnert, Coyle, Cook-Smith & Miller, 2013). Im vorliegenden Beitrag werden am Beispiel einer Teilstudie der zweiten Phase des Projektes „Professionswissen in den Naturwissenschaften“ (ProwiN) (Borowski et al., 2010) die Probleme dargestellt, die sich bei der Untersuchung der Zusammenhänge zwischen Professionswissen und gutem und erfolgreichem Unterrichten ergeben. In Rahmen von ProwiN wurden Testinstrumente zur Erfassung des Fachwissens (CK), fachdidaktischen (PCK) und pädagogischen Wissens (PK) von Biologie-, Chemie- und Physiklehrkräften entwickelt und validiert (zur Physik: Kirschner, 2013). Die fachspezifischen Professionswissenstests für Physiklehrkräfte wurden in einer quasiexperimentellen Feldstudie in einer Teilstichprobe von 23 Gymnasiallehrkräften aus NRW (35% weiblich, MAlter=44 Jahre, SDAlter=12 Jahre) und ihren Klassen der Jahrgangsstufe 8/9 (N=610 Lernende, 57% weiblich, MAlter=14 Jahre, SDAlter=1 Jahr) eingesetzt. Das CK und PCK der Lehrkräfte wurde in Bezug zu ihrem Unterrichtserfolg (Schülerfachwissen am Ende einer mehrmonatigen Unterrichtseinheit zur Mechanik unter Kontrolle des Vorwissens) gesetzt und mit der Qualität des Unterrichts (beurteilt über die kognitiv aktivierende Gestaltung von zwei videographierten Unterrichtsstunden) korreliert. Die kognitive Aktivierung wurde mit einem Ratingmanual (adaptiert nach Vogelsang, 2014) über die Bewertung von 29 Handlungsindikatoren in 7 Subskalen auf einer 3-stufigen Likertskala eingeschätzt (αC,1.Stunde/2.Stunde=.91/.87). Die Professionswissenstests beinhalteten offene und Multiple-Choice Aufgaben (CK: 11 Aufgaben zum Schulwissen/vertieften Schulwissen in Mechanik, Rasch Personen Rel.=.73; PCK: 10 Aufgaben zu Schülervorstellungen, Umgang mit Experimenten und Konzepten in der Mechanik, Rasch Personen Rel.=.59). Der Schülerfachwissentest bestand aus 34 Multiple-Choice Aufgaben zur Mechanik (Rasch Personen Rel. Prä-/Post-Test=.51/.61). Zur Untersuchung der Zusammenhänge zwischen Professionswissen und Unterrichtserfolg wurden Mehrebenenmodelle für die Post-Testwerte der Lernenden gerechnet. Der Anteil der zwischen den Klassen liegenden Varianz an der Gesamtvarianz der Post-Testwerte betrug (10±3)%. Kontrollvariablen auf Schülerebene (Vorwissen, kognitive Fähigkeiten, Geschlecht und Sprache) erklärten R2=(34±3)% (p1-seitig <.001) der Varianz im Post-Test auf Schülerebene. Die Länge der Unterrichtseinheit (Dauer zwischen 10-44 Wochen) erklärte R2=(65±18)% (p1-seitig<.001) der Varianz auf Klassenebene. Weder CK noch PCK waren signifikante Prädiktoren für die Post-Testwerte der Lernenden (γStand.,CK=0.07±0.19, p1-seitig=.363; γStand.,PCK=-0.15±0.16, p1-seitig=.158). Korrelationsanalysen für die Zusammenhänge zwischen Professionswissen und Unterrichtsqualität zeigten signifikante Korrelationen zwischen CK und kognitiver Aktivierung (r=.36±0.19, p1-seitig=.044), aber nicht zwischen PCK und kognitiver Aktivierung (r=.21±0.19, p1-seitig =.165). Bei der Interpretation dieser Ergebnisse ergeben sich folgende Probleme: Bei den Lehrkräften handelt es sich um eine Positivauswahl, was zu einer Unterschätzung von Zusammenhängen führen kann. Zudem ist die Teststärke aufgrund der Stichprobengröße gering. Darüber hinaus können die zum Teil niedrigen Reliabilitäten der Testinstrumente zu Verzerrungen der Ergebnisse führen und mögliche Einflüsse konfundierender Variablen, wie z.B. Klassenführung, nicht ausgeschlossen werden. Eindeutige Aussagen über die Handlungsrelevanz des mit den ProwiN-Tests gemessenen Wissens können deshalb auf Basis der Ergebnisse nicht getroffen werden. Die beschriebenen Probleme werden in vielen Studien als Einschränkungen genannt, ihre Auswirkungen werden allerdings selten im Detail diskutiert. Um die Aussagekraft dieser Studien zu erhöhen, sollte versucht werden, deren Ergebnisse systematisch zu replizieren. Effekte von Aspekten der fachdidaktischen Lehrerexpertise auf die Entwicklung der Schülerkompetenzen – Befunde aus der Domäne Rechnungswesen Christoph Helm Johannes Kepler Universität Linz Theorie In allgemeinbildenden Domänen konnte in empirischen Studien (Mathematik: Baumert et al. 2010; Naturwissenschaften: Cauet et al. 2015) bereits gezeigt werden, dass das Professionswissen von Lehrkräften eine wichtige Voraussetzung für Qualitätsmerkmale von Unterricht (v.a. kognitives Aktivierungspotential) und die Entwicklung von Schülerleistungen darstellt. Vergleichbare Studien im berufsbildenden, v.a. kaufmännischen Bereich fehlen bislang, sind aber bspw. für den Rechnungswesenunterricht (RW) bereits in Vorbereitung (Wuttke et al. 2015). Während aktuelle, videobasierte Studien (z.B. ProwiN, Pythagoras, …) das Professionswissen und Unterrichtsqualitätsmerkmale eng gekoppelt an bestimmte Curriculuminhalte (Mechanik, Satz des Pythagoras, …) erfassen, nimmt die vorliegende Studie – ähnlich der COACTIV-Studie – den Einfluss von Lehrerwissen (über unterschiedliche Curriculuminhalte) auf Schülerleistungen bei Jahresstoffüberprüfungen in der Domäne Rechnungswesen in den Blick. Dabei stützen sich die Analysen auf das Modell zur fachdidaktischen Lehrerkompetenz (PCK) von Berger et al. (2013), das für das Fach Rechnungswesen die drei Aspekte „Wissen über Schülerkognitionen, das Zugänglichmachen von Inhalten und das Aktivierungspotential von Aufgaben“ als relevant erachtet. Darauf aufbauend wird angenommen, dass RW-Lehrer/innen, die über höheres Professionswissen in diesen drei Bereichen verfügen, stärker kognitiv aktivierenden Unterricht anbieten, der wiederum zu stärkeren Entwicklungen von Schülerleistungen im Rechnungswesen führt. Fragestellung Lassen sich mittels Onlinebefragung die drei Aspekte der RW-PCK nach Berger et al. (2013) erfassen? Falls ja, stehen diese RW-PCK-Aspekte im Zusammenhang mit dem kognitiven Aktivierungspotential des RW-Unterrichts und mit der Entwicklung der Schülerleistungen im RW (kontrolliert für die Mathematikfähigkeit der Schüler/innen)? Methode Um die RW-PCK-Facetten zu erfassen, wurden nahezu alle österreichischen Kommerzialisten (= Lehrer/innen, die Wirtschaftsfächer unterrichten, N = 524) eingeladen an einem Onlinefragebogen mit Selbsteinschätzungs- und Testaufgaben teilzunehmen. Die insgesamt elf Fragenblöcke (68 Items: davon 36 Performance-Items und fünf offene Fragen) zur fachdidaktischen Expertise wurden von 89 Lehrpersonen (67 % weiblich, AlterM = 47, AlterSD = 9) beantwortet (Rücklaufquote: 17 %). Die Fragenblöcke decken den Umgang mit Schülerfehlvorstellungen, die Diagnosefähigkeit von Aufgaben- und Lernschwierigkeiten sowie zentralen Gedankenschritten beim Lösen von Aufgaben, die Flexibilität in Hinblick auf alternative Erklärungs- bzw. Darstellungsformen, das Wissen über das kognitive Aktivierungspotential von Aufgaben, das Wissen über (fach)didaktische Modelle und das selbsteingeschätzte didaktische Handeln in Hinblick auf kompetenzorientierten Unterricht ab. 20 der getesteten Lehrpersonen stammen aus der LOTUS-Studie (Helm 2015a), in der jeweils eine RW-Schulklasse dieser Lehrer/innen von der 9. bis zur 11. Schulstufe jährlich mit einem RW-Kompetenztest (Helm 2015b) getestet als auch mit einem Onlinefragebogen zur kognitiven Aktivierung im Unterricht (Skala: DaQS, o.J.) befragt wurde (N9. Stufe = 702, AlterM = 14.4, AlterSD = 0.74). Die so ermittelten Lehrer- sowie Schülerkompetenzen und Unterrichtseinschätzungen wurden in ein Mehrebenenpfadmodell überführt, um die oben dargestellte Wirkungskette zu prüfen. Erste deskriptive Ergebnisse Erste Analysen zeigen, dass die erhobenen RW-PCK-Facetten nur moderat bis mittel miteinander korrelieren, sodass eine eindimensionale PCK-Kompetenzstruktur für das Fach RW unwahrscheinlich ist. Bspw. korreliert die Fähigkeit zur Diagnose zentraler Gedankenschritte von Schüler/inne/n beim Erstellen der Skontoverbuchung zwischen r = .278* und r = .333* mit dem didaktischen Handeln im kompetenzorientierten Unterricht. Darüber hinaus hängt die Diagnosefähigkeit in Hinblick auf Aufgabenschwierigkeiten mit der Anzahl der jährlich besuchten fachdidaktischen Fortbildung zusammen (r = .273*). Werden die RW-PCK-Facetten in korrelativer Beziehung zu den Schülerleistungen und der von den Schüler/innen wahrgenommen kognitiven Aktivierung gesetzt, so ergibt sich folgendes Bild: Während die von den Lehrpersonen berichtete Kompetenzorientierung negativ im Zusammenhang mit den Schülerleistungen in RW stehen (r = - .275, aufgrund des N nicht signifikant), hängt die Diagnosefähigkeit (Gedankenschritte) stark positiv mit den Schülerleistungen zusammen (r = .579*). Beide PCK-Facetten sowie das Wissen über didaktische Modelle und über unterschiedliche Strategien des Zugänglichmachens von RW-Konzepten korrelieren ebenfalls stark positiv mit der von den Schüler/inne/n erlebten kognitiven Aktivierung im RW-Unterricht (r = .490*-.702**), sodass diesbezügliche Mediationseffekt in einem Pfadmodell analysiert werden müssen. Die Ergebnisse werden vor dem Hintergrund der eingesetzten Messinstrumente kritisch diskutiert. Implikationen für Folgeforschungen und die wirtschaftspädagogische Aus- und Fortbildung in Österreich werden aufgezeigt. ID: 323 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktik Deutsch Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Lese- und Sprachförderung Stichworte: Schreibkompetenz, Beurteilungsverfahren, Validität, Textbeurteilung, Literalität Schreibkompetenz messen und beurteilen Chair(s): Thomas Canz (FernUniversität in Hagen), Michael Krelle (Universität Vechta) Diskutant(en): Michael Krelle (Universität Vechta) In modernen Gesellschaften steigt aufgrund der zunehmenden räumlichen und zeitlichen Distanz der in einer Kommunikationssituation beteiligten Partner auch der Grad an Literalität der Gesellschaft und die Anforderungen an die Leseund Schreibkompetenz der Mitglieder dieser Gesellschaft. Daher ist es ein zentrales Ziel, diese Kompetenzen im Rahmen der Schulbildung erfolgreich zu vermitteln; die Überprüfung des Erfolgs dieser Vermittlung ist eine zentrale Aufgabe sowohl des schulischen Unterrichts als auch des wissenschaftlichen Bildungsmonitorings. Das Symposium fokussiert die produktive literale Kompetenz des Schreibens und greift hierbei einige Probleme und Fragestellungen heraus, die mit einer systematischen Erfassung von Schreibkompetenz verbunden sind. Das Symposium betrachtet Schreibkompetenz hierbei aus inter- und multidisziplinären Sicht und integriert Blickwinkel der Fachdidaktik, der Fachwissenschaft (Germanistik, Linguistik), der Psychologie und der Empirischen Bildungsforschung. Der erste Beitrag von Jost, Becker-Mrotzek, Grabowski, Brinkhaus, Hennecke & Wilmsmeier widmet sich einer zentralen Fragestellung bei der Messung von Schreibkompetenz, i. e. wie die Bewertung von Texten als Schreibprodukten in geeigneter Weise erfolgen sollte, anhand analytischer Bewertungskriterien oder anhand holistischer Beurteilungsskalen. Im Rahmen einer kritischen Auseinandersetzung werden ökonomische und Validitätsaspekte fokussiert betrachtet. Auch der zweite Beitrag von Canz und Böhme widmet sich einem Validitäsaspekt bei der Messung von Schreibkompetenz. Die Autoren untersuchen, inwiefern bei einer standardisierten Erfassung des Konstrukts aufgrund der textuellen Präsentation der Aufgabeninstruktionen die ermittelten Schreibleistungswerte durch Lesekompetenzanteile verzerrt sind. Der dritte Beitrag fokussiert ebenfalls einen möglichen die Validität der Schreibkompetenzmessung einschränkenden Aspekt, vorliegend auf Beurteilungsebene. Hoffmann und Canz gehen der Frage nach, inwieweit die Beurteilung von Schülertexten, anhand derer auf Schreibkompetenzen rückgeschlossen wird, durch die Handschriftlichkeit der Texte und durch die Qualität der Handschrift beeinflusst ist. Afra Sturm nimmt schließlich im Rahmen des vierten Beitrages einen anderen Blickwinkel auf Schreibkompetenz ein und fokussiert den Schreibprozess und die Teilfähigkeit des Formulierens. Die Autorin befasst sich hierbei mit Fragen der Dimensionalität des Konstrukts Formulieren sowie dessen Messbarkeit. Abschließend diskutiert und integriert Michael Krelle die präsentierten Ergebnisse und stellt sie in einem größeren Zusammenhang dar. Beiträge des Symposiums Analytische und holistische Ratingverfahren zur Bestimmung von Textqualität als Indikator für Schreibkompetenz Jörg Jost1, Michael Becker-Mrotzek1, Joachim Grabowski2, Moti Brinkhaus2, Vera Hennecke2, Sabine Wilmsmeier1 1 Universität zu Köln, 2Leibniz Universität Hannover Das Verfassen eines Textes erfordert Fähigkeiten auf verschiedenen Prozessebenen (Hayes & Flower 1980, Hayes 2012). Prozessiert werden beim Schreiben neben der motorischen Ausführung, Planung, Formulierung und Überarbeitungen. Dabei werden verschiedene Arten von Wissen wie prozedurales Wissen, Problemlösewissen oder metakognitives Wissen aktiviert (Becker-Mrotzek & Schindler 2007; Becker-Mrotzek i.V.). Im Allgemeinen zeigen sich Kompetenzen im Schreiben auf den verschiedenen Ebenen in der Produktion kommunikativ funktionierender Texte. Zur Schreibkompetenz gehört damit wesentlich die Fähigkeit, in kommunikativer Absicht für andere zu schreiben. Es gehört weiterhin zur Schreibkompetenz, dass geschriebene Texte eine kohärenzstiftende Struktur aufweisen; Kohärenz ist ein, wenn nicht das zentrale Merkmal von Texten (Starke 2001). Auf dieser theoretischen Grundlage wird im zugrundeliegenden BMBF-Projekt „Schreibkompetenz“ nach den Teilkomponenten „Perspektivenübernahme und Adressatenorientierung“ und „Kohärenzherstellung im Text“ bei Schüler/innen der 5. und 9. Klasse gefragt. Erfasst wurden die Teilfähigkeiten isoliert (d. h. entkoppelt von der Produktion von Texten) sowie integriert beim Schreiben eines Textes. Letzteres verlangte von den Schreiber/innen die Produktion eines Berichtes, einer Instruktion und einer Argumentation. Alle Aufgaben waren profiliert (Bachmann & Becker-Mrotzek 2010) und basierten auf einem Bildimpuls. Realisierungen der Texte auf verschiedenen Ebenen (Informationsgehalt, Struktur und Kohärenz, sprachliche Realisierung) und damit Ausprägungen von Textqualität (Nussbaumer 1991) wurden als Indikatoren für Schreibkompetenz gewertet (BeckerMrotzek et al. 2014). Die Textqualität wurde über Ratingverfahren (holistisch und analytisch) ermittelt. Für das holistische Rating wurden NAEP-Ratingskalen zugrunde gelegt. Das analytische Rating wurde auf der Grundlage des Züricher Textanalyserasters (Nussbaumer 1991) entwickelt und bildete Informationsgehalt, Struktur und Kohärenz sowie sprachliche Realisierung ab. Im Vortrag wird die Möglichkeit der Adaption des Züricher Textanalyserasters für die Bearbeitung unterschiedlicher Schreibaufgaben (Instruktion, Bericht, Argumentation) und Forschungsfragen (Teilfähigkeiten Adressatenorientierung und Kohärenz) thematisiert. Es wird gefragt, ob über Ratingverfahren ermittelte Skalen (z.B. zu „Informationsgehalt“, „Kohärenz“) einen quantifizierbaren Zugang zu Textqualität erlauben. Die Ergebnisse zeigen u.a., dass die interne Konsistenz der Skalen (Cronbach’s α) einzelner theoretisch postulierter Kriterien von Textqualität absolut variiert, aber auch zwischen verschiedenen Textsorten unterschiedlich ausfallen kann, z.B. für die Skala „Informationsgehalt (= Vollständigkeit von Informationen)“ .46 für die Textsorte Instruktionen und .71 für die Textsorte Bericht; aber für die Skala „Sprachliche Realisierung“ .62 für die Textsorte Instruktion und .64 für die Textsorte Bericht. Die an konkreten Schreibaufgaben dekomponierten und konkretisierten Beurteilungsaspekte des Züricher Textanalyserasters bilden empirisch also nicht (oder in unterschiedlichem Ausmaß) die im Modell angenommenen Aspekte ab und können auch nicht als generell über Textsorten hinweg gelten. Die Validität, aber auch die Ökonomie des im Projekt eingesetzten analytischen Ratingverfahrens wird kritisch im Vergleich zu holistischen Verfahren diskutiert. Damit wird eine zentrale Fragestellung im Zusammenhang mit der Erfassung von Schreibkompetenzen thematisiert. Der Stellenwert der Lesekompetenz bei der Messung von Schreibkompetenz im Rahmen großer Schulleistungsstudien Canz Thomas1, Katrin Böhme2 1 FernUniversität in Hagen, 2Universität Potsdam Bei der Messung psychologischer Konstrukte kann die Validität durch konstrukt-irrelevante Varianzanteile gemindert sein (Messick 1990, 1996). In einem solchen Fall fließen in die Messung Aspekte ein, die einem anderen als dem intendierten Konstrukt zuzuordnen sind. Für eine valide Schreibkompetenzmessung ist es daher geboten, den Einfluss anderer sprachlicher und nichtsprachlicher Kompetenzanteile zu vermeiden bzw. zu minimieren. Vor besonderen Herausforderungen stehen hierbei standardisierte Schreibkompetenzmessungen im Large-Scale-Bereich in Bezug auf die Miterfassung von Lesekompetenzanteilen. Um eine reliable Beurteilung der Texte hinsichtlich der demonstrierten Schreibkompetenz zu gewährleisten, ist es notwendig, eine Engführung der Schreibaufgaben vorzunehmen, da nur auf diese Weise standardisierte Beurteilungsmanuale zum Einsatz kommen können. Diese Engführung der Schreibaufgaben erfolgt durch eine – teilweise detaillierte – Instruktion und in der Regel durch die Vorgabe eines Stimulus (Wort- und/oder Bildmaterial), welcher als referentielle Grundlage für den Arbeitsauftrag fungiert. Aufgrund des Einsatzes textueller Instruktionen und Stimuli im Rahmen von Schreibaufgaben stellt sich die Frage, inwiefern die auf Basis der Bearbeitungen solcher Aufgaben gewonnenen Einschätzungen der Schreibkompetenz durch die Lesekompetenz der Schreibenden verzerrt sind. Da sprachliche Fähigkeiten wie das Lesen und das Schreiben aufgrund gemeinsamer zugrundliegender kognitiver Prozesse und Ressourcen hoch miteinander assoziiert sind (Bremerich-Vos, Böhme & Robitzsch, 2009; Engelkamp, 1995; Heller, 1999; Jude, 2008; Smith, 2009), steht die Beantwortung der obigen Frage vor der besonderen methodischen Herausforderung, dass die Betrachtung einfacher Zusammenhänge zwischen Lese- und Schreibkompetenz nicht hinreichend ist, vielmehr muss das Ziel sein, schreibaufgabenspezifische Einflüsse der Lesekompetenz zu ermitteln, welche über den allgemeinen Zusammenhang zwischen den Konstrukten hinausgehen. Eine Möglichkeit, dieser Herausforderung zu begegnen, ist es, die Instruktions- und Stimulustexte der Schreibaufgaben anhand leseschwierigkeitsbestimmender Merkmalen zu klassifizieren (Freedle & Kostin, 1993; Köster, 2005; Nold & Rossa, 2007; Nunan & Koebke, 1995; Schweitzer, 2006). Mit diesen Merkmalen lässt sich die spezifische textbezogene Anforderung an die Lesekompetenz quantifizieren. Unter Berücksichtigung dieser leseschwierigkeitsbestimmenden Merkmale kann obige Fragestellung präzisiert werden als „Inwiefern variiert der Zusammenhang zwischen Lese- und Schreibkompetenz in Abhängigkeit von der schreibaufgabenspezifischen Anforderung an die Lesekompetenz?“. Untersucht wurde diese Fragestellung im Rahmen einer Pilotierungsstudie zur Erprobung von Aufgaben in den Kompetenzbereichen Lesen (19 Aufgaben) und Schreiben (7 Aufgaben) unter Beteiligung von 1726 Schülerinnen und Schülern der achten Jahrgangsstufe aller Schulformen des allgemeinbildenden Schulsystems der Bundesrepublik Deutschland. Im Rahmen von Zwei-Ebenen-Moderator-Analysen wurde untersucht, inwiefern der Zusammenhang zwischen der aufgabenspezifischen Schreibleistung und der Lesekompetenz (Ebene 1) durch die leseschwierigkeitsbestimmenden Merkmale der Schreibaufgaben bzw. deren Stimulus- und Instruktionstexte (Ebene 2) moderiert wird. Als mögliche Moderatoren wurden insgesamt zwölf sprachliche Merkmale untersucht, welche sich den Kategorien Textmenge/Textlänge, sprachliche Komplexität, lexikalisches Niveau sowie Kombinationsmaße zur Erfassung der Leseschwierigkeit zuordnen lassen. Es zeigte sich in Übereinstimmung mit Ergebnissen vorheriger Studien ein hoher Basiszusammenhang zwischen Lese- und Schreibkompetenz (u. a. Bremerich-Vos et al., 2009; Jude, 2008; Smith, 2009). Dieser Zusammenhang wird durch zwei der zwölf untersuchten Variablen statistisch bedeutsam moderiert: syntaktische Komplexität und durchschnittliche Häufigkeit/Seltenheit der verwendeten Wörter. Insgesamt entfielen jedoch nur 3.8 % der Gesamtleistungsvarianz auf aufgabenspezifische Effekte, nur 1.6 % auf lesekompetenzrelatierte Effekte. Die Miterfassung von Lesefähigkeiten bei der Messung von Schreibkompetenz kann in der vorliegenden Studie somit als praktisch irrelevant angesehen werden. Die Generalisierbarkeit dieser Befunde unterliegt jedoch einigen Einschränkungen, welche abschließend diskutiert werden. Welche Effekte hat die Schrift auf die Beurteilung von Schülertexten im Rahmen von Schulleistungsstudien und anderen empirischen Untersuchungen zur Schreibkompetenz? Lars Hoffmann1, Thomas Canz2 1 Humboldt-Universität zu Berlin, 2FernUniversität in Hagen Theoretischer Hintergrund Eine bedeutsame Fehlerquelle bei der Beurteilung von Schülertexten stellen Urteilsverzerrungen dar, die, soziokognitiven Theorien wie dem „Heuristisch-systematischen Modell“ (Chen & Chaiken, 1999) oder dem „Kontinuum-Modell der Eindrucksbildung“ (Fiske & Neuberg, 1990) zufolge, aus einer heuristischen bzw. kategoriengeleiteten Informationsverarbeitung resultieren. Im Rahmen von Schulleistungsstudien oder anderen empirischen Untersuchungen zur Schreibkompetenz von Schülerinnen und Schülern werden die meisten dieser Verzerrungen durch eine anonymisierte Auswertung ausgeschlossen, sodass z. B. das Geschlecht, der sozioökonomischen Status oder der Zuwanderungshintergrund der Verfasser der zu beurteilenden Texte nicht bekannt sind. Zumeist nicht experimentell kontrolliert wird hingegen ein möglicher Halo-Effekt der Kovariablen Schrift, deren verzerrender Einfluss mehrfach empirisch belegt wurde. So konnte gezeigt werden, dass die Beurteilung von Schülertexten weniger positiv ausfällt, wenn diese Texte in einer schlecht lesbaren, unsauberen Handschrift verfasst sind (z. B. Chase, 1968; Hughes, Keeling & Tuck, 1983; Sprouse & Webb, 1994; Klein & Taub, 2005; Greifeneder et al., 2012). Des Weiteren wurde ermittelt, dass handschriftlich verfasste Texte tendenziell positiver bewertet werden als Texte, die mit einer Schreibmaschine oder einem Computer abgeschrieben wurden (z. B. Powers, Fowles, Farnum & Ramsey, 1994). Weitgehend offen ist, inwiefern die Befunde zum Einfluss der Schrift auf die Beurteilung von Schülertexten auch auf Schulleistungsstudien oder auf vergleichbare empirische Schreibkompetenzuntersuchungen übertragbar sind. Während die oben skizzierten Effekte an Stichproben aus Lehrkräften oder Lehramtsstudenten ermittelt wurden, werden Schülertexte im Rahmen solcher Studien in der Regel von mehrfach geschulten Kodierern auf der Grundlage eines Kodiermanuals beurteilt. Die Beurteilung der Schülertexte sollte dementsprechend nicht auf heuristisch-kategoriengeleiteten, sondern vielmehr auf merkmalsgeleiteten Informationsverarbeitungsprozessen basieren und dementsprechend robust gegenüber Urteilsverzerrungen sein (vgl. Chen & Chaiken, 1999; Fiske & Neuberg, 1990). Fragestellung Im Beitrag wird der Frage nachgegangen, inwieweit sich ein verzerrender Einfluss der Schrift auch dann zeigt, wenn die Kodierung von Schülertexten durch geschulte Kodierer erfolgt. Hierfür wurden zum einen Zusammenhänge zwischen der Lesbarkeit der Handschrift und den Texturteilen untersucht. Zum anderen wurde geprüft, inwieweit das Medium (handschriftlicher Text vs. am Computer abgeschrieben) einen Effekt auf die Textbeurteilung hat. Methode Die Datengrundlage des Beitrags umfasst 430 Texte von Schülerinnen und Schülern der neunten und zehnten Jahrgangsstufe, die zu insgesamt sechs Schreibaufgaben verfasst wurden, die jeweils auf argumentatives, informierendes oder narratives Schreiben zielen. Die Texte entstanden im Rahmen einer Normierungsstudie des Instituts zur Qualitätsentwicklung im Bildungswesen, die der Entwicklung eines Kompetenzstufenmodells zu den Bildungsstandards im Fach Deutsch für den Mittleren Schulabschluss im Kompetenzbereich Schreiben diente (KMK, 2004, 2014). Die Texte wurden von geschulten Kodierern in zwei unterschiedlichen Varianten – als Scan des handschriftlichen Originals und in einer am Computer abgetippten Variante – kodiert. Die Qualität der Schülertexte wurde global mithilfe einer fünfstufigen Skala beurteilt, zusätzlich wurden die Teilaspekte Inhalt, Stil und sprachliche Richtigkeit kodiert. Die Lesbarkeit der Handschrift, in der die Schülertexte verfasst waren, wurde nachträglich, sowohl holistisch als auch analytisch, beurteilt. Die Bearbeitung der oben genannten Fragestellungen erfolgte vornehmlich unter Verwendung von regressions- und varianzanalytischen Verfahren. Ergebnisse Zwischen den Texturteilen und der Lesbarkeit der Handschrift fanden sich lediglich geringe korrelative Zusammenhänge. Aus den Ergebnissen einer multiplen Regression des Globalurteils auf die Urteile zu Inhalt, Stil, sprachlicher Richtigkeit und Handschrift wurde zunächst gefolgert, dass die Lesbarkeit keinen Effekt auf die Texturteile hat. Hingegen wurde ein Haupteffekt des Mediums gefunden, wobei Inhalt und Stil der Schülertexte, im Kontrast zu anderen Studien (vgl. Powers et al., 1994), in der am Computer abgeschriebenen Variante signifikant positiver beurteilt wurden. Zusätzlich wurden einzelne Hinweise identifiziert, die darauf schließen lassen, dass die Differenzen von Inhalts- und Stilurteilen zwischen Computer- und Handschriftvarianten der Schülertexte von der Lesbarkeit der Handschrift moderiert sein könnten. In weiterführenden Analysen der kriterialen Schrifturteile soll daher exploriert werden, inwieweit bestimmte Charakteristika der Lesbarkeit der Handschrift hierbei von besonderer Bedeutung sind. Basale Schreibfähigkeiten an der Schnittstelle zu hierarchiehöheren Schreibfähigkeiten Afra Sturm Pädagogische Hochschule FHNW Das adressatengerechte Formulieren eines Briefes gelingt ca. 29% der Schüler/-innen nicht, wie die DESI-Studie zeigt, vielmehr sind deren Texte von einer niedrigen sprachlichen Qualität, indem sie u.a. nur begrenztes Wortmaterial aufweisen (Neumann & Lehmann, 2008). Ein großer Leistungsunterschied zeigt sich außerdem in Bezug auf den sprachlichen Hintergrund: Mehrsprachig Aufwachsende und v.a. Jugendliche mit nicht deutscher L1 zeigen deutlich tiefere Leistungen als SuS mit Deutsch als L1. Formulieren als hierarchiehöherer Prozess ist der Teilprozess, der am stärksten von sprachlicher Erfahrung beeinflusst ist (Hayes, 2012). Entsprechend kann gezeigt werden, dass sich Schreibflüssigkeit – gemessen in Wörtern pro Minute – mit zunehmender sprachlicher Erfahrung steigert und dass die durchschnittlichen Schreibportionen – gemessen als durchschnittliche Anzahl Wörter, die ohne Unterbruch geschrieben werden (sog. bursts) – ebenfalls größer werden (Chenoweth & Hayes, 2001). Schreibflüssigkeit korreliert dabei mit der Textqualität, wobei der Zusammenhang auf höheren Klassenstufen zunehmend an Bedeutung verliert (Amato & Watkins, 2011). Im Vergleich zu anderen hierarchiehöheren Prozessen wie Planen oder Überarbeiten geht Formulieren mit der Transkription – verstanden als das Überführen von sprachlicher Repräsentation in Schrift (Hayes, 2012) – eine enge Verbindung ein: Formulieren und Transkription zusammen stellen im Hinblick auf die verfügbaren kognitiven Ressourcen eine Art Nadelöhr dar, da beide den Schreibprozess spürbar verlangsamen können. Es kann deshalb davon ausgegangen werden, dass Formulieren eher als bidirektionaler kognitiv-sprachlicher Transformationsprozess zu denken ist (Alves, 2012) und damit eine Art Zwischenstelle einnimmt. In diesem Beitrag wird zum einen Formulieren als mehrdimensionales Konstrukt ausgeführt, und zwar basierend auf den theoretischen Vorarbeiten im Rahmen folgender Studie: a) Die Interventionsstudie «Basale Schreibfähigkeiten (BASCH)» (2015–2017), in der bei 4.-KlässlerInnen mit Deutsch als L1 und L2 untersucht wird, ob sich ein Ansatz zur Förderung von flüssigem Formulieren positiv auf die sprachliche Qualität der Texte auswirkt. Zum anderen wird auch diskutiert, wie solche Fähigkeiten erfasst werden können. Dazu wird folgende Studie beigezogen: b) «Literalität in Alltag und Beruf (LAB)» (2009–2013) zu literal schwachen Erwachsenen (n=235) und BerufsschülerInnen (n=361), bei denen u.a. untersucht wurde, über welche basalen Lese- und Schreibfähigkeiten sie verfügen. In der Studie b) wurde zur Erfassung der Leseflüssigkeit der Stolperwörtertest von Metze (2003) eingesetzt. Basierend auf Benson & Campbell (2009) wurde zudem ein Test zur Erfassung der Schreibflüssigkeit entwickelt (Sturm, 2014). Da das Deutsche andere orthografische wie auch sprachsystematische Regularitäten aufweist, können die fürs Englische entwickelten Verfahren nicht ohne Weiteres aufs Deutsche übertragen werden. Insbesondere erwies sich die Grundgröße Wort fürs Deutsche als nicht geeignet, weshalb von der Silbe als Grundgröße ausgegangen wurde. Erfasst werden mit einem Schreibflüssigkeitstest schreibproduktabhängige (absolute) Maße – dazu zählen Anzahl Silben, Anzahl korrekte Silben oder sog. Worteinheiten (zwei nebeneinander liegende korrekt verschriftete Wörter) – sowie auch schreibproduktunabhängige (relative) Maße wie der prozentuale Anteil korrekter Silben etc. Für beide Verfahren beträgt die reine Testzeit für Berufsschüler/-innen (=B-Gruppe) und literal schwache Erwachsene (=EGruppe) 3 Minuten. Ca. ein Fünftel der Schreibflüssigkeitstexte aus der B-Gruppe wurde von zwei unabhängigen Ratern ausgewertet. Die Interrater-Reliabilität wurde mit dem Pearson-Korrelationskoeffizienten berechnet und beträgt für alle Kennwerte zwischen .93 und .99. Ausgewählte Befunde sind folgende: – Durchschnittlich liest die B-Gruppe in 3 Minuten 37,5 Sätze korrekt (SD=3,2), während die E-Gruppe nur 18,6 Sätze korrekt liest (SD=3,2). Der Unterschied zwischen den beiden Gruppen ist mit d=1.97 beträchtlich. – Während die B-Gruppe in 3 Minuten durchschnittlich 87,4 Silben schreibt, sind es für die E-Gruppe 63,4 Silben (d=.99). – In Bezug auf die E-Gruppe zeigen sich deutlich stärkere Zusammenhänge zwischen basalen Lese- und Schreibfähigkeiten als bei der B-Gruppe. So korrelieren Anzahl Silben mit der Anzahl korrekt gelesener Silben bei der E-Gruppe mit r=.57 (p<.01) und bei der B-Gruppe mit r=.17 (p<.01). In einem Ausblick wird dargelegt, wie Schreibflüssigkeit bei 4.-KlässlerInnen erfasst werden kann. Dazu werden Befunde aus einem Pretest präsentiert. ID: 325 Symposium Disziplinen-Cluster: Psychologie Thematisches Cluster: Motivation und Emotion Stichworte: Motivation, Zielorientierungen, Spezifität, Stabilität Lern- und Leistungsmotivation: Aspekte von Spezifität und Stabilität Chair(s): Birgit Spinath (Universität Heidelberg), Katharina Kriegbaum (Universität Heidelberg) Diskutant(en): Markus Dresel (Universität Augsburg) Motivation ist eine zentrale Determinante von Lern- und Leistungsverhalten. In diesem Symposium wird es um Aspekte der Spezifität (vs. Breite) und Stabilität (vs. Veränderung) motivationaler Konstrukte gehen. Im Fokus stehen zwei Konzeptionen von motivationalen Wertzuschreibungen, nämlich Zielorientierungen und Interesse. Zum einen wird die Bedeutung der Spezifität bzw. Breite der Erfassung von Zielorientierungen für die Vorhersage lern- und leistungsbezogener Variablen beleuchtet. Daran anschließend wird die Frage gestellt, wie sich aus der Berücksichtigung unterschiedlicher Levels an Spezifität bei der Erfassung von Zielorientierungen Erklärungen für deren transsituationale Konsistenz ableiten lassen. Die Betrachtung der Stabilität über Situationen wird durch die Betrachtung der zeitlichen Veränderung ergänzt, wobei die Veränderung von Zielorientierungen und Interesse über Schülergenerationen hinweg sowie im Längsschnitt betrachtet wird. Die Zusammenstellung der Beiträge bietet neue Einsichten bezüglich der Erfassung und Veränderung von Lern- und Leistungsmotivation. Die Beiträge von Sparfeldt et al. sowie Janke und Dickhäuser beleuchten, dass sich Personen sehr unterschiedlich breite Ziele setzen können, begonnen mit Lebenszielen bis hinzu schulfachspezifischen Zielorientierungen. Sparfeldt et al. gehen in ihrem Beitrag der Frage nach, ob Zielorientierungen schulfachübergreifend oder schulfachspezifisch operationalisiert werden sollten. Bei der Vorhersage von Fachzensuren erwiesen sich fachspezifische Zielorientierungen als stärkere Prädiktoren, während bei der Vorhersage einer schulfachübergreifenden Leistung die schulfachübergreifenden Zielorientierungen erklärungsmächtiger waren. Inwiefern die Spezifität der gesetzten Ziele eine Erklärung für die transsituationale Konsistenz von Zielorientierungen bietet, wird im Beitrag von Janke und Dickhäuser untersucht. Anhand einer Studierenden- sowie Lehrerstichprobe konnte gezeigt werden, dass moderat positive Zusammenhänge zwischen intrinsischen Lebenszielen und einer Lernzielorientierung einerseits sowie extrinsischen Lebenszielen und einer Leistungszielorientierung andererseits bestehen. Die Beiträge von Kriegbaum et al. sowie von Retelsdorf et al. beleuchten, wie sich Motivation im Schulkontext über die Zeit hinweg verändert. Dabei untersuchen Kriegbaum et al. die Veränderungen der Zielorientierungen über Schülergenerationen hinweg, in dem sie die im Abstand von 10 Jahren erhobenen Normstichproben für die Skalen zur Erfassung der Lern- und Leistungsmotivation (SELLMO) miteinander vergleichen. Erwartungskonform zeigten sich für drei der vier Skalen der Zielorientierungen negative Veränderungen über die Zeit. Der Beitrag von Retelsdorf et al. untersucht, inwiefern sich aktuelle und habituelle Lesemotivation bei Schülerinnen und Schülern von der fünften bis zur neunten Klasse verändern, und ob diese Veränderungen miteinander zusammenhängen. Es zeigte sich, dass sowohl das aktuelle als auch habituelle Leseinteresse über den untersuchten Zeitraum abnahm und diese Veränderungen moderat korrelierten. Die Beiträge werden diskutiert von Prof. Markus Dresel. Beiträge des Symposiums Lernen als Lebensziel: Wie intrinsische und extrinsische Aspirationen mit Zielorientierungen zusammenhängen Stefan Janke, Oliver Dickhäuser Universität Mannheim Lernzielorientierungen (der Wunsch, in Bildungssituationen möglichst viel hinzuzulernen) und Leistungszielorientierungen (der Wunsch, in Bildungssituationen möglichst kompetent zu erscheinen) haben sich als zumindest partiell situationsübergreifend stabil erwiesen (Fryer & Elliot, 2007). Diese Stabilität wurde in der Vergangenheit häufig durch zeitstabile Determinanten, etwa dem Leistungsmotiv erklärt (u.a. Elliot & Church, 1997). Nicht beachtet wurde hingegen, dass Zielorientierungen auch von Aspirationen beeinflusst werden, die nicht auf Lern- und Leistungssituationen beschränkt sind. Dies verwundert, da speziell die Literatur zur Selbstbestimmungstheorie (Deci & Ryan, 2000) klare Definitionen für höher aggregierten Aspirationen liefert, die sich theoretisch auch auf Zielorientierungen auswirken könnten. Diese hoch aggregierten Aspirationen sind Lebensziele, die sich in intrinsische und extrinsische Aspirationen unterteilen lassen (Vansteenkiste, Lens & Deci, 2006). Intrinsische Aspirationen bezeichnen einen übergreifenden Fokus auf Selbstverwirklichung. Im Fokus extrinsischer Aspirationen steht das Streben nach Ruhm, Reichtum und Ansehen. Bezogen auf Lern- und Leistungssituationen ist zu vermuten, dass übergreifende intrinsische Aspirationen mit dem Ausmaß der Lernzielorientierung zusammenhängen, also dem Streben nach Kompetenzerweiterung und damit persönlichem Wachstum. Umgekehrt können extrinsische Aspirationen in unserer Leistungsgesellschaft voraussichtlich vor allem dann erreicht werden, wenn das Individuum auch eine starke Leistungszielorientierung entfaltet. In dem vorliegenden Beitrag prüfen wir, ob die Stärke intrinsischer Aspirationen tatsächlich in positivem Zusammenhang zu dem Ausmaß einer Lernzielorientierung steht, und ob extrinsische Aspirationen positiv prädiktiv für das Ausmaß der Leistungszielorientierung sind. Intrinsische und extrinsische Aspirationen sollten dabei transsituative Determinanten der Zielorientierungen sein. Entsprechend sollten sich die Zusammenhänge zwischen übergeordneten Aspirationen und Zielorientierungen auch in verschiedenen Bildungskontexten zeigen lassen. Wir überprüften unsere Annahme in zwei Online-Befragungsstudien einerseits an Studierenden an deutschen Universitäten (n = 321) und andererseits an Lehrkräften an deutschen Schulen (n = 294). Zur Erfassung von Lebenszielen verwendeten wir in beiden Befragungsstudien die deutsche Fassung des Aspiration Index (Klusmann, Trautwein & Lüdtke, 2005). Für die Erfassung der Zielorientierung verwendeten wir bei den Studierenden die etablierten Skalen zur Erfassung der Lern- und Leistungsmotivation (Spinath, Stiensmeier-Pelster, Schöne & Dickhäuser, 2002) und bei den Lehrkräften eine gut validierte Skala zur Erfassung der Zielorientierungen von Lehrkräften (Nitsche, Dickhäuser, Fasching & Dresel, 2011). Mittels Strukturgleichungsmodellierung wurden Generalfaktoren für intrinsische und extrinsische Aspirationen aus den Subskalen des Aspiration Index extrahiert. Diese Generalfaktoren wurden im nächsten Schritt in Beziehung zu Inhaltsfaktoren gesetzt, welche Lern- und Leistungszieleorientierungen repräsentierten. Die von uns verwendeten Instrumente differenzierten Zielorientierungen auf der Inhaltsebene (Lern- versus Leistungszielorientierungen) und Leistungszielorientierung auch hinsichtlich der Zielvalenz (Annäherungs- versus Vermeidungsleistungszielorientierungen). Um unsere Hypothesen hinsichtlich Zielinhalten zu testen, bereinigten wir die Varianz des Leistungszielorientierungsfaktors um die Varianz der Zielvalenz mit Hilfe von Correlated-TraitCorrelated-Method(-1)-Modellen (für mehr Details zu diesem Verfahren siehe Eid, 2000). In beiden Stichproben ließen sich erwartungsgemäße positive Pfadkoeffizienten von intrinsischen Aspirationen auf das Ausmaß der Lernzielorientierung und von extrinsischen Aspirationen auf das Ausmaß der Leistungszielorientierung nachweisen. Die Varianzaufklärung der Aspirationen war in beiden Stichproben in Bezug auf beide Zielorientierungen substantiell (R² = .32 - .45). Die Ergebnisse beider Studien verdeutlichen, dass Zielorientierungen in engem Zusammenhang zu intrinsischen und extrinsischen Aspirationen stehen. Dieser Zusammenhang erwies sich als Kontextstabil: Er konnte in zwei verschiedenen Gruppen und mit Hilfe verschiedener Zielorientierungsfragebögen nachgewiesen werden. Eine mögliche Schlussfolgerung aus diesem Ergebnismuster ist, dass ein Teil der situationsübergreifenden Stabilität von Zielorientierungen dadurch erklärt werden kann, dass Ziele hierarchisch organisiert sind. Es wäre somit anzunehmen, dass sich höher aggregierte Lebensziele indirekt über Zielorientierungen auf das Erleben und Verhalten in Bildungskontexten auswirken. Es wäre spannend, in zukünftige Forschung diesem Mechanismus genauer auf den Grund zu gehen und im Rahmen von Längsschnittsstudien verstärkt die Rolle von Lebenszielen für die Entwicklung von Lern- und Leistungszielorientierungen und nachfolgenden Erleben und Verhalten in Bildungskontexten in den Blick nehmen. Zielorientierungen: schulfachübergreifend oder schulfachspezifisch? Jörn Sparfeldt1, Johannes Schult1, Linda Wirthwein2, Susanne Buch3, Nicole Brunnemann4, Detlef Rost5 1 Universität des Saarlandes, 2TU Dortmund, 3Bergische Universität Wuppertal, 4Universität Konstanz, 5Universität Marburg Zielorientierungen gelten als bedeutsame motivationale Korrelate und Prädiktoren schulischen Lern- und Leistungsverhaltens, auch wenn die in Metaanalysen berichteten mittleren Zusammenhänge mit Leistungs- und weiteren relevanten outcomeVariablen – bei substantieller Variabilität – häufig eher gering ausfallen (z. B. Wirthwein et al., 2013). Seit Beginn der Zielorientierungsforschung werden Lernziele (Ziel ist, eigene Kompetenzen und Fähigkeiten zu erweitern) von Leistungszielen abgegrenzt, bei denen zwischenzeitlich Annäherungs-Leistungsziele (Ziel ist, eigene Kompetenzen zu zeigen) und VermeidungsLeistungsziele (Ziel ist, eigene Inkompetenzen zu verbergen) unterschieden werden. Des Weiteren fassen einige Autoren Arbeitsvermeidung (als Ziel, schulbezogene Arbeit zu minimieren bzw. zu vermeiden) als weitere Zielorientierung. Lange wurden Zielorientierungen theoretisch-konzeptuell und in den jeweiligen Operationalisierungen ohne Bezug zum jeweils spezifischen Inhalt betrachtet; ungeklärt ist zudem die Frage nach dem jeweils angemessen Spezifitätsniveau (z. B. auf die Schule insgesamt oder auf einzelne Schulfächer bezogen). Im Sinne des Symmetrieprinzips lassen sich bei einander entsprechenden Spezifitätsniveaus engere Zusammenhänge mit Drittvariablen erwarten (doch vgl. für teilweise widersprüchliche Befunde Baranik et al., 2010). Zudem dürfte die Schulfachspezifität für die genannten Zielorientierungen differieren; theoretisch lässt sich eine höhere Schulfachspezifität insbesondere für Lernziele vermuten (z. B. Sparfeldt et al., 2007). Zur Klärung der (teilweise widersprüchlichen) Befundlage beantworteten Schülerinnen und Schüler der 7. bis 10. Klassenstufe (N = 1210) einen Fragebogen, in dem die genannten vier Zielorientierungen mit den Skalen zur Erfassung der Lern- und Leistungsmotivation (SELLMO; Spinath et al., 2002) erfasst wurden – und zwar einerseits auf die Schule im Allgemeinen und andererseits auf sechs Schulfächer bezogen. Darüber hinaus wurden weitere Variablen (u. a. Zensuren als Schulleistungsindikatoren und schulische Selbstkonzepte) gleichermaßen schulfachübergreifend und schulfachspezifisch erfasst. Mittels Korrelationsanalysen wurde – unter Berücksichtigung der hierarchischen Datenstruktur – der Frage nach (bezogen auf die vier Zielorientierungen: differentiellen) Zusammenhängen der Zielorientierungen über die sieben Inhaltsbereiche (schulfachübergreifend, 6 Schulfächer) nachgegangen; hierarchische Regressionsanalysen prüften die statistischen Prädiktionsfragen bei einander entsprechenden / nicht entsprechenden Spezifikationsniveaus (Kriterien: u.a. schulfachübergreifende bzw. schulfachspezifische Selbstkonzepte und Schulleistungen; Prädiktoren: (a) zuerst allgemeine und dann die jeweils korrespondierende schulfachspezifische Zielorientierung, (b) zuerst die jeweils korrespondierende schulfachspezifische Zielorientierung und dann die allgemeine Zielorientierung). Im Sinne der Erwartungen zeigten sich geringere mittlere Interkorrelationen der sechs schulfachspezifischen Lernziele als der entsprechenden Annäherungs-Leistungsziele, der Arbeitsvermeidungen und der Vermeidungs-Leistungsziele. Bezogen auf die statistische Vorhersage der Fachzensuren klärten schulfachspezifische Lernziele – unabhängig davon, ob die jeweils korrespondierende schulfachspezifische Lernzielorientierung als erster Prädiktor und die schulfachübergreifende Lernzielorientierung als zweiter Prädiktor oder ob beide Prädiktoren in umgekehrter Reihenfolge in den Regressionsanalysen berücksichtigt wurden – deutlich mehr Kriteriumsvarianz als die schulfachübergreifende Lernzielorientierung auf. Ein gleichartiges Befundmuster resultierte für Annäherungsleistungsziele und Arbeitsvermeidung (nicht jedoch für Vermeidungs-Leistungsziele). Bei der statistischen Vorhersage der schulfachübergreifenden Schulleistungen ergaben sich zumeist höhere (bzw. maximal vergleichbare) Anteile aufgeklärter Kriteriumsvarianz durch die schulfachübergreifenden als die schulfachspezifischen Zielorientierungen. Ein im Wesentlichen vergleichbares Befundmuster resultierte zudem bei der Betrachtung der statistischen Vorhersage schulfachübergreifender und schulfachspezifischer Selbstkonzepte. Die – bezogen sowohl auf das Zusammenhangsmuster als auch die statistischen Prädiktionen – differentiellen Befunde werden einerseits theoretisch in ihrer Relevanz für die Frage des angemessenen Spezifikationsniveaus von Zielorientierungen und andererseits deren Erfassung diskutiert. Darüber hinaus wird die pädagogische und pädagogisch-psychologische Bedeutsamkeit einer differentiellen Betrachtung erörtert. Negative Veränderungen der Zielorientierungen von Schülerinnen und Schülern über eine Dekade: Vergleich der SELLMO-Normstichproben 2002 und 2012 Kriegbaum Katharina1, Birgit Spinath1, Joachim Stiensmeier-Pelster2, Claudia Schöne2, Oliver Dickhäuser3 1 Universität Heidelberg, 2Universität Gießen, 3Universität Mannheim Es gibt Evidenz dafür, dass Lehrkräfte ein Absinken der Lern- und Leistungsmotivation über Schülergenerationen hinweg wahrnehmen (Cocodia et al., 2003; Howard, 2001). Bislang mangelt es an Studien, welche die tatsächliche Veränderung der Motivation über Schülergenerationen hinweg empirisch untersucht haben. In der hier vorgelegten Studie wurde untersucht, inwiefern sich tatsächlich ein Absinken der schulbezogenen Motivation über Schülergenerationen hinweg feststellen lässt. Erste Evidenz dazu liegt aus PISA-Daten vor, anhand derer gezeigt werden konnte, dass die Lesemotivation im OECD-Durchschnitt signifikant abnahm. Der Anteil der Schülerinnen und Schüler (SuS), die angaben, zum Vergnügen zu lesen, verringerte sich von 2000 zu 2009 um rund 5%. Hingegen zeigte sich für die Freude beim Lesen eine positive Entwicklung für Deutschland über diese neun Jahre (Artelt, Naumann & Schneider, 2009). Diese inkonsistente Befundlage unterstreicht die Notwendigkeit, die Veränderungen verschiedener motivationaler Variablen über Schülergenerationen hinweg zu untersuchen. Die Skalen zur Erfassung der Lern- und Leistungsmotivation (SELLMO; Spinath, Stiensmeier-Pelster, Schöne & Dickhäuser, 2002, 2012) stellen ein etabliertes Instrument zur Erfassung der Zielorientierungen dar und wurden im Jahr 2012 neunormiert. Da für die beiden im Abstand von zehn Jahren durchgeführten Eichungen für das deutsche Schulsystem repräsentative Stichproben zugrunde gelegt wurden, bieten diese Daten eine gute Grundlage, um Veränderungen der Zielorientierungen über Schülergenerationen hinweg zu untersuchen. Wenn SuS im Jahr 2012 im Vergleich zu SuS im Jahr 2002 schlechtere motivationale Voraussetzungen gehabt hätten, würde sich dies in einer geringeren Lernzielorientierung, einer höheren Vermeidungs-Leistungszielorientierung sowie einer höheren Tendenz zur Arbeitsvermeidung zeigen. Da hinsichtlich der Annäherungs-Leistungsziele weniger klar ist, ob diese in Bezug auf schulisches Lernen als positiv oder negativ anzusehen sind, wurde keine Hypothese über deren Veränderung formuliert. Die Eichstichprobe aus dem Jahr 2002 beinhaltete N = 3.326 SuS (51% weiblich) und die Eichstichprobe aus dem Jahr 2012 N = 3.057 SuS (50.9% weiblich) der Klassenstufen 4 bis 10 aller Regelschulformen aus verschiedenen Bundesländern Deutschlands. Um zu überprüfen, ob sich die Zielorientierungen in den beiden Stichproben voneinander unterschieden, wurde zunächst eine multivariate Varianzanalyse (MANOVA) mit den vier Zielorientierungen als abhängige Variablen und den Faktoren Stichprobe (2002 oder 2012), Geschlecht, Klassenstufe und Schulform gerechnet. Um die Effekte genauer zu analysieren, wurden anschließend für jeden Faktor und jede abhängige Variable univariate Varianzanalysen berechnet. Die Ergebnisse der MANOVA zeigten signifikante Mittelwertunterschiede für die beiden Stichproben in Bezug auf die vier Zielorientierungen, wobei sich auch signifikante Effekte für die Klassenstufe und Schulform, nicht aber für das Geschlecht zeigten. Im Einklang mit der vermuteten Verschlechterung der Motivation war für die Lernziele über die zehn Jahre ein signifikanter Abfall zu beobachten (η2 = .01). Erwartungsgemäß zeigten sich für die Vermeidungs-Leistungsziele und Arbeitsvermeidung jeweils signifikante Anstiege (η2 = .01). Für Annäherungs-Leistungsziele ergab sich keine signifikante Veränderung. Auffallend ist, dass der Abfall der Lernziele vor allem auf die Klassenstufen 4 (η2 = .02) und 6 (η2 = .01) sowie auf die Grundschule und das Gymnasium (η2 = .01) zurückgingen, der Anstieg der Vermeidungs-Leistungsziele vor allem auf die Klassenstufen 7 bis 10 sowie das Gymnasium und die Hauptschule (η2 = .02) und der Anstieg der Arbeitsvermeidung hauptsächlich auf Klassenstufe 4 (η2 = .04) und somit die Grundschule. Über einen Zeitraum von 10 Jahren zeigte sich demnach eine negative Veränderung der schulbezogenen Motivation über Schülergenerationen hinweg. Die berichteten Befunde stehen somit im Einklang mit der Wahrnehmung von Lehrkräften, der zufolge Motivation über Schülergenerationen absinkt. Zur Einordnung der Stärke der hier berichteten Effekte sei darauf verwiesen, dass die aufgezeigte Veränderung der Zielorientierungen in derselben Größenordnung wie der Flynn-Effekt liegt (Anstieg der Intelligenz um 3 IQ-Punkte pro Dekade; Flynn, 1987; Pietschnig & Voracek, 2015). Mögliche Ursachen für das Absinken der schulbezogenen Motivation werden diskutiert. Veränderungen und Zusammenhänge aktueller und habitueller Lesemotivation im Verlauf der Sekundarstufe I Jan Retelsdorf1, Olaf Köller1, Jens Möller2, Gabriel Nagy1 1 Leibniz-Institut für die Pädagogik der Naturwissenschaften und M, 2Christian-Albrechts-Universität zu Kiel Theoretischer Hintergrund In der Forschung zur Lesemotivation wird neben qualitativ unterschiedlichen Formen der Lesemotivation auch eine Unterscheidung zwischen aktueller und habitueller Lesemotivation getroffen (z.B. Guthrie, Hoa, Wigfield, Tonks & Perencevich, 2006; Möller & Schiefele, 2004; Schiefele, Schaffner, Möller & Wigfield, 2012). Aktuelle Lesemotivation bezieht sich auf die Motivation einen konkreten Text in einer konkreten Situation zu lesen. Habituelle Lesemotivation resultiert, wenn eine Person wiederholt einen Zustand aktueller Lesemotivation erreicht. Während habituelle Lesemotivation als eine relativ stabile Bereitschaft zu lesen verstanden wird, ist aktuelle Motivation situationsspezifisch definiert. Zwar ist die längsschnittliche Entwicklung habitueller Formen der Lesemotivation vergleichsweise gut untersucht (z.B. McElvany, Kortenbruck & Becker, 2008), Entwicklungstrends der aktuellen Lesemotivation sind bisher aber kaum betrachtet worden. Hier stellt sich die Frage inwieweit Entwicklungsverläufe habitueller und aktueller Formen der Lesemotivation miteinander kovariieren (für erste empirische Hinweise s. Guthrie et al., 2006). Fragestellung In unserem Beitrag untersuchen wir Entwicklungstrends der aktuellen und habituellen Lesemotivation von der 5. bis zur 9. Klasse. Im Fokus stehen drei Komponenten der Motivationsentwicklung, nämlich das Interesseniveau, der Interessentrend und die zeitspezifischen Interessenstates (d.h. Abweichungen vom zugrundeliegenden Trend). Diese werden für zwei Formen der habituellen Motivation (Lesen aus Interesse und Leselust) und die aktuelle Lesemotivation (Interesse an vorgegebenen Textpassagen) untersucht. Methode Zu vier Messzeitpunkten (5. bis 9. Klasse) wurden N = 1508 Schülerinnen und Schüler zu ihrer Lesemotivation befragt. Zu jedem Messzeitpunkt wurden Lesetests bearbeitet, die aus mehreren Texten bestanden. Als Maß aktueller Lesemotivation dienten jeweils zwei Items zur Motivation beim Lesen eines Texts (z.B. „Ich fand den Text interessant“). Die habituelle Lesemotivation wurde mit den Subskalen Leselust und Lesen aus Interesse aus dem Fragebogen zur habituellen Lesemotivation erfasst (Möller & Bonerad, 2007). Die Auswertungen erfolgten mittels Curve-of-Factors-Modellen. In diesen wurden die messzeitpunktspezifischen Konstruktausprägungen mittels latenter Variablen erfasst, die wiederum als Indikatoren der konstruktspezifischen Motivationsniveaus und dem Motivationstrends dienten. Das verwendete Modell ermöglicht nicht nur die Erfassung von konstruktübergreifenden Zusammenhängen zwischen Niveaus und Trends, sondern erlaubt auch die Erfassung von messfehlerbereinigten zeitspezifischen Statekovarianzen. Ergebnisse und Diskussion Die Güte des getesteten Modells war akzeptabel: χ²(1623) = 3282.39, CFI = .946, TLI = .943, RMSEA = .026, SRMR = .052. Es zeigte sich, dass in allen drei Lesemotivationen ein signifikanter Rückgang der Mittelwerte zu verzeichnen war. In Tabelle 1 sind die konstruktübergreifenden Korrelationen dargestellt. Alle Korrelationen sind signifikant und positiv. Die Korrelationen zwischen States, Niveaus und Trends zwischen den beiden habituellen Motivationsarten waren am höchsten ausgeprägt, während die Verlaufskomponente der aktuellen Lesemotivation vergleichsweise moderat mit beiden korrelierte. Die Befunde zeigen, dass die Entwicklung der aktuellen Lesemotivation zwar mit der Entwicklung habitueller Motivationsformen zusammenhängt, dass beide Motivationsformen empirisch jedoch nicht gleichgesetzt werden können. ID: 328 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung, Trainings- und Evaluationsforschung Stichworte: Bildungswissenschaftliche Evidenz, Kompetenzmodellierung, Evidenzbasierte Praxis, Validierung, Interventionsstudien Evidenzbasierung in der Lehrerbildung: Analyse und Förderung der Nutzung wissenschaftlichen Wissens bei Lehramtsstudierenden Chair(s): Martin Klein (Universität des Saarlandes), Andreas Hetmanek (LMU München) Diskutant(en): Alexander Renkl (Universität Freiburg) Hintergrund Evidenzbasierung als Nutzung aktueller Theorien und Evidenz zur Absicherung professionsrelevanter Entscheidungen hat in den vergangenen Jahren auch im Bereich der Bildungsforschung an Bedeutung gewonnen (Bromme, Prenzel & Jäger, 2014). Obwohl Kompetenzen in diesem Bereich als grundlegend für guten Unterricht gelten (Kunina-Habenicht et al., 2013), steht ihre systematische Analyse und Förderung in der universitären Ausbildung noch am Anfang. Dieses Symposium beleuchtet das Thema Evidenzbasierung in der universitären Lehrerbildung aus verschiedenen Perspektiven. In vier empirischen Studien werden Modellierung und Messung der erforderlichen Kompetenzen untersucht und Ansätze zur Förderung vorgestellt. Forschungsfrage Wie können verschiedene Aspekte der Kompetenzen im Umgang mit bildungswissenschaftlicher Evidenz bei Studierenden im Bildungsbereich erfasst und gefördert werden? Übersicht Hetmanek und Kollegen vergleichen im Rahmen einer experimentellen Studie Leistungen beim evidenzbasierten Argumentieren im Bereich der Medizin als „Mutterdomäne“ der evidenzbasierten Praxis und dem Bildungsbereich. Studierende der Medizin und der Bildungswissenschaften bearbeiteten szenariobasierte Tests zum evidenzbasierten Argumentieren in der eigenen sowie der fremden Domäne. Im Beitrag werden Analysen zu Leistungsunterschieden sowie Ansätze zur Aufklärung dieser Befunde vorgestellt und mit Blick auf die Vergleichbarkeit der beiden Domänen diskutiert. Heininger und Kollegen untersuchen, wie Lehramtsstudierende sowie aktive Lehrkräfte die Qualität professionsrelevanter Evidenz bewerten, um in einem weiteren Schritt darauf aufbauend die gewonnenen Erkenntnisse für den Berufsalltag nutzen zu können. Dazu wurde ein eigenes Instrument entwickelt und dessen Eignung im Rahmen der Studie untersucht. Klein und Kollegen fokussieren die Anwendung bildungswissenschaftlicher Theorien zur Erklärung komplexer schulischer Situationen. Typische Fehler bei der Theorieanwendung werden dabei an korrekten Lösungsbeispielen kontrastiert und so der Umgang mit wissenschaftlichen Theorien in Anwendungssituationen gefördert. Es werden Ergebnisse aus einer Trainingsstudie vorgestellt, in der Maßnahmen zur instruktionalen Unterstützung und zur Integration in das Curriculum erprobt wurden. Behrmann und Kollegen präsentieren eine Studie an der WWU Münster, bei der Lehramtsstudierende im Rahmen des Praxissemesters „forschend lernen“, also Fragestellungen aus dem Schulalltag ableiten und mittels eigener empirischer Daten beantworten. Die resultierenden Erkenntnisse ermöglichen perspektivisch eine Professionalisierung des beruflichen Handelns. Es wird evaluiert, inwiefern durch die vorbereitende Methodenveranstaltung, die systematisch wissens- und anwendungsbezogene Anteile verknüpft, Wissen und positive Überzeugungen als Voraussetzung forschenden Lernens vermittelt werden. Zur Diskussion wurde Rainer Bromme angefragt. Der in diesem Symposium untersuchte kompetente Umgang mit Theorien und Evidenz durch Studierende im Bildungsbereich stellt ein wichtiges Thema mit hoher Praxisrelevanz dar. Innerhalb des Symposiums wird das Thema mit Beiträgen aus der empirischen Bildungsforschung sowie der Pädagogischen Psychologie aus unterschiedlichen Perspektiven betrachtet. Die perspektivische Heterogenität wird die Diskussion bereichern. Beiträge des Symposiums Evidenzbasiertes Argumentieren: Leistungen von Studierenden der Medizin und der Bildungswissenschaften Andreas Hetmanek1, Jan Kiesewetter1, Christof Wecker1, Kati Trempler2, Mia Wermelt1, Cornelia Gräsel2, Frank Fischer1, Martin Fischer1 1 LMU München, 2Bergische Universität Wuppertal Theoretischer Hintergrund Der Aufbau von Kompetenzen im evidenzbasierten Argumentieren gilt als wichtiger Teil der Professionalisierung. In dieser experimentellen Studie wird ein Vergleich vorgenommen zwischen der Medizin als „Mutterdomäne“ der evidenzbasierten Praxis (EBMWG, 1992; Montori & Guyatt, 2008) und dem Bildungsbereich, in dem der Ansatz aktuell verstärkt diskutiert wird (KMK, 2004; Bromme, Prenzel & Jäger, 2014). Das Einbeziehen von wissenschaftlicher Evidenz beim Treffen von Praxisentscheidungen stellt vielfältige Anforderungen an Praktiker. Zentrale Komponenten sind (1) die Suche nach relevanten und qualitativ hochwertigen wissenschaftlichen Studien, (2) die kriterienbasierte Auswahl zu berücksichtigender Studien (BrandGruwel, et al., 2005), (3) die systematische Prüfung der ausgewählten Studien hinsichtlich Relevanz und Qualität (Harden et al. 1999, Trempler et al. 2015), und (4) die Integration der Studienergebnisse in Bezug auf eine Entscheidung in der Praxis (Goldman et al., 2012; Spohn, 2008). In diesem Beitrag vergleichen wir Medizin und Bildungsbereich: Wie unterscheiden sich Studierende der Medizin von Studierenden der Bildungswissenschaften in ihren Leistungen beim evidenzbasierten Argumentieren in der eigenen und der jeweils fremden Domäne? Methode Aufgabenstellung. Es wurde ein szenario-basiertes Instrument aus dem Projekt KOMPARE eingesetzt. Im bildungswissenschaftlichen Testfall hatten die Probanden eine Entscheidung zwischen Gruppenpuzzle und Lehrervortrag zu treffen (Trempler et al., 2015; Hetmanek, 2014). Komplett analog wurde Testfall zu der Entscheidung konstruiert, die Pockenimpfung mit zwei bzw. mit elf Jahren zu empfehlen. Durch Hintergrundinformationen wurde das nötige fallbezogene Wissen sichergestellt. Stichprobe. An der Studie nahmen insgesamt 282 Studierende von zwei Universitäten freiwillig teil: 165 Medizinstudierende im klinischen Studienabschnitt und 117 Masterstudierende der Bildungswissenschaften. Design. In einem Messwiederholungsdesign bearbeitete jede Versuchsperson je einen Testfall im eigenen und im fremden Fachbereich. Die Bearbeitungsreihenfolge wurde ausbalanciert. Ablauf. Alle Teilnehmenden füllten vor der Testsitzung im Labor einen online-Fragebogen aus, in dem u.a. allgemeine kognitive Fähigkeiten erfasst wurden. In der Testsitzung wurden dann das medizinische und das bildungswissenschaftliche Fachwissen gemessen und die entsprechenden Testfälle bearbeitet. Messung der Variablen. Jeweils vier Teilkompetenzen des evidenzbasierten Argumentierens wurden in beiden Fachbereichen erhoben: Die Suche von Studien wurde mit zehn Items, die Auswahl von Studien mit sechs, die Bewertung von Studien mit 36 und das Ranking von Studien mit vier Ratingitems erfasst, für die jeweils die Übereinstimmung mit einer Experten-Musterlösung ermittelt wurde. Die allgemeinen kognitiven Fähigkeiten wurden mit zwei Teilskalen mit verbalen und figuralen Analogien gemessen. Das bereichsspezifische Wissen in Medizin bzw. im Bildungsbereich wurde mit je acht Multiple-Choice-Aufgaben erfasst. Ergebnisse und Diskussion Beide Studierendengruppen wiesen in ihrer Domäne signifikant höheres Fachwissen auf als die jeweils andere Studierendengruppe. Bezüglich der allgemeinen kognitiven Fähigkeiten waren die Medizinstudierenden den Studierenden der Bildungswissenschaften statistisch signifikant überlegen. Beim evidenzbasierten Argumentieren zeigten Medizinstudierende bei der Bearbeitung des medizinischen Testfalls in allen Teilkompetenzen bessere Leistungen als die Studierenden der Bildungswissenschaften. In ANCOVA-Analysen konnten diese Unterschiede weitestgehend durch medizinisches Fachwissen und allgemeine kognitive Fähigkeiten erklärt werden (Ausnahme Auswahl von Studien). Modellvergleiche der Regressionsmodelle ergaben, dass sich die Modelle in den Gruppen nicht unterscheiden: Allgemeine kognitive Fähigkeiten und Fachwissen spielten demnach eine vergleichbare Rolle – auch in unterschiedlichen Leistungsniveaus. Im bildungswissenschaftlichen Testfall ergaben sich mit Ausnahme der Teilkompetenz Suche von Studien (zum Vorteil der Medizinstudierenden) keine signifikanten Leistungsunterschiede zwischen den Gruppen. Dieses Befundmuster bleibt auch nach Kontrolle für Fachwissen und allgemeine kognitive Fähigkeiten bestehen. Weitere Analysen zur Absicherung (Bayesanalysen) und Regressionsanalysen und Modellvergleiche zur Erklärung dieser Befunde durch Prüfung der Zusammenhänge der Leistungen im evidenzbasierten Argumentieren mit allgemeinen kognitiven Fähigkeiten und Fachwissen werden auf der Konferenz präsentiert. Diese vorläufigen Ergebnisse liefern erste Aufschlüsse zum Zusammenspiel von Domänenwissen, allgemeinen kognitiven Fähigkeiten und Fertigkeitskomponenten beim evidenzbasierten Argumentieren in unterschiedlichen Domänen. Einschränkungen in Bezug auf die Vergleichbarkeit der Domänen Medizin und Bildungsbereich sowie Anschlussfragen für zukünftige Forschungsvorhaben werden diskutiert. Literatur Brand-Gruwel, S., Wopereis, I., & Vermetten, Y. (2005). Information problem solving by experts and novices: Analysis of a complex cognitive skill. Computers in Human Behavior, 21(3), 487–508. Bromme, R., Prenzel, M., & Jäger, M. (2014). Empirische Bildungsforschung und evidenzbasierte Bildungspolitik. Zeitschrift Für Erziehungswissenschaft, 17(S4), 3–54. Evidence Based Medicine Working Group, (1992). Evidence-based medicine. A new approach to teaching the practice of medicine. JAMA, 268(17), 2420–2425. Goldman, S. R., Lawless, K. A., Pellegrino, J., Manning, F., Braasch, J. L. G., & Gomez, K. (2012). A technology for assessing multiple source comprehension: An essential skill of the 21st century. In M. C. Mayrath, J. Clarke-Midura, D. H. Robinson, & G. Schraw (Eds.), Technology-based assessments for 21st century skills: Theoretical and practical implications from modern research (pp. 173–209). Charlotte, NC US: Information Age Publishing. Harden, R. M., Grant, J., Buckley, G., & Hart, I. R. (1999). BEME Guide No.1: Best Evidence Medical Education. Medical Teacher, 21(6), 553–562. Konferenz der Kultusminister der Länder der Bundesrepublik Deutschland. (2004). Standards für die Lehrerbildung: Bildungswissenschaften. Beschluss der Kultusministerkonferenz. Montori, V. M., & Guyatt, G. H. (2008). Progress in Evidence-Based Medicine. JAMA, 300(15), 1814–1816. Sackett, D. L., Rosenberg, W. M. C., Gray, J. A. M., Haynes, R. B., Richardson, W. S., & Ham, C. (1996). Evidence based medicine: what it is and what it isn’t. BMJ, 312(7023), 71–72. Spohn, W. (2008). A survey of ranking theory. In F. Huber & C. Schmidt-Petri (Eds.), Degrees of Belief. An Anthology (pp. 185– 228). Oxford: Oxford University Press. Trempler, K., Hetmanek, A., Wecker, C., Kiesewetter, J., Fischer, F., Fischer, M. R., & Gräsel, C. (2015). Nutzung von Evidenz im Bildungsbereich – Validierung eines Instruments zur Erfassung von Kompetenzen der Informationsauswahl und Bewertung von Studien. Zeitschrift Für Pädagogik, 61(61. Beiheft), 144–166. Lehrkräfte bewerten Evidenz – Entwicklung einer heuristisch orientierten Skala zur Bewertung bildungswissenschaftlicher Evidenz Susanne Heininger, Johannes Bauer, Sandra Wenglein, Manfred Prenzel TUM München Theoretischer Hintergrund Der Umgang mit Evidenz und damit die Fähigkeit, bildungswissenschaftliche Evidenz hinsichtlich der Qualität kritisch bewerten zu können, werden bereits seit Längerem als grundlegende Kompetenz für eine zeitgemäße Umsetzung des am besten verfügbaren Wissens in das Lehrerhandeln betrachtet (KMK, 2004; OECD, 2005). Dennoch sind erst in den letzten Jahren einige wenige Projekte zur Untersuchung der Kompetenz von Lehrkräften zum Umgang mit Evidenz im weiteren Sinne und zur Bewertung bildungswissenschaftlicher Evidenz im Speziellen entstanden (zB. Hefter et al., 2014, Hetmanek et al., 2015, Matic- Strametz et al., 2013; Trempler et al., 2015). Die Bewertung von Evidenz wird als Prozess der systematischen Beurteilung der vorliegenden Forschungsarbeiten hinsichtlich der Glaubwürdigkeit, des Nutzens sowie der Relevanz für einen speziellen Kontext beschrieben (Burls, 2009). Diese Definition aus dem medizinischen Kontext, dem Ursprung der evidenzbasierten Praxis (Sackett et al., 1996), kann auch für die Bildungsforschung angewendet werden. Obwohl für medizinische Studien zahlreiche Skalen zur qualitativen Bewertung von Evidenz als Entscheidungshilfen für medizinisch Tätige vorliegen, sind diese wegen ihrer hohen Differenzierung nach Studiendesigns nur teilweise auf die Domäne der Bildungsforschung übertragbar. Lehrkräfte benötigen professionsspezifische Bewertungsskalen, die der Arbeitslast im Berufsalltag angepasst sind und mit eingängiger heuristischer Struktur zeiteffizient zu einem Bewertungsergebnis leiten. Forschungsfrage Ziel der vorliegenden Studie war es, zu überprüfen, inwiefern eine im Projekt E4teach entwickelte Bewertungsskala gängigen psychometrischen Gütekriterien in angemessener Weise entspricht. Hierfür sollte in einem ersten Zugang mit einer Stichprobe Lehramtsstudierender die Skalenkonformität mit dem dichotomen Rasch Model geprüft werden. Methode Zur Erfassung der Kompetenz der Bewertung bildungswissenschaftlicher Qualität wurde ein Erhebungsinstrument entwickelt, welches mit Hilfe von Text-Vignetten möglichst authentische Problemstellung aus dem Arbeitsalltag von Lehrkräften präsentiert. Zur Beantwortung der jeweils aufgeworfenen Problemstellung werden verschiedene Evidenzquellen angeboten, die von den Testpersonen mit Hilfe einer Bewertungsskala (10 Items) bezüglich der Qualität kritisch eingeschätzt werden sollen. Zwischen Oktober 2014 und Mai 2015 konnten N=222 Lehramtsstudierende zur Bearbeitung des Erhebungsinstrumentes gewonnen werden. Die Testpersonen hatten jeweils neunzig Minuten Zeit, um sechs bildungswissenschaftliche Artikel zu lesen, diese jeweils anhand der heuristisch orientierten Bewertungsskala zur Einschätzung der Qualität bildungswissenschaftlicher Evidenz zu bewerten und anschließend ein Statement zur aufgeworfenen Fragestellung zu verfassen. Die Bewertungsurteile der Testpersonen wurden anschließend mit Expertenurteilen in Beziehung gesetzt. Die Expertenurteile wurden mit Hilfe von neun BildungswissenschaftlerInnen in einer vorhergehenden Studie definiert. Die Bewertungsurteile der Testpersonen wurden nach „Expertenurteil (nicht) getroffen“ 0/1-kodiert. Zur Überprüfung der Eindimensionalität der Bewertungsskala wurden die Daten auf Konformität zum dichotomen Rasch Model getestet. Weiterhin wurde die Modelkonformität über die Unabhängigkeit der Itemparameter geprüft. Es wurden drei Split-Kriterien verwendet: Rohscore-Median (zur Aufteilung in zwei Leistungsgruppen), Geschlecht (Kubinger, 2005) sowie der Einfluss des Studiums mindestens eines MINT-Fachs, wegen einer vermuteten Erfahrung im Umgang mit wissenschaftlicher Evidenz. Zur Überprüfung der Item-Konformität wurde der Andersen’s Likelihood Ratio Test (LRT; Andersen, 1973) eingesetzt. Zur Bestimmung der Model-Fit-Indices wurde der Waldtest (Fischer & Scheiblechner, 1970) herangezogen. Alle Analysen wurden mit der Software R (R Core Team, 2013) und dem eRm-Package (Mair et al., 2012) zur Schätzung der Itemparameter und Berechnung der Model-Fit-Indices sowie dem PP-Package (Reif, 2012) zur Schätzung der Personenparameter durchgeführt. Ergebnisse Tabelle 1 zeigt die vorläufigen statistischen Werte. Die Andersen Likelihood Ratio Tests (für α=.01) sind nicht signifikant für die finale Selektion der Items, was eine Konformität mit dem dichotomen Rasch Model nahelegt. Tabelle 1: Statistische Werte für das Rasch Model Split Kriterium LRT Chi² df Chi² α=0.01 p Items entfernt Rohscore-Median 80.64 56 83.51 .017 3 Geschlecht 70.41 56 79.84 .029 3 MINT-Fach 57.50 53 79.84 .313 0 Diese und weitere Analysen werden aktuell nochmals mit einer größeren Stichprobe durchgeführt. Finales Ziel ist es, Aussagen zur Kompetenz Lehramtsstudierender und aktiver Lehrkräfte treffen zu können. Ergebnisse werden zum Zeitpunkt der Konferenz vorliegen. Literatur Andersen, E.B. (1973). A goodness of fit test for the Rasch model. Psychometrika, 38(1), 123-140. Burls, A. (2009). What is critical appraisal? (2nd ed.). haywardpublishing.co.uk/index.php?route=product/product&path=61&product_id=481 Retrieved from http://webstore. Fischer, G.H., & Scheiblechner, H.H. (1970). Algorithmen und Programme für das probabilistische Testmodel von Rasch. Psychologische Beiträge, 12, 23-51. Hefter, M. H., Berthold, K., Renkl, A., Rieß, W., Schmid, S., & Fries, S. (2014). Effects of a training intervention to foster argumentation skills while processing conflicting scientific positions. Instructional Science, 42(6), 929-947. Hetmanek, A., Wecker, C., Kiesewetter, J., Trempler, K., Fischer, M. R., Gräsel, C., & Fischer, F. (2015). Wozu nutzen Lehrkräfte welche Ressourcen? Eine Interviewstudie zur Schnittstelle zwischen bildungswissenschaftlicher Forschung und professionellem Handeln im Bildungsbereich. Unterrichtswissenschaft, 43(3), (Beiheft), 193-208. KMK (2004). Standards für die Lehrerbildung: Bildungswissenschaften (Beschluss der KMK vom 16.12.2004). Bonn: KMK. Kubinger, K.D. (2005). Psychological test calibration using the Rasch model – Some critical suggestions on traditional approaches. International Journal of Testing, 5(4), 377-394. Mair, P., Hatzinger, R., & Maier, M.J. (2012). eRm: Extended Rasch Modeling. R package version 0.15-1. Matic-Strametz, M., Strametz, R., Bohrt, K., Ochsendorf, F., & Weberschock, T. (2013). Evaluation eines Lehrkonzepts in EbM für Lehramtsstudierende der Biologie - eine kontrollierte Phase-II-Studie (NCT01567267). Zeitschrift für Evidenz, Fortbildung und Qualität im Gesundheitswesen, 107 (1),53–61. OECD (2005). Teachers Matter. Attracting, developing and retaining effective teachers. Retrieved from OECD Publishing website: http://www.oecd.org/edu/school/34990905.pdf R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing: Vienna, Austria. Reif, M. (2012). PP: Person Parameter estimation. R package version 0.2. Sackett, D. L., Rosenberg, W. M. C., Gray, J. A. M., Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine. What it is and what it isn't. BMJ 312 (7023), 71–72. Trempler, K., Hetmanek, A., Wecker, C, Kiesewetter, J., Fischer, F., Fischer, M., & Gräsel, C. (2015). Nutzung von Evidenz im Bildungsbereich – Validierung eines Instruments zur Erfassung von Kompetenzen der Informationsauswahl und Bewertung von Studien. Zeitschrift für Pädagogik, 61 (61. Beiheft), 144 – 166. Förderung anwendbaren bildungswissenschaftlichen Wissens bei Lehramtsstudierenden durch fehlerbasiertes Lernen: Effekte einer erweiterten Seminarkonzeption zur Implementation des Trainings in das Lehramtscurriculum Martin Klein, Kai Wagner, Eric Klopp, Robin Stark Universität des Saarlandes Theoretischer Hintergrund Die Nutzung bildungswissenschaftlichen Wissens im Sinne reflektierter pädagogischer Praxis ist eine der Grundlagen effektiven Lehrerhandelns im Schulalltag (Meier, 2006). Vor diesem Hintergrund hat das Konzept der Evidenzbasierung im Bildungsbereich an Bedeutung gewonnen (Bromme, Prenzel & Jäger, 2014). Darunter versteht man die Berücksichtigung aktueller wissenschaftlicher Befunde und bewährter Theorien bei professionellen Entscheidungen und Handlungen. Dies umfasst auch die Erklärung komplexer schulischer Situationen anhand bildungswissenschaftlichen Wissens (vgl. rückschauendes Begreifen, Beck & Krapp, 2006). Dabei zeigen sich jedoch verschiedene Probleme. Lehramtskandidaten weisen unrealistische Erwartungen und negative Einstellungen gegenüber Theorien auf (Gordon & O'Brien, 2007; Stark, Herzmann & Krause, 2010). Bei der Anwendung bildungswissenschaftlichen Wissens machen Studierende zahlreiche Fehler, etwa die Erklärung komplexer schulischer Situationen anhand von Alltagswissen oder nicht adäquater Umgang mit empirischer Evidenz (Stark, 2005). Um diese Fehler als Lerngelegenheiten zu nutzen, wurde eine auf advokatorischen Fehlern (Oser, 2007) basierende integrierte Lernumgebung (Reinmann & Mandl, 2006) zum Einsatz in Seminaren des Lehramtsstudiums entwickelt. Die Studierenden bearbeiten schulische Problemszenarien, bei denen die typische Fehler bei der Theorieanwendung dargestellt werden. Anhand des Kontrasts an korrekten Lösungsbeispielen wird der Umgang mit wissenschaftlichen Theorien in Anwendungssituationen gefördert.Die Effektivität dieser Lernumgebung zur Förderung verschiedener Wissensdimensionen nach DeJong und FergusonHessler (1996) wurde in früheren Studien belegt (Klein, Wagner, Klopp & Stark, 2015; Wagner, Klein, Klopp & Stark, 2015). Forschungsfrage Die vorliegende Studie untersucht die Effekte einer auf der Bearbeitung der Lernumgebung (Phase 1) aufbauenden zweiten Seminarphase, anhand derer die Lernumgebung in das Curriculum integriert werden soll, sowie Effekte instruktionaler Unterstützung während der Testphase auf anwendbares bildungswissenschaftliches Wissen zur Erklärung komplexer schulischer Problemstellungen. Als Moderator wird außerdem der Einfluss der Einstellungen Studierender gegenüber Theorien überprüft. Methode N = 124 Studierende bearbeiteten die oben beschriebene Lernumgebung im Rahmen regulärer Seminare des Lehramtsstudiums. Variiert wurde anschließend die Konzeption der auf die Bearbeitung der Lernumgebung folgenden Seminarphase. Eine systematisch auf der Struktur der Lernumgebung aufbauende erweiterte Seminarkonzeption wurde anhand von Blended Learning und adaptiver instruktionaler Unterstützung umgesetzt und mit einer regulären Seminarkonzeption verglichen. Dabei konstruierten die Studierenden eigene Szenarien nach dem Muster der Lernumgebung. Dies schloss auch den Kontrast zwischen einer inkorrekten und korrekten Erklärung ein. Erhoben wurden die Qualitäten (Automatisierungsgrad, Strukturiertheit und Verarbeitungstiefe) anwendbaren Wissens nach DeJong und Ferguson-Hessler (1996) anhand von Tests zur eigenständigen Erstellung theoriebasierter Erklärungen für komplexe schulische Problemstellungen (Erklärungswissen, s. Klein et al., 2015). Dabei erfolgte die zweite Variation in Form instruktionaler Unterstützung anhand eines Glossars in der Testphase. Zusätzlich wurden Veränderungen der Einstellungen gegenüber Theorien durch die Lernumgebung anhand einer Skala mit 16 Items sowie ihr Einfluss auf die Lernerfolgsmaße erhoben. Ergebnisse Die erweiterte Seminarkonzeption verbesserte wie erwartet den Automatisierungsgrad, die Strukturiertheit und die Verarbeitungstiefe anwendbaren Wissens gegenüber einer Kontrollgruppe. Die instruktionale Unterstützungsmaßnahme hatte hypothesenkonform ebenfalls einen positiven Effekt auf diese Variablen, wider Erwarten zeigte sich jedoch kein Interaktionseffekt. Das Training anhand der Lernumgebung erbrachte einen schwachen positiven Effekt auf die Einstellungen gegenüber Theorien. Ein Einfluss der Einstellungen auf die Lernerfolgsmaße konnte nicht festgestellt werden. Die Curriculumimplementation anhand einer erweiterten Seminarkonzeption erscheint also vielversprechend. Damit wird im Sinne einer stärkeren Evidenzbasierung ein Beitrag zur systematischen Förderung von Theorienutzungskompetenzen im Lehramtsstudium geleistet. Literatur Beck, K. & Krapp, A. (2006). Wissenschaftstheoretische Grundfragen der Pädagogischen Psychologie. In A. Krapp & B. Weidenmann (Hrsg.), Pädagogische Psychologie (S. 33-73). Weinheim: Beltz PVU. Bromme, R., Prenzel, M. & Jäger, M. (2014). Empirische Bildungsforschung und evidenzbasierte Bildungspolitik. Eine Analyse von Anforderungen an die Darstellung, Interpretation und Rezeption empirischer Befunde. Zeitschrift für Erziehungswissenschaft (S. 3 - 54). Wiesbaden: VS Springer. De Jong, T. & Ferguson-Hessler, M. G. (1996). Types and qualities of knowledge. Education-al Psychologist, 31, 105-113 Gordon, M. & O'Brien, T. (2007). Introduction. In: M. Gordon, T.V. O'Brien & E.R. Smith (Hrsg.), Bridging Theory and Practice in Teacher Education. Education Faculty Book and Media Gallery. (xi-xvi). Book 30. http://digitalcommons.fairfield.edu/educationbooks/30 [24.04.2015] Klein, M., Wagner, K., Klopp, E. & Stark, R. (2015). Förderung anwendbaren bildungswissenschaftlichen Wissens bei Lehramtsstudierenden anhand fehlerbasierten kollaborativen Lernens: Eine Studie zur Replikation bisheriger Befunde sowie zur Nachhaltigkeit und Erweiterung der Trainingsmaßnahmen. Unterrichtswissenschaft. 43, 3, S. 225 - 244. Meier, A. (2006). Theorienutzungskompetenz als Schlüsselqualifikation von Lehrkräften. In: Y.M. Nakamura, C. Böckelmann & D. Tröhler (Eds.). Theorie versus Praxis? (p. 89-106) Verlag Pestalozzianum: Zürich. Oser, F. (2007). Aus Fehlern lernen. In: M. Göhlich, Ch. Wulf & J. Zirfas (Eds.): Pädagogische Theorien des Lernens (p. 203212). Weinheim und Basel: Beltz Verlag. Reinmann, G. & Mandl, H. (2006). Unterrichten und Lernumgebungen gestalten (S. 601-646). Weinheim: BeltzPVU. Stark, R. (2005). Constructing arguments in educational discourses. In H. Gruber, C. Harteis, R. Mulder & M. Rehrl (eds.), Bridging individual, organisational, and cultural aspects of professional learning (S. 64–71). Regensburg: S. Roderer. Stark, R., Herzmann, P. & Krause, U.-M. (2010). Effekte integrierter Lernumgebungen – Vergleich problembasierter und instruktionsorientierter Seminarkonzeptionen in der Lehrerbildung. Zeitschrift für Pädagogik, 56, 548-563 Wagner, K., Klein, M., Klopp, E. & Stark, R. (2014). Instruktionale Unterstützung beim Lernen aus advokatorischen Fehlern in der Lehramtsausbildung: Effekte auf die Anwendung wissenschaftlichen Wissens. Psychologie in Erziehung und Unterricht. Angenommen. Wie lernt man „forschendes Lernen“? – Die Konzeption der Methodenausbildung für Lehramtsstudierende an der WWU Münster und erste Evaluationsergebnisse Lars Behrmann, Martina Homt, Jennifer Schmidt, Stefanie van Ophuysen Westfälische Wilhelms-Universität Münster Das nordrhein-westfälische Lehrerausbildungsgesetz (LABG 2009) sieht verpflichtende Praxisphasen bereits während der universitären Lehramtsausbildung vor. Aus diesem Grund müssen alle Lehramtsstudierenden in NRW über die Dauer eines halben Schuljahres ein Praxissemester absolvieren. Kern des Praxissemesters soll hierbei jedoch nicht der klassische Erwerb von Handlungsroutinen bilden, sondern es soll ein Prozess „forschenden Lernens“ (vgl. Wildt, 2009) initiiert werden. Unter forschendem Lernen wird dabei ein Professionalisierungsprozess verstanden, bei dem die Studierenden ausgehend von theoretischen Vorüberlegungen oder eigenen Erfahrungen schulpraktische Fragestellungen ableiten, die mittels bildungswissenschaftlicher Forschungsmethoden beantwortet werden. Das forschende Lernen beschreibt also einen mittel- bis langfristig angelegten Professionalisierungsprozess, durch den angehende Lehrkräfte auf Basis eigenständig gewonnener objektiver Erkenntnisse nach und nach ihren Unterricht kontinuierlich effektiver und effizienter gestalten. Um diesen Entwicklungsprozess während des Praxissemesters anstoßen zu können, müssen die Lehramtsstudierenden zunächst methodisches Grundlagenwissen erwerben. Dieses allein reicht aller Voraussicht nach jedoch nicht aus, dass Lehrkräfte empirische Forschungsmethoden aus eigenem Antrieb heraus in der schulischen Praxis einsetzen. Nach der Theorie des geplanten Verhaltens (vgl. Ajzen, 2011) kann davon ausgegangen werden, dass angehende Lehrkräfte erst dann „forschend lernen“ werden, wenn sie davon überzeugt sind, dass sie 1) die hierzu notwendigen methodischen Kompetenzen auch besitzen (Kontrollüberzeugung) und 2) dass eine methodische Herangehensweise an Fragestellungen des Schulalltags auch wünschenswerte Konsequenzen nach sich zieht (positive Einstellung gegenüber dem Verhalten). Aus diesem Grund werden in einer auf das Praxissemester vorbereitenden Lehrveranstaltung sowohl forschungsmethodisches Wissen als auch diesbezügliche Überzeugungen der Studierenden adressiert: An acht Vorlesungsterminen werden basale Methodenkenntnisse vermittelt, die zur Durchführung eigener empirischer Untersuchungen unmittelbar benötigt werden (bspw. Wissen über Untersuchungsdesigns, Erhebungsinstrumente, Auswertung und Interpretation von Daten). In der Veranstaltung werden dabei kontinuierlich die Vorzüge einer empirisch-wissenschaftlichen Beantwortung von Fragestellungen im Vergleich zu alltagspsychologischen Erklärungen betont, die auf subjektiven Alltagstheorien beruhen. Im Anschluss an die acht Vorlesungstermine werden weitere sieben Tutoriumssitzungen angeboten. Innerhalb dieser werden die methodischen Inhalte aus der Lehrveranstaltung aufgegriffen und deren praktischer Einsatz mittels entsprechender Aufgaben intensiv eingeübt. Ziel dieser Untersuchung ist es zu überprüfen, ob in der Veranstaltung die Grundlagen gelegt werden, die nach der Theorie des geplanten Verhaltens (Ajzen, 2011) ein eigenständiges forschendes Lernen von Lehrkräften ermöglichen. Zunächst wurden zu diesem Zweck entsprechende Erhebungsinstrumente konstruiert, deren Gütekriterien anhand der Daten von 136 Studierenden aus dem WS 14/15 abgesichert wurden. Mit diesen Instrumenten wurden dann 112 Studierende aus dem Sommersemester 2015 jeweils vor und nach der Veranstaltung im Hinblick auf ihr methodenbezogenes Anwendungswissen, ihr Fähigkeitsselbstkonzept sowie ihre Intention, forschend zu handeln, überprüft. Es zeigte sich diesbezüglich, dass sich das methodische Anwendungswissen der Studierenden über den Veranstaltungszeitraum signifikant verbessert hat (d = .27, p < .05). Ebenso konnte ein signifikanter Anstieg im Fähigkeitsselbstkonzept nachgewiesen werden (d = .75, p < .001). Im Hinblick auf die Intention der Studierenden, eigenständig forschend zu handeln, wurde das 5%Signifikanzniveau jedoch knapp verfehlt (d =.19, p = .078). Die resultierenden Befunde zeigen, dass die Veranstaltung offenbar dazu beitragen kann, Wissen und Überzeugungen zu prägen, die Voraussetzung für eigenständiges „forschendes Lernen“ in der Schulpraxis sind. Die Untersuchung wird derzeit weitergeführt, damit die bislang gefundenen Ergebnisse nach dem Wintersemester 2015/16 auf ihre Replizierbarkeit hin überprüft werden können. Weitere Forschungsdesiderata (z.B. die Entwicklung der Studierenden nach dem Praxissemester, Auswirkungen methodischer Kompetenzen auf didaktische Handlungen) werden aufgezeigt. Literatur Ajzen, I. (2011). The Theory of Planned Behavior. In P.A.M. van Lange, A.W. Kruglanski & E.T. Higgins (Hrsg.), Handbook of Theories of Social Psychology, 438-459. Wildt, J. (2009). Forschendes Lernen: Lernen im „Format “der Forschung. journal hochschuldidaktik, 20(2), 4-7. ID: 343 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Lehrerbildung Thematisches Cluster: Lehrer(aus)bildung Stichworte: Peer Coaching; Praxisphasen; Handlungskompetenz; Peer Coaching als Lernumgebung im Lehramtsstudium Chair(s): Stefanie Schnebel (Pädagogische Hochschule Weingarten), Annelies Kreis (Universität Zürich) Diskutant(en): Alexander Gröschner (Universität Paderborn) Die Entwicklung professioneller Handlungskompetenz ist eine zentrale Aufgabe der Lehrerausbildung. Welche Lerngelegenheiten für deren Entwicklung geeignet sind, ist jedoch noch wenig erforscht (Baumert & Kunter, 2011). Um universitäres theoriebasiertes Lernen mit unterrichtsbezogenen Handlungssituationen zu verknüpfen, gelten Reflexion, Austausch und Kooperation als entscheidende Mediatoren (zusammenfassend Cochran-Smith & Zeichner, 2006). Eine Möglichkeit, praxisbezogene Lerngelegenheiten anzureichern, besteht in der wechselseitigen Unterstützung von Studierenden in Formen von Peer Coaching oder Peer Kooperation. Peer Settings können die Kompetenzentwicklung in der Lehrpersonenausbildung fördern (Britton & Anderson 2010; Lu 2010; Thurlings & den Brok, 2015). Zu erwarten ist, dass sie über positive Kooperationserfahrungen auch dazu beitragen, Kooperation als bedeutsames Moment lebenslanger professioneller Entwicklung zu etablieren. Im Zuge der Einführung von Praxissemestern bzw. der Erweiterung von Praxisphasen im deutschsprachigen Raum werden verschiedene Konzepte erprobt, um evidenzbasiert Lernen in Praktikumskontexten mit Peerunterstützung zu fördern. Welche Prozesse in solchen Lerngelegenheiten ablaufen und welche Effekte erzielt werden können, soll im Rahmen des Symposiums in vier Forschungsbeiträgen diskutiert werden. Beitrag 1 berichtet Ergebnisse einer quantitativen Studie der TU München, die ein Online-Tool zur Dokumentation von Praktikumserfahrungen etabliert und damit Coaching- und Mentoringprozesse im Praktikum abbildbar macht. In Regressionsanalysen kann die Bedeutung von Austauschprozessen mit Mentoren und Peers für die Entwicklung der Motivation im Praktikum aufgezeigt werden. Beitrag 2 zeigt in einem qualitativen Design auf, wie Studierende die Unterstützung durch PeerCoaching in der Planung, Durchführung und Reflexion von Microteaching-Sequenzen wahrnehmen. Die Studie analysiert Daten aus Gruppendiskussionen, die mit Studierenden im Rahmen eines Zertifikatskurses der Universität Münster durchgeführt und inhaltsanalytisch ausgewertet wurden. Die Ergebnisse verweisen darauf, dass durch die Peerunterstützung Reflexion und die Einschätzung eigener Lehrfähigkeit positiv beeinflusst werden können. Die Beiträge 3 und 4 beziehen sich auf das binationale Projekt „Kollegiales Unterrichtscoaching und Entwicklung von experimenteller Kompetenz“ (KubeX) (Schnebel & Kreis 2014). In einem quasi-experimentellen Interventionsdesign wird untersucht, welche Effekte die Einführung Kollegialen Unterrichtscoachings (Kreis & Staub, 2013) auf Inhalte und Prozesse videografierter Planungsgespräche in einem reziproken Coaching zwischen Studierenden erzeugt. Beitrag 3 fokussiert die Einschätzung verschiedener Aspekte von Planungskompetenz aus einer standardisierten Prä-Post-Befragung sowie aus Analysen videografierter Planungsgespräche im Hinblick auf die bearbeiteten Inhalte. Beitrag 4 zeigt auf, inwiefern die in der Intervention vermittelten Coachingmoves durch die Studierenden umgesetzt werden und in welchem Zusammenhang dies mit dem Auftreten dialogischer Elaboration der Planungsskizzen steht. Beitrag 3 und 4 zeigen Unterschiede zwischen zwei Gruppen mit/ohne Training in Kollegialem Unterrichtscoaching. Beiträge des Symposiums „Track your Practicum“ Experiences Sampling als Methode um Praxiserfahrung bei Lehramtsstudierenden sichtbar zu machen Kathleen Stürmer, Ann-Kathrin Schindler TU München Nach wie vor stellt es für die universitäre Lehrerausbildung eine zentrale Herausforderung dar, schulpraktische Erfahrungen von Studierenden in handlungsrelevante professionelle Lernprozesse zu überführen (Wubbels, 1992). Praktische Erfahrungen werden als wichtige Ressource informeller Lernprozesse verstanden. Eine wichtige Rolle für ihre gelingende In-tegration in evidenzbasiertes, handlungsrelevantes Lernen wird dabei den verschiedenen Institutionen (Universität, Schule), Aktivitäten (z.B. Hospitationen, eigene Unterrichtversuche) aber auch Akteuren, die Reflexionsprozesse begleiten und anleiten (z.B. Peers, Dozenten, betreuende Lehrpersonen), zugesprochen. Bisher ist die Bedeutung der einzelnen Komponenten in ihrem Zusammenspiel mit Blick auf die Frage, was tatsächlich eine Ressource für die professionelle Entwicklung angehender Lehrpersonen darstellt, weitaus unbeleuchtet. Um interpersonale Momente im praxisbezogenen Lernen zu identifizieren (Grossman, 1992), auf welchen aufbauend Reflexionsprozesse zum Beispiel in Form von Peer Coaching angeleitet werden können, braucht es Ansätze, die es erlauben praktische Erfahrungen von Studierenden in ihrer Gesamtheit, aber dennoch differenziert abzubilden. Gegenwärtige Zugänge (z.B. Schreiben von Lerntagebüchern, Portfolios) setzen voraus, dass die Studierende relevante Ereignisse in ihrer Relation zu ihren praxisbasierten Lernprozessen wahrnehmen, selektieren, erinnern und in der Lage sind diese in einer nachvollziehbaren Art und Weise explizieren zu können. Sie erlauben keinen Ad hoc Aufgriff, da sie retroperspektiv von dem eigentlichen Handlungskontext sind. Nicht selten stoßen sie zudem auf wenig Akzeptanz. In diesem Bei-trag wird ein neuartiger Zugang vorgestellt, der zum Ziel hat, die einzelnen Komponenten praktischer Erfahrungen von Studierenden an der Schule transparent, mit Blick auf die Bedeutung professioneller Lernprozesse empirisch erfassbar und somit an die Akteure rückspielbar zu machen. „Track your Practicum“ ist ein online Tool, in dem Studierende ihre Aktivitäten an der Schule, ihren Erfahrungsaustausch mit ihren Peers, (betreuenden) Lehrpersonen sowie ihre Lernmotivation über eine Smartphone-Anwendung dokumentieren. Vor dem Hintergrund der zunehmend bedeutenden Rolle technologiebasierten Lernens stellt die Integration digitaler Medien in die universitäre Ausbildung zukünftiger Lehrpersonen einen innovativen Ansatz dar (Könings & Gijselaers, 2015). In dieser Studie untersuchen wir, inwiefern durch das Tool (1) intra-individuell Praxiserfahrungen auf der Aktions-, Akteurs- und Lernprozessebene transparent gemacht und (2) Ressourcen für das praxisbasierte Lernen identifiziert werden können. Grundlage sind die Erfahrungen von N = 42 (weiblich 50%, 2. Semester, Alter = 20.07, SD = 2.22) Studierende, die in Triaden eine 15-tägige universitär begleiteten Praxis-phase durchliefen. Über die Methode des Experience Samplings (Kubey et al., 1996) wurden täglich ihre Aktivitäten (z.B. „Heute habe ich Unterricht hospitiert“ ja/nein), ihr Erfahrungs-austausch mit ihren Peers sowie betreuenden Lehrpersonen (z.B. „Heute habe ich mich mit anderen Studierenden über Unterrichts ausgetauscht.“ ja/nein) und ihre Lernmotivation auf einer fünf-stufigen Skala von ‚1’ nie bis ‚6’ sehr häufig (Prenzel & Drechsel, 1996) erhoben. Multilevel-analytische Auswertungen zeigen, dass die Aktivitäten in ihrem Verlauf, Austauschbeziehungen sowie Lernmotivationsbewegungen über die Tage nachgezeichnet werden. Es zeigt sich, dass Unterrichtshospitationen über die Studierenden hinweg den größten Anteil an Aktivitäten in der Schule darstellen (M = 0.77, SD = 0.26), durchgehend ein hoher Austausch mit der Peergruppe sowie mit den betreuenden Lehrpersonen stattfindet (M = 0.80, SD = 0.26) und die Lernmotivation über die Praxisphase stabil günstig ausgeprägt ist (z.B. intrinsisch M = 5.15, SD = .64). Mit Blick auf die Identifikation von praxisbasierten Lernressourcen wird allerdings deutlich, dass einzig der Austausch mit der betreuenden Lehrperson an der Schule eine günstige Lernmotivation positiv vorhergesagt (z.B. intrinsisch R2 = .20; β = .49, p = .001). Die Ergebnisse verdeutlichen, die hohe Bedeutung der Austauschbeziehungen an der Schule für Studierende. Im Vortrag werden Möglichkeiten diskutiert, wie die gewonnenen Daten an die Akteure professioneller Reflexionsprozesse zurückgespielt werden können sowie Perspektiven aufgezeigt, das Tool zur Unterstützung von Peer Coaching, aber auch Selbstreflexion oder MentorenBetreuung zu nutzen. Begleitung von universitären Praxiselementen durch Peer-Coaching Anna Grabosch, Stephanie van Ophuysen Universität Münster Praxisphasen sind mittlerweile fester Bestandteil in der universitären Lehrerbildung und zu-nehmend Gegenstand von Forschungsaktivitäten (vgl. Gröschner/Seidel 2012). Bisherige Forschungsergebnisse zeigen, dass insbesondere die Betreuungsqualität von Praxisphasen sich als besonders wichtig für den Lernerfolg der Studierenden herausstellt (Schnebel 2009, Gröschner/Schmitt 2011, Hascher/Moser 2001, Kreis/Staub 2011). Untersucht wurde dabei die Betreuungsbeziehung zwischen Studierenden und MentorInnen oder Studierenden und DozentInnen der Hochschulen. Keine Beachtung finden PeerCoaching Konzepte, in denen Studierende andere Studierende begleiten. Bislang wurden Praxisphasen in Form von Prak-tika oder des Praxissemesters in den Blick genommen. Denkbar sind allerdings auch prakti-sche Elemente innerhalb der Universität, um den Handlungskompetenzerwerb von Studie-renden zu fördern. Denn, „der Praxisbezug der universitären Praxisphasen richtet sich […] nicht auf die Vermittlung von Handlungsroutinen im Unterricht und im Schulbetrieb, sondern auf die theoretischkonzeptionelle Durchdringung und Analyse beobachtbarer oder selbster-fahrener Praxis“ (Baumert u.a. 2007, S. 8). Daher stellt sich die Frage, wie der Handlungs-kompetenzerwerb angehender LehrerInnen auch innerhalb der Universität gefördert werden kann und inwiefern Peer-Coaching diesen Prozess unterschützen kann. Die Erziehungswis-senschaftliche Lehr-und Forschungswerkstatt (ELF) der Universität Münster bietet Studie-renden dazu verschiedene handlungsorientierte Angebote. Darunter fallen u.a. die Kollegiale Fallberatung, Kompetenztrainings und Portfolioarbeit, die, in Kombination absolviert, zu einem Zertifikat führen. Im Rahmen der Angebote agieren die teilnehmenden Studierenden in Leitungsfunktionen, lernen ihr Handeln zu reflektieren und theoretisch zu begründen, um so ihre Handlungskompetenz zu erweitern. Der gesamte Prozess wird von geschulten Studie-renden (Peers) begleitet und Lernziele und –ergebnisse werden gemeinsam reflektiert und festgehalten. Im Rahmen eines Forschungsprojektes wird auf Basis von zwei nicht-standardisierten Gruppendiskussionen der Prozess des Handlungskompetenzerwerbs der Studierenden während des Zertifikatserwerbs rekonstruiert und aufgezeigt, welche Bedeutung dabei dem Peer-Coaching zukommt. Zur Erfassung der kollektiven Erfahrungen der ZertifikatsabsolventInnen wurden zwei Gruppen á 5 und á 7 TeilnehmerInnen befragt, die das Zertifikat zu unterschiedlichen Zeitpunkten erworben haben: Die erste Gruppe hat das Zertifikat seit mindestens einem Jahr abgeschlossen, die zweite seit weniger als drei Wochen. Die inhaltsanalytische Auswertung nach Kuckartz erfolgt durch zwei unabhängige Rater. Die Interrater-Reliabilität erweist sich als gut. In den Ergebnissen zeigt sich, dass die AbsolventInnen trotz der unterschiedlichen Erwerbszeiträume des Zertifikats von gemeinsa-men Lernergebnisse berichten. Unterschiede zeigen sich darin, dass die erste Gruppe von weiteren Erkenntnissen nach längerer Reflexionsphase – die der zweiten Gruppe noch bevor steht – berichten. Hinsichtlich des Peer-Coachings wird sichtbar, dass die Zertifikatsabsol-ventInnen die Peers als kompetent und daher als Vorbild wahrnehmen. Die Peer-Coaches sind nach Angabe der AbsolventInnen in der Lage, einen geschützten Raum aufzubauen, Ängste zu nehmen und die AbsolventInnen durch Feedback zu stärken. Dies führt weiterhin dazu, dass die AbsolventInnen sich selbst und ihr Handeln aufgrund der gemeinsamen Re-flexion besser verstehen und einschätzen können und sich systematisch auf die eigene Lei-tungstätigkeit vorbereitet fühlen. Die Bedeutung der Begleitung von Praxisphasen kann auch in diesem Kontext bestätigt werden. Zusätzlich kann gezeigt werden, dass auch Peers in der Lage sind, die Begleitung erfolgreich durchzuführen. Abschließend werden die Möglichkeiten und Grenzen der Implementation von Praxiselementen in der Hochschullehre sowie die Be-gleitung durch Peers diskutiert. Selbsteinschätzungen zur Planungskompetenz und inhaltliche Schwerpunkte in Gesprächen über Unterrichtsplanung – Ergebnisse einer Interventionsstudie zu Planungsgesprächen unter Peers im Rahmen des Projekts KUBeX Stefanie Schnebel1, Stephanie Musow1, Sandra Wagner2, Annelies Kreis3 1 Pädagogische Hochschule Weingarten, 2PH Thurgau, 3Universität Zürich Die Planungskompetenz stellt eine wesentliche Voraussetzung dar, um Unterricht professionell vorzubereiten, durchzuführen und zu evaluieren (Kiper, 2012). Blömeke, Kaiser und Lehmann (2011) betrachten die Entwicklung professioneller Handlungskompetenz als Wechselspiel von Lerngelegenheiten und kognitiven Aspekte wie Wissen und Überzeugungen. Lerngelegenheiten in den praxisbezogenen Bausteinen der Lehrerausbildung lassen sich durch Formen von Mentoring und Coaching anreichern (Goker, 2006). Um Unterricht erfolgreich zu planen, müssen Studierende lernen, verschiedene allgemeinund fachdidaktische Dimensionen in die Planung einzubeziehen (Bach, 2013). Wie Studien zu Unterrichtsbesprechungen mit betreuenden Lehrpersonen zeigen, findet jedoch eine Fokussierung auf Fragen der methodischen Gestaltung und des Klassenmanagements statt (Schüpbach, 2007; Schnebel, 2011). Ein vielversprechender und für erfahrene Lehrpersonen empirisch validierter Ansatz zur Gestaltung von Lerngelegenheiten im Kontext von Praktika stellt das Kollegiale Unterrichtscoaching (Kreis & Staub, 2013) dar. Neben der Modellierung von Coachingprozessen stellt es mit den sogenannten Kernperspektiven ein Tool bereit, das die Coaches unterstützt, vielfältige didaktische Perspektiven in die Gespräche einzubeziehen (Staub, 2014). Im diesem Beitrag zugrundeliegenden Projekt KUBeX wurde eine Intervention entwickelt, in welcher Studierende ein Training zu Kollegialem Unterrichtscoaching erhalten und sich jeweils in Tandems gegenseitig in der Unterrichtsplanung unterstützen. Erste Befunde zu Peer Coaching in praxisbezogenen Elementen der Lehrerausbildung zeigen positive Effekte (Lu, 2010). Insgesamt ist jedoch noch wenig geklärt, welche Inhalte in solchen Peer Coachings verhandelt werden und welchen Beitrag ein solches Coaching zum Aufbau von Unterrichtsplanungskompetenz leisten kann. Vor diesem Hintergrund wird in diesem Beitrag der Fragestellung nachgegangen, inwiefern die Intervention zum Kollegialen Unterrichtscoaching bei den beteiligten Lehramtsstudierenden eine Veränderung in der Kompetenzeinschätzung zur Unterrichtsplanung bewirkt und Unterschiede zwischen Interventions- und Kontrollgruppe bezüglich bearbeiteter Inhalte erzeugt. Die Studie wurde mit einem quasi-experimentellen mixed-methods Design durchgeführt. Studierende des Faches Biologie (n=119) erhielten einen fachdidaktischen Input (2x90‘). Die Interventionsgruppe (n=65) wurde in Kollegiales Unterrichtscoaching eingeführt und trainiert (2x90‘), die Kontrollgruppe (n=59) erfuhr einen unabhängigen pädagogischen Input. Beide Gruppen führten in Tandems Planungsgespräche, die IG anhand des Konzepts des Kollegialen Unterrichtscoachings, die KG kooperierte frei. Wissen und Überzeugungen wurden über eine Prä-Post-Befragung erfasst, die Planungsgespräche videografiert. In der standardisierten Befragung wurden u.a. die Skalen: Strukturiertheit von Unterrichtsplanung (5 Items, α=.66) (Gröschner & Schmitt, 2009) und Einschätzung eigener Planungskompetenz (16 Items, α=.82) eingesetzt. Die Items zur Einschätzung der Planungskompetenz greifen die Elemente der Kernperspektiven wie z.B. (Schülervoraussetzungen, Lernziele, kognitiv anregende Aufgaben etc. ) auf (Schnebel & Kreis, 2014). Zur Analyse der Videos bezüglich der Gesprächsinhalte wurde inhaltsanalytisch ein Codierverfahren entwickelt, welches fach- und allgemeindidaktische Dimensionen abbildet. Das Codierschema umfasst 29 Codes in 10 Dimensionen (Unterrichtsgegenstand, Unterrichtsgestaltung, Lernziele, Klassenmanagement, Motivierung, Schülervoraussetzungen, Kontext, Werkzeuge für Unterrichtsplanung, Metaebene, Notizen). Die Intercoderreliabiltät auf Codeebene beträgt S-Lotus= .88 (min=.71; max=1). Die Bestimmung der Analyseeinheiten erfolgte entlang semantischer Einheiten (Kreis et al., 2012). Die Ergebnisse der Fragebogenerhebung zeigen in einer einfaktoriellen Varianzanalyse mit Messwiederholung einen signifikanten Unterschied der Einschätzung der Planungskompetenz über die Zeit (time: F=9.372; p=.003), aber keine signifikanten Gruppenunterschiede über die Zeit (time * group: F=1.444; p=.232). Im Hinblick auf die Strukturiertheit der Planung ergeben sich weder für den Faktor Zeit noch den Faktor Gruppe signifikanten Unterschiede (time: F=.14; p>.05; time * group: F=.1.68; p>.05; group: F=.43; p>.05). Die Analyse der Planungsgespräche zeigt eine breite Differenzierung der besprochenen Inhalte, wobei prozentual bezogen auf alle Codierungen „Unterrichtsgestaltung“ (M = 10.73; SD = 7.87), „Gestalten von Experimentieren“ (M = 20.89; SD = 9.97) und „Medien“ (M = 14.66; SD = 7.45) am häufigsten bearbeitet werden. Signifikante Unterschiede zwischen den Gruppen treten u.a. in den Codes „Unterrichtsgestaltung“ (U = -3.208; p = .000), „Medien“ (U= 1.637; p = .050) „Differenzierung“ (U = -2.606; p = .009) und „Thematisieren der Kernperspektiven“ (U = -2.162; p = .031) jeweils mit höheren Werten der IG auf. Unterstützendes Gesprächshandeln in Planungsdialogen zwischen Lehrstudierenden – Ergebnisse einer Interventionsstudie zu Kollegialem Unterrichtscoaching Annelies Kreis1, Eva Engeli2, Stephanie Musow3, Stefanie Schnebel3, Sandra Wagner4 1 Universität Zürich, 2Pädagogische Hochschule Thurgau, PH Schaffhausen, 3Pädagogische Hochschule Weingarten, 4PH Thurgau Mit der Studie KUBeX werden Effekte einer Intervention zu Kollegialem Unterrichtscoaching (Kreis & Staub, 2013) auf die gemeinsame Planung von Unterricht zwischen zukünftigen Lehrpersonen untersucht. Die wenigen bisherigen Studien über reziprokes Coaching zwischen angehenden Lehrpersonen in Praktika legen dessen positiven Einfluss auf verschiedene Aspekte der Kompetenzentwicklung nahe (Thurlings & den Brok, 2015). In der vorliegenden Teilstudie stehen Planungsgespräche von Studierendendyaden der Interventions- und Kontrollgruppe im Fokus. Beide Gruppen erhielten einen Impuls zu Fachdidaktik (Experimentieren als Erkenntnismethode der Biologie). Die Interventionsgruppe nahm zusätzlich an einem Training zu Kollegialem Unterrichtscoaching teil (2*90’). Es wurden zentrale Elemente des Ansatzes (Rollen als Coach oder Coachee, dialogische Elaboration einer Unterrichtsskizze mit Hilfe sogenannter Kernperspektiven) vermittelt und gecoachte Planungsgespräche trainiert. Anschliessend wurden zwei Planungsgespräche pro Dyade videografiert (NIG = 42; NKG = 51). Die Studierenden wurden angewiesen, sich nacheinander im Tandem mit verteilten Rollen bei der Ausarbeitung einer mitgebrachten Unterrichtsskizze zu unterstützen (S1 bringt Skizze mit, S2 leitet Gespräch zur Elaboration). Die Planung erfolgte hinsichtlich eines standardisierten Inhalts (Experimentieren zu visueller Wahrnehmung) für eine mittels Vignette beschriebene 8. Klasse. Der Interventionsansatz schlägt spezifische Coachingmoves vor, welche die dialogische Weiterentwicklung der eingebrachten Unterrichtsplanung unterstützen sollen (Kreis & Staub, 2013; Staub, West & Bickel, 2003). Mit diesem Beitrag wird untersucht, ob Studierende basierend auf einer relativ knappen aber ökologisch validen Intervention in der Lage sind, grundlegende Elemente des Kollegialen Unterrichtscoachings umzusetzen und inwiefern sie sich dabei von Kommiliton/innen einer Kontrollgruppe unterscheiden. Dafür werden die Videoaufzeichnungen dahingehend analysiert, welche Unterschiede sich in der Häufigkeit der durch die Coaches angewendeten Gesprächsmoves sowie in der Dauer dialogischer Elaboration zeigen. Die Analyse der Planungsgespräche erfolgt eventbasiert mittels pragma-linguistischer Gesprächsanalyse (Kreis, 2012) anhand eines Kategoriensystems zur Erfassung (a) der Dauer dialogischer Elaboration sowie (b) des individuellen Gesprächshandelns der Interaktant/innen (Moves gemäss Kollegialem Unterrichtscoaching). Letzteres beinhaltet die Codes ‘Einladung’ (short und long answer questions; vgl. Graesser & Person, 1994), ‘Hinweise zur Unterrichtsgestaltung’, ‘Verständnissicherung’, ‘Problematisieren’, ‘Unsicherheit’ (VanLehn et al., 2003) und ‘positive Bewertung’ (Interraterübereinstimmung S-Lotus = .81). Die Besprechungen der Interventionsgruppe dauerten signifikant länger als jene der Kontrollgruppe (MIG=27’, sIG= 10; MKG=17’, sKG=8.8; p=.000**) und enthielten signifikant längere Sequenzen dialogischer Elaboration der Unterrichtsplanung (MIG=15.2’, sIG= 9.5; MKG=5.2’, sKG=5.1; p=.000**). Für die Studierenden S2 mit unterstützender Rolle mit Abstand am häufigsten codiert wurden ‘Hinweise zur Unterrichtsgestaltung’ (M=12.6, s=10.7), gefolgt von ‘Einladung’ (M=4.8, s=4), ‘Verständnissicherung’ (M=2.8, s=3) und ‘Problematisieren’ (M=1.7, s=2). Alle Moves werden von den Studierenden S2 der Interventionsgruppe (Coaches) hoch sign. häufiger angewendet als von jenen der Kontrollgruppe. Die Studierenden S1, deren Unterrichtsskizzen weiterentwickelt werden sollen, wenden am häufigsten die Moves ‘Einladung’ (M=1.7, s=2.6) und ‘Problematisieren’ (M=1.7, s=2.4) an, gefolgt von ‘Unsicherheit’ (M=1.2, s=1.6) und ‘Verständnissicherung’ (M=0.5, s=1). Auch hier ist der Unterschied in der Häufigkeit des Auftretens zwischen IG und KG durchwegs hoch signifikant. Offensichtlich ist, dass die fokussierten Moves deutlich häufiger von S2 als S1 angewendet werden. Eine lineare Regressionsanalyse zeigt, dass dialogische Elaboration vor allem durch die Moves ‘Hinweis’, ‘long answer-question’ und ‘Unsicherheit’ seitens S2 sowie durch ‘long answer-questions’ und ‘problematisierende’ Äusserungen seitens S1 erklärt werden können. Die Ergebnisse zeigen, dass sich das Gesprächshandeln in gemeinsamen Planungsgesprächen zwischen Studierenden durch eine ökologisch valide Intervention in erwünschter Richtung beeinflussen lassen. Sowohl die trainierten Gesprächsmoves gemäss Kollegialem Unterrichtscoaching als auch die angestrebte dialogische Elaboration einer eingebrachten Unterrichtsplanung sind in den Planungsgesprächen der Interventionsgruppe häufiger bzw. länger zu beobachten als in der Kontrollgruppe. Zudem zeigt sich, welche Moves besonders geeignet zu sein scheinen, um das Auftreten von Sequenzen dialogischer Elaboration zu prognostizieren. Weitere Analysen werden zeigen, wie die Coachinggespräche und die im Peersetting weiterentwickelten Unterrichtsplanungen aus fachdidaktischer Sicht eingeschätzt werden. ID: 348 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie Thematisches Cluster: Methoden der empirischen Bildungsforschung Stichworte: Kausale Effekte, Propensity Score Matching, Complier-Average-Causal-Effects, Quasi-experimentelle Designs Analyse kausaler Effekte in der Empirischen Bildungsforschung – Anwendungen und methodische Fortschritte Chair(s): Benjamin Nagengast (Universität Tübingen) Viele Fragestellungen der Empirischen Bildungsforschung (z.B. nach Effekten von institutionellen Lernumgebungen) können nicht mit randomisierten Untersuchungsplänen beantwortet werden. Das Interesse an der Schätzung kausaler Effekte in quasiexperimentellen Designs hat daher in der Empirischen Bildungsforschung in den letzten Jahren deutlich zugenommen. Dabei wird häufig auf das Modell kausaler Effekte (Rubin, 1974, 2005) zurückgegriffen. Propensity Score Verfahren, die auf diesem Modell aufbauen, sind häufig eingesetzte Methoden zur Kontrolle von Selektionseffekten in quasi-experimentellen Designs. Hier hat sich inzwischen ein hoher methodischer Standard etabliert. Bei typischen Studiendesigns der Empirischen Bildungsforschung stellt sich dennoch oft die Frage wie mit messfehlerbehafteten Kovariaten und der Mehrebenenstruktur umgegangen werden kann. Mit dem steigenden Interesse an der experimentellen Evaluation von Interventionen im Schulkontext werden Ansätze zur Analyse spezifischer kausaler Effekte auch in diesem Bereich relevanter. Während der durchschnittliche Effekt für alle Probanden in experimentellen Designs leicht zu identifizieren ist, stellt die Berücksichtigung der Compliance mit Instruktionen bei der Schätzung von Effekten eine Herausforderung dar, die trotz Randomisierung nicht einfach gelöst werden kann. Neuere methodische Entwicklungen auf der Grundlage der Theorie kausaler Effekte erlauben hier weitergehende Analysen, werden aber bisher in der Empirischen Bildungsforschung nur selten eingesetzt. Das Symposium verbindet Beiträge zur Anwendungen von Verfahren zur Analyse kausaler Effekte auf Fragestellungen der Empirischen Bildungsforschung mit Beiträgen, die methodische Entwicklungen vorstellen und illustrieren. Die ersten beiden Beiträge zeigen beispielhaft den Einsatz von state-of-the-art Propensity Score Verfahren zur Analyse der Effekte von Lernumgebungen: Der Beitrag von Golle et al. untersucht die Effekte der beruflichen Ausbildung (im Vergleich zum Besuch des beruflichen Gymnasiums) auf die Entwicklung von Persönlichkeit und Motivation. Guill et al. stellen Analysen zu den Effekten des Besuchs des Gymnasiums auf die Intelligenzentwicklung vor. Drei eher methodisch ausgerichtete Beiträge beleuchten Entwicklungen in der Analyse kausaler Effekte, die für die Empirische Bildungsforschung besonders relevant sind: Sengewald und Pohl greifen das Problem unreliabel erfasster Kovariaten auf, die potentiell zu einer verfälschten Schätzung von kausalen Effekten führen können. Ihr Beitrag zeigt, dass die Aufnahme weiterer Kovariaten sich je nach Datenkonstellation unterschiedlich auf den Bias der Effektschätzung auswirken kann. Der Beitrag von Mayer stellt ein neues, bootstrap-basiertes Verfahren zur Schätzung von kausalen Effekten in quasi-experimentellen Mehrebenendesigns vor, die für die Empirische Bildungsforschung typisch sind. Nagengast et al. beschließen das Symposium mit einem Beitrag zur Analyse von Complier-Average-Causal-Effects in Interventionsstudien mit randomisierter Zuweisung auf Klassenebene und illustrieren die Methode mit Daten aus einer Intervention zur Förderung der Motivation im Fach Mathematik. Beiträge des Symposiums Welchen Einfluss haben unterschiedliche Bildungsgänge auf Persönlichkeit, Selbstkonzept und berufliche Interessen? Jessika Golle, Nicolas Hübner, Sven Rieger, Ulrich Trautwein, Benjamin Nagengast Universität Tübingen *Hintergrund und Fragestellung*: Aktuell gibt es nur wenige gesicherte Befunde zu den Effekten unterschiedlicher institutioneller Umgebungen auf die Entwicklung von bildungsrelevanten Persönlichkeitseigenschaften. Bisherige Studien konzentrierten sich vor allem auf den Einfluss der Arbeit bzw. derer Charakteristika auf die Persönlichkeitsentwicklung (vgl. Roberts, Caspi & Moffitt, 2003). Roberts und Kollegen berichten u.a., dass junge Erwachsene in einem Beruf mit hohem Status im Vergleich zu einem Beruf mit geringerem Status weniger ängstlich und selbstzerstörerisch, glücklicher und selbstbewusster waren. Bisher unbeantwortet bleibt die Frage welchen Einfluss unterschiedliche Institutionen (Schule vs. Beruf) auf die Entwicklung verschiedener Persönlichkeitsaspekte haben. Die vorliegende Arbeit knüpft an dieser Stelle an und widmet sich der Frage: Wie entwickeln sich Realschulabsolventinnen und –absolventen im Anschluss an die 10. Klasse in Abhängigkeit von ihren Übergangsentscheidungen? Von besonderem Interesse ist dabei die Wirkung des Besuchs eines Beruflichen Gymnasiums (BG) auf die Persönlichkeit, das Selbstkonzept und die beruflichen Interessen im Vergleich zu Absolventinnen und Absolventen, die sich im Anschluss an die 10. Klasse nicht für den Besuch eines BG, sondern für eine Ausbildung, Fachschule/Berufsschule oder ein Berufskolleg entschieden. *Methode*: Im Rahmen einer Untersuchung von Übergangsentscheidungen und Ausbildungsverläufen wurden Realschulabsolventinnen und –absolventen am Ende der 10. Klasse hinsichtlich ihrer kognitiven Fähigkeiten, Persönlichkeit, beruflicher Interessen, Selbstkonzept und angestrebter Ausbildung befragt (TOSCA-10; vgl. Trautwein, Nagy & Maaz 2011). Sechs Jahre später wurden die Studienteilnehmer erneut kontaktiert und gebeten einen Fragebogen auszufüllen. Dabei wurden die tatsächlichen Ausbildungs- und Berufsbiografien der letzten 6 Jahre detailliert erhoben und zusätzlich Persönlichkeit, berufliche Interessen und Selbstkonzept wiederholt erfasst. Anhand einer Stichprobe von 382 Schülerinnen und Schülern wurde der Effekt des BG-Besuchs auf die Entwicklung von Persönlichkeit, beruflichen Interessen und Selbstkonzept untersucht. 212 Jugendliche besuchten das Berufliche Gymnasium und 170 Jugendliche entschieden sich für eine Berufsausbildung, Fachschule/Berufsschule oder ein Berufskolleg. Aufgrund systematischer Eingangsunterschiede (_selection bias_) zwischen den Gruppen konnte der Effekt des BG nicht unverfälscht mittels einfacher Mittelwertsvergleiche zum zweiten Messzeitpunkt geschätzt werden. Um mögliche Unterschiede zum ersten Messzeitpunkt kontrollieren zu können, wurden die Teilnehmer der Gruppen mittels _propensity score matching_ (_nearest neighbor_ 1:1, 1:N ohne _caliper_, 1:N _caliper_ = 0.2, 1:N _caliper_ = 0.1; _full matching_) einander so zugeordnet, dass sie sich hinsichtlich der Verteilung der Variablen, die für den Übergang in ein BG und die Vorhersage der Variablen zum zweiten Messzeitpunkt relevant sind, so wenig wie möglich voneinander unterschieden (Rosenbaum & Rubin, 1983). Dabei wurden folgende Maße berücksichtigt: Noten, kognitive Fähigkeiten, Ergebnisse mehrerer Leistungstests, Persönlichkeit, akademische Interessen, Selbstkonzept, Risikoverhalten, Lebenszufriedenheit und sozialer Hintergrund (auf Individual- und Klassenebene). Um den Effekt des Besuchs des BG auf die Persönlichkeit, akademische Interessen und den Selbstwert zum zweiten Messzeitpunkt schätzen zu können, wurden im Anschluss an das _matching_ Regressionsanalysen berechnet und alle Variablen, die bereits beim _matching_ verwendet wurden erneut mitberücksichtigt (_doubly robust_, vgl. Ho, Imai, King & Stuart, 2007; Kretschmann, Vock & Lüdke, 2014; Park, Lubinski & Benbow, 2013; Schafer & Kang, 2008). *Ergebnisse*: Im Folgenden werden die vorläufigen Ergebnisse basierend auf der full matching Stichprobe berichtet, in der die Kovariatenverteilung nach dem Matching am besten balanciert war. Die Teilnehmer, die ein BG besuchten, waren 6 Jahre nach ihrem Realschulabschluss weniger gewissenhaft, besaßen ein geringeres sprachliches und intellektuelles Selbstkonzept und interessierten sich mehr für intellektuell-forschende, soziale, unternehmerische und konventionelle Tätigkeiten als Absolventinnen und Absolventen, die sich für eine Ausbildung, Fachschule/Berufsschule oder ein Berufskolleg entschieden hatten. Diese Befunde legen nahe, dass die jeweils gewählten Bildungsgänge tatsächlich - jenseits der bekannten Effekte auf Leistungsvariablen (z.B. Baumert, Trautwein & Artelt, 2013; Becker, Lüdke, Trautwein & Baumert, 2006; Köller & Baumert, 2001) und Intelligenz (Becker, Lüdtke, Trautwein, Köller & Baumert, 2012) - auch Effekte auf bildungsrelevante Persönlichkeitseigenschaften haben. Steht der Besuch des Gymnasiums im Zusammenhang mit einer Zunahme der Intelligenz der Schülerinnen und Schüler? Karin Guill1, Oliver Lüdtke2, Olaf Köller1 1 IPN Kiel, 2IPN Kiel und Zentrum für internationale Bildungsvergleichsstudie Schulen sind unterschiedlich effektiv darin, Lesen, Mathematik oder Naturwissenschaften zu vermitteln – darin ist die Schuleffektivitätsforschung sich weitgehend einig (Reynolds et al., 2014). Nicht abschließend geklärt ist jedoch, ob die Unterschiede in der Schulqualität groß genug sind, um auch die kognitiven Grundfähigkeiten der Schülerinnen und Schüler differenziell zu beeinflussen. Gegliederte Schulsysteme wie in Deutschlang bieten gute Voraussetzungen zur Untersuchung dieser Fragestellung. Dabei wird aufgrund von Kompositions- und Institutionseffekten in der Regel von einem Vorteil des Gymnasialbesuchs gegenüber dem Besuch anderer Schulformen ausgegangen (Maaz, Trautwein, Lüdtke & Baumert, 2008). Kompositionseffekte meinen die hinsichtlich leistungsbezogener und sozialer Merkmale positive selegierte Schülerschaft am Gymnasium, die eine anspruchsvolle und damit förderliche Interaktion der Schülerin und Schüler ermöglicht. Institutionseffekte umfassen z.B. die curricular höheren Anforderungen am Gymnasium, die fachlich und fachdidaktisch besser qualifizierten Lehrkräfte und den infolgedessen kognitiv stärker aktivierenden Unterricht. Aktuelle Forschungsarbeiten belegen einen positiven Effekt des Besuchs des Gymnasiums im Vergleich zu nicht-gymnasialen Schulformen auf die Intelligenztestleistung (Becker, Lüdtke, Trautwein, Köller & Baumert, 2012) und sollen hier mit einem umfassenderen Intelligenzmaß, in einer größeren und heterogeneren Stichprobe und unter Einbeziehung einer weiteren Schulform, nämlich der Integrierten Gesamtschule, als Vergleichsgruppe fortgeführt werden. Im Fokus stehen die folgenden beiden Forschungsfragen: - Weisen Schülerinnen und Schüler nach vierjährigem Gymnasialbesuch höhere Intelligenztestwerte auf als vergleichbare Schülerinnen und Schüler der Haupt- und Realschule? - Weisen Schülerinnen und Schüler nach vierjährigem Gymnasialbesuch höhere Intelligenztestwerte auf als vergleichbare Schülerinnen und Schüler der Integrierten Gesamtschule? Für die Analysen wurden Daten der Hamburger Längsschnitt- und Schulleistungsstudie LAU (Aspekte der Lernausgangslage und Lernentwicklung; Behörde für Schule und Berufsbildung, 2011) genutzt. Hier wurde am Beginn von Jahrgangsstufe 5 und von Jahrgangsstufe 9 der CFT 20 (Cattell, 1960; Weiß, 1987), ein Maß fluider Intelligenz, von den Schülerinnen und Schülern bearbeitet. Es konnte eine längsschnittliche Stichprobe von _N_ = 8,628 Schülerinnen und Schüler genutzt werden, die in dieser Zeit konstant eine Schulform besuchten. Intelligenztest- und Schulleistungstestdaten, Noten und Angaben zum sozialen Hintergrund zum ersten Messzeitpunkt am Beginn der Sekundarschulzeit wurden genutzt, um mittels _propensity score matching_ (Ho, Imai, King & Stuart, 2007) vergleichbare Gruppen von Schülerinnen und Schülern zu bilden, die einerseits das Gymnasium und andererseits entweder die Haupt- und Realschule oder die Integrierte Gesamtschule besuchten. Fehlende Werte wurden zuvor durch multiple Imputation ersetzt. Zur Überprüfung der Stabilität der Befunde wurden verschiedene MatchingAlgorithmen (1:1 und 1:_k nearest neighbor matching, full matching_) verwendet. Der Effekt des Gymnasialbesuchs auf die Intelligenztestleistung am Beginn der neunten Jahrgangsstufe wurde innerhalb der gematchten Stichproben mittels linearer Regressionsanalysen unter nochmaliger Kontrolle aller Kovariaten aus dem Matching-Verfahren (_double robust check_; Ho et al, 2007) bestimmt. Insgesamt konnte für alle Gruppenvergleiche und alle verwendeten Matching-Algorithmen eine gute Ausbalancierung der Stichproben erreicht werden. Nach vierjährigem Besuch des Gymnasiums wiesen die Schülerinnen und Schüler höhere Intelligenztestwerte auf als eine vergleichbare Stichprobe an der Haupt- und Realschule. Die Effektstärke betrug konsistent über die verschiedenen Matching-Algorithmen hinweg _d_ = 0.40. Die Intelligenztestwerte der Gymnasiastinnen und Gymnasiasten fielen auch höher als die der vergleichbaren Stichprobe an der Integrierten Gesamtschule aus, wobei die Effektstärke in Abhängigkeit vom Matching-Algorithmus zwischen _d_ = 0.17 und _d_ = 0.28 variierte. Die Ergebnisse unterstreichen die Bedeutung einer kognitiv stimulierenden Lernumgebung für die Entwicklung der Intelligenz von Jugendlichen. Kovariatenselektion in nicht-randomisierten Studien mit unreliablen Kovariaten Marie-Ann Sengewald1, Steffi Pohl2 1 Friedrich-Schiller-Universität Jena, 2Freie Universität Berlin Häufig ist man in den Bildungswissenschaften daran interessiert den kausalen Effekt einer Maßnahme zu untersuchen, kann jedoch aufgrund ethischer oder praktischer Gründe kein randomisiertes Experiment durchführen. In nicht-randomisierten Studien liefert die Mittelwertsdifferenz auf der abhängigen Variable zwischen einer Behandlungs- und einer Kontrollgruppe im Allgemeinen eine verfälschte Schätzung des durchschnittlichen, kausalen Behandlungseffektes. Für die Reduktion des Selektionsbias werden in der Regel Kovariaten erhoben und adjustierte Behandlungseffekte in einer Kovarianzanalyse (ANCOVA) oder mit Propensity-Score Methoden geschätzt. Ob damit der kausale Effekt unverfälscht geschätzt werden kann, hängt von der Wahl der Kovariaten und deren Modellierung ab. Häufig wird dabei vernachlässigt, dass Kovariaten messfehlerbehaftet sein können. Bisherige Untersuchungen zeigen, dass messfehlerbereinigte latente Kovariaten mehr Selektionsbias reduzieren können als manifeste Kovariaten. Dies ist dann der Fall, wenn die latenten Kovariaten relevant für die Adjustierung sind. Allerdings ist die Modellierung latenter Kovariaten aufgrund von Zeitbegrenzung in der Erhebung oder Sekundär-Datenanalysen nicht immer möglich. In den bisherigen Forschungsarbeiten zum Einfluss von Messfehlern in Kovariaten auf die Schätzung kausaler Effekte liegt der Fokus auf den unreliablen Kovariaten selbst. Es gibt jedoch Hinweise darauf, dass zusätzliche, korrelierte Kovariaten für die Unreliabilität relevanter Kovariaten kompensieren können. In einer Simulationsstudie evaluierten wir für dieses Setting den Einfluss einer zusätzlichen Kovariate auf die Schätzung des durchschnittlichen kausalen Behandlungseffektes, wenn eine relevante Kovariate nur als messfehlerbehaftet Variable vorliegt. In der Simulation haben wir die Korrelationsstruktur aller Variablen im Modell (Kovariaten, Behandlungsgruppenvariable, abhängige Variable) sowie die Reliabilität der relevanten Kovariate systematisch variiert. Die generierten Daten wurden mit _EffectLiteR_ (Mayer, 2015) analysiert, welches die Berücksichtigung latenter Kovariaten erlaubt. Dabei wurde die relevante Kovariate nur als manifeste messfehlerbehaftete Kovariate in die Analyse aufgenommen. Es zeigen sich mehrere Bedingungen in denen die Effektschätzung durch die zusätzliche Kovariate verbessert wird; in einigen Bedingen kann diese jedoch die Effektschätzung auch verschlechtern. Die zusätzliche Kovariate verbessert die Schätzung bereits, wenn diese nur mit der relevanten Kovariate, nicht jedoch mit der Behandllungsvariable oder der abhängigen Variable zusammenhängt. Bei einer Korrelation von 0.4 zwischen der relevanten und zusätzlichen Kovariate, werden bereits bis zu 15% der Verfälschung, die aufgrund der Messfehlerbehaftetheit der relevanten Kovariate entsteht, reduziert. Die Reduktion der Verfälschung erhöht sich substantiell, wenn die zusätzliche Kovariate zudem die Behandlung oder die abhängige Variable determiniert. Die zusätzliche Kovariate führt zu einer Verstärkung der Verfälschung, wenn diese unkorreliert ist mit der relevanten Kovariate, jedoch mit der Behandlungsvariable zusammenhängt. Auch wenn zusätzliche Kovariaten den verfälschenden Einfluss von Messfehlern in relevanten Kovariaten verringern können, können diese die Verfälschung nicht vollständig kompensieren. Es lohnt sich also dennoch zu überlegen relevante, möglicherweise messfehlerbehaftete Kovariaten mit mehreren Indikatoren zu messen, um diese als latente Variable in die Adjustierung aufnehmen zu können. Implikationen für die Auswahl von Kovariaten in empirischen Anwendungen mit unreliablen Kovariaten werden diskutiert. Ein nichtparametrischer Bootstrapping-Ansatz zur Analyse kausaler Effekte von Interventionen in komplexen Survey Designs Axel Mayer Ghent University *Theoretischer Hintergrund* Die Analyse der differentiellen Wirksamkeit von Interventionen ist nicht nur im Bildungskontext von zentralem Interesse. Bei Mehrebenendesigns mit zwei oder mehr Interventionsgruppen unterscheidet man in der Regel zwischen Designs mit randomisierter versus nicht randomisierter Zuweisung zur Intervention und zwischen Designs mit Zuweisung auf Individualebene versus Zuweisung auf Clusterebene (Plewis & Hurry, 1998). Im vorliegenden Beitrag beschäftigen wir uns vor allem mit der Analyse von durchschnittlichen und bedingten kausalen Effekten in Designs mit nicht randomisierter Zuweisung zur Intervention auf Clusterebene (e.g., Mayer et al., 2014). In solchen Designs gilt es verschiedene Herausforderungen für die kausale Effektanalyse zu berücksichtigen. Ein entscheidender Punkt ist konfundierende Variablen auf der Individualebene und der Clusterebene zu messen und statistisch zu kontrollieren, da ansonsten Mittelwertsunterschiede zwischen Interventionsgruppen nicht kausal interpretiert werden können (Shadish, Cook, & Campbell, 2002). Für die Analyse durchschnittlicher und bedingter Effekte ist es wichtig die statistische Unsicherheit bei der Schätzung von Erwartungswerten von manifesten und latenten Kovariaten zu berücksichtigen (e.g., Kröhne, 2009). Das betrifft nicht nur die Schätzung unbedingter Erwartungswerte, sondern zum Beispiel auch die Schätzung von bedingten Erwartungswerten von Kovariaten in der Kontrollgruppe und der Interventionsgruppe, aber auch die Schätzung von clusterspezifischen Erwartungswerten von stochastischen Kovariaten (Lüdtke et al., 2008). Weitere praktische Herausforderungen für die kausale Effektanalyse bestehen häufig in der Mehrebenenstruktur der Daten, den komplexen Stichprobenziehungsdesigns und der Verletzung von Verteilungsannahmen für Residuen und/oder Random Effects. *Fragestellung* Der vorliegende Beitrag beschäftigt sich mit einem nichtparametrischen Bootstrapping-Ansatz zur Analyse kausaler Effekte. Aufbauend auf dem _EffectLiteR_-Ansatz zur Analyse von bedingten und durchschnittlichen Effekten (Mayer et al., 2015), wird dabei der Frage nachgegangen, ob ein Clusterbootstrapping-Verfahren (e.g., Davison & Hinkley, 1997) unverfälschte Punktschätzungen und Konfidenzintervalle für kausale Effekte in komplexen Survey Designs liefert und dabei die im theoretischen Teil genannten Herausforderungen adäquat berücksichtigen kann. *Methode* Zur Beantwortung der Fragestellung wurde mit simulierten Daten untersucht, wie gut die Schätzungen der kausalen Effekte mit dem Bootstrapping-Ansatz sind. Dazu wurden zunächst 1000 möglichst realistische Datensätze generiert, die aus einer quasiexperimentellen Studie mit Vortest Leseleistung, Intervention auf Klassenebene (z.B. neue Lehrmethode versus alte Lehrmethode) und Nachtest Leseleistung stammen könnten. Für jeden der 1000 simulierten Datensätze wurden wiederum jeweils 200 Bootstrapping-Samples mit einem Clusterbootstrapping-Verfahren gezogen. Beim Clusterbootstrapping-Verfahren werden zunächst Level 2 Einheiten (Klassen) zufällig mit Zurücklegen gezogen und dann werden innerhalb jeder Klasse Level 1 Einheiten (Schülerinnen und Schüler) zufällig mit (oder ohne) Zurücklegen gezogen. In komplexen Survey Designs ist es besonders wichtig, dass das ursprüngliche Design bei der Erstellung der Bootstrap-Samples möglichst genau implementiert wird. Für jedes Bootstrap-Sample wurden dann mittels des _EffectLiteR_ Modells die interessierenden kausalen Effekte berechnet, abgespeichert und mit den wahren Effekten verglichen. *Ergebnisse* In einer solchen Studie können verschiedene kausale Effekte von Interesse sein. Im vorliegenden Beispiel wurden sowohl der durchschnittliche Effekt der Intervention berechnet, als auch der bedingte Effekt für diejeningen, die die neue Lehrmethode gewählt haben, und bedingte Effekte in Abhängigkeit von der mittleren klassenspezifischen Ausgangsleseleistung. Es konnte gezeigt werden, dass man mit dem neuen Verfahren unverfälschte Punktschätzungen und Konfindenzintervalle erhält, wenn das Sampling-Design adäquat berücksichtigt wird und dass man verfälschte Schätzungen bekommt, wenn das Mehrebenendesign nicht entsprechend berücksichtigt wird. Zum Abschluss werden Vor- und Nachteile des Clusterbootstrapping-Verfahrens im Vergleich zu anderen Alternativen wie hierarchischen linearen Modellen, Mehrebenen-Strukturgleichungsmodelle und Korrekturen für Standardfehler von traditionellen Strukturgleichungsmodellen diskutiert. Schätzung von _Complier-Average-Causal-Effects_ in Mehrebenen-Interventionsstudien: Ein Beispiel aus der Motivationsforschung Benjamin Nagengast1, Brigitte Brisson1, Holger Brandt1, Chris S. Hulleman2, Hanna Gaspard1, Isabelle Häfner1, Augustin Kelava1, Ulrich Trautwein1 1 Universität Tübingen, 2University of Virginia Bei der Auswertung von randomisierten Interventionsstudien wird häufig nur der _Intent-To-Treat_ Effekt berichtet, der Unterschiede in der Bearbeitungsgüte (der _Treatment Fidelity_ oder _Compliance_) vernachlässigt. Für ein besseres Verständnis von Wirkfaktoren sind jedoch auch Effektmaße interessant, die die Bearbeitungsgüte der Intervention berücksichtigen. Ein solches Maß ist der _Complier-Average-Causal-Effect_ (CACE) - der Effekt der Intervention für Personen, die den Instruktionen tatsächlich gefolgt sind. Praktisch müssen zur Schätzung des CACE weitere Annahmen getroffen werden (siehe z.B. Angrist et al., 1996): In der Regel wird davon ausgegangen, dass es keine Personen gibt, die die Intervention unabhängig von ihrer Zuweisung zur Behandlungs- oder Kontrollgruppe immer bekommen würden (_Monotonicity Assumption_) und dass die Intervention auf Personen, die nicht den Anweisungen folgen, keinen Effekt hat (_Exclusion Restriction_). Für Interventionsstudien im Klassenkontext weisen die Modelle zur Schätzung des CACE jedoch einige Beschränkungen auf. Die Annahme der _Exclusion Restriction_ ist häufig unrealistisch: Es ist wahrscheinlich, dass Schülerinnen und Schüler sich nicht vollständig der Intervention entziehen können, wenn diese im Klassenkontext durchgeführt wird, wohl aber einzelne Elemente der Intervention verweigert werden können. Außerdem werden die Mehrebenenstruktur und ihre Effekte auf die Bearbeitungsgüte nicht berücksichtigt. Dies kann zu Verzerrungen bei der Schätzung von Varianzkomponenten und Standardfehlern der geschätzten Effekte führen. Neuere methodische Entwicklungen erlauben es durch Verwendung von Kovariaten die Exclusion Restriction zu liberalisieren und damit CACEs und _Non-Complier-Average-Causal-Effects_ (NCACEs) zu identifizieren (Jo, 2002; Jo et al., 2008). Auch die Mehrebenenstruktur kann explizit berücksichtigt werden. Im Beitrag werden diese Modelle vorgestellt und anhand eines Beispiels illustriert. In der Studie „Motivationsförderung in Mathematikunterricht“ (MoMa, Gaspard et al., 2015) sollte die Effektivität von zwei Interventionen zur Förderungen der wahrgenommenen Nützlichkeit von Mathematik überprüft werden. Dazu wurden 1978 Schülerinnen und Schüler der neunten Klasse von 25 Gymnasien in Baden-Württemberg zufällig auf Klassenebene zwei Interventions- bzw. einer Kontrollbedingung zugewiesen. In den Interventionsbedingungen erhielten die Schülerinnen und Schüler zunächst einen psychoedukativen Vortrag zur Bedeutung der Mathematik für verschiedene Studienfächer und zu Erkenntnissen der Motivationsforschung. Anschließend verfassten die Schüler entweder einen kurzen Essay über die Bedeutung der Mathematik für ihr eigenes Leben (Textbedingung) oder bearbeiteten Zitate von Studierenden und anderen Personen über die Bedeutung von Mathematik (Zitatebedingung). Zur Bestimmung der Bearbeitungsgüte wurde die Qualität der Antworten der Schülerinnen und Schüler auf vier Dimensionen bewertet (Vollständigkeit, Argumentation für Nützlichkeit der Mathematik, persönlicher Bezug und innovative Argumentation) und in einen gemeinsamen Index verrechnet. Eine dichotomisierte Version dieses Index diente in den CACE-Modellen als Indikator für die Bearbeitungsgüte der Intervention. Zur Analyse wurden CACE-Modelle für randomisierte Designs mit Gruppenzuweisung auf der Klassenebene (Jo et al., 2008) als bayesianische Mehrebenen-Mischverteilungsmodelle in _OpenBugs_ implementiert. Damit konnten CACEs und NCACEs für die Nützlichkeitswahrnehmungen, den intrinsischen Wert und das akademische Fähigkeitsselbstkonzept jeweils in Mathematik geschätzt werden. Die abhängigen Variablen waren jeweils an zwei Zeitpunkten nach der Intervention (6 Wochen, _T2_, bzw. 5 Monate, _T3_) erhoben worden. Zur Identifikation wurden zahlreiche vor der Intervention erhobene Kovariaten auf Individualund Klassenebene berücksichtigt, die sowohl die Bearbeitungsgüte als auch die abhängigen Variablen vorhersagten. Die Analysen ergaben positive CACEs in der Zitatebedingung: Schülerinnen und Schüler, die die Aufgaben in hoher Qualität bearbeiteten, berichteten unter Kontrolle der Ausgangsvoraussetzungen höhere Nützlichkeitsüberzeugungen (_T2_ und _T3_) und ein positiveres akademisches Fähigkeitsselbstkonzept (_T3_). In der Textbedingung zeigten sich keine Effekte der Intervention bei Personen, die die Aufgaben wie von der Instruktion erfordert bearbeiteten. Allerdings gab es Hinweise auf negative Effekte der Intervention für das akademische Selbstkonzept in Mathematik (_T3_) und den intrinsischen Wert der Mathematik (_T2_) bei Personen, die nur eine geringe Bearbeitungsgüte zeigten. Die Ergebnisse unterstreichen die Bedeutung der Berücksichtigung der Bearbeitungsgüte bei der Schätzung von kausalen Effekten in Interventionsstudien mit Randomisierung auf der Klassenebene. ID: 349 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung Thematisches Cluster: Bildung im Sekundarbereich, Gesundheit/ Stress/ Belastung Stichworte: Stress, Resilienzfaktoren, Sekundarschüler/-innen Mindert Stress den Bildungserfolg bei Jugendlichen? Eine interdisziplinäre Analyse zu potentiellen Resilienzfaktoren Chair(s): Frances Hoferichter (Freie Universität Berlin) Diskutant(en): Diana Raufelder (Universität Greifswald) Die letzten Jahrzehnte wurden als „the age of stress“ tituliert und ein weiterer steiler Anstieg wird unter allen Bevölkerungsschichten und Altersgruppen prognostiziert (Jackson, 2013). Tatsächlich beklagen mittlerweile nicht nur Erwachsene gestresst zu sein, sondern bereits Kinder und Jugendliche verzeichnen ein erhöhtes Stresslevel. Die Gründe dafür sind vielseitig und schließen unter anderem einen hohen Erwartungs- und Leistungsdruck (Rice & Van Arsdale, 2010; Kaplan, Liu, & Kaplan, 2005), einen vollen Stundenplan und/oder stressvolle Lebensumstände mit ein (Brown, Nobiling, Teufel, & Birch, 2011; Schraml, Perski, Grossi, & Simonsson-Sarnecki, 2011). Ein dauerhaft erhöhtes Stresslevel kann zu physischen und psychologischen Beeinträchtigungen wie Kopfschmerzen, Bauchschmerzen (Alfven, Östberg, & Hjern, 2008) als auch zu einem erhöhten Alkohol- und Tabakkonsum führen (Ng & Jeffery, 2003). Dabei sind Depression, Angststörungen und kardiovaskuläre Erkrankungen keine Seltenheit bei Menschen, die an Stress erkranken (Wang et al., 2008). Um diesem prognostizierten Trend insbesondere bei Schülern/-innen entgegenzuwirken, ist es notwendig, Resilienzfaktoren zu identifizieren, welche den Abbau von Stress unterstützen und der Entstehung von Stress präventiv entgegenwirken. Das interdisziplinäre Symposium hat sich dieser Aufgabe angenommen und untersucht aus psychologischer, erziehungswissenschaftlicher und neurowissenschaftlicher Perspektive Resilienzfaktoren bei Adoleszenten. Um sich der Fragestellung zu nähern, wurden verschiedene Methoden angewandt, z.B. quantitative Analysen von Querschnitts- und Längsschnittsdaten als auch bildgebende Verfahren im fMRT. Der erste Beitrag des Symposiums widmet sich dem Zusammenhang von Stresserleben, Selbstbestimmung und Schulengagement bei jugendlichen Schüler/-innen, wobei Autonomie, Kompetenz und soziale Eingebundenheit in Anlehnung an die Selbstbestimmungstheorie (Deci & Ryan, 1990) als mögliche Mediatoren im Zusammenspiel von Stresserleben und Schulengagement getestet wurden. Im zweiten Beitrag wird der Einfluss von Stress auf die sozio-motivationale Lehrer-Schüler Beziehung sowie auf die schulische Leistung adoleszenter Schüler-/innen im Verlauf von zwei Schuljahren thematisiert. Der dritte Beitrag beschäftigt sich mit dem neuronalen Stresserleben von Jugendlichen unter Berücksichtigung von so genannten Respondern und Non-Respondern, also denjenigen Schüler-/innen, die auf einen Stressor im bildgebenen Verfahren einer fMRT Studie sichtlich reagieren oder nicht reagieren. Im abschließenden Beitrag des Symposiums wird der Frage nachgegangen, welche Rolle sozio-motivationale schulische Beziehungen für das Wechselspiel von Stress, Neurotizismus und Prüfungsangst bei Jugendlichen spielen, mit dem Ziel, gestresste und neurotizistische Schüler-/innen beim Abbau von Prüfungsangst zu unterstützen. Die gewonnenen Einsichten der unterschiedlichen Studien werden im Symposium diskutiert, wobei mögliche Implikationen und Präventionsansätze für gestresste Schüler und Schülerinnen im Fokus stehen. Beiträge des Symposiums Das Zusammenspiel von wahrgenommenem Stress, Selbstbestimmung und Schulengagement in der Adoleszenz Alexander Lätsch Universität Greifswald Theoretischer Bezugsrahmen Das 21. Jahrhundert und insbesondere die westlichen Wissens- und Industriegesellschaften sind durch zunehmenden Stress in vielen Bereichen geprägt. So verwundert es auch nicht, dass bereits Kinder und Jugendliche immer häufiger erhöhte Stresslevel berichten und darunter leiden (Beyer & Lohaus, 2006; Lohaus, Domsch, & Fridrici, 2007; Murberg & Bru, 2007; Ravens-Sieberer, Thomas, & Erhart, 2003). Einer Studie des Deutschen Kinderschutzbundes (2012) zufolge, berichtet ein Drittel aller Grundschüler/-innen hohes – teil chronisches - Stresserleben in Verbindung mit der Schule. Dieses Stresserleben nimmt dann im Zuge der Adoleszenz mit den wachsenden schulischen Anforderungen, die an den Einzelnen gestellt werden, aber auch in Verbindung mit den internalen und externalen Veränderungen, mit denen sich der Jugendliche konfrontiert sieht, zu. Dem Stressmodell von Lazarus zufolge entsteht Stress in einem dynamischen Prozess als Zusammenspiel zwischen verschiedenen Umwelt-, situativen und personellen Faktoren (Lazarus & Folkman, 1984). Bislang gibt es allerdings kaum Studien, die dieses Zusammenspiel im Schulkontext Jugendlicher untersucht haben. Dieses Forschungsdesiderat aufgreifend, hatte die vorliegende Studie zum Ziel, das Zusammenspiel zwischen Stresserleben und dem schulischen Engagement Jugendlicher zu untersuchen. Basierend auf der Selbstbestimmungstheorie von Deci und Ryan (1985) wurde dabei das Selbstbestimmungerleben in den drei Grundbedürfnissen Autonomie, Kompetenz und soziales Eingebundensein als mögliche Mediatoren im Sinne möglicher Ansatzpunkte für Prävention- und Interventionsmaßnahmen getestet. Fragestellung Folgende Hypothese galt es im Detail zu prüfen: (1) Wahrgenommener Stress, Selbstbestimmung und Schulengagement stehen insofern in Zusammenhang, dass erlebter Stress und Schulengagement, sowie Stress und Selbstbestimmung negativ miteinander korrelieren – während Selbstbestimmung und Schulengagement positiv korrelieren. Darüber hinaus wird angenommen, dass (2) der Zusammenhang zwischen wahrgenommenem Stress und (behavioralem und emotionalem) Schulengagement durch die Selbstbestimmung (Autonomie, Kompetenz und soziale Eingebundenheit) mediiert wird. Methode Die empirische Grundlage der Studie bildet eine Fragebogenstudie an Sekundarschulen in Brandenburg mit 1088 Schülern/innen der 7ten und 8ten Klasse (Mage = 13.70; SD = 0.53; 54% Mädchen). Nach Einholen der Genehmigung des brandenburgischen Ministeriums für Bildung, Jugend und Sport, der Schulen, Eltern und teilnehmenden Schüler/-innen wurden diese 2011 zu ihrem Stresserleben, Schulengagement und ihrer Selbstbestimmung befragt. Neben der bivariaten Korrelationsanalyse zur Prüfung des postulierten Zusammenhangs der hier verwendeten Variablen (Stress, Schulengagement, Selbstbestimmungserleben), wurden – zur Überprüfung der Mediation – latente Strukturgleichungsmodelle in Mplus konzipiert, wobei die genestete Struktur der Daten (1088 Schüler/-innen in 71 Schulklassen) berücksichtigt wurde. Ergebnisse Die Ergebnisse dieser Untersuchung konnten Hypothese I bestätigen, insofern ein signifikanter Zusammenhang zwischen Stresserleben, Selbstbestimmung und Schulengagement bei den Schülern/-innen der Stichprobe eruiert werden konnte. Wie angenommen stehen Stress und Schulengagement dabei in negativem Zusammenhang, was bisherige Studienbefunde ergänzt, die zeigen konnten, dass erlebter Stress mit passivem Verhalten (gelangweilt sein, schnelles Aufgeben) und negativen Emotionen, wie bspw. Frust, in Zusammenhang steht (vgl. Skinner & Belmont, 1993). Darüber hinaus konnte gezeigt werden, dass erlebter Stress negativ mit der Selbstbestimmung der Schüler/-innen in Zusammenhang steht und vice versa. Im Gegensatz dazu konnte ein positiver Zusammenhang zwischen den Subskalen der Selbstbestimmung (Autonomie, Fähigkeiten und die Beziehung zu anderen) sowie emotionalem und behavioralem Schulengagement konstatiert werden, was im Einklang mit bisherigen Studien (vgl. Reeve, Jang, Carrell, Jeon, & Barch, 2004; Ryan & Deci, 2009) steht. Auch Hypothese II konnte bestätigt werden, insofern die drei Aspekte des Selbstbestimmungserlebens den negativen Zusammenhang zwischen Stress und behavioralen und emotionalen Schulengagement vollständig mediieren. Demnach kann davon ausgegangen werden, dass das Selbstbestimmungserleben der Schüler/-innen ein guter Ausgangspunkt für mögliche Intervention- und Präventionsansätze darstellt, was im Rahmen des Symposiums in Hinblick auf schulpraktische Implikationen diskutiert werden soll. Das reziproke Zusammenspiel von Stresserleben, Lehrer-Schüler-Beziehung und schulischer Leistung im Verlauf von früher zu mittlerer Adoleszenz Luisa Grützmacher1, Diana Raufelder2 1 Universität Potsdam, 2Universität Greifswald Theoretischer Bezugsrahmen In der Adoleszenz und im Zuge der wachsenden schulischen Anforderungen nimmt das Stresserleben der Jugendlichen zu. Unter psychologischem Stress versteht man dem relationalen Stresskonzept von Lazarus zufolge „eine Beziehung mit der Umwelt, die vom Individuum im Hinblick auf sein Wohlergehen als bedeutsam bewertet wird, aber zugleich Anforderungen an das Individuum stellt, die dessen Bewältigungsmöglichkeiten beanspruchen oder überfordern“ (Lazarus & Folkman 1986, S. 63). Speziell auf die Schule bezogen berichten SchülerInnen häufig, dass sie den Leistungsdruck, schlechte schulische Leistungen, Prüfungen, die ständige Leistungsbewertung, das Gefühl des Gehetztseins, Schwierigkeiten beim Umgang mit Lehrkräften und Peers als stressreich empfinden (Kouzma & Kennedy 2004; Jacobs & Strittmatter 1979; Rieder 1990; Pekrun & Helmke 1991; Ulich, 2001; Seiffge-Krenke 2006; Seiffge-Krenke 2008). Darüber hinaus wurde belegt, dass das Stresserleben von Jugendlichen in negativem Zusammenhang mit emotionalen und behavioralen Schulengagement steht (Raufelder et al. 2014), was bedeutet, je mehr Stress Jugendliche empfinden, desto negativer sind die Einstellungen zur Schule und desto geringer ist die Beteiligung an schulischen, sozialen und außerschulischen Aktivitäten, welche eine Voraussetzung für das Erreichen positiver schulischer Leistung darstellt (Fredricks 2004; Raufelder et al. 2014; Connell et al. 1994; Finn 1993; Skinner et al. 1990). Die Lehrer-Schüler-Beziehung ist für Jugendliche aber nicht nur ein möglicher Stressfaktor, sondern kann auch eine wichtige Unterstützung sowohl auf interpersonaler Ebene (Lehrer-Schüle-Verhältnis) als auch auf institutioneller Ebene (LehrerInnen als positive Motivatoren) für den erfolgreichen Lernprozess darstellen (Pianta, Hamre, & Stuhlman 2003; Raufelder & Mohr 2011). D.h., die Lehrer-Schüler-Beziehung stellt somit gleichzeitig eine wichtige Ressource im Stressbewältigungsprozess dar. Darüber hinaus ist die Beziehung zwischen SchülernInnen und LehrernInnen eine bedeutende Determinante für die Lern- und Leistungsmotivation der SchülerInnen (Becker & Luthar, 2002; Pianta, Hamre, & Stuhlman 2003; Stipek 2004) und die schulische Leistung der Adoleszenten (Flanagan, Erath & Bierman 2008; Raufelder & Mohr 2011; Wentzel 1998). Nehmen SchülerInnen ihre LehrerInnen als positive Motivatoren wahr, tendieren sie zu höheren Leistungen, zu höheren Lernzielen, streben nach schulischem Erfolg und der Vermeidung von schulischem Misserfolg (Raufelder, Drury, Jagenow, Hoferichter & Bukowski 2013). Allerdings gibt es bislang keine Studien, die explizit das reziproke Zusammenspiel von Stresserleben, Lehrer-Schüler-Beziehung und schulischer Leistung im Verlauf von früher zu mittlerer Adoleszenz untersucht haben. Dieses Forschungsdesiderat aufgreifend, untersucht die vorliegende Studie folgende Fragestellung: Fragestellung Es gibt einen längsschnittlichen Effekt zwischen... (1) ...dem Stresserleben in der frühen Adoleszenz und dem Stresserleben, dem Lehrer-Schüler-Verhältnis, der Wahrnehmung der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz. (2) ...dem Lehrer-Schüler-Verhältnis in der frühen Adoleszenz und dem Stresserleben, dem Lehrer-Schüler-Verhältnis, der Wahrnehmung der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz. (3) ...der Wahrnehmung der Lehrers als positive Motivatoren in der frühen Adoleszenz und dem Stresserleben, dem LehrerSchüler-Verhältnis, der Wahrnehmung der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz. (4) ...schulischer Leistung in der frühen Adoleszenz und dem Stresserleben, dem Lehrer-Schüler-Verhältnis, der Wahrnehmung der Lehrer als positive Motivatoren und schulischer Leistung in der mittleren Adoleszenz. Methode Die vorliegende Untersuchung basiert auf den Längsschnittdaten einer Fragebogenerhebung an 23 Sekundarschulen in Brandenburg. An der Studie nahmen 1088 SchülerInnen teil, die zum 1. Messzeitpunkt (2011) die 7te und 8te Klasse (Mage = 13.70, SD = 0.53) und zum 2. Messzeitpunkt (2013) 1.5 Jahre später die 9te Klasse (Mage = 14.86, SE = .57) besuchten. Die aufgestellten Hypothesen wurden mittels linearem Strukturgleichungsmodell, das im Cross-Lagged-Panel-Design angelegt ist, in Mplus 7.0 getestet. Ergebnisse Die Ergebnisse der Cross-Lagged-Panel-Untersuchung zeigen, dass die Hypothesen nur teilweise bestätigt werden können. Neben den signifikanten Effekten der gleichen Variable über die Zeit, konnte ein längsschnittlicher cross-lagged Effekt von Stresserleben auf die Wahrnehmung der LehrerInnen als positive Motivatoren eruiert werden, insofern Stress als positiver Prädiktor der Wahrnehmung von LehrerInnen als positive Motivatoren fungiert (obwohl zum ersten Erhebungszeitpunkt kein signifikanter Zusammenhang zwischen dem Stresserleben und der Wahrnehmung der LehrerInnen als positiven Motivatoren konstatiert werden konnte). Es ist folglich denkbar, dass im Stressbewältigungsprozess im Laufe der Adoleszenz auf die motivationale Unterstützung der LehrerInnen zurückgegriffen wird, was wiederum – entsprechend bisheriger Forschungsbefunde – den Stress möglicherweise abfedert bei einer gleichzeitig motivierenden Wirkung auf die SchülerInnen, was wiederum der schulischen Leistung zugutekommt. Die Ergebnisse zeigen zudem, dass die schulische Leistung in der frühen Adoleszenz die Qualität des Lehrer-Schüler-Verhältnis 1,5 Jahre später voraussagt. D.h. je besser die schulische Leistung, desto besser ist das Lehrer-Schüler-Verhältnis bzw. je schlechter die schulische Leistung, desto schlechter wird das Lehrer-Schüler-Verhältnis zwei Jahre später erlebt. Schulpraktische Implikationen zur Minimierung des Stresserlebens und zur Steigerung der Qualität der Lehrer-Schüler-Beziehung in der Adoleszenz mit dem Ziel die schulische Leistung zu optimieren werden im Rahmen des Symposiums diskutiert. Psychosozialer Leistungsstress im Jugendalter – Zusammenhänge zwischen neuronaler, hormoneller und subjektiver Stressreaktion Tobias Gleich, Sabrina Golde Charité Berlin Einleitung Ein gelungener Umgang mit Stress stellt eine immer größere Herausforderung für die gesunde und erfolgreiche Entwicklung in Leistungsgesellschaften dar. Stress wiederum erhöht erheblich das Risiko für spätere physische (v.a. kardio-vaskuläre Erkrankungen) und psychische Erkrankungen (Sapolsky, 2004). Im Jugendalter ist das Gehirn besonders anfällig für negative Effekte von psychosozialem Stress (Lupien, McEwen, Gunnar, & Heim, 2009). Veränderungen aufgrund der körperlichen und psychischen Entwicklung in der Pubertät, gesteigerte akademische Anforderungen sowie psychosoziale Veränderungen im Rahmen von Familie und Peers stellen typische Stressfaktoren in dieser Zeit dar. Dem Stresshormon Cortisol kommt eine tragende Rolle in der biologischen Stressregulation zu. Aktuelle Studien zeigen, dass sich die Cortisolantwort unter Stress bei Erwachsenen in zwei Antwortmuster gliedern lassen: Eines, bei dem Stresssituationen von rapidem Cortisolanstieg begleitet sind (Gruppe der “Responder”) und eines, bei dem dieser Anstieg fehlt (Gruppe der “NonResponder”) (Miller, Plessow, Kirschbaum, & Stalder, 2013). Weiterhin gibt es Hinweise, dass sich diese Gruppen im Hinblick auf ihre Stressvulnerabilität unterscheiden (z.B. Kunz-Ebrecht, Mohamed-Ali, Feldman, Kirschbaum, & Steptoe, 2003). Im Gehirn werden insbesondere der Hippocampus und der Präfrontale Kortex (PFC) mit der Regulation von Stress in Verbindung gebracht (Pruessner et al., 2010; Zschucke, Renneberg, Dimeo, Wüstenberg, & Ströhle, 2015). In der hier vorgestellten Studie wurde die Interaktion zwischen psychischem Stress- und Anspannungsempfinden, Cortisol (gemessen im Speichel) und neuronaler Aktivierung während einer stressauslösenden fMRT-Aufgabe bei Jugendlichen im Rahmen der „Responder-“ und „Non-Responder-“ Kriterien untersucht. Methode Es wurden 47 Jugendliche zwischen 14 und 17 Jahren (M = 15.7 ±.59, 22 Mädchen) aus Sekundarschulen in Berlin und Brandenburg rekrutiert. Eine adaptierte Version der „Montreal Imaging Stress Task“ (MIST) wurde verwendet, um die Teilnehmer/Innen unterschiedlichen Intensitäten von Stress auszusetzen (Dedovic et al., 2005; Zschucke et al., 2015). Die Task beinhaltet Mathematikaufgaben, bei denen Zeitdruck und Aufgabenschwierigkeit individuell angepasst werden, um die Leistung niedrig zu halten. Eine fingierte Vergleichsstichprobe, sowie negatives soziales Feedback erhöhten den sozialen Druck zusätzlich. Vor und nach der Stressinduktion wurden subjektive Stress- und Anspannungswerte erhoben und Veränderungen der Cortisolkonzentration erfasst. Ergebnisse Erste Ergebnisse in der Gesamtgruppe zeigen, dass ansteigender Stress durch neuronale Aktivierungsanstiege in Bereichen des PFC, der Inselrinde, des temporoparietalen Übergangs (TPJ) und dem Hippocampus gekennzeichnet sind. Die neuronale Aktivität des orbitofrontalen Cortex (OFC) und des ventralen Striatums nahm hingegen unter psychosozialem Stress ab. Sowohl bei Respondern, als auch bei Non-Respondern gab es einen Zusammenhang zwischen den neuronalen Aktivierungszunahmen der Insula und TPJ bei Stress und subjektivem Stress- und Anspannungsempfinden. Jedoch nur bei Respondern hing der Aktivierungsanstieg des Hippocampus unter Stress sowohl mit subjektivem Stress- und Anspannungsempfinden, als auch mit Cortisolanstieg im Speichel zusammen. Diskussion Die beobachteten Aktivierungsunterschiede in PFC und Hippocampus bestätigen aktuelle Studien und zeigen zudem, dass diesen Regionen auch bei Adoleszenten eine wichtige Rolle bei der Stressregulation zukommt. In Übereinstimmung mit der Rolle des OFC und ventralem Striatums für die Verarbeitung von sozialer Belohnung bzw. Bestrafung zeigte sich eine verringerte neuronale Aktivität in der erhöhten psychosozialen Stressbedingung (McClure, York, & Montague, 2004). Weiterhin bestand ein positiver Zusammenhang zwischen subjektivem Stresserleben und neuronaler Aktivierung der Inselrinde und TPJ, Strukturen entscheidend für soziale Wahrnehmung und Salienz (Fiske & Taylor, 2013). Dies bestätigt die Bedeutung von sozialen Faktoren bei der Entstehung von erlebtem Stress in der Jugend auf neuronaler Ebene. Die Tatsache, dass wir nur bei Respondern eine Verbindung zwischen Hippocampus-Aktivität und sowohl Stress- und Anspannungssempfinden, also auch Cortisolanstieg, gefunden haben, deutet auf eine besondere physiologische und neuronale Dynamik der Stressverarbeitung in dieser Gruppe hin. Die ambivalente Rolle sozio-motivationaler Beziehungen im Zusammenhang mit Stress, Neurotizismus und Prüfungsangst bei Sekundarschülern/-innen Frances Hoferichter Freie Universität Berlin Theoretischer Bezugsrahmen Laut einer Studie, die 11.000 Schulkinder im Alter von 9 bis 14 Jahre befragte, fühlen sich fast ein Viertel aller Kinder regelmäßig gestresst (LBS Kinderbarometer 2009). Einer Tagebuch-Studie zufolge, gehören schulische Stressoren wie Leistungsdruck, Nervosität vor Tests und die Angst vor schlechten Noten zu den häufigsten Alltagsbelastungen von Kindern und Jugendlichen (Seiffge-Krenke, 1995). In welchem Maße jedoch diese Stressoren zu einer Stressreaktion führen, hängt unter anderem auch von Persönlichkeitsfacetten ab. Basierend auf dem trait-state model, besteht beispielsweise eine Wechselwirkung zwischen dem Persönlichkeitsmerkmal Neurotizismus und Stress als auch Prüfungsangst (Murberg & Bru, 2007; Szabó, 2011; Spielberger, 1966). Das bedeutet, dass Schüler/-innen mit der Prädisposition ängstlich zu sein im Vergleich zu ihren Klassenkameraden/-innn stärker an Prüfungsangst leiden und ihre Umwelt eher als stressig wahrnehmen. Nach der social connectedness theory (Twenge, 2000) dienen soziale Netzwerke als Stabilisatoren für Persönlichkeit, psychosomatische Befindlichkeiten und beugen Ängsten vor. Bislang gibt es jedoch keine Studien, die Stress und Persönlichkeitskomponenten unter Einbeziehung von sozialen Beziehungen in Bezug auf Prüfungsangst im Schulkontext analysiert haben. Fragestellung Mit dem Ziel diese Forschungslücke zu schließen, wurde in der vorliegenden Studie der Zusammenhang von Stress, Neurotizismus, Prüfungsangst und sozio-motivationalen Beziehungen bei Sekundarschülern/-innen untersucht. Dabei wurde angenommen, dass eine positive Schüler-Schüler-Beziehung (SSB) als auch Lehrer-Schüler Beziehung (LSB) den Zusammenhang von Stress und Neurotizismus mit Prüfungsangst mediiert (Hypothese 1). Es wurde weiterhin angenommen, dass Peers als positive Motivatoren (PPM) und Lehrer als positive Motivatoren (LPM) den Zusammenhang von Stress und Neurotizismus mit Prüfungsangst mediieren (Hypothese 2). Insgesamt wurde dabei erwartet, dass die postulierten Mediatoren Prüfungsängste insbesondere für gestresste und neurotizistische Schüler/-innen abschwächen. Methode Insgesamt nahmen 1.088 Sekundarschülern/-innen der siebten und achten Klasse aus Brandenburg (587 Mädchen, MAlter =13,7; SD = 0,5; Altersspanne, 12–15 Jahre) an der Fragebogenstudie teil. Nachdem das Ministerium für Bildung, Jugend und Sport, Schulen, Schüler/-innen und Eltern der Teilnahme an der Studie zustimmten, wurden die Schüler/-innen 2011 zu ihren sozio-motivationalen Beziehungen, Persönlichkeit, Stress und Prüfungsangst befragt. Um die Hypothesen zu testen, wurden latente Strukturgleichungsmodelle im Statistikprogramm Mplus konzipiert (Muthén & Muthén, 1998-2013). Ergebnisse Die Ergebnisse der Studie konnten Hypothese 1 teilweise bestätigen und zeigen, dass eine positive SSB den Zusammenhang von Neurotizismus und Prüfungsangst mediiert, jedoch nicht den Zusammenhang von Stress und Prüfungsangst. Eine gute LSB konnte hingegen nicht als Mediator im konzipierten Modell nachgewiesen werden. Des Weiteren zeigen die Ergebnisse, dass PPM und LPM die Beziehung von sowohl Neurotizismus als auch Stress mit Prüfungsangst mediieren. Damit konnte Hypothese 2 vollständig bestätigt werden. Interessanterweise und entgegen unserer Annahme, intensivieren PPM und LPM jedoch das Empfinden von Prüfungsangst bei neurotizistischen und gestressten Schülern/-innen. Zusammenfassend kann man sagen, dass eine positive SSB helfen kann, Prüfungsängste abzubauen, wohingegen die motivationale Orientierung zu Peers und Lehrern Prüfungsangst – aufgrund einer möglichen Abhängigkeitsbeziehung – verstärkt. Damit unterstreicht die Studie die ambivalente Rolle sozio-motivationaler Beziehungen, die im Symposium eingehend diskutiert werden soll. ID: 351 Symposium Disziplinen-Cluster: Erziehungswissenschaft Thematisches Cluster: Bildung im Sekundarbereich, Genderforschung, Motivation und Emotion Stichworte: Soziale Unterstützung, Schüler-Schüler-Verhältnis, Lehrer-Schüler-Verhältnis, Prüfungsangst, Schulengagement, Eltern Kann soziale Unterstützung ungünstigen Bildungstendenzen entgegenwirken? Chair(s): Olga Bakadorova (Ernst-Moritz-Arndt-Universität Greifswald) Diskutant(en): Frances Hoferichter (Freie Universität Berlin) Eine übergeordnete Ängstlichkeitsdisposition, die im 5-Faktoren-Modell der Persönlichkeit als Neurotizismus bekannt ist (Chamorro-Premuzic, Ahmetoglu, & Furnham, 2008) und häufig mit erhöhter Prüfungsängstlichkeit (Hodapp et al., 2011) und Stress (Murberg & Bru, 2007) einher geht, aber auch ein niedriges schulisches Selbstkonzept können als Determinanten ungünstiger Bildungstendenzen betrachtet werden, insofern sie sich negativ auf schulische Lern- und Motivationsprozesse und auch Leistung auswirken, was im schlimmsten Fall zu einem vorzeitigen Schulabbruch führen kann (Cortina, 2008; Rumberger & Rotermund, 2012). Das ist besonders in der Adoleszenz essenziell, wenn die Heranwachsenden neben den Veränderungen durch den Schulwechsel vielfache physische, psychische und kognitive Veränderungsprozesse bewältigen müssen. So haben Langzeitstudien mit SchülerInnen verschiedener Altersstufen gezeigt, dass negative emotionale Zustände ihren Prävalenzhöhepunkt in der Adoleszenz haben (Compas, Hinden, & Gerhardt, 1995; Petersen et al., 1993). Im Vergleich zu Erwachsenen tendieren Adoleszente zu stärkeren, intensiveren und extremeren emotionalen Reaktionen (Arnett, 1999; Buchanan, Eccles, & Becker, 1992). Diese Veränderungen führen bei vielen adoleszenten SchülerInnen zu einer Abnahme der schulischen Motivation und Leistung sowie des Schulengagements (Harter, 1996; Wigfield, & Eccles, 2001), deren Tiefpunkt in der neunten Klasse zu verzeichnen ist (Harter, 1996). Um dieses negative Zusammenspiel zwischen negativen Persönlichkeitsdispositionen, niedrigem schulischen Selbstkonzept, sowie erhöhtem Stresserleben als ungünstige Bildungstendenzen und schulischen Motivations- und Lernprozessen zu durchbrechen, wird im Rahmen dieses Symposiums soziale Unterstützung – wie sie in positiven Beziehungen mit Mitschüler/-innen (Peers) und Lehrer/-innen, aber auch in positiven Beziehungen mit den Eltern erlebt wird – als möglicher Ansatzpunkt für Präventions- und Interventionsstrategien untersucht und diskutiert. Dabei ist das Symposium interdisziplinär (Erziehungswissenschaft, Psychologie und Neurowissenschaft), sowie methodenplural (Quantitative Fragebogenstudien, qualitative Interviews und bildgebende Verfahren im fMRT) ausgerichtet: im ersten Beitrag steht die Rolle elterlicher Unterstützung bzw. Druck im Zusammenspiel von Prüfungsangst und Schulengagement im Fokus der statistischen Untersuchung einer großen Stichprobe (N = 1088) von Sekundarschüler/-innen aus Brandenburg. Als zweiter Beitrag wird eine fMRT-gestützte Studie vorgestellt, in der die neuronale Verarbeitung von Freunden und Lehrern verglichen und Zusammenhänge mit dem Selbstkonzept analysiert werden. Im dritten Beitrag wird mittels thematischer Analyse qualitativer Interviews der Frage nachgegangen, ob Schüler/-innen mit einem hohen (N = 18) vs. niedrigen schulischen Selbstkonzept (N = 18) soziale Unterstützung von Peers und Lehrkräften in Bezug auf Motivation und Lernverhalten gleichermaßen erleben. Im letzten Beitrag wird anhand der Fragebogendaten einer großen Stichprobe (N = 513) von Sekundarschüler/-innen aus Berlin untersucht, ob soziale Unterstützung in Form eines positiv erlebten Schüler-SchülerVerhältnisses und Lehrer-Schüler-Verhältnisses den Zusammenhang zwischen Neurotizismus und Prüfungsangst mediiert, wobei mögliche Geschlechterunterschiede berücksichtigt werden. Die Ergebnisse der interdisziplinären Beiträge werden abschließend in Hinblick auf mögliche schulpraktische Implikationen diskutiert. Beiträge des Symposiums Die Rolle von wahrgenommener elterlicher Unterstützung und Druck für das Zusammenspiel von Prüfungsangst und Schulengagement: Geschlechtsspezifische Effekte bei Jugendlichen Nicola Regner1, Tobias Ringeisen2 1 UCL Institute of Education, 2Hochschule Merseburg Theoretischer Hintergrund: Das sozio-kontextuelle Modell zu schulischer Leistung und leistungsbezogenen Emotionen (SoKoMoLE; Eccles, 2007; Jacobs & Eccles, 1992; Simpkins, Fredricks, & Eccles, 2012) postuliert geschlechtsspezifische Pfade zwischen schulbezogenem Elternverhalten, Leistung und Engagement sowie leistungsbezogenen Emotionen bei Jugendlichen. Eccles und Kollegen nehmen an, dass das geschlechtsbezogene (Rollen-)Verhalten von Mutter und Vater differenziell mit der Prüfungsangst bei Jungen und Mädchen assoziiert ist und sich auf Mitarbeit, Engagement und Leistung in der Schule auswirkt. Empirische Belege fehlen weitgehend, da bisherige Studien den kombinierten Einfluss von Mutter und Vater gemessen und/oder die Facetten von Prüfungsangst nicht differenziert haben (Bögels & Phares, 2008; Brand & Klimes-Dougan, 2010). Fragestellung: Im Einklang mit den Annahmen des SoKoMoLE wurde in der aktuellen Studie untersucht, ob geschlechtsspezifische Pfade zwischen (hemmender und aktivierender) Prüfungsangst bei jugendlichen Schülerinnen und Schülern und dem Schulengagement bestehen und ob dieses Zusammenspiel durch das wahrgenommene schulbezogenem Elternverhalten (Unterstützung und Druck) mediiert wird. Methode: Eine Schülerstichprobe der Jahrgangsstufen 7 und 8 (N = 1088; 587 Mädchen, 501 Jungen; Mage = 13.70; SD = 0.53) füllten Fragebögen zur wahrgenommenen elterlichen Unterstützung und zum elterlichen Druck (separat für Mutter und Vater; Reitzle, Metzke & Steinhausen, 2001), zum Schulengagement (emotionale und behaviorale Facetten; Skinner, Furrer, Marchand &Kindermann, 2008), sowie zur hemmenden und aktivierenden Prüfungsangst (Petermann & Winkel, 2007) aus. Die Schüler stammten aus 23 Sekundarschulen (11 Oberschulen und 12 Gymnasien), die zufällig aus den insgesamt 124 Sekundarschulen in Brandenburg ausgewählt worden waren. Auf Basis eines Multigruppenvergleichs wurden anhand von Strukturgleichungsmodellen mögliche Geschlechtsunterschiede im Zusammenhangsmuster der Variablen untersucht. Ergebnisse: Es zeigten sich Geschlechtsunterschiede im Zusammenspiel von Prüfungsangst, wahrgenommener elterlicher Unterstützung und elterlichem Druck sowie schulischem Engagement. Bei Mädchen fungierte mütterlicher Druck als Mediator zwischen hemmender Prüfungsangst und emotionalem Schulengagement, während mütterliche Unterstützung nur teilweise den Zusammenhang zwischen aktivierender Prüfungsangst und emotionalem sowie behavorialem Schulengagement mediierte. Bei Jungen fungierte mütterliche Unterstützung als vollständiger Mediator zwischen hemmender Prüfungsangst und behavorialem Schulengagement, während väterliche Unterstützung partiell die Assoziation zwischen aktivierender Prüfungsangst und emotionalem Schulengagement mediierte. Die Ergebnisse legen nahe, dass bei Mädchen das schulisches Engagement eher vom Verhalten der Mutter abhängt, während bei Jungen beide Elternteile eine essentielle Rolle für das Zusammenwirken von Prüfungsangst und schulischem Engagements spielen. Implikationen für die weitere Forschung zur Bedeutung von elterlichem Verhalten für Leistung und Engagement sowie die Nutzbarmachung dieser Ergebnisse für den schulischen Kontext werden diskutiert. Die Bedeutung von Freunden für die Entwicklung eines kohärenten Selbstkonzepts – eine fMRT-Studie Sabrina Golde Charite Berlin Einleitung Die mittlere Adoleszenz ist einerseits eine Zeit der steigenden Autonomie und eine kritische Phase für die Bildung eines kohärenten Selbstkonzepts (Harter, 2012) Andererseits ist es eine Phase der sozialen Re-Orientierung (Nelson, Leibenluft, McClure, & Pine, 2005) und dabei auch der gesteigerten sozialen Abhängigkeit und Sensibilität gegenüber Peers (Peake, Dishion, Stormshak, Moore, & Pfeifer, 2013). Um dem oft berichteten, gesteigerten Risikoverhalten und der sinkenden akademischen Motivation in dieser Lebensphase entgegenzuwirken, ist soziale Unterstützung durch Lehrer und Freunde entscheidend (Dahl, 2004). Ziel dieser interdisziplinären Untersuchung war es daher zu analysieren und zu vergleichen, inwiefern sich die Relevanz von Freunden und Lehrern in dieser Zeit auch auf neuronaler Ebene zeigt. Konkret haben wir untersucht, inwiefern neuronale Strukturen der Verarbeitung des selbstrelevanter Inhalte bei Jugendlichen auch bei der Verarbeitung von freunden- und lehrerbezogenen Aspekten im Vordergrund stehen. Zudem hat uns interessiert, wie Unterschiede in der Involvierung dieser neuronalen Strukturen bei der Verarbeitung von Freunden und Lehrern mit der gefühlten Einsamkeit und dem akademischen Selbstkonzept in Verbindung stehen. Methoden 41 Adoleszente beurteilten im Magnetresonanztomographen, ob verschiedene Persönlichkeitseigenschaften auf sie (Selbstreferenz), ihre Freunde, Lehrer oder Politiker zutreffen. Im Anschluss wurden Zusammenhänge zwischen Unterschieden in der Aktivierung neuronaler Strukturen der selbstreferenziellen Verarbeitung, insbesondere des ventralen medialen Präfrontalkortex, und berichteter Einsamkeit sowie akademischen Selbstkonzept analysiert. Ergebnisse Selbstbeurteilungen und die Beurteilungen von Freunden wurden in stark überlappenden Regionen des Gehirns, d.h. in den klassischen Regionen des neuronalen Selbst-Netzwerks, verarbeitet. Im Gegensatz dazu fanden wir kaum Unterschied zwischen der neuronalen Verarbeitung von Lehrern und einer fremden Personengruppe, die der Politiker. Hohe berichtete Einsamkeit hing negativ mit der Aktivierung dieser Strukturen bei Freunden und Lehrern zusammen. Die Aktivierung bei Freunden sagte wiederum ein hohes akademisches Selbstkonzept vorher. Diskussion Die Ergebnisse unterstützen die hohe Relevanz von psychologischer Nähe zu Freunden für die Entwicklung eines stabilen (akademischen) Selbstkonzepts in der Adoleszenz auf neuronaler Ebene. Darüber hinaus könnten die Zusammenhänge zwischen gefühlter Einsamkeit und neuronaler Aktivierung bei Freunden und Lehrern von neurowissenschaftlicher Seite darauf hinweisen, dass einsame Jugendliche eine größere psychologische Distanz zu ihren Freunden und Lehrern wahren und somit weniger soziale Unterstützung erfahren. Differences in perception of social support among students with high and low academic self-concepts Olga Bakadorova Ernst-Moritz-Arndt-Universität Greifswald Theoretical Background The transition from primary to secondary school in early adolescence, marked by physical and psychical changes (Rosenberg, 1979), is often associated with a motivational decline, academic failure or even school dropout (Ellis, Marsh, & Craven, 2005), affecting adolescents’ development and educational chances in a long-term perspective. However, while some students experience the transition as threatening, others take it as a challenge they successfully overcome. (Ellis et al., 2005). Self-concept plays a vitally important role in this respect (Brinthaupt & Lipka, 2002), being not only both a condition and major outcome of learning situations (Marsh, Craven, & MacInerney, 2005), but also contributing to long-lasting effects. Research suggests high self-concept promotes psychological well-being (Craven & Marsh, 2008), presenting a protective factor during transitions and adjustment (Gilman & Huebner, 2006). In school context, academic self-concept as a sub-component of self-concept, addressing cognitive abilities in learning situations (Schöne et al., 2012), is essential for cyclical reinforcement of achievement (Marsh, 1990). Therefore, its maintenance is vitally important for long-lasting educational outcomes. At the same time, in adolescence both peers and teachers gain in importance (Harter, 1996), revealing a mismatch between adolescents’ needs and school transition implications: new (academic and social) demands, larger classes, different peer groups (Rosenberg, 1979). Peers provide attachment (Rubin, Bukowski, & Laursen, 2009), emotional comfort (Azmitia, Cooper, & Braun, 2009), and learning support (Seiffige-Krenke, 1990), positively affecting academic motivation and achievement (Birch & Ladd, 1996). Teachers’ support is in turn associated with students’ school self-concept (Skaalvik & Skaalvik, 2013), commitment to learning (Becker & Luthar, 2002), higher achievement (Goodenow, 1993), and better school adjustment (Yueung & Leadbeater, 2010). In sum, the literature research evidences positive effects of high (academic) self-concept on educational outcomes and indicates positive associations between self-concept and social support, suggesting social relations present an important protective factor for positive development in long-term perspective when put in the core of preventing strategies. Research Questions The current study explores the role of social relations with teachers and peers as well as their association with educational outcomes among students with high or low academic self-concepts. The goal is to estimate the influence of these social actors on motivational, learning and educational processes during school transition and address their impact in lifelong perspective. Method 36 German-speaking adolescents from 23 schools in Brandenburg, determined by a prior longitudinal quantitative study (N2011 = 1088; N2013 = 845). were randomly selected for semi-structured qualitative interviews (Smith & Osborn, 2003), adressing school process, social relations and motivation. In both high (HSSC) and low (LSSC) academic self-concept groups boys and girls were represented (HSSC: 7 boys, 11 girls (MAge = 16.3, SD = .53); LSSC: 10 boys, 8 girls (MAge= 16.5, SD = .55)). The interviews were analyzed by inductive thematic analysis (Braun & Clarke, 2006) with an inter-rater agreement κ ≥ .89. Results The results suggest peers are an important source of motivation (Wentzel, 2009) for all students, contributing to a positive social climate (Wilson, 2004) and fulfilling emotional needs (Rubi et al., 2009). However, while high self-concept students were motivated through comparison to others and strived for acknowledgement, low school self-concept students were motivated by support and empowerment. Close relations with teachers provided emotional comfort for both groups, facilitating students’ motivation (Federici & Skaalvik, 2014). However, HSSC students emphasized feeling of belonging, while LSSC students expressed the need of fairness. While HSSC students were motivated by direct feedback including critique, LSSC students wished themselves encouragement or positive comparison to important others. Practical implementations and their consequences for educational context are discussed. Profitieren neurotizistische Schüler/-innen von sozialer Unterstützung in Hinblick auf ihre Prüfungsängstlichkeit? Diana Raufelder1, Frances Hoferichter2 1 Ernst-Moritz-Arndt-Universität Greifswald, 2Freie Universität Berlin Theoretischer Bezugsrahmen Die Schule ist im besonderen Maße ein „Austragungsort“ unserer „test-oriented“ und „test-consuming“ Kultur (vgl. Zeidner, 2004). So ist Prüfungsangst die Emotion, die unter Schülern/-innen am häufigsten genannt wird (Pekrun, 2000; Cassadya & Johnson, 2002; Elliot & McGregor, 1999; Eum & Rice, 2011). Einer Tagebuch-Studie zufolge, gehören schulische Stressoren, wie Leistungsdruck, Nervosität vor Tests und die Angst vor schlechten Noten zu den häufigsten Alltagsbelastungen von Kindern und Jugendlichen (Seiffge-Krenke, 1995). Die Angst vor Prüfungen ist dabei unabhängig von der Schulform unter den Schülern/innen verbreitet (vgl. Winkel, 2009). Prüfungsangst führt zu einer Abnahme des Selbstwerts und Selbstkonzepts (Pekrun, 2000), reduziert intrinsische Motivation (Deci & Ryan, 1990), die Fähigkeit der Leistungserbringung (Cortina, 2008; Frydenberg, 2002; Kondo, 1997) und wirkt sich negativ auf die Persönlichkeitsentwicklung und psychosomatische Gesundheit aus. Darüber hinaus kann Prüfungsangst zu frühem Schulausschluss/-abbruch führen (Wild, Hofer, & Pekrun, 2006; Yousefi, 2012), was den weiteren Werdegang maßgeblich beeinflussen kann. Einige Forscher/-innen haben die verschiedenen Manifestationen von Prüfungsangst als Ausdruck einer übergeordneten Ängstlichkeitsdisposition identifiziert, die im Fünf-Faktoren-Modell der Persönlichkeit als Neurotizismus bekannt ist (Chamorro-Premuzic, Ahmetoglu, & Furnham, 2008). Da erlebte soziale Unterstützung sowohl zur Entwicklung einer gesunden Persönlichkeit als auch zur Minimierung von Ängsten beitragen kann (Flanagan, Erath, & Bierman, 2008; Steptoe, Wardle, Pollard, Canaan, & Davies, 1996), wurde die Rolle sozialer Beziehungen mit Peers und Lehrer/-innen im Schulkontext als mögliche externale Ansatzpunkte für Präventions- und Interventionsmaßnahmen getestet, wobei Geschlechtereffekte berücksichtigt wurden, da Mädchen in der Regel sowohl mehr Prüfungsangst (Chapell et al., 2005) als auch Neurotizismus (McCrae et al., 2002) berichten. Fragestellung Folgende Hypothesen galt es im Detail zu überprüfen: (I) Mädchen berichten mehr Prüfungsangst (worry und emotionality) und Neurotizismus. Darüber hinaus erleben Mädchen die Beziehungen zu ihren Lehrer/-innen positiver als Jungen. In Bezug auf die Beziehungen zu Mitschüler/-innen wurde kein Geschlechterunterschied erwartet. (II) Der Zusammenhang zwischen Neurotizismus und Prüfungsangst wird durch die Qualität der Lehrer-Schüler-Beziehung (LSB) und Schüler-Schüler-Beziehung (SSB) mediiert. Methode Die empirische Grundlage der Studie bildet eine Fragebogenstudie an Gymnasien in Berlin mit 513 Schülern/-innen (MAlter = 14,03, SD = ,55, Altersspanne: 13–16 Jahre; 301 Mädchen, 212 Jungen). Die Schüler/-innen wurden 2009 zu ihrer Prüfungsangst, Persönlichkeit und ihren sozialen Beziehungen mit Peers und Lehrkräften befragt. Zur Überprüfung der Hypothesen wurden mittels Mplus (1) ein latenter Mittelwertsvergleich durchgeführt und (2) ein Strukturgleichungsmodell konzipiert, in dem LSB und SSB als Mediator fungieren. Ergebnisse Die Ergebnisse des latenten Mittelwertvergleichs bestätigen Hypothese I teilweise, da Mädchen im Vergleich zu Jungen eher Prüfungsangst (worry und emotionality) erleben und auch eher dazu neigen, neurotizistisch zu sein.. In Bezug auf das Erleben sozialer Beziehungen konnten hingegen keine Geschlechterunterschiede identifiziert werden. Hypothese II wurde insofern bestätigt, dass eine positive SSB den Zusammenhang zwischen Neurotizismus und beiden Aspekten der Prüfungsangst (worry und emotionality) mediiert, nicht aber die LSB. D.h., das Erleben von sozialer Unterstützung durch positive Peer-Beziehungen kann dazu beitragen die Prüfungsängstlichkeit von neurotizistischen Schüler/-innen zu minimieren. Schulpraktische Konsequenzen aus den Forschungsbefunden werden diskutiert. ID: 354 Symposium Disziplinen-Cluster: Psychologie Thematisches Cluster: Gesundheit/ Stress/ Belastung, Lernen mit Computer und neuen Medien, Vorschulische Bildung Stichworte: Schreiben, Lesen, Motorik, Kognition, Kinder Motorik und Schriftspracherwerb in heterogenen Gruppen Chair(s): Julia Festman (Universität Potsdam), Annegret Klassert (Universität Potsdam) Diskutant(en): Sascha Schröder (MPIB) Die interdisziplinäre Forschungsgruppe Heterogenität und Inklusion (FG-HI) der Universität Potsdam wurde im Oktober 2013 gegründet, um empirisch zu untersuchen, wie Kinder in heterogenen Gruppen Schriftsprache erwerben. Hierbei gilt es insbesondere, die interdisziplinären Zusammenhänge beim Schriftspracherwerb näher zu betrachten, aber auch die förderlichen und hindernden Faktoren zu identifizieren und Möglichkeiten der Kompensation zu erarbeiten. Methodisch breit betreibt die Forschungsgruppe sowohl experimentelle Grundlagen- als auch Anwendungsforschung. Sie besteht aus NachwuchswissenschaftlerInnen und bündelt die Expertise der Humanwissenschaftlichen Fakultät der Universität Potsdam in den Disziplinen Erziehungswissenschaften, Primarstufe, Inklusionspädagogik, Linguistik, Psychologie, Sport- und Gesundheitswissenschaften. Ein Schwerpunkt der FG-HI liegt in der Erforschung des Zusammenhangs zwischen der motorischen Entwicklung und dem Schreiberwerb. Die Annahme, dass der Erfolg des Schreiberwerbs auf der Aneignung basaler grob- und feinmotorischer Komponenten beruht (Van Galen 1991), ist nicht neu. Dennoch ist über die Art und das Ausmaß des Zusammenspiels von verschiedenen Dimensionen motorischer Fähigkeiten und grundlegender (grafomotorischer) wie auch höherer Schreibfähigkeiten (z.B. orthografisches und phonologisches Regelwissen) wenig bekannt. Die Beiträge des Symposiums stellen Erkenntnisse aus den einzelnen Teilprojekten der FG-HI dar, die motorische Aspekte des Schreibens aus unterschiedlichen interdisziplinären Perspektiven und in verschiedenen Populationen untersucht haben. Getestet wurden u.a. Kinder in sozial schwächeren Stadtteilen, Kinder mit Migrationshintergrund, und Kinder aus inklusiven Grundschulen. Im Beitrag von Gerth und Kollegen werden Ergebnisse aus dem Projekt „Tablet vs. Papier“ (TaPir) vorgestellt. Dieses erforscht, ausgehend von der Debatte um die zunehmende Digitalisierung in der Schule, ob die Anforderungen, auf einem Tablet oder auf dem Papier zu schreiben, identisch sind. Im Fokus des Beitrags stehen hierbei Aspekte der motorischen Ausführung von Schülern der 2. Klasse verglichen mit einer Gruppe von Erwachsenen. Fließer und Kollegen präsentieren Erkenntnisse aus dem Projekt „Motorik-Balance-Schreiben“ (MoBaS), zur Frage frühe Handschriftfähigkeiten bei Vorschulkindern mit der motorischen Entwicklung in den Teilbereichen Stützmotorik, Bewegungsmotorik und Handgeschicklichkeit assoziiert sind. Zwei weitere Beiträge stellen Ergebnisse aus dem Projekt „Rahmenbedingungen des Schriftspracherwerbs“ (RaSch) dar. Anhand einer heterogenen Stichprobe von Drittklässlern (n=167) untersucht die FG-HI hier das Zusammenspiel von kognitiven, sprachlichen, motorischen und emotionalen Fähigkeiten und dem Schriftspracherwerb. Wotschack & Klassert berichten über einen neuen Test zur Erfassung der motorischen Komponente des Schreiberwerbs und dessen diagnostische Relevanz für Schwierigkeiten im Schriftspracherwerb in vier Gruppen (ungestört, Lese-Rechtschreibstörung, isolierte Lesestörung oder isolierte Rechtschreibstörung). Der Vortrag von Czapka und Kollegen beschreibt den Einfluss von kognitiver und motorischer Belastung auf motorische Balancefähigkeiten und exekutiven Funktionen und deren Zusammenhang mit den Rechtschreibkompentenzen der Kinder der heterogenen Stichprobe. Beiträge des Symposiums Tablet statt Tafel oder wie sich die Digitalisierung in den Schulen auf die Handschriftqualität auswirkt Sabrina Gerth, Michael Fliesser, Annegret Klassert, Julia Festman Universität Potsdam Die Debatte um die Digitalisierung in den Schulen wird momentan ausgiebig in der Politik und der Presse geführt. Weltweit wird daran gearbeitet, mehr neue Medien in die Klassenzimmer zu bringen: Finnland schafft die Schreibschrift ab, in den Niederlanden sind sogenannte iPad-Schulen im Vormarsch und in Südkorea soll Papier noch vor Ablauf des Jahres aus den Klassenzimmern verbannt werden. Die Vorteile liegen auf der Hand. Auf Tablets können interaktiv Videos gezeigt werden, und sie bieten eine unbegrenzte Anzahl von Quellen, die im Schulbuch möglicherweise schon veraltet sind, sobald es erscheint. Individuell abgestimmte Lern-Apps können individualisiertes Lernen ermöglichen. Die individuelle Förderung entspricht dem Leitbild der Inklusion, bei der Schüler in heterogenen Gruppen ganz nach ihren Anforderungen lernen. Allerdings gibt es auch Gegenstimmen, die fordern, dass Computer erst dann zielgerichtet im Lernprozess eingesetzen werden, sobald Kinder die entwicklungsbiologische Reife dazu erlangt haben (Lembke & Leipner, 2015). In diesem Projekt untersuchen wir, inwieweit sich ein Unterschied zeigt, ob Kinder auf dem Papier oder einem Tablet schreiben. Diese Fragestellung ist in doppelter Hinsicht relevant: in Bezug auf die oben beschriebenen bildungspolitischenDebattenund auf die Evaluation einer Forschungsmethode. Mit Hilfe von Tablets untersuchen Wissenschaftler seit einigen Jahren den Schreibprozess (Marquardt & Mai, 1994; Rosenblum et al., 2003; Tucha et al., 2008), um objektivere und dynamischere Maße zu gewinnen als in früheren Studien, die meist die Handschriftqualität des Schreibproduktes (Berninger et al., 1992; Graham et al., 2000), d.h. die Lesbarkeit und Konsistenz des Schriftbildes, betrachteten. Getestet wurden Kinder der 2. Klasse (n=27, 7-8 Jahre), die sich mitten im Handschrifterwerb befinden, und Erwachsene (n=25, 18-28 Jahre) als Kontrollgruppe. Alle Aufgaben wurden einmal auf dem Tablet und auf dem Papier (aufgelegt auf ein Tablet) an zwei Erhebungsterminen (Dauer jeweils 25-35 min) durchgeführt. Die Hälfte der Probanden begann auf dem Tablet. Es wurden zwei Aufgabentypen gestellt: (a) graphomotorische Fertigkeiten und (b) Schreiben der Phrase “Sonne und Wellen”. Unsere Schreibmaße gliedern sich in die Beurteilung der Handschriftqualität durch ein selbstentwickeltes Scoring (Auswertungen gibt es bisher nur für (a), für (b) läuft das Rating noch) und die objektive Messung des Automatisierungsgrades der Handschrift mit Hilfe der Schreibgeschwindigkeit und der Geschwindigkeitsumkehrpunkte (NIVs) auf dem Tablet (Marquardt & Mai, 1994; Tucha et al., 2008). Die Kinder zeigen teilweise Unterschiede zwischen den Medien (p<.02). Sie weisen schlechtere Werte im Scoring, also eine schlechtere Handschriftqualität, auf dem Tablet als auf dem Papier auf. Hingegen zeigen die Erwachsenen keinen Unterschied zwischen Papier und Tablet. Beide Gruppen schreiben signifikant größer auf dem Tablet als auf dem Papier (p<.001). Die Ergebnisse der Schreibprozessmaße ergab eine schnellere Schreibgeschwindigkeit auf dem Tablet für alle Aufgaben (alle p<.001). Beide Gruppen zeigen einen geringeren Automatisierungsgrad (mehr NIVs) auf dem Papier für einen Teil der graphomotorischen Aufgaben, was auf eine Fokussierung auf motorische Ausführung der Schreibaufgabe hinweist. Für die Schreibaufgabe (b) zeigten sich höhere Werte für die NIVs lediglich auf dem Tablet für die Erwachsenen (p=.0103). Die Vergrößerung der Schrift bei beiden Gruppen und die schlechtere Handschriftqualität der Kinder auf dem Tablet werden auf die glattere Tablet-Oberfläche zurückgeführt. Geübte Schreiber adaptieren ihre grafomotorische Ausführung/Schreibbewegung entsprechend der Verringerung der Reibung der Schreiboberfläche durch eine Erhöhung der Schreibgeschwindigkeit und eine Vergrößerung der Schrift (Denier van der Gon & Thuring, 1965). Ungeübte Schreiber hingegen gelingt die Adaptation nicht so schnell. Sie schreiben daher unsauberer auf einer glatteren Oberfläche. Daher bezweifeln wir, dass Kinder in der Lage sind, genauso gut auf einem Tablet schreiben zu lernen, wie auf dem Papier, da die glattere Oberfläche des Tablets eine zusätzliche motorische Herausforderung für sie darstellt. Assoziation früher Handschriftfähigkeiten mit unterschiedlichen motorischen Teilberei-chen Michael Fliesser, Gerit Brenner, Annegret Klassert, Steffen Müller, Monique Wochatz, Sabrina Gerth, Stephan Kopinski, Julia Festman Universität Potsdam Das möglichst frühe Aufdecken von Defiziten in für die Handschrift relevanten motorischen Bereichen ist in heterogenen Schulklassen ein wichtiges Ziel, da Probleme in der motorischen Aus-führung den Erwerb höherer Schreibfähigkeiten wie Rechtschreibung oder korrekter Satzbau er-schweren (Berninger et al. 1997). Drei potentielle Einflussbereiche sind zu unterscheiden (entwicklungstaxonomisches Modell; Haibach et al. 2011): (1) Stützmotorik: Körperhaltung gegen die Schwerkraft aufrechthalten, (2) Bewegungsmotorik: den Körper zielgerichtet im Raum bewegen, und (3) Handgeschicklichkeit: feine Bewegungen ausführen, um Objekte mit der Hand zu steuern. Erste Zusammenhänge dieser Bereiche mit Handschriftaufgaben konnten bereits nachgewiesen werden (u.a. Daly et al. 2003; Volman et al. 2006; Flatters et al. 2014; Rosenblum et al. 2006; Hicheur et al. 2005). Bisher wurden die genannten Bereiche allerdings noch nicht gemeinsam untersucht, so dass unklar ist, welchen Einfluss Stütz- und Bewegungsmotorik und Handgeschicklichkeit auf die frühen Handschriftfähigkeiten haben. Untersucht wurden 41 Vorschulkinder (13 Mädchen); Durchschnitt Alter: 5;11 Jahre (SD=0;5), Größe: 1.15m (SD=0.05) Gewicht 20kg (SD=2,5); in vier Testbereichen: 1. Frühe Handschriftfähigkeiten (Tablet): Buchstaben, Zahlen, Schlaufen um Punkte und freie Schlaufen kopieren. Gemessen wurden die Qualität des Produktes anhand eines Fehlerscores und die Anzahl der Geschwindigkeitsänderungen (Numbers of Inversion in Velocity, NIVs) bei der Ausführung. 2. Stützmotorik (Kraftmessplatte): Einbeinstand und mit abgehobenen Füßen so ruhig wie möglich auf einem Hocker sitzen. Bei beiden Aufgaben wird der Center of Pressure Weg (COP in mm) über eine Messdauer von 10s gemessen. 3. Bewegungsmotorik (Kraftmessplatte/Lichtschranken): Möglichst hoch springen und zehnmal möglichst gleichmäßig durch einen 3m langen Korridor gehen (Müller et al. 2013). Bei der ersten Aufgabe ist die Zeit ohne Bodenkontakt, also zwischen Absprung und Landung [sec], und bei der zweiten Aufgabe die Variabilität der Ganggeschwindigkeit (Coefficient of Variation CV) über 10 Wiederholungen [%] die Meßgröße. 4. Handgeschicklichkeit (M-ABC 2): Münzen durch einen Schlitz werfen und Perlen auf eine Schnur auffädeln, beides Aufgaben der Movement Assessement Battery for Children (Petermann et al. 2009). Gemessen wurde die jeweils benötigte Zeit. Aus den zusammengehörigen Aufgaben wurde für jedes Kind ein Durchschnittsrang errechnet. Die Korrelation dieser Ränge mit den Handschriftaufgaben wurden mithilfe von Spearman Rangkorrelationen (95%-Konfidenzintervalle, 2-seitig) überprüft. Zusätzlich wurde der Mann-Whitney U-Tests durchgeführt (Gruppentrennung beim Median) (α=0,05). Die Handgeschicklichkeit der Kinder korreliert mit ihrer Fähigkeit, freie Schlaufen zu kopieren (ϱ=-0.418, n=40): Kinder, die beim Münzen einwerfen und Perlen auffädeln geschickter sind, machen weniger Fehler, wenn sie freie Schlaufen kopieren. Die Gruppe, die die Handschriftaufgabe unterdurchschnittlich erfüllte, also die Aufgabe mit mehr Geschwindigkeitsumkehrpunkte (NIVs) ausführte, wies signifikant schlechtere Handgeschicklich-keitswerte auf als die überdurchschnittliche Vergleichsgruppe (p=0.006, n=39). Zwischen Stützmotorik und frühen Handschriftfähigkeiten zeigen sich keine signifikanten Korrelationen (r=0.117, n=29). Nur für NIVs bei Schlaufen um Punkte kann ein kleiner Einfluss (ρ=-0.231) vermutet werden. Auch zwischen Bewegungsmotorik und frühen Handschriftfähigkeiten weisen die Korrelationen keine signifikanten Zusammenhänge auf (r=0.066, n=38). Eine Tendenz zeigt sich bei dem Fehlerpunktescore für Zahlen (ρ=-0.253). Diese wird durch den Gruppenvergleich gestützt: Die Gruppe mit überdurchschnittlich vielen Fehlern beim Kopieren der Zahlen weist signifikant niedrigere Werte (p=0.028, n=41) in der Bewegungsmotorik auf. Vor allem Handgeschicklichkeit scheint einen Einfluss auf die frühe Handschriftfähigkeit zu haben, was die signifikante Korrelation zwischen der Anzahl der Geschwindigkeitsänderungen (NIVs) bei den freien Schlaufen und den Handgeschicklichkeitsaufgaben (Summenscore von Münzen einwerfen und Perlen auffädeln) zeigt (r=-0.371, n=38). Zusammenfassend bleibt festzuhalten, dass ein Einfluss der Motorik auf (frühe) Handschriftfähigkeiten vor allem über die Handgeschicklichkeit vermittelt zu sein scheint, während andere Bereiche nur eine geringe Rolle zu spielen scheinen. Da diese entwicklungstaxonomisch aber vor der Entwicklung der Handgeschicklichkeit ausgeprägt werden, kann ein indirekter Zusammenhang vermutet werden. Handschrift und Rechtschreibung in der Grundschule: Rapid Automatized Writing (RAW) - Ein neuer Schnellschreibtest Christiane Wotschack, Annegret Klassert Universität Potsdam Die Bedeutung der Automatisierung und Geschwindigkeit der Handschrift wurde in der Schulpädagogik lange zugunsten von Ordentlichkeit und Schreibstil vernachlässigt (Medwell & Wray, 2007). Der Mangel einer automatisierten orthografischmotorischen Integration, also einer effizienten Handschrift, beeinträchtigt jedoch sowohl den schulischen Erfolg als auch das Selbstbewusstsein negativ (vgl. Überblick von Feder 2007). Während sich für die Leistung beim Wortlesen ein Schnellbenenntest von Buchstaben (Rapid Automatized Naming, RAN) als unabhängiger und valider Prädiktor erwiesen hat (z.B. Wolf et al. 2002), liegt ein solcher Test für das Schreiben nicht vor. Da bei RAN die Geschwindigkeit beim Abruf der phonologischen Buchstabeninformation gemessen wird, nicht aber die für den Abruf der graphematischen Information, wurde ein vergleichbarer Schnellschreibtest für Buchstaben (Rapid Automatized Writing, RAW) entwickelt, der die Prozesse beim Schreiben aufgrund der schriftlichen Modalität besser abbilden soll. Die Annahmen sind, dass RAW einen zusätzlichen Einfluss auf die Schreibleistung hat und RAW besonders für Schüler mit Schreibproblemen prädiktiv sein sollte. Die Stichprobe umfasst 167 Schüler (davon 84 männlich) der 3.Klasse in Berlin und Potsdam mit einem Durchschnittsalter von 9;1 Jahren. Als Kontrollvariablen wurde u.a. ein Test zur phonologischen Bewusstheit (BAKO Untertests 2 und 4), ein Schnellbenenntest (TEPHOBE Untertest RAN Buchstaben) sowie ein standardisierter Lesetest zum Wortverständnis (ELFE Untertest Wortverständnis) durchgeführt. Neben einem standardisierten Schreibtest (BUEGA Untertest 5) wurde das Schreiben von Neologismen getestet. Der Schnellschreibtest für Buchstaben (RAW) wurde als Tabletversion neu entwickelt. Aufgabe war es, insgesamt 30 mal verschiedene, auditiv präsentierte Buchstaben so schnell wie möglich auf eine Tabletoberfläche zu schreiben. Anhand der Ergebnisse in den standardisierten Lese- und Rechtschreibtest wurden die Schüler auf Basis des strengen, einfachen Diskrepanzkriteriums (1,5 Standardabweichungen unter der Klassennorm laut DGKJP, 2015) verschiedenen Gruppen zugeordnet: ungestört (n=91), Lese-Rechtschreibstörung (n=33), isolierte Lesestörung (n=12) oder isolierte Rechtschreibstörung (n=31). Zur Einschätzung des Einflusses der verschiedenen Maße auf die Leistung beim Schreiben von Neologismen (Anzahl Fehlerpunkte) wurde eine lineare Regression gerechnet. Für die Gesamtgruppe konnte das neu entwickelte Maß RAW zusätzlich zur phonologischen Bewusstheit und RAN als bedeutsamer Prädiktor für die Schreibleistung bei Nichtwörtern identifiziert werden (b = .57, t (161) = 2.5, p = .015): Je weniger Buchstaben pro Sekunde geschrieben wurden, desto besser war die Akkuratheit beim Schreiben von Neologismen. Bei Betrachtung der Defizitgruppen zeigte sich, dass RAW vor allem bei Schülern mit isolierter Rechtschreibstörung einen signifikanten Prädiktor auf die Schreibleistung darstellt (b = 1.07, t (27) = 2.4, p = .02). Die Ergebnisse bestätigen die Annahme, dass RAW einen zusätzlichen Einfluss auf die Schreibleistung hat, insbesondere bei Schülern mit schlechter Schreibleistung. Das Ergebnis eines negativen Zusammenhangs bei schlechten Schreibern, nämlich dass ein schnelleres Buchstabenschreiben mit einer schlechteren Schreibleistung korreliert ist, lässt sich mit einer noch nicht abgeschlossenen Entwicklung der Automatisierung der Handschrift erklären. Bei dieser Defizitgruppe wird das Rechtschreiben nicht durch Schnelligkeit und Automatisierung geprägt, sondern hauptsächlich durch korrekte Schreibweise und Lesbarkeit, was auch den pädagogischen Fokus des Schreibenlernens widerspiegelt. Insbesondere beim Schreiben von Nichtwörtern erfolgt die Akkuratheit jedoch auf Kosten der Schnelligkeit (vgl. Tucha et al., 2008). Die Ergebnisse machen den Bedarf eines validen Tests zur Identifikation von Schülern mit Handschriftproblemen deutlich, da eine Verbesserung der automatisierten orthografischmotorischen Integration Ressourcen für höhere, kognitive Aufgaben, wie der Textkomposition, freigibt. Der Einfluss von motorischer und kognitiver Kontrolle auf Lesen und Schreiben Sophia Czapka, Stephan Kopinski, Annegret Klassert, Julia Festman Universität Potsdam Exekutive Funktionen (EF) sind als allgemeine Kontrollmechanismen zur Steuerung von Kognition und Handlung (Miyake & Friedman, 2012) wichtige Prädiktoren für Lesen und Schreiben (Altemeier, Abbott, & Berninger, 2008; Limbird et. al, 2014), sowie ein Indikator für Schulreife (Blair & Razza, 2007). Trotzdem bleibt unklar, welche Relevanz einzelne EF-Komponenten für den Schriftspracherwerb haben. In der vorliegenden Studie werden zwei für den Schriftspracherwerb relevante EF-Komponenten untersucht: kognitive und motorische Kontrolle. Kognitive Kontrolle bezeichnet die Fähigkeit, Ziele und zielrelevante Informationen aktiv aufrechtzuerhalten, während irrelevante Informationen unterdrückt werden (Miyake & Friedman, 2012). Motorische Kontrolle kann u.a. zur Unterdrückung von bestehenden irrelevanten motorischen Handlungstendenzen dienen. Diese kann sich allgemein auf den Körper als Ganzes (z.B. statische Balance) als auch spezifisch auf einzelne motorische Teilbereiche (z.B. Finger, Sprechapparat) beziehen. Für den Leseprozess ist kognitive Kontrolle notwendig, um visuelle und sprachliche Informationen zu integrieren, um PhonemGraphem-Korrespondenzen effizient abzurufen und um gleichzeitig irrelevante Informationen zu unterdrücken (Altemeier et al., 2008). Beim Schreiben wird zusätzlich allgemeine und spezifische motorische Kontrolle gebraucht, um z.B. Schriftzüge korrekt (in Hinblick auf die Umsetzung des motorischen Programms und die räumliche Anordnung) auszuführen, und kognitive Kontrolle, u.a. um orthographisch korrekt zu schreiben. Ziel der vorliegenden Studie ist, den Einfluss von EF auf Lese- und Schreibleistungen zu untersuchen. Dabei soll geklärt werden, in wie weit kognitive Kontrolle und spezifische motorische Kontrolle zusammenwirken und allgemeine motorische Kontrolle unabhängig die Lese- und Schreibleistung bei Grundschulkindern beeinflussen. Mit 137 Schülern (3. Klasse, Durchschnittsalter 9;1 Jahre) wurden zwei EF-Tests durchgeführt: Eine Untergruppe(n=94) hat den BST (Bivalent Shape Task; Mueller & Esposito, 2014) und den Smiley-Stroop auf dem Tablet (T-Stroop) gelöst. Die richtige Antwort war jeweils motorisch per Fingerdruck zu geben. Die zweite Gruppe (n=43) hat die gleichen Aufgaben erhalten, allerdings wurde der Smiley-Stroop auf einem Bildschirm präsentiert und verbal beantwortet (V-Stroop). Als Maß für allgemeine motorische Kontrolle dient die Auslenkung des Körperschwerpunkts (CoP-Sway), die während des V-Stroop mit einer Kraftmessplatte gemessen wurde. Mit den Stroop-Aufgaben (BST, V-Stroop und T-Stroop) wird Interferenzinhibition, eine wichtige Komponente der kognitiven Kontrolle, gemessen. Sie beschreibt die Fähigkeit, irrelevante Reize, die die Zielsetzung stören, auszublenden. Als Maß für Interferenzinhibition dient der Stroopeffekt, die Differenz in Verhaltensmaßen (Reaktionszeiten und Fehlerrate) zwischen der inkongruenten und kongruenten Bedingung, aus denen die Aufgaben bestehen. Im Gegensatz zu der kongruenten Bedingung stimmen Reiz und Ziel in der inkongruenten Bedingung in ihren Eigenschaften nicht überein, was dazu führt, dass mehr kognitive Kontrolle erforderlich ist, um eine korrekte Antwort zu geben, die länger dauert und fehleranfälliger ist als in der kongruenten Bedingung. In beiden Aufgabenstellungen spielt spezifische motorische Kontrolle eine wesentliche Rolle: jeweils in der inkongruenten Bedingung ist die motorisch automatische Antwort zu adaptieren (Fingerdruck und verbale Antwort). Standardisierte Tests wurden zur Erfassung der Lese- (ELFE) und Schreibleistung (BUEGA) verwendet. Vorläufige Analysen zeigen, dass nur der T-Stroop zur Varianzaufklärung in dem Rechtschreibtest beiträgt (Beta = -0,05, p=0,002), allerdings erklärt er nur etwa 5% der Varianz der Daten. Die Ergebnisse für den Leseverständnistest sind ähnlich. Auch hier trägt nur der T-Stroop zur Varianzaufklärung bei (Beta = -0,04, p=0,03). Der Einfluss der motorischen Kontrolle zeigt sich tendenziell für den Rechtschreibtest, aber nicht für das Leseverständnis. Dies spiegelt den Entwicklungsstand der Kinder im Schriftspracherwerb wieder: Sie müssen zunächst die Grundfähigkeiten beherrschen, wie die motorische Ausführung von Schriftzügen, wofür bewusste motorische Kontrolle notwendig ist. Erst mit fortschreitender Automatisierung des Schreibprozesses sinkt der Bedarf an motorischer Kontrolle(Halsband & Lange, 2006). Die Ergebnisse werden in Hinblick auf kognitive Anforderungen und dem Einfluss allgemeiner bzw. spezifischer motorischer Kontrolle im Zusammenhang mit schulrelevanten Fähigkeiten diskutiert. ID: 365 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie Thematisches Cluster: Grundschulbildung, Hochbegabung, Trainings- und Evaluationsforschung Stichworte: Enrichment Kurse, Grundschulkinder, Evaluation, Begabung Außerschulische Förderangebote für besonders begabte Grundschulkinder: Konzeption, Evaluation, Implementation Chair(s): Jessika Golle (Universität Tübingen) Diskutant(en): Miriam Vock (Universität Potsdam) Für besonders begabte Kinder spielen die Lernumgebung und Lernmöglichkeiten eine bedeutende Rolle bei der Entfaltung ihrer Potentiale. Verschiedene Arten der Förderung, wie Enrichment und Akzeleration, bieten die Möglichkeit, die Lerninhalte und Lernvoraussetzungen den Bedürfnissen dieser Zielgruppe anzupassen. Im Rahmen des extracurricularen Enrichment-Programms der Hector-Kinderakademien soll eine individuelle Förderung besonders begabter Kinder bereits in der Grundschule ermöglicht werden. Die Kinder setzten sich entweder vertieft mit bereits bekannten schulischen oder neuen Themen auseinander. Der inhaltliche Schwerpunkt liegt im MINT-Bereich (*M*athematik, *I*nformatik, *N*aturwissenschaften und *T*echnik). Ziel der Hector-Kinderakademien ist es das Potential der Kinder zu stärken, Interesse zu wecken und sie in ihrer Entwicklung ganzheitlich zu unterstützen. Das Programm wird seit 2010 in ganz BadenWürttemberg an 61 Standorten angeboten. In diesem Symposium werden die Konzeption, Evaluation und Implementation von 4 Kursangeboten der HectorKinderakademien, die langfristig zu einem festen Angebot an allen Standorten gehören sollen, vorgestellt und diskutiert. Im Rahmen der Kursentwicklung gab es einen engen interdisziplinären Austausch und es flossen Erkenntnisse aus der Psychologie und Unterrichtsqualitätsforschung sowie verschiedener Fachdidaktiken (Deutsch, Sprecherziehung, Naturwissenschaft und Technik, Mathematik und Musik) ein. Abhängige Variablen wurden gemeinsam definiert und Messinstrumente neu entwickelt (Tests, Fragebögen, Beobachtungsbogen). Die Überprüfung der Kurseffektivität erfolgte mittels quasi-experimenteller und experimenteller Kontrollgruppendesigns mit Messwiederholungen. Analysen wurden basierend auf Selbst- und Fremdeinschätzungen durchgeführt. Der im ersten Beitrag vorgestellte Kurs setzt den Fokus auf die Förderung der Präsentationsleistung im MINT Bereich. Durch praktische Übungen und (Video)Feedback lernen die Kinder kompetent über naturwissenschaftliche Themen zu sprechen. Die berichteten Ergebnisse legen nahe, dass sich sowohl die Präsentationsleistung als auch die Sprechangst durch den Kurs positiv beeinflussen lassen. Im zweiten Beitrag wird ein Kurs vorgestellt, der das Wissenschaftsverständnis der Kinder und ihr Interesse an Naturwissenschaften fördern soll. Die Kinder führen selbst Experimente durch und erleben dadurch den Zyklus der naturwissenschaftlichen Erkenntnisgewinnung. Die Evaluationsergebnisse zeigen, dass sich der Kursbesuch positiv auf das Verstehen des Forschungszyklus und das Nutzen geeigneter Experimentierstrategien auswirkt. Der dritte Kurs bereitet die Schüler auf die Teilnahme an der Mathematik-Olympiade vor. Kursziel ist es das Erkennen und Nutzen mathematische Muster und Strukturen sowie das Verbalisieren von Lösungswegen zu fördern. Die Ergebnisse der ersten Evaluation legen eine bessere Mathematikleistung der Kinder im Anschluss an den Kurs nahe. Der vierte Kurs hat das Ziel die mathematischen und visuellräumlichen Fähigkeiten der Kinder durch gezielte Auseinandersetzung mit musikalischen Strukturen und kreativen kompositorischen Tätigkeiten zu fördern. Vorläufige Ergebnisse deuten darauf hin, dass die Kursteilnahme musikalisches Hörverständnis sowie mathematisches und räumliches Vorstellungsvermögen positiv beeinflusst. Beiträge des Symposiums Wissen präsentieren – Effekte eines Präsentationstrainings auf die Präsentationskompetenz besonders begabter Grundschulkinder Evelin Herbein1, Ingo Zettler2, Jessika Golle1, Maike Tibus1, Ulrich Trautwein1 1 Universität Tübingen, 2Universität Kopenhagen *Theoretischer Hintergrund:* Kompetent kommunizieren zu können ist bedeutsam für das persönliche Wohlbefinden sowie den schulischen und beruflichen Erfolg (vgl. Morreale & Pearson, 2008). Unter anderem sind kompetente Sprecher besser in der Lage ihr Wissen und ihre Ideen effektiv darzustellen (Girard, Pinar, & Trapp, 2011). Eine spezielle kommunikative Interaktion, die als Methode des Wissensaustauschs zum Beispiel im beruflichen Kontext von Bedeutung ist, ist das Präsentieren (Živković, 2014). Bereits an Grundschulkinder wird die Aufgabe gestellt vor anderen zu präsentieren um beispielsweise über Hobbies oder Interessen zu informieren. Um mit den Anforderungen zurechtzukommen spielen das Wissen zum Vortragsthema, verbale Fähigkeiten (Schleppegrell, 2001) und kommunikative Fähigkeiten im Bereich des Präsentierens eine bedeutsame Rolle (Eriksson, 2006). Letztere umfassen sowohl den Umgang mit der Vortragssituation (z.B. Lampenfieber) als auch nonverbale und verbale Fähigkeiten (vgl. De Grez & Valcke, 2010). Obwohl die Fähigkeit kompetent zu präsentieren im Bildungsplan verankert ist (Kultusministerkonferenz, 2005) und Kinder mit Präsentationsaufgaben in der Grundschule konfrontiert werden (Behrens & Eriksson, 2011) spielt die Förderung von Präsentationskompetenz im Schulalltag, im Vergleich zur Lese- und Rechtschreibförderung, eine untergeordnete Rolle (Morreale, Cooper, & Perry, 2000). Aufgrund der Bedeutung von Präsentationskompetenz und der Wichtigkeit, Informationen effektiv weitergeben zu können, wurde ein Präsentationstraining als Enrichment-Programm entwickelt. Abgeleitet aus bestehenden theoretischen und praktischen Ansätzen (vgl. Morreale et al., 2000; Pabst-Weinschenk, 2005; Wagner, 2006) fokussiert es auf drei Hauptbereiche: Lampenfieber/Sprechangst, nonverbale Kommunikation und Verständlichkeit. Ziel des Trainings war es, die Präsentationskompetenz zu steigern und Sprechangst zu reduzieren. *Methode:* Das Präsentationstraining ist Teil eines außerunterrichtlichen Förderprogramms für besonders begabte und hochbegabte Grundschulkinder (Hector-Kinderakademien) in Baden-Württemberg. Es umfasst elf 90-minütige Kurseinheiten und wurde, nach einer Vorerprobungsphase und ersten Evaluation, im Sommer 2015 mit acht Dozent/inn/en multipliziert. Um die Durchführungstreue zu erhöhen (Graham & Harris, 2014) erhielten die Dozent/inn/en ein detailliertes Kursmanual mit Ablaufplan, Übungen und Materialien für jede Sitzung. Zusätzlich nahmen sie an einer eintägigen Qualifizierungsveranstaltung teil. Ziel der vorliegenden Studie war es, die Trainingseffekte auf die Präsentationskompetenz und Sprechangst zu überprüfen. Zur Überprüfung der Trainingseffekte wurde ein randomisiertes Wartekontrollgruppen-Design mit Prä-Post-Messung verwendet. 61 Dritt- und Viertklässler (54,1% Jungen; Alter: _M_ = 9,10 _SD_ = 0,84), die für die Teilnahme an einer Hector-Kinderakademie nominiert worden waren, wurden zufällig entweder dem Training (_N_ = 29) oder der Wartekontrollgruppe (_N_ = 32) zugeteilt. In der Studie wurden sowohl Fragebögen also auch Videoratings eingesetzt. Diese erfassten verschiedene abhängige Maße der Präsentationskompetenz (nonverbales Verhalten, Sprachgebrauch, Organisation der Präsentation sowie die selbsteingeschätzte Präsentationsleistung) und Sprechangst. Die Auswertung der Daten erfolgte mittels multipler linearer Regressionen. Dabei wurden für den Ausgangswert sowie für verbale und fluide Intelligenz kontrolliert. Alle kontinuierlichen Variablen wurden vor den Analysen standardisiert, weshalb der Regressionskoeffizient für den Kurs als Effektstärke interpretiert werden kann. Zur Berücksichtigung fehlender Werte wurde in Mplus das Full-Information Maximum Likelihood Schätzverfahren (_FIML_) verwendet. *Ergebnisse und Ausblick:* Vorläufige Analysen ergaben, dass die Kinder, die am Präsentationstraining teilgenommen hatten, im Mittel eine signifikant höhere selbsteingeschätzte Präsentationsleistung berichteten als die Kinder der Kontrollgruppe (_B_ = .44, _p_ < .05). Gleichzeitig berichteten sie eine signifikante Reduktion der Sprechangst, sowohl für die körperliche Sprechangstsymptomatik (_B_ = -.47, _p_ < .05), als auch die kognitiven Sprechangstsymptome (_B_ = -.59, _p_ < .001). Momentan werden die im Rahmen des Prä- und Posttest gefilmten Kurzpräsentationen von externen Ratern eingeschätzt. Der dazu verwendete Beobachtungsbogens erfasst die Präsentationskompetenz auf den Ebenen nonverbales Verhalten–visuell, nonverbales Verhalten–auditiv, Organisation der Präsentation und Sprachgebrauch. Die vorliegenden Ergebnisse weisen auf die Effektivität des Präsentationstrainings hinsichtlich der Förderung von Präsentationsleistung und der Reduktion von Sprechangst hin. Durch parallele Verwendung von sowohl Videoratings als auch Fragebögen werden die Trainingseffekte aus verschiedenen Perspektiven erfasst und überprüft. Förderung des Wissenschaftsverständnisses bei Grundschulkindern – Multiplikation eines außerschulischen MINT-Programms Julia Schiefer, Jessika Golle, Kerstin Oschatz, Maike Tibus, Ulrich Trautwein Universität Tübingen *Theoretischer Hintergrund und Fragestellung:* Die Förderung und Erfassung des Wissenschaftsverständnisses spielt an der Schnittstelle zwischen kognitiver Psychologie und Bildungsforschung eine zentrale Rolle (OECD, 2007; Zimmerman, 2007). Um ein angemessenes Wissenschaftsverständnis zu entwickeln, müssen Schüler/innen sowohl Einsicht in naturwissenschaftliche Methoden und Arbeitsweisen bekommen, als auch ein Verständnis für den epistemischen Status naturwissenschaftlichen Wissens aufbauen (Elder, 2002; Höttecke, 2001; Lederman, 2002, 2007). Im Rahmen des Enrichment-Programms der HectorKinderakademien wurde eine Intervention (Hector Core Course „Kleine Forscher“) entwickelt, der beide Bereiche bereits bei Grundschulkindern fördern soll. Nach einer Pilotierungsphase wurde der Kurs durch zehn Kursleiter/innen multipliziert. In der vorliegenden Studie wurde untersucht, welche Effekte der Besuch des Kurses auf die naturwissenschaftsbezogenen (epistemischen) Überzeugungen als auch auf die Methodenkompetenzen der Kinder hat. Dabei kam u.a. ein neu entwickeltes Instrument (SIC-Test: _Scientific Inquiry Cycle_) zum Einsatz, das das Verständnis für den zyklischen Prozess der naturwissenschaftlichen Erkenntnisgewinnung (Forschungszyklus) erfasst (Kuhn, 2002). *Methode:* _Design und Stichprobe_ Die Forschungsfragen wurden im Rahmen einer Interventionsstudie mit 117 Dritt- und Viertklässlern in einem randomisierten Prä-Posttest-Design mit Wartekontrollgruppe untersucht (71,2% Jungen, 45,8% Viertklässler/innen; Alter: _M_ = 8.89, _SD_ = 0.82). Die Intervention zur Förderung des Wissenschaftsverständnisses wurde über einen Zeitraum von zehn Wochen an zehn Hector-Kinderakademien durch zuvor geschulte Kursleiter/innen durchgeführt. _Kurskonzeption_ Die Intervention fokussierte sowohl die explizite Anregung wissenschaftstheoretischer Reflexion sowie die Vermittlung von naturwissenschaftlichen Methoden und Arbeitsweisen (z.B. durch spielerische Forschungsprojekte und Experimente oder dem Besuch eines Schülerlabors). _Instrumente_ Das Verständnis für den Forschungszyklus wurde mit dem neu entwickelten SIC-Test erfasst (12 Items, EAP Reliabilität (t1/t2) = .73/.76). Der SIC-Test wurde in einer Vorstudie an einer Stichprobe von 878 Dritt- und Viertklässlern (57,2% Jungen, 50,1% Viertklässler/innen; Alter: _M_ = 8.89, _SD_ = 0.76) skaliert und validiert. Zur Erfassung der Experimentierstrategien wurden Items aus dem Projekt _Science-P_ (Mayer, 2011; Mayer et al., 2014) eingesetzt, welche durch selbst generierte Aufgaben ergänzt wurden (6 Items, _α_ (t1/t2) = .51/.81). Naturwissenschaftsbezogene Überzeugungen wurden mit dem Instrument von Conley et al. (2004, in der Übersetzung von Urhahne & Hopf, 2004) erhoben (26 Items, Skalen Quelle, Sicherheit, Entwicklung und Rechtfertigung des Wissens, _α_ (t1/t2)= .72/.70, .68/.73, .69/.66, .60/.76). Die fluide Intelligenz der Kinder wurde mit dem BEFKI-short (Schipolowski et al., 2013; 16 Items, _α_ = .76) erfasst. Die Umsetzung des Kurskonzepts wurde durch eine genaue Dokumentation der Manualtreue der Kursleiter/innen kontrolliert. _Statistische Analyse_ Um die Frage nach der Effektivität des Kurses beantworten zu können, wurden multiple lineare Regressionsanalysen in Mplus (Muthèn & Muthèn, 1998-2012) berechnet. Abhängige Variablen waren die z-standardisierten Differenzen zwischen den beiden Messzeitpunkten. Die Regressionskoeffizienten können somit als standardisierte Differenzen zwischen den beiden Gruppen (Effektstärken) interpretiert werden. Fehlende Werte wurden bei den Analysen durch Full-Infomation-Maximum-Likelihood(_FIML_) Verfahren (Schafer & Graham, 2002) berücksichtigt. *Ergebnisse:* Vorläufige Ergebnisse zeigten (unter Kontrolle des jeweiligen Ausgangsniveaus, der Intelligenz sowie des Geschlechts) signifikante Interventionseffekte auf die Entwicklung der Experimentierstrategien (_B_ = .33, _p_ < .05) sowie die Leistungen der Kinder im SIC-Test (_B_ = .23, _p_ < .05). Bezüglich der Entwicklung der naturwissenschaftsbezogenen Überzeugungen zeigten sich keine Unterschiede zwischen der Interventions- und der Kontrollgruppe. Die Ergebnisse liefern Hinweise auf die Effektivität des Kurses, wobei sich insbesondere die methodischen Kompetenzen der Kinder (Experimentierstrategien sowie das Verständnis für den Forschungszyklus) verbessert haben. Das Enrichment-Programm soll langfristig allen 61 Hector-Kinderakademien zur Verfügung gestellt werden und so zur Qualität der Förderangebote im MINTBereich an den Akademien beitragen. Evaluation eines Mathematiktrainings als Enrichment-Programm für begabte Grundschulkinder Franziska Rebholz, Jessika Golle, Maike Tibus, Ulrich Trautwein Universität Tübingen *Theoretischer Hintergrund:* Mathematik kann verallgemeinert als „…die Wissenschaft von den Mustern“ charakterisiert werden (Devlin, 2002, S. 3). Das Erkennen von Mustern und Strukturen in mathematischen Problemstellungen ist entscheidend für das kompetente Lösen mathematischer Probleme (vgl. Nolte, 2013). Mathematische Kompetenz spiegelt sich in verschiedenen mathematischen Fähigkeiten wider, wie z.B. in der Fähigkeit zur Analogienbildung (Aßmus & Förster, 2013), im räumlichen Vorstellungsvermögen (Käpnick, 1998) oder in der Fähigkeit zum Bilden von Superzeichen (Kießwetter, 2013). Mathematisch begabte Kinder sind häufig nicht nur kompetent im Umgang mit mathematischen Problemen, sondern sie sind fasziniert von Mathematik, haben ein besonderes Gefühl für Zahlen und sind begeistert von geometrischen Mustern (vgl. Kießwetter, 2013; Käpnick, 1998). Diese bereichsspezifische Begabung bei hoher allgemeiner kognitiven Leistungsfähigkeit bietet viele Chancen für erfolgreiches mathematisches Arbeiten (Käpnick et al., 2011). Dennoch können bei der Arbeit mit diesen Kindern Defizite beobachtet werden, die dem Entwickeln von Expertise in diesem Bereich hinderlich sein können, wie z.B. im Bilden und Begründen von Hypothesen oder in der Verbalisierung erkannter mathematischer Zusammenhänge (Bezold, 2012; Käpnick 1998). Im Rahmen dieser Studie wurde ein Mathematik-Training für besonders begabte Grundschulkinder entwickelt und evaluiert. Die Ziele des Trainings waren 1) das Erkennen und Nutzen mathematischer Muster und Strukturen zu fördern und 2) möglichen Defiziten mathematisch begabter Kinder - beispielsweise durch das begründete Notieren eines erarbeiteten Lösungswegs in Kleingruppen - entgegenzuwirken. Das Training orientierte sich inhaltlich an den Ansprüchen der Mathematik-Olympiade und umfasste 10 Sitzungen a 90 Minuten. Die Mathematik-Olympiade ist ein dreistufiger Wettbewerb, der sich durch komplexe Aufgabengestaltung und eine Bewertung des Lösungsweges besonders für begabte und hochbegabte Kinder anbietet. *Methode:* Das Training wurde als Kurs mit dem Titel „Fit für die Mathematik-Olympiade“ an 6 Hector-Kinderakademien für besonders begabte Grundschüler durchgeführt. Um die Effektivität des Trainings zu überprüfen, wurde ein Kontrollgruppendesign mit Messwiederholung gewählt. Insgesamt nahmen 201 Kinder an der Untersuchung teil, 50 Kinder in der Trainingsgruppe und 151 Kinder in der Kontrollgruppe. Die Kontrollgruppe bestand aus Schülerinnen und Schülern, die nicht für die Hector-Kinderakademien nominiert wurden. Beide Gruppen bestanden zu ähnlichen Teilen aus Dritt- und Viertklässlern. Die Erhebung der Daten erfolgte zu Beginn und zum Ende eines Schulhalbjahres, dies entsprach auch dem Beginn und dem Ende des Trainings. Zu beiden Messzeitpunkten wurden die Mathematik-Kompetenz der Kinder (DEMAT 2+/3+/4, Krajewski et al., 2004; Roick et al., 2004; Gölitz et al., 2006), ihr mathematisches Interesse, ihr Selbstkonzept in Mathematik und die figuralen sowie kristallinen kognitiven Fähigkeiten via BEFKI-short (Schipolowski et al., 2013) erfasst. Zusätzlich wurden die Leistungsdaten während der Mathematik-Olympiade erhoben. Die Daten wurden mit Hilfe multipler linearer Regressionen ausgewertet. Um die Kurseffekte für mögliche Eingangsunterschiede zwischen den beiden Gruppen kontrollieren zu können, wurden die zum ersten Messzeitpunkt erhobenen Variablen in allen Analysemodellen als Kovariaten berücksichtigt (Alter, Geschlecht, Mathematik-Kompetenz, kognitive Fähigkeiten, mathematisches Interesse und Selbstkonzept). *Ergebnisse:* Sowohl für die Dritt- als auch für die Viertklässler zeigte sich ein signifikanter Interventionseffekt auf die Mathematik-Kompetenz, Cohen‘s _d_ = .74 (3. Klasse) bzw. _d_ = .82 (4. Klasse). Auch auf die Leistung in der MathematikOlympiade wurden unter Kontrolle des Alters, des Geschlechts sowie aller Ausgangsvariablen positive Effekte gefunden, Cohen‘s _d_ = .76 (3. Klasse) bzw. _d_ = .84 (4. Klasse). Das Selbstkonzept in Mathematik und das Interesse an Mathematik unterschied sich nicht signifikant in Abhängigkeit der Gruppenzugehörigkeit zum zweiten Messzeitpunkt. *Diskussion und Ausblick:* Die Ergebnisse weisen darauf hin, dass die entwickelte Intervention wirksam ist und die mathematischen Fähigkeiten der Kinder positiv beeinflusst werden können. Einschränkungen in der Aussagekraft der Effekte ergeben sich durch die nicht-zufällige Gruppenzuweisung. Im nächsten Schritt wird das Trainingsprogramm überarbeitet und in einem Warte-Kontrollgruppen-Design mit randomisierter Gruppenzuweisung evaluiert. „Mathematik zum Anhören: Kinder komponieren mit LEGO“ – Pilotstudie eines musikalischmathematischen Kurses für besonders begabte und hochbegabte Kinder der dritten und vierten Klasse. Jennifer Müller1, Jessica Kornmann1, Uwe Oestermeier1, Leonie Jacob1, Jessika Golle2, Peter Gerjets1 1 Leibniz-Institut für Wissensmedien, 2Universität Tübingen *Theoretischer Hintergrund:* In Anbetracht der Relevanz der MINT-Fächer (Mathematik, Informatik, Naturwissenschaft und Technik; Cramer & Walcher, 2010) und dem steigenden Mangel an Fachkräften in den MINT-Bereichen (Anger, Demary, Koppel, & Plünnecke, 2013) ist die Förderung mathematischer und visuell-räumlicher Fähigkeiten bereits bei Grundschulkindern zu einer Notwendigkeit geworden. Insbesondere die Förderung von besonders begabten und hochbegabten Kindern stellt hierbei eine Herausforderung dar, da einseitige Förderung zu Langeweile im Unterricht und somit zu Underachievement führen kann (Rost und Sparfeldt, 2009). Um dem vorzubeugen, wurde ein Kurskonzept entwickelt, welches musisch-kreative und mathematische Komponente miteinander verbindet. Das Ziel des Kurses ist die implizite Förderung mathematischer und visuell-räumlicher Fähigkeiten der Kinder durch gezielte Auseinandersetzung mit musikalischen Strukturen und kreativen kompositorischen Tätigkeiten (vgl. Graziano, Peterson, & Shaw, 1999). Diese implizite Förderung wird durch eine strukturelle Überlappung der kognitiven Anforderungen von Mathematik und Musik ermöglicht (vgl. Bahr & Christensen, 2000). So machten wir uns beispielsweise zu Nutze, dass in der Musik beim Repräsentieren der Tonhöhen genauso wie in der Mathematik beim Repräsentieren von Zahlen visuell-räumliche Fähigkeiten eine wichtige Rolle spielen oder dass musikalischen Rhythmen mathematische Teil-Ganzes-Relationen zugrunde liegen (Toussaint, 2005). Folglich entwickelten wir Kurseinheiten, die vordergründig Kompositionstechniken wie Transposition, Umkehrung oder Diminution vermitteln, gleichzeitig aber dazu beitragen, dass mathematisch-geometrische Fertigkeiten wie Translation oder Spiegelung von geometrischen Figuren und Bruchrechnen herausgebildet und gefestigt werden. Eine Besonderheit des Kurskonzeptes ist es, dass für die Komposition keine musikalischen Vorkenntnisse erforderlich sind. Um Musik zu komponieren, bauen die Kinder Muster aus Lego-Steinen, die von einer Software nach Positionierung auf einem Multitouch-Tisch in Töne umgewandelt werden. Im Rahmen des Kurses lernen die Kinder aus eigener Erfahrung, welche Muster in Verbindung mit der Position auf dem Multitouch-Tisch ein angenehmes Klangerlebnis erzeugen und wie sie neuerlernte Kompositionstechniken kreativ umsetzen können. Durch den Einsatz von Lego-Steinen und durch das Hantieren mit den Mustern wird das visuell-räumliche Vorstellungsvermögen angeregt (Caldera, Culp, O’Brien, Truglio, Alvarez, & Huston, 1999) und dadurch der Zugang zu den abstrakt-strukturellen Komponenten der Mathematik erleichtert. *Methode:* In einer Pilotstudie wurde das Kurskonzept an zwei Hector-Kinderakademien im Sommersemester 2015 in zehn Kurseinheiten je 90 Minuten umgesetzt. Im ersten Evaluationsschritt wurde untersucht, ob direkter und indirekter Wissenstransfer in den Bereichen Mathematik und Musik stattfand. Dazu absolvierten 16 Dritt- und Viertklässler am Anfang und am Ende des Kurses eine Testbatterie bestehend aus Aufgaben zu Mathematik und räumlichen Vorstellungsvermögen (z.B. DEMAT 4+), Musiktheorie und einem Musical Aptitude Test (MAT). Die Daten wurden mittels einfaktorieller Varianzanalysen mit Messwiederholung ausgewertet. *Ergebnisse:* Im Vergleich zum Prätest verbesserten sich die Kinder bei den Aufgaben zu Mathematik und räumlichem Vorstellungsvermögen (Cohen’s _d_ = 0.71) sowie beim MAT (Cohen’s _d_ = 2.50) deutlich. Keine Unterschiede zwischen dem Prä- und Posttest wurden bei musiktheoretischen Aufgaben gefunden. *Diskussion und Ausblick:* Die Ergebnisse deuten darauf hin, dass das Kurskonzept musikalisches Hörverständnis sowie mathematisches und räumliches Vorstellungsvermögen von besonders begabten und hochbegabten Kindern fördern kann. Die kleine Stichprobengröße und die fehlende Kontrollgruppe müssen bei der Aussagekraft jedoch berücksichtigt werden. Daher ist als nächster Evaluationsschritt eine Multiplikationsstudie samt Kontrollgruppenvergleich an 12 Hector-Kinderakademien im Sommersemester 2016 geplant. ID: 366 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Didaktiken der Naturwissenschaften und Technik, Didaktik Deutsch Thematisches Cluster: Bildung im Sekundarbereich, Grundschulbildung, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Lernaufgaben, Leistungsaufgaben, Heterogenität, Diagnose Mit herausfordernden Aufgaben und standardisierten Beurteilungsvorgaben Heterogenität in der Schule begegnen? Chair(s): Marc Kleinknecht (TU München), Svenja Kühn (Universität Duisburg-Essen), Stefan Schipolowski (Institut zur Qualitätsentwicklung im Bildungswesen Berlin), Eva-Maria Lankes (TU München) Diskutant(en): Knut Neumann (Institut der Pädagogik der Naturwissenschaften Kiel) Aufgaben haben im Unterricht für das Lehren und Lernen eine wichtige Bedeutung und eignen sich insbesondere für einen produktiven Umgang mit Heterogenität: Sie lassen sich für verschiedene Zielgruppen (z.B. leistungsstarke und leistungsschwache Schülerinnen und Schüler) variieren und können so Lernende ihrem Wissens- und Kompetenzstand entsprechend fördern (z.B. Caspari, 2013a, 2013b). Aufgaben sind aber auch Instrumente der Leistungsentwicklung sowie feststellung (z.B. Abraham & Müller, 2008). Basierend auf der Kritik der schulischen Beurteilungspraxis geraten neben der Aufgabenqualität zunehmend Korrektur- und Bewertungsvorgaben in den Fokus, die eine möglichst objektive, transparente und vergleichbare Leistungsbeurteilung ermöglichen sollen – dies gilt insbesondere im Kontext standardisierter, lerngruppenübergreifender Tests und Prüfungen. Sowohl der Einsatz adäquater Aufgaben als auch standardisierter Beurteilungsverfahren haben das Potenzial, der Heterogenität von Schülerinnen und Schülern angemessen zu begegnen und so den Bildungserfolg aller Schülerinnen und Schüler zu gewährleisten. Vor diesem Hintergrund werden im Symposium Aufgaben und standardisierte Beurteilungsvorgaben aus fachdidaktischer, schulpädagogischer und psychometrischer Perspektive beleuchtet. Die ersten beiden Beiträge gehen der Frage nach, wie Lehrkräfte schwache Schülerinnen und Schüler durch Aufgaben identifizieren und fördern können: Der erste Beitrag fokussiert die Bedeutung komplexer Aufgaben für das Lehren und Lernen in der Biologie. Dazu präsentieren die Autoren Ergebnisse einer videobasierten Prä-Post-Studie, in der untersucht wurde, inwieweit komplexe Aufgaben zu höheren Leistungen gerade auch bei schwachen Lernenden führen und welches fachliche und fachdidaktische Wissen den Einsatz solcher Aufgaben begünstigt. Im zweiten Beitrag zu Diagnoseaufgaben werden wiederum komplexe Aufgaben thematisiert, die im Leseunterricht der Grundschule dazu dienen können, die Leseprozesse in der Grundschule zu identifizieren. Die Autoren untersuchen, welche wissens- und textbezogenen Modellierungsformen bei den Lösungen zu IGLU-Aufgaben bei schwachen und starken Leserinnen und Lesern auftreten, und ziehen Konsequenzen für die schulische Diagnosepraxis. Im Fokus des dritten und vierten Beitrags stehen Aufgaben und dazugehörige Bewertungsvorgaben im Kontext lerngruppenübergreifender Tests und Prüfungen: Die Autoren des dritten Beitrags analysieren die Konfiguration von Korrekturund Bewertungsvorgaben in Prüfungsverfahren für den Mittleren Schulabschluss aller Bundesländer in den Fächern Deutsch und Mathematik. Sie diskutieren, inwieweit diese Transparenz und Vergleichbarkeit tatsächlich befördern. Schließlich behandelt der vierte Beitrag Leistungsaufgaben im Kontext der Vergleichsarbeiten (VERA-8) im Teilbereich Schreiben des Faches Deutsch. Diese Leistungsaufgaben sollen von den Lehrkräften auch als Diagnoseaufgaben genutzt werden und deren Unterrichtsgestaltung positiv verändern. Die Autoren untersuchen die Qualität des Assessments aus psychometrischer Perspektive und dessen Nutzen für die schulische Praxis, unter anderem zur Identifikation und Förderung schwacher Lernender, aus Perspektive der Lehrkräfte. Das Symposium schließt mit einer Diskussion der zuvor präsentierten Forschungsergebnisse. Beiträge des Symposiums Einfluss des Professionswissens auf den Einsatz von komplexeren Lernaufgaben im Biologieunterricht zur Förderung der Leistung von Schülern mit wenig Vorwissen Christian Förtsch, Sonja Werner, Lena von Kotzebue, Birgit J. Neuhaus LMU München Theoretischer Hintergrund Das im Rahmen des Projekts Evaluation der Standards in den naturwissenschaftlichen Fächern der Sekundarstufe I (ESNaS; u.a. Kauertz et al., 2010) entwickelte Kompetenzmodell zur Erstellung von Aufgaben enthält unter anderem das Merkmal Komplexität. Hierbei wird die Komplexität von Aufgaben grundsätzlich in die verschiedenen Niveaustufen Fakt, Zusammenhang und Übergeordnetes Konzept eingeteilt. Wadouh et al. (2014) nutzten diese Einteilung zur Kodierung aller Aussagen im Biologieunterricht. Sie konnten bei Schülerinnen und Schülern (SuS) in Klassen mit hohem Vernetzungsniveau ein besser strukturiertes Wissen identifizieren, als bei Schülerinnen und Schülern in Klassen mit niedrigem Vernetzungsniveau. Erste Ergebnisse zur Wirksamkeit eines konzeptorientieren Biologieunterrichts konnten bereits von Förtsch et al. (eingereicht) gezeigt werden. Basierend auf Lehr-Lern-Modellen wird zudem davon ausgegangen, dass das Professionswissen einer Lehrkraft die Unterrichtsqualität beeinflusst, welche wiederum die Schülerleistung steigert (Kunter et al., 2011; Helmke, 2014). Empirische Hinweise zum Einfluss des fachdidaktisches Wissens (FDW), auf die Gestaltung von Lernaufgaben liegen allerdings erst im Bereich der Mathematik vor (Kunter et al., 2011). Fragestellungen Welchen Einfluss hat das fachspezifische Professionswissen auf den Einsatz von komplexeren Lernaufgaben im Biologieunterricht? Steigert der Einsatz von komplexeren Lernaufgaben im Biologieunterricht die Schülerleistung, insbesondere bei SuS mit wenig Vorwissen? Methode Im Rahmen des Projekts Professionswissen in den Naturwissenschaften (ProwiN) wurden 43 Biologielehrkräfte (Alter M=35,3 Jahre, SD=8,0; 60,5% weiblich) des bayerischen Gymnasiums für jeweils zwei Unterrichtsstunden in der 9. Jahrgangsstufe zum Themenbereich Neurobiologie videographiert (N=85 Unterrichtsstunden). Das Fachwissen (FW) und FDW der Lehrkräfte wurde mittels zwei separaten Paper-Pencil-Tests, jeweils bestehend aus offenen und Multiple-Choice-Fragen (Jüttner et al., 2013), vor der Videographie erhoben und unter Verwendung des Partial-Credit-Modells Rasch-skaliert (FW: 12 Items; FDW: 9 Items). Beide Tests wiesen zufriedenstellende fit-Werte auf (alle Infit/Outfit-MNSQ≤1,5; Personenreliabilität: 0,53 (FDW); 0,73 (FW); Itemreliabilität: 0,96 (FDW); 0,99 (FW)). Die Schülerleistung wurde mit Hilfe eines Leistungstests zum Thema Neurobiologie im Prä-Post-Design erhoben (Prätest: 18 Items, Posttest: 22 Items) und ebenfalls Rasch-skaliert. Die Personen- (Prätest: 0,63; Posttest: 0,78) und Itemreliabilitäten (Prätest/Posttest: 1,00), sowie Item fit-Werte (alle Infit/Outfit-MNSQ≤1,3) wiesen ebenfalls gute Werte auf (Bond & Fox, 2007). Die Aufgabenkodierung im Unterricht erfolgte in zwei Schritten. Zunächst wurde jede inhaltsbezogene Denk- oder Handlungsaufforderung der Lehrkraft an die SuS als Lernaufgabe grundkodiert. Die identifizierten Lernaufgaben wurden basierend auf Wadouh et al. (2014) und Kauertz et al. (2010) einer der drei Komplexitätsstufen Fakt, Zusammenhang oder Konzept zugeordnet. Bei 10 % der Videos erfolgte die Aufgabenkodierung zusätzlich durch einen zweiten unabhängigen Rater, welche eine sehr gute Übereinstimmung aufwies (Cohens κ = 0,94). Anschließend wurde für jede Unterrichtsstunde der Anteil an komplexen Aufgaben (Zusammenhangs- und Konzeptaufgaben) berechnet. Zur Überprüfung der Fragestellungen wurden lineare multiple Regressionsmodelle, sowie Mehrebenenpfadmodelle berechnet. Ergebnisse Deskriptive Ergebnisse zeigten im Mittel den Einsatz von 31,3 Aufgaben (SD=13,3) pro Unterrichtsstunde, wobei nur 6,4 Aufgaben (SD=4,5) einer hohen Komplexität zugeordnet werden konnten. FDW konnte als signifikanter Prädiktor für den Einsatz von komplexen Lernaufgaben im Unterricht identifiziert werden (β=0,32, p=0,036, R²=0,10). Ergebnisse der Mehrebenenpfadanalyse zeigten auf der Klassenebene einen positiven Effekt des FDW auf den Einsatz von komplexen Lernaufgaben (β = 0,39, p=0,005, R²=0,17), welche wiederum einen positiven Einfluss auf die Schülerleistung im Posttest aufwiesen (β=0,45, p=0,001, R²=0,21). Auf Schülerebene wurden die Leistung im Prätest und die Anstrengungsbereitschaft kontrolliert. Bei SuS mit wenig Vorwissen konnten mittels einer multiplen Regression ähnliche Effekte auf deren Schülerleistung gezeigt werden (β=0,20, p=0,001, R²=0,038). Fazit Es konnte gezeigt werden, dass der Einsatz von komplexen Lernaufgaben im Biologieunterricht zu einer Steigerung der Schülerleistung führt, die ebenfalls bei SuS mit wenig Vorwissen nachweisbar ist. Ein höheres FDW der Lehrkraft fördert zudem deren Einsatz, weshalb die Integration in die universitäre Lehrerausbildung, sowie in Lehrerfortbildungen sinnvoll erscheint. Wissens- und textbezogene Modellbildungen schwacher und starker Leserinnen und Leser beim Lösen komplexer Leseaufgaben Marc Kleinknecht, Eva-Maria Lankes TU München Theoretischer Hintergrund Komplexe Leseaufgaben gelten als wichtiges methodisches Werkzeug, um die Lesekompetenz bereits in der Grundschule zu diagnostizieren und zu fördern (Köster, 2005). Ein gelingender Einsatz solcher Leseaufgaben setzt voraus, dass Lehrkräfte ein fundiertes Wissen zu Leseaufgaben und den Leseprozessen der Schülerinnen und Schüler bei der Bearbeitung dieser Aufgaben besitzen. Das Wissen über diese kognitiven Prozesse und die Anwendung dieses Wissens im schulischen Alltag stellt eine zentrale Facette diagnostischer Kompetenz von Lehrkräften dar, die allerdings bei Lehrkräften wenig ausgeprägt sein dürfte (Artelt et al., 2007, S. 66f). Bislang beschäftigen sich nur wenige empirische Arbeiten mit der diagnostischen Betrachtung von Leseprozessen bei der Bearbeitung von komplexen Aufgaben und möglichen Kriterien zur Analyse von Leseprozessen in der schulischen Praxis (Schnotz & Dutke, 2004). Insbesondere mangelt es an Studien, die die Leseprozesse schwacher Schülerinnen und Schüler untersuchen, die oftmals an komplexen Aufgaben scheitern und für die Diagnosekonzepte weitgehend fehlen (Bos, Tarelli, Bremerich-Vos & Schwippert, 2012). Fragestellung Der vorliegende Beitrag beleuchtet auf Basis kognitionspsychologischer Ansätze (Richter & Christmann, 2002) die Prozesse des vorwissensbasierten Interpretierens und Schlussfolgerns beim aufgabengesteuerten Lesen. Ein besonderes Augenmerk des Beitrags liegt auf den Leseprozessen schwacher Leserinnen und Leser. Methode Als Datenmaterial für diese Studie dienen Aufgabenlösungen zu 11 Aufgaben (13 Einzelitems) der Internationalen GrundschulLese-Untersuchung (IGLU 2011) von zufällig gezogenen N = 199 Grundschülerinnen und -schülern. Diese Teilstichprobe wurde aus der (für Deutschland repräsentativen) Gesamtstichprobe der in IGLU getesteten Schülerinnen und Schüler (N = 4000), geschichtet nach Kompetenzstufe und Geschlecht, gezogen, sodass Jungen und Mädchen etwa gleichverteilt über die fünf Kompetenzstufen in der Stichprobe vertreten waren. Die Aufgaben im offenen Aufgabenformat (constructed response) beziehen sich auf zwei literarische und zwei informierende Texte. Für die Analyse wurden angelehnt an kognitionspsychologische Ansätze zum Lesen drei Formen der Modellbildung unterschieden: Eine ausschließlich erfahrungs- und vorwissensbezogene Modellierung, eine auf Textausschnitte bezogene Modellierung und eine auf den Gesamtzusammenhang des Textes bezogene Modellierung. Für die Inhaltsanalyse der Daten wurden zwei studentische Hilfskräfte geschult und deren Probekodierungen an 20 Prozent des Datenmaterials geprüft. Die Werte für Cohen’s Kappa .58 - .79 verweisen auf eine moderate bis sehr gute Übereinstimmung für die drei Kategorien. Ergebnisse Die Ergebnisse für die Gesamtgruppe zeigen, dass knapp 40% der Schülerinnen und Schüler gesamttextbezogene Modellierungen verwenden, gut 30% der Kinder gelingt in ihren Antworten keine der Modellierungsarten. Formen der erfahrungsund wissensbezogenen Modellierung (ohne Textbezug) (12%) und lediglich auf Textausschnitte bezogene Modellierungen (19%) kommen dagegen seltener vor. Ein Vergleich der Modellbildungen leistungsschwacher vs. -starker Leserinnen und Leser zeigt, dass sich Leserinnen und Lesern auf verschiedenen Kompetenzstufen bei der Modellierung signifikant unterscheiden (F = 7,80, p = .000, n2 = .147; F = 56,14, p = .000, n2 = .554). Schwache Leserinnen und Leser (auf Kompetenzstufe 1 und 2) bilden vorwiegend erfahrungs- und wissensbezogene Modelle, starke Leserinneren und Leser (auf Kompetenzstufe 3 bis 5) dagegen primär gesamttextbezogene Modellierungen. Im Beitrag illustrieren wir die Ergebnisse an Antwortbeispielen schwacher bzw. starker Lesenden und diskutieren den Nutzen der Ergebnisse für die Lesediagnostik und -förderung im Grundschulunterricht. Gleiche Aufgaben, gleiche Bewertungsvorgaben, gleiche Chancen für alle? Potenziale und Risiken zentraler Abschlussprüfungen Stefanie Mathes, Svenja Kühn Universität Duisburg-Essen Theoretischer Hintergrund Mit der Einführung zentraler Abschlussprüfungen geht u.a. die Annahme einher, durch landesweit einheitliche Prüfungsaufgaben sowie vorgegebene Korrektur- und Bewertungsrichtlinien mehr Transparenz und Vergleichbarkeit bei der Vergabe von Schulabschlüssen herstellen zu können und damit einen Beitrag zu mehr Bildungsgerechtigkeit zu leisten. Inwieweit diese intendierten Zielsetzungen in der gegenwärtigen Prüfungspraxis tatsächlich erreicht werden, ist bislang nur unzureichend empirisch überprüft worden. Empirische Analysen von Prüfungsaufgaben (z.B. Roppelt et al., 2008; Kühn & Drüke-Noe, 2013; Neubrand & Neubrand, 2010) weisen auf eine Diskrepanz zwischen den bildungspolitischen Wirkungserwartungen und den Wirkungserfahrungen hin – im Bereich der konkreten Ausgestaltung von Korrektur- und Bewertungsvorgaben sowie deren Wahrnehmung und tatsächlichen Nutzung seitens der beurteilenden Lehrkräfte steht die wissenschaftliche Auseinandersetzung hingegen noch am Anfang. Es existieren bislang nur vereinzelte Untersuchungen, welche erste Hinweise auf eine Heterogenität der formalen und inhaltlichen Gestaltung von Beurteilungsvorgaben geben (vgl. Klein et al., 2009; Zabka & Stark, 2010), wie auch auf eine ambivalente Einschätzung durch die Lehrkräfte hinsichtlich der subjektiv wahrgenommenen Qualität und Nützlichkeit verweisen (vgl. Appius & Holmeier, 2012; Odendahl, 2008). Projektdesign Der Beitrag greift dieses bislang vernachlässigte Thema auf und stellt ausgewählte Befunde eines DFG-Projekts vor, das die Konfiguration und professionelle Nutzung der einheitlichen Korrektur- und Bewertungsvorgaben im Rahmen zentraler Abschlussprüfungen zum Erwerb des Mittleren Schulabschlusses untersucht. Im Rekurs auf schulische Governance-Ansätze (z.B. Altrichter, Brüsemeister & Wissinger, 2007; Altrichter & Maag Merki, 2010) ist davon auszugehen, dass die Nutzung der Korrektur- und Bewertungsvorgaben u.a. durch strukturelle und organisational-situative Handlungsbedingungen sowie individuelle Einstellungen, Kenntnisse und Merkmale der beurteilenden Lehrerinnen und Lehrer bedingt wird. Anknüpfend an die o.g. Forschungsarbeiten kann angenommen werden, dass die Nutzung der vorgegebenen Korrektur- und Bewertungsrichtlinien zudem maßgeblich durch deren konkrete Ausgestaltung determiniert wird. Um zu erfassen, ob und inwieweit Lehrkräfte diese tatsächlich nutzen, muss also zunächst eine differenzierte Analyse der Korrektur- und Bewertungsvorgaben erfolgen. Kern des Beitrags ist daher die Deskription der länderspezifischen Ausgestaltungsvarianten der Beurteilungsvorgaben sowie die Bestimmung von Ländertypen, welche hinsichtlich der Konfiguration entsprechender Vorgaben möglichst viele Übereinstimmungen aufweisen. Fragestellung Wie sind die Korrektur- und Bewertungsvorgaben in den Fächern Deutsch und Mathematik im Kontext zentraler Abschlussprüfungsverfahren zum Erwerb des Mittleren Schulabschlusses in den deutschen Ländern ausgestaltet? Methode Vorgestellt werden die Befunde einer kategoriengeleiteten Analyse der Korrektur- und Bewertungsvorgaben im bundesweiten Ländervergleich; dabei werden ausschließlich die beiden Kernfächer Deutsch und Mathematik fokussiert, die im Kontext der Prüfungsverfahren zum Erwerb des Mittleren Schulabschlusses als einzige in allen Bundesländern zentral geprüft werden (vgl. Kühn, 2013). In Anlehnung an inhaltsanalytische Verfahren (vgl. Mayring, 2010) wurden hierfür sowohl induktiv als auch deduktiv zwei fachspezifische Kategoriensysteme entwickelt, welche sowohl formale (z.B. Darstellungsform, Umfang) als auch inhaltliche Aspekte (z.B. Detailliertheits- und Verbindlichkeitsgrad) der Korrektur- und Bewertungsvorgaben berücksichtigen. Ergebnisse Die Analysen verweisen auf ein großes Spektrum von offenen, global formulierten Erwartungshorizonten ohne Verbindlichkeitsgrad bis hin zu konkreten kriteriengeleiteten Punkterastern. Trotz der ausgeprägten Heterogenität der Vorgaben können gleichwohl Ländertypen identifiziert werden, die im Spannungsfeld von Standardisierungsanspruch und pädagogischem Ermessen unterschiedliche Schwerpunkte setzen. Die Befunde werden im Hinblick auf den Beitrag zentraler Prüfungen zur Erhöhung von Bildungsgerechtigkeit diskutiert. Messung von Schreibkompetenz im Fach Deutsch: Bewährung der eingesetzten Beurteilungsskalen im Rahmen der Vergleichsarbeiten und in der schulischen Praxis Stefan Schipolowski, Katrin Böhme Institut zur Qualitätsentwicklung im Bildungswesen Berlin Theoretischer Hintergrund Obgleich der Vermittlung produktiver schriftsprachlicher Kompetenzen in Schulcurricula und in den Bildungsstandards der Kultusministerkonferenz eine große Bedeutung zugeschrieben wird (vgl. etwa KMK, 2004), wurde eine direkte Messung der Schreibkompetenz in Schulleistungsstudien bisher vergleichsweise selten durchgeführt. Dies kann teilweise darauf zurückgeführt werden, dass die Bewertung der von den Schülerinnen und Schülern verfassten Texte eine besondere Herausforderung darstellt: Einerseits sollen die verwendeten Beurteilungsskalen zuverlässige, valide und möglichst differenzierte Aussagen bezüglich der Stärken und Schwächen bei verschiedenen Aspekten der Schreibkompetenz erlauben, auf der anderen Seite muss die Bewertung der Texte vom Aufwand her leistbar sein (Behrens & Krelle, 2011). Letzteres ist wesentlich für die Akzeptanz der entwickelten Testinstrumente, insbesondere dann, wenn die Bewertung der Schülertexte durch die Lehrkräfte der beteiligten Schulen vor Ort vorgenommen werden soll, wie es typischerweise in den länderübergreifenden Vergleichsarbeiten (VERA) der Fall ist. Fragestellungen 1) Neben der Frage des Ressourceneinsatzes der Lehrkräfte bei der Bewertung von Schülertexten ist bisher weitgehend unklar, inwieweit sich die verschiedenen, in der Fachliteratur diskutierten Ansätze zur Bewertung von Schülertexten (vgl. etwa Neumann, 2012; Schipolowski & Böhme, 2015) psychometrisch für den Einsatz in groß angelegten Kompetenztestungen eignen. 2) Zudem ist offen, ob eine Eignung für Zwecke der Bildungsforschung gleichzeitig mit einem hohen Nutzen dieser Bewertungsansätze für die Unterrichtsentwicklung und der Verwendbarkeit in der schulischen Praxis einhergehen. Methode Grundlage unseres Beitrags sind die am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) für den Einsatz in den Vergleichsarbeiten in der achten Jahrgangsstufe (VERA-8) entwickelten Aufgaben und Beurteilungsskalen zur Erfassung von Schreibkompetenz im Fach Deutsch. Konkret wurden für VERA-8 im Jahr 2015 verschiedene mehrstufige Skalen entwickelt, die eine Beurteilung von Schülertexten mit Blick auf inhaltliche und stilistisch-strukturelle Aspekte sowie hinsichtlich der sprachlichen Richtigkeit erlauben. Diese Beurteilungsskalen wurden in einer umfangreichen Pilotierungsstudie (N = 2.918 Achtklässlerinnen und Achtklässler aus acht Bundesländern) für 12 verschiedene Schreibaufgaben erprobt. Für die Untersuchung der zweiten Fragestellung befragen wir gegenwärtig Lehrkräfte, die an der Durchführung von VERA-8 2015 teilgenommen haben. Zentrale Inhalte dieser Zusatzbefragung sind die Eignung der Skalen zur Identifikation von leistungsschwachen Lernern, die Eignung für Zwecke der Unterrichtsentwicklung, die Nutzung und der Nutzen von Benchmarktexten sowie die Nutzung der zugehörigen fachdidaktischen Kommentare. Ergebnisse In unserem Vortrag beschreiben und erläutern wir zunächst die eingesetzten Aufgaben und Beurteilungsskalen einschließlich des verwendeten Begleitmaterials (u. a. kommentierte Benchmarktexte) und berichten zentrale, in der Pilotierungsstudie ermittelte psychometrische Eigenschaften der Beurteilungsskalen. Konkret präsentieren wir für die Beantwortung der ersten Fragestellung die Urteilerübereinstimmung bei geschulten Kodiererinnen und Kodierern anhand von Intraklassen-Korrelationen und die mittels Strukturgleichungsmodellierung geprüften Zusammenhänge zwischen den Skalenwerten unter Berücksichtigung der Reliabilität. Ferner untersuchen wir das Ausmaß von Haloeffekten. Für die Beantwortung der zweiten Fragestellung richten wir das Augenmerk auf die Bewährung der Skalen in der Schulpraxis und stellen hierzu Ergebnisse der durchgeführten Zusatzbefragung dar. Dabei reflektieren wir diese Ergebnisse vor dem Hintergrund der Zielstellungen der Vergleichsarbeiten in der achten Jahrgangsstufe und den besonderen Herausforderungen des Unterrichtens in heterogenen Lerngruppen. Abschließend diskutieren wir auf Basis der Ergebnisse die Vor- und Nachteile der eingesetzten Bewertungsskalen sowohl aus psychometrischer Sicht als auch aus Sicht der Lehrkräfte und leiten Empfehlungen für zukünftige Schreibassessments im Rahmen von groß angelegten Kompetenztestungen mit verschiedenen Zielsetzungen (etwa Systemmonitoring oder Unterrichtsentwicklung) ab. ID: 368 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Didaktik Mathematik, Didaktiken der Naturwissenschaften und Technik Thematisches Cluster: Bildung im Sekundarbereich, Hochschulbildung, Lese- und Sprachförderung Stichworte: Sprachförderung, Sprache im Fach, Deutsch als Zweitsprache Sprache im Fachunterricht Chair(s): Dominik Leiss (Leuphana Universität Lüneburg), Knut Schwippert (Universität Hamburg) Diskutant(en): Miriam Vock (Universität Potsdam) Sprachliche Kompetenzen und deren Zusammenhang mit Schülerleistungen kommt in den letzten Jahren eine besondere Bedeutung zu und stellt schon jetzt Fachlehrpersonen vor besondere Herausforderungen (Becker-Mrotzek et al. 2013). Einerseits verlangen die für zahlreiche Fächer vorliegenden bzw. diskutierten Bildungsstandards die Vermittlung fachsprachlicher Kompetenzen (KMK 2004, VGD 2011). Andererseits ist aus (inter)nationalen Vergleichsstudien bekannt, dass insbesondere Schülerinnen und Schüler mit einem Migrationshintergrund Probleme haben bei der Bearbeitung komplexerer Aufgabenstellungen (vgl. u. a. Anand Pant et al. 2013, Prenzel et al. 2013). So bestimmt ein komplexes Wechselspiel von Merkmalen der in der Regel schriftlich dargelegten Aufgabenstellung (Verschaffel et al. 2000) und von intrapersonellen Aspekten (Artelt et al. 2001) das mentale Modell der schriftlichen Problemstellung in der Schülerkognition. Dabei scheint der Schreib- und Lesekompetenz bei den intrapersonellen Aspekten eine herausragende Rolle zuzukommen, was sich empirisch u.a. bei zahlreichen Studien in einer hohen Korrelation der Lesekompetenz mit der jeweiligen anwendungsorientierten Fachkompetenz widerspiegelt (vgl. u. a. Vilenius-Tuochimaa et al. 2008). Auch wenn es zu diesem komplexen Zusammenhang eine Reihe von deduktiven Theorien existieren, so stellt die empirische Klärung der relevanten Prozessvariablen und deren Zusammenhänge sowohl in der nationalen als auch der internationalen Forschung ein Desiderat dar (siehe Überblick in Kintsch 2004). Entsprechend zielt das beantrage Symposium darauf ab, ein Verständnis über fachbezogene Denk- und Lösungsprozesse in aufgabenbasierten Lehr-Lernarrangements unter der gemeinsamen Berücksichtigung sprachlicher Heterogenität in den Mittelpunkt empirischer Forschung zu stellen. Konzeptionelle Grundlage ist die systematische Verbindung empirischer Bildungsforschung mit und zwischen der Fachdidaktik Deutsch, Mathematik, Musik und Physik. Der erste Beitrag stellt ein theoretisches Rahmenmodell zur Beschreibung der sprachlichen Anforderungen von Unterrichtsaufgaben sowie eine diesbezügliche empirische Studie zur Analyse von Interaktionseffekten zwischen Fachleistungen und sprachlichen Anforderungen exemplarisch für die Fächern Physik und Musik vor. Im zweiten Beitrag wird im Rahmen einer quasi-experimentellen Interventionssstudie untersucht inwiefern sprachlich bzw. fachlich schwache Lernende von einer eher ganzheitlichen oder einer eher fokussierten Sprachförderung im Fach Mathematik profitieren. Der dritte Beitrag widmet sich einer ähnlichen Thematik, indem anhand zweier 15 Wochen dauernder Sprachförderkonzepte, einer separierten Sprach- und Fachförderung eine integrierte Förderung in den Fächern Deutsch und Mathematik gegenüber gestellt wurde. Im vierten Beitrag wird der Blick auf die Überzeugungen von Lehrpersonen hinsichtlich sprachlicher und kultureller Heterogenität gelenkt. Die Autoren haben hierzu 427 Lehramststudierende mit einem selbst entwickelten Testinstrument befragt und beschreiben u.a. Zusammenhänge von DaZ-Kompetenzen und diesbezüglichen beliefs. Beiträge des Symposiums Sprache und Fachunterricht: Modellierung sprachlicher Anforderungsniveaus Dietmar Höttecke1, Michael Ahlers2 1 Universität Hamburg, 2Leuphana Universität Lüneburg Theoretischer Hintergrund Felder sprachlichen Handelns sind auch in nicht explizit sprachlichen Unterrichtsfächern zahlreich (Vollmer & Thürmann 2010). Schulunterricht aller Fächer stellt fachspezifische und überfachliche Sprachanforderungen (Feilke 2012). Besondere Hemmnisse für gelingende fachliche Lernprozesse ergeben sich, wenn die Bedeutungskonstruktion über Sach- oder Aufgabentexte von sprachlichen Eingangsvoraussetzungen abhängt. Sichtbar wird dieses Problem z.B. in dem Befund, dass die zu Hause gesprochene Sprache Einfluss auf fachliche Kompetenzen hat (Pant et al. 2013) oder in Korrelationen zwischen Lesekompetenz (Leutner et al. 2004) bzw. sprachlichen Kompetenzen (Härtig et al. 2015) mit fachlichen Kompetenzen. Eine Didaktik der Mehrsprachigkeit empfiehlt daher Maßnahmen der Sprachförderung oder sprachliche Entlastungsmaßnahmen (z.B. Vereinfachung von Sachtexten) (Leisen 2010). Ob Reduktion sprachlicher Komplexität eine sinnvolle Entlastungsstrategie für Aufgaben darstellt, wird in unserer Studie untersucht. Hinweise darauf ergaben sich bereits aus Studien, bei denen Items in Chemie bzw. Science sprachlich auf den Ebenen der Lexik, Syntax, Tempus, der Verwendung von Negationen und der Textlänge variiert worden waren (Cassels & Johnstone 1984, Bird & Welford 1995, Prophet & Badede 2009). Fragestellungen (1) Wie lassen sich sprachliche Anforderungen von Textaufgaben in der Sekundarstufe I über verschiedene Fächer hinweg praktikabel operationalisieren? (2) Sinkt die Lösungswahrscheinlichkeit von Aufgaben mit ansteigender sprachlicher Schwierigkeit? (3) Zeigen sich systematische Zusammenhänge zwischen Lösungswahrscheinlichkeiten der sprachlich variierten Aufgaben und Personenmerkmalen? Methode Es wurde ein Testdesign gewählt, bei dem sprachliche Anforderungen von primär geschlossenen Testitems auf drei sprachlichen Niveaus über die Domänen Mathematik, Physik, Sport, Deutsch und Musik hinweg systematisch variiert wurden. Dazu wurde ein Modell zur Operationalisierung sprachlicher Anforderungsniveaus entwickelt. Der Modellentwicklung lag die theoretische Annahme zugrunde, dass sprachliche Anforderungen sich aus mehreren voneinander nicht isolierbaren Faktoren ergeben, die bei der Aufgabenkonstruktion zugleich variiert werden (u.a. Wort- und Satzlänge, Syntax, Morphosyntax, Layout, Kohäsionsmittel). Jedes Item liegt auf drei Sprachniveaus vor. Die Variation der drei Sprachniveaus erfolgte ausgehend vom mittleren Niveau und bezog sich nur auf Itemstämme. Instruktionen, Lösungen und Distraktoren wurden auf dem leichten Niveau gehalten. Lösungsrelevante Informationen variierten nicht. Es ergaben sich für 5 Fächer, 3 Items je Fach und 3 Sprachstufen 45 Testitems, die über drei Testhefte rotiert wurden, um Positionseffekte zu berücksichtigen. Die Items wurden durch Schülerinterviews präpilotiert. Das Sample bestand aus N = 601 Schülern/innen (weiblich: 49,7%, 7./8. Jg., Hamburg, NRW, Hessen, Baden-Württemberg). Jede/r Schüler/in bearbeitete je drei Aufgaben pro Unterrichtsfach, die sich in der sprachlichen Schwierigkeit unterschieden. Sprachliche Fähigkeiten wurden zusätzlich mit einem C-Test erhoben. Ein Fragebogen erhob weitere Hintergrunddaten (Alter, Geschlecht, Migrationshintergrund, Anzahl Bücher zu Hause). Ergebnisse Frage (1): Es konnte auf Basis linguistischer und fachdidaktischer Expertise ein Modell zur Operationalisierung sprachlicher Schwierigkeiten entwickelt werden, das die Konstruktion von 45 Items ermöglichte und validierte. Frage (2): Die Erwartung, dass sich die theoretisch erwartete Stufung der Sprachschwierigkeit empirisch bewährt, konnte nicht bestätigt werden. Lösungswahrscheinlichkeiten fallen nur bei wenigen Items monoton mit ansteigendem Sprachniveau. Tendenziell haben Items auf dem mittleren sprachlichen Anforderungsniveau eine höhere Lösungswahrscheinlichkeit gegenüber dem einfachen und schweren Sprachniveau. Regressionsmodelle zeigen, dass die Regressionsgewichte der Itemeigenschaften „Sprachniveau leicht“ oder „Sprachniveau schwer“ gering ausfallen und das Kriterium der Lösungswahrscheinlichkeit kaum vorhersagen (Varianzaufklärung durchschnittlich R² = 0.01). Frage (3): In einem Regressionsmodell unter Kontrolle der Kovariaten bleiben Regressionskoeffizienten gering, zeigen aber für Sprachfähigkeit und sozio-ökonomischen Hintergrund klare positive, für Migrationshintergrund klare negative Zusammenhänge mit der Lösungswahrscheinlichkeiten der Items. Die Varianzaufklärung steigt hier an (R² = 0.11). Dieses Ergebnismuster zeigt sich ebenfalls auf der Ebene bivariater Korrelationen. Der Beitrag schließt mit einer Diskussion über Grenzen der Studie und über mögliche Konsequenzen für die Konstruktion von Lern- und Testaufgaben. Der Bezug des Beitrags zum Tagungsthema ergibt sich, da wir die sprach-bezogenen Ausgangsbedingungen, die wir untersuhen, als „schwierige Randbedingung“ gelingender fachlicher Lernprozesse verstehen. Brauchen mehrsprachige Jugendliche eine andere fach- und sprachintegrierte Förderung als einsprachige? Differentielle Analysen zur Wirksamkeit einer Intervention in Mathematik Susanne Prediger, Lena Wessel TU Dortmund Theoretischer Hintergrund: Aufgrund zahlreicher empirischer Befunde zu sprachlich bedingten Leistungsdisparitäten (OECD, 2007; Prediger, Wilhelm, Büchter, Benholz, & Gürsoy, 2015; Stanat, 2006) ist Sprachförderung zur Querschnittsaufgabe aller Fächer erklärt worden (Ahrenholz, 2010). Gegenstand der Sprachförderung im Fach ist neben der Fachsprache vor al-lem die Bildungssprache, deren kommunikative und epistemische Funktion nicht nur für mehr-sprachige, sondern auch für sprachlich schwache einsprachige Lernende zum Lernhindernis wer-den kann (Feilke, 2012; Gogolin, 2006; Morek & Heller, 2012). Mit Konzepten des Makro-Scaffolding (Gibbons, 2002) und der Darstellungsvernetzung (Leisen, 2005; Prediger & Wessel, 2013) stehen Ansätze zur Verfügung, die sich zur Weiterentwicklung der sprachlichen und fach-lichen Kompetenzen in integrierter Form bewährt haben. Fragestellung: Ein Forschungsdefizit gibt es jedoch weiterhin in der empirischen Absicherung und theoretischen Ausdifferenzierung der fach- und sprachintegrierten Förderung (Bredel, 2005). Insbesondere gibt es wenig empirisch konsolidiertes Wissen darüber, welche Maßnahmen fach- und sprachintegrierter Förderung für welche Sprachhintergründe tatsächlich das fachliche Lernen stützen können: sind es eher die ganzheitlichen Anregungen zur Kommunikation oder zusätzlich fokussiertere Sprachangebote auf Wort- und Satzebene? Benötigt die Gruppe der sprachlich schwachen einsprachigen Lernenden andere Fördermaßnahmen als mehrsprachige Lernende? Inwiefern kann die Gruppe der sprachlich starken, aber mathematisch schwachen Lernenden ebenfalls von einer fach- und sprach¬integrierten Förderung mathematisch profitieren? Im Vortrag berichtet wird aus einem DFG-Projekt, das die differentiellen Bedarfe und Wirkungen bei ein- und mehrsprachigen Jugendlichen mit unterschiedlicher Sprachkompetenz am Beispiel des Um-gangs mit Brüchen untersucht. Methode: In einer quasiexperimentellen Interventionsstudie werden zwei Varianten der fach- und sprachintegrierten Förderung (5x 90 min) verglichen bzgl. der abhängigen Variable verstehens-bezogene Mathematikleistung. Die unabhängige Variable im Prä-Post-Follow-up-Design bilden zwei Interventionsformen (plus Kontrollgruppe): eine ganzheitliche Förderung G des mathematisch konzep¬tuellen Verständnisses mit ganzheitlicher Kommunikationsanregung und eine Förde-rung F, die zusätz¬lich eine fokussierte Erarbeitung der themenbezogenen Sprachmittel auf Wort- und Satzebene anbietet. Die Interventionsgruppen sind vergleichbar bzgl. der Kontrollvariablen kognitive Grundfertigkeit, bildungssprachliche Kompetenz, Mehrsprachigkeit, SES und verste-hensbezogene Mathematik-Ausgangsleistung. Die differentielle Wirksamkeit der beiden Interventionsformen wird untersucht für vier Sub-samples mathematisch schwacher Lernender mit unterschiedlichen Sprachhintergründen: einspra-chig (E) oder mehrsprachig (M), jeweils mit höherer (+) oder niedrigerer (-) Sprachkompetenz im Deutschen (also Subsamples E-, E+, M-, M+, zusammen n = 332). Die Datenanalyse erfolgt mittels Varianzanalyse mit Messwiederholung und dem Vergleich von Effektstärken für die Intragruppeneffekte. Ergebnisse. Die Varianzanalyse mit Messwiederholung (ANOVA) und Post-hoc-Test zeigt für beide Interventionsformen einen signifikant höheren Lernzuwachs bzgl. der verstehensbezogenen Mathematikleistungen als in der Kontrollgruppe (F(Zeit) = 292.15, p<0.001, ² = 0.47; F(Gruppen) = 8.1, p<0.001, ² = 0.047; F(Gruppen x Zeit) = 19.59, p<0.001, ² = 0.11), aber keine relevanten Unter-schiede zwischen beiden Interventionsformen. Die Effektstärken im Zuwachs an verstehens-bezogener Leistung sind mit dG = 1.14 für Förderung G und dF =1.12 für Förderung F sehr hoch, die für die Kontrollgruppe mit d=0.59 nur mittel. Die differentiellen Analysen zeigen unterschiedliche Lernzuwächse der vier Subsamples je nach Sprachhintergrund. Dabei wird insbesondere deutlich, dass gerade die sprachlich schwachen einsprachigen Lernenden (Gruppe E-) besonders von der Interventionsform F (auch fokussierte Förderung auf Wort- und Satzebene) profitieren (mit einer Mittelwertdifferenz von 5.27), deut-lich mehr als die mehrsprachigen Lernenden (Mittelwertdifferenz von 3.41 in dem Subsample M- und 2.78 in M+). Diese Phänomene sollen durch vertiefte Analysen auch aus den videographierten Förderpro-zessen genauer erklärt werden, um durch genauere Implementations- und Nutzungskontrolle die differenzielle Wirksamkeit von Förderansätzen genauer zu bestimmen. Damit wird eine empirisch gesicherte Basis für zielgruppenspezifisch adaptive Förderung je nach Sprachhintergrund geschaffen. Integrierte und separierte Sprachförderung im Vergleich – Entwicklungsverläufe bei Schülerinnen und Schülern des 7. Jahrgangs Maike Hagena1, Sabrina Kulin2, Knut Schwippert2, Dominik Leiss1 1 Leuphana Universität Lüneburg, 2Universität Hamburg Innerhalb des schulischen Lernens kommt es häufig zu einer Separierung von sprachlichem und fachlichem Lernen. Sprachförderung im Sinne eines bildungssprachlich gestützten Lernens gilt jedoch als Schlüssel für den Kompetenzerwerb im Fachlernen (Becker-Mrotzek, Schramm, Thürmann & Vollmer, 2013), woraus sich die Notwendigkeit einer Sprachbildung und förderung in sämtlichen Fächern (Gogolin et al., 2011; Prediger, 2013; Schmölzer-Eibinger, 2013) bzw. einer Verbindung von sprachlichem und fachlichem Lernen ableitet. Da Schülerinnen und Schüler mit Defiziten in der deutschen Sprache nicht nur in den als eindeutig sprachlich klassifizierten Fächern, sondern auch in vermeintlich sprachfernen Fächern wie z.B. der Mathematik benachteiligt sind (Baumert & Schümer, 2001), wäre mit einem Sprach-Fach-Lernen erhöhter Bildungserfolg trotz erwartungswidriger Ausgangsbedingungen zu erwarten. Befunde, dass Sprachkompetenz ein wichtiger Indikator für erfolgreiches Fachlernen ist (z.B. Bos et al., 2007; Becker-Mrotzek et al., 2013), untermauern diese Relevanz. Konzeptionen von integriertem Sprach-Fachlernen sollen Lösungsansätze liefern. Auf Grund der theoretischen Überlegungen ergeben sich folgende Forschungsfragen: (a) Wie entwickelt sich die Handlungsfähigkeit von Schülerinnen und Schülern im Fachunterricht durch Sprachförderung? (b) Welche Unterschiede lassen sich zwischen Schülerinnen und Schülern identifizieren, die integrierte bzw. separierte Sprachförderung erhalten? Im Rahmen der Studie Fach-an-Sprache-an-Fach (FaSaF) wurden 15 Wochen lang 256 Schülerinnen und Schüler der 7. Klassen an sieben Schulen aus dem Raum Hamburg und Niedersachsen sprachlich gefördert. Entsprechend den Bedingungen in der schulischen Praxis wurden heterogene Lerngruppen anhand sprachlicher und mathematischer Eingangstests (LGVT, DEMAT, C-Tests) gebildet. Pro Schule konnten somit zwei in sich heterogene Fördergruppen additiv zum Regelunterricht implementiert werden, die von geschulten Projektmitarbeiterinnen unterrichtet wurden – dabei wurde in einer Fördergruppe mit einem separierten, in einer Fördergruppe mit einem integrierten Sprachförderkonzept gearbeitet. Experimentalgruppe 1: Separiertes Sprachförderkonzept (n = 124) Es fand eine separierte Sprach- und Mathematikförderung statt, in der Lese- und Schreibstrategien anhand von argumentativen Texten erarbeitet wurden. Anschließend wurde die Bearbeitung mathematischer Modellierungsaufgaben fokussiert. Experimentalgruppe 2: Integriertes Sprachförderkonzept (n = 126): Ausgehend von der Bearbeitung mathematischer Modellierungsaufgaben wurden sowohl Lese- als auch Schreibstrategien anhand von argumentativen Texten erarbeitet. Zur Untersuchung der fachspezifischen Entwicklungsverläufe kamen in einem Pre-Post-Test-Design selbstentwickelte, standardisierte Testinstrumente zum mathematischen Modellieren zum Einsatz. Nach einem Jahr (Mitte 2016) erfolgt eine FollowUp-Testung. Auswertungen bestätigen die Güte der entwickelten Testinstrumente (Mathematisches Modellieren: Cronbachs Alpha = .79). Aus derzeitigen Analysen zeichnet sich sowohl im Pretest als auch im Posttest bei einer geschlossenen Aufgabe für das Argumentieren ab, dass die Schülerinnen und Schüler ein hohes implizites Schreibwissen besitzen und sich dieses z.T. im Laufe der Förderung mit einem kleinen Effekt (Cohens d = 0.32) signifikant verbessert. Analysen zu den Entwicklungen der Schülerantworten zu Aufgaben beim mathematischen Modellieren werden – neben einem Vergleich der Fördergruppen – im Vortrag präsentiert und diskutiert. Deutsch als Zweitsprache im Fachunterricht - Überzeugungen angehender Lehrkräfte Nele Fischer, Svenja Hammer Leuphana Universität Lüneburg Das Anforderungsprofil an den Lehrerberuf wird immer vielfältiger. Darunter fällt auch die Kompetenz, Schülerinnen und Schüler mit Deutsch als Zweitsprache (DaZ) im Fachunterricht angemessen unterstützen zu können (DaZ-Kompetenz). Um das Verhalten von Lehrkräften zu erklären, hat sich das Konstrukt der Überzeugungen bzw. „beliefs“ als besonders relevant erwiesen (Pintrich 1990). Dies sind subjektiv geprägte und als legitim angesehene Thesen, welche die Analysen von und Reaktionen auf Sachverhalte, Situationen und Personen beeinflussen (Borg 2011). Die Forschung zu Überzeugungen im schulischen Kontext hat in den letzten Jahren zugenommen, sich aber hauptsächlich auf das fachspezifische Lehren und Lernen, die Leistungserwartungen von Lehrkräften im Kontext migrationsbedingter Heterogenität und das Auftreten kultureller Konflikte konzentriert. Nur wenige Untersuchungen nehmen den Umgang mit DaZ zum Anlass, das Konstrukt der „beliefs“ nutzbar zu machen, um daraus vor allem eventuelle Lücken in der Lehramtsausbildung zu erkennen und zu schließen. Ziel der durchgeführten Studie war es, zu untersuchen, welche Überzeugungen angehende Lehrkräfte hinsichtlich sprachlicher und kultureller Heterogenität vertreten. Hierfür wurden theoretisch die drei Bereiche Wertschätzung der Herkunftssprachen, Zuständigkeit für Sprachförderung und Sprachsensibilität im Fachunterricht identifiziert. Konkret wurden folgende Fragestellungen untersucht: (1) Ist es möglich, die Skalen zu Überzeugungen hinsichtlich Mehrsprachigkeit auf Basis des Rasch-Modells zu skalieren und ein theoretisch angenommenes, dreidimensionales Konstrukt zu bestätigen? (2) Welche Zusammenhänge bestehen zwischen den Überzeugungen von Lehramtsstudierenden hinsichtlich Mehrsprachigkeit, Personenmerkmalen und DaZ-Kompetenz? Angelehnt an das im Projekt DaZKom (Köker et al. 2015) entwickelte Kompetenzmodell, wurden Skalen für den Einsatz bei Lehramtsstudierenden (N = 427) konzipiert und erprobt. Die Skala besteht aus 31 Items mit einer EAP Reliabilität = 0.84. Zusätzlich wurden Skalen zu inner- und außeruniversitären Lerngelegenheiten sowie Praxiserfahrungen im Bereich DaZ eingesetzt (vgl. Hammer et al., 2015). Auf Grundlage der Skalen- und Itemkennwerte wird deutlich, dass sich Einstellungen zu Mehrsprachigkeit mit einem RaschModell abbilden lassen. Die Ergebnisse der Erhebung sprechen zudem dafür, dass 75% der befragten Studierenden sprachsensible Überzeugungen in Bezug auf Fachunterricht haben. 82% der Studierenden fühlen sich zuständig für Sprachförderung, wohingegen nur 58% der Studierenden Wertschätzung für die Herkunftssprachen der Schülerinnen und Schüler zeigt. Besonders Studierende mit Praxiserfahrung im Bereich DaZ zeigen positivere Einstellungen gegenüber Mehrsprachigkeit als Studierende ohne Praxiserfahrung. Dies zeigt sich auch bei Studierenden mit einer höheren Anzahl an universitären Lerngelegenheiten. Ein Zusammenhang zwischen der DaZ-Kompetenz und den DaZ-Einstellungen konnte ebenfalls festgestellt werden – Studierende mit hoher DaZ-Kompetenz zeigten positivere Einstellungen zu Mehrsprachigkeit als Studierende mit geringerer DaZ-Kompetenz. Diese Studie konnte somit herausstellen, dass universitäre Lerngelegenheiten nicht nur auf kognitive Aspekte, sondern auch auf motivationale und volitionale Aspekte ausgerichtet werden sollten. Aus den Ergebnissen sollen Schlussfolgerungen für die Gestaltung der universitären Lehre im Bereich DaZ abgeleitet werden. Zudem werden Grenzen der Studie diskutiert und ein Ausblick auf weitere Forschungsdesiderate gegeben. ID: 370 Symposium Disziplinen-Cluster: Psychologie Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Motivation und Emotion Stichworte: Fähigkeitsselbstkonzept, Selbstwirksamkeitsüberzeugung, Schulleistung Fähigkeitsselbstkonzept und Selbstwirksamkeitsüberzeugung im Kontext von Schulleistung Chair(s): Anne Franziska Weidinger (Technische Universität Dortmund), Anja Meißner (Technische Universität Dortmund), Ricarda Steinmayr (Technische Universität Dortmund) Diskutant(en): Oliver Dickhäuser (Universität Mannheim) Erfolgserwartungen, wie das Fähigkeitsselbstkonzept und die Selbstwirksamkeitsüberzeugung gelten als wichtige motivationale Determinanten schulischen Leistungsverhaltens und des Bildungserfolgs (Wigfield, Eccles, Schiefele, Roeser & Davis-Kean, 2006). Lernende mit höheren Erfolgserwartungen zeigen bessere Schulleistungen als ihre Mitschülerinnen und Mitschüler mit geringeren Erfolgserwartungen (zsf. Marsh & Martin, 2011). Im Sinne einer differenzierten Betrachtung des Zusammenspiels von Erwartungen und Leistung werden die Zusammenhänge im vorliegenden Symposium in unterschiedlichen Domänen und für unterschiedliche Altersgruppen, Schulformen sowie Leistungs- und Begabungsniveaus thematisiert. In einer Längsschnittstudie mit insgesamt sieben Messzeitpunkten untersuchten Weidinger, Steinmayr und Spinath, ob sich vom zweiten bis zum vierten Schuljahr Veränderungen in der Richtung des Zusammenhangs zwischen Fähigkeitsselbstkonzept und Schulleistung ergeben. Entsprechend theoretischer Annahmen überwogen im Alter von sieben bis acht Jahren SkillDevelopment-Effekte, und erst gegen Ende der Grundschulzeit zeigte sich ein Einfluss des Fähigkeitsselbstkonzepts auf die Leistungsveränderung der Kinder. Herrmann, Schmidt, Kessels und Preckel untersuchten Referenzgruppeneffekte auf das Fähigkeitsselbstkonzept von Fünftklässlerinnen und Fünftklässlern aus regulären Gymnasialklassen und aus Hochbegabtenklassen. Bei gleichzeitiger Betrachtung von Kontrast- und Assimilationseffekten konnten sie für das Fach Mathematik – nicht jedoch für Deutsch – zeigen, dass der durch die Leistungsstärke der Bezugsgruppe bedingte negative Kontrasteffekt in Hochbegabtenklassen vollständig durch einen positiven Assimilationseffekt kompensiert wurde. McElvany, Gebauer, Bos, Schöber und Köller untersuchten die Rolle der domänenspezifischen Selbstwirksamkeitsüberzeugung von Siebtklässlerinnen und Siebtklässlern unterschiedlicher Schulformen für deren Leistung in standardisierten Mathematik- und Lesetests und deren domänenspezifische Motivation. Während die domänenspezifische Selbstwirksamkeitsüberzeugung für die Testleistung in Mathematik und Lesen gleich bedeutsam war, zeigte sich in Mathematik ein höherer Zusammenhang zwischen Selbstwirksamkeitsüberzeugung und Motivation. Dieses Befundmuster blieb bei Kontrolle weiterer motivationaler Konstrukte stabil, wobei sich die Effekte bei Berücksichtigung der kognitiven Grundfähigkeiten reduzierten. Dies zeigte sich sowohl für leistungsschwächere als auch -stärkerer Lernende. Meißner und Steinmayr untersuchten die relative Bedeutsamkeit von Fähigkeitsselbstkonzept und Intelligenz für die Schulleistung von Achtklässlerinnen und Achtklässlern unterschiedlicher Schulformen in Mathematik und Deutsch. Dabei wurde die Art des Schulleistungsindikators unterschieden. Während sich das domänenspezifische Fähigkeitsselbstkonzept in beiden Domänen als bedeutsamster Prädiktor der jeweiligen Note erwies, leistete Intelligenz einen größeren (Mathematik) oder genauso großen Beitrag (Deutsch) wie das domänenspezifische Fähigkeitsselbstkonzept zur Vorhersage der Testleistung. Dieses Befundmuster zeigte sich unabhängig von der Schulform. Zusammengefasst liefern die Studien wichtige Erkenntnisse zur Rolle von Erwartungen für die Schulleistung in unterschiedlichen Domänen sowie verschiedener Schülergruppen. Die Befunde zeigen, dass eine differenzierte Betrachtung des Zusammenhangs von Fähigkeitsselbstkonzept bzw. Selbstwirksamkeitsüberzeugung und Schulleistung aus theoretischer und praktischer Sicht lohnenswert ist. Beiträge des Symposiums Von Skill-Development über Self-Enhancement zu reziproken Effekten: Veränderung der gegenseitigen Beeinflussung von Fähigkeitsselbstkonzepten und Leistung in der Grundschule Anne Franziska Weidinger1, Ricarda Steinmayr1, Birgit Spinath2 1 Technische Universität Dortmund, 2Ruprecht-Karls-Universität Heidelberg Im Laufe der Grundschulzeit durchläuft das Fähigkeitsselbstkonzept verschiedene Veränderungen (zsf. Dweck, 2002). Zum Beispiel differenziert es sich bei Kindern zwischen sieben und acht Jahren insofern aus, dass zunehmend besser zwischen Fähigkeiten und Anstrengung unterschieden, und das Fähigkeitsselbstkonzept von anderen Selbstkonzeptfacetten (z.B. soziale Kompetenz, Aussehen) klarer getrennt wird (Stipek & Mac Iver, 1989). Gleichzeitig steigt das Interesse der Kinder an sozialen Vergleichen und der schulische Kontext bietet die Möglichkeit, diese vermehrt anzustellen (zsf. Dweck, 2002; Nicholls, 1984). Diese Prozesse sollten dazu führen, dass Kinder ihre Fähigkeiten über die Grundschulzeit hinweg zunehmend realistischer beurteilen können (Stipek, 1981). Tatsächlich zeigten sich mit zunehmendem Alter höhere Zusammenhänge zwischen dem Fähigkeitsselbstkonzept und objektiven Leistungsmaßen bzw. Fremdeinschätzungen der Fähigkeiten (z.B. Asendorpf & van Aken, 1993; Spinath & Spinath, 2005), und anfänglich sehr positive Fähigkeitsselbstkonzepte wurden im Laufe der Zeit negativer (z.B. Spinath & Steinmayr, 2008). Für die Frage nach der gegenseitigen Beeinflussung von Fähigkeitsselbstkonzept und Leistung bedeutet dies, dass bei Sieben- bis Achtjährigen vor allem Effekte der vorherigen Leistung in einer Domäne auf die Veränderung des domänenspezifischen Fähigkeitsselbstkonzepts im Sinne von Skill-Development-Effekten (vgl. Calsyn & Kenny, 1977) zu beobachten sein sollten, da sich das Fähigkeitsselbstkonzept erst einmal formieren muss. Erst mit ca. zehn Jahren sollte die Unterscheidung zwischen Fähigkeit und anderen Faktoren (z.B. Anstrengung) sowie deren Effekte auf die eigene Leistung voll ausgeprägt sein (Dweck, 2002; Nicholls & Miller, 1984). Erst, wenn Fähigkeiten als stabile Eigenschaft der Person verstanden und nicht mehr nur an einzelnen Handlungsergebnissen festgemacht werden, sollten Fähigkeitsselbstkonzepte zu Prädiktoren für zukünftiges Verhalten bzw. Leistung werden. Folglich sollten sich Effekte des Fähigkeitsselbstkonzepts auf die Leistungsentwicklung (Self-Enhancement-Effekte; vgl. Calsyn & Kenny, 1977) erst zum Ende der Grundschulzeit zeigen. Obgleich die gegenseitige Beeinflussung von Fähigkeitsselbstkonzepten und Leistung bereits bei Grundschulkindern untersucht wurde (z.B. Helmke & van Aken, 1995; Guay, Marsh & Boivin, 2003; Viljaranta, Tolvanen, Aunola & Nurmi, 2014), wurde diese Hypothese noch nicht geprüft. Mit dem Ziel diese Forschungslücke zu schließen, untersuchten wir den Kausalzusammenhang zwischen Fähigkeitsselbstkonzept und Leistung bei Kindern vom achten bis zehnten Lebensjahr, wobei die Konstrukte siebenmal, je im Abstand von vier Monaten kurz nach Einführung der Ziffernnoten erhoben wurden. Eine engmaschigere Untersuchung des Zusammenhangs zwischen Fähigkeitsselbstkonzept und Leistung als in vorherigen Studien kann Aufschluss darüber geben, ob sich in der schulischen Phase, in der Fähigkeitsselbstkonzepte stark geformt werden, Veränderungen in der Richtung des Zusammenhangs ergeben. Die Daten zur Untersuchung der Fragestellung stammen aus einer Längsschnittstudie mit 542 Grundschulkindern (t1: M = 7.95 Jahre, SD = 0.58; t7: M = 9.93 Jahre; SD = 0.72). Das Fähigkeitsselbstkonzept für Mathematik (Selbstberichtfragebögen) sowie die Mathematiknote (Angabe der Lehrkraft) wurden zu sieben Messezeitpunkten vom Ende der zweiten bis zum Ende der vierten Klasse erhoben. Die Daten wurden mit latenten Wachstumskurvenmodellen (LGCM) sowie einem latenten cross-lagged Modell (CLM) ausgewertet. Die univariaten LGCM zeigten, dass das Fähigkeitsselbstkonzept im Gegensatz zur Mathematiknote im Mittel über die Zeit abfiel, wobei es signifikante interindividuelle Unterschiede in dem Abfall gab. Das CLM zeigte, dass Skill-Development-Effekte bis zum Beginn der vierten Klasse (t5) geringer wurden, während Self-Enhancement-Effekte erwartungskonform größer wurden: Bis Mitte der dritten Klasse (t3) zeigten sich nur Skill-Development-Effekte, dann reziproke Effekte (t3-t4) und zu Beginn der vierten Klasse nur noch Self-Enhancement-Effekte (t4-t5). Ab Mitte der vierten Klasse überwogen erneut Skill-Development-Effekte (t5-t6), bevor Skill-Development- und Self-Enhancement-Effekte am Ende der vierten Klasse (t6-t7) vergleichbar hoch ausfielen. Unsere Ergebnisse zeigen, dass im Alter von sieben bis acht Jahren Skill-Development-Effekte überwiegen, und dass sich erst gegen Ende der Grundschulzeit ein Einfluss des Fähigkeitsselbstkonzepts auf die Leistungsveränderung der Kinder zeigt. Dies stützt theoretische Annahmen zur Motivationsentwicklung im Grundschulalter und es wird in Bezug auf die pädagogische Praxis diskutiert. Big fish in big ponds: Assimilations- und Kontrasteffekte in Hochbegabtenklassen Julia Herrmann1, Isabelle Schmidt2, Ursula Kessels1, Franzis Preckel2 1 Freie Universität Berlin, 2Universität Trier Theoretischer Hintergrund: Der sogenannte Big-Fish-Little-Pond-Effekt (BFLPE; Marsh & Parker, 1984) besagt, dass sich die Zugehörigkeit zu leistungsstarken Referenzgruppen ungünstig auf akademische Selbstkonzepte (ASKs) von SchülerInnen auswirken kann, was insbesondere für die Hochbegabtenförderung in Spezialklassen einen großen Nachteil bedeuten würde. Ursprünglich wurde der BFLPE als reiner negativer Kontrasteffekt (negativer Einfluss des mittleren Leistungsniveaus der Klasse auf ASKs bei Konstanthaltung der individuellen Fähigkeit) beschrieben und als solcher bereits gründlich beforscht und repliziert. Neuere Konzeptionen des BFLPE (z. B. Marsh & Craven, 2002) berücksichtigen, dass sich die Zugehörigkeit zu einer leistungsstarken Gruppe auch positiv auf ASKs auswirken kann (z. B. weil mit der Gruppenzugehörigkeit ein gewisser Status einhergeht und weil man sich positive Eigenschaften, die die Gruppe charakterisieren, auch selbst zuschreiben kann – ein sogenannter positiver Assimilationseffekt). Verglichen mit der großen Anzahl herkömmlicher BFLPE-Studien ist bislang in nur wenigen Forschungsarbeiten versucht worden, Assimilations- und Kontrasteffekte voneinander zu trennen. Genaueren Aufschluss über die jeweilige Stärke und ein evtl. domänenspezifisches Auftreten dieser gegenläufigen Effekte zu gewinnen, erscheint jedoch lohnenswert und gerade in Hochbegabtenstichproben interessant, da hier Hinweise auf starke Assimilationseffekte durch Fähigkeitsgruppierungsmaßnahmen vorliegen (z. B. Preckel & Brüll, 2010; Rindermann & Heller, 2005). Fragestellung: Die Studie geht der Frage nach, ob sich bei Leistungsgruppierung in reguläre Gymnasial- und spezielle Hochbegabtenklassen innerhalb der gleichen Schulen BFLPEs auf domänenspezifische ASKs zeigen und dabei negative Kontrast- und positive Assimilationseffekte trennen lassen. Hypothesen: Bei Kontrolle der individuellen kognitiven Leistungsfähigkeit zeigen sich simultan: - Ein negativer Kontrasteffekt des Klassenleistungsniveaus - Ein positiver Assimilationseffekt der Hochbegabtenklassenzugehörigkeit auf die ASKs. Die gegenläufigen Effekte lassen sich sowohl für das ASK im Fach Mathematik als auch für das ASK im Fach Deutsch zeigen. Die Replikation des BFLPE gelingt bei relativ breiter und schulferner Leistungsoperationalisierung über ein Intelligenzmaß. Die Effekte bleiben bei Kontrolle für früheres ASK bestehen. Methode: An der Studie nahmen 1330 FünftklässlerInnen teil, die entweder reguläre Gymnasial- oder spezielle Hochbegabtenförderklassen besuchten (42 reguläre Klassen, n = 1069, 48% Mädchen; 15 Hochbegabtenförderklassen, n = 261, 39% Mädchen). Datenerhebungen fanden zu drei Zeitpunkten statt: - Beginn Kl. 5: 1. Erhebung ASK Mathematik und Deutsch (Self-Description Questionnaire, SDQ II; Marsh, 1990) - Ca. 4 Wochen nach dem Schulübergang: 2. Erhebung ASK Mathematik und Deutsch (SDQ II) - 10-12 Wochen nach dem Schulübergang: Erhebung Intelligenz (Kognitiver Fähigkeitstest für 4. bis 12. Klassen, Revision, KFT 4-12+ R; Heller & Perleth, 2000) Zur Datenauswertung wurden in Mplus Random-Intercept Mehrebenen-Regressionsanalysen durchgeführt und dabei ein schrittweises Vorgehen gewählt. Die ASK-Domänen Mathematik und Deutsch wurden separat betrachtet (AV: ASK Mathe bzw. Deutsch zu T2). Bei Konstanthaltung der individuellen Leistungsfähigkeit (numerische oder verbale Intelligenz) wurden zunächst nur negative Kontrasteffekte (operationalisiert über das durchschnittliche Intelligenzniveau der Klasse im numerischen bzw. verbalen Bereich) bzw. positive Assimilationseffekte (operationalisiert über den Klassentyp: reguläre vs. Hochbegabtenförderklasse) jeweils einzeln geprüft. Anschließend wurden beide antagonistischen Effekte simultan modelliert sowie das ASK in Mathematik bzw. Deutsch zu T1 mit ins Modell aufgenommen, um auszuschließen, dass es sich bei den erwarteten Assimilationseffekten um Auswirkungen a priori hoher ASKs bei den SchülerInnen in den Hochbegabtenklassen handelte. Ergebnisse und Diskussion: Bei einzelner Modellierung ließen sich weder in der mathematischen noch in der verbalen Domäne Kontrast- oder Assimilationseffekte zeigen. Bei gleichzeitiger Aufnahme beider Ebene-2-Prädiktoren (Leistungsniveau der Klasse und Klassentyp) ins Modell trat für Mathematik der erwartete Suppressionseffekt auf: Es zeigte sich ein positiver Assimilationseffekt der Zugehörigkeit zu einer Hochbegabtenklasse, der einen negativen - durch die Leistungsstärke der Bezugsgruppe bedingten - Kontrasteffekt vollständig kompensierte. Dieses Ergebnismuster blieb auch bei Kontrolle für vorbestehendes ASK erhalten. Für Deutsch zeigten sich entgegen der Hypothese auch bei simultaner Modellierung keinerlei Referenzgruppeneffekte. Es wird diskutiert, wodurch dieses bereichsspezifische Befundmuster zustande gekommen sein könnte und welche Implikationen die Ergebnisse für die Hochbegabtenförderung in Spezialklassen haben. Prädiktion von Motivation und Kompetenz in Mathematik und Lesen: Die Bedeutung der Selbstwirksamkeitsüberzeugung im Kontext motivationaler und kognitiver Merkmale Nele McElvany1, Miriam M. Gebauer1, Wilfried Bos1, Christian Schöber2, Olaf Köller2 1 Institut für Schulentwicklungsforschung, TU Dortmund, 2IPN, Universität Kiel Ziel schulischer Bildung ist multikriterialer Kompetenzerwerb (vgl. Landesschulgesetze). Hierzu zählen neben psychischem Wohlbefinden, Persönlichkeitsmerkmalen und sozialen Kompetenzen insbesondere kognitiven Kompetenzen und motivationale Orientierungen (vgl. Baumert & Köller, 2000; Fend, 1980; Kunter, 2005). Grundlegende kognitive Kompetenzen im schulischen Kontext sind unter anderem Mathematik- und Lesekompetenz. Im Bereich der motivationalen Merkmale gehört die Förderung der intrinsischen Motivation (vgl. Deci & Ryan, 1993) gegenüber Mathematik und Lesen zu den Bildungszielen. Im Zusammenspiel multipler Determinanten für Bildungserfolg von Lernenden gelten auch Selbstwirksamkeitsüberzeugungen als relevante individuelle Bedingungsfaktoren (Pajares & Urdan, 2006). Diese beeinflussen - als das Vertrauen in die eigene Kompetenz bezogen auf zukünftige Handlungen und die Einschätzung des zu erwartenden (Miss)Erfolgs - Planung, Organisation und Durchführung von Handlungen (Bandura, 1997). Die Relevanz von Selbstwirksamkeitsüberzeugungen kann insgesamt als gut gesichert gelten. Es liegen jedoch bisher wenige Erkenntnisse zur differentiellen Bedeutung für Kompetenz und Motivation in unterschiedlichen schulischen Domänen vor. Dies gilt auch für die simultane Berücksichtigung anderer motivationaler Einflussfaktoren, wie akademischem Selbstkonzept, Lernzielorientierung und Schulfreude, und von kognitiven Grundfähigkeiten sowie für Befundmuster unterschiedlich leistungsstarker Schülergruppen. Vor diesem Hintergrund werden vier Forschungsfragen untersucht: (1) Hat mathematikbezogene Selbstwirksamkeitsüberzeugung für Mathematikmotivation und Mathematikleistung eine stärkere prädiktive Kraft als lesebezogene Selbstwirksamkeitsüberzeugung für Lesemotivation und Lesekompetenz? (2) Sind domänenspezifische Selbstwirksamkeitsüberzeugungen auch bei Berücksichtigung anderer zentraler motivationaler Merkmale (akademisches Selbstkonzept, Lernzielorientierung, Schulfreude) prädiktiv für (a) Mathematik- und Lesemotivation sowie (b) Mathematik- und Lesekompetenz? (3) Sind domänenspezifische Selbstwirksamkeitsüberzeugungen auch bei zusätzlicher Berücksichtigung der kognitiven Grundfähigkeiten neben motivationalen Merkmalen signifikante Prädiktoren für domänenspezifische Motivation und Kompetenz? (4) Gilt das Befundmuster gleichermaßen bei leistungsschwächeren wie bei leistungsstärkeren Schülergruppen? Aufgrund der expliziten Vermittlung von Mathematik im Rahmen des Mathematikunterrichts verbunden mit Leistungsrückmeldungen wird eine stärkere Relevanz der Selbstwirksamkeitsüberzeugungen für diesen Bereich als für die Lesekompetenz, die eher implizite Grundlage des Lernens in der weiterführenden Schule ist, erwartet. Darüber hinaus wird angenommen, dass die Selbstwirksamkeitsüberzeugungen auch bei Berücksichtigung anderer motivationaler Merkmale sowie der kognitiven Grundfähigkeiten bedeutsame Prädiktoren bleiben und dass das Ergebnismuster bei Schülergruppen an Hauptschulen (leistungsschwach) und Gymnasien (leistungsstark) vergleichbar ist. Es wurden die Daten von 1.307 Schülerinnen und Schülern der 7. Klassenstufe an Haupt- und Gesamtschulen sowie Gymnasien analysiert, die im Rahmen der Studie Se-Mig erhoben wurden (51.1% weiblich, M = 12.1 Jahre [SD = 0.6]). Die Kompetenztests wurden anhand von Aufgaben aus mehreren großen Studien (u.a. LAU, TIMSS) für die Zielgruppe zusammengestellt und skaliert (WLE-Scores). Die Mathematik- und Lesemotivation wurden als intrinsische Komponente angelehnt an Möller und Bonerad (2007) parallel formuliert erfasst. Ebenso wurden die Selbstwirksamkeitsüberzeugungen bezogen auf Mathematik- und Lesekompetenz parallel erhoben (angelehnt an Jerusalem & Satow, 1999). Akademisches Selbstkonzept, Lernzielorientierung und Schulfreude wurden ebenfalls mit reliablen Skalen gemessen. Zur Erfassung der kognitiven Grundfähigkeiten wurden zwei Subtests aus dem KFT 5-12+ R (Heller & Perleth, 2000) eingesetzt. Die Analysen in dem Programm Mplus 7.11 erfolgten (1) mit Strukturgleichungsmodellen und (2) Modellfitvergleichen bei Gleichsetzung von zu vergleichenden Pfaden. Aufgrund der Stichprobengröße konnten nur die Mathematik- und Lesemotivation latent modelliert werden. Die Ergebnisse zeigen zunächst, dass die Selbstwirksamkeitsüberzeugungen für Motivation im Bereich Mathematik stärker prädiktiv sind (β = .67) als für den Bereich Lesen (β = .42) und die Selbstwirksamkeit der jeweils anderen Domäne negativ prädiktiv sind. Für die Kompetenzen sind die jeweiligen Selbstwirksamkeitsüberzeugungen vergleichbar bedeutsam (β = .28 für Mathematik, β = .23 für Lesen). Das Befundmuster bleibt insgesamt auch bei Berücksichtigung der zusätzlichen motivationalen Bedingungen stabil, wobei sich die Prädiktionskraft deutlich reduziert, wenn in einem weiteren Schritt die kognitiven Grundfähigkeiten aufgenommen werden (χ2[106]= 456.087, p < .05, CFI = .96, RMSEA = .05; R2 zwischen .45 [Lesekompetenz] und .71 [Lesemotivation]). Das Befundmuster ist für leistungsschwächere überwiegend vergleichbar mit leistungsstärkeren Lernenden. Implikationen für Forschung und Praxis, insbesondere die Förderung der Selbstwirksamkeitsüberzeugungen, werden diskutiert. Zur relativen Bedeutsamkeit des Fähigkeitsselbstkonzeptes und der Intelligenz bei der Vorhersage von Testleistung und Schulnoten: Spielt die Domäne eine Rolle? Anja Meißner, Ricarda Steinmayr Technische Universität Dortmund Beim Fähigkeitsselbstkonzept handelt es sich um eines der zentralen Konstrukte in der empirischen Bildungsforschung, da es das Lern- und Leistungsverhalten der Schülerinnen und Schüler (SuS) wesentlich beeinflusst (z.B. Helmke & van Aken, 1995; s. Eccles & Wigfield, 2002). Verschiedene Studien zeigten, dass das Fähigkeitsselbstkonzept über bewährte kognitive Konstrukte wie die Intelligenz hinaus die Schulleistung vorhersagen konnte (z.B. Helmke, 1992; Steinmayr & Spinath, 2009). Fähigkeitsselbstkonzept und Intelligenz haben sich jedoch als interkorrelierte Prädiktoren schulischer Leistungen erwiesen (z.B. Steinmayr & Meißner, 2013). Um die Bedeutsamkeit des Fähigkeitsselbstkonzeptes für die Schulleistung einzuschätzen, sollte neben dem eigenständige Anteil auch der mit Intelligenz gemeinsam aufgeklärte Varianzanteil betrachten werden. Die Varianzanteile, die allein durch einen Prädiktor oder durch beide Prädiktoren gemeinsam in der Schulleistung aufgeklärt wurden, variieren jedoch erheblich zwischen Studien. Diese heterogene Befundlage könnte darauf zurückzuführen sein, dass in den Studien unterschiedliche Schulleistungsindikatoren (z.B. standardisierte Tests, Schulnoten) verwendet wurden. Bislang haben nur wenige Studien untersucht, ob sich die relative Bedeutsamkeit motivationaler und kognitiver Prädiktoren in Abhängigkeit vom Leistungsindikator unterscheidet (z.B. Helmke, 1992; Sauer & Gamsjäger, 1996; Steinmayr & Meißner, 2013). Für die Domäne Mathematik wurde gezeigt, dass Intelligenz der beste Prädiktor zur Vorhersage der Testleistung war, während Fähigkeitsselbstkonzept und Intelligenz einen vergleichbaren Beitrag zur Vorhersage der Noten leisteten (Helmke, 1992; Steinmayr & Meißner, 2013). Ein anderes Befundmuster zeigte sich jedoch für die Domäne Lesen (Meißner, McElvany & Steinmayr, 2015), sodass domänen-spezifische Effekte anzunehmen sind. Um Schlussfolgerungen über domänen-spezifische Effekte ziehen zu können, bedarf es Studien, die Fähigkeitsselbstkonzept und Intelligenz sowie verschiedene schulische Leistungsindikatoren in mehreren Domänen an einer Stichprobe untersuchen. Uns ist keine Studie bekannt, die diesem Anspruch gerecht wird. Aus diesem Grund soll in der vorliegenden Studie untersucht werden, ob sich die relative Bedeutsamkeit von Fähigkeitsselbstkonzept und Intelligenz in Abhängigkeit vom Schulleistungskriterium (Testleistung und Schulnoten) und der Domäne (Mathematik und Deutsch) unterscheidet. Es wurden N = 689 SuS (M = 13.3 Jahre, SD = 0.6, 366 Mädchen) der 8. Jahrgangsstufe von 4 Gymnasien und 4 Realschulen untersucht. Wir erfassten standardisiert die Mathematikleistung (TIMSS; Baumert et al., 1998) und die Deutschleistung (indiziert über die Leseleistung: LGVT 6-12 von Schneider, Schlagmüller & Ennemoser, 2007; und die Rechtschreibleistung: START-R von Kersting, in Vorbereitung) sowie die Zeugnisnoten in Mathematik und Deutsch (Schülerangabe) als Kriterien. Die domänenspezifischen Fähigkeitsselbstkonzepte (SESSKO; Schöne, Dickhäuser, Spinath & Stiensmeier-Pelster, 2002) und die Intelligenz (CFT 20-R; Weiß, 2006) wurden als Prädiktoren erfasst. Es wurde ein latentes Strukturgleichungsmodell berechnet und mittels latenter Mehr-Gruppenvergleiche geprüft, ob sich Unterschiede zwischen den Schulformen zeigen. Anschließend wurden Kommunalitätenanalysen (s. Pedhazur, 1997) berechnet. Die latenten Mehr-Gruppenvergleiche zeigten, dass Messinvarianz gegeben war und sich die Strukturbeziehungen zwischen den Schulformen nicht unterschieden. Folglich wurde das Strukturgleichungsmodell mit der Gesamtstichprobe berechnet. Im Rahmen der latenten multiplen Regressionsanalysen leisteten das domänen-spezifische Fähigkeitsselbstkonzept und die Intelligenz einen bedeutsamen Beitrag zur Vorhersage der Testleistung und der Schulnoten in Mathematik und Deutsch. Für die Domäne Mathematik erwies sich die Intelligenz als bester Prädiktor zur Vorhersage der Testleistung, während sich das domänenspezifische Fähigkeitsselbstkonzept als bester Prädiktor zur Vorhersage der Mathematiknote erwies. In Deutsch leisteten das domänen-spezifische Fähigkeitsselbstkonzept und die Intelligenz einen vergleichbaren Beitrag zur Vorhersage der Testleistung, während sich das domänen-spezifische Fähigkeitsselbstkonzept als bester Prädiktor zur Vorhersage der Deutschnote erwies. Ein bedeutsamer Anteil der Varianz im Mathematiktest und den Mathematiknoten wurde durch die Prädiktoren gemeinsam erklärt. Der Anteil gemeinsam erklärter Varianz im Deutschtest und den Deutschnoten fiel hingegen sehr gering aus. Die Ergebnisse sprechen dafür, dass sich die relative Bedeutsamkeit des Fähigkeitsselbstkonzepts in Abhängigkeit vom Leistungsindikator und der Domäne unterscheidet. Die Ergebnisse werden im Hinblick auf die differentielle Bedeutsamkeit des Fähigkeitsselbstkonzeptes in verschiedenen Leistungskontexten diskutiert. ID: 380 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Soziologie Thematisches Cluster: Berufliche Bildung, Hochschulbildung, Inklusion Stichworte: Promotionsphase; Postdocphase; soziale Herkunft; Verselbständigung; Forschungsprogramm Against the Odds? Akademische Verselbständigung im Kontext erwartbarer und erwartungswidriger Karriereverläufe in der Wissenschaft Chair(s): Susanne Maria Weber (Philipps-Universität Marburg) Diskutant(en): Kolja Briedis (DZHW) Die Karriereverläufe von NachwuchswissenschaftlerInnen sind untrennbar verknüpft mit ihren Bildungsverläufen; ‚Erfolg‘ lässt sich in dieser Doppelstruktur nicht allein über den Erwerb formaler Bildungsabschlüsse oder das Besetzen bestimmter beruflicher Positionen bestimmen, sondern kommt letztlich in der Fähigkeit zum Ausdruck, als eigenständige WissenschaftlerInnen wissenschaftliche Praxis mitgestalten zu können. Welche konkreten Lern- und Bildungsprozesse sich im Verlauf der einzelnen Qualifizierungs- und Karrierephasen aber vollziehen müssen, um in dieser Weise ‚erfolgreiche‘ Verläufe wissenschaftlicher Nachwuchskarrieren zu produzieren, ist nicht nur eine für die NachwuchswissenschaftlerInnen selbst sowie für etablierte WissenschaftlerInnen und für Wissenschaftsorganisationen drängende, sondern auch eine bildungs- und wissenschaftspolitisch viel diskutierte Frage. Wie wird also akademische Verselbständigung im Kontext erwartbarer und erwartungswidriger Verläufe wissenschaftlicher Nachwuchskarrieren hervorgebracht? Dieser Frage geht das hier vorgeschlagene Symposium nach, indem aktuelle empirische Forschungsergebnisse aus Projekten des BMBF-Programms „Forschung zum Wissenschaftlichen Nachwuchs“ diskutiert werden. Die einzelnen Beiträge nutzen unterschiedliche disziplinäre, theoretische und methodische Zugänge, um akademische Verselbständigung entlang des Prozessverlaufs akademischer Karrierewege zu rekonstruieren. Dieser Logik folgend nimmt das Symposium seinen Ausgangspunkt bei der Betrachtung von Bildungsverläufen „vom Abitur bis zur Promotion“ und der hierbei zu bewältigenden Übergänge – dabei zeigen Anna Bachsleitner, Michael Becker, Marko Neumann und Kai Maaz (DIPF), wie der Übergang in die Promotion von der sozialen Herkunft beeinflusst wird und wie Herkunftseffekte auf primäre und sekundäre Effekte zurückzuführen sind. Verselbständigungsprozesse in der Promotionsphase untersuchen die Beiträge von Anna Brake, Hannah Burger und Julia Elven (Universität Augsburg) sowie von Jörg Schwarz, Franziska Teichmann und Susanne Weber (Philipps-Universität Marburg), wobei erstere die habituellen Strukturen von NachwuchswissenschaftlerInnen und letztere die institutionalisierten Strukturen ihrer Arbeitszusammenhänge fokussieren. Schließlich kann als eine zentrale Leistung am Ende dieses Prozess der Verselbständigung von NachwuchswissenschaftlerInnen die Herausbildung eines selbständigen Forschungsprogramms stehen: Grit Laudel und Jana Bielick (TU Berlin) zeigen in ihrem Beitrag, unter welche Bedingungen die dafür notwendigen Lernprozesse stattfinden und zum Erfolg führen. Schließlich wird Kolja Briedis (DZHW) die Beiträge vor dem Hintergrund des Tagungsthemas diskutieren. Gemeinsam ist den im geplanten Symposium versammelten Beiträgen damit eine prozessuale Perspektive auf die Verselbständigung von NachwuchswissenschaftlerInnen – dabei helfen nicht nur die unterschiedlichen vertretenen disziplinären Perspektiven aus Erziehungswissenschaft und Soziologie, sondern auch die unterschiedlichen methodischen Zugänge quantitativer und qualitativer Provenienz, eine komplexe Rekonstruktion von Verselbständigung im Rahmen erwartbarer und erwartungswidriger Karriereverläufe in der Wissenschaft zu leisten. Beiträge des Symposiums Soziale Herkunftseffekte beim Übergang in die Promotion Anna Bachsleitner, Michael Becker, Marko Neumann, Kai Maaz DIPF Während der Einfluss der sozialen Herkunft für frühe Übergänge im Bildungssystem, vor allem für den Übertritt in die Sekundarstufe sowie ins Studium, vielfach nachgewiesen worden ist, finden sich zu späteren Bildungsübergängen, wie der Aufnahme einer Promotion, kaum Untersuchungen (Möller, 2013). Insbesondere mangelt es an Studien, die soziale Herkunftseffekte beim Promotionsübergang unter der Perspektive primärer und sekundärer Effekte betrachten. Die Unterscheidung in primäre und sekundäre Effekte geht zurück auf Boudon (1974), der Bildungsungleichheit als das Ergebnis von Unterschieden zwischen sozialen Schichten in Leistungen (primäre Effekte) und Bildungsentscheidungen (sekundäre Effekte) versteht. Nach Esser (1999) wägen Personen bei einer Bildungsentscheidung den Nutzen der weiterführenden Bildung, die Kosten, ihre subjektive Erfolgswahrscheinlichkeit und ihren potentiellen Statusverlust ab. Höhere soziale Schichten sollten sich eher für weiterführende Bildung entscheiden, da für sie ein hoher Bildungsabschluss notwendig zum sozialen Statuserhalt ist und sie eine höhere Erfolgswahrscheinlichkeit durch eine geringere Distanz zu hoher Bildung haben. Da es jedoch im Bildungsverlauf durch die verschiedenen Selektionsstufen sowie die zunehmende Unabhängigkeit vom Elternhaus zu einer Abnahme des Einflusses sozialer Herkunft kommen sollte (Blossfeld/Shavit, 1993), stellt sich die Frage, ob und in welchem Umfang die soziale Herkunft beim Übergang in die Promotion noch eine Rolle spielt. Bisherige Befunde zum Zusammenhang von sozialer Herkunft und Promotion basieren größtenteils auf Promovierendenbefragungen, die darauf hindeuten, dass Promovierende eine nach sozialer Herkunft selektive Gruppe darstellen (u.a. Enders/Bornmann, 2001). Vergleichende Untersuchungen für den Promotionsübergang zwischen Promovierenden und nichtpromovierenden Hochschulabsolventen gibt es jedoch bislang kaum. Jaksztat (2014) berichtet einen positiven Effekt der Bildungsherkunft auf den Promotionsübergang, der hauptsächlich auf Leistungsunterschiede, die Fachrichtungswahl und die Tätigkeit als studentische Hilfskraft zurückzuführen ist. Jedoch wurde bisher noch nicht explizit das Verhältnis primärer und sekundärer Effekte beim Promotionsübergang untersucht. Ausgehend von der noch lückenhaften Forschungslage soll in dieser Studie untersucht werden, inwieweit der Übergang in die Promotion von der sozialen Herkunft beeinflusst wird und wie sich ein potentieller Effekt erklären lässt. Dabei soll mit Hilfe einer Effektdekomposition auch ermittelt werden, welche Anteile des Herkunftseffektes auf primäre und sekundäre Effekte zurückzuführen ist. Die Untersuchung basiert auf den Daten der Längsschnittstudie BIJU (Bildungsverläufe und psychosoziale Entwicklung im Jugend- und jungen Erwachsenenalter), die die Bildungsverläufe von ehemaligen 7.-Klässlern bis zu Beginn ihres vierten Lebensjahrzehntes beinhaltet. Die Stichprobe umfasst 2.214 Hochschulabsolventen, 316 davon mit aufgenommener Promotion. Es wurden eine logistische Regression zur Vorhersage der Promotionsaufnahme und eine Effektdekomposition mit der Methode khb (Karlson/Holm/Breen, 2012) durchgeführt. Die soziale Herkunft wird durch die Bildungsherkunft, kategorisiert in Eltern ohne Hochschulabschluss, mindestens ein Elternteil mit Hochschulabschluss und mindestens ein Elternteil mit Promotion, operationalisiert. Zur Messung der primären Effekte werden Abitur- und Studiennote sowie die Ergebnisse standardisierter Leistungstests (kognitive Grundfähigkeiten, Englisch, Mathematik) als Prädiktoren verwendet. Zudem werden verschiedene Indikatoren zu Kosten-Nutzen-Abwägungen aus der Studienzeit einbezogen. Als Kontrollvariablen dienen das Geschlecht, die Studienfachgruppen und die Hochschulform. In den Ergebnissen zeigt sich, dass ein positiver Effekt eines höheren Bildungshintergrundes auf den Promotionsübergang nachweisbar ist. Dieser bleibt auch nach Kontrolle des Studienfaches und der Hochschulform für Hochschulabsolventen bestehen, von denen mindestens ein Elternteil selber promoviert hat. Bei Aufnahme der Leistungsparameter verliert der Herkunftseffekt an statistischer Signifikanz. Die Indikatoren der Kosten-Nutzen-Abwägung reduzieren ebenfalls den Effekt des Bildungshintergrundes, dieser bleibt jedoch weiterhin signifikant. Die Effektdekomposition zur Ermittlung des Verhältnisses von primären und sekundären Effekten deutet darauf hin, dass sekundäre Effekte von größerer Relevanz für den Promotionsübergang sind. Jedoch variiert das Verhältnis, je nachdem ob die Abschlussnoten oder die Leistungstests als Maße der primären Effekte verwendet werden. Habitus als Ermöglichungsstruktur von Verselbständigungsprozessen in wissenschaftli-chen Nachwuchskarrieren Anna Brake1, Hannah Burger2, Julia Elven2 1 Philipps-Universität Marburg, 2Universität Augsburg Autonomie gilt gleichermaßen als Ziel wie auch als Ausweis erfolgreicher wissenschaftlicher Laufbahnen. Die Befähigung zu einer eigenständigen wissenschaftlichen Praxis kann damit nicht nur als zentrales Ziel von Lern- und Sozialisationsprozessen in wissenschaftlichen Nachwuchskarrieren verstanden werden, sondern auch als erfolgskritische Voraussetzung für den weiteren Karriereverlauf. Doch obwohl dies so ist, liegen bisher wenige Erkenntnisse dazu vor, wie Selbständigkeit in den unterschiedlichen Phasen wissenschaftlicher Laufbahnen ermöglicht und in konkreten Arbeitszusammenhängen praktisch hervorgebracht wird. Aus praxistheoretischer Perspektive, in der wissenschaftliche Nachwuchskarrieren als Trajektorien in den Blick kommen, die im Zusammenspiel habitualisierter und institutionalisierter Strukturen hervorgebracht werden (Bourdieu 1987; 2002), wird deutlich, dass Prozesse der Verselbständigung erstens sehr voraussetzungsreich sind und zweitens sehr unterschiedlich verlaufen können. Mit Blick auf die akteursseitigen Voraussetzungen von Verselbständigung in wissenschaftlichen Nachwuchskarrieren kommt daher dem Konzept des Habitus eine zentrale Bedeutung zu. Als langfristig biographisch erworbenes, herkunfts- und laufbahnspezifisches Dispositionssystem bildet er die Grundlage für weitere Lern- und Sozialisationsprozesse in der Promotionsphase. Im Zusammenspiel mit den institutionalisierten Strukturen konkreter wissenschaftlicher Arbeitszusammenhänge sind die als Habitus verdichteten inkorporierten Denk-, Wahrnehmungs- und Handlungsstrukturen der NachwuchswissenschaftlerInnen an der Hervorbringung einer wissenschaftlichen Praxis beteiligt, in der Verselbstständigung erst ermöglicht, erleichtert oder auch begrenzt wird. Von dieser theoretischen Perspektive ausgehend fragen wir im vorgeschlagenen Beitrag danach, in welcher Weise habitualisierte Denk-, Wahrnehmungs- und Handlungsmuster für Verselbständigungsprozesse in der Promotionsphase wirksam werden, wie sie diese Prozesse in den konkreten wissenschaftlichen Arbeitszusammenhängen, in die die NachwuchswissenschaftlerInnen eingebunden sind, ermöglichen oder begrenzen, und in welcher Weise die daraus resultierenden Verselbständigungskonstellierungen für die weitere Trajektorie wirksam werden (können). Der Beitrag basiert auf Ergebnissen des Forschungsprojekts „Trajektorien im akademischen Feld – Habitus als Ermöglichungsstruktur wissenschaftlicher Nachwuchskarrieren“. Für das Projekt wurden 30 leitfadengestützte Interviews mit NachwuchswissenschaftlerInnen aus akademischen und nicht-akademischen Elternhäusern geführt, die in unterschiedlichen organisationalen Kontexten promoviert haben. Alle InterviewpartnerInnen hatten zum Zeitpunkt der Erhebung ihre Promotion eingereicht bzw. vor maximal sechs Monaten verteidigt und befanden sich damit in einer für ihre Karriereverläufe kritischen Übergangsphase. Etwa eineinhalb Jahre nach dem Erstinterview wird über eine telefonische Nachbefragung zusätzlich der weitere Karriereverlauf erhoben. Auf der Basis dieses Materials können unter Rückgriff auf die dokumentarische Methode (Bohnsack 2010; Nohl 2013) habituelle Orientierungen rekonstruiert werden, die Verselbständigungsprozesse in wissenschaftlichen Nachwuchskarrieren in je spezifischer Weise erleichtern oder limitieren. Dabei richtet sich die Analyse nicht nur darauf, in welchen thematischen Zusammenhängen die NachwuchswissenschaftlerInnen sich (explizit) mit Selbständigkeit auseinandersetzen. Aufschlussreich ist insbesondere auch, wie sie von ihrer bisherigen Laufbahn und ihrer wissenschaftlichen Alltagspraxis erzählen. Über den in der dokumentarischen Methode angelegten systematischen Vergleich lassen sich dabei Gemeinsamkeiten und Unterschiede entlang relevanter Strukturmerkmale – u.a. der sozialen Herkunft – rekonstruieren. In der Analyse des Interviewmaterials konnten dabei unterschiedliche Dimensionen herausgearbeitet werden, anhand derer sich Verselbständigungsprozesse in wissenschaftlichen Nachwuchskarrieren systematisieren und vergleichen lassen. Danach können diese sich beziehen auf: 1. die wissenschaftliche Alltagspraxis (z.B. das Schreiben von Artikeln oder Vorbereiten und Halten von Lehrveranstaltungen); 2. die Art und Weise, mit der die NachwuchswissenschaftlerInnen sich in ein (reflexives) Verhältnis zum wissenschaftlichen Feld setzen sowie die spezifischen Feldrekonstruktionen, die sich darin ausdrücken und 3. die soziale Einbindung der NachwuchswissenschaftlerInnen auf der Ebene der Arbeitsbeziehungen in den Arbeitsbereichen (Betreuer, Peers) sowie in darüber hinausgehende Netzwerke. Die bisherigen Analysen verdeutlichen, dass Verselbständigung sich in diesen Dimensionen auf der Ebene des Einzelfalls durchaus spannungsreich und widersprüchlich gestalten kann, sodass den (konvergenten, ambivalenten…) Relationen dieser Dimensionen eine besondere Bedeutung zukommt. Die Ergebnisse der vergleichenden Analyse entlang dieser Dimensionen und ihrer Relationen werden im Beitrag insbesondere mit Blick auf die Bedeutung diskutiert, die die herausgearbeiteten Verselbständigungskonstellierungen für die weiteren Trajektorien der NachwuchswissenschaftlerInnen haben (können). Institutionelle Strukturierung von Verselbständigungsprozessen im akademischen Feld Jörg Schwarz, Franziska Teichmann, Susanne Maria Weber Philipps-Universität Marburg Autonomie und Selbständigkeit von WissenschaftlerInnen werden diskutiert als Wert und wichtiger Bestandteil der akademischen Identität, die auf der Ebene individueller und disziplinär je spezifischer kollektiver Orientierungsmuster geformt und erhalten werden (Henkel 2005). Problematisiert wird aber auch ihr drohender Verlust im Zuge aktueller Politikstrategien, die Auswirkungen auf klassisch „autonome“ Orientierungsmuster von WissenschaftlerInnen haben. Diskutiert wird hier die heteronome Überformung im Kontext von Audit, Controlling und Fremdsteuerung der managerialen Universität (Clarke/Knights 2015). Autonomie wird weiterhin thematisiert als Anforderung der akademischen Profession und eines akademischen Selbstverständnisses. Aus dieser Perspektive bedarf akademische Autonomie der aktiven Weitergabe im Generationenverhältnis der Wissenschaft (Hamilton 2007). Die Freiheit von Forschung und Lehre, die kollektive Praxis der Selbstkontrolle in Peer Review sowie die akademische Selbstverwaltung fasst Hamilton (2007) als sozialen Kontrakt. Mit diesem gehe die Verantwortung einher, die Autonomie akademischer Professioneller an die nachfolgenden WissenschaftlerInnen-Generationen weiterzugeben, wenn man nicht die akademische Autonomie riskieren wolle. In der deutschsprachigen Diskussion finden wir „Autonomie“ als nachwuchspolitische Forderung, als Ausbildungsprojekt des wissenschaftlichen Nachwuchses, als erwartete „Selbstverständlichkeit“ oder auch als „empirische Leerstelle“. So findet sich die Ausbildung des wissenschaftlichen Nachwuchses in Qualifikationsrahmen und gestuften Qualifikationsschritten einer wissenschaftlichen Kompetenzentwicklung hin zur wissenschaftlichen Selbstständigkeit (vgl. BUWIN). Im Rahmen von Bildungsberichterstattung und Grundlagenforschung zum wissenschaftlichen Nachwuchs zielen empirische Studien auf die Erfassung von Autonomie als Praxis oder Desiderat (vgl. FOWIN). Die empirische Erhellung der konkreten Praxis wissenschaftlicher Verselbständigung in akademischen Arbeitszusammenhängen stellt jedoch eine weitgehende Forschungslücke dar. Um Verselbständigung in wissenschaftlichen Nachwuchskarrieren erhellen zu können, bedarf es der Analyse von Entwicklungskontexten, innerhalb derer sich die Entwicklung und Professionalisierung von NachwuchswissenschaftlerInnen vollzieht. Verselbständigung als Prozess des Zusammenwirkens habitualisierter und institutionalisierter Strukturen lenkt den Blick auf die alltäglichen Arbeitskontexte und die sich hier in sozialer Praxis aktualisierende Relevanz und Ausgestaltung von Selbständigkeit und Autonomie. Der Beitrag stellt für diese Fragestellung zentrale Ergebnisse des Projekts „Trajektorien im akademischen Feld – Institutionelle Ermöglichungskontexte wissenschaftlicher Nachwuchskarrieren“ vor. Aus einer praxeologischen Perspektive (Bourdieu 1993; Elven/Weber 2012) zeigen sich im akademischen Feld (resp. disziplinäre Felder oder Forschungsfelder etc.) als einer relationalen Ordnung von Akteuren unterschiedliche Praxismuster der Verselbständigung entlang durch soziale Ungleichheit strukturierter Orientierungsrahmen. Selbstständigkeit und Autonomie stellen zentrale Bezugspunkte akademischer Selbstverständnisse und Wertbezüge dar und gehören wesentlich zur „Illusio“ im akademischen und wissenschaftlichen Feld. Welche Vorstellungen von „guter Wissenschaft“, „guter Forschung“, „WissenschaftlerIn sein“ und Lebensführung aktualisieren sich bei der Auswahl und Verselbständigung von NachwuchswissenschaftlerInnen? Welche Ordnung von Praktiken (Bourdieu 2002; Weber 2012) der Autonomie und Verselbständigung lässt sich in der wissenschaftlichen Alltagspraxis auffinden? Es ist zu erwarten, dass sich an spezifischen Positionierungen im jeweiligen Forschungsfeld mit höherer Wahrscheinlichkeit spezifische Grundüberzeugungen von Wissenschaft, Strategien ihrer Realisierung und konkrete alltägliche Praktiken vorfinden lassen: Welche Perspektiven sehen die BetreuerInnen für „ihren“ „Nachwuchs“ und welche Strategien verfolgen sie für und mit ihnen? In ungleichheitstheoretischer Perspektive und mit Blick auf erwartungswidrigen Bildungserfolg wird die spezifische Lern- und Förderpraxis in der institutionellen Herstellung akademischer Nachwuchskarrieren wirksam für die Reproduktion oder Kreation von Pfaden (Schwarz/Teichmann/Weber 2015). In einer qualitativen Analyse wird mittels eines triangulativen (Brake 2010) Forschungssettings anhand von leitfadengestützten Interviews mit BetreuerInnen, Gruppendiskussionen mit den Peers und Dokumentenanalysen die institutionelle Praxis von Universität, außeruniversitärer Forschungseinrichtung bzw. Graduiertenkolleg untersucht. Die Analyse der drei Dimensionen BetreuerIn, Peers und Organisation wird das Forschungsmaterial angelehnt an die dokumentarischen Methode (Bohnsack 2010) rekonstruktiv erschlossen. Der Beitrag zeigt auf, wie soziale Ungleichheit wirksam wird in den Strategien der Verselbständigung im Zusammenspiel von BetreuerInnen und Peers sowie Organisationen. In den Identifikationen, in spezifischen Mustern der Führung und Steuerung in Arbeitszusammenhängen sowie den institutionellen Strategien entstehen spezifische Settings und spezifische räumliche und zeitliche Arrangements der Verselbständigung. Im Zusammenwirken institutioneller mit habituellen Orientierungsmustern lassen sich so Passungsverhältnisse und Karriereperspektiven des akademischen Nachwuchses im Sinne erwartbarer und erwartungswidriger Karriereverläufe rekonstruieren. Wann haben NachwuchswissenschaftlerInnen „ausgelernt“? Fachgebietsspezifische Bedingungen für die Entstehung der ersten individuellen Forschungsprogramme Grit Laudel, Jana Bielick TU Berlin NachwuchswissenschaftlerInnen gewinnen in einem längeren Prozess den Status unabhängiger ForscherInnen, der den Erwartungen ihrer Scientific Communities entspricht (Puljak/Sharif 2009). Dieser Prozess endet nicht mit dem Erlangen eines formalen Status‘ (Promotion, Habilitation oder Professur), sondern mit der Entwicklung des ersten eigenständigen individuellen Forschungsprogramms. Damit dies gelingt, müssen die NachwuchswissenschaftlerInnen lernen, aussichtsreiche mittelfristige Forschungsvorhaben zu formulieren, und sich die zu deren Bearbeitung erforderlichen Methoden aneignen. Diese Lernprozesse dauern auch nach der Promotion an und vollziehen sich unter Bedingungen zunehmend unsicherer Karrierephasen. Insbesondere ist weltweit eine wachsende Länge der Sequenzen befristeter Beschäftigung als Postdoc beobachtet worden (Stephan/Levin 2001; Åkerlind 2005; Lam/de Campos 2014), was zu der Hypothese geführt hat, dass die Lernphase zu einem „holding pattern“ (NRC 2005: 4) wird, in dem Postdocs auf unbefristete Stellen warten. Die Auswirkungen solcher Veränderungen auf die Entwicklung individueller Forschungsprogramme durch NachwuchswissenschaftlerInnen sind bislang nicht bekannt. In unserem Beitrag wollen wir aufklären, wovon abhängt, dass manche NachwuchswissenschaftlerInnen erfolgreich individuelle Forschungsprogramme entwickeln, andere dagegen nicht. Es soll gezeigt werden, welche Bedingungen gegeben sein müssen, damit die genannten Lernprozesse stattfinden können und zum Erfolg führen. Die theoretische Grundlage der Untersuchung bildet ein an Heuristiken der Chicago School anschließender weiter Karrierebegriff, der Karrieren als Sequenzen rollenbezogener Erfahrungen versteht (Barley 1989) und die systematische Einbeziehung des Inhalts der Arbeit (Barley/Kunda 2001). Auf diesen Grundlagen lässt sich ein theoretisches Modell entwickeln, dass die Karrieren von ForscherInnen analytisch in drei miteinander verschränkte parallele Karrieren auflöst, und zwar eine kognitive Karriere, eine Reputationskarriere in der Scientific Community und eine Organisationskarriere (Laudel/Gläser 2008). Ein individuelles Forschungsprogramm (IFP) ist ein Skript der kognitiven Karriere, in dem die Realisierung eines über das einzelne Projekt hinausgehenden Erkenntnisinteresses angelegt ist (Laudel/Bielick 2015). Anhand von vergleichenden Fallstudien in drei Fachgebieten (Pflanzenbiologie, Geschichte der Frühen Neuzeit, experimentelle Atom- und Molekularphysik) untersuchen wir die Situationen von NachwuchswissenschaftlerInnen, die typische Stellen des deutschen Karrieresystems innehaben (Postdoc, Assistent, Juniorprofessur, Gruppenleiter, Fellowship). Dazu führen wir Experteninterviews mit den NachwuchswissenschaftlerInnen durch (30 pro Fachgebiet), die durch strukturbibliometrische Methoden unterstützt werden (Gläser/Laudel 2015). Die Interviews werden mit qualitativer Inhaltsanalyse analysiert, indem für die Fragestellung relevante Informationen unter theoretisch und empirisch bestimmte Kategorien subsumiert (Gläser/Laudel 2013) werden. Unsere bisherigen Ergebnisse zeigen, dass nicht alle NachwuchswissenschaftlerInnen IFP entwickeln können. Außerdem variieren die Zeiträume, in denen IFP entwickelt wurden, erheblich. Diese Varianz konnte nicht mit der Organisationskarriere formalen Eigenschaften von Stellen (wie Autonomie oder Befristungsdauer) oder deren Abfolge – erklärt werden. So haben NachwuchswissenschaftlerInnen auf Postdoc-Positionen in der Biologie und der Physik in einigen Fällen ein IFP vorbereitet, in anderen Fällen dagegen lediglich das IFP des Gruppenleiters unterstützt. Die Unterschiede lassen sich jedoch aufklären, wenn man die durch die jeweiligen Stellen im Einzelfall geschaffenen Bedingungen analysiert. Folgende Mechanismen konnten bisher gefunden werden: 1. Die durch die Stelle eines Wissenschaftlers geschaffenen formalen Bedingungen werden stark überformt durch die tatsächlichen Autoritätsbeziehungen in Forschungsgruppen. Postdocs sind stets formal von ihren Gruppenleitern abhängig, die ihnen jedoch Autonomie und Ressourcen für eigene Forschungspläne gewähren können. 2. Die gezielte Auswahl von Postdoc-Stellen ermöglicht das Erlernen neuer Methoden. Eine solche Selektion setzt voraus, dass Postdoc-Stellen in allen Spezialgebieten eines Faches reichlich vorhanden sind. 3. Lernprozesse waren seltener, wenn Wissenschaftler als Quelle von Wissen eingestellt wurden, d.h. weil sie eine für die Forschungen des Gruppenleiters relevante Methode beherrschten. 4. Fachspezifische Unterschiede in der Entstehung von IFP hängen mit der Natur der Lernprozesse zusammen. In den beiden naturwissenschaftlichen Fächern liegt der Schwerpunkt wegen der großen Methodendynamik auf dem Erlernen von Methoden; die Formulierung von Forschungsproblemen wird durch Beobachtung in der Gruppe erlernt. In den Geschichtswissenschaften spielt das Erlernen von Methoden eine sehr viel geringere Rolle, da die Dynamik der Methoden geringer ist. ID: 382 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Didaktik Fremdsprachen, Lehrerbildung Thematisches Cluster: Fremdsprachenunterricht, Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung Stichworte: fachdidaktisches Wissen, professionelle Kompetenz von Lehrkräften, Fremdsprachenlehrer, Lerngelegenheiten, Lehrerausbildung Fertig ausgebildet? Professionelle Kompetenzen angehender Englischlehrkräfte auf dem Prüfstand Chair(s): Johannes König (Universität zu Köln) Diskutant(en): Gabriele Kaiser (Universität Hamburg) Theoretisch-konzeptionelle Arbeiten (im Überblick zuletzt Depaepe et al., 2013) und empirische Untersuchungen (u.a. Hill et al., 2005; Baumert et al., 2010) unterstreichen die besondere Bedeutung des fachdidaktischen Wissens von Lehrpersonen (pedagogical content knowledge, PCK) für die Lernfortschritte ihrer Schüler. Während für die Domäne der Mathematik mittlerweile verschiedene Studien zur standardisierten Erfassung vorliegen, fehlt noch weitgehend entsprechende Forschung für sprachliche Fächer. So stehen auch Arbeiten für das Fach Englisch als Fremdsprache noch sehr am Anfang (Nold, 2013). Dies ist insofern erstaunlich, als dass Englisch im hiesigen Schulsystem ebenfalls Kernfach ist und im Zuge der Globalisierung als Basiskompetenz von Heranwachsenden an Bedeutung gewinnt. An dieser Problemlage setzt das geplante Symposium an. Im Rahmen des interdisziplinären und DFG-geförderten Projekts PKE („Professionelle Kompetenz von Englischlehrkräften: Fachdidaktisches Wissen angehender Englischlehrkräfte - Konzeption, Messung, Validierung“, KO3947/6-1) wurden im Sommer 2015 angehende Englischlehrkräfte für die Sekundarstufe (Lehrämter Gymnasium und Haupt-/Realschule) aus erster und zweiter Ausbildungsphase in Nordrhein-Westfalen (NRW) zu ihrem fachlichen, fachdidaktischen und pädagogischen Wissen mithilfe von standardisierten Papier-Bleistift-Tests getestet. Ferner nahmen sie an einer sprachpraktischen Testung teil und wurden ausführlich zu den Lerngelegenheiten ihrer bislang durchlaufenen Ausbildung sowie individuellen Merkmalen befragt. Für die zweite Ausbildungsphase liegt eine repräsentative Stichprobe angehender Lehrkräfte im letzten Jahr ihrer Ausbildung vor, sodass belastbare Aussagen zum erreichten Stand am Ende der Lehrerausbildung (bezogen auf NRW) getroffen werden können. In den Beiträgen des Symposiums werden zentrale Ergebnisse zur professionellen Kompetenz und zu Lerngelegenheiten der angehenden Englischlehrkräfte berichtet, wobei ein fachdidaktischer Fokus eingenommen wird. Im Rahmen von Beitrag (1) von Johannes König u.a. wird zunächst das Design der PKE-Studie überblicksartig vorgestellt, dann auf die Testung von fachdidaktischem Wissen angehender Lehrkräfte eingegangen. Ergebnisse aus binnenstrukturierenden Analysen zur Konstruktvalidität des verwendeten PCK-Tests und deskriptive Ergebnisse zum Abschneiden der angehenden Lehrkräfte am Ende ihrer Ausbildung werden berichtet. Im Anschluss fokussiert Beitrag (2) von Sarah Strauß u.a. auf Validierungsanalysen des getesteten fachdidaktischen Wissens mit Außenkriterien (kognitive und motivational-affektive Maße professioneller Kompetenz). Beitrag (3) von Sandra Lammerding u.a. stellt die Konzeption und Erfassung von fachdidaktischen Lerngelegenheiten im Rahmen der PKE-Studie vor. Berichtet wird die strukturelle Überprüfung des verwendeten Erhebungsinventars sowie deskriptive Befunde aus Selbstberichten der angehenden Lehrkräfte. In Beitrag (4) von Sarantis Tachtsoglou schließlich wird in Regressionsanalysen der Einfluss von Lerngelegenheiten auf das fachdidaktische Wissen modelliert. Das Symposium wird abgerundet durch die reflektierte Einordnung der Studie und ihrer Untersuchungsergebnisse in den Stand aktueller Forschung zur (fachbezogenen) professionellen Kompetenz von Lehrkräften durch die Diskutantin Gabriele Kaiser. Beiträge des Symposiums Modellierung und Erfassung des pedagogical content knowledge (PCK) angehender Englischlehrkräfte Johannes König1, Günter Nold2, Andreas Rohde1, Sandra Lammerding1, Sarah Strauß1, Sarantis Tachtsoglou1 1 Universität zu Köln, 2Technische Universität Dortmund Theoretischer Hintergrund: Das fachdidaktische Wissen (pedagogical content knowledge, PCK) gilt als zentrale kognitive Komponente der professionellen Lehrerkompetenz. Bisherige Ansätze zur Konzeptualisierung und Messung fokussieren auf Mathematik als Unterrichtsfach (Hill et al., 2005; Baumert et al., 2010; Blömeke et al., 2010). Entsprechende Arbeiten für das Fach Englisch als Fremdsprache stehen dagegen noch sehr am Anfang (Nold, 2013). Angesichts der Bedeutung von Englisch als gleichwertiges Kernfach im Schulsystem sowie seiner wachsenden Bedeutung im Kontext der Globalisierung, z.B. hinsichtlich individueller Mehrsprachigkeit und in seiner Funktion als Lingua Franca, sollten die theoretischen Diskurse zu Positionen und Konzepten der Fremdsprachenlehrerausbildung auch in der Domäne Englisch als Fremdsprache durch empirische Forschung gestützt werden. Diesem Forschungsanliegen begegnet die interdisziplinäre und DFG-geförderte Studie PKE („Professionelle Kompetenz von Englischlehrkräften: Fachdidaktisches Wissen angehender Englischlehrkräfte - Konzeption, Messung, Validierung“, KO3947/6-1). Ziel dieses ersten Beitrages des Symposiums ist es, das Studiendesign überblicksartig vorzustellen und daraufhin die Testung fachdidaktischen Wissens angehender Englischlehrkräfte als das Kernstück der PKE-Studie sowie zentrale empirische Befunde zu präsentieren. Die Konzeptualisierung und Operationalisierung des PCK in der PKE-Studie schließt an Arbeiten in anderen Domänen (z.B. Mathematik) und an den internationalen Diskurs zu Lehrerwissen, -expertise und -kompetenzen an. Eine Testdesignmatrix sieht einerseits drei inhaltliche Dimensionen vor (knowledge of curriculum, knowledge of teaching strategies and representations, knowledge of students), andererseits drei Dimensionen kognitiver Anforderungen (recall, analyze, create). Fragestellung: Die PKE-Studie geht der übergreifenden Frage nach, wie sich das PCK von angehenden Englischlehrkräften modellieren und erfassen lässt. Grundsätzlich wird eine homogene Fähigkeitsstruktur vermutet, sodass ein PCK-Gesamtscore berichtet werden kann. Angesichts einer vermuteten Abhängigkeit des PCK von spezifischen Lerngelegenheiten in der Lehrerausbildung prüfen wir Hypothesen wie die folgenden: H1: Wir erwarten Messinvarianz des Tests für angehende Lehrkräfte der ersten und zweiten Phase, jedoch sollten Referendare angesichts erweiterter Lerngelegenheiten besser abschneiden als Studierende. H2: Eine Prüfung der Binnenstruktur des Tests sollte die inhaltlichen Dimensionen sowie die Dimensionen kognitiver Anforderungen ausweisen. Methode: Im Sommer 2015 wurden angehende Englischlehrkräfte für die Sekundarstufe (Lehrämter Gymnasium und Haupt-/Realschule) aus erster (216 Master-Studierende von 11 Universitäten) und zweiter Phase (228 Referendare von 11 ZfsLs) in NRW rekrutiert. Die Referendar-Stichprobe wurde zufällig gezogen (Lehramt Gymnasium) bzw. als Vollerhebung durchgeführt (Lehramt Haupt/Realschule). Der institutionelle Rücklauf (ZfsL) beträgt 100%, bei Referendaren 78%. Damit entspricht die Stichprobe internationalen Standards (Tatto, 2013), sie ist repräsentativ für eine Population von 544 angehenden Englischlehrkräften der zweiten Phase. Der Rücklauf der MA-Studierenden-Stichprobe beträgt auf Institutionsebene 92%, fehlende Populationsstatistiken lassen eine präzise Abschätzung des Rücklaufs auf Individualebene aber nicht zu. Als Instrumente wurden drei paper-pencil Tests zur Erfassung von fachlichem, fachdidaktischen, pädagogischem Wissen sowie ein Sprachtest eingesetzt, ferner wurden Lerngelegenheiten, demographische sowie motivational-affektive Merkmale erfragt. Alle Erhebungen fanden zuerst in Ausbildungsseminaren statt und wurden aus Zeitgründen fortgesetzt als Online-Survey (Rücklauf > 70% der in Seminaren einbezogenen Probanden). Der PCK-Test umfasst 36 Items, die sich gleichmäßig über die 3x3-Matrix von Inhaltsdimensionen und kognitiven Anforderungen verteilen (jeweils 18 geschlossene/offene Items). Neun Testitems wurden aus der TEDS-LT-Studie übernommen (Jansing et al., 2013), die meisten Items jedoch im Rahmen der PKE-Studie in einem aufwändigen Verfahren neu entwickelt. Ergebnisse: In einer eindimensionalen IRT-Skalierung unter Einschluss von 33 der 36 Items erweist sich der PCK-Test als reliabel (EAPReliabilität, Cronbach’s Alpha jew. ≥ .70), Item-Diskriminationswerte liegen im Durchschnitt bei ≥ .3.; Messinvarianz für die zwei phasenbezogenen Stichproben lässt sich in vergleichenden Skalierungsanalysen belegen. Eine Regressionsanalyse des PCK mit der Ausbildungsphase als Prädiktor weist ein signifikant und praktisch bedeutsam besseres Abschneiden der Referendare gegenüber den Studierenden aus (curriculare Validität). Eine Prüfung der mehrdimensionalen Teststruktur belegt insbesondere die Konstruktvalidität für die Dimensionen kognitiver Anforderungen (ein dreidimensionales Skalierungsmodell mithilfe der Software Conquest gelangt zu einer signifikant besseren Anpassung an die Daten als das eindimensionale Modell). Validierung des pedagogical content knowledge (PCK) angehender Englischlehrkräfte Sarah Strauß1, Johannes König1, Günter Nold2 1 Universität zu Köln, 2Technische Universität Dortmund Theoretischer Hintergrund: In der aktuellen Forschung zur professionellen Kompetenz von Lehrkräften haben sich modellhafte Vorstellungen durchgesetzt, die zwischen kognitiven und motivational-affektiven Bereichen unterscheiden (Baumert & Kunter, 2006; Blömeke et al., 2010). Professionelles Wissen von Lehrkräften wird in Anlehnung an die Arbeiten von Shulman (1987) in fachliches, fachdidaktisches und pädagogisches Wissen untergliedert (Baumert et al., 2010; Tatto et al., 2012). Hinzu kommen personale Merkmale im Bereich der berufsbezogenen Überzeugungen, motivationalen Orientierungen und Selbstregulation. Für die Zielgruppe angehender Englischlehrkräfte fehlen bislang Arbeiten, die die verschiedenen Elemente professioneller Kompetenz fachspezifisch konkretisieren und auf Zusammenhänge empirisch prüfen. In diesem Forschungskontext verfolgt der Beitrag das Ziel, Zusammenhänge zwischen dem im Rahmen der PKE-Studie erfassten fachdidaktischen Wissen (pedagogical content knowledge, PCK) angehender Englischlehrkräfte mit weiteren zentralen Merkmalen ihrer professionellen Kompetenz zu prüfen, um letztlich Aussagen zur Validität des neu entwickelten PCK-Tests treffen zu können. Fragestellung: Bearbeitet wird die übergreifende Fragestellung, ob sich spezifische Zusammenhänge in erwarteter Richtung (positiv oder negativ) sowie in einer jeweils erwarteten Höhe zwischen dem PCK und weiteren kognitiven sowie motivational-affektiven Maßen der angehenden Englischlehrkräfte zeigen. Dabei untersuchen wir Hypothesen wie die folgenden: H1: Im kognitiven Bereich erwarten wir positive Zusammenhänge in jeweils mittlerer Höhe zu ihrem fachlichen Wissen in Literaturwissenschaft und Linguistik, zu ihrem pädagogischen Wissen und zu Ergebnissen aus einem sprachpraktischen Test. H2: In Ergänzung zu H1 sollte, im Sinne einer diskriminanten Validität, das PCK höher mit dem pädagogischen Wissen korreliert sein als die Korrelation zwischen pädagogischem und fachlichem Wissen (vgl. die „Amalgam-Hypothese“ von Shulman, 1987, S. 8, der zufolge PCK „that special amalgam of content and pedagogy“ sei). H3: Wir erwarten positive Korrelationen zwischen PCK und motivationalen Variablen (Enthusiasmus) und zur Selbstregulation (Selbstwirksamkeit) sowie konstruktivistischen Überzeugungen zum Lehrern und Lernen, jedoch negative zur Transmissionsorientierung. Methode: Verwendet wird die Stichprobe von 228 Referendarinnen und Referendaren mit Fach Englisch für die Sekundarstufe (Lehramt Gymnasium, Lehramt Haupt-/Realschule) im letzten Jahr ihrer Ausbildung in Nordrhein-Westfalen. Die im Sommer 2015 erhobene Zufallsstichprobe weist eine sehr gute Rücklaufquote auf (Ebene der Institutionen 100%, Ebene der Referendare 78%) und ist repräsentativ für die zugrunde liegende Population von 544 angehenden Sekundarstufenlehrkräften für das Fach Englisch in NRW. In Ausbildungsseminaren sowie im Rahmen eines ergänzenden Online-Surveys (Rücklauf > 70%) wurden Tests zur Erfassung des professionellen Wissens (fachliches, fachdidaktisches, pädagogisches) eingesetzt. Während der PCK-Test im Wesentlichen neu entwickelt wurde (vgl. den ersten Beitrag dieses Symposiums), wurde das Fachwissen mit Tests aus TEDS-LT (Roters et al., 2011) sowie pädagogisches Wissen mit dem TEDS-M-Instrument (König et al., 2011) erfasst. Als Sprachtest wurde der Cambridge English Placement Test (CPT) von Cambridge English Language Assessment (der University of Cambridge) eingesetzt. Für die Erfassung der motivational-affektiven Merkmale Enthusiasmus, Selbstwirksamkeit und Überzeugungen zum Lehren und Lernen wurden u.a. Instrumente aus der COACTIV-Studie (Baumert et al., 2008) zugrunde gelegt, jedoch auf das Fach Englisch angepasst. Ergebnisse: Die Ergebnisdarstellung gliedert sich in zwei Schritte: Zunächst werden für die einbezogenen Konstrukte jeweils deskriptive Befunde zum „Erreichen“ der Leistungen bzw. „Vorliegen“ entsprechender motivational-affektiver Merkmale bei angehenden Englischlehrkräften am Ende ihrer Ausbildung berichtet. Daraufhin werden in interkorrelativen Analysen mithilfe der Software Mplus (Muthén & Muthén, 1998-2010) die Zusammenhänge schrittweise sowie gesamthaft geprüft, wobei die Cluster-Struktur der Stichprobe (Referendare in Ausbildungsseminaren in Regierungsbezirken) Rechnung getragen wird, um korrekte Teststatistiken und Standardfehler zu erhalten. Zum Zeitpunkt des Einreichens des vorliegenden Abstracts waren diese Analysen noch nicht vollständig abgeschlossen. Erste Befunde zeigen aber, dass sich unsere genannten Hypothesen weitgehend bestätigen lassen. So korreliert beispielsweise das PCK mit dem pädagogischen Wissen bei .50 und der Enthusiasmus für das Unterrichten von Englisch korreliert positiv mit dem PCK. Auch für die Zusammenhänge zwischen dem PCK und den transmissionsorientierten und konstruktivistischen Überzeugungen zeigen sich Korrelationen in erwarteter Richtung. Modellierung und Erfassung von Lerngelegenheiten angehender Englischlehrkräfte Sandra Lammerding, Johannes König Universität zu Köln Theoretischer Hintergrund: In der Wirksamkeitsforschung zur Lehrerbildung ist die Annahme zentral, dass der Erwerb professioneller Kompetenz von angehenden Lehrkräften beeinflusst wird durch das Angebot und die Nutzung von Lerngelegenheiten des jeweiligen Ausbildungsprogramms (u.a. Tatto et al., 2008; Blömeke et al., 2010; König & Seifert, 2012). Die Erfassung von Lerngelegenheiten (engl. opportunities to learn – OTL) ist daher auch bei der Untersuchung der professionellen Kompetenz angehender Englischlehrkräfte bedeutsam. Allerdings ist die Forschungslage bislang dünn, sodass im Rahmen der PKE-Studie, aufbauend auf angrenzenden Vorarbeiten (Stancel-Piatak et al., 2013; Darge et al., 2012; König et al., 2014), eine Konzeptualisierung von Lerngelegenheiten sowie eine Operationalisierung zur Erfassung über Befragungen der angehenden Lehrkräfte entwickelt wurde. Der Beitrag stellt das Konzept vor, welches zentrale Aspekte der fachdidaktischen Ausbildung in Vorlesungen und Seminaren sowie der schulpraktischen, auf das Unterrichten von Englisch bezogenen Lerngelegenheiten umfasst. Ausbildungsinhalte wurden in sieben Bereiche (u.a. Sprachdidaktik/Spracherwerb, Literaturdidaktik, Methodik des Englischunterrichts, fachdidaktische Bildungsforschung), lernprozessbezogene Tätigkeiten in schulpraktischen Settings wurden in fünf Bereiche unterteilt (u.a. Planung und Durchführung von Englischunterricht, Aspekte forschenden Lernens); ferner wurde die Theorie-Praxis-Kohärenz der Ausbildung und die mentorielle Unterstützung in der Schulpraxis erfragt. Fragestellung: Zwei Fragestellungen werden bearbeitet: Zunächst wird die Strukturierung der Lerngelegenheiten in Ausbildungsinhalte, praktische Tätigkeiten, Kohärenz und mentorielle Unterstützung analysiert. Leitend ist dabei die Hypothese (H1), dass entsprechend unserer modellhaften Vorstellungen sich die unterschiedenen Komponenten voneinander empirisch trennen lassen. In einem zweiten Schritt werden deskriptive Befunde zu Lerngelegenheiten angehender Englischlehrkräfte im letzten Jahr ihrer Ausbildung berichtet. Dabei untersuchen wir Hypothesen wie die folgenden: Unter den Ausbildungsinhalten wird fachdidaktische Forschung weniger fokussiert als die Methodik des Englischunterrichts (H2a); Innerhalb der Ausbildungsinhalte erhält die Sprachdidaktik die größte Bedeutung (H2b); innerhalb lernprozessbezogener Tätigkeiten in der Schulpraxis ist das forschende Lernen weniger ausgeprägt als Bereiche von Unterrichtsplanung und -durchführung (H2c). Methode: Grundlage bildet die repräsentative Stichprobe der PKE-Studie (detailliert: vorhergehende Symposiumsbeiträge) von 228 angehenden Englischlehrkräften (Lehrämter Gymnasium und Haupt-/Realschule) im letzten Jahr ihrer Ausbildung in NordrheinWestfalen (zugrunde liegende Population: 544 angehende Englischlehrkräfte). Die verwendeten Skalen zur Erfassung von Inhalten (7) des Studiums sowie im schulpraktischen Setting die praktischen Tätigkeiten (5), Kohärenz (1) und mentorielle Unterstützung (1) wurden in einem aufwändigen Verfahren im Rahmen der PKE-Studie entwickelt. Für die Konzeptualisierung der Inhaltsskalen wurden eine Analyse zentraler Lehrwerke sowie ein umfassendes Expertenreview durchgeführt (Lammerding & König, 2015), um curriculare Validität zu sichern. Über 86 Items werden diverse Inhaltsaspekte der fachdidaktischen Ausbildung erfragt, ob diese studiert wurden oder nicht (ja=1/nein=0). Analog wurde die Durchführung praktischer Tätigkeiten über 99 Items erfragt (ja=1/nein=0). Kohärenz wird über fünf, mentorielle Unterstützung über vier Items erfasst (vierstufiges Antwortformat). Ergebnisse: Die Reliabilitäten der gebildeten 14 Skalen sind akzeptabel bis gut (zwischen .60 und .92). Eine konfirmatorische Faktorenanalyse zur Prüfung der dimensionalen Struktur in vier latente Variablen (Inhalte, Tätigkeiten, Kohärenz, Mentoring), gemessen über manifeste Skalen (Inhalte, Tätigkeiten) bzw. manifeste Einzel-Items (Kohärenz, Mentoring) bestätigt die Unterteilung der Lerngelegenheiten in die verschiedenen Aspekte (χ2/df=1.8; CFI=.917; RMSEA=.057). Die Interkorrelationen sind relativ niedrig, lediglich Inhalte und Tätigkeiten sind etwas höher korreliert. Dagegen gelangt eine Faktorenanalyse mit einem allgemeinen Faktor für sämtliche Lerngelegenheiten zu einem schlechten Modell-Fit (χ2/df=.6; CFI=.472; RMSEA=.142). Insgesamt verweisen die Ergebnisse auf eine strukturelle Trennung der OTL-Bereiche. Deskriptive Ergebnisse für die Skalen der Ausbildungsinhalte zeigen, dass wie angenommen die fachdidaktische Forschung (12 Items, Skalenwerte: M=.44, SE=.01) weniger verbreitet ist als die Methodik des Englischunterrichts (13 Items, Skalenwerte: M=.65, SE=.01). Die Sprachdidaktik ist der wichtigste Inhaltsbereich (24 Items, Skalenwerte: M=.71, SE=.01). Bezüglich der praktischen Tätigkeiten kann aufgezeigt werden, dass forschungsmethodische Zugänge eine geringere Rolle spielen (9 Items, Skalenwerte: M=.32, SE=.01) als die Planung (19 Items, Skalenwerte: M=.86, SE=.004) und Durchführung (28 Items, Skalenwerte: M=.87, SE=.004) von Unterricht. Implikationen für die Fremdsprachencurricula werden diskutiert. Die Bedeutung von Lerngelegenheiten für das pedagogical content knowledge (PCK) angehender Englischlehrkräfte Sarantis Tachtsoglou, Johannes König, Sandra Lammerding Universität zu Köln Theoretischer Hintergrund: Eine drängende Frage der aktuellen Lehrerbildungsforschung ist, inwieweit der Erwerb professioneller Kompetenz von angehenden Lehrkräften durch Lerngelegenheiten unterstützt wird, die sie im Rahmen ihrer Ausbildung durchlaufen (u.a. Tatto et al., 2008; Blömeke et al., 2010; König & Seifert, 2012). Aufbauend auf dem vorherigen Beitrag dieses Symposiums zur Erfassung von Lerngelegenheiten (engl. opportunities to learn – OTL) zielt der vorliegende Beitrag auf die Analyse von Zusammenhängen zwischen den Lerngelegenheiten und dem erreichtem fachdidaktischen Wissen (PCK) angehender Englischlehrkräfte im letzten Jahr ihrer Ausbildung. Hierzu ist der Forschungsstand generell (vgl. Blömeke & König, 2011) wie auch in Bezug auf die Fremdsprachenlehrerausbildung (Blömeke et al., 2013) dünn. Analysen zur Ausbildung von Mathematiklehrkräften oder von Lehrkräften allgemein zeigen jedoch, dass sowohl Ausbildungsinhalte sowie lernprozessbezogene Tätigkeiten in der Schulpraxis den Erwerb professionellen Wissens beeinflussen können (zuletzt u.a. Blömeke et al., 2012; König & Klemenz, 2015). Entsprechende Ergebnisse können wichtige Einblicke in die Effektivität von Curricula sowie Implikationen für die zukünftige Gestaltung von Lerngelegenheiten in der Lehrerbildung liefern (vgl. Tatto et al., 2008). Fragestellung: Bearbeitet wird die Frage, welche der erfassten Lerngelegenheiten die Testleistungen der angehenden Lehrkräfte im PCK erklären können. Hierzu prüfen Hypothesen wie die folgenden: H1: In Bezug auf die fachdidaktischen Inhalte vermuten wir Zusammenhänge in mittlerer Höhe für Inhaltsskalen, die besonders gut mit dem verwendeten Konzept des PCK-Tests übereinstimmen, insbesondere Sprachdidaktik/Spracherwerb, Methodik des Englischunterrichts und Curriculum und Assessment/Beurteilung. H2: In Bezug auf schulpraktische Tätigkeiten erwarten wir Zusammenhänge in mittlere Höhe für unterrichtsnahes Handeln wie die Planung und Durchführung von Unterricht. Methode: Datengrundlage bildet die repräsentative Stichprobe von 228 Referendarinnen und Referendaren mit Fach Englisch für die Sekundarstufe im letzten Jahr ihrer Ausbildung in Nordrhein-Westfalen, die im Rahmen der PKE-Studie im Sommer 2015 u.a. zu ihrem fachdidaktischen Wissen (PCK) getestet und zu ihren Lerngelegenheiten befragt wurde (detailliert: vorhergehende Symposiumsbeiträge). Ferner wird als Vergleichsstichprobe die in die PKE-Studie einbezogenen Master-StudierendenStichprobe verwendet (n=216 von 11 Universitäten). Vertreten sind in beiden Stichproben die Lehrämter Gymnasium sowie Haupt-/Realschule. Da das PCK substanziell vom gewählten Lehramt beeinflusst wird (vgl. erster Symposiumsbeitrag), wird dieses in den Analysen zum Zusammenhang zwischen Lerngelegenheiten und PCK kontrolliert. Darüber hinaus kontrollieren wir den Einfluss weiterer Merkmale (Geschlecht, Alter, HISEI) auf das PCK, um den Einfluss der individuellen Voraussetzungen angehender Lehrkräfte Rechnung zu tragen. Ergebnisse: Erste Ergebnisse aus schrittweisen Regressionsanalysen für die repräsentative Stichprobe der Referendarinnen und Referendare zeigen zunächst, dass den Inhalten der Sprachdidaktik die höchste prädiktive Kraft zukommt (standardisiertes Regressionsgewicht > .33), gefolgt von der Kulturdidaktik, Curriculum und Beurteilung sowie Fachdidaktische Forschung (Gewicht > .2). Nur gering können Methodik und Literaturdidaktik das Wissen vorhersagen (Gewicht > .1); die Mediendidaktik ist ohne praktische Bedeutsamkeit (Gewicht < .1). Ebenfalls geringe Vorhersagekraft haben die schulpraktischen Tätigkeiten sowie der mentorielle Support. Von den Kontollvariablen lässt sich nur der Einfluss vom gewählten Lehramt (Gewicht > .30) feststellen, der für höhere PCK-Werte derjenigen angehenden Lehrkräfte spricht, die ein gymnasiales Lehramt anstreben. Unter Einbezug der Stichprobe der ersten Ausbildungsphase zeigt sich, dass Referendarinnen und Referendare über umfangreicheres fachdidaktisches Wissen verfügen als die getesteten Master-Studierenden, allerdings ist dieser Effekt klein. Ferner verringert sich der Unterschied zwischen erster und zweiter Phase, wenn die Inhalte der Sprachdidaktik als Prädiktor einbezogen werden. Dies lässt die vorsichtige Schlussfolgerung zu, dass weniger das formale Stadium (erste vs. zweite Phase), sondern die mit einem Lehramt (Gymnasium vs. Haupt-/Realschule) verbundenen Profile von Lerngelegenheiten sowie der Umfang studierter Inhalte für das Abschneiden im Test entscheidend sind. Vertiefende Analysen im Mehrebenendesign werden zur Tagung vorliegen und zur Diskussion gestellt. Implikationen der Ergebnisse, die auf die Bedeutung disziplinärer Inhalte der Fachdidaktik (v.a. Sprachdidaktik) verweisen, erwartungswidrig aber die relativ schwache Bedeutung von Unterrichtsmethodik und schulpraktischen Tätigkeiten anzeigen, werden zur Diskussion gestellt. ID: 386 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung Thematisches Cluster: Selbstreguliertes Lernen, Motivation und Emotion Stichworte: Motivationsregulation, Strategien, Selbstreguliertes Lernen Motivationsregulation beim Lernen differenziert betrachtet: Neue Vorgehensweisen, neue Befunde. Chair(s): Hubertina Thillmann (Ruhr-Universität Bochum), Joachim Wirth (Ruhr-Universität Bochum) Diskutant(en): Birgit Spinath (Ruprecht-Karls-Universität Heidelberg) Während die bisherigen Ergebnisse zur Motivationsregulation beim selbstregulierten Lernen (SRL) weitgehend auf Maßen der selbstberichteten Quantität der Nutzung von Motivationsregulationsstrategien beruhen (z. B. Wolters, 1998; Schwinger, von der Laden, Spinath, 2007), werden in diesem Symposium verschiedene neue methodische Herangehensweisen vorgestellt, bei denen eine differenzierte Betrachtungsweise zu neuen, teilweise erwartungswidrigen Erkenntnissen über die Rolle der Motivationsregulation beim SRL führt. Vor dem Hintergrund der Validitätsproblematik von Selbstberichtverfahren zur Erfassung von Strategien des SRL (vgl. Leopold & Leutner, 2002), nehmen die beiden ersten Beiträge neue Maße der Motivationsregulation in den Blick, die insbesondere qualitative Aspekte der Motivationsregulation erfassen. Im ersten Beitrag kamen neben Maßen, welche die Quantität der Strategienutzung erfragen, insbesondere Maße, welche die Qualität der Strategienutzung in den Blick nehmen, zum Einsatz. Hierbei erwiesen sich insbesondere die Maße der Qualität, wie die Effektivität, Genauigkeit und Kontrolle der Strategienutzung, als prädiktiv für den Regulationserfolg, die Anstrengung beim Lernen und die Studienleistung. Einen ähnlichen Ansatz verfolgen die Autoren des zweiten Beitrags. Neben dem bekannten Maß der Strategienutzung (Schwinger et al., 2007) haben sie ein Maß für das konditionale Strategiewissen von Schülerinnen und Schülern eingesetzt. Nach einer situationalen Anregung der Motivationsregulation erwies sich hier neben der selbstberichteten Nutzung ausgewählter Strategien insbesondere das konditionale Strategiewissen um die Aufrechterhaltung der Motivation beim Lernen als prädiktiv für den Lernerfolg in einer konkreten Lernsituation. Ebenfalls um einen neuen Ansatz der Erfassung von Motivationsregulation geht es in dem dritten Beitrag. Basierend auf dem theoretischen Konzept volitionaler Kompetenzen (vgl. Kuhl & Fuhrmann, 1998) zeigt sich, dass eine Ausdifferenzierung des Aspektes der Motivationskontrolle, die gezielt der Aufrechterhaltung der Selbstintegrität beim Lernen dienen soll, sich als prädiktiv für das Lernerleben im Verlauf eines Semesters sowie für das allgemeine Wohlbefinden erweist. Ebenfalls längsschnittlich angelegt befasst sich der abschließende Beitrag dieses Symposiums mit den Effekten einer spezifischen Strategie der Motivationsregulation, nämlich der self-enhancement-Strategie der Überschätzung eigener Leistung (vgl. Dickhäuser & Plenter, 2005). Dabei gehen die Autoren der Frage nach, welche kurz- und langfristigen Effekte die Nutzung dieser Strategie auf das Selbstkonzept und die Leistung von SchülerInnen hat. Die Ergebnisse bestätigen neben kurzfristigen positiven Effekten auf das Selbstkonzept und indirekt auf die Leistung, einen langfristigen negativen Effekt auf das Selbstkonzept und indirekt auf die Leistung. Zusammenfassend leisten alle vier Beiträge neue Erkenntnisse darüber, welche spezifischen Aspekte bzw. Strategien der Motivationsregulation relevant für Erleben und Leistung beim SRL sind. Damit erbringen sie sowohl neue theoretische als auch praktische Implikationen für die Forschung zur Motivationsregulation. Beiträge des Symposiums Motivationsregulation bei Studierenden: Quantität und Qualität des Strategieeinsatzes als Indikatoren erfolgreicher Regulation bei spezifischen motivationalen Problemlagen Tobias Engelschalk, Gabriele Steuer, Markus Dresel Universität Augsburg Theoretischer Hintergrund Für ein erfolgreiches Studium wird dem selbstregulierten Lernen (SRL) hohe Relevanz zugeschrieben (vgl. Streblow & Schiefele, 2006). Bei dieser Art des Lernens kommt ¬ neben dem Einsatz von kognitiven und metakognitiven Lernstrategien ¬ der aktiven Kontrolle von motivationalen Prozessen eine wichtige Rolle zu (z.B. Winne & Hadwin, 2012). In den letzten Jahren hat sich die SRL-Forschung, die speziell auf den Aspekt der Selbststeuerung der Motivation fokussiert, deutlich intensiviert. Dabei wurde die Motivationsregulation vorwiegend im Hinblick auf die Quantität des Strategieeinsatzes untersucht, wobei sich zeigte, dass die Häufigkeit der Nutzung von Strategien zwar prädiktiv für die Bereitschaft ist, sich beim Lernen anzustrengen, jedoch nicht mit tatsächlichem Lernerfolg in Zusammenhang steht (z.B. Schwinger, Steinmayr & Spinath, 2009). Dieses Befundmuster lässt sich u.a. dahingehend interpretieren, dass die alleinige Betrachtung quantitativer Aspekte des Strategieeinsatzes zu kurz greifen könnte, da eine Strategie nicht nur mit einer gewissen Intensität eingesetzt, sondern auch in qualitativer Hinsicht so reguliert werden muss, dass das Ziel der jeweiligen Strategie tatsächlich auch erreicht wird (Schreiber, 1998). Während für den Einsatz kognitiver Lernstrategien bereits empirische Hinweise vorliegen, dass insbesondere die qualitativen Aspekte des Strategieeinsatzes gelingendes SRL vorhersagen können, mangelt es für den Bereich der motivationalen Lernstrategien an Studien, die eine Beurteilung der Bedeutung von quantitativen versus qualitativen Aspekten des Strategieeinsatzes erlauben. Fragestellung Im Beitrag werden quantitative und qualitative Aspekte des Einsatzes von Motivationsregulationsstrategien simultan betrachtet, um den jeweiligen Beitrag zum Erfolg der Regulationsbemühungen quantifizieren zu können. Dazu werden die folgenden Forschungsfragen formuliert: (1) Lassen sich mit Hilfe der Quantität des Strategieeinsatzes Regulationserfolg (Einschätzung, wie gut ein motivationales Problem überwunden werden kann), Anstrengung (Bereitschaft sich im Studium anzustrengen) und Studienleistungen vorhersagen? (2) Verbessern sich die Vorhersagen, wenn neben der Quantität auch die Qualität des Strategieeinsatzes berücksichtigt wird? Methode Um die Validität der Messungen zu sichern, wurden zentrale Variablen situationsspezifisch und möglichst verhaltensnah erhoben (vgl. Spörer & Brunstein, 2006). Mittels Fragebogen wurden 188 Studierenden Beschreibungen prototypischer Lernsituationen (Prüfungsvorbereitung und Semesterarbeit) vorgelegt, die jeweils spezifische Ursachen mangelnder Lernmotivation (geringe Erfolgserwartung und geringer subjektiver Wert jeweils vor- und während der aktionalen Lernphase) enthielten (vgl. Engelschalk, Steuer & Dresel, 2015). Für diese 2 x 2 x 2 motivationalen Problemlagen berichteten sie die Quantität des Strategieeinsatzes (operationalisiert als Häufigkeit des Einsatzes von acht verschiedenen Motivationsregulationsstrategien), die Qualität des Strategieeinsatzes (operationalisiert als Effektivität, Genauigkeit und Kontrolle bei der Umsetzung derjenigen Strategien, die in der jeweiligen Situationen am ehesten eingesetzt wurden) sowie den jeweiligen Erfolg der Motivationsregulationsbemühungen („Regulationserfolg“, erfasst mit je zwei Items). Die Anstrengung wurde global mit einer 15 Items umfassende Skala erhoben und die Studienleistung als Durchschnitt der letzten vier erhaltenen Modulnoten operationalisiert. Ergebnisse In den durchgeführten Regressionsanalysen erwies sich die Quantität des Einsatzes von Motivationsregulationsstrategien als moderat positiver Prädiktor des Regulationserfolgs sowie der Anstrengung. Die Studienleistung ließ sich jedoch nicht aus der Nutzungsquantität vorhersagen. Alle drei abhängigen Variablen, insbesondere auch die Studienleistung, ließen sich signifikant besser durch die Hinzunahme der Qualität des Strategieeinsatzes prädizieren. Hier waren teils große Anteile der Kriteriumsvarianz zu beobachten, die spezifisch mit dem Qualitätsaspekt im Zusammenhang standen, mithin Aspekte reflektierten, die nicht im Umfang der Strategienutzung abgebildet sind (Regulationserfolg: deltaR² = .21, p < .001; Anstrengung: deltaR² = .04, p < .01; Studienleistung: deltaR² = .02, p< .05). Im Gegensatz dazu erwiesen sich die Anteile der Kriteriumsvarianz, die spezifisch aus dem Quantitätsaspekt vorhergesagt werden konnten, als nicht signifikant für den Regulationserfolg und die Studienleistung und als klein für die Anstrengung (deltaR² = .03, p < .05). Diskussion Insgesamt verweisen die Ergebnisse darauf, dass die Qualität des Einsatzes von Motivationsregulationsstrategien prädiktiv für relevante Aspekte des Lernprozesses ist und dass gerade diesem Aspekt im Hinblick auf eine effektive und zielführende Regulation der Lernmotivation besondere Bedeutung beigemessen werden sollte. Motivationsregulation bei SchülerInnen: Zum Einfluss des Wissens über und der Nutzung von Strategien zur Motivationsregulation auf den Lernerfolg beim SRL Hubertina Thillmann, Joachim Wirth Ruhr-Universität Bochum Theoretischer Hintergrund Die Selbstregulation der Motivation rückt zunehmend in den Fokus der Forschung zum selbstregulierten Lernen (SRL) (Winne & Hadwin, 2012; Wolters, 2003). Bislang konnte gezeigt werden, dass Studierende und auch schon SchülerInnen nicht nur angeben, eine Reihe unterschiedlicher Motivationsregulationsstrategien anzuwenden (Wolters, 1998; Schwinger, von der Laden & Spinath, 2007), sondern dass sie die Auswahl dieser Strategien auch nach dem jeweiligen Anlass ausrichten (Engelschalk, Steuer & Dresel, 2015). Obwohl die berichtete Strategienutzung mit erhöhter Anstrengung beim Lernen assoziiert ist (Schwinger & Stiensmeier-Pelster, 2012), zeigte sich bislang kein Effekt auf den Lernerfolg in konkreten Lernsituationen (Schwinger, Steinmayr & Spinath, 2009). Dies könnte jedoch an Validitätsproblemen der eingesetzten Selbstberichtverfahren liegen (vgl. Artelt, 2000). Es stellt sich daher die Frage, welche Relevanz der Motivationsregulation beim SRL tatsächlich zukommt, bspw. wenn zwecks Erhöhung der Validität a) die Motivationsregulation in einer konkreten Situation angeregt wird und b) neben der Nutzung von Motivationsregulationsstrategien auch das Wissen über Motivationsregulationsstrategien erfasst wird (vgl. Leopold & Leutner, 2002). Fragestellung und Hypothese Welchen Einfluss auf den Lernerfolg in einer konkreten Lernsituation hat neben der Nutzung von Motivationsregulationsstrategien das Wissen über Motivationsregulationsstrategien? H: Die Nutzung von und das Wissen über Strategien zur Motivationsregulation leisten einen inkrementellen Beitrag zur Vorhersage des Lernerfolgs beim SRL über das inhaltliche Vorwissen und das allgemeine Leistungsniveau hinaus. Methode N=80 Schülerinnen und Schüler (SuS) der Jahrgangsstufe 10 an zwei Gymnasien in NRW haben an dieser Studie teilgenommen. 47 Schüler waren männlich, das Alter betrug M=15.20 Jahre (SD=0.71 Jahre). Zunächst wurden Alter, Geschlecht und die letzten Schulnoten erfragt. Aus dem Mittelwert der Noten wurde das Leistungsniveau berechnet. Im Anschluss wurde die motivationale Zielorientierung anhand der Skalen zur Lern- und Leistungsmotivation (Spinath, Stiensmeier-Pelster, Schöne & Dickhäuser, 2002) erfasst. Danach war es Aufgabe der SuS, sich selbstreguliert Wissen aus einem Text zum Thema Lebewesen anzueignen. Dazu wurde ihr inhaltsspezifisches Vorwissen (5 MC-Items) erfasst. Alle SuS erhielten vor dem Lesen des Textes einen motivationsregulatorischen Prompt zur Strategie der annäherungsleistungszielbezogenen Selbstinstruktion und 3 min. Zeit zur selbständigen Motivationsregulation. Zudem wurde ihre aktuelle Motivation, den Text zu bearbeiten, einmal vor und einmal nach der Selbstmotivation anhand des Fragebogens zur Aktuellen Motivation (Rheinberg, Vollmeyer & Burns, 2001) erfasst. Nach dem SRL wurde das konditionale Wissen über Strategien zur Motivationsregulation anhand eines Strategiewissenstests mit den Skalen Initiation und Persistenz der Motivation erhoben (Thillmann & Wirth, 2011). Daran anschließend wurde die selbstberichtete Nutzung von Strategien zur Motivationsregulation (Schwinger, von der Laden & Spinath, 2007) sowie ihr inhaltliches Wissen zum Lehrtext (21 MultipleChoice-Items) erfasst. Ergebnisse Die Reliabilitäten der eingesetzten Maße erwiesen sich als zufriedenstellend. Zur Überprüfung der Hypothese wurde eine univariate Varianzanalyse zur Vorhersage des Wissens zum Post-Zeitpunkt gerechnet. Als Prädiktoren gingen nacheinander folgende Variablen in die Analyse ein: inhaltliches Vorwissen, Leistungsniveau, Lernzielund Annäherungsleistungszielorientierung, Strategien zur Motivationsregulation und konditionales Wissen über Strategien zur Motivationsregulation. Die Ergebnisse zeigen über signifikante Haupteffekte für das inhaltliche Vorwissen und das Leistungsniveau hinaus, Effekte für die Nutzung der Strategien Interessensteigerung (F(1,74)=6.36; p=.035; eta²=.090), Bedeutsamkeitssteigerung (F(1,74)=4.66; p=.028; eta²=.068) und annäherungsleistungszielbezogene Selbstinstruktion (F(1,74)=5.05; p=.028; eta²=.073) sowie für das konditionale Strategiewissen zur Persistenz (F(1,74)=4.84; p<.031; eta²=.070). Somit konnte die Hypothese bestätigt werden. Diskussion Die Ergebnisse dieser Studie sprechen für die Relevanz der Motivationsregulation für den Lernerfolg beim SRL, und zwar über den Einfluss des Vorwissens und des Leistungsniveaus hinaus. Demnach erzielen SuS, die angeben Erfahrungen in spezifischen Strategien zur Motivationsregulation zu haben, einen höheren Lernerfolg in einer konkreten Lernsituation als SuS, die dies nicht angeben. Zudem zeigt sich ein zusätzlicher Informationswert des konditionalen Wissens über Strategien zur Aufrechterhaltung der Motivation beim SRL, über die selbstberichtete Nutzung spezifischer Strategien hinaus. Zum Einfluss von Motivationskontrolle auf Lernerleben und -verhalten und das allgemeine Wohlbefinden: Eine vorlesungsbegleitende Studie mit Lehramtsstudierenden Axel Grund, Carola Grunschel, Stefan Fries Universität Bielefeld Theoretischer Hintergrund Motivationskontrolle stellt in Kuhls modularer Konzeption volitionaler Kompetenzen (Kuhl & Fuhrmann, 1998) einen Teilprozess der Selbstregulation dar. Die zentrale Funktion der Motivationskontrolle liegt insbesondere in der Aufrechterhaltung der Selbstintegrität („self-maintenance”) und weniger in der Zielerreichung („goal-maintenance“). Für letzteres ist die Selbstkontrolle zuständig. Durch die Motivationskontrolle soll die Zielverfolgung motivational angereichert und energetisiert werden, indem positive affektive Zustände hergestellt werden. Motivationskontrolle sollte demnach eine entscheidende Rolle beim selbstregulierten Lernen spielen und das aktuelle Lernerleben und –verhalten günstig beeinflussen. Darüber hinaus sollte Motivationskontrolle aber auch nachhaltige Effekte auf das allgemeine Wohlbefinden haben. Allerdings gibt es bisher kaum Forschung dazu, wie sich diese Prozesse im konkreten (Lern-) Alltag von Studierenden entfalten. Fragestellung Im Rahmen einer Feldstudie soll überprüft werden, inwiefern Motivationskontrolle in Zusammenhang mit Aspekten des aktuellen und prospektiven Lernerlebens und -verhaltens in konkreten Situationen selbstregulierten Lernens (Besuch einer Vorlesung) steht. Es wird angenommen, dass eine bessere Motivationskontrolle mit einer funktionalen Stabilisierung der aktuellen Handlungsregulation auf motivational-affektiver Ebene einhergeht (z.B. weniger Konflikterleben, mehr situatives Interesse, mehr Lernfreude, weniger negative Emotionen) und positive prospektive Leistungsemotionen (mehr Hoffnung und weniger Angst) vorhersagt. Darüber hinaus werden bereichsübergreifende Effekte der Motivationskontrolle auf das allgemeine subjektive Wohlbefinden erwartet. Methode Die Daten wurden zu mehreren Messzeitpunkten im Rahmen einer Vorlesung im Fach Psychologie für Lehramtsstudierende erhoben. Zum ersten Vorlesungstermin nahmen insgesamt 245 Studierende an der Befragung teil (weiblich = 84%; MAlter= 22.1, SDAlter= 3.5; MSemester= 3.7, SDSemester= 2.0) und beantworteten einen Fragebogen zur Motivationskontrolle sensu Kuhl sowie weitere Kontrollvariablen (z.B. soziale Erwünschtheit, allgemeines affektives und kognitives Wohlbefinden). Zudem wurden sie bis zur Mitte des Semesters im Anschluss an die Vorlesungstermine zu ihrem Lernerleben und –verhalten in den jeweiligen Sitzungen befragt. Zur Mitte des Semesters wurden abschließend die prospektiven Leistungsemotionen der Studierenden in Bezug auf die anstehende Modulklausur zur Vorlesung sowie abermals ihr allgemeines affektives und kognitives Wohlbefinden erfasst. Die Daten wurden regressionsanalytisch ausgewertet. Ergebnisse Wie erwartet berichteten Studierende, die über eine bessere Motivationskontrolle verfügen, im Durchschnitt der verschiedenen Veranstaltungen über mehr funktionales motivational-affektives Lernerleben und -verhalten (z.B. situationales Interesse, Spaß und flowartige Zustände) und weniger dysfunktionale motivational-affektive Zustände (z.B. weniger motivationale Konflikte, Ablenkungen und Langeweile). Die Befunde blieben auch bestehen, wenn Selbst- und Fremdtäuschungstendenzen sowie das allgemeine affektive Wohlbefinden der Studierenden statistisch kontrolliert wurden. Motivationskontrolle sagte zudem prospektive Leistungsemotionen in Bezug auf die Klausur sowie das allgemeine psychologische Wohlbefinden der Studierenden zur Semestermitte vorher. Diejenigen, die angaben ihre Motivation gut kontrollieren zu können, berichteten weniger Angst und mehr Hoffnung in Bezug auf das Abschneiden in der anstehenden Klausur. Zudem berichteten sie zur Mitte des Semesters insgesamt mehr positive Affekte und eine höhere Lebenszufriedenheit, auch wenn frühere Einschätzungen zum subjektiven Wohlbefinden sowie Selbst- und Fremdtäuschungstendenzen kontrolliert wurden. Insgesamt sprechen die Befunde dafür, dass Motivationskontrolle funktionale motivational-affektive Zustände in konkreten Kontexten des selbstregulierten Lernens unterstützt, darüber hinaus aber auch das allgemeine Wohlbefinden fördert. Short- and Long-Term Effects of Over-Reporting of Grades on Academic Self-Concept and Achievement Fabio Sticca1, Thomas Götz1, Ulrike Nett2, Kyle Hubbard3, Ludwig Haag4 1 Universität Konstanz & Pädagogische Hochschule Thurgau, 2Universität Ulm, 3McGill University, 4Universität Bayreuth Theoretical background A number of studies from different research fields have shown that there is a tendency to portray oneself as above average with respect to many individual characteristics. This tendency is most evident for characteristic that are perceived as important (e.g., Brown, 2012). In the academic context, one such important individual characteristic is academic achievement. Indeed, many students are prone to over-report their grades (Kuncel, Credé, & Thomas, 2005), which has been interpreted as a form of selfenhancement strategy (Dickhäuser & Plenter, 2005). Although such self-enhancement strategies were assumed to be adaptive in terms of self-concept and academic achievement, a first longitudinal study by Robins and Beer (2001) showed that selfenhancement was adaptive in the short term but maladaptive in the long term as far as self-esteem, well-being, and achievement are concerned. To date, results obtained by Robins and Beer (2001) have not been replicated. Moreover, no study has examined whether the short-term adaptive effects are partly responsible for the long-term maladaptive effects of self-enhancement on academic achievement. In order to examine such a complex longitudinal relationship, it is imperative to adopt a multivariate approach, as complex relationship between multiple constructs might remain undetected in bivariate approaches such as the one used by Robins and Beer (2001). Research question This study examined the short- and long-term effects of self-enhancement (i.e., over-reporting of academic grades) on academic self-concept and academic achievement. In particular, we examined whether the positive short-term effects of self-enhancement are partly responsible for the negative long-term effects. Method 916 Swiss ninth-graders participated in three assessments across three years (mean age at T1 = 15.6 years, 56% female). Students reported their last mid-term grades and their self-concepts (SDQ; Marsh & O’Neill, 1984) in mathematics, German, English, and French. Actual mid-term grades were obtained from the school administrations. The longitudinal interplay between self-enhancement, academic self-concept, and academic achievement was examined using a trivariate parallel process latent growth model (TPPLGM). This model allowed us to test whether latent growth parameters of one latent growth model (LGM) predicted those of another LGM. Results Results from the PPLGM showed that, in the short term, self-enhancement was positively associated with self-concept but not with achievement, while self-concept was strongly associated with achievement. However, in the long term, self-enhancement had a direct maladaptive effect on academic self-concept and an indirect maladaptive effect on academic achievement that was mediated by inflated academic self-concepts. Discussion The present study yielded the first results showing that self-enhancement has adaptive short-term effects on academic-self concept and that these apparently adaptive effects lead to maladaptive developments in academic achievement over time. An inflated academic self-concept might lead to unrealistic expectations and maladaptive learning strategies or reduced learning efforts, which in turn may lead to lower academic achievement. If a decrease in academic achievement is then attributed to external causes, the likelihood of continued self-enhancement increases and a vicious cycle may arise with maladaptive longterm consequences for academic achievement. Implications for research and educational practice are discussed. ID: 390 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktiken der Naturwissenschaften und Technik Thematisches Cluster: Bildung im Sekundarbereich, Mathematisch-naturwissenschaftlicher Unterricht, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: internationaler Vergleich, Mehrebenenmodellierung, multiple Outcomes, Unterrichtsforschung Unterrichtsforschung durch die Brillen verschiedener Disziplinen Chair(s): Susanne Kuger (Deutsches Institut für Internationale Pädagogische Forschung), Ronny Scherer (Centre for Educational Measurement at the University of Oslo (CE) Diskutant(en): Ilonca Hardy (Goethe-Universität Frankfurt) Die Unterrichtsforschung verfolgt multiple Ziele und nutzt dabei sehr heterogene Studien aus unterschiedlichen disziplinären und personellen Perspektiven auf unterschiedliche Kriteriumsmerkmale. Auf der einen Seite finden sich rekonstruierende Ansätze, die Interaktionen zwischen den beteiligten Akteuren erst einmal sichtbar, beschreibbar und reliabel und valide messbar machen wollen. Des Weiteren existieren Studien, die Unterricht vergleichend darstellen und beschreiben wollen. Vergleiche finden zwischen Schulformen, Fächern oder Ländern statt. Nicht zuletzt stellt die Frage nach der ultimativen Effektivität von Unterricht für verschiedene Zielmerkmale eine zentrale Frage der Erforschung von Unterricht dar. Ziel des Symposiums ist es, diese drei Ansätze zur Beschreibung von Unterricht und seiner Effektivität anhand von vier Studien zu illustrieren und dabei die Komplexität des Unterrichtsgeschehens und Wirkens multi-perspektivisch zu betrachten. Dabei werden verschiedene disziplinäre Brillen eingesetzt, um auf Basis substanzieller Datenlagen Unterricht empirisch zu beschreiben. Der erste Beitrag berichtet dabei zunächst von den Schwierigkeiten und Möglichkeiten, die Komplexität großer multimethodischer Datensätze zu systematisieren und zu belastbaren und interkulturell validen Beschreibungsdimensionen des Physikunterrichts in drei verschiedenen Ländern zu kommen. Eine besondere Herausforderung stellt die Vereinigung und Verknüpfung von Datenquellen aus Befragungen, Tests und Videografien dar. Die Studie zeichnet sich vor allem durch eine fachdidaktische Beschreibungsweise von Unterricht aus, die über die verfügbaren Maße in internationalen Schulleistungsstudien hinausgeht. Der zweite Beitrag nimmt die ländervergleichenden Überlegungen des ersten Beitrags auf und rekonstruiert Unterrichtskulturen in 11 Ländern weltweit. Betrachtet werden dabei fachdidaktische, allgemeindidaktische und pädagogisch-psychologische Beschreibungsdimensionen von Unterricht zugleich. Anhand der Daten der PISA 2012 Studie werden latente Profilanalysen zwischen und innerhalb der Länder verglichen, um verschiedene Unterrichtskulturen in Ländern und Schulen zunächst zu rekonstruieren und dann kontrastierend und vergleichend zu analysieren. Im dritten Beitrag wird aus einer eher pädagogisch-psychologischen Perspektive heraus die Bedeutung von Unterricht für verschiedene Schülermerkmale untersucht. Um der multi-kriterialen Zielsetzung von Unterricht nachzugehen, analysiert diese Studie die Zusammenhänge gängiger Beschreibungsdimensionen von Unterricht mit motivationalen, Leistungs- und Persönlichkeitsmerkmalen der Schülerinnen und Schüler und vergleicht die Bedeutung unterschiedlicher Unterrichtsmerkmale für diese Kriterien. Zuletzt wird aus methodischer Perspektive ein Ansatz geliefert, der es erlaubt, die Komplexität der Beschreibung von Instruktionsqualität anhand von Schülereinschätzungen quantitativ zu explizieren. Dabei können zum einen die verschiedenen Merkmale der Instruktionsqualität (Mehrdimensionalität, Domänenspezifität, Mehrebenenstruktur) integrativ beschrieben und zum anderen Unterschiede zwischen Ländern berücksichtigt werden. Anhand der Daten der TIMSS und PIRLS 2011 Studien wird die Validität des Ansatzes empirisch geprüft. Abschließend werden die Beiträge aus einer erziehungswissenschaftlichen Perspektive dahingehend diskutiert, welchen Erkenntnisgewinn sie zur zukünftigen Lehrerbildung beitragen können. Beiträge des Symposiums Die Messung fachbezogener Instruktionsqualität mittels Videoanalysen Knut Neumann Leibniz-Institut für die Pädagogik der Naturwissenschaften und M Die fachspezifische Interpretation der Instruktionsqualität ist eine zentrale Aufgabe der Fachdidaktik. So hat die Unterrichtsqualitätsforschung zwar einzelne Merkmale der Instruktionsqualität identifiziert (u.a. Strukturiertheit, Aktivierung oder Klassenführung, vgl. z.B. Helmke, 2006), unklar ist jedoch wie sich diese im Fachunterricht manifestieren. Was sind zum Beispiel lernwirksame Strukturen des Physikunterrichts, oder welche Elemente des Physikunterrichts sind besonders aktivierend? Diese Fragen sind auch mit Blick auf die wissenschaftliche Fundierung der Lehrerbildung von zentraler Bedeutung. Insbesondere in den Fachdidaktiken der Mathematik und der naturwissenschaftlichen Fächer sind in Folge der TIMSS Videostudien (z.B. Roth et al., 2006) zahlreiche Studien durchgeführt worden, in denen die Instruktionsqualität in den jeweiligen Fächern untersucht wurde (z.B. Reyer, 2004). Dabei wurde in unmittelbarer Anlehnung an die Prozess-Produkt-Forschung zunächst auf die Wirkung einzelner Merkmale wie z.B. der Strukturierung (Reyer, 2004) oder der Aktivierung (z.B. Lau, 2011) untersucht. Dies wird aber der Komplexität der realen Unterrichtssituation nicht gerecht. Eine valide Beschreibung von Instruktionsqualität muss idealerweise sämtliche Merkmale und deren Zusammenspiel berücksichtigen. Statt einzelner Merkmale von Instruktionsqualität müssten Instruktionsqualitätsmuster beschrieben werden. Offen ist dabei allerdings bisher, wie die Identifikation solcher Muster methodisch anzugehen ist. Dieser Frage soll im vorliegenden Beitrag am Beispiel der internationalen Vergleichsstudie „Quality of Instruction in Physics“ (QuIP) nachgegangen werden. Im Rahmen dieser Vergleichsstudie wurde Physikunterricht in den drei Ländern Deutschland, Finnland und der Schweiz im Rahmen eines Prä-Post-Designs untersucht. Die Prä-Testung erfolgte zu Beginn einer Unterrichtseinheit zur Elektrizitätslehre, in deren Verlauf dann in jeder Klasse entweder eine Doppelstunde oder zwei einzelne Stunden auf Video aufgezeichnet wurden. Die Post-Testung erfolgte am Ende der Unterrichtseinheit. Erfasst wurden unter anderem Schülerleistung, -interesse und –motivation im Prä-Post-Vergleich aber auch Rahmenbedingungen wie das Professionswissen der Lehrkräfte. Insgesamt wurde Unterricht in N = 103 Klassen des 9. und 10. Jahrgangs in den drei Ländern videographiert. Diese Unterrichtsstunden wurden neben der Klassenführung unter anderem mit Hilfe physikdidaktisch ausformulierten Kategoriensysteme zur inhaltlichen Strukturierung (Brückmann, 2009) und zur kognitiven Aktivierung (Lau, 2011) analysiert. Die Ergebnisse zeigen deutliche Unterschiede im Leistungszuwachs der Schülerinnen und Schüler verschiedener Länder und bestätigen damit, dass die Befunde z.B. aus PISA durch Unterschiede im Lernen der Schülerinnen und Schüler erklärt werden können. Die einzelnen Videoanalysen bestätigen klare Effekte der inhaltlichen Strukturierung, der kognitiven Aktivierung und der Klassenführung sowie weiterer Merkmale der Instruktionsqualität. So wirkt sich sowohl die Zahl der Konzepte, r = .36, p < .001, als auch die Zahl der Verbindungen zwischen diesen Konzepten, r = .28, p < .01, positiv auf den Lernzuwachs der Schülerinnen und Schüler aus. Zudem zeigt sich ein Einfluss der Passung zwischen dem von der Lehrkraft angestrebten und von den Schülerinnen und Schülern gezeigten Vernetzungsniveau als Maß für kognitive Aktivierung, r = .36, p < .01. Nicht zuletzt erwiesen sich im Rahmen einer Kovarianzanalyse der Schülerleistung im Posttest unter Berücksichtigung der Schülerleistung im Prätest verschiedene Merkmale der Klassenführung als statistisch bedeutsam; darunter die effektive Zeitnutzung, F(94, 9) = 4.46, p < .05, 2 = .10. In der Gesamtschau der Ergebnisse zeigt sich ein Bild, dem zufolge eine hohe Instruktionsqualität in Physik durch eine starke Lehrerzentrierung, einen systematischen Wissensaufbau und weitere Elemente (die hier im Detail nicht dargestellt werden können) wie häufigere Wiederholungen und Leistungsüberprüfungen oder weniger und qualitativere Experimente gekennzeichnet ist. Dieses Bild lässt sich empirisch bisher allerdings weder durch z.B. Regressionsanalysen oder (hierarchische) Strukturgleichungsmodelle belegen. Dies kann u.a. in der für diese Verfahren auf Klassenebene vergleichsweise kleine Stichprobe begründet sein. Detailliertere Analysen legen jedoch nahe, dass in den einzelnen Klassen jeweils ganz unterschiedliche Merkmale der Instruktionsqualität zum Tragen kommen. Der Beitrag diskutiert vor dem Hintergrund dieser Ergebnisse wie sich Muster der Instruktionsqualität identifizieren und beschreiben lassen; sowie insbesondere die Validierung dieser Muster. Profile von Unterrichtsbeschreibungen in 11 Ländern Susanne Kuger Deutsches Institut für Internationale Pädagogische Forschung Hintergrund und Problemstellung Bei der Suche nach universellen Beschreibungsansätzen und Wirkungsmustern des Unterricht konzentriert sich ein Teil der Forschung auf den internationalen Vergleich, um eine Kulturabhängigkeit der Ergebnisse zu verringern und so eine größere Generalisierbarkeit der Ergebnisse annehmen zu können. Gleichwohl kommen diese Studien zu keinem einheitlichen Fazit. Während einige Studien größere Unterschiede in der Beschreibung und Effektivität des Unterrichts zwischen den Ländern feststellen (manchmal auch cultural scripts genannt, z.B. Kobarg et al., 2011; Stigler & Hiebert, 2009; Vieluf, Kaplan, Klieme, & Bayer, 2012), kommen andere Studien zu dem Schluss großer Ähnlichkeiten (Baker & LeTendre, 2005; Hattie, 2009; Seidel & Shavelson, 2007). Ein Problem stellt in diesen Analysen die Auswahl der Beschreibungsdimensionen für den Unterricht dar. Je nach Studie werden Beschreibungen aus allgemeindidaktischer (Vieluf et al., 2012), aus fachdidaktischer (Schmidt et al., 2001) oder aus pädagogisch-psychologischer (Kobarg et al., 2011) Sicht gewählt und das Unterrichtsgeschehen über Konstrukte operationalisiert, die aus den jeweiligen Perspektiven übliche Beschreibungsdimensionen darstellen. Es existieren dagegen weniger Studien, die Beschreibungen unterschiedlicher disziplinärer Perspektiven und unterschiedlicher Dimensionen einer Perspektiven gleichzeitig berücksichtigen. Ein weiterer Kritikpunkt an bisherigen Studien mit einem international vergleichenden Ansatz ist die häufig auch nur implizite Annahme, dass nicht nur alle Konstrukte in den jeweiligen Ländern existieren und ähnlich gut erfasst werden können, sondern dass sie darüber hinaus auch in allen Ländern in gleichen Verhältnissen zueinander stehen. Diese Annahme unterstellt, dass die Orchestrierung von Unterricht in den unterschiedlichen Kulturen ähnlich realisiert wird und widerspricht dem Befund länderspezifischer Besonderheiten des Unterrichts (Stigler & Hiebert, 2009). Um eine einheitliche Operationalisierung sicherzustellen, untersuchten Givvin, Hiebert, Jacobs, Hollingsworth und Gallimore (2005) Zeiteinheiten des Auftretens bestimmter Sichtstrukturen in den TIMSS Videos von 1995 und 1999. Ihr Maß der Konvergenz verschiedener Zeitanteile einer Unterrichtsaktivität an der Gesamtunterrichtszeit zwischen Schulen und Ländern weist auf stark unterschiedliche Auftretenswahrscheinlichkeiten der untersuchten Aktivitäten bei gleichzeitig ähnlichen Wirkungsmustern für die Schülerleistungsentwicklung hin. Beitrag dieser Studie Aufbauend auf diesen Analysen möchte die vorliegende Studie das Repertoire der untersuchten Beschreibungsdimensionen auf gängige Indikatoren der allgemeindidaktischen, der fachdidaktischen sowie der pädagogisch-psychologischen Forschung erweitern, um die Komplexität des Unterrichtsgeschehens an verschiedene Forschungsstränge anschließend darstellen und vergleichen zu können. Ziel der Studie ist es, Ähnlichkeiten in den Beschreibungen des Mathematikunterrichts in den einzelnen Ländern zu finden und zugleich länderspezifische Kovariationen der Beschreibungsdimensionen zuzulassen, um kulturelle Muster des Unterrichtens nicht zu übersehen. Methode Als Datengrundlage dienen die Daten der Studie PISA 2012 aus elf Ländern (Australien, Deutschland, Finnland, HongkongChina, Japan, Niederlande, Polen, Schweden, Schweiz, Tschechische Republik, USA). PISA 2012 erfasste in diesen Ländern ca. 74.000 Schülerinnen und Schüler. Das Rotationsdesign der Kontextfragebögen führt zu einer Datenbasis von etwa ⅓ dieser Stichprobe. Für dieses Drittel liegen Angaben zu Beschreibungsdimensionen der bisher häufig in der pädagogischpsychologischen Forschung untersuchten Unterrichtsqualität, eher allgemeindidaktischer Unterrichtsaktivitäten und -methoden sowie fachdidaktisch orientierter Angaben zu den behandelten Inhalten des Mathematikunterrichtes vor. Nach einer Analyse der Messinvarianz dieser Beschreibungsdimensionen werden latente Profilanalysen auf individueller und auf Schulebene berechnet. Aufgrund der großen Unterschiede in den Schulsystemen der Länder werden die Schülerperformanz im PISA Mathematiktest, die besuchte Klassenstufe und der sozioökonomischer Hintergrund der Schüler als Prädiktoren für die latenten Klassen mit in die Analysen aufgenommen. Ergebnisse Die Messinvarianzprüfung zeigt eine eingeschränkte Vergleichbarkeit der Daten in den Ländern. Erste Mehrgruppenmodelle latenter Profilanalysen weisen darauf hin, dass einige Beschreibungsdimensionen keinen relevanten Beitrag zur Profilbildung beitragen, wogegen andere stärker differenzieren. Die Schülerangaben zur Unterrichtsbeschreibung zeigen deutliche Unterschiede zwischen den Ländern, wobei sich jeweils Ähnlichkeiten zwischen einzelnen Ländern beobachten lassen. Die Ergebnisse werden vor dem Hintergrund der Allgemeingültigkeit und Generalisierbarkeit von Unterrichtskulturen in so verschiedenen Regionen und Bildungssystemen diskutiert. Mehrdimensionale Bildungsziele im Mathematikunterricht und ihr Zusammenhang mit den Basisdimensionen der Unterrichtsqualität Anja Schiepe-Tiska1, Jörg-Henrik Heine1, Oliver Lüdtke2, Tina Seidel1, Manfred Prenzel1 1 Technische Universität München, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und M Theoretischer Hintergrund Schule und Unterricht haben nicht nur das Ziel (Fach-)Wissen zu vermitteln; sie sollen im Sinne mehrdimensionaler Bildungsziele Jugendliche auch dabei unterstützen, fachspezifische Interessen und Vertrauen in die eigenen Fähigkeiten (Selbstwirksamkeitserwartungen) zu entwickeln. Interesse ist dabei gekennzeichnet durch eine kognitive (gegenstandsbezogene), affektive und wertbezogene Komponente (Krapp & Prenzel, 2011). Selbstwirksamkeitserwartungen beschreiben Überzeugungen, konkrete Handlungen und Problemstellungen erfolgreich bewältigen zu können (Bandura, 1977). Für das Erreichen dieser mehrdimensionalen Bildungsziele nimmt der Mathematikunterricht eine zentrale Rolle ein (KMK, 2003). Angebots-Nutzungs-Modelle (vgl. Seidel & Reiss, 2014) postulieren, dass die Qualität der angebotenen Lerngelegenheiten im Unterricht unter anderem von der professionellen Lehrerkompetenz sowie Kontexteffekten der Klasse und Schule beeinflusst werden. Inwieweit der Unterricht jedoch seine Wirkung entfaltet und Jugendliche die angestrebten Zielkriterien erreichen, hängt davon ab, ob und wie Lernende die dargebotenen Lerngelegenheiten wahrnehmen und aktiv nutzen. Die Qualität von Unterricht kann demnach daran festgemacht werden, wie gut es Lehrpersonen gelingt, Angebotsstrukturen zu schaffen, die Jugendlichen Möglichkeiten bieten, mehrdimensionale Ziele zu erreichen. Auf der Basis von Analysen von Unterrichtsvideos ließen sich drei Dimensionen der Unterrichtsqualität identifizieren (Klieme, Schümer & Knoll, 2001), die sich auch in Studien fanden, die andere methodische Zugänge wählten (z.B. Kunter et al., 2011): kognitive Aktivierung, effiziente Klassenführung und konstruktive Unterstützung. Bisherige Befunde zeigen, dass ein kognitiv aktivierender, störungsarmer Unterricht positiv mit der Mathematikleistung zusammenhing (Klieme et al., 2001; Kunter, 2005; Rakoczy, 2008). Gleichzeitig zeigte sich, dass eine effiziente Klassenführung mit einem höheren Maß an Interesse an Mathematik einherging. Darüber hinaus hing Interesse positiv mit der konstruktiven Unterstützung durch die Lehrkraft zusammen. Selbstwirksamkeitserwartungen wurden bisher nicht in Studien einbezogen, die den Basisdimensionen der Unterrichtsqualität und mehrdimensionalen Zielkriterien betrachteten. Zusammenhang zwischen Fragestellung Der vorliegende Beitrag untersucht, wie multiple Zielkriterien mit den drei Dimensionen der Unterrichtsqualität kognitive Aktivierung, Disziplin im Klassenzimmer und konstruktiver Unterstützung zusammenhängen. Dabei werden neben der mathematischen Kompetenz die Ziele Freude und Interesse an Mathematik sowie mathematikbezogene Selbstwirksamkeitserwartungen einbezogen und es werden systematisch die Zusammenhänge dieser Zielkriterien mit den Dimensionen der Unterrichtsqualität auf der Schüler- und Klassenebene verglichen. Methode Zur Beantwortung unserer Fragestellungen wurden Daten aus der nationalen Erweiterung der PISA-Studie 2012 verwendet. Die Stichprobe bestand aus 211 bundesweiten Schulen von denen 412 Klassen mit 9845 Jugendlichen (MAlter = 15.56; SDAlter = 0.62; nweiblich = 4919; nmännlich = 4926) teilnahmen. Die mittlere Klassengröße betrug 23.9 Schülerinnen und Schüler (SD = 4.25). Die Schülerinnen und Schüler bearbeiteten einen zweistündigen Kompetenztest und anschließend Fragen zu ihrem Unterricht, Interesse und Selbstwirksamkeitserwartungen. Der Schülerfragebogen wurde erstmals in einem Rotationsdesign mit drei verschiedenen Fragebogenvarianten eingesetzt (OECD, 2014). Alle Varianten enthielten Fragen zum familiären Hintergrund, aber nur jeweils zwei Drittel der Jugendlichen beantworteten Fragen zum Unterricht, Interesse und Selbstwirksamkeitserwartungen. Im Umgang mit den fehlenden Werten wurden multiple Imputationen verwendet (Lüdtke, Robitzsch, Trautwein & Köller, 2007). Für jedes Zielkriterium wurden latente Zwei-Ebenen-Strukturgleichungsmodelle spezifiziert, die die Schüler- und Klassengewichte sowie die Stratifizierung der Stichprobe berücksichtigten. Die individuellen und aggregierten Einschätzungen des Unterrichts wurden gleichzeitig als Prädiktoren auf Individual- und Klassenebene berücksichtigt (Lüdtke, Robitzsch, Trautwein & Kunter, 2009). Kontrolliert wurde auf individueller Ebene für die kognitiven Grundfertigkeiten und den sozioökonomischen Status sowie auf Klassenebene für die Schulart. Ergebnisse Die Ergebnisse zeigten für die mathematische Kompetenz positive Zusammenhänge mit kognitiver Aktivierung und effizienter Klassenführung. Freude und Interesse an Mathematik hing positiv mit kognitiver Aktivierung, Disziplin sowie konstruktiver Unterstützung zusammen. Hohe mathematikbezogene Selbstwirksamkeitserwartung ging mit kognitiver Aktivierung sowie Disziplin einher. Dabei zeigten sich die Zusammenhänge mit mathematischer Kompetenz vorwiegend auf der Klassenebene während die Zusammenhänge mit Interesse eher auf der individuellen Ebene zu finden waren. Für die Selbstwirksamkeitserwartung zeigten sich Effekte auf beiden Ebenen. Die Befunde weisen darauf hin, dass eine Förderung mehrdimensionaler Bildungsziele im Mathematikunterricht möglich ist. Die psychometrische Brille der Unterrichtsforschung: Ein integrativer Ansatz zur Modellierung der Struktur und Messinvarianz von Aspekten der Instruktionsqualität Ronny Scherer1, Jan-Eric Gustafsson2 1 Centre for Educational Measurement at the University of Oslo (CE, 2University of Gothenburg Theoretischer Hintergrund Die valide Messung der Instruktionsqualität stellt die Grundlage empirischer Forschung zur Effektivität von Unterricht dar. Aktuell werden verschiedene Datenquellen genutzt, um Aspekte der Instruktionsqualität wie Klassenführung, konstruktive Unterstützung und kognitive Aktivierung zu beschreiben (Wagner et al., 2015). Die Mehrheit bisheriger Studien verwendete hierbei Schülereinschätzungen dieser Aspekte und konnte verschiedene Merkmale der Instruktionsqualität identifizieren: (1) Mehrebenenstruktur: Wenngleich Schülereinschätzungen individuelle Wahrnehmungen des Unterrichtsgeschehens darstellen, basieren sie auf den Erfahrungen in einem Klassenraum. Wenn die Frage nach der Effektivität von Unterricht im Mittelpunkt steht, sind diese Einschätzungen auf Klassenebene von Interesse (Marsh et al., 2012). (2) Mehrdimensionalität: Instruktionsqualität umfasst verschiedene kognitive und nicht-kognitive Aspekte des Lehrens und Lernens (Fauth et al., 2014). (3) Domänenspezifität: Aspekte der Instruktionsqualität können domänenspezifische Ausprägungen haben. Schließlich wird in der einschlägigen Literatur darauf hingewiesen, dass die Beschreibung der Instruktionsqualität kulturspezifisch sein kann (OECD, 2014). Fragestellung Basierend auf den bislang identifizierten Merkmalen der Instruktionsqualität wird der Frage nachgegangen, inwiefern Schülereinschätzungen eine valide Beschreibung von Aspekten des Konstrukts liefern. Im Speziellen werden folgende Fragen beantwortet: 1) Inwiefern repräsentieren die eingesetzten Items die beschriebenen Eigenschaften der Instruktionsqualität? 2) Inwiefern lässt sich das unter 1) identifizierte Messmodell über ausgewählte Länder hinweg verallgemeinern? 3) Welche Zusammenhänge bestehen zwischen den Faktoren der Instruktionsqualität und den Leistungen der Schülerinnen und Schüler in den Mathematik-, Naturwissenschafts- und Lesetests? Methode Grundlage der vorliegenden Studie bilden die TIMSS und PIRLS 2011 Datensätze dreier skandinavischer Länder: Finnland, Norwegen und Schweden. Insgesamt nahmen 12077 Schülerinnen und Schüler der Jahrgangsstufe 4 an beiden Studien teil und bearbeiteten Leistungstests sowie Fragebögen in den Domänen Mathematik, Naturwissenschaften und Lesen. Im Wesentlichen wurden drei Aspekte der Instruktionsqualität erfasst: (1) Klarheit der Anforderungen und Erwartungen, (2) Verständlichkeit der kommunizierten Inhalte, (3) Interesse der Schülerinnen und Schüler an den Lehreräußerungen. Die Schülerinnen und Schüler schätzten den Grad des Vorhandenseins dieser drei Aspekte in den drei Domänen ein. Die resultierenden Itemantworten wurden mit Hilfe eines Mehrebenen-Strukturgleichungsmodells beschrieben, das neben den Aspekten der Instruktionsqualität und den Domänen auch einen Generalfaktor aller Schülereinschätzungen beinhaltete (Scherer & Gustafsson, 2015). Dieser Faktor lässt sich zum einen als eine umfassende, domänenübergreifende Einschätzung der Instruktionsqualität deuten; er lässt aber auch eine Interpretation als Faktor zu, der kulturell geprägte Antwortmuster kontrolliert. Das resultierende, bifaktorielle MehrebenenStrukturgleichungsmodell wurde genutzt, um die drei Forschungsfragen zu beantworten. Ergebnisse Hinsichtlich der Mehrebenenstruktur der Instruktionsqualität zeigte sich eine Abhängigkeit der Schülerdaten von der Nestung in Klassen (ICC-1 zwischen .03 und .12). Auf Schüler- und Klassenebene ließen sich die drei Aspekte der Instruktionsqualität sowie ein Generalfaktor als latente Variable beschreiben. Schließlich war es möglich, die drei Domänen auf Schülerebene zu modellieren; um das Modell zu identifizieren, wurde jedoch der Mathematik-Faktor auf Klassenebene entfernt. Auf Grundlage dieser Befunde konnten damit die Mehrebenenstruktur, Mehrdimensionalität sowie die Domänenspezifität beschrieben werden. Das vorgeschlagene Modell erwies sich als vollständig messinvariant über die drei Länder hinweg (strikte Messinvarianz) und lieferte somit Hinweise auf die Generalisierbarkeit im Kontext der drei Länder. Hinsichtlich der Zusammenhänge der verschiedenen Faktoren zu den Schülerleistungen ergaben sich signifikante Korrelationen in allen drei Domänen lediglich mit dem Faktor „Verständlichkeit der kommunizierten Inhalte“ auf Klassenebene (beta=.31-.32). Der Generalfaktor kann aufgrund der geringen und größtenteils nicht signifikanten Korrelationen mit den Leistungen als ein Faktor interpretiert werden, der möglichen Bias im Antwortmuster der Schülerinnen und Schüler beschreibt (He, Bartram, Inceoglu, & van de Vijver, 2014). Vor dem Hintergrund der Ergebnisse folgern wir, dass das vorgeschlagene bifaktorielle Mehrebenen-Strukturgleichungsmodell Evidenzen für eine valide Beschreibung von Aspekten der Instruktionsqualität liefert, da dieses Modell die verschiedenen Charakteristiken der Instruktionsqualität systematisch vereint. ID: 394 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Didaktik Deutsch Thematisches Cluster: Kompetenzdiagnostik/ Kompetenzentwicklung, Lese- und Sprachförderung Stichworte: Lesekompetenz, Diagnostik, Textverständnis, Textmerkmale, Personenmerkmale Diagnostische Aspekte der Lesekompetenzmessung über die Lebenspanne unter Berücksichtigung verschiedener Text- und Personenmerkmale Chair(s): Ilka Wolter (Leibniz-Institut für Bildungsverläufe Bamberg), Lena Nusser (Otto-Friedrich-Universität Bamberg), Cordula Artelt (Otto-Friedrich-Universität Bamberg) Diskutant(en): Barbara Drechsel (Otto-Friedrich-Universität Bamberg) Lesekompetenz wird verstanden als Fähigkeit, das Gelesene zu nutzen, um eine mentale Repräsentation des Inhaltes (d.h. ein Situationsmodell) eines Textes zu bilden (Kintsch, 1998; vgl. Oakhill, Kain & Elbro, 2015). Neben Fähigkeits- und Wissensmerkmalen sowie den Rezeptionszielen der Lesenden spielen bei der Vorhersage des Textverstehens auch Merkmale der Texte (z.B. Gestaltung des Textmaterials, also die Bereitstellung von Strukturen, die das Bilden von Referenzen und von Verknüpfungen zwischen Sätzen und somit auch das Ziehen von Inferenzen aus Texten ermöglichen) und die konkreten Verstehensanforderungen eine Rolle. Das Textverständnis ist dabei als Resultat des Zusammenwirkens von Personen- und Textmerkmalen zu verstehen (vgl. Schnotz, 2006). Die Bedeutung von Text- und Anforderungsmerkmalen für die Lesekompetenzdiagnostik soll in dieser Arbeitsgruppe herausgestellt werden. Da sich in empirischen Studien in der Lesekompetenz wiederholt Unterschiede aufgrund verschiedener Personenmerkmale zeigen, besteht ein großer Bedarf an reliablen und validen Testinstrumenten, welche Besonderheiten von Subgruppen berücksichtigen sowie sensitiv für Veränderungen in verschiedenen Altersbereichen sind. Vor dem Hintergrund zahlreicher Studien, in welchen Differenzen in der Lesekompetenz u.a. auf sprachliche Herkunft, SES und Geschlecht zurückgeführt werden (z.B. Naumann, Artelt, Schneider & Stanat, 2010), sollen Besonderheiten der Lesekompetenzdiagnostik in der Betrachtung verschiedener Personengruppen beleuchtet werden. In dieser Arbeitsgruppe werden Einflüsse variierender Textmerkmale und in verschiedenen Subgruppen in der Diagnostik des Textverständnisses betrachtet. Die Beiträge zeichnen sich dadurch aus, dass in der Entwicklung der Verfahren zur Erhebung des Textverständnisses vor allem kognitionspsychologische Konzeptionen (vgl. Kintsch, 1988) herangezogen, aber auch herausfordernde Personengruppen wie jüngere Kinder und Schüler(innen) mit sonderpädagogischem Förderbedarf einbezogen werden. Im ersten Beitrag wird ein computerbasiertes, adaptives Testverfahren zur Lesediagnostik bei Grundschulkindern der 3. Klasse vorgestellt, welches über Sach- und narrative Texte unterschiedlicher Anforderungsstufen das Textverständnis erfasst. Der zweite Beitrag stellt eine experimentelle Variation von Anforderungen in Testmaterialien für die Lesekompetenzmessung bei Schüler(innen) der 7. Klasse mit sonderpädagogischem Förderbedarf vor. Es werden unterschiedliche Bearbeitungsarten identifiziert und Zusammenhänge mit kognitiven Grundfähigkeiten aufgezeigt. Im dritten Beitrag wird in einer experimentellen Studie am Beispiel von Physiktexten aufgezeigt, inwiefern das Textverständnis von Schüler(innen) der 9. Klasse bei variierender Kohäsion von Texten identischen Inhalts mit bestimmten Personenmerkmalen (z.B. Geschlecht, sprachlicher Hintergrund, Vorwissen) einhergeht. Der vierte Beitrag thematisiert die Lesekompetenzmessung im Erwachsenalter und die individuelle Anwendung von Strategien bei der Aufgabenbearbeitung in einem computerbasierten Testverfahren. In einem experimentellen Design werden die initialen Text-Lesezeiten in Abhängigkeit davon untersucht, ob nach begonnener Aufgabenbearbeitung Texteinsicht oder keine Texteinsicht möglich war. Abschließend werden die Beiträge hinsichtlich ihres Mehrwerts für die Lesekompetenzdiagnostik in verschiedenen Altersbereichen diskutiert. Beiträge des Symposiums Faire und adaptive Lesediagnostik: Analysen zu Reliabilität, Fairness und Validität eines computerbasierten Textverständnistests für Grundschulkinder Annika Ohle, Franziska Schwabe, Nele McElvany Institut für Schulentwicklungsforschung (ifs), Dortmund Aufgrund der Bedeutung von Lesekompetenzen für die Teilhabe am schulischen und gesellschaftlichen Leben und der Heterogenität in den Leseleistungen bereits bei Grundschulkindern (Foorman & Connor, 2011) sind passgenauer Unterricht und individuelle Unterstützung der Kinder aller Kompetenzstufen erforderlich. Die verlässliche und faire Messung der vorhandenen Kompetenzen und Defizite ist dabei eine Grundvoraussetzung für Auswahl und Einsatz adäquater Fördermaßnahmen. Computerbasierte, adaptive Testverfahren können hier zu einer Steigerung der Messeffizienz beitragen, da sie im Gegensatz zum Vorgehen konventioneller Testverfahren die zu bearbeitenden Testaufgaben an die beobachteten Leistungen der Testperson anpassen (van der Linden & Glas, 2000). Damit sind sie klassischen Verfahren vor allem aufgrund der höheren und gleichmäßigeren Messgenauigkeit überlegen. Vor dem Hintergrund wachsender Diversität in Schule und Unterricht ist darüber hinaus die Fairness des Gesamttests sowie einzelner Items für unterschiedliche Schülergruppen ein bedeutsames Kriterium (Camilli, 2006) und bei der Entwicklung neuer Instrumente zu berücksichtigen. Zentrales Element eines adaptiven Tests ist ein ausreichend homogener Itempool, der den üblichen Gütekriterien an Tests gerecht wird und den Anforderungen an „faires“ Testen gerecht wird. Ausgehend von einem solchen Itempool kann eine verlässliche Diagnostik von Lesekompetenz bei Kindern im Grundschulalter kurz nach dem Entwicklungsschritt zwischen _Lernen zu lesen_ und _Lesen um zu lernen_ realisiert werden. Um zu klären, ob die vorliegenden Testitems in der schulischen Praxis und für die weitere Forschung eingesetzt werden können, werden die folgenden Fragen zu einem auf Basis der Theorie von Kintsch (van Dijk & Kintsch, 1983) entwickelten Itempool, der das Textverständnis von Kindern der dritten Grundschulklasse computerbasiert erfasst, beantwortet: (1) Erfüllt der Itempool die Anforderungen an Reliabilität sowohl für (1a) die Gesamtstichprobe als auch für (1b) relevante Schülersubgruppen (Mädchen, Jungen; Kinder mit/ohne Migrationshintergrund; Kinder sozial schwächerer/stärkerer Lage)? (2) Sind die Einzelitems des Itempools fair gegenüber den genannten Schülersubgruppen? (3) Weist der Itempool zufriedenstellende (3a) konvergente und (3b) diskriminante Validität auf? Insgesamt flossen die Daten von _N_ = 1 039 Grundschulkindern der dritten Klassenstufe in die Analysen ein (Alter: _M_ = 9.08 Jahre [_SD_ = 0.50]; 50.3% Mädchen; 40.0% Kinder mit sprachlichem Migrationshintergrund; HISEI: _M_ = 47.59 [_SD_ = 15.65]). In einem Multi-Matrix-Design bearbeitete jeweils nur ein Teil der Kinder einen Teil der 86 computerbasierten Items. Der Textverständnistest ist – angelehnt an Modelle des Leseverstehens – so konzipiert, dass sowohl literarische und Sachtexte als auch hierarchieniedrige und -hohe Leseprozessanforderungen abgedeckt sind. Das Antwortformat aller Items ist ein MultipleChoice Format mit vier Antwortmöglichkeiten. Dargestellt werden Kennzahlen zur Verteilung der Itemschwierigkeitsparameter auf Grundlage einer Skalierung mit dem einparametrischen logistischen Modell der IRT mit TAM in R. Zur Beantwortung der Forschungsfragen werden (1) Reliabilitäten für Subgruppen, (2) Ergebnisse zu _Differential Item Functioning_ (DIF) als Indikator für Testfairness und (3) Zusammenhänge mit relevanten Drittvariablen dargestellt. Die Ergebnisse in Bezug auf den Itempool zeigen, dass für das gewählte einparametrische logistische Testmodel global die größte Zuverlässigkeit im mittleren Bereich der Fähigkeitsverteilung liegt. Die Reliabilitäten des Itempools (Frage 1) sind in der Gesamtgruppe wie auch für die genannten Subgruppen akzeptabel bis zufriedenstellend (.63 < EAP α <.73). Die Items des Gesamttests sind außerdem gegenüber den genannten Schülergruppen frei von DIF (Frage 2). In Bezug auf Hinweise zur Validität (Frage 3) bestehen signifikante Korrelationen zu bereits etablierten Testverfahren im Bereich sprachlicher Kompetenzen (.55 < _r_ < .89) sowie nur geringe Korrelationen zu einem Test kognitiver Grundfähigkeiten (_r_ < .29). Abschließend wird die Qualität – gemessen an den dargestellten Gütekriterien – des Testinstruments mit Blick auf dessen Verwendung im Schulkontext sowie im Rahmen weiterer, wissenschaftlicher Studien diskutiert. Widrigkeiten bei der Kompetenztestung!? – Erklärungsansätze für die Lesetestbearbeitung von Förderschülerinnen und -schülern Lena Nusser1, Karin Gehrer2, Sabine Weinert1, Cordula Artelt1, Claus H. Carstensen1 1 Otto-Friedrich-Universität Bamberg, 2Leibniz-Institut für Bildungsverläufe Bamberg Der Anteil der Schülerinnen und Schüler, die eine Zuweisung eines sonderpädagogischen Förderbedarfs erhalten, hat in den letzten Jahren stetig zugenommen (von 5.3% in 2000 auf 6.6% in 2010; Autorengruppe Bildungsbericht, 2014). Die größte Gruppe mit fast 40% stellen jene Schülerinnen und Schüler mit einem sonderpädagogischen Förderbedarf Lernen (SPF-L) dar, die meist lernzieldifferent und überwiegend in einem stark gegliederten Förderschulsystem unterrichtet werden. Bisher existieren wenige breit angelegte und zugleich differenzierte Untersuchungen hinsichtlich der Kompetenzentwicklung dieser Schülergruppe, vor allem im Vergleich zu integrativ beschulten Kindern bzw. Kindern ohne SPF. Grund hierfür ist die besondere Herausforderung, bildungsrelevante Kompetenzen von Schülerinnen und Schülern mit und ohne SPF-L in beiden Gruppen gleichermaßen valide und vergleichbar zu erfassen. Bisherige Ergebnisse von Machbarkeitsstudien zur Erfassung der Lesekompetenz bei Lernenden an Förderschulen in 5. Klassen im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld, Roßbach & von Maurice, 2011; Heydrich, Weinert, Nusser, Artelt & Carstensen, 2013) zeigen bei dieser Gruppe - im Unterschied zu einer Schülergruppe an Hauptschulen - neben einem erhöhten Auftreten von fehlenden Werten, nicht akzeptable, unsystematische Itemfitwerte sowie differential-item-functioning bei einer Vielzahl von Items (Südkamp, Pohl & Weinert, 2015). Dabei dürfte die Gruppe von Schülerinnen und Schülern mit SPF-L alles andere als homogen in ihren Fähigkeitsprofilen, die die Item- und Testbearbeitung und damit die Messung der Lesekompetenz beeinflussen, sein. Neben eingeschränkten sprachlichen Fähigkeiten kann eine reduzierte Aufmerksamkeitsspanne, die bei der Schülergruppe mit SPF-L häufig zu finden ist (Grünke, 2004), dazu führen, dass das Verständnis der Ausfüllhinweise als auch die konsequente und sequenzielle Testbearbeitung nur eingeschränkt erfolgt. Dabei ist eine Interaktion zwischen spezifischen Anforderungen des Testmaterials und den Fähigkeiten einer Person zu erwarten. So wird vermutet, dass Lese- und Wahrnehmungsgeschwindigkeit, die Aufmerksamkeitsspanne sowie verbale und nonverbale Fähigkeiten die Testbearbeitung der Schülerinnen und Schüler maßgeblich beeinflussen können (vgl. auch Artelt, Stanat, Schneider & Schiefele, 2001). Um die erwähnten Ausgangsbedingungen dieser Schülergruppe bei Kompetenztestungen zu berücksichtigen, werden häufig Akkommodationen, von denen angenommen wird, dass sie konstruktirrelevant sind, implementiert (z. B. read-aloud, mehr Testzeit, reduzierte Itemschwierigkeit, vgl. Koretz & Barton, 2003). Ziel der vorliegenden Studie ist es zu überprüfen, ob bei der Erfassung des Leseverständnisses innerhalb der NEPSRahmenkonzeption (Gehrer, Zimmermann, Artelt & Weinert, 2013) bei Schülerinnen und Schülern mit SPF-L unterschiedliche Bearbeitungsprofile mittels latenter Klassenanalysen identifiziert werden können. Zum einen sollen aufgabenspezifische Schwierigkeiten im Zusammenhang mit kognitiven Anforderungen des Testmaterials aufgezeigt und zum anderen die Bearbeitungsprofile durch relevante Vorläuferfertigkeiten erklärt werden. Zudem wird untersucht, ob sich vergleichbare Profile und Erklärungsansätze bei Schülergruppen an Hauptschulen finden lassen. 413 Schülerinnen und Schüler mit SPF-L in der 7. Jahrgangstufe an Förderschulen Lernen nahmen an der Studie teil (Altersdurchschnitt: _M_ = 13.43 Jahre, 40% weiblich). Die Schülerinnen und Schüler (_n_ = 125) im 6. Jahrgang an Hauptschulen dienen im Rahmen dieser Analysen als Vergleichsgruppe (Altersdurchschnitt: _M_ = 12.22 Jahre, 39% weiblich). In einem experimentellen Design wurden für die vorliegende Studie je zwei unveränderte Test-Units (Text plus Aufgaben) mit drei angepassten Test-Units ergänzt. Eine Akkommodation zielte auf eine Reduzierung des Wortschatzes sowie einer Vereinfachung der grammatikalischen Struktur der Verständnisfragen (Groeben & Christmann, 1998). Anhand eines theoretisch hergeleiteten Regelsystems wurden alle Aufgabenstämme und -antworten überarbeitet, um eine signifikante Verbesserung der Lesbarkeit zu erzielen. In einer zweiten Experimentalbedingung wurden Texte und zugehörige Verständnisfragen administriert, die ursprünglich für jüngere Schülerinnen und Schüler an Regelschulen entwickelt wurden (out-of-level-Testung; siehe auch Thurlow, Elliott & Ysseldyke, 1999). Erste Ergebnisse zeigen differenzielle Bearbeitungsprofile, die zwischen Schülergruppen mit höheren bzw. niedrigeren Lösungswahrscheinlichkeiten über eine Vielzahl von Aufgaben sowie Profilen mit spezifischen Stärken und Schwächen unterscheiden. Es deuten sich Zusammenhänge zwischen den identifizierten Testbearbeitungsprofilen und den kognitiven Grundfähigkeiten der Schülerinnen und Schüler an. Naturwissenschaftsbezogenes Textverständnis als Interaktion von Personen- und Textmerkmalen Nicole Kohnen, Hendrik Härtig, Sascha Bernholt, Jan Retelsdorf IPN Kiel *Theoretischer Hintergrund* Auch für den Bildungserfolg in den Naturwissenschaften ist ein angemessenes Textverständnis wesentlich (Norris & Phillips, 2003). Im Allgemeinen versteht man Lesen nicht als eine reine Informationsentnahme aus einem Text. Vielmehr haben Lesende z.B. mit ihrem Vorwissen und ihren Erwartungen individuelle Zugangsvoraussetzungen, auf deren Basis der Verstehensprozess stattfindet. Dieser führt nach van Dijk und Kintsch (1983) zu einer Repräsentation des Textes auf drei Ebenen (wörtliche Repräsentation, propositionale Repräsentation, Situationsmodell). Da der Verstehensprozess sowohl von den einzelnen Lesenden abhängt als auch vom Text angeleitet wird, nimmt man einen vom Text gesteuerten Konstruktionsprozess und einen von den Lesenden gesteuerten, aktiven Integrationsprozess an. Das Textverständnis ergibt sich somit auf allen Ebenen aus einem Zusammenspiel von Personen- und Textmerkmalen (Schnotz, 2006; Kintsch, 1988). Im Rahmen dieses Projekts wird das naturwissenschaftsbezogene Textverständnis von Schüler/innen erstmals systematisch als eine ebensolche Interaktion untersucht. An Personenmerkmalen werden inhaltsbezogenes, domänenspezifisches Vorwissen, der allgemeine rezeptive Wortschatz, die basale Lesekompetenz, das allgemeine Textverständnis narrativer Texte, das Lesestrategiewissen, das schlussfolgernde Denken, das Geschlecht und die Sprache im Elternhaus erhoben. Auf der Textseite wird die Kohäsion variiert (d.h. mehr oder weniger sprachliche Verknüpfungsmittel auf der Textoberfläche werden zwischen den einzelnen Sätzen bzw. Absätzen eingesetzt), da ein Einfluss der Kohäsion auf das Textverständnis belegt ist (Schmitz & Gräsel, angenommen; Ozuru et al., 2009). *Fragestellungen* 1. Inwiefern beeinflusst die sprachliche Gestaltung (Leichte Sprache/lokal und global kohäsiv/lokal und global inkohäsiv) das Textverständnis naturwissenschaftlicher expositorischer Texte für die Sekundarstufe 1? 2. Welchen Effekt haben die personenbezogenen Variablen (Vorwissen, Wortschatz, basale Lesekompetenz, allgemeines Textverständnis, Lesestrategiewissen, schlussfolgerndes Denken, Geschlecht, Sprache im Elternhaus) auf das Textverständnis? 3. Welche Interaktionseffekte stellen sich zwischen den Personen- und den Textmerkmalen mit Blick auf das Textverständnis naturwissenschaftlicher Texte dar? *Methode* Aktuell wird ein randomisiertes Experiment mit den drei Bedingungen der Textversionen durchgeführt. Befragt werden ca. 300 Neuntklässler/innen an schleswig-holsteinischen Gemeinschaftsschulen. Insgesamt werden zu zwei physikalischen Themen jeweils drei Textversionen eingesetzt. Die Textversionen zu einem Thema unterscheiden sich nur in sprachlicher, nicht in inhaltlicher Hinsicht. Die erste Version ist in Leichter Sprache (nach Maaß, 2015) verfasst und damit lokal und global hochkohäsiv. Die Syntax und die Morphologie der zweiten Version sind komplexer, das Layout ist verändert. Auch diese Variante ist aber mit den explizit gemachten semantischen Relationen, vielen Erklärungen sowie den Themensätzen lokal und global sehr kohäsiv. Die dritte Version ist in syntaktischer und morphologischer Hinsicht ähnlich komplex, die genannten Kohäsionsmittel sind aber nicht vorhanden. Jede/r Schüler/in liest zwei Texte unterschiedlichen Inhalts, wobei beide Texte in Leichter Sprache verfasst, kohäsiv oder inkohäsiv sind. An Kontrollvariablen werden der sozio-ökonomische Hintergrund, das Alter, die Deutsch- und Physiknoten, das generelle Fachinteresse, das Selbstkonzept Physik, die habituelle Lesemotivation und Grit erhoben. Außerdem werden die Lesbarkeitsindizes und die Lesedauer gemessen. Nach dem Lesen werden das situative Interesse, die Einschätzung der eigenen Leistung sowie die drei Ebenen der Textrepräsentation getestet. *Erwartete Ergebnisse* Erwartet wird der Expertise Reversal Effect (McNamara & Kintsch, 1996; McNamara et al., 1996), nach dem Lesende mit wenig Vorwissen stärker von einer hohen Kohäsion, Lesende mit viel Vorwissen dagegen stärker von einer geringen Kohäsion profitieren. Eine hohe Kohäsion sollte aber auch für Lesende mit viel Vorwissen vorteilhaft sein, die über eine hohe Lesekompetenz verfügen (O’Reilly & McNamara, 2007). Ebenso sollten Lesende mit wenig Vorwissen mit einem kohäsiven Text v.a. dann eine angemessene Textrepräsentation erlangen können, wenn sie im Allgemeinen gut lesen können (Ozuru et al., 2009). Ferner gehen wir davon aus, dass Lesende mit wenig Vorwissen den Nachteil beim Lesen inkohäsiver Texte durch eine hohe allgemeine Lesefähigkeit und schlussfolgerndes Denken kompensieren können. Schließlich erwarten wir, dass der Wortschatz, das Vorwissen und das schlussfolgernde Denken das Textverständnis am stärksten beeinflussen. Sind gute Lesende unter widrigen Bedingungen flexible Strategienutzende? Logdatenanalyse der Kontextauswirkung auf Testleistungen Florian Kopp1, Karin Gehrer1, Cordula Artelt2, Ilka Wolter1, Ingrid Koller3 1 Leibniz-Institut für Bildungsverläufe Bamberg, 2Otto-Friedrich-Universität Bamberg, 3Alpen-Adria Universität Klagenfurt Empirische Befunde zeigen, dass Testleistungen als Resultat individueller Kompetenzen im Zusammenspiel mit den jeweiligen Kontextbedingungen der Testsituation gesehen werden müssen. (Fischer, Bullock, Rotenberg & Raya, 1993). Als Teil der Kompetenz sehen wir das Wissen und die adaptive Anwendung von Strategien in Abhängigkeit vom Kontext. Daraus folgt, dass Kontext nicht nur einen direkten Einfluss auf die Testleistung hat, z.B. durch eine Änderung der kognitiven Anforderungen, sondern auch zu einem veränderten Strategieeinsatz führt, der ebenfalls einen Effekt auf die Testleistung haben sollte. Wir nehmen an, dass Personen unterschiedlicher Kompetenzniveaus sich hinsichtlich ihres Strategieeinsatzes bei der Bearbeitung von Aufgaben unterscheiden, da sowohl die Strategien als auch die Fähigkeit, die situational passende Strategie auszuwählen, leistungsrelevante Aspekte sind (vgl. Pressley, Borkwski & Schneider, 1989). Im Rahmen der Lesekompetenzmessung stellen mögliche Einschränkungen der Texteinsicht bei der Bearbeitung dazugehöriger Aufgaben eine Variation der Aufgabenanforderungen dar, die mit unterschiedlichen Strategien einhergehen sollte. Ohne Texteinsicht zeichnet sich das Leseverhalten insbesondere durch eine höhere Verarbeitungsqualität (vgl. Artelt, Stanat, Schneider & Schiefele, 2001, S. 84) aus. Dies sollte mit höheren Anforderungen und somit mit längeren Lesezeiten einhergehen (vgl. Goldhammer, Naumann, Stelter, Tóth, Rölke & Klieme, 2014). Empirische Ergebnisse zeigen, dass sich die Testresultate beim Lesen mit oder ohne Testeinsicht für verschiedene Teilnehmergruppen unterscheiden (Artelt et. al., 2001, S. 126). In der vorgestellten Studie wurde eine Variation in der Aufgabenanforderung über zwei Bedingungen realisiert: Die teilnehmenden Personen konnten Leseaufgaben entweder mit oder ohne Texteinsicht nach dem Beginn der Aufgabenstellung bearbeiten. Bei der Konstruktion des Testmaterials wurde darauf geachtet, dass Leseverstehensaufgaben sich durch geringe Gedächtnisanforderungen auszeichnen (vgl. Kintsch, 1982). Aufgrund obiger theoretischer Überlegungen und ausgehend von der nachgewiesenen Voraussetzung der Eindimensionalität des gemessenen Lesekompetenzkonstruktes über die Aufgaben der beiden Bedingungen, wurden die folgenden zwei Hypothesen untersucht: 1) Die Bedingung der Nicht-Texteinsicht sollte zu erhöhten Itemschwierigkeiten führen (vgl. Artelt et. al., 2001). 2) Personen in der Bedingung der Nicht-Texteinsicht passen ihre Erstlesestrategie an. Dies gilt insbesondere für Personen mit hoher Lesekompetenz. In einer Stichprobe von _N_ = 899 Erwachsenen (Altersrange 20-70 Jahre) aus einer computeradministrierten Entwicklungsstudie im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld, Roßbach & von Maurice, 2011) erfolgte die Lesekompetenzmessung (Gehrer, Zimmermann, Artelt & Weinert, 2013) anhand von 18 Texten unterschiedlicher Textsorten (Gehrer & Artelt, 2013). In sechs Texten wurden die Personen zufällig der experimentellen Bedingung (mit oder ohne Texteinsicht) zugeordnet. Als Indikator für die Strategienutzung diente im Rahmen des Bearbeitungsverhaltens die Erstlesezeit der Texte vor der Aufgabenbearbeitung. Dazu erfolgte eine Logdatenanalyse. Die Überprüfung der Messinvarianz über die Experimentalgruppen sowie die Dimensionalitätsprüfung der Aufgaben über die zwei experimentellen Variationen erfolgte mittels des multidimensionalen Rasch-Modells. Entgegen der ersten Annahme zeigten die Analysen, dass die Variation der Texteinsicht keinen Einfluss auf die geschätzten Itemschwierigkeiten hatte. Aufgaben ohne Texteinsicht waren zum Großteil nicht schwerer als dieselben Aufgaben, die mit Texteinsicht administriert wurden. In Bezug auf die zweite Hypothese zeigte die Analyse der Logdaten erwartungskonform, dass die durchschnittlichen Erstlesezeiten bei den Personen in der Bedingung ohne Texteinsicht über alle sechs Texte länger war als in der Bedingung mit Texteinsicht (_p <_ .01, Mittelwertdifferenzen: 11.5-31.0 Sekunden). Weiterhin zeigte sich wie erwartet, dass Personen mit höherer Lesekompetenz in der Bedingung ohne Texteinsicht bei allen sechs Texten signifikant mehr Zeit benötigten als in der Bedingung mit Texteinsicht (_p <_ .01, Mittelwertdifferenzen: 21.1-38.1 Sekunden). Bei den schlechten Lesenden zeigt sich dieses Muster weniger deutlich. Weitere Analysen sollen den unterschiedlichen Strategiegebrauch in der Gruppe der schlechteren Lesenden näher beleuchten und untersuchen, inwiefern weitere Muster in den Strategien der Aufgabenbearbeitung abgebildet werden können. Die Ergebnisse werden vor dem Hintergrund der Frage adaptiver Strategienutzung in der Testbearbeitung diskutiert. Abschließend wird ein Ausblick gegeben, wie weitere Bearbeitungsstrategien in computerbasierten Kompetenztests durch Logdatenanalyse untersucht werden können. ID: 400 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Didaktiken der Naturwissenschaften und Technik, Lehrerbildung Thematisches Cluster: Hochschulbildung, Kompetenzdiagnostik/ Kompetenzentwicklung, Lehrer(aus)bildung Stichworte: (Angehende) Lehrkräfte, Professionelle Kompetenz, Professionswissen, Motivationale Orientierungen, Erkenntnisgewinnung Struktur und Entwicklung professioneller Kompetenz von (angehenden) Lehrkräften Chair(s): Ute Harms (IPN) Diskutant(en): Thilo Kleickmann (Christian-Albrechts-Universität Kiel) Das hier vorgeschlagene Symposium führt Arbeiten zur Strukturaufklärung und Entwicklung professioneller Kompetenz von (angehenden) Lehrkräften aus den Projekten BilWiss, KiL und Ko-WADiS zusammen. Dabei werden alle drei Phasen der Lehrerbildung (Studium, Vorbereitungsdienst und Schuldienst) in den Blick genommen. Der fachliche Schwerpunkt liegt auf der Lehrerbildung im Bereich der Naturwissenschaften. Die Einzelbeiträge werden durch zwei Linien miteinander verknüpft. Die erste Linie bezieht sich auf die jeweils untersuchten Aspekte der professionellen Kompetenz: Die ersten drei Beiträge thematisieren das Professionswissen, der vierte Beitrag nimmt Domänen der motivationalen Orientierungen von Lehrkräften in den Blick. Die zweite Linie adressiert unterschiedliche Fragen an diese Aspekte: Beitrag eins (Großschedl et al.) und zwei (Hartmann et al.) beschäftigen sich mit Fragen der Struktur des fachbezogenen Professionswissens; Beitrag drei (Kunina-Habenicht et al.) und vier (Harms & Mahler) legen den Schwerpunkt auf die Entwicklung einzelner Aspekte der professionellen Kompetenz von Lehrkräften in Abhängigkeit von speziellen Lerngelegenheiten. In diesem Zusammenhang wird zum einen die Wirksamkeit neuer in den Vorbereitungsdienst integrierter Ausbildungselemente auf die Entwicklung bildungswissenschaftlichen Wissens untersucht, zum anderen wird Zusammenhängen zwischen universitären bzw. außeruniversitären Lerngelegenheiten und der Entwicklung motivationaler Orientierungen nachgegangen. Ziel des Symposiums ist es, die vorgestellten Studien sowohl hinsichtlich ihres methodischen Vorgehens als auch inhaltlich sowohl aus fachbezogener als auch aus allgemeiner bildungswissenschaftlicher Perspektive - zu diskutieren. Dabei soll es neben Fragen der Modellierung einzelner Komponenten des Lehrerprofessionswissens insbesondere auch um Fragen ihres Zusammenspiels und ihrer Förderung gehen. Beiträge des Symposiums Entwicklung fachdidaktischen Wissens: integrative versus transformative Modellierung Jörg Großschedl, Daniela Mahler, Ute Harms IPN THEORETISCHER HINTERGRUND Fachdidaktisches Wissen ist das Wissen darüber, wie fachliche Inhalte Schülerinnen und Schülern nähergebracht werden können (z. B. Magnusson, Krajcik, & Borko, 1999; Shulman, 1987). Zur Beschreibung der Entwicklung des fachdidaktischen Wissens (PCK) werden nach Gess-Newsome (1999) ein integratives und ein transformatives Modell gegenübergestellt. Beide Modelle ziehen spezifische Implikationen für die Gestaltung der fachdidaktischen Ausbildung nach sich. Im integrativen Modell bildet PCK keine eigenständige Wissensdomäne, sondern geht in der jeweiligen Unterrichtssituation in einem kreativen Schöpfungsakt aus dem vorhandenen CK und PK hervor. Dagegen wird PCK im transformativen Modell als eigenständige Wissensdomäne betrachtet, die mehr ist als die Summe ihrer Teile (CK und PK). FORSCHUNGSFRAGEN Zum jetzigen Zeitpunkt besteht kaum empirische Evidenz darüber, ob das integrative oder das transformative Modell die Entwicklung von PCK besser beschreibt. Dementsprechend sollen folgende Forschungsfragen beantwortet werden: (1) Kann eine Unterteilung des Professionswissens in CK, PCK und PK empirisch gestützt werden (wenn ja, dann spräche dies für das transformative Modell)? (2) Ist PCK mehr als die Summe seiner Teile (CK und PK; wenn ja, dann spräche dies ebenfalls für das transformative Modell) oder gleich der Summe seiner Teile (wenn ja, spräche dies für das integrative Modell)? METHODE In einer Querschnittstudie mit Multimatrixdesign beantworteten N=620 angehende Biologielehrkräfte (Semester: M=5,5, SD=2,8; 78,6% weiblich; 64,7% gymnasiales Lehramt) einen getesteten Fragebogen aus dem Projekt KiL (Großschedl, Harms, Kleickmann, & Glowinski, 2015) zur Erfassung ihres CK (38 Items), PCK (34 Items) und PK (67 Items). Alle Instrumente weisen gute Reliabilitäten auf. In einem konfirmatorischen Faktorenmodell wurden CK, PCK und PK als korrelierte aber eigenständige Konstrukte spezifiziert (Standardmodell). Dabei wird angenommen, dass die Lösung von PCK-Items allein vom PCK der Studienteilnehmer abhängt, nicht von ihrem CK und PK. In einem Nested-Faktormodell wurde die Lösung von PCK-Items dagegen so modelliert, dass sie einerseits von einem spezifischen fachdidaktischen Wissen (PCKspez) abhängt, andererseits aber auch vom CK und PK, die beide als Generalfaktoren modelliert wurden. Als Indikatoren der Wissensdomänen dienten in beiden Modellen Subskalenwerte, die auf Grundlage mehrdimensionaler Raschmodelle berechnet wurden. Ob im NestedFaktormodell tatsächlich PCKspez nachweisbar bleibt, nachdem CK und PK auspartialisiert wurden, wurde mittels latenter Regressionsanalyse zwischen PCKspez und ausgewählten Prädiktoren untersucht. FORSCHUNGSERGEBNISSE; DISKUSSION UND RELEVANZ Zunächst wurden die Modellfitindizes des Standardmodells betrachtet. Diese weisen auf eine gute Modellpassung hin (CFI=0,97, TLI=0,06, RMSEA=0,03) und können als erster Hinweis für die Gültigkeit des transformativen Modells verstanden werden, in dem PCK als eigenständiger Wissensbereich beschrieben wird. Anschließend wurden die Regressionsanalysen aus dem Nested-Faktormodell betrachtet. Die Ergebnisse aus den Regressionsanalysen sind erwartungskonform und stützen die Annahme einer spezifischen fachdidaktischen Kompetenz - unabhängig vom CK und PK: Höhere kognitive Fähigkeiten (operationalisiert über die Abiturnote) scheinen sich positiv auf PCKspez auszuwirken (r=-,41). Studierende des gymnasialen Lehramts verfügen im Mittel über eine höheres PCKspez als Studierende des nicht-gymnasialen Lehramts (r=,71). Gleiches gilt für Studierende höherer Semester gegenüber Studienanfängern (r=,61). Dass PCKspez tatsächlich eine spezifische fachdidaktische Kompetenz repräsentiert, legt der Zusammenhang (r=,32) zwischen PCK und der Skala „universitäre Lerngelegenheiten für PCK im Studium“ nahe (alle p<,05). Unsere Analysen stützen die Gültigkeit des tranformativen Modells zur Beschreibung der Entwicklung von PCK. Dies birgt u. a. folgende Implikationen für die Lehrer/-innen-Bildung: (a) Die fachliche und bildungswissenschaftliche Ausbildung unterstützt den Aufbau von PCK, kann die fachdidaktische Ausbildung jedoch nicht ersetzen. (b) Fachliche und bildungswissenschaftliche Inhalte müssen bereits in der universitären Lehre zusammengeführt, da im transformativen Modell nicht von einer eigenständigen Integrationsleistung der Studierenden ausgegangen wird. (c) Die Fachdidaktik zeigt „best practice“ auf und bereitet angehende Biologielehrkräfte damit auf möglichst viele Unterrichtssituation vor. Wissenschaftliches Denken als fächerübergreifende Kompetenz im Lehramt: Analysen zur Kompetenzstruktur Stefan Hartmann1, Annette Upmeier zu Belzen1, Dirk Krüger2 1 Humboldt-Universität zu Berlin, 2Freie Universität Berlin THEORETISCHER HINTERGRUND UND FORSCHUNGSFRAGEN Das Projekt Ko-WADiS hat zum Ziel, die Entwicklung von Kompetenzen des wissenschaftlichen Denkens bei Lehramtsstudierenden der Biologie, Chemie und Physik zu erfassen. Wissenschaftliches Denken (Scientific Reasoning) wird dabei als domänenspezifische Problemlösefähigkeit aufgefasst, die Personen zum erfolgreichen Umgang mit empirischwissenschaftlichen Problemstellungen befähigt (Mayer, 2007). Diese Kompetenz manifestiert sich beim wissenschaftlichen Arbeiten, wenn einzelne Schritte eines idealtypischen Forschungsprozesses angemessen zur Lösung naturwissenschaftlicher Probleme angewendet werden. Zur Erfassung der Kompetenz wurde ein schriftlicher Test mit 123 Multiple-Choice-Items entwickelt. Es wurden verschiedene Analysen zur Beurteilung der Validität durchgeführt (Hartmann, Mathesius, Stiller, Straube, Krüger & Upmeier zu Belzen, 2015; Hartmann, Upmeier zu Belzen, Krüger & Pant, 2015). Eine wesentliche Quelle für Validitätsevidenz stellt die interne Struktur eines Tests dar (AERA, APA & NCME, 2014). Inwieweit sich die empirische Struktur der mit dem Test erfassten Kompetenz mit theoretischen Vorhersagen deckt, wurde im Projekt Ko-WADiS bereits während der Testentwicklung im Rahmen einer Pilotierungsstudie untersucht. Die Ergebnisse dieser Studie stützten die Annahme, dass die Kompetenz des wissenschaftlichen Denkens eine eindimensionale Struktur aufweist und domänenübergreifend auf Kontexte aller empirisch arbeitenden Naturwissenschaften übertragbar ist. Dies zeigte sich in hohen Korrelationen zwischen den Teilleistungen der Aufgaben mit biologischen, chemischen und physikalischen Kontexten. Eine dem Längsschnitt vorgeschaltete Normierung des Testinstruments in allen zu testenden Studierendenkohorten stand bislang aus. Vor der längsschnittlichen Erhebung war zudem zu prüfen, inwieweit die psychometrischen Eigenschaften des Tests in den unterschiedlichen Studierendenkohorten invariant sind. Somit ergaben sich folgende Fragestellungen: 1) Bilden die mit dem Instrument erhobenen Leistungen die theoretisch vorhergesagte eindimensionale Kompetenzstruktur ab? 2) Bilden die mit dem Instrument erhobenen Leistungen die theoretisch vorhergesagte Übertragbarkeit über Fächergrenzen (Biologie, Chemie und Physik) ab? 3) Sind die psychometrischen Kennwerte hinsichtlich Dimensionalität, Reliabilität, Reihenfolge der Itemschwierigkeiten und Korrelationen zwischen den Fächern in den zu testenden Studienkohorten invariant? METHODE Zur Prüfung der Forschungsfragen wurden die 123 Items des Ko-WADiS-Testinstruments in einem Balanced Incomplete Block Design bei 2058 Bachelor- und 381 Masterstudierenden der Freien Universität Berlin und der Humboldt-Universität zu Berlin eingesetzt. Es handelt sich um Studierende der Fächer Biologie, Chemie und Physik mit und ohne Lehramtsoption. Die im bevorstehenden Längsschnitt zu erfassenden Kohorten sind in diesen Gruppen querschnittlich vollständig abgedeckt. Auf Basis der Multiple-Choice-Antworten der Studierenden wurden mit ein- und mehrdimensionalen Verfahren der Item-Response-Theorie (IRT) Item- und Personenparameter geschätzt. Neben der eindimensionalen Skalierung kamen zum Einsatz: eine zweidimensionale Skalierung (Kompetenzen im Bereich „naturwissenschaftliche Untersuchungen“ und „naturwissenschaftliche Modellbildung“), eine dreidimensionale Skalierung (Kompetenzen des wissenschaftlichen Denkens anhand von Kontexten der Fächer Biologie, Chemie und Physik) sowie eine siebendimensionale Skalierung (Kompetenzen in den Bereichen „Fragen formulieren“, „Hypothesen generieren“, „Untersuchungen planen“, „Daten auswerten“, „Zweck von Modellen“, „Testen von Modellen“ und „Ändern von Modellen“). Personenfähigkeiten wurden jeweils in Form von Plausible Values geschätzt. Zusammenhänge zwischen Teilkompetenzen wurden als latente Korrelationen direkt im IRT-Modell modelliert. Die jeweilige Passung zwischen modellhaften Annahmen und empirischer Datenstruktur wurde über geeignete Informationsparameter (BIC, CAIC) verglichen. ERGEBNISSE Sowohl die Informationskriterien BIC und CAIC als auch die latenten Korrelationen der Dimensionen in den mehrdimensionalen Modellen sprechen deutlich für eine eindimensionale Fähigkeitsstruktur. Dieser Befund deckt sich sowohl mit den theoretischen Annahmen als auch mit den Ergebnissen der Pilotierungsstudie. Hohe latente Korrelationen zwischen den Teilleistungen in Biologie, Chemie und Physik (.76 ≤ r ≤ .87) sprechen für einen starken Generalfaktor und eine hohe Übertragbarkeit der Kompetenz über Fächergrenzen hinweg. Analysen, die getrennt nach den Studierendengruppen Bachelor und Master durchgeführt wurden, ergeben ebenfalls jeweils die beste Modellpassung für die eindimensionale Skalierung sowie nahezu identische Werte für Reliabilität, Reihenfolge der Itemschwierigkeiten und Korrelationen zwischen den Fächern. Mit den Befunden ist eine wichtige Voraussetzung für die bevorstehende längsschnittliche Kompetenzerfassung vom Studienbeginn bis zum Studienende erfüllt. Quo Vadis Bildungswissenschaften in der Lehrerbildung: Unterschiede zwischen verschiedenen Formen des Vorbereitungsdienstes Olga Kunina-Habenicht1, Detlev Leutner2, Tina Seidel3, Ewald Terhart4, Mareike Kunter1 1 Johann Wolfgang Goethe-Universität, 2Universität Duisburg-Essen, 3Technische Universität München, 4Westfälische WilhelmsUniversität Münster THEORETISCHER HINTERGRUND Die Lehrerbildung in Deutschland ist in eine überwiegend theoretisch orientierte universitären Phase und eine stärker auf die Praxis ausgerichtete zweite Phase (Vorbereitungsdienst) strukturiert. In Nordrhein-Westfalen wurde der Vorbereitungsdienst 2011 von 24 Monaten auf 18 Monate verkürzt. Als neue Ausbildungselemente wurden u.a. eine personenorientierte Beratung mit Coaching-Elementen und ein Eingangs- und Perspektivgespräch eingeführt, die die Qualität der Ausbildung verbessern sollten (Gerdes & Annas-Sieler, 2011). Unter bildungswissenschaftlichem Wissen (BW) werden fachunspezifische universitäre Studieninhalte zusammengefasst, an deren Vermittlung i.d.R. mehrere Disziplinen beteiligt sind. Im BilWiss-Forschungsprogramm wurde ein neuer Wissenstest konstruiert, der über bestehende Verfahren zur Messung von pädagogisch-psychologischem Wissen hinausgeht (für eine Übersicht siehe Voss, Kunina-Habenicht, Hoehne, & Kunter, 2015), indem er theoretisches universitäres Wissen fokussiert. In bisherigen Vorarbeiten (Linninger et al., 2015) hat sich empirisch eine sechsdimensionale Struktur des BW gezeigt mit eher unterrichtsnahen Inhaltsbereichen (u.a. Unterrichtsgestaltung, Lernen und Entwicklung) und eher unterrichtsfernen Bereichen (u.a. Bildungstheorie, Lehrerberuf als Profession). In diesem Beitrag wird explorativ untersucht, ob die Einführung der neuen Lerngelegenheiten im reformierten VD den Wissensaufbau positiv begünstigt. Konkret werden zwei Forschungsfragen untersucht: a) ob sich der Stand des BW zwischen den beiden Formen des VD am Ende des VD unterscheidet und b) ob die Entwicklungsverläufe in beiden Formen des VD vergleichbar sind. Dabei ist denkbar, dass die negativen Effekte der zeitgleichen Verkürzung des VD den potentiellen positiven Effekten durch die neuen Ausbildungselemente entgegenwirken, so dass sich empirisch keine Unterschiede im Wissensaufbau in beiden Formen des VD zeigen. Da die Lerngelegenheiten im VD praxisorientiert gestaltet sind und der Test überwiegend theoretisches Wissen erfasst, ist in Bezug auf die Wissensentwicklung ein geringer Anstieg in den unterrichtsnahen Inhaltsbereichen zu erwarten, während in den unterrichtsfernen Inhaltsbereichen Wissensrückgang aufgrund von Vergessenseffekten wahrscheinlich ist. METHODE Zur Beantwortung der Forschungsfragen werden längsschnittliche Daten herangezogen. In Bezug auf die erste Fragestellung werden zwei Messzeitpunkte betrachtet. Zum ersten Messzeitpunkt (t1) bearbeiteten 3273 Referendar(inn)e(n) (zum Beginn des VD) im Frühjahr 2011 den Wissenstest und am Ende des VD zusätzlich eine Teilstichprobe (n=626) im Winter 2013/14 (t2). Zur Modellierung der Wissensentwicklung werden zusätzlich Daten ein Jahr nach Beginn als selbständige Lehrkraft (t3; n=ca. 160) herangezogen. Zum ersten Messzeitpunkt wurde die Langfassung des Wissenstests eigesetzt, während zu t2 eine Kurzfassung des Wissenstests (Papierversion) bearbeitet wurde. Zum dritten Messzeitpunkt wurde die Kurzfassung des Wissenstests online bearbeitet. Die Langfassung des Wissenstests beinhaltet 289 Items und wurde im Rotationsdesign eingesetzt, während die Kurzform 56 Items umfasst. Bei den Analysen werden zwei Personengruppen (Kohorte K1: letzter Jahrgang im bisherigen VD von 24 Monaten; Kohorte K2: erster Jahrgang im reformierten VD von 18 Monaten) zu Beginn und am Ende des VD miteinander verglichen. Die Kohorten K1 und K2 waren zu Beginn des VD vergleichbar hinsichtlich der demografischen Angaben und der Abiturnote (Kunter, Linninger, Schulze-Stocker, Kunina-Habenicht, & Lohse-Bossenz, 2013). Als Indikatoren für die Wissensleistungen werden IRT-Scores aus eindimensionalen 2-PL-Partial-Credit-Modellen verwendet. Die Vergleiche zwischen K1 und K2 erfolgten mittels des generalisierten linearen Modells mit Kovariaten (Abiturnote, Muttersprache, Lehramtszugang). Für den Vergleich der Wissensentwicklung in beiden Kohorten werden Latent-Change-Modelle und Multigruppenmodelle geschätzt. ERGEBNISSE K2 wies zu Beginn des VD signifikant bessere Werte in den Dimensionen Unterrichtsgestaltung und Schulorganisation als die K1 auf (unter Kontrolle der Abiturnote, Muttersprache und Lehramtszugangs). Die Leistungen in allen sechs Wissensdimensionen am Ende des VD unterschieden sich nicht signifikant zwischen den Kohorten (unter Kontrolle der Abiturnote, Muttersprache und Testleistung zu t1). Eine mögliche Interpretation der Ergebnisse neben der oben erörterten Kompensationshypothese durch die gleichzeitige Verkürzung des VD ist, dass K1 im alten VD Wissen aufholt. Latent-Change-Modelle sind Gegenstand aktueller Analysen. Die Ergebnisse werden diskutiert in Bezug auf methodische Limitationen (bspw. das quasi-experimentelle Studiendesign und verschiedene Testformen zu verschiedenen Messzeitpunkten) und Implikationen für die Lehrerbildung. Motivationale Orientierungen von Biologielehrkräften als Aspekt professioneller Kompetenz Ute Harms, Daniela Mahler IPN THEORETISCHER HINTERGRUND Das Modell professioneller Kompetenz von Lehrkräften (Baumert & Kunter, 2006) beschreibt unterschiedliche Kompetenzaspekte, die eine erfolgreiche Lehrkraft ausmachen. Aufgrund der hohen Belastung im Berufsalltag von Lehrkräften sind neben kognitiven Kompetenzaspekten auch motivationale Orientierungen von Bedeutung. Diese Studie betrachtet zwei Domänen der motivationalen Orientierungen: (1) Selbstwirksamkeit und (2) Enthusiasmus. Bandura (1977) beschreibt Selbstwirksamkeit als die Erwartung, dass aufgrund der eigenen Kompetenz eine Handlung erfolgreich ausgeführt werden kann. Enthusiasmus von Lehrkräften wird als affektive Orientierung beschrieben, die sich sowohl auf das Unterrichtsfach als auch auf das Unterrichten bezieht (Kunter, Frenzel, Nagy, Baumert & Pekrun, 2011). Selbstwirksamkeit und Enthusiasmus sind neben ihrer Relevanz für die Berufszufriedenheit von Lehrkräften (Moè, Pazzaglia & Ranconi, 2001) ebenfalls wichtig für die Wahl eines Tätigkeitsfeldes, die Performanz sowie die Ausdauer in diesem Tätigkeitsfeld (Wigfield & Eccles, 2000). Aufgrund dieser Relevanz und unter der Annahme, dass motivationale Orientierungen durch externe Faktoren beeinflussbar sind (Kunter, 2013), stellt sich die Frage, wie sich motivationale Orientierungen fördern lassen. Dafür ist die Identifikation konkreter Lerngelegenheiten wichtig sowie das Verständnis der Zusammenhänge zwischen motivationalen Orientierungen und den kognitiven Aspekten der professionellen Kompetenz (hier: fachbezogenes Professionswissen). FRAGESTELLUNGEN 1. Welcher Zusammenhang besteht zwischen (a) Selbstwirksamkeit, (b) Enthusiasmus für das Fach Biologie sowie (c) Enthusiasmus für das Unterrichten und bestimmten Lerngelegenheiten (wahrgenommene Qualität der Universitätsausbildung, Teilnahme an Fortbildungsveranstaltungen, Lehrerfahrung, Selbststudium (z. B. Rezeption von Primärliteratur))? 2. Welcher Zusammenhang besteht zwischen (a) Selbstwirksamkeit, (b) Enthusiasmus für das Fach Biologie sowie (c) Enthusiasmus für das Unterrichten und dem fachbezogenen Professionswissen von Biologielehrkäften (Fachwissen, fachdidaktisches Wissen)? METHODE An dieser Studie nahmen 134 Biologielehrkräfte (Alter: M=43,7 Jahre (SD=10,3), 75,4% weiblich) teil. Selbstwirksamkeit (10 Items, rho=,71; Schmitz & Schwarzer, 2000), Enthusiasmus für das Fach Biologie (3 Items, rho=,73; Baumert et al. 2009), Enthusiasmus für das Unterrichten (2 Items, rho=,79; Baumert et al., 2009) sowie das fachbezogene Professionswissen (Fachwissen: 19 Items, rho=,68; fachdidaktisches Wissen: 9 Items, rho=,78; Großschedl, Mahler, Kleickmann & Harms, 2014) wurden mit Fragebögen erhoben. Die Abfrage der verschiedenen Lerngelegenheiten erfolgte mit geschlossenen Items entsprechend der Studie von Großschedl et al., 2014. Zuerst wurde mithilfe einer konfirmatorischen Faktorenanalyse überprüft, ob sich die drei angenommenen Domänen motivationaler Orientierungen auch empirisch abbilden lassen. Um die Frage nach den Zusammenhängen zwischen motivationalen Orientierungen und Lerngelegenheiten nachzugehen, wurde unter Berücksichtigung der faktoriellen Struktur eine Regression der latenten Faktoren auf manifeste Kovariaten durchgeführt (MIMICModell, Muthén & Muthén, 2007). Korrelationsanalysen geben Auskunft über die Zusammenhänge zwischen motivationalen Orientierungen und den Domänen des fachbezogenen Professionswissens. ERGEBNISSE UND FAZIT Die konfirmatorische Faktorenanalyse zeigt, dass sich Selbstwirksamkeit, Enthusiasmus für das Fach Biologie sowie Enthusiasmus für das Unterrichten empirisch trennen lassen (3-faktorielles Modell: CFI=0,98, TLI=0,97, RSMEA=0,02, TRd = 63,89, df=3, p<,001). Die Ergebnisse der Regressionsanalyse zeigen Zusammenhänge zwischen Selbstwirksamkeit bzw. Enthusiasmus für das Unterrichten und der wahrgenommenen Qualität der Lehrerausbildung, der Teilnahme an Fortbildungsveranstaltungen sowie der Häufigkeit des Selbststudiums. Korrelationsanalysen zeigen einen marginal signifikanten positiven Zusammenhang zwischen Selbstwirksamkeit und fachdidaktischem Wissen (r=,17, p<,07) und einen signifikant positiven Zusammenhang zwischen Enthusiasmus für Biologie und fachdidaktischem Wissen (r=,22, p<,04). Die Ergebnisse betonen die Relevanz der Lehreraus- und -fortbildung für die Förderung motivationaler Orientierungen von Lehrkräften. Da sich Lehrerbildung vor allem auf Wissensaspekte bezieht, geben die gefundenen Zusammenhänge zum fachdidaktischen Wissen weitere Hinweise für die Förderung motivationaler Orientierungen. ID: 402 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Soziologie Thematisches Cluster: Bildungsgerechtigkeit/ Migration, Motivation und Emotion Stichworte: Akkulturation, psychologische Adaption, soziokulturelle Adaption, Zuwanderungshintergrund, Zweitsprache Schulische Adaption von Heranwachsenden mit Zuwanderungshintergrund Chair(s): Aileen Edele (Humboldt-Universität zu Berlin), Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen, HU Berlin) Diskutant(en): Heike Solga (Wissenschaftszentrum Berlin für Sozialforschung) In Anlehnung an Ward (1996) lassen sich zwei übergeordnete Aspekte der schulischen Anpassung unterscheiden: die soziokulturelle Adaption, also Verhaltensweisen und Fähigkeiten zur Bewältigung des Schulalltags (z.B. Beherrschung der Unterrichtssprache, schulische Kompetenzen), sowie die psychologische Adaption, also affektive Reaktionen auf den Schulkontext (z.B. schulbezogenes Wohlbefinden, Verbundenheit mit Schule/Peers). Es ist anzunehmen, dass Heranwachsende mit Zuwanderungshintergrund hinsichtlich beider Aspekte vor besonderen Herausforderungen stehen. Sie besitzen oft geringer ausgeprägte Fähigkeiten in der Unterrichtssprache Deutsch und erreichen im Durchschnitt ein geringeres schulisches Kompetenzniveau als Gleichaltrige ohne Zuwanderungshintergrund (Stanat et al., 2010). Mit Bezug auf die psychologische Adaption ist die Befundlage dagegen weniger eindeutig. So berichten Heranwachsende aus zugewanderten Familien einerseits häufig ein hohes schulisches Wohlbefinden (Briones & Tabernero, 2012), andererseits können sie aber besonderen emotionalen Belastungen ausgesetzt sein, etwa durch divergierende Erwartungen von schulischem und familiärem Kontext (Kumar & Maehr, 2010; Phinney et al., 2000) oder aufgrund von Diskriminierungserfahrungen (Wong et al., 2003). Das Symposium beschäftigt sich mit Faktoren, die die psychologische und die soziokulturelle Adaption von Heranwachsenden mit Zuwanderungshintergrund an den Kontext Schule beeinflussen. Zwei Vorträge fokussieren den psychologischen Aspekt schulischer Adaption, der bislang wenig untersucht wurde. Der erste Beitrag (Rjosk et al.) geht der Frage nach, ob Kinder mit Zuwanderungshintergrund sich emotional stärker mit ihren Peers verbunden fühlen, wenn sie eine Klasse mit hohem Anteil an Schülerinnen und Schülern aus zugewanderten Familien besuchen. Zudem wird geprüft, ob die emotionale Verbundenheit mit den Peers die Lernfreude der Kinder fördert. Der zweite Vortrag (Schachner et al.) untersucht, ob das interkulturelle Schulklima das Schulzugehörigkeitsgefühl von Heranwachsenden mit und ohne Zuwanderungshintergrund begünstigt und ob es sich darüber vermittelt positiv auf ihre schulisch-psychologische Anpassung auswirkt. Der dritte Beitrag (Seuring & Strobel) befasst sich mit dem Sprachgebrauch von Jugendlichen aus zugewanderten Familien und untersucht, wie sich der Gebrauch der Sprache in unterschiedlichen Kontexten auf die Kompetenz in der Unterrichtssprache Deutsch auswirkt, die als wichtiger Indikator der soziokulturellen Adaption gilt. Der vierte Beitrag (Schotte et al.) beschäftigt sich mit beiden Aspekten der schulischen Adaption und untersucht differenzielle Zusammenhänge der kulturellen Identität mit der psychologischen und der soziokulturellen Anpassung von Jugendlichen mit Zuwanderungshintergrund. Insbesondere wird die Annahme geprüft, dass die ethnische Identität besonders positiv mit der psychologischen Adaption assoziiert ist, während die soziokulturelle Adaption besonders von der nationalen Identität abhängt. Die Vortragenden sind in unterschiedlichen Disziplinen verortet, nämlich der Psychologie (Rjosk, Schachner), der Soziologie (Seuring) und den Erziehungswissenschaften (Schotte). Diskutiert wird das Symposium primär aus einer soziologischen Perspektive (Solga). Beiträge des Symposiums Effekte zuwanderungsbezogener Klassenzusammensetzung auf die psychosoziale Anpassung von Grundschulkindern Camilla Rjosk1, Dirk Richter2, Oliver Lüdtke3 1 Institut zur Qualitätsentwicklung im Bildungswesen, HU Berlin, 2Bergische Universität Wuppertal, 3IPN *Theoretischer Hintergrund* Schulleistungsstudien haben wiederholt zuwanderungsbezogene und soziale Disparitäten in schulischen Leistungen identifiziert(z.B. OECD, 2010). Ferner konnte gezeigt werden, dass diese Leistungsunterschiede nicht nur durch individuelle Lernvoraussetzungen, sondern auch durch die Zusammensetzung der Schülerschaft in der Klasse bzw. der Schule beeinflusst wird. Demnach besteht zwischen dem Anteil an benachteiligten Schülerinnen und Schülern (SuS) in der Klasse und der individuellen Leistungsentwicklung ein negativer Zusammenhang (vgl. Dumont, Neumann, Maaz & Trautwein, 2013; Van Ewijk & Sleegers, 2010a, 2010b). Die Auswirkungen der Klassenzusammensetzung auf Merkmale psychosozialer Anpassung, wie das Verbundenheitsgefühl zu den Peers oder die Lernfreude, wurden indes kaum untersucht. Emotionale Verbundenheit ist eine von drei Kontextbedingungen des Lernumfelds, die in der Selbstbestimmungstheorie als motivationsförderlich benannt werden (Deci & Ryan, 2000). Gerade für SuS mit Zuwanderungshintergrund kann das Verbundenheitsgefühl mit Peers von besonderer Bedeutung sein, da sie oft soziale und kulturelle Hürden überwinden müssen, um sich als Teil der Schulkultur wahrzunehmen (vgl. Kumar & Maehr, 2010). Eine Grundlage dafür, dass Menschen Nähe zueinander aufbauen, Freundschaften schließen und sich verbunden miteinander fühlen, ist der social identity theory (Tajfel & Turner, 1986) und dem similarity attraction paradigm (Byrne, 1971) zufolge das Ausmaß wahrgenommener Ähnlichkeit mit der anderen Person. Es wird angenommen, dass die zuwanderungsbezogene Herkunft von SuS ein Merkmal ist, das für Ähnlichkeitswahrnehmungen eine wichtige Rolle spielt. Empirisch gibt es Hinweise aus dem US-amerikanischen Raum dafür, dass in weniger heterogenen Schulen oder Klassen SuS das Schulklima insgesamt als fairer und förderlicher für interethnischen Austausch wahrnehmen (Benner et al., 2008), SuS einer ethnischen Minderheit weniger Diskriminierung empfinden (Seaton & Yip, 2009) und die gegenseitige Unterstützung sowie die Akzeptanz für SuS einer ethnischen Minderheit größer sind (Postmes & Branscombe, 2002). Detaillierte Untersuchungen der Bedeutung, die der Zuwanderungshintergrund der Peers für das Verbundenheitsgefühl und die Lernfreude von SuS mit Zuwanderungshintergrund im Vergleich zu SuS ohne Zuwanderungshintergrund hat, fehlen bislang weitgehend. *Fragestellung* Der vorliegende Beitrag untersucht ausgehend von dieser Forschungslücke folgende Fragestellungen: (1) Fühlen sich SuS mit Zuwanderungshintergrund stärker mit ihren Peers verbunden, wenn sie in Klassen mit einem höheren Anteil von SuS mit Zuwanderungshintergrund unterrichtet werden? (2) Steht das Verbundenheitsgefühl der SuS mit der Lernfreude in diesen Klassen in positivem Zusammenhang? *Methode* Die Analysen beziehen sich auf Daten des IQB-Ländervergleichs 2011 (Stanat et al., 2012) mit 18.762 SuS der 4. Jahrgangsstufe (903 Klassen). Der Zuwanderungshintergrund der SuS wird über das Geburtsland der Eltern operationalisiert. Zur Analyse wurden in einem ersten Schritt Mehrebenenstrukturgleichungsmodelle mit dem Verbundenheitsgefühl als abhängiger Variable und dem Klassenanteil von SuS mit Zuwanderungshintergrund als unabhängiger Variable berechnet. In einem zweiten Schritt wurden die Klassenzusammensetzung und das Verbundenheitsgefühl mit den Peers als Prädiktoren der Lernfreude der SuS untersucht. Kontrollvariablen auf Individualebene waren kognitive Grundfähigkeiten als Proxy für Vorwissen, sozioökonomischer Status und Geschlecht der SuS sowie auf Klassenebene mittlere Klassenleistung, mittlerer SES und Geschlechterzusammensetzung. *Ergebnisse* Die Befunde weisen darauf hin, dass die zuwanderungsbezogene Klassenzusammensetzung differentiell mit dem Verbundenheitsgefühl von SuS mit Zuwanderungshintergrund im Vergleich zu SuS ohne Zuwanderungshintergrund assoziiert ist (β = 0.23, SE = 0.04 p < .05). Mit steigendem Anteil von SuS mit Zuwanderungshintergrund fühlen sich SuS mit Zuwanderungshintergrund stärker mit ihren Peers verbunden, wobei sie sich durchschnittlich weniger verbunden mit ihren Peers fühlen als SuS ohne Zuwanderungshintergrund. Ein erhöhtes Verbundenheitsgefühl wiederum hängt positiv mit der individuellen Lernfreude der SuS zusammen (β = 0.30, SE = 0.02 p < .05). Die Ergebnisse verweisen somit auf die Relevanz der Klassenzusammensetzung als Lernumfeld, das förderlich für die soziale Anpassung von SuS mit Zuwanderungshintergrund ist. Effekte des interkulturellen Klimas auf schulisches Zugehörigkeitsgefühl und schulisch-psychologische Anpassung von Kindern mit und ohne Migrationshintergrund Maja Schachner1, Miriam Schwarzenthal1, Fons J. R. Van de Vijver2, Peter Noack3, Linda Juang1 1 Universität Potsdam, 2Tilburg University (NL), North-West University (SA), 3Friedrich-Schiller-Universität Jena Basierend auf zwei unterschiedlichen Ansätzen aus dem Diversity Management in der Organisationsentwicklung (vergleiche z.B. Ely & Thomas, 2001) werden auch an Schulen zwei Ansätze im Hinblick auf den Umgang mit kultureller Diversität unterschieden (vergleiche z.B. Hachfeld, Hahn, Schroeder, Anders, & Kunter, 2015), die sich im interkulturellen Klima niederschlagen: Zum einen Bestrebungen der _Gleichbehandlung und Inklusion_, und zum anderen Bestrebungen der _Wertschätzung kultureller Vielfalt_. Schulen, die sich vor allem für _Gleichbehandlung und Inklusion_ einsetzen, betonen eher kulturelle Gemeinsamkeiten und setzen sich gegen Diskriminierung und für die gleiche Teilhabe aller Schüler ein. Wenn eine Schule sich dagegen eher der _Wertschätzung kultureller Vielfalt_ verschreibt, werden kulturelle Unterschiede nicht heruntergespielt sondern bewusst thematisiert und als Bereicherung gesehen. Die Kombination beider Ansätze wirkt sich positiv auf die schulisch-psychologische Anpassung von Schülern mit Migrationshintergrund aus, wobei die Effekte von _Gleichbehandlung und Inklusion_ über eine höhere Orientierung zur Mehrheitskultur vermittelt werden und die Effekte von _Wertschätzung kultureller Vielfalt_ über eine höhere Orientierung zur Herkunftskultur (Schachner, Noack, Van de Vijver, & Eckstein, in press). In der gegenwärtigen Studie untersuchen wir, (1) inwiefern sich beide Ansätze bzw. deren Manifestation im wahrgenommenen Klassenklima positiv auf das Schulzugehörigkeitsgefühl und darüber auf die schulisch-psychologische Anpassung aller Schüler (mit und ohne Migrationshintergrund) auswirken, und (2) inwiefern die Betrachtung des interkulturellen Klimas bisher inkonsistente Befunde zu Effekten der ethnischen Zusammensetzung der Schulklasse auf die schulisch-psychologische Anpassung von Schülern mit und ohne Migrationshintergrund aufklären kann. Die Stichprobe umfasst 1591 Sekundarschüler der 6. Klassenstufe, die für eine Fragebogenstudie zu Akkulturationsprozessen an multikulturellen Schulen in Baden-Württemberg rekrutiert wurden. Davon haben 965 Schüler einen Migrationshintergrund (mindestens ein Elternteil aus einem anderen Land; insgesamt 83 Herkunftsländer), wobei der Großteil (85%) in Deutschland geboren wurde. Das Durchschnittsalter aller teilnehmenden Schüler beträgt 11,5 Jahre; 49,6% von ihnen sind weiblich. Die Schüler repräsentieren 88 Schulklassen, die im Hinblick auf ihre ethnische Zusammensetzung variieren. So haben zwischen 8% und 100% der Schüler in einer Klasse einen Migrationshintergrund (im Mittel 60%) und die Schüler mit Migrationshintergrund in einer Klasse variieren in der Diversität ihrer Herkunftsländer zwischen einem Fraktionalisierungs-Index (Alesina, Devleeschauwer, Easterly, Kurlat, & Wacziarg, 2003) von .42 bis .91 (M = .79, SD = .11). Alle Variablen (wahrgenommenes Klassenklima und schulisch-psychologische Anpassung) wurden im Selbstbericht erhoben. Mehrgruppenstrukturgleichungsmodelle auf individueller Ebene unter Kontrolle der ethnischen Zusammensetzung der Schulklasse und des individuellen sozioökonomischen Status bestätigten, dass die Manifestation beider Ansätze im wahrgenommenen Klassenklima gleichermaßen in beiden Gruppen (mit und ohne Migrationshintergrund) den erwarteten positiven Effekt auf das Schulzugehörigkeitsgefühl (standardisiertes β = 0,38 , p < 0,001 für _Gleichbehandlung und Inklusion_; β = 0,09, p < 0,001 für _Wertschätzung kultureller Vielfalt_) und darüber auf Variablen der schulisch-psychologischen Anpassung (allgemeine Lebenszufriedenheit; β = 0,36, p < 0,001; und akademisches Selbstkonzept; β = 0,52, p < 0,001) haben. _Gleichbehandlung und Inklusion_ hatte zudem einen direkten positiven Effekt auf allgemeine Lebenszufriedenheit bei Kindern mit Migrationshintergrund (β = 0,12, p < 0,001). Ein geringerer Anteil von Schülern mit Migrationshintergrund schien in beiden Gruppen das Schulzugehörigkeitsgefühl zu begünstigen (β = .19, p < 0.001), während mehr Vielfalt unter den Schülern mit Migrationshintergrund nur bei deutschen Schülern einen positiven Effekt hatte (β = 0.14, p < 0,001). Das Structural-WeightsModell mit zwei freigesetzten Pfaden wies eine sehr gute Passung auf (χ2/df = 2,37; RMSEA = 0,04; TLI = 0,97; CFI = 0,98). In Mehrebenenanalysen soll zusätzlich überprüft werden, ob sich ein ähnlicher Zusammenhang auch auf Klassenebene zeigt bzw. ob Effekte der ethnischen Zusammensetzung der Schulklasse durch die individuelle Wahrnehmung des interkulturellen Klassenklimas moderiert werden. Die Ergebnisse werden im Hinblick auf Implikationen für die empirisch-pädagogische Forschung zur Rolle von kultureller Diversität in Schule und Bildungsprozessen sowie für die Anwendung in schulischer Praxis und Schulpolitik diskutiert. Spracherhalt oder Sprachverlagerung? Erstsprachgebrauch und Zweitspracherwerb bei Jugendlichen mit Migrationshintergrund Julian Seuring, Strobel Bernadette Universität Bamberg Kenntnisse in der Sprache des Aufnahmelandes stellen eine zentrale Ressource für die schulische Adaption von Zuwanderern und ihren Nachkommen dar. Zweitsprachkompetenzen sind zentral für andere Aspekte der soziokulturellen Adaption, wie etwa den schulischen Kompetenzerwerb (Stanat & Christensen, 2006), stehen aber auch mit Aspekten der psychologischen Adaption, wie dem schulischen Wohlbefinden, in Zusammenhang (Wolfgramm et al., 2010). Geringe Zweitsprachkompetenzen von Jugendlichen mit Zuwanderungshintergrund werden oftmals auf eine herkunftssprachliche Kommunikation innerhalb der Familie zurückgeführt (z.B. Müller & Stanat, 2006; Verwiebe & Riederer, 2013). Weitere Kontexte des Sprachgebrauchs, z.B. außerhalb der Familie oder der Medienkonsum, finden in der bisherigen Forschung dagegen nur selten Berücksichtigung. Der vorliegende Beitrag widmet sich dieser Lücke und beschreibt den Sprachgebrauch von Jugendlichen mit Zuwanderungshintergrund in verschiedenen alltagsrelevanten Kontexten. Darüber hinaus wird untersucht, ob sich die mit der Familiensprache verbundenen Nachteile in den Zweitsprachkompetenzen durch die Muster des Sprachgebrauchs in anderen Kontexten verstärken oder aber reduzieren. Ausgehend von einem allgemeinen Modell des Zweitspracherwerbs (Esser, 2006) ist die Verwendung der Zweitsprache mit einem verbesserten Zugang zu dieser Sprache sowie einer erhöhten Motivation diese zu erlernen verbunden. Beides sollte sich positiv auf den Kompetenzerwerb in der Zweitsprache niederschlagen. Demzufolge sollten neben der Familiensprache auch alle weiteren Gelegenheiten des Sprachgebrauchs ausschlaggebend für den Zweitspracherwerb sein, und dies in besonderem Maße dann, wenn der familiäre Kontext nur einen eingeschränkten Zugang bietet. Anhand der Daten des Nationalen Bildungspanels (NEPS) zu Schülerinnen und Schülern der neunten Klasse (Startkohorte 4) lässt sich differenzieren, welche Sprache jugendliche Zuwanderer mit ihren Eltern, Geschwistern und Peers sowie beim Medienkonsum verwenden. Die Muster des Sprachgebrauchs werden zudem für verschiedene Herkunftsgruppen und Zuwanderungsgenerationen gesondert betrachtet. Die Analyse umfasst Informationen zu 910 Jugendlichen aus der Türkei, 481 aus Polen, 759 aus der ehemaligen Sowjetunion und 2.579 Fälle aus sonstigen Herkunftsländern. Um neben den aggregierten Verteilungen des Sprachgebrauchs in einzelnen Kontexten zusätzlich den kontextübergreifenden Sprachgebrauch auf individueller Ebene zu analysieren, werden in einem zweiten Schritt sogenannte _Sprachgebrauchsprofile_ gebildet. Diese Profile geben Aufschluss darüber, in welchen Kontexten eine Person ausschließlich die Zweitsprache verwendet und in welchen sie zusätzlich die Herkunftssprache gebraucht. Mittels linearer Regressionsmodelle wird geprüft, ob sich zwischen den Sprachgebrauchsprofilen Unterschiede in der Deutschkompetenz zeigen. Die Ergebnisse eines standardisierten Leseverstehenstests (Haberkorn et al., 2012) dienen dabei als Indikator für die Zweitsprachkompetenz. Deskriptiv zeigt sich zunächst, dass die Herkunftssprache mit den Eltern (58%) häufiger verwendet wird als mit Geschwistern (39%). Mit Peers wird hingegen überwiegend Deutsch gesprochen (82%), während beim Medienkonsum auch die Herkunftssprache relativ oft genutzt wird (48%). Weiterhin kommunizieren türkischstämmige Jugendliche in allen Kontexten häufiger in der Herkunftssprache als Jugendliche, deren Familien aus Polen oder der ehemaligen Sowjetunion stammen. Bei Betrachtung der Sprachgebrauchsprofile zeichnet sich darüber hinaus eine maßgebliche Bedeutung der Familiensprache ab. Wird mit den Eltern ausschließlich Deutsch gesprochen, dann auch meist in allen anderen Kontexten. Jugendliche mit einer nichtdeutschen Elternsprache variieren hingegen stark hinsichtlich des Sprachgebrauchs in weiteren Kontexten. Besonders die Kommunikation im Freundeskreis und mit Mitschülerinnen und Mitschülern erweist sich hier als sehr heterogen. Entgegen den theoretischen Annahmen stehen diese heterogenen Muster allerdings kaum mit Unterschieden in der Lesekompetenz in Verbindung. Erhebliche Kompetenzunterschiede zeigen sich vorrangig in Abhängigkeit des Sprachgebrauchs mit den Eltern (ß = -0,29, SE = 0,04). Diese Unterschiede bleiben auch bei weiterer Berücksichtigung der verwendeten Sprache mit den Geschwistern und beim Medienkonsum nahezu konstant. Lediglich der Deutschgebrauch mit den Peers kann die mit der Familiensprache assoziierten Unterschiede in geringem Umfang reduzieren (ß = -0,23, SE = 0,04). Insgesamt verdeutlichen die Befunde die zentrale Rolle der Familiensprache für den Zweitspracherwerb, andere Kontexte sind diesbezüglich von nachrangiger Bedeutung. Dies bedeutet gleichzeitig aber auch, dass durch die Verwendung der Herkunftssprache mit den Geschwistern und beim Medienkonsum keine zusätzlichen Nachteile entstehen. Die Rolle der kulturellen Identität für das Wohlbefinden und den Bildungserfolg von Jugendlichen mit Zuwanderungshintergrund Kristin Schotte1, Aileen Edele1, Petra Stanat2 1 Humboldt-Universität zu Berlin, 2Institut zur Qualitätsentwicklung im Bildungswesen; HU Berlin Heranwachsende mit Zuwanderungshintergrund stehen im deutschen Bildungssystem vor besonderen Herausforderungen. Empirisch ist vielfach belegt, dass sie im Vergleich zu Gleichaltrigen ohne Zuwanderungshintergrund weniger günstige Muster in der Bildungsbeteiligung und im Kompetenzerwerb aufweisen (z.B. Pöhlmann et al., 2013). In diesen Aspekten der soziokulturellen Adaption, die sich allgemein auf den Erwerb kultureller Fertigkeiten zur Alltagsbewältigung bezieht, sind sie also benachteiligt. Günstigere Muster zeichnen sich hingegen für die psychologische Adaption, etwa das subjektive Wohlbefinden, ab: Heranwachsende mit Zuwanderungshintergrund berichten durchschnittlich ein ähnlich hohes oder höheres Wohlbefinden als Gleichaltrige ohne Zuwanderungshintergrund (z.B. Briones & Tabernero, 2012). Diese Diskrepanz zwischen soziokultureller und psychologischer Adaption erscheint paradox und wirft die Frage nach (zuwanderungs-)spezifischen Schutzfaktoren auf. Ein Faktor, der das subjektive Wohlbefinden der Heranwachsenden mit Zuwanderungshintergrund zu beeinflussen scheint, ist ihre kulturelle Identität, also die Orientierung am Herkunfts- bzw. Aufnahmekontext. Laut Branscombe et al. (1999, _recjectionidentification-model_) und Berry et al. (2006) ist die ethnische Identität (Identifikation mit dem Herkunftskontext) besonders förderlich für die psychologische Adaption, da dieses Zugehörigkeitsgefühl beispielsweise negative Erfahrungen, etwa wahrgenommene Diskriminierung, abschwächen kann. Hingegen wird die nationale Identität (Identifikation mit dem Aufnahmekontext) vor allem für die soziokulturelle Adaption als zentral angesehen. Zudem erachten Berry et al. (2006) eine Identifikation mit beiden Kontexten insgesamt als besonders förderlich. Bereits vorliegende Befunde bestätigen den positiven Zusammenhang zwischen ethnischer Identität und subjektivem Wohlbefinden (Berry et al., 2006; Smith & Silva, 2011). Außerdem werden positive Zusammenhänge zwischen nationaler Identität und anhand von schulbezogenen Einstellungen operationalisierter soziokultureller Adaption berichtet (Berry et al., 2006). In einigen Studien hat sich zudem eine starke Identifikation mit beiden Kontexten als förderlich für die anhand von Noten erfasste soziokulturelle Adaption erwiesen (z.B. Oysermann et al., 2003). Nur wenige Studien haben bislang jedoch die soziokulturelle Adaption mit standardisierten Leistungsmessungen operationalisiert, um mögliche Verzerrungen in den Lehrkrafturteilen zu berücksichtigen (Edele et al., 2013; Hannover et al., 2013), oder beide Formen der Adaption gleichzeitig mit ethnischer und nationaler Identität in Beziehung gesetzt (Berry et al., 2006). Bislang wurde die Hypothese des differenziellen Zusammenhangs der Identitätsdimensionen mit der psychologischen und soziokulturellen Adaption also kaum systematisch unter Einbeziehung standardisierter Leistungsmaße überprüft. Die vorliegende Studie setzt an dieser Forschungslücke an und prüft folgende Hypothesen: (1) Die ethnische Identität hängt enger mit der psychologischen als mit der soziokulturellen Adaption zusammen. (2) Die nationale Identität hängt enger mit der soziokulturellen als mit der psychologischen Adaption zusammen. (3) Besonders förderlich für psychologische und soziokulturelle Adaption ist eine hohe Ausprägung beider Identitätsdimensionen. Die Analysen wurden mit Daten des Nationalen Bildungspanels (NEPS) der 9. Klassenstufe (Schuljahr 2010/11) durchgeführt. Die Stichprobe umfasst N = 1443 Heranwachsende mit Zuwanderungshintergrund (56% Mädchen, MAlter = 14.8). Neben Skalen zur ethnischen und nationalen Identität (je vier Items, α = .90/.91) wurden Skalen zur Erfassung des globalen Selbstwertgefühls (10 Items, α = .83) und der globalen Lebenszufriedenheit (5 Items, α = .76) als Indikatoren für psychologische Adaption sowie standardisierte Leistungsmessungen im Leseverstehen (Haberkorn et al., 2012) und Mathematik (Duchhardt & Gerdes, 2013) als Indikatoren für soziokulturelle Adaption in die Analysen einbezogen. Unter Kontrolle relevanter Hintergrundcharakteristika (SES, Geschlecht, besuchte Schulform, Sprachgebrauch zuhause, Generationsstatus) wurden OLS-Regressionen mit robusten Standardfehlern berechnet, um die Mehrebenenstruktur in den Daten zu berücksichtigen. Erste Ergebnisse zeigen erwartungskonform einen engeren Zusammenhang der ethnischen Identität mit der psychologischen Adaption (Selbstwertgefühl: ß=0.18, p < .001/Lebenszufriedenheit: ß=0.12, p < .001) als mit der soziokulturellen Adaption (Leseverstehen: ß=-0.01, n.s./Mathematik: ß=-0.02, n.s.) (1). Die nationale Identität hängt positiv mit beiden Formen der Adaption zusammen, jedoch zeigt sich kein engerer Zusammenhang mit der soziokulturellen als mit der psychologischen Adaption (2). Zudem zeichnet sich kein signifikanter zusätzlicher Beitrag einer hohen Identifikation mit beiden Kontexten ab (3). Die Relevanz der Befunde für zuwanderungsspezifische Bildungsungleichheiten wird diskutiert. ID: 404 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Sonstige Didaktiken Thematisches Cluster: Bildung im Sekundarbereich, Trainings- und Evaluationsforschung Stichworte: Kulturelle Bildung, Persistenz, Selbstkonzept, Empathie, Bildhauerei Wirkungen Kultureller Bildung Chair(s): Caroline Theurer (Universität Kassel), Sebastian Konietzko (Westfälische-Wilhelms-Universität Münster) Diskutant(en): Christian Rittelmeyer (Georg-August-Universität Göttingen) Kulturelle Bildung kann als Sammelbegriff für vielfältige Bildungsangebote für Menschen jeder Altersgruppe in verschiedenen Sparten wie Kunst, Musik, Literatur, Tanz und Theater verwendet werden (Fuchs, 2009) und kann im schulischen wie außerschulischen Kontext stattfinden. Dabei bietet Kulturelle Bildung – besonders im schulischen Kontext – nicht nur ergänzende Lerngelegenheiten, sondern kann Möglichkeiten zur gesellschaftlichen Teil-habe schaffen. Als persönlichkeitsbildende Maßnahme wird ihr eine hohe Bedeutung bei-gemessen. Darüber hinaus wird häufig angenommen, dass Kulturelle Bildung Transferef-fekte auf kognitive Maße oder sogar Lernleistungen (Hamer, 2014; Rittelmeyer, 2010) ha-ben kann, was sie in der vergangenen Dekade zu einem bedeutsamen Thema für die Bil-dungsforschung hat werden lassen (Scheunpflug & Prenzel, 2013). Dementsprechend wird vermehrt darüber diskutiert, wie Kulturelle Bildung (innerhalb der Schule) gestärkt werden kann (KMK, 2013). Diese Diskussion gewinnt gerade vor dem Hintergrund, dass die Partizi-pation an Bildungsangeboten im kulturellen Bereich stark von sozio-ökonomischen Hin-tergrundvariablen (Rat für Kulturelle Bildung e. V., 2015; Weishaupt et al., 2012) sowie el-terlicher Partizipation (Kröner et al., 2013) abhängt, an Relevanz. Zwar wird die Bedeutung Kultureller Bildung für die Persönlichkeitsentwicklung nicht be-stritten, jedoch gibt es bislang nur wenige empirische Befunde, die ihre Wirkungen bele-gen, so beispielsweise auf Merkmale wie Sprachentwicklung, Offenheit, Selbstkonzept, Emotionalität oder Kreativität. In dem Symposium werden Studien vorgestellt, die sich mit den Wirkungen Kultureller Bildung interdisziplinär auseinandersetzen. Mit unter-schiedlichen Schwerpunkten, Thematiken und methodischen Herangehensweisen werden erste Ergebnisse von einzelnen Projekten vorgestellt, die über den „Forschungsfonds Kul-turelle Bildung. Studien zu den Wirkungen Kultureller Bildung“ finanziert werden. Der For-schungsfonds ist ein Projekt vom Rat für Kulturelle Bildung e.V., gefördert durch die Stif-tung Mercator. Interdisziplinäre besetzte Forschergruppen widmen sich in den Einzelbei-trägen unterschiedlichen Themen und Altersgruppen: Rogh et al. untersuchen, in welcher Weise und Intensität Fünftklässler Bildungsangebote im kulturellen Bereich nutzen und wie sich diese Nutzung auf personale Merkmale auswirkt. Stuckert et al. nehmen Bil-dungsprozesse in Jugendkunstschulen in den Blick und analysieren, inwieweit selbstbezo-gene Kognitionen dadurch beeinflusst werden. Marx et al. prüfen, ob empathische Fähig-keiten von Jugendlichen mit deren Lesegewohnheiten zusammenhängen. Gruber et al. widmen sich schließlich der Entwicklung von BildhauerInnen indem sie einerseits danach fragen, welche Erlebnisse und Personen den Werdegang beeinflussen und andererseits prüfen, ob hier Unterschiede zwischen Experten und Novizen bestehen. Die vorgestellten Studien werden von Christian Rittelmeyer zusammenfassend diskutiert. Beiträge des Symposiums Eine Wirkungsstudie zu kultureller Bildung im Medium „Tanz und Bewegungstheater“ Svenja Konowalczyk1, Esther Pürgstaller2, Marion Gonella2, Yvonne Hardt3, Nils Neuber2, Claudia Steinberg4, Martin Stern1 1 Philippps-Universität Marburg, 2Westfälische-Wilhelms-Universität Münster, 3Hochschule für Musik und Tanz Köln, 4Johannes Gutenberg-Universität Mainz Das Projekt „Tanz und Bewegungstheater – ein künstlerisch-pädagogisches Projekt zur kulturellen Bildung in der Ganztagsgrundschule“ zielt auf die empirische Überprüfung von Wirkungen kultureller Bildung am Beispiel von Tanz und Bewegungstheater. Als Indikatoren für die Wirkung werden Effekte in den Bereichen Kreativität, Selbstkonzept und emotionale Kompetenz bei Kindern in Ganztags(grund)schulen erfasst. Kreativität, deren Förderung als ein wesentlicher Bestandteil kultureller Bildung gesehen wird (u. a. Liebau, 2012; Bockhorst; Reinwand & Zacharias, 2012), rückt zunehmend als Bildungskomponente in den Vordergrund: bei der Bewältigung sozialer Aufgaben des Alltags ebenso wie beim Bildungsweg und Berufsleben (vgl. Serve, 2000). Nationale und internationale Studien zeigen, dass ein Unterricht in kreativer Tanz- und Bewegungserziehung zu einer spezifischen Förderung der (motorischen) Kreativität beitragen kann (vgl. u. a. Neuber, 2000; Bournelli & Mountakis, 2008). Auch für den Bereich des Selbst- und Körperkonzepts liegen positive Befunde vor, die die Annahme stützen, dass ein Unterricht im Tanz und Bewegungstheater förderlich sein kann (vgl. Dinold, 2004; Reichel et al., 2010). Im Anschluss an die Theorie von Shavelson, Hubner und Stanton (1976) ermöglicht das Selbstkonzept als Teil der Persönlichkeit eine Konkretisierung und empirische Operationalisierung der Persönlichkeitsentwicklung (vgl. Conzelmann, 2008; Conzelmann & Müller, 2005). Darüber hinaus stellen emotionale Kompetenzen eine wichtige Basisfertigkeit für die psychosoziale Entwicklung von Kindern dar (vgl. u.a. Jerusalem & Pekrun, 1999; Gembris, 2003). Aus einer ersten eigenen Studie ist bekannt, dass ein musik- und tanzpädagogisches Förderprogramm im offenen Ganztag der Verbesserung der Emotionserkennung sowie des Emotionswortschatzes dienen kann (Behrens, Zubarik & Henz, 2013). Auf dieser Grundlage wird im vorgestellten Projekt der Frage nachgegangen, welche Effekte ein künstlerisch-pädagogisches Angebot im Tanz und Bewegungstheater auf die Bereiche Kreativität, Selbstkonzept und emotionale Kompetenz von Schülerinnen und Schülern hat. Zur Klärung werden in einer quasi-experimentellen Längsschnittuntersuchung im Kontrollgruppendesign kognitive und motorische Facetten der Kreativität sowie Facetten des Selbstkonzeptes und der emotionalen Kompetenz bei rund 360 Kindern im Grundschulalter (3. und 4. Klasse) erfasst. Geplant sind drei Messzeitpunkte vor, unmittelbar nach sowie drei Monate nach Abschluss eines künstlerisch-pädagogischen Unterrichtsprojektes zum Tanz und Bewegungstheater. Die Intervention wird über 12 Wochen (1 x 90 min. pro Woche) von qualifizierten Tanz- und Bewegungspädagogen/innen durchgeführt. Zusätzlich zu den Experimentalgruppen, die am künstlerisch-pädagogischen Angebot teilnehmen, werden Kontrollgruppen einbezogen, die während des gleichen Zeitraumes kein spezielles Angebot bzw. ein Alternativ-Programm, z. B. in Form von Kleinen Spielen, erhalten. Insgesamt sind 12 Versuchsgruppen und 6 Kontrollgruppen mit jeweils 15-20 Kindern vorgesehen (NVG=180-240; NKG=90-120). Als standardisierte Testverfahren werden ein Subtest des Kreativitätstests für Vorschul- und Schulkinder (KVS-P; Krampen 1996) sowie ein bewegungsspezifischer Kreativitätstest in Anlehnung an Neuber (2000) angewandt. Zur Erfassung des Selbstkonzepts wird voraussichtlich der Self-Description Questionnaire-Short (SDQ-GS I) nach Arens et al. (2013) eingesetzt. Darüber hinaus findet der emotionale Kompetenztest für Kinder und Jugendliche (KUSCHE-Affektive-Interview-Revised) zur Abbildung der emotionalen Kompetenz in der Studie Verwendung (Kusche, Greenberg & Beilke, 1988). Der wissenschaftliche Erkenntnisstand der Tanzforschung im Kontext von Tanz und kultureller Bildung ist noch unzureichend, da es an Feld- und vor allem Längsschnittstudien in schulischen und außerschulischen Kontexten mangelt. Die geplante empirische Studie trägt zur Schließung dieser Forschungslücke bei und lässt gewinnbringende Ergebnisse erwarten. Nutzung Kultureller Bildung zu Beginn des fünften Schuljahres – erste deskriptive Befunde aus dem Forschungsprojekt KuBiK5 Wida Rogh1, Caroline Theurer2, Nicole Berner1, Frank Lipowsky2 1 Alanus Hochschule Alfter, 2Universität Kassel Kulturelle Bildungsangebote richten sich in vielfältiger Weise an Kinder und Jugendliche und bieten ihnen u. a. kunst-, musik-, theater- und tanzpädagogische Angebote. Kinder und Jugendliche können so in einer ästhetisch-künstlerischen Auseinandersetzung im sozialen Miteinander aktiv und kreativ werden und eigene Stärken erkennen und weiter ausbauen. Daher wird Kultureller Bildung eine hohe Bedeutung für die Entwicklung von Heranwachsenden zugeschrieben (Scheunpflug & Prenzel, 2013). Obwohl Kulturelle Bildung einen wichtigen Teil schulischer wie außerschulischer Bildung darstellt (Keuchel, 2013; Rat für Kulturelle Bildung, 2015; Sozialgesetzbuch 8. Buch, §11) und von wissenschaftlicher und politischer Seite für die Förderung von Kreativität und gesellschaftlicher Innovation als relevant erachtet wird (Kultusministerkonferenz, 2013; Liebau, 2008; Winner, Goldstein & Lancrin, 2013), gibt es nur wenige empirische Befunde zur Nutzung Kultureller Bildung sowie zu Wirkungszusammenhängen mit anderen personalen Merkmalen. Die meisten Studien fokussieren dabei auf Teilbereiche Kultureller Bildung oder haben ein Experimentalgruppendesign, um ein kulturpädagogisches Programm zu evaluieren, an dem die Schüler über einen bestimmten Zeitraum teilnehmen. Selten wird der Blick auf eine umfassende Kulturelle Bildung gerichtet, um Wirkungen Kultureller Bildung auf personale Merkmale – insbesondere auf die Kreativität – zu untersuchen (Harland et al., 2000; Luftig, 2000; Moga, Burger, Hetland und Winner, 2000). Zum Beispiel wurde im deutschen Sprachraum bisher kaum die über einen längeren Zeitraum in Anspruch genommene kulturelle Bildung in der Lebenswelt der Heranwachsenden betrachtet und untersucht, wie sich eine vielseitige Nutzung Kultureller Bildung auf die Entwicklung personaler Merkmale auswirkt. Dabei ist zu erwarten, dass sich verstärkte Effekte Kultureller Bildung auf die Kreativitätsentwicklung in sogenannten „multi-arts“-Studien (Moga et al., 2000) zeigen. Hier setzt das Forschungsprojekt KuBiK5 (Wirkung Kultureller Bildung auf Kreativität im fünften Schuljahr; Berner, Theurer, Rogh & Lipowsky, 2015) an, das die Nutzung Kultureller Bildung in verschiedenen Bereichen, u. a. Bildende Kunst, Musik, Medien, Tanz und Theater sowohl auf schulischer als auch außerschulischer Ebene in den Blick nimmt. Längsschnittlich wird die Wirkung Kultureller Bildung auf Kreativität im Verlauf des fünften Schuljahres über zwei Messzeitpunkte untersucht. Dabei werden auch mediierende personale Merkmale, wie u. a. die Ausdauer, die Offenheit und das Selbstkonzept, berücksichtigt. Im Vortrag werden Ergebnisse der ersten Datenerhebung zu Beginn des fünften Schuljahrs im Herbst 2015 berichtet. Insgesamt wurden Schülerinnen und Schüler in 54 fünften Schulklassen in NRW, Hessen und Sachsen zu den von ihnen genutzten schulischen und außerschulischen kulturellen Bildungsangeboten sowie zu ihren Interessen und Freizeitaktivitäten befragt. Darüber hinaus wurden, neben bisher in der Forschung üblichen quantitativen Angaben zu Umfang und Intensität der in Anspruch genommenen Kulturellen Bildungsangebote auch subjektive Wertungen der Freude und Beanspruchung mit berücksichtigt. Diese subjektiven Wertungen fließen in ein Maß für individuell erlebte Qualität ein und werden als bedeutsame Bedingung für eine positive Wirkung Kultureller Bildungsangebote betrachtet. Informationen zu Quantität und subjektiv erlebter Qualität dienen schließlich der Generierung eines umfassenden Indikators für Kulturelle Bildung. Um Aussagen über den familiären Hintergrund treffen zu können, wurden die Eltern ebenfalls befragt. Über einen Elternfragebogen werden Angaben zum sozio-ökonomischen Status, kulturellem Kapital, zu Erziehungsstilen und -zielen sowie zur elterlichen Einstellung zu Kultureller Bildung erfragt. Diese umfassend vorliegenden Informationen ermöglichen es, die Nutzung Kultureller Bildung im Kontext von theoretisch denkbaren Wirkmechanismen unter Berücksichtigung von mediierenden, individuellen, häuslichen sowie schulischen und außerschulischen Kontextmerkmalen zu untersuchen und ein theoretisches Wirkmodell vorzustellen, mit dem die postulierten Zusammenhänge auf Schülerebene geprüft werden sollen. Erste deskriptive Ergebnisse zum generierten Indikator für Kulturelle Bildung und dessen Zusammenhang mit individuellen und häuslichen Kontextmerkmalen werden vorgestellt. Weiterführende Analysen zu möglichen Wirkungsweisen Kultureller Bildung auf die Kreativitätsentwicklung von Fünftklässlern werden prospektiv diskutiert. Bildungsprozesse in Jugendkunstschulen Marina Stuckert1, Ivo Züchner1, Werner Thole2, Jacqueline Rauschkolb1, Svenja Thielker2 1 Philippps-Universität Marburg, 2Universität Kassel Theoretischer Hintergrund Die musikalische und ästhetisch-kulturelle Bildung im Kindes- und Jugendalter wird in Deutschland stark durch außerschulische Akteure – Musik- und Tanzschulen, Vereine und andere Organisationen –geprägt. Jugendkunstschulen sind hier zentrale Orte der non-formaler Bildung von Kindern und Jugendlichen: Auf Freiwilligkeit der Teilnahme beruhend, machen sie Angebote der ästhetisch-kulturellen Bildung, die in Kurs oder Projektform ablaufen. Gemeinsam ist den Angeboten das Lernen und die ästhetisch-künstlerische Gestaltungen in Gruppen – als öffentlich geförderte Jugendarbeit haben diese sowohl das Ziel der Persönlichkeitsentwicklung als auch der Unterstützung der Herausbildung künstlerischer Fähigkeiten: die Anregungsqualität von Inhalten wie Theater, Musik, Bildende Kunst, Digitale Medien und Tanz wird nicht nur in der Entwicklung technischer Fähigkeiten und Etablierung einer ästhetischen (Selbst)Wahrnehmung gesehen, sondern auch als Anstoß für die Weiterentwicklung von grundsätzlicheren personalen und sozialen Fähigkeiten erachtet (bjke 2011). Bislang existiert wenig empirisch abgesichertes Wissen darüber, welche konkreten Bildungsprozesse über das Engagement von Kindern und Jugendlichen in den ästhetisch-kulturellen Angebotsbereichen stattfinden (u.a. Prenzel & Ray 2012; Autorengruppe Bildungsberichterstattung 2012; Liebau 2014). Zu analysieren ist entsprechend, inwieweit ein Zusammenhang zwischen der Teilnahme an Angeboten von Jugendkunstschulen und der Veränderung der Beherrschung ästhetisch-künstlerischen „Techniken“ sowie des ästhetisch-expressiven Selbstkonzeptes besteht. Darüber hinaus werden Bildungsprozesse angenommen in Bezug auf eine Erweiterung der Fähigkeiten zur Selbstdarstellung und -präsentation, auf die Fähigkeit, andere Perspektiven zu übernehmen sowie bezüglich der Erprobung sozialer Interaktion (u.a. Lindner 2003; Bockhorst 2011). Die Analyse dieser Aspekte ist Zielsetzung des Forschungsprojekts „Jugendkunstschulen – eine Studie zu den Wirkungen von Angeboten in der kulturellen Kinder- und Jugendarbeit“ (JuArt), das als Kooperationsprojekt der Phillips-Universität Marburg und der Universität Kassel vom Rat für Kulturelle Bildung im Rahmen der Förderlinie „Wirkungen kultureller Jugendbildung“ gefördert wird. Fragestellung des Beitrags Der Beitrag im Symposium analysiert, inwieweit die Teilnahme an Angeboten der Jugendkunstschulen eine Veränderung der ästhetischen Selbstwahrnehmung und des sozialen und körperlichen Selbstkonzeptes beeinflusst. Dabei wird ein Augenmerk auf differenzielle Effekte nach Angebotsart sowie unterschiedlichen Teilnehmerkreisen gelegt. Methode Dargestellt werden Ergebnisse der 1. und 2. Welle einer quantitativen Längsschnitterhebung an 38 Jugendkunstschulen mit ca. 900 Kindern und Jugendlichen. Diese wurden zu Beginn und zum Ende ihres Kurses/Projektes in einer Prä-/Posterhebung zu eigenen Aktivitäten, zur sowie zur Einschätzung eigener ästhetische sowie zur Einschätzung der eigenen Person befragt. Ergänzt wird die Studie durch Befragungen der Kursleitungen sowie Gruppendiskussionen in ausgewählten Projekten und Kursen. In den standardisierten Befragungen wird neben biografischen und motivationalen Aspekten nach dem Wissen und Können innerhalb der jeweils gewählten „Sparte“ gefragt. So kommen Konstrukte zum Einsatz wie das spartenspezifische Fähigkeitsselbstkonzept in Anlehnung an Vispoel (1993). Um zudem die individuelle Bedeutsamkeit der jeweiligen künstlerischen Aktivität zu berücksichtigen, wurde das Flow-Erleben in Anlehnung an die motivationale Orientierung nach Prenzel (1984) gemessen. Die Erfassung der Persönlichkeitsfacetten basiert u. a. auf dem Shevelson-Modell des Selbstkonzepts (1976). D.h. es werden Skalen zu hierarchisch niedrigeren bereichsspezifische Facetten eingesetzt – also zum sozialen (Helmke et al. 2002), emotionalen (Barchard 2001) und körperlichen (Pöhlmann, Thiel & Joraschky 2007; Roth 2014) Selbstkonzept, bei welchen eine Veränderung über die Zeit erwartbar ist. Bei der Analyse der Daten im Längsschnitt werden Latent change score Modelle (Ferrer & McArdle 2010) verwendet. Die Clusterstruktur der Daten, die durch die Erhebung in Einrichtungen (und Kursen) zustande kommt, wird durch eine mehrebenenanalytische Modellierung berücksichtigt. Ergebnisse Da die Post-Erhebungen bei Einreichung des Exposés noch nicht abgeschlossen wurden, werden im Folgenden erwartete Ergebnisse formuliert. So wird die Hypothese geprüft, dass sich stärkere Veränderungen bei den kulturellen Fähigkeiten als Veränderungen des Selbstkonzepts ergeben und letztere über den Erwerb kultureller Fähigkeiten vermittelt werden. Zudem werden in differentiellen Analysen besondere Veränderungen bei Kindern aus Familien mit niedrigerem kulturellen Kapitel erwartet, die in den Jugendkunstschulen tendenziell unterrepräsentiert sind. Unterschiede in empathischen Fähigkeiten zwischen viel- und weniglesenden Jugendlichen und ihre Relevanz für literarisches Textverstehen als Indikator Kultureller Bildung Alexandra Marx1, Sofie Henschel1, Thorsten Roick2, Petra Stanat1, Jörn Brüggemann3, Volker Frederking4 1 Humboldt-Universität zu Berlin, 2Landesamt für Schule und Lehrerbildung, Regionalstelle Frankfur, 3Carl von Ossietzky Universität Oldenburg, 4Friedrich-Alexander-Universität Erlangen-Nürnberg Theorie Dem Erkennen von Perspektiven, Emotionen und Handlungsmotiven anderer Personen wird in unterrichtsdidaktischen Überlegungen eine wichtige Rolle für das literarische Textverstehen beigemessen (z.B. Olsen, 2011). Der damit verbundene Einfühlungsprozess soll die Aufmerksamkeit des Rezipienten auf relevante Informationen lenken und so die Bildung einer kohärenten Textrepräsentation und das Textverstehen begünstigen. Untersuchungen bei Jugendlichen stützen diese Annahme insofern, als sie darauf hinweisen, dass insbesondere die Fähigkeit, sich in die Stimmungen lyrischer Werke oder in die Perspektive von Figuren einzufühlen (Fantasieempathie), über weitere Empathiefacetten (z.B. Betroffenheit) und motivationale Variablen hinaus zur Erklärung des literarischen Textverstehens beiträgt (Henschel & Roick, 2013). Untersuchungen bei erwachsenen Lesern zeigen zudem, dass Zusammenhänge zwischen dem häufigen Lesen literarischer Texte und Facetten der Empathie bestehen (Bal & Veltkamp, 2013). Die vorliegende Studie untersucht, inwieweit Unterschiede in empathischen Fähigkeiten in Abhängigkeit vom Leseverhalten bei jugendlichen Lesern zu beobachten sind und ob diese differenziell zur Erklärung des literarischen Textverstehens beitragen. Methode Untersucht wurden 314 Jugendliche (42% weiblich), von denen 141 als viellesend (Gruppe VL; mehr als 60 Minuten täglich und mehr als sechs literarische Bücher pro Jahr) und 173 als weniglesend (Gruppe WL; weniger als 15 Minuten täglich und höchstens zwei literarische Bücher pro Jahr) klassifiziert wurden. Alle Jugendlichen bearbeiten am Ende der 10. Klasse Items zu Facetten der (trait-bezogenen) Empathie (Fantasieempathie: α = .75; Empathiefähigkeit: α = .75), zur state-bezogenen Empathie (α = .87) sowie zum literarischen Textverstehen (rtt = .77). Die Daten wurden unter Kontrolle des Geschlechts, der Schulform und der früheren Leistung im literarischen Textverstehen strukturanalytisch in einem Mehrgruppenmodell ausgewertet. Ergebnisse Jugendliche der Gruppe VL erreichen im literarischen Textverstehen bessere Leistungen als ihre Peers der Gruppe WL und berichten höhere Werte sowohl für die Fantasieempathie und Empathiefähigkeit als auch für die state-bezogene Empathie mit literarischen Figuren. Unter Kontrolle des früheren literarischen Textverstehens zeigt sich, dass in beiden Gruppen ausschließlich Fantasieempathie indirekt – vermittelt über die state-bezogene Empathie – zur Erklärung des literarischen Textverstehens beiträgt. Darüber hinaus deutet sich vor allem für die Gruppe VL auch ein direkter Zusammenhang zwischen Fantasieempathie und literarischem Textverstehen an, der nicht über die state-bezogene Empathie vermittelt wird. Diskussion Die Ergebnisse stützen die Annahme, dass häufiges Lesen von Literatur positiv mit empathischen Fähigkeiten assoziiert zu sein scheint (vgl. Bal & Veltkamp, 2013). Entgegen bisheriger Studienergebnisse nutzen Jugendliche ihre empathischen Fähigkeiten aber unabhängig vom Leseverhalten, um sich einen Text zu erschließen, indem sie sich während des Lesens in die Protagonisten eines literarischen Textes einfühlen. Da in der Gruppe VL auch die trait-bezogene Fantasieempathie tendenziell zur Erklärung des literarischen Textverstehens beizutragen scheint, sollte in weiteren Studien untersucht werden, welche prozessbezogenen kognitiven und affektiven Merkmale diesen Zusammenhang neben der state-bezogenen Empathie mit literarischen Figuren vermitteln. Die Ausbildung von Empathie wird in den Bildungsstandards als wesentliches Ziel des Deutschunterrichts benannt, das insbesondere durch den Umgang mit literarischen Texten erreicht werden soll. Deshalb ist ein genaueres Verständnis darüber, welche Wirkmechanismen zwischen Lesepraxis, empathischen Fähigkeiten und dem Verstehen literarischer Texte bestehen von besonderer Bedeutung, um empathieförderliche Zugänge bei der Unterrichtsgestaltung in deutschdidaktischen Überlegungen systematisch zu berücksichtigen. Studien zur Bildhauerei. Fertigkeitserwerb und künstlerischer Werdegang von BildhauerInnen Linda Puppe, Hans Gruber, Birgit Eiglsperger, Christiane Settele Universität Regensburg Theoretischer Hintergrund Das vorliegende Forschungsvorhaben ist ein Teil des Projektes „Studien zur Bildhauerei. Analyse expertisegradbedingter Unterschiede in differenzierter Wahrnehmung und plastischer Gestaltung“. Es werden Ergebnisse aus der Vorstudie vorgestellt sowie erste Ergebnisse der eigentlichen Studie auf der Tagung präsentiert. Der theoretische Ausgangspunkt der Studie ist die Expertiseforschung. Expertise bezieht sich nach Ericsson (2006) auf die Charakteristika, die Fähigkeiten und das Wissen, welches ExpertInnen von NovizInnen unterscheidet. Deren zentrale Annahme ist, dass der Expertiseerwerb Ergebnis eines langfristigen kognitiven Adaptationsprozesses ist. Ericsson und Charness (1994) gehen davon aus, dass in der bildenden Kunst wenigstens zehn Jahre Vorbereitung nötig sind, um internationale Wettbewerbe zu gewinnen. Um Einflussfaktoren, welche zur Expertisierung beitragen, charakterisieren zu können, sind Analysen von Biographien unterschiedlicher BidhauerInnen hilfreich. Sloane und Sosniak (1985) führten hierzu eine Befragung mit 25 BildhauerInnen und 15 Eltern durch. Sie beschrieben verschiedene Aspekte, welche als wichtig für die bildhauerische Entwicklung genannt wurden. Diese sind unter anderem: familiärer Einfluss, Schulzeit, außerschulische Aktivitäten und Studium. Wiederholt wird betont, dass ausgeprägte Motivation und Anstrengungsbereitschaft vorlag sowie Förderung durch Schule und Familie vorhanden war. Fragestellung Das Forschungsvorhaben hat das Ziel, folgende Fragen zu beantworten: 1. Welche Erlebnisse beeinflussen den Werdegang von BildhauerInnen und deren künstlerische Entwicklung? 2. Welche Personen begleiten den Werdegang von BildhauerInnen und fördern deren künstlerische Entwicklung? 3. Wie unterscheiden sich die Expertisegruppen im Fertigkeitserwerb? Methode Design Vorstudie Es wurde ein quasi-experimentelles Design gewählt. Stichprobe Es nahmen 27 BildhauerInnen an der Umfrage teil. Instrument Als Instrument für die Vorstudie wurde ein Fragebogen mit offenen und geschlossenen Fragen entwickelt. Durchführung Für die Stichprobe der ExpertenInnen wurden KünstlerInnen befragt, welche Mitglied im Bundesverband bildender Künstlerinnen und Künstler sind (BBK). Der Fragebogen stand als Online-Version zur Verfügung. Auswertung Die Analysen zu Gruppenunterschiede wurden mittels Kruskal-Wallis-Test durchgeführt. Ergebnisse Die Ergebnisse zeigen, dass es keine signifikanten Unterschiede zwischen den Expertisegruppen bezüglich der feedbackgebenden Personen existieren. ExpertInnen und Semi-ExpertInnen erhalten gleichermaßen Rückmeldung von Familie, DozentInnen, FreundInnen und KommilitonInnen. Aber die jeweiligen Expertisegruppen bewerten die Personen, welche für das künstlerische Schaffen hilfreich sind, unterschiedlich. Für 41 Prozent der ExpertInnen war der Austausch mit KünstlerkollegInnen hilfreich bezüglich des künstlerischen Weiterkommens, bei Semi-ExpertInnen lediglich vier Prozent. Die Gruppe der SemiExpertInnen empfanden KommilitonInnen und DozentInnen mit 41 und 36 Prozent am hilfreichsten. Des Weiteren wurde nach der Häufigkeit der Rückmeldungen gefragt. Auch hier existieren keine signifikanten Unterschiede. Der Modalwert lag bei den Semi-ExpertInnen bei „gelegentlich“, bei den ExpertInnen bei „oft“. Die Analyse der Ratingskalen ergab, dass es für Semi-ExpertInnen signifikant anstregender ist Museen zu besuchen und Fachliteratur zu lesen. Design Studie „Fertigkeitserwerb und künstlerischer Werdegang von BildhauerInnen“ Es wird ein Querschnittsdesign mit einem Zwei-Gruppen-Vergleich gewählt, der Faktor Expertisegruppe umfasst die Stufen ExpertIn und Semi-ExpertIn. Unter die abhängigen Variablen fallen zum Beispiel Anzahl von Einzel- und Gruppenausstellungen, Personen wie Eltern und Lehrende sowie Ereignisse, beispielsweise das Kennenlernen des Ehepartners. Stichprobe Die Stichprobe setzt sich aus jeweils zehn KünstlerInnen (ExpertInnen) und Semi-ExpertInnen zusammen. Die KünstlerInnen haben bereits langjährige professionelle Erfahrung im Bereich der Bildhauerei. Zur Gruppe der Semi-ExpertInnen zählen Studierende in künstlerischen Studiengängen, die bereits bildhauerische Erfahrung haben. Instrument Für die Studie wurde ein teilstrukturiertes Interview entwickelt sowie mithilfe von Dokumenten der ProbandInnen eine Timeline zum künstlerischen Werdegang erstellt. Durchführung Die Versuchspersonen werden gebeten, Dokumente, die ihren künstlerischen Werdegang nachvollziehbar machen lassen, zu einem Interview mitzubringen (z. B. Flyer und Einladungen zu Ausstellungen, eigene Kataloge, Wettbewerbsteilnahmen). Im Verlauf des Interviews wird eine Timeline erstellt, die die einzelnen Stationen visualisiert. Die Interviews werden aufgenommen und danach wörtlich transkribiert. Auswertung Das Interview zum Werdegang wird anhand einer inhaltlich strukturierenden qualitativen Inhaltsanalyse ausgewertet. Die Aussagen der ProbandInnen werden in entsprechenden Kategorien und Unterkategorien eingeordnet. Analysen der Gruppenunterschiede erfolgen nonparametrisch mittels Kruskal-Wallis Test beziehungsweise Mann-Whitney-U Test. ID: 407 Symposium Disziplinen-Cluster: Psychologie Thematisches Cluster: Gesundheit/ Stress/ Belastung Stichworte: Psychische Beeinträchtigung, Risikofaktiren, Prävention, Inervention, Bildungserfolg Individuelle Risikofaktoren und Interventionsansätze im Kontext Schule: Beiträge aus dem Blickwinkel der klinischen und neurowissenschaftlichen Forschung Chair(s): Aiste Jusyte (LEAD Graduate School, Universität Tübingen), Thomas Dresler (LEAD Graduate School, Universität Tübingen) Diskutant(en): Klaus Hurrelmann (Hertie School of Governance) Die Verbindung unterschiedlicher Forschungstraditionen gehört seit jeher zu den zentralen Anliegen der Empirischen Bildungsforschung. Aktuelle Forschungsprogramme, wie etwa die Graduiertenschule LEAD (Learning, Educational Achievement, and Life Course Development) in Tübingen, sind ein sichtbares Zeichen einer disziplinübergreifenden Zusammenarbeit. Im Zentrum steht sowohl die Frage nach den kennzeichnenden Merkmalen erfolgreichen Lernens oder einer erfolgreichen Entwicklung, aber auch die Identifikation relevanter Risikofaktoren auf Seiten des Lernkontexts oder der individuellen Person. Zu den individuellen Risikofaktoren gehören sowohl früh auftretende Lernstörungen (z.B. Dyskalkulie), die den schulischen Erfolg mindern, als auch psychische Störungen (z.B. Depression oder Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung [ADHS]), deren Auftreten nicht nur die Schulleistungen beeinträchtigen, sondern sich auch auf andere Lebensbereiche, wie soziale Anpassung, negativ auswirken können. Dabei stellen alle diese Störungen nicht nur eine erhebliche Belastung für die betroffenen Schülerinnen und Schüler dar, sondern gefährden gleichzeitig die weitere Entwicklung von Heranwachsenden. Die Minimierung und Prävention solcher Entwicklungsrisiken gehören daher zu den wichtigsten Aufgaben der Bildungsforschung. Vor allem das Verständnis der Ätiologie der genannten Störungen ist von enormer Bedeutung, um diese durch effektive Präventions- und Interventionsbemühungen frühzeitig zu adressieren. Diese Fragestellungen werden in der Graduiertenschule LEAD im Rahmen von interdisziplinären Forschungsprojekten an den Schnittstellen zu klinischer Psychologie und Neurowissenschaften bearbeitet. Im Rahmen des Symposiums sollen ausgewählte Befunde der Graduiertenschule LEAD zur Bedeutung individueller Risikofaktoren aus klinisch-psychologischer und neurophysiologischer Perspektive vorgestellt und diskutiert werden. Auf der Grundlage der interdisziplinären und damit einhergehenden methodischen Vielfalt sollen sowohl Erkenntnisse über die Ätiologie dieser Störungen gezeigt, als auch praktische Implikationen für neue Förderangebote und Behandlungsansätze vorgestellt werden. Inhaltlich beschäftigen sich die Beiträge zum einen mit Auswirkungen von Depressivität auf schulische Leistungen und zum anderen mit der Frage, welche Faktoren die Wirksamkeit von Depressionspräventionsprogrammen an Schulen erhöhen können. Ferner werden Ergebnisse von Grundlagen- und Präventionsstudien zu zwei verbreiteten Störungsbildern, nämlich Dyskalkulie und ADHS, präsentiert, deren Untersuchung durch den Einsatz von Methoden aus den Neurowissenschaften einen aktuellen Beitrag zur Aufklärung von zugrundeliegenden Mechanismen und der Entwicklung völlig neuer Behandlungsmethoden bilden. Beiträge des Symposiums Die Bedeutung internalisierender Beeinträchtigungen für die schulische Entwicklung von Heranwachsenden: Befunde der TRAIN Studie Sina Müller1, Richard Göllner2, Aiste Jusyte1, Thomas Lösch1, Ulrich Trautwein2 1 LEAD Graduate School, Universität Tübingen, 2Hector-Institut für Empirische Bildungsforschung,Tübingen Die schulische Entwicklung und die Lerngeschichte von Kindern und Jugendlichen sind abhängig von einer Vielzahl unterschiedlicher Einflussfaktoren. Hierzu gehören die individuellen Lernvoraussetzungen des einzelnen Kindes, das elterliche Erziehungsumfeld (z.B. der sozioökonomische Hintergrund oder das Erziehungsverhalten von Eltern) sowie die schulische Lernumgebung selbst (Eccles & Roeser, 2011; Weinert & Helmke, 1997) – alles Faktoren, die bereits oft untersucht wurden. Hingegen haben Einschränkungen der psychischen Gesundheit von Heranwachsenden bislang weniger Aufmerksamkeit erfahren, wenngleich klinische Studien zeigen, dass ein substantieller Anteil Jugendlicher von erheblichen emotionalen Beeinträchtigungen betroffen ist. In der BELLA-Studie des deutschen Kinder- und Jugendgesundheitssurveys (KiGGS; RavensSieberer, Wille, Bettge & Erhart, 2007) zeigten sich Prävalenzraten von 10% für Angst und 5.4% für Depression und in anderen Studien weit höhere subklinischen Zahlen (Balazs et al., 2013). Die Auswirkungen dieser Beeinträchtigungen auf die schulische Entwicklung von Schülerinnen und Schülern und eine erfolgreiche Gestaltung des Übergangs ins Erwachsenenalter sind jedoch nach wie vor unklar. In der vorliegenden Studie wurde untersucht, inwieweit internalisierende Beeinträchtigungen (das heißt depressive/ängstliche Symptomatik) die Entwicklung von Schülerinnen und Schülerinnen beeinflussen. Neben den klassischen Entwicklungskriterien (wie etwa dem Selbstwert) wurden auch Kriterien des schulischen Erfolges (Lesekompetenz und Mathematikleistung, Eingebundenheit in der Schule) betrachtet. Grundlage der Untersuchung waren Daten der Studie „Tradition und Innovation: Entwicklungsverläufe an Haupt- und Realschulen in Baden-Württemberg und Mittelschulen in Sachsen“ (TRAIN; Jonkmann, Rose, & Trautwein, 2013), einer Längsschnittuntersuchung zur Analyse differentieller Entwicklung von Schülerinnen und Schülern aus nicht gymnasialen Schulformen (5., 6., 7., und 8. Klasse). Die Stichprobe umfasste N = 1062 sächsische Mittelschülerinnen und -schüler (46.8% weiblich, M Alter = 10.76, SD = .68). Zur Erfassung internalisierender Symptomatik wurde in TRAIN die deutsche Version der Child Behavior Checklist (CBCL; Döpfner et al., 2013) verwendet. Zudem wurden die Mathematikleistung (Blum, Drüke-Noe, Hartung & Köller, 2006; Granzer, Köller & Bremerich-Vos, 2009), die Lesekompetenz (Böhme, Neumann & Schipolowski, 2010), sowie die Subskalen Selbstwert und Familie des KINDLR-Fragebogen für Kinder und Jugendliche (Ravens-Sieberer & Bullinger, 1998) im Längsschnitt erhoben. Zur Beschreibung der sozialen Eingebundenheit von Schülerinnen und Schülern dienten ein Selbstberichtsmaß (Fend & Prester, 1986) und auch Berichte von Mitschülerinnen und Mitschülern sowie Lehrkräften. In Übereinstimmung mit Befunden aus klinischen Studien, zeigte sich, dass 9.2% der befragten Schülerinnen und Schüler eine hohe und 15.1% eine moderate internalisierende Symptomatik aufwiesen. In Hinblick auf weitere Entwicklungskriterien, ergaben sich für diese Schülergruppen substantielle Unterschiede: In der 5. Klasse wiesen die beeinträchtigten Jugendlichen in allen untersuchten Entwicklungskriterien signifikant niedrigere Werte auf als Schülerinnen und Schüler ohne Beeinträchtigungen. Darüber hinaus zeigten psychisch beeinträchtigte Jugendlichen im Rahmen von Veränderungsanalysen eine substantiell geringere Zunahme im Verlauf für die Lesekompetenz, sowie für die soziale Einbindung aus Lehrersicht. Interessanterweise zeigte sich für das Ausmaß der sozialen Einbindung im Selbstbericht eine stärker positive Zunahme. Demnach bestehen bereits mit Beginn der Sekundarstufe (5. Klasse) bedeutende Unterschiede für Jugendliche mit internalisierenden Beeinträchtigungen im Vergleich zu ihren Mitschülerinnen und Mitschülern. Für einige wichtige soziale und akademische Entwicklungskriterien ergeben sich im zeitlichen Verlauf bedeutsame Unterschiede, die im Rahmen des Beitrags weiterführend diskutiert werden sollen. Ein Vergleich von Lehrkräften und Psychologen bei der Durchführung eines schulbasierten Präventionsprogramms zur Vermeidung von Depressionen Gabriel Kornwachs1, Richard Göllner2, Leona Hellwig1, Margarete Patak3, Melanie Wahl3, Martin Hautzinger3 1 LEAD Graduate School, Universität Tübingen, 2Hector-Institut für Empirische Bildungsforschung,Tübingen, 3Abteilung für klinische Psychologie, Universität Tübingen Depressionen treten bereits im Kindes- und Jugendalter häufig auf und stellen somit nicht nur eine Einschränkung der Lebensqualität von Heranwachsenden dar, sondern können auch deren weitere Entwicklung in einem erheblichen Maße gefährden (z.B. Bettge, Wille, Barkmann, Schulte-Markwort & Ravens-Sieberer 2008). Das schulische Umfeld bietet zur Vermeidung von Depressionen sehr geeignete Möglichkeiten, wenngleich die Effektivität existierender Programme im Schulalltag bisher nur vereinzelt evaluiert wurde (vgl. Stice, Shaw, Bohon, Marti & Rohde, 2009). Ein vielfach angewendetes Programm zur Depressionsprävention ist das Programm Lebenslust mit LARS&LISA (Wahl, Patak, Schmid & Hautzinger, 2008). Neben einer hohen Akzeptanz erwies sich das hauptsächlich von Psychologen durchgeführte Programm als präventiv und konnte die Depressivität und das Selbstwertgefühl bei klinisch auffälligen Schülern positiv beeinflussen (Groen, Pössel, Al-Wiswasi & Petermann, 2003; Pössel, Horn, Hautzinger & Groen 2004; Pössel, Seemann & Hautzinger 2008). Die praktische Umsetzung und Implementation solcher Programme im Schulalltag stellen jedoch weiterhin eine große Herausforderung dar. So ist bisher weitestgehend unklar, inwieweit auch Lehrkräften eine „wirksame“ Programmdurchführung gelingt. Die Untersuchung relevanter Prozessmerkmale auf Seiten des Unterrichts und deren Auswirkungen auf die Programmeffektivität sind daher notwendige Schritte. In der vorliegenden Arbeit wurde daher untersucht, inwieweit sich Lehrkräfte und Psychologen bzgl. der Effektivität und der qualitativen Ausgestaltung des universellen schulbasierten Depressionspräventionsprogramms Lebenslust mit LARS&LISA unterscheiden. Ferner wurde untersucht, inwieweit die Unterrichtsfaktoren Klassenführung, Strukturiertheit des Unterrichts und Manualtreue einen Einfluss auf die Effektivität des Programms ausüben. An der Studie nahmen 421 Hauptschüler der achten Klasse zwischen 2008 und 2009 in Baden-Württemberg teil. Das Programm wurde von 22 Lehrkräften und 22 Psychologen durchgeführt, die zuvor in einem zweitägigen Training ausgebildet wurden. Die zehn wöchentlichen Sitzungen (Dauer 90 min) wurden videografiert und anschließend im Hinblick auf die Unterrichtsfaktoren durch unabhängige Beurteiler bewertet. Als Zielgrößen zur Bestimmung der Programmeffektivität wurden die Ausprägung der depressiven Symptomatik (ADS, Meyer & Hautzinger, 2001), der generellen Psychopathologie (SDQ, Goodman, 1997) und der positiven sozialen Fertigkeiten (TISS-P, Inderbitzen & Foster, 1992) sowohl vor als auch nach dem Training (Post) sowie als 12 Monats-Follow-Up (12MFU) erhoben. Ein Vergleich zwischen Lehrkräften und Psychologen zeigte keine bedeutsamen Unterschiede bzgl. der Programmeffektivität. Mit Blick auf die untersuchten Unterrichtsfaktoren ergaben sich jedoch substantielle Unterschiede: Während Lehrkräfte im Vergleich zu Psychologen besser in der Klassenführung abschnitten, gelang den Psychologen eine deutlich höhere Strukturierung der Programminhalte. Hingegen ergab sich für die Manultreue kein Unterschied. Im Hinblick auf die gewählten Effektivitätskriterien hatte der Unterrichtsfaktor Klassenführung sowohl einen positiven Einfluss auf die psychische Belastung (SDQ, 12 MFU) als auch auf die sozialen Fertigkeiten (TISS-P, Post) der Schüler. Die Strukturiertheit des Unterrichts konnte den SDQ-Wert (12MFU) voraussagen, während die Manualtreue keinen Einfluss hatte. Insgesamt sprechen die Ergebnisse dafür, dass Unterrichtsfaktoren für die Effektivität eines universellen schulbasierten Depressionspräventionsprogramms von Bedeutung sind. Dabei weisen Lehrkräfte und Psychologen unterschiedliche Stärken während der Durchführung auf. Die Bedeutung dieser Befunde für die zukünftige Umsetzung derartiger Programme in der Praxis wird diskutiert. Blickbewegungsanalysen beim Lösen von Subtraktionsaufgaben mit und ohne Zehnerübergang bei Kindern mit schwachen Mathematikleistungen Katharina Lambert1, Kevin Eggebrecht2, Korbinian Möller2 1 Hector-Institut für Empirische Bildungsforschung,Tübingen, 2Leibniz Institut für Wissensmedien, Universität Tübingen Bei Kindern mit schwachen Mathematikleistungen sind im Vergleich zu Kindern ohne Lernschwierigkeiten sowohl Reaktionszeiten wie auch Fehlerraten schon beim Lösen von einfachen Rechenaufgaben deutlich erhöht (z.B. Gaupp et al., 2004; Geary et al., 1993; Geary et al., 2004). Unterschiede in der Bearbeitung von Aufgaben mit mehrstelligen Zahlen sind dagegen weit weniger gut untersucht. In ersten Untersuchungen zeigte sich für Kinder mit schwachen Mathematikleistungen ein stärker ausgeprägter Carry-Effekt bei mehrstelligen Additionsaufgaben was die Lösungsgeschwindigkeit sowie die Fehlerrate angeht (Busch et al., 2013; Lambert et al., in prep.). Allerdings fanden sich in den Blickbewegungsmustern keine Unterschiede zwischen den Leistungsgruppen, was darauf hindeutet, dass der größere Carry-Effekt nicht auf qualitative, sondern quantitative Verarbeitungsunterschiede zurückzuführen zu sein scheint. Wie in vorangegangenen Untersuchungen für Kinder ohne Lernschwierigkeiten (Moeller et al., 2011), ließ sich auch für schwach rechnende Kinder eine verstärkte Verarbeitung der Einer der Summanden feststellen, wenn ein Übertrag von den Einern zum Zehner notwendig war (Lambert et al., in prep). Analog zum Carry-Effekt bei der Addition erscheint der Effekt des Borgens (Borrow-Effekt) bei der Subtraktion (z.B. 26 - 18). Allerdings wurde die erhöhte Schwierigkeit durch die Notwendigkeit des Borgens bei mehrstelligen Subtraktionsaufgaben bisher kaum (Kong et al., 2005) und bei Kindern noch gar nicht untersucht. Solche Aufgaben benötigen, analog zu Additionsaufgaben mit Übertrag, allgemein mehr Aufmerksamkeit und Arbeitsgedächtniskapazität (z.B. Imbo et al., 2007), um auf basis-numerischer Ebene die korrekte Integration der Einer und Zehner in die Platz x Wert Struktur arabischer Zahlen beim Borgen vom Zehner zu leisten. Für Erwachsene konnten Radler, Huber, Moeller und Pixner (2014) für den Borrow-Effekt zeigen, dass die notwendigen Prozesse zumindest für die Verarbeitung der Operanden (d.h., Subtrahend und Minuend) ähnlich denen beim Carry-Effekt in der Addition sind. Allerdings gibt es bislang keine Untersuchung, die die dem Borrow zugrundeliegenden kognitiven Prozesse bei sich typisch entwickelnden Kindern untersucht, oder gar mögliche Unterschiede für sich atypisch entwickelnde Kinder zu identifizieren sucht. Zur Beantwortung dieser Fragen, wurden in der vorliegenden Studie n = 24 Kinder der dritten Klassenstufe mit schwachen mathematischen Leistungen (Prozentrang < 25) mit n = 46 Kindern mit guten Mathematikleistungen (Prozentrang > 45) verglichen. Verwendet wurde im Gegensatz zu bisherigen Studien (z.B. Moeller et al., 2011) ein Produktionsparadigma, da dies eher den schulischen Anforderungen der Kinder entspricht. Blickbewegungsmessungen wurden angewendet, um Prozessunterschiede untersuchen zu können. Wie erwartet, wiesen schwach rechnende Kinder höhere Reaktionszeiten und Fehlerraten auf als Kinder der Kontrollgruppe. Darüber hinaus zeigten spezifischere Analysen in beiden Gruppen einen bedeutsamen Borgen-Effekt, d.h. höhere Reaktionszeiten und Fehlerraten für Aufgaben mit verglichen mit Aufgaben ohne Zehnerübergang. Rechenschwache Kinder hatten dabei spezifische Probleme mit dem Zehnerübertrag was sich in einem signifikant erhöhten Borrow-Effekt in den Fehlerraten dieser Gruppe zeigte. Die Ergebnisse deuten somit darauf hin, dass sich die Befunde zum Carry-Effekt bei der Addition auf Subtraktionsaufgaben übertragen lassen. Die Analysen der Blickbewegungsmuster zeigten analog zu Untersuchungen zum Carry-Effekt bei der Addition und den Ergebnissen zur Subtraktion bei Erwachsenen, dass bei allen Kindern die Notwendigkeit eines Zehnerübertrags mit spezifischer Verarbeitung der Einer, d.h. mit längeren Fixationsdauern auf eben diesen, assoziiert war. Es fanden sich jedoch wieder keine qualitativen Gruppenunterschiede in den Blickbewegungsmustern. Die Analysen deuten damit darauf hin, dass sich die kognitiven Prozesse von schwach und gut rechnenden Kindern zur zur Anwendung der Borgenoperation bei mehrstelligen Subtraktionen nicht grundlegend voneinander unterscheiden. Allerdings scheinen die Prozesse bei schwach rechnenden Kindern generell verlangsamt und mit geringerer Lösungsgenauigkeit abzulaufen. Dies lässt sich möglicherweise auf eine fehlende Automatisierung des arithmetischen Faktenwissens, einer mangelnden Flexibilisierung von Rechenstrategien (Qin et al., 2014) und einer (dadurch bedingten) stärkeren Belastung des Arbeitsgedächtnisses (z.B. Geary et al., 2004) zurückführen. Mögliche Konsequenzen für die Praxis werden diskutiert. Neurofeedbacktraining in einem virtuellen Klassenzimmer bei Schulkindern mit einer Aufmerksamkeitsdefizit-/ Hyperaktivitätsstörung (ADHS) mit dem Ziel der Förderung schulischer Leistungsfähigkeit Friederike Blume1, Justin Hudak1, Thomas Dresler1, Tobias Renner2, Caterina Gawrilow3, Ann-Christine Ehlis4 1 LEAD Graduate School, Universität Tübingen, 2Klinik für Kinder- und Jugendpsychiatrie, Tübingen, 3Psychologisches Institut, Universität Tübingen, 4Klinik für Psychiatrie und Psychotherapie, Tübingen Kinder mit einer Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung (ADHS) sind unaufmerksam, hyperaktiv und impulsiv. Diese Kernsymptome zeigen sich situationsübergreifend, insbesondere aber bei Aufgaben, die Aufmerksamkeit erfordern. Folglich beeinflussen die Symptome die Leistungsfähigkeit zu Hause, bei der Arbeit oder in der Schule (American Psychiatric Association, 2013). Untersuchungen zeigen, dass Kinder mit ADHS schlechtere akademische Leistungen aufweisen als Kinder ohne ADHS (Daley & Birchwood, 2010). Sie haben zudem Probleme in exekutiven Funktionen (EF), die der schlechteren schulischen Leistungsfähigkeit zugrunde liegen könnten (Willcutt et al., 2005). Weitere Studien implizieren, dass ADHS-typisches Verhalten eine primäre Ursache für schwache Schulleistungen darstellt (vgl. Frazier et al., 2007; Loe & Feldman, 2007; Rodriguez et al., 2007). Folglich sollte eine Therapie der ADHS darauf abzielen, sowohl EF, als auch das Verhalten zu verbessern. Die Verhaltensmuster von Kindern mit ADHS (Symptome, reduzierte EF) spiegeln sich auf neuronaler Ebene in veränderten Aktivitätsmustern wider, die mittels Elektroenzephalographie (EEG) und funktionaler Nahinfrarotspektroskopie (fNIRS) gemessen werden können (vgl., Barry et al., 2003; Ehlis et al., 2008). Negoro und Kollegen (2010) zeigten mittels fNIRS, dass der ventrolaterale Präfrontalkortex von Kindern mit ADHS schlechter durchblutet ist als bei Kindern ohne ADHS. Neurofeedbacktrainings (NFT) sind spezifische Interventionen, die zum Ziel haben, Selbstregulation auf neurophysiologischer und auf Verhaltensebene zu verbessern, um so abweichende Hirnaktivität zu normalisieren (Gevensleben et al., 2014). Beim NFT wird die Gehirnaktivität des Patienten in visuelle oder akustische Signale übersetzt und unmittelbar rückgemeldet (Drechsler et al., 2007). Dadurch erlernen Patienten Strategien, ihre Gehirnaktivität selbst zu steuern (Gevensleben et al., 2014). Folglich sollten sich dadurch EF und das Verhalten verbessern. Studien zur Wirksamkeit von NFT zeigen widersprüchliche Ergebnisse auf. Holtmann und Kollegen (2014) konnte keine Verbesserung der ADHS-Symptomatik feststellen, die spezifisch auf ein EEGbasiertes NFT zurückzuführen war. Diese Ergebnisse stehen im Kontrast zu den Resultaten der Meta-Analysen von Arns und Kollegen (2009; 2014), die Evidenz für solche spezifischen Effekte fanden. Marx und Kollegen (2015) zeigten in einer Pilotstudie, dass ein NIRS-basiertes NFT mit Kindern mit ADHS die Symptomatik signifikant reduzieren konnte. Somit bleibt die spezifische Effektivität von NFT weiter unklar, ebenso wie bisher kaum untersuchten Effekte auf EF und die schulische Leistungsfähigkeit von Kindern mit ADHS (vgl. Meisel et al., 2013). Bislang wurden NFT bei Kindern mit ADHS bisher nur in 2D-Trainingssituationen umgesetzt, jedoch nicht in virtuellen Umgebungen, wie beispielsweise einem virtuellen Klassenzimmer. In der 2D-Situation werden die Signale auf einem Computerbildschirm zurückgemeldet. Jedoch gibt es unserer Ansicht nach gute Gründe, warum Patienten mit ADHS von einem NFT in einer virtuellen Umgebung profitieren sollten. Umso ähnlicher die Laborsituation dem realen Leben ist, umso leichter sollte Generalisierung erfolgen. Othmer und Kaiser (2000) zeigten, dass ein NFT in einer virtuellen Umgebung die Compliance und die kognitive Leistung von Probanden im Vergleich zu Personen, die in einer 2D-Umgebung trainiert hatten, verbessern konnte. Dies zeigt, dass Interventionen in virtueller Umgebung Effekte haben könnten, die mit einer 2D-Umgebung nicht erreicht werden können (vgl. Tortella-Feliu et al., 2011). Somit gehen wir erstens davon aus, dass die Generalisierung von im Labor erworbenen Selbstregulationskompetenzen in den Alltag durch das Training in einer virtuellen Umgebung vereinfacht und stimuliert werden kann. Othmer und Kaiser (2000) zeigten, dass ein Training in virtueller Umgebung im Vergleich zum 2D-Training den Verbleib von Patienten im Trainingsprogramm und das Bemühen, während des Trainings und in kognitiven Tests gut abzuschneiden, signifikant verbessern konnte. Deshalb sollte zweitens eine virtuelle Umgebung eine attraktivere Trainingsumgebung als eine 2D-Situation darstellen und zu einer höheren intrinsischen Motivation für das Training beitragen. In dem geplanten Vortrag möchten wir das NFT in einem virtuellen Klassenzimmer als eine Intervention vorstellen, die das Potential besitzt, neben der ADHS-Symptomatik auch EF zu verbessern. Dadurch könnte die schulische Leistungsfähigkeit von Kindern mit ADHS langfristig gesteigert werden. ID: 408 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Lehrerbildung Thematisches Cluster: Gesundheit/ Stress/ Belastung, Lehrer(aus)bildung Stichworte: Lehrkräfte, Beanspruchung, Emotionale Erschöpfung, Praxisschock, Vorbereitungsdiest Mythos „Praxisschock“ ? Beanspruchungserleben beim Übergang in die berufliche Praxis bei (angehenden) Lehrkräften Chair(s): Uta Klusmann (Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik), Friedericke Zimmermann (Christian-Albrechts-Universität zu Kiel) Diskutant(en): Anne Frenzel (Ludwig-Maximilians-Universität München) Der Übergang in den Lehrerberuf wird seit über 30 Jahren einhellig als Phase mit erhöhtem Stresserleben, etwa mit den Begriffen „Praxisschock“ oder „Survival Phase“, bezeichnet (Huberman, 1989; Schaefer, Long & Clandinin , 2012; Veenman, 1984). Ursächlich hierfür seien das Erleben von Inkompetenz, unrealistische Erwartungen und die multiplen Aufgaben einer Lehrkraft (Tynjälä & Heikkinnen, 2011). Eine Folge des Stresserlebens seien international hohe Abbruchquoten in den ersten Berufsjahren (Schaefer et al., 2012). Die empirische Befundlage ist weniger eindeutig als die Diskussion um den „Praxisschock“ impliziert (vgl. Dicke, 2015). Einerseits deuten Arbeiten darauf hin, dass beginnende Lehrkräfte Symptome von Stress und einen Anstieg in Erschöpfung aufweisen(Chan, 2002; Klusmann et al., 2012). Andere Arbeiten fanden allerdings niedrigere Stress-Werte angehender Lehrkräfte verglichen mit erfahrenen Lehrkräften (Klassen & Chui, 2011). Diese heterogene Befundlage überrascht nicht, da sich die für Beanspruchung verwendeten Indikatoren und die Gestaltung des Berufseinstiegs unterschieden. Auch in Anbetracht von Reformen in den letzten Jahren erscheint es notwendig, die Frage nach dem „Praxisschock“ mit aktuellen Daten systematisch zu untersuchen. Das Symposium stellt aktuelle empirische Längsschnittstudien zum postulierten „Praxisschock“ zusammen. Dabei decken die Beiträge alle Übergangsphasen in die schulische Praxis ab (Schulpraktikum, Vorbereitungsdienst, Beruf). Gemeinsam ist den Beiträgen die Betrachtung desselben Indikators für Beanspruchungserleben (emotionale Erschöpfung). Der erste Beitrag von Römer et al. untersucht individuelle und institutionelle Bedingungen des Beanspruchungserlebens im Schulpraktikum. Der zweite Beitrag von Zimmermann et al. fokussiert auf Entwicklungsverläufe und Einflussfaktoren für BurnoutDimensionen am Übergang vom Studium in den Vorbereitungsdienst. Der dritte Beitrag von Dicke et al. untersucht auf Basis von zwei Längsschnittkohorten die Entwicklung emotionaler Erschöpfung beim Übergang vom Vorbereitungsdienst in den Beruf. Der vierte Beitrag von Schmidt et al. untersucht anhand von Tagebuchdaten Stresserleben und emotionale Erschöpfung von Lehramtskandidaten im Vorbereitungsdienst im Vergleich zu Lehrkräften in den ersten Berufsjahren. Beiträge 1) Jasmin Römer, Martin Rothland & Sophie Straub: Das Praxissemester als sensible Phase für das Beanspruchungserleben von Lehramtsstudierenden. Erste Befunde aus dem Forschungsprojekt PriL 2) Friederike Zimmermann, Johanna Kaiser, Andrea Bernholt, Johannes Bauer & Lena Rösler: Veränderungsverläufe in BurnoutDimensionen: Die Bedeutung personaler und sozialer Faktoren angehender Lehrkräfte im Vorbereitungsdienst 3) Theresa Dicke et al.: „Doppelter Praxisschock“ auf dem Weg ins Lehramt? Die Entwicklung und potentielle Einflussfaktoren von emotionaler Erschöpfung während des Vorbereitungsdienstes und nach Berufseintritt 4) Juliane Schmidt, Uta Klusmann & Mareike Kunter: Wird alles besser? Tägliches Stresserleben von Lehramtskandidaten im Vorbereitungsdienst und Lehrkräften im Vergleich 5) Diskutantin: Anne Frenzel (Ludwig-Maximilians-Universität München) Beiträge des Symposiums Das Praxissemester als sensible Phase für das Beanspruchungserleben von Lehramtsstudierenden. Erste Befunde aus dem Forschungsprojekt PriL Jasmin Römer, Martin Rothland, Sophie Straub Universität Siegen Nationale wie internationale Studien belegen, dass sich viele Studierende als beansprucht erleben (u.a. Kreß, Sperth & Hofmann, 2015). Damit in Verbindung stehen körperliche und psychische Gesundheitsfolgen. Insbesondere psychosomatische Beschwerden treten vermehrt auf. Es wird vermutet, dass das Praxissemester mit seinen vielfältigen Herausforderungen eine (sensible) Phase erhöhten Beanspruchungserlebens für Lehramtsstudierende angesichts der vielfältigen neuen Herausforderungen darstellt. Da die Studierenden nun ihre Rolle als Lehrende in einer für sie bislang fremden Arbeitswelt ausschnittweise antreten, haben sie noch keine geeigneten Copingstrategien im Umgang mit den an sie gestellten Berufsanforderungen entwickeln können. Es besteht daher die ständige Gefahr von Überbeanspruchung, die sich insbesondere bei persönlich negativ eingeschätzter Lehrbefähigung gesundheitsschädigend auswirken könnte. Ob eine Bewältigung des Praxissemesters mit positiver Rollenidentifikation letztlich gelingt, hängt (aber) sowohl von individuellen als auch institutionellen Ressourcen ab. Fragestellung Bislang gibt es nur wenige Untersuchungen, in denen Lehramtsstudierende während des laufenden Praxissemesters zu ihrem Beanspruchungserleben befragt wurden und die gleichermaßen international anschlussfähig sind. Im Rahmen der Studie PriL (Praxissemester in der Lehrerbildung: Nutzung und Wirkung) wird die vermutete Beziehung vermehrter Beanspruchung im Praxissemester im Vergleich zur Studienzeit längsschnittlich zu drei Messzeitpunkten (vor, während und am Ende des Praxissemester) überprüft. Übergreifendes Ziel des Beitrags ist es, Einflüsse und Zusammenhänge bedingender Faktoren, die zu einem erfolgreichen Gelingen des Praxissemester beitragen können unter Berücksichtigung individueller Eingangsvoraussetzungen zu untersuchen. Gelingen wird dabei sowohl über positiv veränderte berufsbezogene Selbstkonzepte als auch über einen gering erlebten Erschöpfungszustand definiert und operationalisiert. Methode Grundlage des eingereichten Beitrags sind Ergebnisse zum Burnouterleben (Maslach Burnout Inventory-Student Survey; MBISS) und den psychosomatischen Beschwerden (Fragebogen zur Erfassung des Gesundheitsverhaltens; FEG) von Lehramtsstudierenden zum ersten und zweiten Messzeitpunkt der Studie PriL. Darüber hinaus werden Zusammenhänge mit erlebten Herausforderungen (subjektiver work load) sowie personalen und institutionellen Ressourcen im Praxissemester (bspw. pädagogische Vorerfahrungen; Unterstützung durch MentorInnen) aufgezeigt und diskutiert (u.a. Robins, Roberts & Sarris, 2015; Fives, Hammon & Olivarez). Bereits Etablierte ebenso wie neu konstruierte Instrumente werden eingesetzt. Ergebnisse Befunde zum zweiten MZP werden im November 2015 erwartet. Ergebnisse können im Symposium auf der Basis einer Stichprobe von n=137 berichtet werden. Veränderungsverläufe in Burnout-Dimensionen: Die Bedeutung personaler und sozialer Faktoren angehender Lehrkräfte im Vorbereitungsdienst Friederike Zimmermann1, Johanna Kaiser1, Andrea Bernholt2, Johannes Bauer3, Lena Rösler2 1 Christian-Albrechts-Universität zu Kiel, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und M, 3Technische Universität München Dieser Beitrag widmet sich der Entwicklung von Ausprägungen in Burnout-Dimensionen angehender Lehrkräfte über ihr erstes Jahr im Vorbereitungsdienst. Trotz des viel diskutierten „Praxis-Schocks“ gibt es nur wenige empirische Arbeiten, die sich mit Auswirkungen des Berufseinstiegs auf das Beanspruchungserleben angehender Lehrkräfte beschäftigen. Diese Studien geben einen Einblick in die Bedeutung verschiedener im Wesentlichen für Erschöpfung untersuchter Faktoren, z.B. eigenständiger Unterricht (Klusmann, Kunter, Voss, & Baumert, 2012), soziale Unterstützung durch Mentorinnen und Mentoren (Alhija & Fresko, 2010) sowie angehende Mit-Lehrkräfte (Richter, Kunter, Lüdtke, Klusmann, & Baumert, 2011) und LehrerSelbstwirksamkeitserwartung (Dicke et al., 2015). Vorhandene Studien gehen nicht über zwei Messzeitpunkte im Referendariat hinaus, so dass a) längsschnittliche Verläufe im Beanspruchungserleben nicht beobachtet werden können (vgl. Singer & Willett, 2003) und b) eine möglicherweise schon im Studium bestandene Vorbelastung nicht berücksichtigt wird. Außerdem ist offen, in welcher Form es zu Veränderungen in den weiteren für Burnout relevant erachteten Facetten kommt und ob es für diese spezifische protektive Faktoren gibt (Maslach, Schaufeli, & Leiter, 2001). Wir untersuchen erstens, ob Veränderungen in Erschöpfung, Zynismus und Leistungsmangel im ersten Jahr Vorbereitungsdienstes stattfinden, und wenn ja, welche Formen diese annehmen und zweitens, die Bedeutung zeitinvarianten (z.B. Dauer ausschließlicher Hospitation, Ausprägungen in Burnout-Dimensionen im Studium) zeitvariierenden Kovariaten (z.B. Betreuung durch die Ausbildungslehrkraft, soziale Unterstützung durch angehende Lehrkräfte, Lehrer-Selbstwirksamkeitserwartung). des von und Mit- Methode Die angehenden Lehrkräfte entstammten 13 verschiedenen Hochschulstandorten und wurden im Anschluss an das Projekt PaLea weiterverfolgt. Eine Substichprobe (N = 176; 80% weiblich) wurde verwendet, für die die erste Folgebefragung in den ersten 12 Wochen des Vorbereitungsdienstes lag (T2); es folgten Befragungen nach einem halben Jahr (T3) und einem Jahr (T4); Angaben am Ende des Studiums (T1) wurden berücksichtigt. Die Burnout-Dimensionen wurden mit Versionen des Maslach Burnout Inventory (MBI; Maslach, Jackson, & Leiter, 1996) erfasst, die an das Studium bzw. den Vorbereitungsdienst adaptiert waren (vgl. Schaufeli, Martinez, Marques Pinto, Salanova, & Bakker, 2002; Schaufeli & Salanova, 2007). Die Zufriedenheit mit der Betreuung durch die Ausbildungslehrkraft, die die Person am intensivsten betreut sowie die soziale Unterstützung durch andere angehende Lehrkräfte wurden mit an anderer Stelle erstellten Skalen erfasst (COACTIV-R, 2009). Außerdem wurde die Skala zur Lehrer-Selbstwirksamkeitserwartung eingesetzt (Schmitz & Schwarzer, 2000). Die Reliabilitäten waren für alle Skalen und über alle Messzeitpunkte gut. Latente Wachstumskurvenmodelle wurden berechnet: a) zur Bestimmung der Form der Veränderungsverläufe in den BurnoutDimensionen, b) unter Einschluss von zeitinvarianten und zeitvariierenden Kovariaten, wobei c) die Veränderung der Effekte zeitvariierender Kovariaten über die Zeit getestet wurde (McArdle & Anderson, 1990; Muthén, 1993; Preacher, Wichman, MacCallum, & Briggs, 2008). Ergebnisse Die Analysen der latenten Wachstumskurvenmodelle ergaben für Erschöpfung einen mittleren Anstieg im ersten Halbjahr sowie ein Plateau stabil erhöhter Werte im zweiten Halbjahr, für Zynismus einen linearen Anstieg und für Leistungsmangel keine Veränderung über das erste Jahr im Vorbereitungsdienst. Die für alle Dimensionen signifikanten Varianzen in Ausgangs- und Veränderungswert konnten wesentlich durch die Vorbelastungswerte zu T1 erklärt werden. Das Niveau, auf dem Veränderungen in Erschöpfung und Zynismus stattfinden bzw. auf dem Ausprägungen im Leistungsmangel stabil bleiben ist also wesentlich von Ausprägungen in den Burnout-Dimensionen im Studium bestimmt. Eine längere Dauer ausschließlicher Hospitation wirkte einem Anstieg in Erschöpfung entgegen. Die Effekte der zeitvariierenden Kovariaten waren stabil über T2-T4. Während Lehrer-Selbstwirksamkeitserwartung negativ mit allen Burnout-Dimensionen assoziiert war, war die Betreuung durch Ausbildungslehrkräfte für Leistungsmangel und Zynismus, die soziale Unterstützung durch angehende Mit-Lehrkräfte spezifisch für Zynismus bedeutsam. Für die durchgängig bedeutsame Lehrer-Selbstwirksamkeitserwartung war ferner der Leistungsmangel am Ende des Studiums prädiktiv. Neben den günstigen Auswirkungen einer längeren Hospitationszeit und einer Unterstützung durch Ausbildungslehrkräfte und angehende Mit-Lehrkräfte legen die Befunde nahe, dass der Aufbau von Ressourcen bereits im Lehramtsstudium zur Vorbeugung erhöhter Burnout-Werte im Vorbereitungsdienst beitragen kann. Keywords: Referendariat, Burnout-Dimensionen, soziale Unterstützung, Lehrer-Selbstwirksamkeitserwartung, Burnout im Studium „Doppelter Praxisschock“ auf dem Weg ins Lehramt? Die Entwicklung und potentielle Einflussfaktoren von emotionaler Erschöpfung während des Vorbereitungsdienstes und nach Berufseintritt Theresa Dicke1, Doris Holzberger2, Olga Kunina-Habenicht3, Christina Linninger3, Franziska Schulze-Stocker4, Tina Seidel2, Ewald Terhard4, Detlev Leutner1, Mareike Kunter5 1 Duisburg-Essen University, 2Technische Universität München, 3Goethe University, Frankfurt, 4Westfälische WilhelmsUniversität Münster, 5Goethe Universität, Frankfurt Beginnende Lehrkräfte gelten in der öffentlichen Wahrnehmung als eine Berufsgruppe mit einem besonders hohen Beanspruchungsniveau. Dabei wird häufig auf den sogenannten Praxisschock verwiesen (Huberman, 1998). Die tatsächliche Befundlage ist dabei nach wie vor allerdings unklar: (1) Studien zum Verlauf von der empfundenen Beanspruchung zeigen inkonsistente Ergebnisse (Dicke et al., 2015). (2) andere Studien weisen auf individuelle Unterschiede im Beanspruchungserleben hin (Schulte, 2008). (3) die Vergleichbarkeit internationaler Ergebnisse zur Beanspruchung beginnender Lehrer mit deutschen Studien ist auf Grund des weltweit einzigartigen Vorbereitungsdienstes limitiert (Klusmann, Kunter, Voss & Baumert, 2012). Theoretisch sollte der in Deutschland durchgeführte Vorbereitungsdienst einen sukzessiven und begleiteten Einstieg beginnender Lehrkräfte ermöglichen (Dietrich, 2014). Anderseits unterliegt der Vorbereitungsdienst Kritik, unter anderem aufgrund des mangelnden Praxisbezugs (Kunter, Linninger, Schulze-Stocker, Kunina-Habenicht & Lohse-Bossenz, 2013) oder dem Druck durch Noten und Examensarbeit (Schulte, 2008). Im Jahr 2009 wurde daraufhin im Land Nordrhein-Westfalen eine Reform des Vorbereitungsdienstes beschlossen. Diese führte zu einer Verkürzung der Vorbereitungszeit und erhöhte damit das Risiko einer höheren Belastung durch Zeitdruck. Gleichzeitig wurden jedoch Personenzentrierung (z.B. Mentoring) und Handlungsorientierung (z. B. praxisgerechten Handlungssituationen) verstärkt sowie auf die Examensarbeit und Benotung des Kernseminars verzichtet (Gerdes & Annas-Sieler, 2011). Diese Maßnahmen sollten zu einer stärkere Unterstützung und Entlastung der Lehramtsänwärter(innen)(LAA) führen. Ziel der vorliegenden Studie ist es deshalb, mehr über die Beanspruchungssituation während des Vorbereitungsdiensts zu erfahren. Durch die Abbildung des Verlaufs der empfundenen Beanspruchung während des Vorbereitungsdienstes und ein Jahr nach Beginn als selbständige Lehrkraft soll eine bessere Vergleichbarkeit mit internationalen Studien hergestellt werden. Zudem soll untersucht werden, inwieweit die Reform des Vorbereitungsdienstes Auswirkung auf diesen Verlauf hat. Methode Design Die vorliegende Studie bezieht sich auf drei Messzeitpunkte: Zu Beginn des Referendariats (T1), am Ende des Referendariats (T2) und ein Jahr nach Beginn als Lehrkraft (T3). Dabei wurden Daten zweier Kohorten gewonnen: Kohorte 1 (K1): der letzte Jahrgang des bisherigen Vorbereitungsdiensts von 24 Monaten; Kohorte 2 (K2): erster Jahrgang im reformierten Vorbereitungsdienst von 18 Monaten. Somit handelt es sich bei dieser Studie um ein quasi-experimentelles Design mit Messwiederholung. Stichprobe Die Ausgangsstichprobe der vorliegenden Studie (N = 1.749; K1: n = 1212, K2: n = 498) setzt sich aus 27.2% männlichen und 69.6% weiblichen LAA aller allgemeinbildenden Schularten mit einem Durchschnittsalter von M = 27.47 (SD = 4.11) Jahren zusammen. Es zeigten sich keine signifikanten Unterschiede in diesen Merkmalen zwischen K1 und K2. Instrumente Emotionale Erschöpfung (Enzmann & Kleiber, 1989) Analyseverfahren Zur Untersuchung der Veränderung und möglicher Gruppenunterschiede von emotionaler Erschöpfung vom Beginn über das Ende des Referendariats hinaus bis zum Ende des ersten Jahres als selbstständige Lehrkraft wurden Latent-Change-Modelle (Ferrer & McArdle, 2010) sowie Mehrgruppen-Vergleiche angestellt. Ergebnisse Das Latent-Change-Modell zeigte eine gute Passung auf die Daten. Es zeigte sich eine leichte Abnahme der emotionalen Erschöpfung während des Vorbereitungsdiensts; wobei die Effektgröße jedoch eher klein war. Ein Jahr nach Berufseinstieg als selbstständige Lehrkraft zeigte sich wiederum ein etwas stärkerer Anstieg der emotionalen Erschöpfung. Zudem zeigten sich individuelle Unterschiede im Wert des Ausgangsniveaus von emotionaler Erschöpfung und in beiden Veränderungen. Untersucht wurde dann, ob sich diese individuellen Unterschiede durch die Zughörigkeit zu einer Kohorte erklären lassen. Der Modellfit für dieses (Mehrgruppen)-Latent-Change-Modell war nicht zufriedenstellend. Für T1, also den Ausgangswert von emotionaler Erschöpfung, zeigte sich ein signifikanter Unterschied in beiden Kohorten, wobei K2 den minimal höheren Wert zeigte. Es zeigten sich jedoch keine signifikanten Unterschiede der Change-Variablen und damit im Verlauf von emotionaler Erschöpfung zwischen beiden Kohorten. Fazit Es zeigen sich tatsächlich Indizien für einen zweiten Praxisschock, welcher erneut ein Jahr nach Beginn als selbstständige Lehrkraft auftritt. Hinsichtlich der Reform des Vorbereitungsdienstes scheint es gelungen zu sein, potentielle belastende Effekte der Verkürzung durch die neu eingeführten Elemente zu relativieren. Schlüsselwörter: emotionale Erschöpfung, Lehrerausbildung, Vorbereitungsdienst Veränderungsmessung Wird alles besser? Tägliches Stresserleben von Lehramtskandidaten im Vorbereitungsdienst und Lehrkräften im Vergleich Juliane Schmidt1, Uta Klusmann1, Mareike Kunter2 1 Leibniz-Institut für die Pädagogik der Naturwissenschaften und M, 2Goethe Universität Frankfurt Der Übergang in die schulische Praxis stellt für viele Lehrkräfte eine große Herausforderung dar, die mit vielen Veränderungen einhergeht: Sie sind nicht länger die Lernenden, sondern müssen als Lehrende von Beginn den eigenen Unterricht gestalten, vor- und nachbereiten, mit Schülerinnen, Schülern und dem Kollegium interagieren, Eltern beraten, sich fortbilden und organisatorische Aufgaben übernehmen. An diese Veränderungen und neuen Herausforderungen müssen sich die Lehrkräfte erst anpassen. Huberman (1989) geht in den ersten sechs Berufsjahren von zwei Anpassungsphasen aus: Dem Modell zufolge sind Lehrkräfte zunächst primär mit dem „Überleben“ und „Entdecken“ beschäftigt. Dabei kennzeichnet das „Überleben“ den Praxisschocks aufgrund der Konfrontation mit der Komplexität des Unterrichtens, während das „Entdecken“ den initialen Enthusiasmus der Lehrkraft wiederspiegelt. Daran schließt sich eine Phase der „Stabilisierung“ an, in der Lehrkräfte sich mit ihrer Rolle als Lehrkraft identifizieren können. Bisherige längsschnittliche Untersuchungen bei Lehrkräften zeigten einen Anstieg im Stresserleben im ersten Berufsjahr (Hultell, et al., 2013; Klusmann et al., 2012). Zudem fanden Klusmann und Kollegen (2012) für das zweite Jahr eine leichte Erholung des Wohlbefindens, während Hultell und Kollegen (2013) von einem weiteren Anstieg des Burnout-Niveaus berichteten. Allerdings wurde bisher noch nicht untersucht, ob sich auch das tägliche Stresserleben von Lehrkräften verändert. Daher betrachtet die aktuelle Studie im Rahmen der Untersuchung des Anpassungsprozesses von Lehrkräften nicht nur Veränderungen im Wohlbefinden sondern auch Unterschiede im täglichen Stresserleben. Das „Stresserleben“ wurde dabei als Verhältnis von täglichen positiven zu negativen (beruflichen) Ereignissen definiert. Das erste Ziel war es somit, Indikatoren für einen Anpassungsprozess in Form von Unterschieden im täglichen Stresserleben zwischen Referendarinnen und Referendaren im ersten und zweiten Jahr des Vorbereitungsdienstes und Lehrkräften zu finden. Als zweites sollte überprüft werden, ob der Anpassungsprozess im täglichen Wohlbefinden in Form von Unterschieden im Wohlbefinden zwischen den drei Gruppen reflektiert wird. Die Analysen basieren auf Daten aus zwei Tagebuchstudien mit insgesamt drei verschiedenen Kohorten von (angehenden) Lehrkräften: 353 Referendarinnen und Referendaren im ersten, 100 Referendarinnen und Referendaren im zweiten Jahr des Vorbereitungsdienstes und 141 Lehrkräften in den ersten Berufsjahren. Alle Teilnehmerinnen und Teilnehmer haben an 14 Tagen in einem Online-Tagebuch Angaben zu ihrem täglichen Stresserleben, ihrer emotionalen Erschöpfung und ihrem Enthusiasmus zu Lehren gemacht. Um das tägliche Stresserleben zu erfassen, wurden mittels idiographisch-nomothetischem Ansatzes zunächst die täglichen beruflichen Ereignisse offen berichtet und anschließend als positiv bzw. negativ bewertet. Die offenen Antworten wurden – entsprechend der Tätigkeitsbereiche von Lehrkräften – in acht Kategorien unterteilt: Unterrichten, Vor- und Nachbereitung, außerunterrichtliche Interaktion mit Schülerinnen und Schülern, Beraten, Interaktion mit Kollegium, Aus- und Fortbildung, Organisation und Sonstiges. Die Ergebnisse zeigen, dass sich die drei Kohorten im täglichen Stresserleben in drei Kategorien statistisch signifikant unterschieden: “Unterrichten” (F(2,481) = 18.52, p < .001, η² = .072), “außerunterrichtliche Interaktion mit Schülerinnen und Schülern” (F(2,481) = 4.14, p = .02, η² = .017), und “Organisation” (F(2,481) = 6.05, p = .003, η² = .025). Die Lehrkräfte hatten dabei ein geringeres Stresserleben beim „Unterrichten“ und der „Organisation“. Zudem zeigten Lehrkräfte sowie Referendarinnen und Referendare im zweiten Jahr des Vorbereitungsdienstes ein geringeres Stresserleben hinsichtlich der „außerunterrichtlichen Interaktion mit Schülerinnen und Schülern“ als Referendarinnen und Referendare im ersten Jahr. Bezüglich des Wohlbefindens zeigten sich weder für die emotionale Erschöpfung (F(2,480) = 2.80, p = .06, η² = .012) noch für den Enthusiasmus zu Lehren (F(2,480) = 1.13, p = .32, η² = .005) statistisch signifikante Unterschiede zwischen den drei Kohorten. Lehrkräfte in den ersten Berufsjahren berichteten lediglich in der Tendenz eine geringe emotionale Erschöpfung (M = 1.59) als Lehrkräften im ersten (M = 1.68) und zweiten Jahr des Vorbereitungsdienstes (M = 1.66). Insgesamt liefert die aktuelle Studie Hinweise auf einen Anpassungsprozess in den ersten Berufsjahren, der aber wider Erwarten nicht mit Veränderungen im Wohlbefinden einhergeht. Keywords: (angehende) Lehrkräfte; Anpassungsprozesse; Tagebuchstudie ID: 410 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie, Soziologie Thematisches Cluster: Bildung im Sekundarbereich, Motivation und Emotion Stichworte: Akademisches Selbstkonzept, Leistungsselbsteinschätzung, Referenzgruppenwechsel, BFLPE Leistungsselbsteinschätzungen im sozialen und institutionellen Kontext Chair(s): Malte Jansen (DIPF), Michael Becker (DIPF) Diskutant(en): Petra Stanat (IQB / HU Berlin) Soziale Vergleiche gehören zu den wichtigsten Quellen von Wissen über die eigene Person und Identität (Gore & Cross, 2014). Im schulischen Kontext ist eine zentrale Komponente von Identität das Wissen über die eigenen Kompetenzen. Dabei sind die Peers (Lerngruppe, Schule) die wichtigste Referenzgruppe, vor deren Hintergrund soziale Leistungsvergleiche stattfinden. Allerdings gibt es unterschiedliche Hypothesen zur Auswirkung einer starken oder negativ selegierten Referenzgruppe. Zum einen geht eine starke Referenzgruppe mit einem besonders hohen Vergleichsstandard einher, was zu einem negativen Effekt der Peer-Leistung auf Selbstkonzepte unter Kontrolle der individuellen Leistung führt (Big-Fish-Little-Pond Effect). Zum anderen werden aber auch positive Assimilationseffekte innerhalb von leistungsstarken Gruppen und negative Stigmatisierungseffekte von leistungsschwachen Gruppen (z.B. Schulformen) beschrieben. In diesem Symposium werden vier empirische Beiträge vorgestellt, die sich mit dem Zusammenspiel von Referenzgruppen und Selbstkonzepten beschäftigen und sowohl Fragen der Richtung als auch der Generalisierbarkeit und weiteren Bedeutsamkeit von Kontexteffekten ergründen wollen. Der erste Beitrag betrachtet die Selbstkonzeptentwicklung beim Übergang der Grund- zur Sekundarschule, der mit einem Referenzgruppenwechsel einhergeht. Er stellt die Frage, wie sich Kontexteffekte weiterentwickeln und auch transsituativ von Bedeutung sind. Es wird untersucht, inwiefern sich Effekte einer starken Referenzgruppe in der Grundschule auf akademische Selbstkonzepte auch nach dem Übergang in die Sekundarschule bestehen bleiben und sich über die Referenzgruppeneffekte innerhalb der Sekundarschule auswirken. Der zweite Beitrag beschäftigt sich mit einer anderen Art des Referenzgruppenwechsels, des Überspringens einer Stufe in den Klassenstufen 4 bis 6. Es wird die Selbstkonzeptentwicklung von Überspringerinnen und Überspringern mit der einer durch Propensity Score Matching balancierten Vergleichsgruppe verglichen und geprüft, ob mögliche Effekte des Überspringens geschlechtsspezifisch ausfallen. Im dritten Beitrag werden die Ergebnisse solcher Referenzgruppeneffekte am Ende der Sekundarstufe I fokussiert. Er geht der Frage nach, in welchem Maße sich Evidenz für negative Stigmatisierungs- und Marienthal-Effekte oder für positive Effekte Selbstwert schützender Nischen finden lässt. Es werden Selbstkonzepte und Bildungsaspirationen von Zehntklässlerinnen und Zehntklässlern untersucht, die eine nicht-gymnasiale Schulart besuchen und vor dem Übergang in die Oberstufe bzw. die berufliche Ausbildung stehen, und die Frage gestellt, wie diese von der besuchten Schulart und dem dort angestrebten Abschluss beeinflusst werden. Im vierten Beitrag wird schließlich untersucht wie die Über- oder Unterschätzung der eigenen Kompetenzen im Vergleich zur sozialen Referenzgruppe (Fremdeinschätzung durch die Peers) die eigene Leistungsentwicklung (Tests und Noten) beeinflusst. Dazu wird ein Round-Robin-Design genutzt, bei dem alle Schülerinnen und Schüler einer Klasse sich gegenseitig in Bezug auf ihre Kompetenz beurteilen, und mit einem interpersonellen Ansatz unter Nutzung bayesianischer Verfahren ausgewertet. Beiträge des Symposiums Never Forget Where You Come From? Zum Zusammenspiel multipler Big-Fish Big-Fish-Little-Pond Effekte Michael Becker, Marko Neumann DIPF Theoretischer Hintergrund: Neben dem Kompetenzerwerb wird auch das akademische Selbstkonzept (ASK) als wichtiges Outcome schulischer Bildungsprozesse erachtet, sowohl für Lernprozesse selbst als auch für die Entwicklung von Interessen, Aspirationen und Planung von Bildungskarrieren (Eccles, 1994; Nagengast & Marsh, 2012). Eine Vielzahl von Forschungsarbeiten hat gezeigt, dass neben individuellen Faktoren auch der Kontext eine wichtige Rolle für die Entwicklung des akademischen Selbstkonzeptes spielt. Gerade soziale Vergleichsprozesse und kontextspezifische Rückmeldungen über die Leistungen führen dazu, dass sich Schülerinnen und Schüler mit gleichen individuellen Leistungen, in leistungsstarken Klassen weniger kompetent fühlen als in weniger leistungsstarken Klassen (ein sogenannter Big-Fish-Little-Pond-Effekt, BFLPE; Marsh, 1987). Obwohl BFLPE als gut belegt gelten können und generalisierbar erscheinen sowohl über unterschiedliche Bildungsetappen, Schülergruppen und Kulturkreise (Chmielewski, Dumont, & Trautwein, 2013; Marsh & Hau, 2003; Seaton, Marsh, & Craven, 2009) wurde darauf verwiesen, dass BFLPE in der Regel allein im Querschnitt untersucht wurden und wenig darüber bekannt ist, wie sie sich im Längsschnitt entwickeln (Dai & Rinn, 2008). Zwar wurde vereinzelt gezeigt, dass BFLPE längsschnittlich persistieren können (im Überblick vgl. Marsh et al., 2008). Jedoch gibt es nur wenig Forschung zur transkontextuellen Dynamik von BLFPE, so etwa zur Frage, wie sich BFLPE längerfristig über unterschiedliche Kontexte hinweg entwickeln. Zwar weisen einige Studien darauf hin, dass BFLPE auch nach Kontextwechseln bestehen bleiben können (Marsh, 1991; Marsh, Trautwein, Lüdtke, Baumert, & Köller, 2007), jedoch ist das Wissen hierüber bislang eher anekdotisch und darauf beschränkt, lediglich einen BFLPE zu untersuchen (vgl. auch Wouters, Fraine, Colpin, Van Damme, & Verschueren, 2012). Fragestellung: Die Studie untersucht das Zusammenspiel mehrerer BLFPE im Übergang von der Grundschule in die Sekundarstufe. Hierbei wird geprüft, inwiefern sich für sowohl Grundschule als auch Sekundarschulen BFLPE finden lassen und wie sie sich längsschnittlich kurz- wie längerfristig nach dem Übergang verändern. Dabei wird die Frage adressiert, ob ein BFLPE eines früheren Kontextes auch in der Anwesenheit eines BFLPE eines neuen Lernkontextes bestehen bleibt. Methode: Die Studie verwendet die Berliner ELEMENT-Studie (Lehmann & Lenkeit, 2008) und greift auf ein random subsample von N = 155 Schülerinnen und Schülern zurück, die drei Mal, kurz vor ihrem (vorzeitigen) Übergang an ein grundständiges Gymnasium in der Grundschule (Ende 4), kurz nach dem Übergang (Beginn 5) sowie ein Jahr nach dem Übergang (Ende 5), untersucht wurden (zum Subsample vgl. Becker et al., 2014). Für dieses Subsample liegen neben individuellen Informationen zu Leistung und akademischem Selbstkonzept auch Kontextinformationen (aggregierte Klassenleistung) zum ersten Kontext (Grundschule) wie auch zum zweiten Kontext (grundständiges Gymnasium) nach dem Übergang vor. Statistisch wurden latente Modelle und auf sowohl Individual- als auch Kontextebene mit Leseverständnis, Orthographie und Mathematik als Leistungsindikatoren (alle Maße mit WLE-Reliabiliät r > .84) geschätzt sowie, nur auf individueller Ebene, eine latente Modellierung des allgemeinen ASK (zu allen Messzeitpunkten Cronbach’s α > .71; Reteststabilität r > .52; starke Messinvarianz über die drei Messzeitpunkte) umgesetzt. Zur simultanen Modellierung der beiden BFLPE wurden die Effekte als latente multivariate hierarchische Regressionsmodelle gerechnet. Die Umsetzung erfolgte über Mplus 7.11, fehlende Daten wurden auf Indikatorenebene in MICE (van Buuren & Groothuis-Oudshoorn, 2011) imputiert. Ergebnisse Die Analysen ergaben ein differenziertes Muster: Der Grundschulkontext weist in erwartbarer Weise einen starken BLFPE zum Ende der vierten Klasse (Grundschule) auf, der Sekundarschulkontext zum Ende der 5. Klasse (Gymnasium). Längsschnittlich lässt der Grundschul-BFLPE unmittelbar nach dem Übergang nach und ist am Ende der 5. Klasse nicht mehr nachweisbar. Die Wirkung des gymnasialen Kontextes setzt noch nicht direkt nach dem Übergang ein, sondern lässt sich erst nach einem Jahr nachweisen. Die Befunde werden hinsichtlich der Bedeutung längerfristige Relevanz von BFLPE diskutiert, da sie darauf hinweisen, dass nicht in allen Domänen, Alters- und Entwicklungsstufen von längerfristigen Wirkungen von BFLPE auszugehen ist. Das Überspringen einer Klassenstufe: Analyse geschlechtsspezifischer Effekte auf das schulische Selbstkonzept Julia Kretschmann1, Miriam Vock1, Oliver Lüdtke2, Anna Gronostaj1 1 Universität Potsdam, 2IPN / ZIB Theoretischer Hintergrund: Angebote zur Förderung besonders leistungsstarker und begabter Schülerinnen und Schüler lassen sich akzelerierenden und anreichernden Maßnahmen zuordnen (Vock, Preckel, Holling, 2007). Das individuelle Überspringen einer Klassenstufe stellt dabei eine häufig genutzte und organisatorisch wenig aufwendige Maßnahme der Akzeleration dar. Akzeleration („Beschleunigung“) beinhaltet ein schnelleres Durchlaufen der Schullaufbahn und zielt darauf ab, ein Passungsproblem zu lösen, indem begabte Schülerinnen und Schüler auf einem Anforderungsniveau unterrichtet werden sollen, das ihrem indi-viduellen Entwicklungsstand entspricht (Holling et al., 2015). Während eine förderliche Wirkung des Überspringens einer Klasse auf die schulische Leistungsentwicklung der Kinder bereits in einer Reihe von quantitativen Studien nachgewiesen werden konnte, sind die wenigen Befunde zu den motivationalen Auswirkungen des Springens weitaus uneinheitlicher. Dazu mag auch beitragen, dass motivationale, soziale und emotionale Konstrukte in bisherigen Untersuchungen gehäuft subsumiert werden. Hinweise auf geschlechtsspezifische Effekte des Klassenüberspringens liegen bislang v.a. hinsichtlich der sozialen Entwicklung der Kinder vor (Hoogeveen, Van Hell & Verhoeven, 2009), treten aber in den letzten Jahren in der Forschung zur Hochbegabtenförderung zudem gehäuft im Zusammenhang mit motivationalen Merkmalen in Erscheinung (z.B. Dai & Rinn, 2008; Dai, Rinn & Tan, 2013). Das für den Wechsel in eine leistungsstärkere Lerngruppe postulierte Absinken im akademischen Selbstkonzept („Big-Fish-LittlePond-Effekt“) wäre, ausgehend von diesen Befunden, für akzelerierte Mädchen in stärkerem Umfang zu erwarten als für akzelerierte Jungen. Jedoch liegen auch Ergebnisse vor, die ein Aus-bleiben des Big-Fish-Little-Pond-Effekts im Zusammenhang mit Maßnahmen zur Förderung besonders begabter Schülerinnen und Schülern durch ausgleichende Assimilationseffekte aufzeigen (z.B. Preckel & Brüll, 2010). Fragestellung: Die vorliegende Untersuchung geht daher der Frage nach, (1) welche Veränderungen im allgemeinen und fachbezogenen akademischen Selbstkonzept sowie in der leis-tungsbezogenen Schulangst der Schülerinnen und Schüler das individuelle Überspringen einer Klassenstufe bewirkt, und (2) ob sich geschlechtsspezifische Effekte des Überspringens auf die motivationale Entwicklung der Kinder nachweisen lassen. Methode: Bislang berücksichtigten nur wenigen Studien zu den Auswirkungen akzelerativer Maßnah-men die Unterschiedlichkeit akzelerierter und nicht-akzelerierter Schülerinnen und Schüler. Belastbare Befunde aus Deutschland fehlen gänzlich. Wurden Störvariablen kontrolliert, wurden überdies nur wenige konfundierende Merkmale in die Analysen aufgenommen. Problematisch scheint auch die Anwendung regressionsanalytischer Modelle, da Treatment- und Vergleichsgruppe in vielen Verteilungen der Kovariaten nur sehr begrenzt überlappen. In dem vorliegenden Beitrag wird daher die Methode des Propensity Score Matchings zur Bildung einer adäquaten Vergleichsgruppe gewählt. Matchingvariablen und Matchingalgorithmus werden an die Anforderungen der moderierenden Regression und die mehrebenenanalytische Beschaffenheit der Daten angepasst. Grundlage der Analysen bilden die Berliner ELEMENT-Daten (N = 4962, davon n = 96 Springer/innen) von Schülerinnen und Schülern der Klassenstufen 4 bis 6. Ergebnisse: Die Ergebnisse zeigen, dass ein Absinken des akademischen Selbstkonzepts im Sinne eines Referenzgruppeneffekts nach Übertritt in eine höhere Klassenstufe durch Überspringen ausbleibt. Hingegen zeigen sich die Ausprägungen im akademischen Selbstkonzept teilweise erhöht. Dies spricht für das Vorliegen eines starken Assimilationseffekts („Basking-in-Reflected-GloryEffekt“). Die gefunden Effekte werden jedoch zum Teil durch das Geschlecht moderiert: In der Gruppe der Mädchen zeigen sich weniger positive Entwicklungen in schulischem Selbstkonzept und leistungsbezogener Schulangst in Folge des Springens als in der Gruppe der Jungen. Akademische Selbsteinschätzungen und Wahrnehmungen der eigenen beruflichen Chancen – Das Zusammenspiel von Schulformzugehörigkeit und Schulabschluss Hanna Dumont1, Protsch Paula2, Malte Jansen1, Michael Becker1 1 DIPF, 2WZB Theoretischer Hintergrund Inwiefern die Schulformzugehörigkeit die akademische Laufbahn von Schülerinnen und Schülern beeinflusst, stellt sowohl in der Pädagogischen Psychologie als auch in der Bildungssoziologie seit langem eine prominente Forschungsfrage dar. Bezüglich des Einfluss der Schulformzugehörigkeit auf die Selbsteinschätzungen von Schülerinnen und Schülern kommen die beiden Disziplinen zu unterschiedlichen Schlüssen. Während in der Soziologie davon ausgegangen wird, dass Schülerinnen und Schüler in niedrigeren Schulformen „a negative identity construction“ entwickeln (Solga, 2004, S.102), wird in der Psychologie auf der Basis von empirischen Befunden zum sogenannten Big-Fish-Little-Pond-Effect (BFLPE) im gegliederten Schulsystem (siehe z.B. Köller, 2004) die Position vertreten, dass niedrigere Schulformen „selbstwertschützende Nischen“ (Trautwein, Baumert & Maaz, 2007, S.7) darstellen. Gleichwohl konnten in einer jüngeren pädagogisch-psychologischen Arbeit Stigmatisierungseffekte bei Hauptschülerinnen und Hauptschülern auf Ebene der kollektiven Identität gezeigt werden (Knigge, 2009). Somit lässt sich vermuten, dass hinsichtlich der Schulformzugehörigkeit verschiedene nebeneinander existierende Selbsteinschätzungen bestehen und daher weitere Dimensionen betrachtet werden sollten, um zu einem umfassenderen Bild des Einfluss der Schulformzugehörigkeit auf die Selbsteinschätzungen zu gelangen. Dabei scheint die Einschätzung der beruflichen Chancen von Schülerinnen und Schülern unterschiedlicher Schulformen mit Blick auf ihren weiteren beruflichen Lebensweg von besonderer Relevanz. Vor dem Hintergrund der zunehmend geringer werdenden Kopplung von Schulform und Schulabschluss und auf der Basis von soziologischen Studien zum Übergang von der Schule in den Ausbildungsmarkt, in denen die Bedeutsamkeit des erreichten Bildungszertifikats für die berufliche Laufbahn gezeigt wurde (Protsch, 2014), sollte nicht nur die Schulformzugehörigkeit, sondern das Zusammenspiel von Schulformzugehörigkeit und Schulabschluss untersucht werden. Fragestellung Ausgehend von diesen Befunden und unter Einbezug der unterschiedlichen disziplinären Perspektiven, geht der vorliegende Beitrag der Frage nach, inwiefern sich akademische Selbsteinschätzungen und die Wahrnehmung von beruflicher Chancen(losigkeit) von Schülerinnen und Schülern mit gleichen individuellen Lernvoraussetzungen in Abhängigkeit ihrer Schulformzugehörigkeit und ihres voraussichtlichen Schulabschlusses voneinander unterscheiden. Fokussiert wird dabei auf die nichtgymnasialen Schulformen Hauptschule, Realschule und Gesamtschule, da an diesen Schulformen in dem von uns fokussierten Schulsystem gleichermaßen der Hauptschul- und der Realschulabschluss erworben werden kann. Methode Aufgrund der großen Unterschiede in der konkreten Ausgestaltung der Schulformen zwischen den Bundesländern und der regionalen Unterschiede in der Arbeitsmarktsituation, wird die empirische Analyse auf das Bundesland Berlin begrenzt. Als Datenbasis dienten Fragebogenangaben von gut 1100 Schülerinnen und Schüler der 10. Jahrgangstufe im alten Schulsystem vor der Berliner Schulstrukturreform. Dies bietet in besonderer Weise die Möglichkeit, Schulform und Schulabschlüsse zu differenzieren. Verwendet wird der Schulabschluss, der voraussichtlich erreicht wird. Als abhängige Variablen dienen das Fähigkeitsselbstkonzept sowie verschiedene Einschätzungen beruflicher Chancen. Unter Kontrolle differenzieller Lernvoraussetzungen (z.B. Testleistung, sozialer Hintergrund) wurden sechs Gruppen von Schülerinnen und Schülern miteinander verglichen: Hauptschulabschluss auf Hauptschule (Referenzkategorie), Hauptschulabschluss auf Realschule, Hauptschulabschluss auf Gesamtschule, Realschulabschluss auf Hauptschule, Realschulabschluss auf Realschule und. Realschulabschluss auf Gesamtschule. Die Gruppenzugehörigkeit wurde dabei in Form von Dummy-Variablen in lineare Regressionen aufgenommen. Ergebnisse In Bezug auf das Fähigkeitsselbstkonzept zeigten sich keine Unterschiede zwischen den Gruppen. Die generellen Chancen mit einem Hauptschulabschluss einen Ausbildungsplatz zu finden schätzten Jugendliche mit Realschulabschluss auf Real- und Gesamtschulen als schlechter ein als Schülerinnen und Schüler mit Realschulabschluss auf Hauptschulen sowie diejenigen mit Hauptschulabschluss auf allen Schulformen. Gleichzeitig schätzten jedoch nur die Schülerinnen und Schüler mit angestrebtem Hauptschulabschluss auf Haupt- und Gesamtschulen ihre eigene Chance einen Ausbildungsplatz zu finden als geringer ein als die anderen Gruppen. Bezüglich der Einschätzung der eigenen Qualifikationen bei der Ausbildungsplatzsuche waren es die Schülerinnen und Schüler mit Realschulabschluss auf Gesamtschulen, die positiv von den anderen Jugendlichen abwichen. Die Befunde zeigen das komplexe Wechselspiel zwischen Schulformzugehörigkeit und Schulabschluss und machen zudem deutlich, wie wichtig es ist, die Untersuchung der Selbsteinschätzungen von Jugendlichen nicht allein auf Fähigkeitsselbstkonzepte zu beschränken, sondern auf der Basis verschiedener disziplinärer Perspektiven um weitere Dimensionen zu ergänzen. Selbstüberschätzung als Prädiktor für akademische Leistung: Ein interpersoneller Ansatz zur Modellierung der Akkuratheit von Fähigkeitsselbsteinschätzungen Thomas Lösch1, Oliver Lüdtke2, Alexander Robitzsch3, Augustin Keleva1, Benjamin Nagengast1, Ulrich Trautwein1 1 Eberhard Karls Universität Tübingen, 2IPN / ZIB, 3IPN Theoretischer Hintergrund Prominente Theorien der pädagogischen Psychologie kommen zu widersprüchlichen Vorhersagen zu dem Effekt von Selbstüberschätzung: Überschätzung sollte entweder förderlich (z.B. Ryan & Deci, 2000; Wigfield & Eccles, 2000) oder hinderlich (z.B. Alexander, 2013; de Bruin & van Gog, 2012) für schulische Leistung sein. Studien unterscheiden sich jedoch in der Operationalisierung der Selbstüberschätzung. Selbstüberschätzung als sozialer Vergleich basiert nur auf Selbsteinschätzungen und vernachlässigt tatsächliche Leistungen (Blanton, Buunk, Gibbons, & Kuyper, 1999). Selbstüberschätzung als Selbsteinsicht verrechnet eine Selbsteinschätzung mit einer objektiven Leistung, vernachlässigt dabei aber individuelle Antworttendenzen (Chiu & Klassen, 2010) Der interpersonelle Ansatz (Kwan, John, Kenny, Bond, & Robins, 2004) berücksichtigt beide Perspektiven für die Erfassung der Selbstüberschätzung. Durch die Verwendung eines Round-Robin-Designs (d.h. alle Schülerinnen und Schüler einer Klasse beurteilen sich gegenseitig) kann die Selbsteinschätzung der eigenen Fähigkeiten in mehrere Komponenten zerlegt werden. Der Perceiver Effekt repräsentiert eine individuelle Beurteilungstendenz. Der Target Effekt erfasst dagegen, wie eine einzelne Schülerin bzw. ein einzelner Schüler von Mitschülern bewertet wird. Eine Selbsteinschätzung, die von der gewichteten Summe von Target und Perceiver Effekt abweicht, kann als Selbstüberschätzung bzw. Selbstunterschätzung verstanden werden. Fragestellung Erstens ist zu klären, inwieweit die Überschätzungsmaße des sozialen Vergleichs mit dem Target Effekt, bzw. inwieweit Selbsteinsicht mit dem Perceiver Effekt konfundiert sind (siehe Kwan et al. (2004). Zweitens soll geklärt werden, wie Selbstüberschätzung querschnittlich und längsschnittlich mit Leistung (Note und Leistungstest) korreliert. Methode Die vorliegende Studie verwendet als Datenbasis die TRAIN Studie (Jonkmann et al., 2013) und berücksichtigt die ersten beiden Messzeitpunkte (t1 und t2) von zwei Kohorten der Mittelschule in Sachsen. Die Stichprobe bestand aus 1.549 Schülerinnen und Schülern in 46 fünften Klassen (46.33 % weiblich, mittleres Alter 11.11, SD = 0.54) und 41 achten Klassen (47.06 % weiblich, mittleres Alter 14.30, SD = 0.65). Das zentrale Maß der Studie waren interpersonelle Kompetenzeinschätzungen in Mathematik zu t1: In jeder Klasse beantworteten Schülerinnen und Schüler das Item „Dieser Schüler ist gut in Mathematik“ für alle anderen Mitschüler und sich selbst auf einer siebenstufigen Skala. Die Selbsteinschätzung wurde als Maß des Fähigkeitsselbstkonzepts verwendet. Als Leistungsmaße wurden standardisierte Testleistungen sowie Zeugnisnoten zu beiden Messzeitpunkten erfasst. Drei Maße der Selbstüberschätzung wurden verglichen. Selbsteinsicht war die Differenz zwischen standardisiertem Selbstkonzept und standardisierter Leistung zu t1 (Chiu & Klassen, 2010). Sozialer Vergleich war das Residuum der Regression vom Selbstkonzept auf den Perceiver Effekt (Blanton et al., 1999). Interpersonelle Überschätzung war das Residuum der Regression vom Selbstkonzept auf Perceiver Effekt und Target Effekt (Kwan et al., 2004). Target Effekt und Perceiver Effekt wurden mit Hilfe von Bayes-Verfahren geschätzt (Lüdtke, Robitzsch, Kenny, & Trautwein, 2013). Zur Klärung der querschnittlichen Zusammenhänge der Überschätzungsmaße mit Target- und Perceiver-Effekten sowie Leistung wurden bivariate Korrelationen berechnet. Der längsschnittliche Effekt wurde durch Regressionsmodelle bestimmt, wobei jeweils die Leistung zu t2 – unter Kontrolle der Leistung zu t1– durch die Überschätzung vorhergesagt wurde. Ergebnisse Für die erste Forschungsfrage zeigte sich, dass die Überschätzungsmaße des sozialen Vergleichs und der Selbsteinsicht konfundiert waren (siehe Kwan et al., 2004). Um Selbstüberschätzung unkonfundiert von Leistung und Antworttendenzen zu erfassen, schien der interpersonelle Ansatz daher geeignet zu sein. Interessanterweise unterschied sich je nach verwendetem Maß der Zusammenhang zwischen Leistung und Überschätzung. Während der soziale Vergleich positiv mit Leistung korrelierte, zeigte sich ein negativer Zusammenhang der Selbsteinsicht mit Leistung. Die interpersonelle Überschätzung korrelierte positiv mit Leistung, d.h. eher kompetente Schülerinnen und Schüler überschätzten sich mehr. In der Vorhersage der Leistungsentwicklung zeigte sich ein kleiner, positiver Effekt der interpersonellen Überschätzung, d.h. Überschätzung schien eher förderlich für die Leistungsentwicklung zu sein. Insgesamt lieferte die vorliegende Studie zwei zentrale Ergebnisse. Zum einen machte sie deutlich, dass sich verschiedene Überschätzungsmaße hinsichtlich zentraler Korrelate unterschieden. Zum anderen zeigte sich in der Studie ein positiver Effekt für die mittels des interpersonellen Ansatzes erfasste Überschätzung auf die Leistungsentwicklung. ID: 415 Symposium Disziplinen-Cluster: Didaktiken der Naturwissenschaften und Technik, Lehrerbildung Thematisches Cluster: Lehrer(aus)bildung, Trainings- und Evaluationsforschung, Unterrichtsentwicklung/ Unterrichtsqualität Stichworte: Kommunikation, Interaktion, (Fach)Sprach, Video, Lehreraus- und fortbildung Kommunikation, Argumentation und (Fach)Sprache: Videoeinsatz zur Erfassung von Interaktionen in formalen Lernsettings Chair(s): Ann-Kathrin Schindler (Technische Universität München) Diskutant(en): Dominik Leiss (Leuphana Universität Lüneburg) Eine Lehrkraft ist im Rahmen ihrer Profession von formalen Lernsettings in zweierlei Hinsicht umgeben: Zum einen ist sie als Lehrender im Unterricht tätig, in welchem ihre Schülerinnen und Schüler die Nutzer des formalen Lernsettings Klassenzimmer sind. Zum anderen besucht sie selbst als Lernender im Rahmen der Aus- und fortbildung das formale Lernsetting Hochschule. Im Verständnis des lebenslangen Lernens sowie einer gelungenen Theorie-Praxis-Verzahnung (Gröschner, 2014) spielen beide Lernsettings eine zentrale Rolle. Während im Lehramtsstudium das Lernsetting Hochschule dominierend ist und angereichert wird durch schulpraktische Erfahrungen, ist im späteren Beruf das Klassenzimmer das zentrale Setting und (meist freiwillige) Fortbildungen an der Hochschule dienen Lehrkräften als weiterbildendes Lernsetting. Beide Lernsettings sind in hohem Maße von Interaktionen, Kommunikation und der Verwendung von (Fach)Sprache geprägt. Im Klassenzimmer von Interaktionen mit Schülerinnen und Schülern, in der Hochschule von Interaktionen mit Peers und Mentoren. Das Symposium will eine Synergie schaffen, zwischen Lernsettings, in welchen (angehende) Lehrkräfte selbst als Lernende agieren (Beitrag 1, 2 und 4), und Lernsettings, in welchen die Schülerinnen und Schüler die Rolle der Lernenden einnehmen (Beitrag 3 und 4). Alle Beiträge setzen dabei das Instrument Video ein, um Interaktionen, Kommunikation und (Fach)Sprache der beteiligten Akteure zu erfassen (Beitrag 1, 3 und 4) beziehungsweise nutzen Video, um Interaktion und Kommunikation unter den Lernenden anzuregen (Beitrag 2 und 4). Des Weiteren thematisieren alle Beiträge die Bedeutung von Interaktion, Kommunikation und (Fach)Sprache für unterrichtliches Handeln und die Wichtigkeit (angehende) Lehrkräfte im Erwerb diesbezüglicher Kompetenzen zu unterstützen. Beitrag 1: Der erste Beitrag stellt ein Training im Lernsetting Hochschule vor, in welchem angehende Lehrkräfte über die Bewertung und argumentativen Nutzen von Evidenz lernen. Die Experimentalgruppe zeigte eine signifikante Steigerung in ihrer Bewertungs- und Argumentationskompetenz im Rahmen videographierter Gruppendiskussionen. Beitrag 2: Im zweiten Beitrag wird untersucht, inwiefern angehende Lehrkräfte soziale Interaktionen im Rahmen einer Mentoringsituation in Abhängigkeit davon wahrnehmen, ob ein Eigenvideo einer unterrichteten Lesestunde als Grundlage für die Interaktion mit ihrem Mentor diente. Der Beitrag diskutiert, wie der Einsatz von Video im Lernsetting Hochschule Interaktionen zwischen Mentor und Mentee unterstützt. Beitrag 3: Der dritte Beitrag untersucht den Umgang mit Fachsprache im Chemieunterricht und liefert damit eine Betrachtung von Interaktionen im Lernsetting Klassenzimmer aus fachdidaktischer Perspektive. Die Konstruktion und Evaluation des Kodiermanuals werden diskutiert. Beitrag 4: Der abschließende Beitrag stellt Befunde einer videobasierten Fortbildung zur produktiven Unterrichtskommunikation vor. Neben Ergebnissen zur signifikanten Verbesserung der Interventionsgruppen werden individuelle Entwicklungsverläufe der Lehrkräfte diskutiert und Implikationen bezüglich effektiver Fortbildungsangebote abgeleitet. Beitrag 5: Diskussion Beiträge des Symposiums Training der Kompetenz angehender Lehrkräfte zur Bewertung und argumentativen Nutzung von Evidenz Sandra Wenglein, Johannes Bauer, Manfred Prenzel Technische Universität München Theoretischer Hintergrund Das Prinzip des evidenzbasierten Handelns, sowie das argumentative Nutzen von Evidenz, spielt im Bildungswesen eine immer größere Rolle (Fischer et al. 2014; Wiseman, 2010). Der Praxistransfer hat jedoch bisher in vielen Bereichen nicht, oder nur unzureichend, stattgefunden. Gerade Lehrkräfte begründen ihr Handeln kaum auf Grundlage wissenschaftlicher Evidenz (Hetmanek et al., 2015; Williams & Coles, 2007), obwohl dies in den Standards für Lehrerbildung gefordert wird (KMK, 2004). Ein möglicher Grund dafür ist, dass die Kompetenz zur Bewertung und Nutzung bildungswissenschaftlicher Evidenz im Lehramtsstudium in der Regel kaum systematisch gefördert wird. Im Anschluss an diese Entwicklungen wurde ein Training für Lehramtsstudierende zum kompetenten Umgang mit Evidenz entwickelt. Die Grundidee dieses Trainings besteht darin, innerhalb kurzer Zeit in kooperativen Lernsettings (Gräsel, 2006; Collins et al, 1989) Heuristiken zu zwei Teilkompetenzen zu vermitteln: (a) zur Bewertung und (b) zur argumentativen Nutzen von Evidenz. Die Heuristiken zur kritischen Bewertung von Evidenz haben zum Ziel den Studierenden kognitive Strategien zu vermitteln, mit denen sie die komplexe Aufgabe der Bewertung von Evidenz auch mit geringem Vorwissen bewältigen können (Abelson, 1995; Elsevier, 2014). Die Heuristiken zum Argumentativen Nutzen von Evidenz beruhen auf Schemata nach Kuhn (1997) und Toulmin (1996). Fragestellungen Ziel der vorliegenden Studie war es, erste Erkenntnisse zu Trainierbarkeit und Nützlichkeit der vermittelten Heuristiken zu gewinnen. Konkret fokussiert die Studie drei Fragestellungen: (a) Wie manifestieren sich die erlernten Heuristiken in Gruppendiskussionen und in den schriftlichen Statements während des Trainings und führt ihre Nutzung zu einer gesteigerten Qualität der Argumentation? (b) Gelingt der Transfer der Heuristiken aus dem kooperativen Setting (Gruppendiskussion) während des Trainings auf eine nachfolgende Situation, in der Evidenz individuell bewertet und genutzt werden muss, und lässt sich hier eine Konsistenz in der Argumentationsqualität feststellen? (c) Welche Rolle spielen hierfür das wissenschaftstheoretische Vorwissen der Teilnehmenden, die Fachausrichtung, die Überzeugungen und die Ambiguitätstoleranz der Studierenden? Methode und Design Zur Beantwortung der Fragestellung wurde ein 2x2 Experiment (randomisierter Faktor Training vs. Kontrollgruppe, beobachteter Faktor Fächerkombination: natur- vs. geisteswissenschaftlich) mit _N_ = 167 Lehramtsstudierenden durchgeführt. Analysiert wurden videografierte Gruppendiskussionen sowie ein auf Fallvignetten basierendes, schriftliches Testinstrument (Wilson, 2005; Heininger, 2013). Zur Auswertung diente ein in Anlehnung an bestehende Instrumente entwickeltes Kategoriensystem (Kuhn, 1997; Wilson, 2005; Bell, 2010; Felton & Kuhn, 2011). Mit Hilfe dieses Kategoriensystems werteten zwei Rater unabhängig voneinander sowohl die Gruppendiskussionen als auch die schriftlichen Statements aus (mittlere Interrater-Reliabilität ICC = .87, Range .70 - .97). Zudem wurden über Fragebögen Prozess- und Akzeptanzdaten erfasst, die eine zusätzliche Einschätzung der ablaufenden Lernprozesse und Wirkungen des Trainings erlauben. Als relevante Hintergrundvariablen wurden insbesondere epistemologische Überzeugungen, Überzeugungen zur Nutzung von Evidenz und die Ambiguitätstoleranz erfasst. Ergebnisse Die Ergebnisse zeigten einen großen Effekt des Trainings auf die Bewertungskompetenz (_d_ = 1.55; _p_ < .001) und die Argumentationskompetenz (_d_ = 1.36 ; _p_ < .001). Teilnehmer der Experimentalgruppe belegten ihr Argumente zudem signifikant häufiger mit Evidenz (χ² (1) = 21.09; (_p_ = .006) hatten klarer aufgebaute Argumente (χ² (6)= 12.79; _p_ = .003) und argumentierten häufiger dialektisch (χ² (1)= 4.63; _p_ = .031). Die Ergebnisse sind über beide Teilkompetenzen und über beide (schriftliche) Statements auf der Individualebene konsistent (ICC = .90). Die Konsistenz über alle Settings hinweg (schriftliche Statements und Gruppendiskussionen) liegt bei ICC = .54. Erste Analysen zu Einflussvariablen auf beide Teilkompetenzen zeigen, dass der Fächerhintergrund keine signifikante Auswirkung auf deren Ausprägung hat (β = .087; _p_ = .356). Die vorliegende Studie erweitert damit den Stand der Forschung zu Voraussetzungen evidenzbasierter Praxis und zu effektiven Designprinzipien von Fördermaßnahmen zum evidenzbasierten Argumentieren bei Lehramtsstudierenden. Literatur Abelson, Robert P. (1995). Statistics as principled argument. Hillsdale, NJ: Lawrence Erlbaum, pp. 12-14. Bell, P. (2010). Scientific arguments as learning artifacts: designing for learning from the web with KIE. International Journal of Science Education, 22, 797-817 Collins, A., Brown, J. S. & Newman, S. E. (1989). Cognitive apprenticeship: teaching the crafts of reading, writing, and mathematics. In L. B. Resnick (Hrsg.), Knowing, learning and instruction (S. 453-494). Hillsdale, NJ: LEA. Elsevier Reviewer Guidelines (2014). Verfügbar unter: http://www.elsevier.com/reviewers/reviewer-guidelines#editors-advice Felton, M., Kuhn, D. (2001). The Development of Argumentive Discourse Skill. Discourse Processes, 32, 135-153 Fischer, F., Kollar, I., Ufer, S., Sodian, B. Hussmann, H., Pekrun, R., Neuhaus, B., Dorner, B. Pankofer, S., Fischer, M., Strijbos, J., Heene, M., Eberle, J. (2014). Scientific Reasoning and Argumentation: Advancing an Interdisciplinary Research Agenda in Education. Frontline learning Research (3), 1-18. Gräsel, C. (2006). Gestaltung problemorientierter Lernumgebungen. In K. H. Arnold, U. Sandfuchs & J. Wiechmann (Hrsg.), Handbuch Unterricht (S. 335-339). Bad Heilbrunn: Klinkhardt. Hetmanek, A., Wecker, C., Gräsel, C., Kiesewetter, J., Trempler, K. Fischer, M.R., & Fischer,F. (2015). Ressourcen nutzen Lehrkräfte wann? Eine Interviewstudie zur Schnittstelle zwischen Unterrichtsalltag und Wissenschaft, Unterrichtswissenschaft, 43 (3). Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland. (2004). Standards für die Lehrerbildung: Bildungswissenschaften (Beschluss der Kultusministerkonferenz vom 16.12.2004). Bonn: KMK, verfügbar unter http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/ 2004_12_16-Standards-Lehrerbildung.pdf Kuhn, D., Shaw, V., & Felton, M. (1997). Effects of dyadic interaction on argumentive reasoning. Cognition and Instruction, 15, 287–315. Toulmin, S. (1996). Der Gebrauch von Argumenten. Weinheim: Beltz Athenäum Williams, D. & Coles, L. (2007). Evidence-based practice in teaching: an information perspective. Journal of Documentation, 63(6), 812-835. Wilson, M. (2005). Constructing measures. New York: Taylor & Francis. Wiseman, A. W. (2010). The uses of evidence for educational policymaking: Global contexts and international trends. Review of Research in Education, 34, 1-24. Mentoring mit videographierten vs. beobachteten Unterrichtsstunden Barbara Drechsel, Jana Roder Otto-Friedrich-Universität Bamberg Die Verschränkung von in der Lehrerausbildung erworbenem Wissen mit erfahrungsbasiertem Lernen in Praxisphasen während des Studiums erhöht die Qualität der Ausbildung (Korthagen, 2010). Praxisphasen bieten die Möglichkeit, professionsbezogene Theorien und Konzepte an der Schulwirklichkeit zu überprüfen sowie sich der eigenen Berufswahl zu vergewissern (Hascher, 2006). Entscheidend für den Erfolg von Praxisphasen ist die Qualität der Lernbegleitung (Gröschner et al., 2013), die eher selten systematisch und häufig durch eine unzureichende Verknüpfung von Theorie und Praxis gekennzeichnet ist (Brouwer und Korthagen, 2005). Um Bezüge zu relevantem Theoriewissen herzustellen, werden im Projekt LuPe (Leseförderung und Praxiserfahrung) Hochschuldozentinnen als Mentoren eingesetzt, die auch die praxisvorbereitenden Kurse unterrichten. Diese verfügen über theoriebezogenes Expertenwissen im Bereich Lesekompetenzförderung, das für den Erwerb von Kompetenzen in der Praxis handlungsleitend ist (Borko & Mayfield, 1995). Im Gegensatz zum schulischen Mentoring durch Praxislehrkräfte existiert hierzu bisher nur wenig Forschung (Arnold et al., 2014). Da sie die Unterrichtsversuche nicht „live“ beobachten können sind universitäre Mentoren auf Werkzeuge wie die Videographie angewiesen, die ein großes Potenzial für die Ausbildung von Lehrkräften birgt (Dalehefte & Kobarg, 2013, Krammer & Reusser, 2005, Stadler, 2005; Nitsche, 2014), das nur dann zum Tragen kommt, wenn eine „aktiv-produktive“ (Vohle & Reinmann, 2012) Bearbeitung des Videomaterials in sozialer Interaktion ermöglicht wird. Dieses vielversprechende Werkzeug kann jedoch nicht immer eingesetzt werden, da sich Studierende sowie Schülerinnen und Schüler nicht immer mit dem Aufzeichnen von Unterrichtssequenzen einverstanden erklären. In diesen Fällen muss auf teilnehmende Beobachtungen zurückgegriffen werden. Je nachdem, welches Medium zur Erfassung der Unterrichtsstunde zur Verfügung steht, unterscheidet sich auch das Mentoring und es stellt sich die Frage, ob die Erfolge des Mentoring sich in Abhängigkeit davon unterscheiden. Der vorliegende Beitrag thematisiert folgende Fragen (1) Wie wirkt sich das Mentoring (Vorbesprechung, Beobachtung/Videografie, Nachbesprechung) auf verschiedene lernrelevante Faktoren (z.B. Vorbereitungszeit, subjektiver Lerngewinn, Zufriedenheit) bei Lehramtsstudierenden aus? (2) Unterscheiden sich diese Wirkungen in Abhängigkeit davon, ob die begleitete Stunde beobachtet oder videographiert wurde? Es wird angenommen, dass die universitäre Lernbegleitung bei den Studierenden fruchtbare Lernprozesse auslöst und somit bei der mentorierten im Vergleich zu nicht mentorierten Lesestunden zwar die Arbeitsbelastung und die Vorbereitungszeit höher ist, aber auch mehr positive Lernergebnisse erreicht werden. Die Befunde zu Vorteilen von Unterrichtsvideos legen die Vermutung nahe, dass Studierende, deren Lesestunde videographiert wurde, zufriedener sind und den subjektiven Lerngewinn der begleiteten Stunde höher einschätzen als ihre Kommilitoninnen und Kommilitonen, deren Stunden mittels teilnehmender Beobachtung erfasst wurden. Die Fragestellungen werden mittels Daten aus einem Theorie-Praxis-Seminar für Lehramtsstudierende zum Thema Lesekompetenzförderung bearbeitet. Über die fünf Wochen der Praxisphase des Seminars führten 50 Studierende ein Logbuch zur Reflexion und zur Vor- und Nachbereitung der Lesestunden. Eine der fünf Lesestunden wurde ausführlich mentoriert. Angelehnt an das Fachspezifische Unterrichtscoaching (Staub & Kreis, 2013) untergliedert sich das Mentoring zu dieser Stunde in drei Phasen: Die umfassende Vorbesprechung der Unterrichtseinheit, die in geteilter Verantwortung durchgeführte und beobachtete Leseförderstunde und eine gemeinsame Nachbesprechung dieser Stunde. Die Auswertungen von Logbucheinträgen und einer retrospektiven Fragebogenerhebung geben Hinweise zu Zufriedenheit und Nutzen bezüglich des Mentoring und darauf, wie sich die lernrelevanten Faktoren zwischen der begleiteten und den nicht begleiteten Lesestunden unterscheiden und (2) ob und wie sich diese Faktoren in Abhängigkeit davon unterscheiden, ob die begleitete Lesestunde beobachtet oder videographiert wurde. Aus den Ergebnissen werden Überlegungen für die Weiterentwicklung der universitären Lernbegleitung angestellt sowie Schlussfolgerungen bezüglich des Einsatzes von Videofeedback im praktischen Teil des Seminars gezogen. Vor dem Hintergrund der vorliegenden Befunde werden weitere Forschungsfragen diskutiert. Literatur Arnold, K.-H., Gröschner, A. & Hascher, T. (Hrsg.) (2014). Pedagogical field experiences in teacher education: theoretical foundations, programmes, processes, and effects. Münster: Waxmann. Borko, H. & Mayfield, V. (1995). The roles of the cooperating teacher and university supervisor in learning to teach. Teaching and Teacher Education, 11, 501-518. Brouwer, N. & Korthagen, F. (2005). Can Teacher Education Make a Difference? American Educational Research Journal, 42, 153-224. Dalehefte, I.M. & Kobarg, M. (2013). Aus Unterrichtsbeobachtungen lernen. Publikation des Programms SINUS an Grundschulen. Kiel: IPN. Gröschner, A., Schmitt, C. & Seidel, T. (2013). Veränderung subjektiver Kompetenzeinschätzungen von Lehramtsstudierenden im Praxissemester. Pädagogische Psychologie, 27 (1-2), 77-86. Hascher, T. (2006). Veränderungen im Praktikum – Veränderungen durch das Praktikum. Zeitschrift für Pädagogik, 52 (51. Beiheft), 130-148. Korthagen, F.A.J. (2010). Situated learning theory and the pedagogy of teacher education: Towards an integrative view of teacher behavior and teacher learning. Teaching and Teacher Education, 26, 98-106. Krammer, K. & Reusser, K. (2005). Unterrichtsvideos als Medium der Aus- und Weiterbildung von Lehrpersonen. Beiträge zur Lehrerbildung, 23 (1), 35-50. Nitsche, Kai (2014): UNI-Klassen - Reflexion und Feedback über Unterricht in Videolabors an Schulen. Dissertation, LMU München: Fakultät für Psychologie und Pädagogik. Reusser, K. (2005). Situiertes Lernen mit Unterrichtsvideos. Journal für Lehrerinnen- und Lehrerbildung, 2, 8-18. Stadler (2005). Intervention durch Forschung. Wege zur Unterstützung der Professionalisierung von Lehrkräften mittels Video. In: M. Welzel & H. Stadler (Hrsg.). Nimm doch mal die Kamera! Zur Nutzung von Videos in der Lehrerbildung (S. 171-190). Münster: Waxmann. Staub, F.C. & Kreis, A. (2013). Fachspezifisches Unterrichtscoaching in der Aus- und Weiterbildung von Lehrpersonen. Journal für LehrerInnenbildung, 2, 8-13. Vohle, F. & Reinmann, G. (2012). Förderung professioneller Unterrichtskompetenz mit digitalen Medien: Lehren lernen durch Videoannotation. In R.Schulz-Zander et al. (Hrsg.), Jahrbuch Medienpädagogik 9 ( S. 413-429). Wiesbaden: Springer. Fachsprache im Chemieunterricht Holger Tröger1, Elke Sumfleth1, Oliver Tepner2 1 Universität Duisburg-Essen, 2Universität Regensburg Theoretischer Rahmen Fachsprachen dienen dem sprachlichen Austausch von Informationen auf fachlicher Ebene (Rincke, 2007). Das Lernen von Sprache und Fachsprache ist dabei untrennbar mit dem Lernen im Fach verbunden (Merzyn, 2008) und sowohl erklärtes Ziel schulischer Bildung im Unterrichtsfach Chemie (KMK, 2005; Ministerium für Schule und Weiterbildung des Landes NordrheinWestfalen, 2014) als auch Gegenstand chemiedidaktischer Forschung (z.B. Busch & Ralle, 2011; Özcan, 2013; SchmölzerEibinger, 2013). Dieser Symposiumsbeitrag fokussiert auf die Entwicklung, Evaluation und praktische Anwendung eines hoch-inferenten Videokodiermanuals zum Umgang mit Fachsprache im Chemieunterricht, das im Rahmen des Projekts ProwiN (Professionswissen in den Na-turwissenschaften) entwickelt wurde (Tröger, Sumfleth & Tepner, 2015). Videokodiermanual zur Analyse von Fachsprache im Chemieunterricht _Konstruktion_ Das hoch-inferente Kodiermanual dient der turnbasierten Detailanalyse der Tiefenstruktur des transkribierten Unterrichtsgesprächs und berücksichtigt die sprachliche und inhaltliche Ebene der unterrichtlichen Äußerungen. Auf sprachlicher Ebene wird die Äußerung hinsichtlich ihrer medialen Repräsentationsform (mündliche oder schriftliche Äußerung), ihrem Anlass (Beitrag, Frage, Aufgreifen einer anderen Äußerung) sowie ihrer strukturellen Komplexität untersucht. Die Analyse der strukturellen Komplexität erfolgt in Anlehnung an die Operationalisierung inhaltlicher Komplexität als schwierigkeitsbestimmende Dimension von Aufgaben, wie sie z.B. im ESNaS Projekt (Kauertz, Fischer, Mayer, Sumfleth & Walpuski, 2010) vorgenommen wurde. Dabei wird zwischen Äußerungen unterschieden, die nur aus einzelnen Wörtern, ganzen Sätzen oder miteinander verbundenen Sätzen bestehen. Weiterhin wird differenziert, ob diese Kodiereinheiten alltagssprachliche Begriffe, allgemein-wissenschaftssprachliche Begriffe und/oder Fachbegriffe enthalten. Auf inhaltlicher Ebene werden Äußerungen hinsichtlich ihrer inhaltlichen Komplexität und ihrer fachlichen Korrektheit beurteilt. _Evaluation_ Zur Evaluation des Videokodiermanuals wurden zehn vorliegende und turnbasiert transkribierte Unterrichtsvideos aus einer vorherigen Videostudie (Walpuski et al., 2012) von zwei Beobachtern unabhängig voneinander auf Grundlage des Manuals kodiert. Die durchschnittliche Interrater-Übereinstimmung (Kappa = .88) ist sehr gut und variiert je nach Kategorie zwischen Kappa = 1.0 und Kappa = .72. Auf Grundlage der quantitativen Auswertung der Evaluation kann das Manual als geeignet betrachtet werden, Fachsprachenhandlungen im Unterricht zu erfassen. Eine qualitative Analyse des Kodier-manuals konnte überdies zeigen, dass eine Analyse der Fachsprache die Unterscheidung zwischen fachsprachlicher und fachlicher Richtigkeit erforderlich macht; beispielsweise ist die Aussage eines Schülers „Salzsäure ist HCl“ zwar fachlich falsch, da „HCl“ nicht Salzsäure „ist“ sondern als Formelzeichen Salzsäure symbolisiert, wird aber oftmals von der Lehrkraft als fachlich richtig akzeptiert. Die Abkürzung des Wortes mit der Summenformel kann beispielsweise in der Ökonomie gesprochener Sprache begründet sein. Durch die Einführung der Unterscheidung von fachsprachlicher und fachlicher Richtigkeit wird solchen Fällen Rechnung getragen und die an sich falsche Aussage eines Schülers kann als fachsprachlich falsch aber fachlich korrekt gewertet werden. Die Unterteilung stößt an ihre Grenzen, wenn die fachsprachliche Inkorrektheit auch eine fachliche Inkorrektheit mit bedingt. In diesem Falle wäre die Aussage sowohl fachlich als auch fachsprachlich falsch. Dieses Beispiel zeigt bereits die hohe Inferenz der Beschreibung fachsprachlicher Aussagen auf. Anwendungsbereich und Ausblick Das Kodiermanual wird verwendet, um den Zusammenhang zwischen der Lernleistung von Schülerinnen und Schülern und dem Umgang ihrer Lehrkraft mit Fachsprache im Unterricht analysieren zu können. Zu diesem Zweck wurde in den Schuljahren 2014 und 2015 der Unterricht von 29 Lehrkräften an bayrischen und nordrhein-westfälischen Gymnasien videografiert. In der 8. Jahrgangsstufe wurden von jeder Lehrkraft zwei aufeinanderfolgende Unterrichtsstunden zum Thema Atombau und Periodensystem der Elemente aufgezeichnet und analysiert. Diese Erhebung wurde von schriftlichen Testinstrumenten zur Erfassung des Fachwissens der Schülerinnen und Schüler sowie des theoriebasierten fachdidaktischen Wissens der Lehrkräfte zum Umgang mit Fachsprache begleitet (Strübe, Tröger, Tepner & Sumfleth, 2014). Der Beitrag stellt die Entwicklung und Evaluation des hoch-inferenten Kodiermanuals zum Umgang mit Fachsprache im Chemieunterricht detailliert vor und thematisiert Vor- und Nachteile sowie Herausforderungen der Untersuchungsmethode. Darüber hinaus werden quantitative und qualitative Ergebnisse der Videoanalysen der ProwiN-Stichprobe vorgestellt. Literatur Busch, H. & Ralle, B. (2011). Fachbegriffe und ihre Bedeutung. Diagnose fachsprachlicher Kompetenz. NiU Chemie, 22(124/125), 52-55. Kauertz, A., Fischer, H. E., Mayer, J., Sumfleth, E. & Walpuski, M. (2010). Standardbezogene Kompetenzmodellierung in den naturwissenschaftlichen Fächern der Sekundarstufe I. Zeitschrift für Didaktik der Naturwissenschaften, 16, 155-166. KMK / Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (Hrsg.). (2005). Bildungsstandards im Fach Chemie für den Mittleren Schulabschluss (Jahrgangsstufe 10). München: Luchterhand. Merzyn, G. (2008). Sprache und Chemie lernen. Naturwissenschaften im Unterricht, 19(106/107), 94–97. Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (Hrsg.). (2014). Kernlehrplan für die Sekundarstufe II Gymnasium/Gesamtschule in Nordrhein-Westfalen. Chemie. Düsseldorf. Özcan, N. (2013). Zum Einfluss der Fahsprache auf die Leistung im Fach Chemie: eine Förderstudie zur Fachsprache im Chemieunterricht. Berlin: Logos. Rincke, K. (2007). Sprachentwicklung und Fachlernen im Mechanikunterricht: Sprache und Kommunikation bei der Einführung in den Kraftbegriff. Berlin: Logos. Schmölzer-Eibinger. (2013). Sprache als Medium des Lernens im Fach. In M. Becker-Mrotzek (Hrsg.), Sprache im Fach. Sprachlichkeit und fachliches Lernen (S. 25-41). Münster: Waxmann. Strübe, M., Tröger, H., Tepner, O. & Sumfleth, E. (2014). Development of a Pedagogical Content Knowledge test of chemistry language and models. Educatión Química, 25(3), 380-390. Tröger, H., Sumfleth, E. & Tepner, O. (2015). Der Umgang von Chemielehrkräften mit Fachsprache und Schülerfehlern. In S. Bernholt (Hrsg.), Heterogenität und Diversität - Vielfalt der Voraussetzungen im naturwissenschaftlichen Unterricht. Gesellschaft für Didaktik der Chemie und Physik, Jahrestagung in Bremen 2014 (S. 498-500). Kiel: IPN. Walpuski, M., Tepner, O., Sumfleth, E., Dollny, S., Hostenbach, J. & Pollender, T. (2012). Multiple perspectives on students' scientific communication & reasoning in chemistry education : VISIONS 2011: Teaching. Acta Didactica Norge, 6(1). Veränderungen in der Unterrichtskommunikation von Lehrkräften: Befunde einer videobasierten Interventionsstudie Alexander Gröschner1, Ann-Kathrin Schindler2, Tina Seidel2 1 Universität Paderborn, 2Technische Universität München Theoretischer Hintergrund Unterrichtskommunikation ist ein bedeutsames Element erfolgreicher Lehr- und Lernprozesse. Empirische Studien für den mathematisch-naturwissenschaftlichen Unterricht zeigen, dass in Deutschland eine enggeführte, lehrerzentrierte Klassengesprächsführung vorliegt (Jurik, Gröschner, & Seidel, 2013). Diese Engführung wirkt sich wiederum negativ auf das Lernen der Schülerinnen und Schüler aus (Lipowsky et al., 2007). Demgegenüber zeigen lernwirksame Aktivitäten einer produktiven Klassengesprächsführung (Walshaw & Anthony, 2008) positive Effekte u.a. auf die Schülermotivation (Kiemer et al., 2015). Offen ist, inwiefern Lehrkräfte ihre Unterrichtskommunikation tatsächlich im Unterricht im Rahmen einer videobasierten Fortbildung verändern. Studien zum Lernen von Lehrkräften in Fortbildungen deuten darauf hin, dass Lehrkräfte sehr unterschiedliche Lernerträge aus Fortbildungen erzielen und diesbezüglich individuelle Lernerfahrungen eine bedeutsame Rolle für den Lerntransfer von Fortbildungen für die Gestaltung unterrichtlicher Praxis darstellen (Kazemi & Hubbard, 2008). Die vorliegende Studie hatte demnach zum Ziel, Effekte einer videobasierten Fortbildung auf die unterrichtliche Gesprächsführung der Lehrkräfte zu untersuchen sowie mögliche individuelle Unterschiede im Lernen der Lehrkräfte aufzudecken. Die Forschungsfragen lauteten: 1. Inwiefern verändern Lehrkräfte in der Interventionsgruppe (IG) ihre Unterrichtskommunikation zugunsten einer lernwirksamen Klassengesprächsführung gegenüber Lehrkräften in der Kontrollgruppe (KG) vom prä- zum post-Messzeitpunkt? 2. Inwiefern unterscheiden sich die Lehrkräfte der Interventionsgruppe (IG) untereinander hinsichtlich lernwirksamer Aktivitäten der Klassengesprächsführung unter Berücksichtigung von vier Messzeitpunkten? Methode Im Rahmen der Studie nahmen sechs Lehrkräfte an einer videobasierten Fortbildung, dem „Dialogischen Videozirkel“ (DVZ, Gröschner et al., 2015) teil, während vier Lehrkräfte 2-3 eher „klassische“ Ein-Tages-Workshops zum Thema besuchten sowie zweimal an Rundgesprächen mit dem Fortbildungsleiter des DVZ ihre Erfahrungen der Workshops austauschten. Der DVZ besteht aus drei Workshops (Unterrichtsplanung, Reflexion 1 und 2) und einer videografierten Unterrichtsstunde. Er wurde im Schuljahr 11/12 zweimal angeboten. Das Fortbildungsangebot in der IG (DVZ) und KG betrug gleichermaßen jeweils 22 Stunden. In der IG und KG wurde zudem jeweils eine Unterrichtsstunde am Schuljahresanfang sowie -ende videografiert (_N_ Videos total=32). Die Auswertungen der Frage 1 beziehen sich auf diesen prä-post-Vergleich (= 20 Videos). Für Frage 2 wurden zusätzlich die videografierten Stunden des DVZ 1 und DVZ 2 ausgewertet. Die Analysen basierten auf einem hochinferten Ratingschema (Pehmer, Kiemer ,& Gröschner, 2014), das von zwei unabhängigen Beoachtern bearbeitet wurde (ICCs=.77 bis .91). Eingeschätzt wurden vier Skalen mit jeweils vier Items (α= .75 bis .90): Schülerbeteiligung; Vernetzung von Schülerbeiträgen; Unterstützung von Schülerideen und Lehrerfeedback. Ergebnisse Hinsichtlich Forschungsfrage 1 zeigten sich mittels non-parametrischer Varianzanalyse (Noguchi et al., 2012) signifikante Unterschiede in allen untersuchten Dimensionen der Unterrichtskommunikation: in der Schülerbeteiligung (_F_=5.56; _df_=1; _p_=.02), in der Vernetzung von Schülerbeiträgen (_F_=4.90; _df_=1; _p_=.03), im Umgang mit Schülerideen (_F_=11.76; _df_=1; _p_=.00) sowie im Lehrerfeedback (_F_=11.82; _df_=1; _p_=.00). Friedman-Tests deuten in Bezug auf die zweite Forschungsfrage auf sehr individuelle Lernverläufe der Lehrkräfte in der IG hin, die jedoch nur in der Skala Umgang mit Schülerideen (χ2=8.79; _df_=3; _p_=.03) signifikant werden. Zusammenfassend weist die Studie auf die Wirksamkeit einer videobasierten Fortbildung zur Förderung der produktiven Unterrichtskommunikation hin. Zugleich deuten die individuellen Unterschiede in den Veränderungen der Lehrkräfte auf den Bedarf gezielter Transferangebote hin, um Fortbildungen effektiv zu gestalten. Literatur Gröschner, A., Seidel, T., Kiemer, K. & Pehmer, A.-K. (2015). Through the lens of teacher professional development components: the "Dialogic Video Cycle" as an innovative program to foster classroom dialogue. Professional Development in Education, 41(4), 729–756. Kazemi, E. & Hubbard, A. (2008). New Directions for the Design and Study of Professional Development: Attending to the Coevolution of Teachers’ Participation Across Contexts. Journal of Teacher Education, 59(5), 428–441. Kiemer, K., Gröschner, A., Pehmer, A.-K. & Seidel, T. (2015). Effects of a classroom discourse intervention on teachers’ practice and students’ motivation to learn mathematics and science. Learning and Instruction, 35(2), 94–103 Jurik, V., Gröschner, A., & Seidel, T. (2013). How student characteristics affect girls' and boys' verbal engagement in physics instruction. Learning and Instruction, 23, 33–42. Lipowsky, F., Rakoczy, K., Pauli, C., Reusser, K. & Klieme, E. (2007). Gleicher Unterricht -gleiche Chancen für alle? Die Verteilung von Schülerbeiträgen im Klassenunterricht. Unterrichtswissenschaft, 35(2), 125–147. Noguchi, K., Gel, Y. R., Brunner, E., & Konietschke, F. (2012). nparLD: An R software package for the nonparametric analysis of longitudinal data in factorial experiments. Journal of Statistical Software, 50(12), 1–23. Pehmer, A.-K., Kiemer, K., & Gröschner, A. (2014). Productive teacher-student interactions: A coding scheme for productive dialogue during whole class and small group conversation. Munich: TUM School of Education. Walshaw, M., & Anthony, G. (2008). The teacher's role in classroom discourse: A review of recent research into mathematics classrooms. Review of Educational Research, 78(3), 516–551. ID: 425 Symposium Disziplinen-Cluster: Wirtschafts- und Berufspädagogik Thematisches Cluster: Berufliche Bildung, Kompetenzdiagnostik/ Kompetenzentwicklung Stichworte: Berufsbildung; Kompetenzdiagnostik; Heterogenität; Differential Item Functioning Kompetenzdiagnostik in der Berufsbildung bei heterogenen Schülergruppen und Testformaten Chair(s): Christian Spoden (Friedrich-Schiller-Universität Jena) Diskutant(en): Andreas Rausch (Otto-Friedrich-Universität Bamberg) Die Kompetenzdiagnostik hat in den letzten Jahren ihre eigenständige Bedeutung in Abgrenzung zu verwandten Konzepten der empirischen Bildungsforschung nachgewiesen (Wilhelm & Nickolaus, 2013). Dies gilt auch für die Kompetenzdiagnostik in der Berufsbildung, wenngleich einige Entwicklungsstränge aufgrund besonderer Anforderungen hier leicht verzögert eingesetzt haben. So ist der Kompetenzkanon in der Berufsbildung mit allgemeinen, berufsübergreifend arbeitsbezogenen und fachbezogenen Kompetenzen umfangreicher und durch einen großen Entwicklungsbedarf hinsichtlich diagnostischer Instrumente begleitet (vgl. Achtenhagen, 2007). Auch das Format der Testinstrumente ist in der Berufsbildung breiter gefächert und beinhaltet häufiger auch computerisierte Test und berufspraktische Arbeitsproben (z. B. Gschwendtner, Abele & Nickolaus, 2009). Eine weitere Besonderheit der beruflichen Bildung ist die starke Heterogenität der Schülerschaft bezüglich soziodemographischer Merkmale und schulischer Leistungsfähigkeit (Seeber, 2010; Ernst & Westhoff, 2011). Unterschiede in Ausbildungskulturen oder Lerngelegenheiten tragen zudem nicht dazu bei, diese Heterogenität im Laufe der Ausbildung zu reduzieren (vgl. Liedtke & Seeber, 2015). Diesen Anforderungen steht eine etablierte Methodik auf Basis der Item-Response-Theory (de Ayala, 2009) gegenüber, welche es ermöglicht, Kompetenzausprägungen der Schülerinnen und -schüler auf kontextuelle und situative Anforderungen zurückzuführen (Hartig & Klieme, 2006). Ihr Einsatz in der Berufsbildung stellt die Anschlussfähigkeit an vorausgegangene Studien im allgemeinen Bildungsbereich sicher, ermöglicht aber auch die Identifikation berufsspezifischer wie berufsübergreifender Merkmale der Struktur- und Niveaukomponenten von Kompetenzmodellen (Seeber et al., 2010). Eine zentrale Frage beim Einsatz IRT-basierter Methoden lautet allerdings, wie in den heterogenen Strukturen der Berufsbildung in Bezug auf Kompetenzdomänen, Testformate und Personengruppen eine Vergleichbarkeit der Kompetenzausprägungen sichergestellt und Benachteiligungen aufgrund soziodemographischer beziehungsweise bildungsbiographie-bezogener Merkmale vorgebeugt werden kann. Diese Frage wird in vier Einzelbeiträgen dieses Symposiums aus unterschiedlicher Perspektive analysiert, wobei alle Beiträge die Bedeutung für die Berufsbildung herausarbeiten. Im Beitrag von Rudeloff wird aus einem wirtschaftspädagogischen Blickwinkel ein Modell der Finanzkompetenz vorgestellt und dessen Messäquivalenz in verschiedenen Schülergruppen geprüft, die aufgrund von Migrationsstatus, Geschlecht oder Bildungsherkunft unterschiedliche Lernvoraussetzungen mitbringen. Der Beitrag von Bernhardt, Spoden und Frey interpretiert Messäquivalenzprüfungen aus psychometrischer Perspektive als Teil eines umfangreicheren Qualitätssicherungsprozess zur Implementation eines CAT-Itempools und der Vorbereitung adaptiver Testungen in den Kompetenzbereichen Lesen, Mathematik und Naturwissenschaften. Der Beitrag von Spoden et al. untersucht Messäquivalenz zwischen Ausbildungsberufen in den zuvor genannten Kompetenzbereichen als Voraussetzung für faire Leistungsvergleiche zwischen Berufsgruppen und strukturelle Analysen mit fachbezogenen Kompetenzen und plädiert dabei für eine Verzahnung psychometrischer und inhaltlicher Analysen. Der Beitrag von Sangmeister, Winther und Klotz analysiert die Messäquivalenz zwischen einer klassischen Paper-Pencil-Präsentation und einer computer-basierten Darbietung der Testitems und diskutiert diagnostische Implikationen in der Erwachsenenbildung. Beiträge des Symposiums Finanzkompetenz von Jugendlichen: Eine Beurteilung der psychometrischen Qualität des eingesetzten Testinstruments Michelle Rudeloff Georg-August-Universität Göttingen Theoretischer Hintergrund: Heutzutage kommt der Finanzkompetenz eine wachsende Bedeutung zu (Habschick et al., 2003). So ist diese nicht nur entscheidend für den effektiven Umgang mit Finanzdienstleistungen und das Verständnis geldpolitischer Entscheidungen, sondern besitzt auch eine berufsqualifizierende Funktion (Reifner, 2003). Zudem spielt die Befähigung im Umgang mit Geld und Finanzthemen nicht mehr nur für Erwachsene eine Rolle, sondern ist bereits für Jugendliche relevant (OECD INFE, 2011). Speziell die Phase des Übergangs in die Sekundarstufe II stellt für die Jugendlichen eine Herausforderung dar (Bender, 2012). Mehrheitlich wird in diesem Zeitraum die Volljährigkeit und damit die uneingeschränkte Geschäftsfähigkeit erreicht, sodass an die Jugendlichen der Anspruch an eine angemessene und auf eine selbstverantwortete Lebensführung hin ausgerichtete ökonomische Urteilsfähigkeit gestellt wird. So verdienen bspw. viele Jugendliche, die in die duale Berufsausbildung einmünden, erstmals eigenes Geld und stehen vor der Herausforderung, mit ihren Einnahmen wirtschaften zu müssen. Vor diesem Hintergrund werden Forderungen nach einer frühzeitigen Förderung der finanziellen Urteilsfähigkeit im Rahmen eines schulischen Fächerkanons und Curriculums erhoben. Analysen der aktuellen Lehrpläne aller Bundesländer verdeutlichen jedoch, dass die Vermittlung von Finanzkompetenz curricular nicht hinreichend verankert ist. Aktuell kann auf eine Reihe von Studien zur Finanzkompetenz zurückgegriffen werden (Kaminski & Friebel, 2012). Werden diese Studien unter einer forschungsmethodischen Perspektive verglichen, fällt bei der Überprüfung der eingesetzten Testinstrumente auf, dass Aussagen zur empirischen Überprüfung der psychometrischen Qualität häufig fehlen (Aprea, 2012). Zudem wird die Auswahl der Items oft nicht mit entsprechenden konzeptuellen Überlegungen begründet, obwohl die Domänenabgrenzung eine entscheidende Voraussetzung für die Diagnose von Kompetenzen darstellt (Kaminski & Friebel, 2012; Winther, 2010). Trotz der Kritik bleibt vor dem Hintergrund der Bildungsgerechtigkeit und Chancengleichheit zu berücksichtigen, dass als entscheidende Determinanten finanzwirtschaftlicher Kompetenzen neben der Mathe- und Lesekompetenz der Jugendlichen (z. B. Rosendahl & Straka, 2011) das Geschlecht, der Schulabschluss, die besuchte Schulform, die ethnische Zugehörigkeit sowie der Bildungsstand der Eltern identifiziert werden konnten (z. B. Lusardi et al., 2009). Fragestellung und Methode: Im Rahmen des Vortrags wird das Promotionsvorhaben „Informelles Lernen und Finanzkompetenz“ vorgestellt. Den Fokus bilden das Domänenmodell und das auf dessen Basis entwickelte Testinstrument, welches bei N=530 Schülern der Klassenstufe 10 unterschiedlicher Schulformen eingesetzt wurde, um die Finanzkompetenz zu erheben. Im Vordergrund steht die Frage, ob der Test eine hinreichende psychometrische Qualität aufweist, um eine valide Erfassung der Finanzkompetenz zu ermöglichen. Hierzu wurden auf Basis der Item Response Theorie die Itemparameter und Itemfitwerte geprüft sowie Berechnungen zu Differential Item Functioning für das Geschlecht, die Bildungsherkunft, die Bildungsaspiration, den Migrationshintergrund und die Schulform durchgeführt. Darüber hinaus erfolgten Analysen zur Dimensionalität des Instruments. Des Weiteren wurden diskriminante Zusammenhangsanalysen (vgl. Bortz & Döring, 2006) zwischen der Mathe- und Leseleistung der Schüler und deren Finanzkompetenz zur Prüfung der Konstruktvalidität berechnet. Ergebnisse: Die Auswertung der Daten erfolgte mit dem Programm Conquest (Wu et al., 2007). Eine Skalierung über das PartialCredit-Modell zeigt zufriedenstellende Test- und Itemfitstatistiken (z. B. Weighted MNSQ-Fits: 0.86 bis 1.21; T-values ≤ 1.96; Item-Total-Correlations zwischen 0.20 und 0.60). Die DIF-Prüfungen zur Lösungswahrscheinlichkeit zeigen bei einigen Items eine Konfundierung mit der Schulform, dem Geschlecht und der Bildungsherkunft. Im Vortrag wird diesbezüglich diskutiert, ob Differential Item Functioning es ermöglicht, differentielle Stärken und Schwächen einzelner Schülergruppen im Bereich der Finanzkompetenz aufzudecken oder lediglich als Einschränkung der Testfairness durch die systematische Benachteiligung bestimmter Schülergruppen zu sehen ist (z. B. Scheuneman & Gerritz, 1990). Zur Überprüfung der Dimensionalität wurden verschiedene IRT-Modelle berechnet. Die Ergebnisse zeigen, dass das fünfdimensionale IRT-Modell die Daten signifikant besser abbildet als bspw. das eindimensionale Modell (Δ Deviance = 124,23; p < .001). In Bezug auf die diskriminante Validität ergeben sich nur geringe Korrelationen zwischen den Mathe- und Deutschnoten und den Testleistungen der Schüler als Indiz für die Konstruktvalidität. Prozesse zur Qualitätskontrolle bei der Etablierung eines CAT-Itempools zur Erfassung von schulisch erworbenen Kompetenzen Raphael Bernhardt, Christian Spoden, Andreas Frey Friedrich-Schiller-Universität Jena Theoretischer Hintergrund: Schulisch erworbene Grundkompetenzen in den Domänen Mathematik, Lesen und Naturwissenschaft stellen einen zentralen Bereich beruflicher Handlungskompetenz dar (Baethge, 2010). Sie haben sich als erklärungsmächtige Prädiktoren für den Ausbildungserfolg erwiesen (z.B. Seeber & Lehmann, 2011) und können somit als ein Schlüssel für erfolgreiches Lernen in der Berufsausbildung angesehen werden. Um in den Randbereichen der Kompetenzverteilung bei vertretbaren Testzeiten gut differenzieren zu können, bietet sich computerisiertes adaptives Testen (CAT) an. Im Rahmen der Entwicklung von drei computerisierten adaptiven Tests für Berufsschülerinnen und Berufsschüler (SuS) in den aufgeführten Domänen wurde im Projekt „Messung allgemeiner Kompetenzen-adaptiv“ (MaK-adapt) aus bestehenden Items groß angelegter Vergleichsstudien ein Itempool je Domäne etabliert. Im vorliegenden Beitrag werden Schritte der Qualitätskontrolle bei der Etablierung der Itempools sowie der Vorbereitung der adaptiven Tests vorgestellt. Forschungsfragen und Methode: In einem ersten Schritt wurde in einer Kalibrierungsstudie eine Schätzung von Itemparametern unter Annahme des Rasch-Modells sowie eine Selektion geeigneter Items anhand von Itemfitstatistiken und Differential-ItemFunctioning-Analysen (DIF; z.B. Holland & Wainer, 1993) vorgenommen. Bei der Erstellung eines Itempools spielen Fragen, inwieweit die Items dem Testmodell entsprechen und ob die Items fair in Bezug auf relevante Kovariaten sind, eine zentrale Rolle. Die Passung der Itempoole in Bezug auf das Rasch-Modell wurde anhand der Mak-adapt-Kalibrierungsstichprobe (N = 1.632 SuS; 46 % weiblich) mit Hilfe von Mean-Square-Statistiken (MNSQ), die Annahme der Invarianz der Itemparameter in verschiedenen Personengruppen mithilfe eines Multifacetten-Rasch-Modells analysiert (Linacre, 1994). In einem zweiten Schritt wurde zuerst in einer Simulationsstudie und später empirisch in einer CAT- Pilotierungsstudie (N=1.093 SuS; 38% weiblich) die Berücksichtigung von Items aus allen Subdomänen, das Content-Balancing, sowie die Messpräzision der adaptiven Tests geprüft. Das Content-Balancing wurde mit Hilfe des Maximum Priority Index (MPI; Cheng & Chang, 2009) vorgenommen. Die gleichmäßige Vorgabe von Items aller Subdomänen ist eine wichtige Annahme des theoretischen Rahmenkonzeptes im Projekt MaK-adapt. Deshalb ist die Frage, ob der MPI die Balancierung der Subdimensionen wie vorgegeben vornimmt, wesentlich. Aufgrund der beschränkten Anzahl an Items lautet eine weitere zentrale Frage, wie hoch die zu erzielende Messpräzision bei der Nutzung des DIF-neutralen Itempools und des MPI ist. Ergebnisse: Die Analyse des gewichteten MNSQ ergab, dass zwei Mathematikitems, ein Leseitem und kein Naturwissenschaftsitem aufgrund fehlender Passung zum Rasch-Modell aus dem Itempool entfernt werden müssen. Im Rahmen der DIF-Analysen wurden sechs Mathematikitems, acht Naturwissenschaftsitems und fünf Leseitems identifiziert. Im Anschluss an die statistische Identifizierung folgte eine inhaltliche Analyse der entsprechenden Items, welche zum Ausschluss von zwei Items in der Domäne Mathematik, einem Item beim Lesen und drei Items bei den Naturwissenschaften führte. Bezüglich der zweiten Forschungsfrage wurde festgestellt, dass die Administration von Items aller Subdimensionen vom MPIAlgorithmus wie vorgegeben umgesetzt worden ist; Verletzungen der Content-Balancing-Vorgaben wurden nicht identifiziert. Die Ergebnisse zur dritten Forschungsfrage zeigen, dass bei Mathematik ab einer Testlänge von 20 Items, bei Lesen ab 21 Items und bei Naturwissenschaft ab 28 Items eine Reliabilität von >.80 zu erwarten ist. Die zu erwartende Reliabilität aus der Pilotierungsstudie liegt in der Domäne Naturwissenschaft leicht unter der simulierten Testung; in den Domänen Mathematik und Lesen sind die Reliabilitäten fast identisch. Diskussion: Zur Erfassung schulischer Grundkompetenzen bei SuS konnte in kurzer Entwicklungszeit ein qualitativ hochwertiges CAT-Instrument produziert werden. Qualitätskontrollen in Bezug auf den CAT-Itempool versprechen, dass aus bestehenden Items von groß angelegten Vergleichsstudien faire Testinstrumente mit hoher Passung zum Rasch-Modell konstruiert werden können. Wir regen an, diesem Vorgehen für eine schnelle Implementation eines Itempools zu folgen. Die Ergebnisse der Simulationsstudien weisen zudem aus, dass auf Basis der genutzten Itempools eine hinreichende Messpräzision mit begrenzter Itemanzahl beim CAT erzielt werden kann. In Übereinstimmung mit den Ergebnissen von Cheng und Chang (2009) kann zudem der MPI als zuverlässiges Instrument des Content-Balancing beim CAT empfohlen werden. Differenzielle Domänen- und Itemeffekte zwischen Ausbildungsberufen bei der Erfassung schulischer Grundqualifikationen von Berufsschülerinnen und Berufsschülern Christian Spoden, Raphael Bernhardt, Andreas Frey Friedrich-Schiller-Universität Jena Theoretischer Hintergrund: Schulische Grundqualifikationen wie Lesen, Mathematik und Naturwissenschaften haben sich als erklärungsmächtig für den Erfolg der beruflichen Ausbildung erwiesen (z. B. Lehmann & Seeber, 2007; Nickolaus, Geissel, & Gschwendtner, 2008; Nickolaus et al., 2010; Nickolaus & Norwig, 2009; Seeber & Lehmann, 2011). Um Berufsschülerinnen und Berufsschüler hinsichtlich dieser Grundqualifikationen zu verorten und schließlich auch strukturelle Zusammenhänge zwischen diesen Grundqualifikationen und berufsfachlichen Kompetenzdimensionen zu untersuchen, wurden im Rahmen der vom Bundesministerium für Bildung und Forschung geförderten Forschungsinitiative Technology-based Assessment of Skills and Competencies in VET (ASCOT) adaptive Tests entwickelt (Ziegler, Frey, Seeber, Balkenhol & Bernhardt, 2015). Testkonstrukteure standen dabei vor zwei Herausforderungen: Eine erste Herausforderung wurde in der Abstimmung der Testinstrumente auf das jeweilige berufstypische Leistungsspektrum identifiziert; computerisiertes adaptives Testen (CAT) ermöglicht bei verhältnismäßig kurzen Testzeiten eine große Leistungsdifferenzierung und erwies sich somit als Methode der Wahl. Eine zweite Herausforderung bezog sich auf die berufsübergreifenden Einsatzmöglichkeiten der Testinstrumente, da die Erfassung allgemeiner Grundqualifikationen möglichst einen berufsübergreifenden Vergleich der entsprechenden Kompetenzen ermöglichen sollte. Fragestellung: Im Zusammenhang mit der Entwicklung adaptiver Testinstrumente zur Erfassung dieser Kompetenzen wird in dem vorliegenden Beitrag der Frage nach Domänen- und Item-spezifischen Vorteilen zweier Gruppen von Ausbildungsgängen (kaufmännisch-verwaltende vs. gewerblich-technische Berufe) nachgegangen und diese zunächst im Rahmen des sogenannten Differential Item Functioning (DIF) und anschließend auf Basis einer qualitativen Analyse durch Inhaltsexperten untersucht. Methode: Die nachfolgend beschriebenen Analysen stützen sich auf die Kalibrierungsdaten des Forschungsprojekts MaK-adapt im Rahmen. Die Stichprobe umfasste Testdaten auf Basis eines rotierten Testheftdesigns von N = 1224 Berufsschülerinnen und Berufsschülern (33 % weiblich, 91 % Muttersprache Deutsch, 60 % Abschluss der mittleren Reife, zu 68 % im dritten Ausbildungsjahr) aus den Bundesländern Hessen, Niedersachsen und Thüringen. Um belastbare Aussagen zum DIF zu erzielen, wurde die Stichprobe in zwei Gruppen von Ausbildungsberufen, kaufmännisch-verwaltend ausgerichtete Berufe und gewerblichtechnisch ausgerichtete Berufe, unterteilt. Die Studierenden bearbeiteten Tests in den Kompetenzbereiche Lesen, Mathematik und Naturwissenschaften, die sich auf Vorarbeiten aus verschiedenen Large-Scale Assessments stützten (Bernhardt et al, 2013). In einem ersten quantitativen Analyseschritt wurden in jeder der drei Domänen DIF-Analysen zwischen den zuvor beschriebenen Gruppen von Ausbildungsberufen mit Hilfe von Mehrfacetten-Rasch-Modellen unter Berücksichtigung von Domain-OrderEffekten bestimmt. In einem zweiten qualitativen Schritt wurde eine Inhaltsanalyse im Hinblick auf schwierigkeitsbestimmende, konstruktirrelevante Itemmerkmale von Inhaltsexpertinnen vorgenommen; es sollte so beurteilt werden, ob die statistisch bestimmten DIF-Effekte auf Konstrukt-irrelevante Merkmale zurückzuführen sind und somit im Sinne eines Item Bias interpretiert werden müssen. Ergebnisse und Diskussion: Die Ergebnisse verdeutlichen, dass zwar mittlere Leistungsunterschiede zwischen kaufmännischverwaltenden und gewerblich-technischen Ausbildungsgängen vorliegen, jedoch nur einzelne DIF-Effekte in den Domänen Lesen (Omnibustests im Mehrfacetten-Rasch-Modell: χ2(71) = 95.10, p <.05; signifikanter DIF bei sechs Items) und Mathematik (χ2 (125) = 153.51, p < .05; signifikanter DIF bei neun Items) statistisch identifiziert wurden. Die inhaltliche Analyse dieser Items offenbarte, dass zwischen den statistisch identifizierten DIF-Effekten und der Einschätzung der Items durch Inhaltsexpertinnen im Sinne eines Vorteils zugunsten der einen oder anderen Berufsgruppe kein Zusammenhang bestand. Dies weist darauf hin, dass die wenigen statistisch identifizierten DIF-Effekte nicht auf konstruktirrelevante Itemmerkmale zurückzuführen sind. In der Domäne Naturwissenschaften fiel bereits der Omnibustest für DIF-Effekte nicht signifikant aus (χ2 (130) = 142.23, p = .219). Schulische Grundqualifikationen können somit über verschiedene Ausbildungsberufe hinweg mit dem gleichen Instrument fair erfasst und zueinander in Beziehung gesetzt werden. Dementsprechend wurden die drei CAT-Verfahren inzwischen in bereits sechs Projekten der ASCOT-Initiative erfolgreich eingesetzt (Bernhardt et al., 2013). Mit der Erfassung schulischer Grundkompetenzen bei Berufsschülerinnen und –schülern ist eine wichtige Voraussetzung dafür erfüllt, wissenschaftlich belastbare und beispielsweise auch für die Beratung von Politik und praktisch tätigen Institutionen nutzbare Aussagen tätigen zu können (Baethge, 2012). Testformate im Vergleich: Papierbasierte vs. computerbasierte Aufgaben zur Messung kaufmännischer Kompetenz Julia Sangmeister1, Esther Winther2, Viola Katharina Klotz1 1 Deutsche Institut für Erwachsenenbildung Bonn, 2Universität Duisburg-Essen Theoretischer Hintergrund: Dem Einsatz von Technologien und Computern im Rahmen von Assessments kommt, auch in Deutschland insbesondere im Rahmen von Bildungsvergleichsstudien wie PISA und NEPS , eine immer größere Bedeutung zu (vgl. Bennett, 2002). Empirisch geprüfte Ergebnisse können dabei helfen, die Stärken und Schwächen computerbasierter Testformate herauszustellen. Der vorliegende Beitrag vergleicht am Beispiel eines Tests zur Messung kaufmännischer Kompetenz das klassische Testformat in Papier und Bleistift (PPT) mit einem computerbasierten Assessment (CBA) für die Ausbildung von Industriekaufleuten . Kaufmännische Kompetenz wird nach Winther & Achtenhagen (2008) definiert als „die Fähigkeit, auf Grundlage eines systemischen Verstehens betrieblicher Teilprozesse und deren Rekonstruktion aus realen Unternehmensdaten in berufsrealen Situationen unternehmerische Entscheidungen treffen und diese validieren zu können, um damit das eigene Wissens- und Handlungspotential vor dem Hintergrund der Entwicklung individueller beruflicher Regulationsfähigkeit auszubauen“. Das theoretische Modell zur Aufgabenentwicklung differenziert für das Konstrukt der kaufmännischen Kompetenz zwischen einer domänenspezifischen und einer domänenverbundenen Dimension (vgl. Gelman & Greeno, 1989). Domänenverbundene Inhalte beziehen sich auf allgemeine sprachliche und mathematische Fähigkeiten, die in beruflichen Handlungssituationen relevant werden. Sie unterscheiden sich von Inhalten des allgemeinen Bildungsbereichs durch ihre berufliche Relevanz. Domänenspezifische Inhalte umschließen darüber hinausgehend spezifisches Regel- und Handlungswissen einer beruflichen Gemeinschaft, das sich exklusiv auf kaufmännischen Berufe bezieht. Fragestellung: Zunächst soll geprüft werden, ob sich die theoretisch angenommene zweidimensionale Struktur anhand der Daten empirisch bestätigen lässt. In einem weiteren Schritt erfolgt ein Vergleich von PPT und CBA, um die Frage zu klären, ob ein Format auf Gesamttestebene und/oder Itemebene systematisch zu besseren oder schlechteren Leistungen führt. Angenommen wird dabei, dass sich domänenspezifische Aufgaben besser im CBA darstellen und bearbeiten lassen. Theoretisch wird diese Annahme durch eine Lernortargumentation motiviert: Auszubildenden sind domänenverbundene Aufgaben eher aus dem schulischen Lernkontext der allgemeinbildenden Schule vertraut. Domänenspezifische Aufgaben beziehen sich dagegen stärker auf arbeitsplatzbezogene Tätigkeiten, die dort üblicherweise am PC verrichtet werden Methode & Design: Insgesamt werden 38 Items für das Konstrukt der kaufmännischen Kompetenz papier- und computerbasiert über vier curriculare Schwerpunktbereiche administriert und den Testpersonen in einem within-persons-Design (vgl. Senkbeil & Ihme, 2014) über offene und halboffene Antwortformate präsentiert. Die Stichprobe setzt sich aus 387 Auszubildenden zur Industriekauffrau/zum Industriekaufmann im zweiten Ausbildungsjahr zusammen. Erhoben wurde in drei Bundesländern. Die Analysen wurden mittels Item Response Theory (IRT) im Programm Acer Conquest durchgeführt (vgl. Wu et al., 2007). Neben den Modellprüfungen war für den vorliegenden Beitrag vor allem die Berechnung von Differentiellen Itemfunktionen (DIF) von Bedeutung, mit deren Hilfe ein Vergleich der Testformate ermöglicht wird. Nach Embretson & Reise (2000) liegt dann ein DIFEffekt vor, wenn Testpersonen mit gleicher latenter Personenfähigkeit unterschiedliche Lösungswahrscheinlichkeiten für ein Item aufweisen. Es wird untersucht, inwieweit die Gruppenunterschiede, hier nicht durch Eigenschaften der Personen selbst (z.B. Geschlecht), sondern durch das verwendete Testformat hervorgerufen werden. Ergebnisse & Ausblick: Die Anforderungen zur Modellgüte, gemessen an Itemfit-Werten (weighted mean square) liegen im zulässigen Bereich zwischen 0,75 ≤ wMNSQ ≤ 1,33 (Adams & Khoo, 1996; Bond & Fox, 2001). Auf Basis der Modellgüte-Maße AIC, BIC und cAIC kann das theoretisch unterstellte zweidimensionale Modell empirisch bestätigt und repliziert werden. Der Gruppenunterschied zwischen beiden Testformaten ist auf Gesamttestebene mit einem Wert von 0,112 Logits vernachlässigbar. Auf Itemebene zeigen sich bei 23 Items mittlere bis hohe DIF-Effekte, von denen 12 Items zugunsten des PPT und 11 Items zugunsten des CBA interpretiert werden können. Erste Analysen zeigen, dass domänenverbundene Aufgaben im klassischen PPT besser zu bearbeiten sind und domänenspezifische Aufgaben durch die Simulation besser unterstützt werden. Für die Prüfungspraxis würde sich auf Basis dieser Befunde eine Mischform beider Testformate empfehlen. ID: 429 Symposium Disziplinen-Cluster: Psychologie, Didaktiken der Naturwissenschaften und Technik Thematisches Cluster: Bildung im Sekundarbereich, Hochschulbildung, Mathematisch-naturwissenschaftlicher Unterricht Stichworte: beispielbasiertes Lernen, wissenschaftliches Denken, Video-Beispiele. Lang ist der Weg durch Belehren, kurz und wirksam durch Beispiele: Förderung von wissenschaftlichem Denken durch beispielbasiertes Lernen Chair(s): Juliane Kant (Eberhard Karls Universität Tübingen) Diskutant(en): Maria Opfermann (Universität Duisburg-Essen) Wissenschaftliches Denken ist eine Schlüsselfertigkeit, die zur Lösung von Problemen in unterschiedlichsten Domänen (z.B. Biologie, Physik, Medizin) und Kontexten (Schule, Hochschule) notwendig ist (Laugksch, 2002). Wissenschaftliches Denken umfasst Aktivitäten wie das Aufstellen von Hypothesen, zur Planung und Durchführung von Experimenten und zum Ziehen von Schlussfolgerungen (Fischer et al., 2014). Empirische Befunde zeigen jedoch, dass Lernende verschiedener Altersstufen und in unterschiedlichsten Bildungskontexten häufig Schwierigkeiten beim wissenschaftlichen Denken haben (de Jong & van Joolingen, 1998). Eine Möglichkeit zur Unterstützung des wissenschaftlichen Denkens ist beispielbasiertes Lernen (z.B. Stark, Kopp & Fischer, 2011). Im Vergleich zu (unangeleitetem) Problemlösen verspricht das Studium von Lösungsbeispielen eine effizientere Nutzung der Arbeitsgedächtniskapazität und dadurch einen erleichterten Schemaerwerb (Sweller, 2006). Ursprünglich für klar strukturierten Probleme mit eindeutigen Lösungen eingesetzt, werden in jüngerer Zeit die Potenziale des Ansatzes für die Förderung komplexerer kognitiver Fertigkeiten untersucht. Hierzu möchte dieses Symposium einen Beitrag leisten, indem es (a) verschiedene Varianten beispielbasierten Lernens präsentiert (z.B. Lernen mit Video-Beispielen; Lernen mit fehlerhaften Beispielen) und auf ihre Effektivität zur Förderung unterschiedlicher Facetten wissenschaftlichen Denkens untersucht sowie (b) der Frage nachgeht, inwiefern die Effektivität beispielbasierten Lernens in unterschiedlichen Inhaltsdomänen (Naturwissenschaften, Medizin, Erziehungswissenschaften) variiert. Kant, Scheiter und Oschatz verwenden Video-Beispiele, um SchülerInnen in den Naturwissenschaften Experimentierstrategien zu vermitteln. Es wird untersucht, welche Rolle dabei die Domänenspezifität bzw. -generalität der Video-Beispiele spielt und ob es einen Unterschied macht, wenn den SchülerInnen die Experimentierstrategie zuvor explizit beschrieben wird oder wenn sie sich die Experimentierstrategie selbst aus den Beispielen erschließen müssen. Schmidt-Borcherding, Hänze und Wodzinski beschäftigen sich mit der Frage, ob und wie SchülerInnen beim nachvollziehenden vs. eigenständigen Experimentieren mit Hilfe von Lösungsbeispielen unterstützt werden können. Dabei wurden zusammenhängende Lösungsbeispiele mit schrittweise präsentierten Lösungsbeispielen (sog. „gestuften Lernhilfen“) verglichen. Innerhalb des Hochschulkontexts gehen Strobel, Heitzmann, Strijbos, Kollar und Fischer der Frage nach, inwiefern korrekte vs. fehlerhafte Video-Beispiele Medizinstudierende bei der Entwicklung von Diagnose- und Fehlererkennungskompetenz als wissenschaftlichen Denkfertigkeiten unterstützen können. Außerdem wird untersucht, ob es ratsam ist, Studierende zusätzlich Feedback auf das in den Video-Beispielen gezeigte Verhalten formulieren zu lassen. Ebenfalls im Hochschulkontext (in der Domäne Erziehungswissenschaften) untersuchen Murböck, Antosch-Bardohn, Strijbos und Stegmann, inwiefern der Zeitpunkt kognitiver Modellierung in Form von Video-Beispielen (vor oder nach der Bearbeitung einer Lernaufgabe) sowie die Art der Lernaufgabe für Unterschiede beim Fertigkeitserwerb in empirischen Forschungsmethoden verantwortlich ist. Die Ergebnisse der vier Studien unterstreichen die Mächtigkeit beispielbasierten Lernens zur Förderung wissenschaftlichen Denkens und weisen vielfältige Implikationen für die Gestaltung effektiver Lösungsbeispiele in unterschiedlichen Domänen und Bildungskontexten auf. Beiträge des Symposiums Förderung von wissenschaftlichem Denken und Fachwissen mit Video-Beispielen von simulierten Experimenten Juliane Kant1, Katharina Scheiter2, Kerstin Oschatz1 1 Eberhard Karls Universität Tübingen, 2Leibniz-Institut für Wissensmedien Theoretischer Hintergrund und Fragestellung Wissenschaftliches Denken ist eines der zentralen Ziele internationaler Bildungsstandards (Kultusministerkonferenz, 2004; National Research Council, 2011). Es umfasst das Wissen und die Fertigkeiten Probleme zu identifizieren, Fragen zu stellen, Hypothesen aufzustellen, Artefakte zu erstellen, Evidenzen zu generieren, Ergebnisse auszuwerten, Schlussfolgerungen zu ziehen und den Verlauf sowie die Ergebnisse dieses Prozesses zu kommunizieren (Fischer et al., 2014). Diese Fertigkeiten können durch Methoden gefördert werden, die auf entdeckendem Lernen basieren z.B. Lernen mit simulierten Experimenten am Computer (Ton de Jong, 2006). Es hat sich jedoch gezeigt, dass Schüler dabei angeleitet werden müssen (Alfieri, Brooks, Aldrich, & Tenenbaum, 2011). Eine mögliche Form der Anleitung ist das beispielbasierte Lernen. Wenn Lernern ein Video-Beispiel zum Umgang mit simulierten Experimenten gezeigt wurde, verbesserte sich ihr Experimentierverhalten in Physik (Mulder, Lazonder, & de Jong, 2014). Trotzdem blieb der Lernzuwachs im Fachwissen Physik eher gering. Mulder et al. (2014) schlugen deshalb eine verbesserte Gestaltung der Video-Beispiele vor. Wichtige Gestaltungsaspekte aus der Forschung zu Lösungsbeispielen sind die Anordnung mehrerer Beispiele sowie der Instruktionstyp. Die Anordnung bezieht sich darauf, ob ein Prinzip mit Beispielen aus unterschiedlichen (fächerübergreifend) oder ähnlichen Kontexten (fachspezifisch) beigebracht wird (Quilici & Mayer, 1996). Der Instruktionstyp kann entweder deduktiv sein (abstraktes Prinzip, gefolgt von Beispielen) oder induktiv (nur Beispiele, aus denen das abstrakte Prinzip erschlossen werden muss; Renkl, 2015). In der vorliegenden Studie wurde untersucht, ob sich diese beiden Gestaltungsaspekte auf den Erwerb von wissenschaftlichem Denken und Fachwissen auswirken. Methode Wir haben ein computerbasiertes Lernprogramm zum Thema Energie entwickelt und mit 126 Gymnasiasten der achten Klasse getestet. Das Lernprogramm bestand aus vier Video-Beispielen (2 aus Biologie, 2 aus Physik), in denen zwei Modell-Schüler Strategien wissenschaftlichen Denkens an simulierten Experimenten demonstrierten. Zusätzlich enthielt das Lernprogramm zwei simulierte Experimente. Zwei Aspekte wurden bei der Gestaltung der Video-Beispiele variiert. Erstens wurden die Video-Beispiele entweder fächerübergreifend oder fachspezifisch angeordnet. Bei der fächerübergreifenden Anordnung lernten die Schüler je eine Strategie wissenschaftlichen Denkens mit einem Video-Beispiel aus Physik und einem Video-Beispiel aus Biologie. Bei der fachspezifischen Anordnung lernten die Schüler je eine Strategie wissenschaftlichen Denkens mit zwei Video-Beispielen aus nur einem Fach. Zweitens war der Instruktionstyp entweder deduktiv oder induktiv. Beim deduktiven Instruktionstyp erhielten die Schüler eine abstrakte Beschreibung der Strategie für wissenschaftliches Denken gefolgt von zwei Video-Beispielen. Beim induktiven Instruktionstyp erhielten die Schüler lediglich zwei Video-Beispiele und mussten sich die Strategie erschließen. Die Kombination der Gestaltungsaspekte ergab vier Gruppen, zu denen die Schüler randomisiert zugewiesen wurden. Im Prätest wurde das Vorwissen der Schüler zum wissenschaftlichen Denken sowie zum Thema Energie mit Leistungstests erhoben. In zwei Lerneinheiten wurde den Schülern jeweils mit Hilfe zweier Video-Beispiele und eines simulierten Experiments beigebracht, wie man kontrollierte Experimente durchführt und wie man Hypothesen aufstellt. Im Posttest wurden wissenschaftliches Denken und Fachwissen mit den Leistungstests des Prätests erhoben. Zusätzlich wurde das wissenschaftliche Denken verhaltensnah durch Experimentieraufgaben erfasst. Dabei mussten die Schüler zu einer Fragestellung eine Hypothese aufstellen und diese mit simulierten Experimenten überprüfen. Während des Experimentierens wurde der Bildschirm der Schüler aufgenommen. Zwei unabhängige Rater kodierten die Anzahl kontrollierter Experimente in den Aufnahmen. Ergebnisse Die Video-Beispiele konnten wissenschaftliches Denken fördern. Für alle Gruppen ergab sich ein signifikanter Interventionseffekt von Prä- zu Posttest für den Leistungstest zu wissenschaftlichem Denken. Gruppenunterschiede ergaben sich bezüglich des verhaltensnahen Maßes für wissenschaftliches Denken und bezüglich des Fachwissens. Die beiden fächerübergreifenden Gruppen führten im Posttest mehr kontrollierte Experimente durch als die fachspezifischen Gruppen. Eine fächerübergreifende Anordnung scheint somit von Vorteil zu sein zur Förderung wissenschaftlichen Denkens. Des Weiteren zeigte sich ein Interaktionseffekt für Fachwissen. Die fächerübergreifend-deduktive Gruppe sowie die fachspezifisch-induktive Gruppe verbesserten von Prä- zu Posttest ihr Fachwissen. Die Gestaltung von Video-Beispielen beeinflusst also tatsächlich den Erwerb von wissenschaftlichem Denken und Fachwissen. Mit den eigenen Daten rechnet sich’s leichter? Zur Rolle von Lösungsbeispielen und gestuften Lernhilfen beim Schülerexperiment Florian Schmidt-Borcherding1, Martin Hänze2, Rita Wodzinski2 1 Universität Bremen, 2Universität Kassel Experimentieren (im weiteren Sinne verstanden als systematische Herstellung, Kontrolle und/oder Manipulation von Beobachtungssituationen) ist eine - wenn nicht „die“ - zentrale naturwissenschaftliche Methode. Auch deswegen wird dem Schülerexperiment im naturwissenschaftlichen Unterricht aus fachlicher wie fachdidaktischer Sicht große Bedeutung beigemessen. Der mit dem selbstständigen Experimentieren der Schülerinnen und Schüler (SuS) erzielte Lernerfolg bleibt allerdings oft hinter den Erwartungen zurück (z.B. Bates, 1978; Hofstein & Lunetta, 1982; Hucke & Fischer, 2002). Das erklärt möglicherweise auch, warum Lehrerinnen und Lehrer oft lieber auf Demonstrationsexperimente, eng strukturierte Experimentieranleitungen oder die Vorgabe „korrekter“ Messergebnisse zurückgreifen (Tesch, 2005). Mit dieser Studie soll untersucht werden, (a) welche Rolle die Herstellung eigener Messergebnisse (Experimentieren im weiteren Sinne) im Vergleich zu vorgegebenen Messergebnissen (Lösungsbeispiel für experimentell gewonnene Daten) beim Schülerexperiment spielt und (b) ob Maßnahmen zur Öffnung von Lösungsbeispielen auch bei eng strukturierten Anleitungen für Schülerexperimente lernwirksam sind. Als Maßnahme zur Öffnung von Experimentieranleitungen sollen sog. „gestufte Lernhilfen“ dienen. Gestufte Lernhilfen segmentieren Lösungsbeispiele in einzelne Schritte, denen kognitiv aktivierende Prompts vorangestellt werden. Die Prompts und Lösungsschritte werden von Lernenden schrittweise und nur bei Bedarf abgerufen. So gestaltete Lernhilfen haben sich beim naturwissenschaftlichen Problemlösen gegenüber einfachen Lösungsbeispielen als lernwirksamer erwiesen (z.B. Schmidt-Weigand, Hänze & Wodzinski, 2009). N = 126 Schülerinnen und Schüler der 8. Jahrgangsstufe einer integrierten Gesamtschule in Nordhessen bearbeiteten in Partnerarbeit eine Aufgabe zum Hookeschen Gesetz. Über die Ausdehnung einer Feder bei Gegenständen mit bekannter Masse sollte die unbekannte Masse eines weiteren Gegenstandes bestimmet werden. Für diese Aufgabe wurde eine eng strukturierte Experimentieranleitung verfasst. In einem 2x2-faktoriellen Versuchsdesign wurde nun variiert, (a) ob die Ausdehnung der Feder für jeden der Gegenstände bestimmt werden musste (Experimentieraufgabe) oder vorgegeben war (Textaufgabe) und (b) ob die Anleitung als zusammenhängender Instruktionstext vorgegeben wurde (Lösungsbeispiel) oder schrittweise in Form gestufter Lernhilfen. Die Schülerpaare wurden zufällig auf die vier resultierenden Untersuchungsbedingungen aufgeteilt. Als abhängige Variablen dienten Maße des Lernerlebens (basic needs, kognitive Belastung) sowie des Lernerfolgs (Güte der Aufgabenlösung, Wissenstest zum Hookeschen Gesetz). Sowohl im Lernerleben als auch im Lernerfolg zeigt sich ein Haupteffekt der Aufgabenart. SuS, die die Federausdehnungen tatsächlich messen mussten, berichten unabhängig von der weiteren Unterstützung ein positiveres Lernerleben im Sinne höherer intrinsischer Motivation, kognitiver Aktivierung, Autonomieerleben, Kompetenzerleben und sozialer Einbindung als SuS, die mit vorgegebenen Messwerten weiter arbeiten mussten. In gleicher Weise erwarben SuS mit selbst erzeugten Messdaten ein genaueres Verständnis zum Hookeschen Gesetz als SuS mit vorgegebenen Messwerten. Entgegen unseren Erwartungen zeigen sich keine Unterschiede zwischen enggeführter Anleitung und gestuften Lernhilfen. Für das selbstständige Experimentieren ist das Ausbleiben eines positiven Effektes gestufter Lernhilfen immerhin noch dadurch erklärbar, dass das Experimentieren Lerner möglicherweise von den externen Hilfen ablenkt (vgl. Schmidt-Borcherding et al., 2013). Das Fehlen von Unterschieden bei der Textaufgabe lässt sich damit allerdings nicht erklären. Das Versagen der Anderen: Erlernen von Diagnostischen Fähigkeiten durch das Geben von Feedback auf videobasierte fehlerhafte Cognitive Modeling Examples Christian Strobel1, Nicole Heitzmann1, Jan-Willem Strijbos1, Ingo Kollar2, Martin Fischer1 1 Ludwig-Maximilians-Universität München, 2Universität Augsburg Theoretischer Hintergrund Diagnostizieren als eine der komplexesten alltäglichen Aufgaben eines Arztes hat eine Fehlerrate von 10-15% (Graber, Gordon & Franklin, 2005). Instruktionale Ansätze in der medizinischen Ausbildung sind dringend nötig, um diese Rate zu reduzieren. Bei deren Erforschung wird bisher meist der Erwerb diagnostischen Faktenwissens allein als Maß der Effektivität betrachtet. Ein holistisches Diagnosekompetenzmodell vereint unseres Erachtens Diagnosewissen bestehend aus konzeptionellem Wissen über Fakten einer Krankheit, konditionalem Wissen über ein Diagnoseverfahren und strategischem Wissen über dessen Hintergründe und Implikationen (Stark, Kopp, & Fischer, 2011) sowie Fehlererkennungskompetenz als Wissen über mögliche Fehlerquellen einer Diagnose. Letztere wurde bis jetzt noch nicht in das Konzept der Diagnosekompetenz inkorporiert. Dies ist aber unabdingbar, um eine akkuratere Aussage über die tatsächliche Diagnosefähigkeit von Medizinern machen zu können (Dror, 2011). Ein erfolgreicher Ansatz zur Vermittlung von Diagnosekompetenz ist das fallbasierte Lernen mit Lösungsbeispielen (Stark, et al., 2011). Eine authentische Variante fallbasierter Lösungsbeispiele zum Erlernen kognitiver Fähigkeiten sind videobasierte Cognitive Modeling Examples (Kostons, Van Gog, & Paas, 2012): Videos von Mitstudierenden, die eine Differenzialdiagnose von Anfang bis Ende durchführen und ihre Überlegungen hinter der Diagnose erklären. Renkl und Atkinson (2003) sehen fehlerhafte Beispiele als lernförderlicher und motivierender an als fehlerfreie Beispiele – vorausgesetzt, der Fehler wird durch Elaboration des Gesehenen erkannt. Um Elaboration anzuregen, könnte sich der Auftrag, elaboriertes Peer-feedback auf das Gesehene zu geben, als effektiv herausstellen (Li, Liu, & Stecklberg, 2010; Cho & Cho, 2011). Aus diesen theoretischen Annahmen ergeben sich folgende Fragestellungen. Fragestellungen Forschungsfrage 1: Wie wirkt sich der Einsatz von Cognitive Modeling Examples verglichen mit Textbuchlernen auf den Erwerb von Diagnosekompetenz aus? Forschungsfrage 2: Wie wirkt sich das Geben von Peer-Feedback auf Cognitive Modeling Examples im Vergleich zum Ansehen allein auf den Erwerb von Diagnosekompetenz aus? Forschungsfrage 3: Gibt es einen Unterschied zwischen fehlerhaften und korrekten Cognitive Modeling Examples bezüglich des Erwerbs von Diagnosekompetenz? Forschungsfrage 4: Gibt es eine Interaktion zwischen dem Geben von Peer Feedback auf fehlerhafte oder korrekte Cognitive Modeling Examples bezüglich des Erwerbs von Diagnosekompetenz? Methode Die Stichprobe bestand aus N=121 Medizinstudierenden der LMU im 7. Semester; alle absolvierten einen Wissens-Pre-Test und lernten jeder für sich mit drei über die CASUS-Lernsoftware (Fischer, 2000) präsentierten Cognitive Modeling Examples zu Atemnot und absolvierten einen Wissens-Post-Test. In einem 2x2 faktoriellen Design mit Kontrollgruppe wurde untersucht ob (a) die Korrektheit der Beispiele (fehlerhafte vs. korrekte) und (b) das Geben von Peer-Feedback (ja vs. nein) auf die gezeigten Beispiele den Grad der Elaboration und dadurch den Erwerb von Diagnosekompetenz verbessern. Die Kontrollgruppe lernte aus einem Lehrbuchabschnitt zum Thema Atemnot. Die Messung der Diagnosekompetenz war operationalisiert als 15 Multiple-Choice-items zu konzeptuellem Wissen (α =.51), 15 Key-Feature-Fragen zu strategischem Wissen (α =.58) und sechs Problemlöseaufgaben zu konditionalem Wissen (α=.59). Fehlererkennungskompetenz wurde erfasst mit fehlerhaften Lösungsbeispielen mit 15 auffindbaren Fehlern innerhalb der Diagnose (α =.61) Ergebnisse Cognitive Modeling Examples führten zu einem besseren Lernerfolg bei konzeptionellem diagnostischem Wissen als das Lernen eines Lehrbuchabschnittes, t(40)=2.651 p=.011. Der Lernerfolg zwischen fehlerhaften und korrekten Beispielen unterschied sich für Diagnosewissen nicht, F(1,95)=.264, p=.609. Fehlererkennungskompetenz wurde jedoch mit fehlerhaften Beispielen verbessert, F(1,95)=4.290, p=.041, ηp²=.045. Das Geben von Feedback hatte entgegen unserer Hypothese negative Effekte auf den Erwerb von Diagnosewissen, F(1,95)=8.866, p=.004, ηp²=.090 sowie auf Fehlererkennungskompetenz, F(1,95)=5.066, p=.027, ηp²=.053. Die kognitive Anstrengung war höher beim Feedbackgeben (M=3.95, SD=.78) im Vergleich zum Modell-Anschauen (M=3.50, SD=.657), t(86)=3.040, p=.003. Es wurde kein Interaktionseffekt der Faktoren gefunden. Der Elaboriertheitsgrad des Feedbacks korrelierte mit konditionalem Wissen (r=.31, p=.035) sowie mit kognitiver Anstrengung (r=.38, p=.011). Die Ergebnisse untermauern die Effektivität von Cognitive Modeling Video-Examples als Lehrmethode in der medizinischen Ausbildung. Gerade fehlerhafte Beispiele fördern Fehlererkennungskompetenz der Studierenden. Das Geben von Feedback sollte jedoch als didaktische Methode mit Vorsicht eingesetzt werden, um die Studierenden nicht kognitiv zu überlasten. Zeitpunkt kognitiver Modellierung und Art der Lernaufgabe: Effekte auf den Fertigkeitserwerb in empirischen Forschungsmethoden Julia Murböck, Jana Antosch-Bardohn, Jan-Willem Strijbos, Karsten Stegmann Ludwig-Maximilians-Universität München Vielen Studienanfängern der Erziehungswissenschaften fällt das Erlernen von wissenschaftlichen Fertigkeiten in empirischen Forschungsmethoden schwer. Beispielbasiertes Lernen ist eine effektive Methode, um den frühen Fertigkeitserwerb zu fördern (Renkl, 2014). Eine Form beispielbasierten Lernens ist Lernen am Modell (Van Gog & Rummel, 2011). Ein bislang nur wenig untersuchter Aspekt in der Erforschung beispielbasierter Lernumgebungen ist die Sequenzierung der Lehr- und Lernaktivitäten und deren Wirkung auf den Fertigkeitserwerb: Soll die Fertigkeit vor oder nach der Bearbeitung von Lernaufgaben modelliert werden und welche Arten von Lernaufgaben sollen die Studierenden bearbeiten? Sollen sie selbst ein Problem lösen, schon gelöste Beispiele vergleichen oder ein Problem lösen und sich anschließend selbst mit dem Modell vergleichen? Für die Modellierung davor spricht, dass dadurch eine (überflüssige) kognitive Belastung vermieden werden kann und dies zu besserem Fertigkeitserwerb führt (Van Gog et al., 2011). Metaanalytische Befunde liefern jedoch auch einen Beleg, dass die Effektivität nachfolgender Modellierung von der Art der Lernaufgabe abhängt und besonders bei vergleichenden Aktivitäten wirksam scheint (Alfieri et al., 2013). Die Lernenden erschließen sich dabei die Prinzipien aktiv, wodurch sie die nachfolgende Instruktion besser mit ihrem Vorwissen verknüpfen können sollten. Neben dem Vergleich von Beispielen scheint es auch sinnvoll, Vergleiche mit dem Modell gezielt anzuregen, da angenommen wird, dass der Lerner sich bei der Lösung eines ähnlichen Problems überwacht und seine Aufmerksamkeit bei der nächsten Modellierung gezielt auf seine Schwachstellen richtet (Bandura, 1977). Die vorliegende Studie bearbeitet daher die Fragestellung, in wieweit der Zeitpunkt der Modellierung, die Art der Lernaufgabe und deren Interaktion einen Effekt auf den Fertigkeitserwerb haben. Zur Bearbeitung der Fragestellungen wurden der Zeitpunkt der Modellierung (vorher vs. nachfolgend) und die Art der Lernaufgabe (Problemlösen vs. Vergleichen von Beispielen vs. Problemlösen und Vergleich mit Modell) in einem 2x3-faktoriellen-Design variiert. Im Rahmen der Studie sollten die Studierenden in 60 Minuten mit Hilfe von drei Modellierungen und drei Lernaufgaben die Fertigkeit erwerben, wie man verschiedene experimentelle Designs darstellt. Die Lernaufgaben bestanden entweder aus (1) dem Lösen von analogen Problemen, (2) dem Vergleich von zwei gelösten Beispielen oder (3) der Bearbeitung von analogen Problemlöseaufgaben und dem Vergleich mit der Modelllösung. Pädagogik-Studenten (N=142) im ersten Semester wurden einer der sechs Bedingungen zufällig zugewiesen. Der Lernerfolg wurde mit Hilfe eines Wissenstests erfasst, bei dem die Lernenden die einzelnen Teilschritte beim Darstellen eines Designs umsetzen mussten (Cohen’s Kappa=.78). In den Bedingungen mit vorheriger Modellierung wurde signifikant mehr gelernt als mit nachfolgender Modellierung, F(1, 141)=4.50; p=.036; η²=.032. Auch zeigt sich ein signifikanter Effekt der Art der Lernaufgabe auf den Fertigkeitserwerb, F(2, 141)=7.06; p=.001; η²=.095. Die Lerner, die jeweils zwei gelöste Beispiele verglichen haben, haben signifikant mehr gelernt als Studierende, die analoge Probleme gelöst haben (p=.025; d=.50) sowie verglichen mit Lernern, die analoge Probleme gelöst haben und ihre Lösung mit der Modelllösung vergleichen mussten (p<.001; d=.74). Die Interaktion zwischen Zeitpunkt der Modellierung und Art der Lernaufgabe ist nicht signifikant, F(2, 141)=.068; p=.934; η²=.001. Im Einklang mit den Befunden von Van Gog et al. (2011) liefert diese Studie Hinweise darauf, dass die Modellierung vor der Bearbeitung von Lernaufgaben stattfinden sollte anstatt danach. Entgegen der metanalytischen Befunde von Alfieri und Kollegen (2014) erbrachte diese Studie keinen Hinweis darauf, dass der Zeitpunkt der Modellierung von der Art der Lernaufgabe abhängt. Der positive Effekt des Vergleichens von Beispielen scheint durch eine bessere Schemabildung zu einem höheren Fertigkeitserwerb geführt zu haben, da die Problemlöseaufgaben die Lerner womöglich zu Beginn noch überlastet haben (Renkl, 2014). Eine Limitation dieser Studie ist die Art des Lernziels, da es sich hier nicht um eine komplexe Fertigkeit handelt, sondern um eine strukturierte, regelbasierte Prozedur. Für komplexe Fertigkeiten als Lernziel kann diese Studie daher keine gültigen Aussagen treffen. ID: 433 Symposium Disziplinen-Cluster: Erziehungswissenschaft, Psychologie Thematisches Cluster: Bildung im Sekundarbereich, Grundschulbildung, Motivation und Emotion Stichworte: Transition, Sekundarstufe I, Passung, Selbstkonzept, Leistungen Passung, Selbstkonzept und Leistung beim Übergang in die gegliederte Sekundarstufe I Chair(s): Markus P. Neuenschwander (Pädagogische Hochschule FHNW) Diskutant(en): Benjamin Nagengast (Universität Tübingen) Kinder sind in schulische Kontexte eingebettet, welche die Entwicklung ihrer Fähigkeitsselbstkonzepte und Leistungen beeinflussen (Lerner et al, 2005). Schulische Kontexte, die den Bedürfnissen der Kinder entsprechen, begünstigen Selbstkonzept und Leistungen (stage-environment fit, Eccles & Roeser, 2009). Die Analyse von Schulübergängen ermöglicht, den Einfluss der Schulorganisation auf das Selbstkonzept und die Leistungen der Kinder zu analysieren. Schulübergänge sind für die Kinder Herausforderungen, deren Bewältigung die Schulkarriere, aber auch die Entwicklung der Fähigkeitsselbstkonzepte und der Leistungen in den einzelnen Fächern beeinflusst. In schulischen Selektionsprozessen können erwartete Schulkarrieren korrigiert werden (erwartungswidrige Bildungsverläufe). Es entsteht Durchlässigkeit zwischen verschiedenen Bildungskanälen. Nach der Selektion müssen sich die Kinder an die neuen Bezugssysteme und Anforderungen in den Schulformen der Sekundarstufe I anpassen, was ihre Selbstkonzept- und Leistungsentwicklung steuert. In diesem Symposium wird der Frage nachgegangen, welche erwarteten und erwartungswidrigen Folgen der Übergang in die Sekundarstufe I auf die individuelle Entwicklung der Passungswahrnehmung, der Fähigkeitsselbstkonzepte, der Leistungen und der Noten in den einzelnen Fächern hat. Zur Bearbeitung der Leitfrage berichtet Neuenschwander aus einer entwicklungspsychologischen Perspektive Befunde eines Schweizer Längsschnittprojekts, wonach mit dem institutionellen Übergang in die Sekundarstufe I die wahrgenommene Passung Kind-Unterricht reduziert wird. Durch die Gliederung der Sekundarstufe I entstehen leistungshomogenere Lerngruppen, die den Bedürfnissen der Jugendlichen besser entsprechen sollten. Hildebrand und Waterman zeigen aus einer pädagogischen Perspektive längsschnittlich, dass die Bewältigung von Herausforderung und Bedrohung bei Viertklässlern am Ende der Grundschulzeit angesichts der Ungewissheit nach dem Übergang die Noten in Deutsch und Mathematik in der Sekundarstufe vorhersagt. Sie folgern, dass die Passung zwischen den kontextuellen Bedingungen und den psychologischen Grundbedürfnisse verbessert werden sollte. In psychologischer Tradition berichten Rösselet und Neuenschwander längsschnittliche Befunde, dass explizite und implizite Erwartungen von Lehrpersonen der Primarschule die Leistungsentwicklung vor und nach dem Übergang in die Sekundarstufe I beeinflussen. Trotz der Selektions- und Anpassungsprozesse erklären Lehrpersonenerwartungen Leistungsveränderungen auch nach dem Übergang. Zurbriggen stellt in sonderpädagogischer Tradition Längsschnittbefunde vor, wie sich Selbstkonzepte und Leistungen von Jugendlichen aus anforderungsreichen Schulformen mit erwartungswidrig tiefen Schulleistungen in der Primarschule entwickeln. Sie zeigt hypothesenkonform ein deutliches Absinken deren Selbstkonzept und ein Ansteigen deren Leistungen im Vergleich zu den anderen Jugendlichen. Sie illustriert damit Folgen von erwartungswidrigen Zuweisungen und von Anpassungsprozessen an die jeweiligen Schulformen der Sekundarstufe I. Nagengast diskutiert die Befunde auf dem Hintergrund der Leitfrage. Die Ergebnisse zeigen exemplarisch, wie der Schulübergang zu diskontinuierlichen Veränderungsprozessen von Kindern beiträgt bzw. wie die Leistungsentwicklung nach dem Übergang frühzeitig vorhergesagt werden kann. Beiträge des Symposiums Veränderung der Passungswahrnehmung bei einem frühen oder späten Übertritt in die Sekundarstufe I Markus P. Neuenschwander Pädagogische Hochschule FHNW Schulen begünstigen die Lernmotivation und die Leistungen von Kindern, wenn ihre Angebote mit den altersspezifischen Bedürfnissen der Kinder korrespondieren (stage-environment-fit, Eccles & Roser, 2009). Passungswahrnehmung bezeichnet die von den Schülerinnen und Schülern wahrgenommene Passung zwischen sich und dem schulischen Unterricht. Eccles et al. (1993) postulierten ein starkes Absinken der Passungswahrnehmung beim Übertritt in die US middle school durch die veränderte Schulorganisation: Die Kinder wechseln von kleinen Schulen in große Schulen mit anonymen Lehrpersonenbeziehungen und höheren Leistungsanforderungen. Weil die Pubertät bei Mädchen im Durchschnitt früher beginnt als bei Jungen, ist die Passungswahrnehmung von Mädchen bei einem frühen Schulübertritt wegen der Kumulation von Belastungen tiefer als bei Jungen (Simmons & Blyth, 1987). In der Schweiz treten die Kinder in eine gegliederte Sekundarstufe I über mit Schülergruppen, die leistungshomogener als Primarschulklassen sind. Damit soll die Passung zunehmen. Sinkt die Passungswahrnehmung gleichwohl unabhängig vom Alter der Kinder in Übereinstimmung mit der Eccles-These beim Übertritt in die Sekundarstufe I in der Schweiz? Wie beeinflusst das Schülergeschlecht die Veränderung der Passungswahrnehmung zu zwei verschiedenen Übertrittszeitpunkten? In den Kantonen Aargau und Basel-Landschaft traten die Kinder nach dem 5. Schuljahr in die gegliederte Sekundarstufe I über (früher Übertritt), in den Kantonen Bern und Luzern nach dem 6. Schuljahr (später Übertritt). Hypothesen: Es wird in der Gruppe früher Übertritt ein starkes Sinken der Passungswahrnehmung während der Transition vom 5. zum 6. Schuljahr und ein schwaches Sinken in der Sekundarstufe I vom 6. zum 7. Schuljahr angenommen. Bei der Gruppe später Übertritt wird hingegen ein schwaches Sinken vom 5. zum 6. Schuljahr der Primarschule und ein starkes Sinken während der Transition vom 6. zum 7. Schuljahr postuliert. Methode: Die Hypothesen wurden unter Hinzuziehung von Längsschnittdaten des Projekts „Wirkungen der Selektion WiSel“ überprüft. Es wurden zufällig 50 Klassen mit frühem Übertritt und 49 Klassen mit spätem Übertritt ausgewählt. Die Kinder wurden im 5., 6. und 7. Schuljahr klassenweise befragt. Die Längsschnittstichprobe umfasste 111 Schülerinnen und 90 Schüler mit frühem Übertritt und 175 Schülerinnen und 187 Schüler mit spätem Übertritt. Die Passungswahrnehmung wurde reliabel mit 4 Items operationalisiert. Ergebnisse: Mit Daten des 5. Schuljahres wurden signifikante positive Korrelationen zwischen der Passungswahrnehmung und Leistungen in Deutsch und Mathematik sowie Lernziel- und Leistungszielorientierung gefunden (Validierung). Die metrische Messinvarianz der Passungswahrnehmung zwischen den Messzeitpunkten war in beiden Gruppen gegeben. Die Hypothesen wurden mit latenten Wachstumsmodellen 2. Ordnung getestet. Es wurden nicht-lineare Slopes definiert (früher Übertritt: starkes Sinken vom 5. zum 6. Schuljahr, schwaches Sinken vom 6. zum 7. Schuljahr; später Übertritt: schwaches Sinken vom 5. zum 6. Schuljahr, starkes Sinken vom 6. zum 7. Schuljahr). Dieses Wachstumsmodell zeigte für beide Gruppen einen guten Fit. Das Modell war in beiden Gruppen besser als dasjenige eines Vergleichsmodells mit linearen Slopes. Gruppenvergleiche zeigten, dass die Passungswahrnehmung (Intercept) bei der Gruppe später Übertritt signifikant höher war als in der Gruppe früher Übertritt. Die Passungswahrnehmung sinkt in der Gruppe früher Übertritt tendenziell stärker als in der Gruppe später Übertritt (Slope). Das Geschlecht erklärte nur die Passungswahrnehmung (Intercept) in der Gruppe später Übertritt (Mädchen hatten höhere Passungswahrnehmung). Diskussion: In Übereinstimmung mit Eccles & Roeser (2009) ist die Passungswahrnehmung beim frühen Übertritt tiefer als beim späten Übertritt. Sie nimmt besonders in der Übertrittsphase ab. Die Veränderung der Passungswahrnehmung wird daher nicht mit dem Alter der Kinder, sondern mit Änderungen der Schulorganisation von der Primar- in die Sekundarstufe I erklärt – trotz der gegliederten Sekundarstufe I. Der späte Übertritt begünstigt erwartungsgemäß die Passungswahrnehmung von Mädchen. Beeinflusst das Erleben des Grundschulübergangs als Herausforderung oder Bedrohung die spätere Leistungsentwicklung in der Sekundarstufe? Johanna Hildebrandt, Rainer Watermann Freie Universität Berlin Der Übergang von der Primarstufe auf die Sekundarstufe I geht einher mit richtungsweisenden Laufbahnentscheidungen und ist daher von zentraler Bedeutung für die Schulkarrieren junger Schüler (Köller, Watermann & Trautwein, 2004). Wenngleich den Grundschülern die zahlreichen strukturellen, curricularen, didaktischen und sozialen Veränderungen (Tobbell & O’Donnell, 2013) nicht vollständig bekannt sein dürften, ist anzunehmen, dass sie dem bevorstehenden Übergang nicht neutral begegnen, sondern spezifische Erwartungen und Vorstellungen an die neue Schule entwickeln. Vor dem Hintergrund stresstheoretischer Konzeptionen (z.B. Lazarus & Folkman, 1984) manifestieren sich diese Erwartungen als Herausforderung – verbunden mit Freude und Zuversicht – aber auch als Bedrohung – verbunden mit Sorgen und Ängsten (z.B. Skinner & Brewer, 2002). Ferner wird postuliert, dass übergangsbezogene Erwartungen in einem dynamischen Zusammenspiel mit kognitiven, emotionalen und verhaltensbezogenen motivationalen Merkmalen zu kurz- und langfristigen adaptiven und maladaptiven Anpassungsleistungen führen (z.B. Lazarus & Folkman, 1984). Hinsichtlich der zunehmenden akademischen Anforderungen auf der Sekundarstufe (Tobbell & O’Donnell, 2013) sollten sich die Anpassungsleistungen im akademischen Bereich in den Sekundarstufennoten wiederspiegeln. Im Vortrag wird auf der Grundlage eines Teildatensatzes der TIMSS-Übergangsstudie (N=1661; TIMSS, Trends in International Mathematics and Science Study) erstmals der prognostischen Validität von Herausforderung und Bedrohung im Leistungsbereich hinsichtlich der Leistungsentwicklung (Noten in Deutsch und Mathematik) in der Sekundarstufe nachgegangen. In Kovarianzanalysen zeigte sich bei Kontrolle der zeitgleich gemessenen Kovariaten zur Grundschule (motivationale Merkmale, korr