Comments
Description
Transcript
La Stampa
Das Korpus romanischer Zeitungssprachen erstellt von Elisabeth Burr Korpora & Subkorpora • Italienische Zeitungen - Deutsche Einigung 1989 • • • • Corriere della Sera Il Mattino La Repubblica La Stampa (Zeitung - OCR) (Zeitung - OCR) (Zeitung - Files) (Zeitung - Files) (19.), 20., 21.10.1989 20., 21.10.1989 20., 21.10.1989 20., 21.10.1989 • Französische, italienische und spanische Zeitungen Europawahlen 1994 • Le Monde (CD-ROM) • Corriere della Sera (CD-ROM) 12./13., 14., 15.06.1994 13., 14., 15.06.1994 • La Vanguardia 13., 14., 15.06.1994 (Magnetband) Größe der Subkorpora Italienische Zeitungen Deutsche Einigung 1989 • Corriere della Sera • Il Mattino • La Repubblica • La Stampa 258.287 Wortformen 171.501 Wortformen 174.958 Wortformen 119.771 Wortformen • Gesamt 724.517 Wortformen Größe der Subkorpora Französische, italienische und spanische Zeitungen Europawahlen 1994 •Le Monde 236.236 Wortformen •Corriere della Sera 303.641 Wortformen •La Vanguardia261.133 Wortformen Gesamt 801.010 Wortformen Das Markup-System Die Ebene der Zeichen Disambiguierung mehrdeutiges Zeichen Funktion Kodierung • • • • • • • • • • Satzzeichen Dezimalzeichen Satzzeichen Dezimalzeichen Gedankenstrich Silbentrennung Apostroph Minute Anführungszeichen Sekunde , \ . } (89) / # (94) = ' £ (1994) " $ (1994) , , . . ' ' " " Typographische Ebene Korpus 1989 Markierung Roman Kursiv Fett neuer Absatz Kodierung @ ^ ~ // Die Ebene der Textkonstituenten • Kodierung im COCOA-Format Bibliographische Informationen • • • • Referenz Zeitung Ausgabe Ausgeweisenheit – a) – b) – c) Variable <Z> <E> <A> signiert anonym Redaktion • Autor/Autorin • Positionierung • Sprache Beispiel <Z Stampa> <E 211089> <A firmato> <A Non firmato> <A Redazione> <N> <C> <L> <N Ferrara Giovanni> <C MEA01> <L Inglese> (94) Die Variable C TESTATA AP Apertura APB TAA TAB Taglio alto MEA Taglio medio BAA Taglio basso SP Spalla TAC MEB SPB TAD TAE MEC BAB Sparten <S> • Sparte <S> <S Politica> Textart <T> Typen von Überschriften • • • • • Vorzeile Schlagzeile Untertitel Zusammenfassung Zwischenüberschrift <T Occhiello> <T Titolo> <T Sottotitolo> <T Sommario> <T Catenaccio> Textart <T> die festen journalistischen Formen • • • • • • • • • Leitartikel 'Aufmacher' Glosse Ankündigung Kolumne Kurzmeldung Kurznachricht Agenturmeldung Bildunterschrift <T Fondo> <T Spalla> <T Corsivo> <T Civetta> <T Rubrica> <T Flash> <T Breve> <T Agenzia> <T Foto> Textart <T> die fließenden Formen • • • • • Artikel Nachricht Kritik Spielbericht Interview <T Articolo> <T Notizia> <T Critica> <T Partita> <T Intervista> Textart <T> weitere Formen • • • • • • • Leserbrief Antwort auf Anfrage Wetterbericht Filminhalt Fernseh-, Kinoprogramm Liste Buch-, Film-, Liedtitel, etc. <T Lettera> <T Risposta> <T Tempo> <T Film> <T Programma> <T Elenco> <T Nome> Art des Sprechens <P> • • • • • Fortlaufender Text Zitat (schriftliche Quelle) Zitat (mündliche Quelle) Frage (Interview) Antwort (Interview) <P Prosa> <P Citazione> <P Discorso> <P Domanda> <P Risposta> Ebene der sprachlichen Fakten • ideosynkratische Kodierung Ebene der Wortformen Bezug Kodierung • Verb + Enklitikon • Konjunktion + finites Verb • Präposition + Artikel * * + Beispiel da*me*lo os*sia del+la Ebene der grammatischen Kategorien Korpus 1989 • alle finiten Verbformen wurden mit Hilfe eines 9stelligen Zahlencodes kodiert Beispiel: $I110a003dice • die periphrastischen Formen wurden als Einheit betrachtet (#) Beispiel: ho#$I111a001visto Das System Finite Verbform $ Modus: Indikativ Konjunktiv Imperativ Tempus: I C B ... Tempus • • • • • • • • • • Präsens Präteritum Perfekt Trapassato einfaches Futur zusammengesetztes Futur Imperfekt Plusquamperfekt einfaches Konditional zusammengesetztes Konditional Diathese: 110 111 120 121 130 131 210 211 230 231 ... Diathese • aktiv • passiv Aspekt: a p ... Aspekt nicht Verbalperiphrase stare + Gerundium stare per + Infinitiv venire + Partizip Perfekt andare + Partizip Perfekt [.....] cominciare col + Infinitiv stare + Partizip Perfekt venire + Gerundium stare + cominciare a + Infinitiv Person: 00 01 02 03 04 21 22 23 24 ... Person 1. Person 2. Person 3. Person 1 2 3 Beispiel • • • • • • • • • • • • • • • • • • <Z Repubblica> <E 211089> <S Politica> <A firmato> <N Ferrara Giovanni> <C MEA01> <T Titolo> <P Prosa> @~La Rai specchio d'Italia ((@di GIOVANNI FERRARA)) <T Fondo> //@~$I110a003CAPITA spesso di sentir dire, come niente $C210a003fos= se, che in Italia ormai <P Citazione> «c'$I110a003è il regime»; <P Prosa> che quelli che $I110a003contano ne+l potere reale hanno#$I111a003deciso che si $I110a003è con loro o contro di loro, che la Markup im Korpus '94 • COCOA-Format • partielle Angleichung an TEI-Standard Header <<!--Spanish Newspaper Corpus "European Elections 1994" Component 1 <<!--Original text copyright La Vanguardia, Barcelona <<!--Text source magnetic tape, ATEX format <<!--Data extraction Gert-jan Burggraaf (NL) <<!--Translation ATEX format to DOS codepage 850 Gert-jan Burggraaf (NL) <<!--with support of Steward Whitelaw & Roger Tripper, Daily Telegraph, London <<!--Extraction & Translation Period 1995 <<!--by extraction of this edition first letter of every line was lost <<!--has been corrected collating electronic with printed version <<!--Format MS-DOS Text -->> <<!--not lemmatised <<!--preposition-article contraction like "del" to "de+el", "al" to a+el <<!--verb-enclitics contraction like "veder+la" to veder+la" <<!--composed words with dash are retained as one form <<!--Accents ecc. substituted with apostrophee <<!--à to 'a, á to a', ñ to n', ç to c', ü to u\, ê to ‘e’ ecc. <<!--Apostrophee in its original function is followed by blank, i.e. "del' autovia" <<!--Hyphenation, line breaks correspond to printed version <<!--Disambiguation: punctuation and digits, i.e. # = decimal point, \ = decimal comma <<!--Disambiguation: Quotes and minutes / seconds, i.e. £ = minutes, $ = seconds <<!--Mistakes not corrected, but annotated {sic} <<!--Markup textual features <<!--Markup format COCOA <<!--Values of variables given in Italian <<!--Occhiello = CINTILLO, Titolo = TITULO, Sottotitolo = SUBTITOLO <<!--Sommario = ENTRADILLA, Catenaccio = DESTACADO <<!--Markup of comments { } and << >> <<!--Correction, Disambiguation, Markup Elisabeth Burr <<!--Elaboration Period 1995-1997 <<!--Copyright Elisabeth Burr <<!--The June 13, 1994 issue of the newspaper La Vanguardia, Barcelona, Spain -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> -->> Perspektive • Kodierung im SGML-Format • Angleichung an TEI-Standard • Angleichung an EAGLES-Standard Beispiele aus der Forschung I Die innere Variation der italienischen Zeitungssprache Kategorien • Aktiv, Passiv, aspektive Verbalperiphrasen • Indikativ, Konjunktiv, Imperativ • Konjunktiv: aktuelle versus inaktuelle Ebene • Tempora des Konjunktivs - aktuelle Ebene • Tempora des Konjunktivs - inaktuelle Ebene • Indikativ: aktuelle versus inaktuelle Ebene • Tempora des Indikativs - aktuelle Ebene • Tempora des Indikativs - inaktuelle Ebene Untersuchung Erhebung der Daten mit Micro-OCP: • 48.390 finite Verbformen • = etwa 7,5% der Gesamtwortzahl • sehr interessante und z.T. unerwartete Ergebnisse allgemein • synphasische Einheiten unterscheiden sich v.a. aufgrund der Realisierungen der Tempora des Indikativs • Modus, Diathese, Zahl der finiten Verben spielen eine untergeordnete Rolle • die Gesamtzahl der aspektiven Verbalperiphrasen ist nur in Ausnahmen signifikant • die signifikanten Abweichungen von der jeweiligen Norm betreffen fast durchwegs die inaktuelle Ebene bzw. sind von ihr verursacht Innere Variation des Korpus • Il Mattino & La Stampa Norm des Gesamtkorpus • Corriere della Sera: - Imperativ, - inaktuelle Ebene Indikativ • La Repubblica: viele positive Abweichungen - Sonderstellung Titulatur • relativ homogen • reduziertes Verbalsystem: Ø futuro anteriore Ø congiuntivo imperfetto • nur Titolo realisiert dieses System 2 Normen: Il Mattino & La Stampa: - passato prossimo Corriere della Sera & La Repubblica: + passato prossimo • Occhiello, Sottotitolo, Sommario: Texttraditionen Citazione vs Discorso • relativ homogene Einheiten Citazione: • + Nominalstil • + passivo, + trapassato prossimo • Ø futuro anteriore 'Parlato' - fortlaufender Text Stilisierung des Gesprochenen • + finite Verben • - Passato Prossimo • + Presente • - Passiv • + Imperativ • - Indikativ • + Konjunktiv • - Plusquamperfekt • + Imperfekt • - Konjunktiv Perfekt • + Konditional Präsens 'Gesprochen' - 2 Normen Corriere della Sera & La Repubblica: - passato remoto • Il Mattino & La Stampa: + passato remoto Passato remoto • Il Mattino: - passato remoto: Citazione, Articolo, Notizia + passato remoto: Discorso • La Stampa: + passato remoto: grundsätzlich Spartenvariation La Repubblica: größte Variationsbreite • La Stampa: geringste Variationsbreite • Il Mattino & Corriere: mittlere Variationsbreite Articolo/Prosa folgende Sparte realisiert jeweils die Norm: • Il Matino: Cultura (vgl. + Passiv, - passato remoto) • La Repubblica: Politica (vgl. + inaktuelle Ebene Indikativ) II Referenz Nomina Agentis • exhaustive Erhebung • 15.385 Berufs-, Funktions- und Gradbezeichnungen • Fragen – spielen Frauen in den Zeitungen überhaupt eine Rolle – werden sie mit maskulinen oder femininen Formen bezeichnet – gibt es Unterschiede zwischen den Arten von Aktivitäten – welche Feminisierungsverfahren werden verwendet – werden Frauen bei den angeblich generischen Formen tatsächlich mitgedacht Ergebnisse (summarisch) • 94,25% der Nomina Agentis referieren auf Männer oder männlich gedachte Agenten • 5,75% der Nomina Agentis referieren auf Frauen • die Mehrheit der berücksichtigten Frauen erscheint in traditionellen Rollen personenbezogene Eigennamen • Frage: kann der Gebrauch personenbezogener Eigennamen Ausdruck einer Ungleichbehandlung der Geschlechter sein? • zu beachten: es kann hierbei nicht um die Eigennamen selbst gehen, sondern um das Zusammenauftreten derselben mit kontextuellen (grammatischen, lexikalischen oder semantischen) Phänomenen. Frauen - Männer 9,03% zu 90,97%. Arten von Eigennamen Referenz auf Eigenname Familienname Vorname Vor- und Familienname Gesamt Mann Frau Gesamt absolut % absolut % absolut % 6904 55,76 183 14,89 7087 52,06 477 3,85 297 24,17 774 5,69 5002 40,39 749 60,94 5751 42,25 12383 100,00 Indikation von Geschlecht: Vorname Vorname + Familienname 1229 100,00 13612 100,00 Signifikanz Referenz auf Frauen: Vorname + 27,2 Vor- und Familienname + 10,1 Familienname – 18,1 Referenz auf Männer: Familienname + 5,7 Vorname – 8,6 Vor- und Familienname – 3,2 bestimmter Artikel Referenz auf Eigenname + bestimmter Artikel Vor- und Familienname Vorname Familienname Mann absolut % Frau absolut % 0 0 0 51 0 0,74 0 Gesamt absolut % 0 0 0,00 1 0,34 62 33,88 1 113 0,13 1,59 Signifikanz • Referenz auf Frauen: – + bestimmter Artikel + 34,6 – andere Erweiterungen + 11,2 – – bestimmter Artikel – 10,0 • Referenz auf Männer: – + bestimmter Artikel – 5,6 – andere Erweiterungen – 1,8 – – bestimmter Artikel + 1,6 Ergebnis das Fehlen des Artikels bei der Referenz auf Frauen stellt im untersuchten Sprachmaterial eine Ausnahme dar. Der Artikel wird so gebraucht, wie Renzi es darstellt: "l'articolo è obbligatorio, e in pratica segnala automaticamente che la persona in questione è una donna" (Renzi 21989: 393). Da der bestimmte Artikel bei männlichen Referenten nur dort gebraucht wird, wo er auf etwas Außergewöhnliches hinweist, erhalten auch die Referentinnen Ausnahmecharakter. III Phraseologie Wiederholte Rede - Idiom Principle lateinische Einheiten • Französisch • • • • • • • • • • grand prix de+ le jury se'rie b, c, d, e 2e prix boulogne-sur- mer; 3e prix sion, paris; 3e prix - ge'ologie (se'rie d 1er prix de son environnement remis a+ les parlementaires. a+le re'gime. la fin d' un apr'es son arrestation. le ni rester inde'finiment a+le ex-aequo: soleil trompeur, de ex aequo: be'atrice joyeux ex aequo: david madore (pascal, ex aequo: radha nair (ecole ex aequo: sophie chantalat (monot, intra muros. a ce titre, le refus intra-muros, la hausse n' est plus statu quo d' autre part, le minis statu quo he'rite' de+le re'gime statu quo, reprenne son mouvement lateinische Einheiten • Italienisch • • • • • • • • • • • nel+la precarieta'. l' ultimo casus belli riguarda il dovesse riuscire? "basterebbe un casus belli, chiude sibillino il terzo e' stato assegnato ex aequo a+l russo andrea katherine heigl si fa ex aequo desiderare e odiare, a+l l' ha fatto. poteva provar+ci in extremis convocando calciatori decreto su+l lavoro, rinviato in extremis da+ l governo, teso - sembra esser+si risolta in extremis in favore de+i a punti, sottratta a berzin in extremis. arrivo - (ultima e mi faccio richiamare in extremis? una trama da rivista, c' era chi andava a vedere l' opera omnia di roger corman!". sotto il peso del+la sua "opera omnia. e delfini non fu lateinische Einheiten • Spanisch • • • • • • • • • • xiv los que protestaban contra el "ars nova, no lo haci'an para embargo, el cda queda excluido de facto de las negociaciones con nasa la auto’noma inviste doctores honoris causa a los me'dicos cardu's, sera'n investidos doctores honoris causa por la uab invistio' ayer doctor honoris causa a felicito' e impuso la medalla honoris causa de dos esta los me'dicos fuster y cardu's, honoris causa por la auto’noma miocardio. en su investidura como honoris causa, fuster obvio' del tiempo, reconocen que "postume labuntur anni, lo cual catalana, a su vez traduccio'n "sui generis de un canto Kreativität • Italienisch • • • • • • • • • • • pensiero dilagante. business is business, tutto questo garden, il 19. lo so, quello è business. quello è anche i risultati de+l suo "emilio poll". poi, per primo, la legge: trasmettendo gli exit poll al+le 21#59, un minuto , nulla vietava la relazione. no comment da parte mia, in svizzera, li spenderò là. yes comment. calcio e politica de+l gesto, vale a dire l'art pour l'art, la ruse pour dire l' art pour l' art, la ruse pour la ruse. solo un' (girone a, chieti e nola (b. più risiko che calcio: i giornali nel+la coppa de+l mondo. più risiko che calcio, dunque, se Vorgeformtheit & Numerus • Schwankungen beim Numerus weisen auf Vorgeformtheit hin: • • • • • • • (INGL) (INGL) (FRAN) (FRAN) (FRAN) (INGL) (INGL) rai e un po' il biscione. gli exit poll fioccano, miglio commenta: la filarmonica. mentre l' exit poll scandiva i primi risultati pagamento su+i quotidiani, le due tranche del+l' operazione hanno 476 a 586 miliardi, sara' in due tranche e prevede l' esclusione la consegna avvenne in due tranches, la prima "rata sotto 2 victorias a 0, en la final del "play-off por el ti'tulo en tres rondas anteriores de los "play-off. la aportacio'n de kollokationelle Profile • • • par la douane russe d'un stock d'archives appartenant comme il l'a fait avec le stock d'armes nucléaires ne sont pas encore achevés. le stock de capital, les • • • ingredienti de+l suo ricettario "nouvelle cuisine", il "sushi marin, esponente di spicco del+la nouvelle dance francese che felice de+l cinema francese, la nouvelle vague, con la donn- un x coup de y • • • • • incartade. la ville lui a même de l'intérieur a sans doute confirment que les iraniens ont et, par la même occasion, de depuis, tous les ans, elle va donné un sérieux coup de pouce donné un bon coup de pouce, donné un coup de pouce a+les donner un coup de pouce à l' donner un coup de main pendant Vergleiche (Elativ) • Französisch • • • • • • • • - qui parfois leur ressemblent es points de vue se sont éloignés plus faibles se font retourner ns un premier temps: "Il est snob aspire visiblement à être connu La parure corporelle est vieille deux fillettes a les joues roses qui redescend, le visage noirci comme comme comme comme comme comme comme comme de+les frères jamais, en raison de+le une crêpe. a+le une chasse a+le renard le loup blanc. Et y Adam ou Eve et touche de+les hortensias que un charbon par l' Vergleiche (Elativ) • Italienisch • • • • • • • • • dove i sudamericani l'attendono nno, e cio+è da quando sono sorti con un nuovo partito, cresciuto E saltella instancabile Domenica era affranto e feroce, è un partito! Tranquillo lo urlava Berti Vogts, rosso turno viene neutralizzato, legato sua vita che rimarrà indelebile come come come come come come come come come il Messia. funghi negozi che prestan un fungo fuori dal+la un folletto, piglio da un fuoco beffardo ne+gli un corpo, come un un peperone. Mancavano un salame con fil di un sogno bellissimo ne+l Vergleiche (Elativ) • Spanisch • • • • • • es de ley en el cuerpo, se quieren y azules de un color intensi'simo, En efecto, hemos Ì sufrido de Gullit, la solucio'n vino co de acceso a+el Cercle atrai'dos El sen'or Joan Barril escribe como como como como como como hermanos. Uno de ellos cae de terciopelo. Para perros. Pero Indurain por arte de magia desde el Ulises por las sirenas, los a'ngeles, pero algunas