Das Kefk Network Wiki befindet sich im Testbetrieb.


Gesetz der Verteilung von Satzlängen

Aus Kefk.

Wechseln zu: Navigation, Suche

Ein besonders einfaches Kriterium für Satzkomplexität ist die Länge der Sätze. Die Länge eines Satzes kann verschieden definiert werden: als die Zahl der Buchstaben, Silben, Wörter, Teilsätze usw. Untersucht man nun für Texte, wie häufig Sätze verschiedener Länge in ihnen vorkommen, so kann man feststellen, dass sie von einem Sprachgesetz gesteuert sind. Es handelt sich im Prinzip um das gleiche Sprachgesetz, das auch die Häufigkeitsverteilung der Wortlängen betrifft (Gesetz der Verteilung von Wortlängen; Theorie: Wimmer u.a. [1]).

Bestimmt man die Satzlänge nach der Zahl der Teilsätze (clauses) je Satz, so kann bei rund 500 deutschen Texten die Hyperpoisson-Verteilung als gutes Modell angesehen werden. Bei anderen Kriterien für die Satzlänge, in anderen Sprachen, bei anderen Textsorten etc. sind oft auch andere Modelle geeigneter. Die Untersuchungen zu Satzlängen unterstützen bisher die von der Quantitativen Linguistik vertretene Hypothese, dass Sprachsystem und -verwendung sich gemäß bestimmten, theoretisch begründbaren Sprachgesetzen verhalten.

Bestimmt man dagegen die Länge syntaktischer Konstruktionen nach der Zahl ihrer Endknoten, so folgen diese ebenfalls Gesetzen. [2]

Man kann statt der Länge der Sätze auch die Satztiefe als Komplexitätsmaß wählen. Die Satztiefe lässt sich z.B. durch die Menge der Regeln definieren, die in einer generativen Syntax benötigt werden, um einen Satz zu erzeugen; äquivalent: Zahl der Knoten in einem Baumgraphen für einen solchen Satz. Auch in diesem Fall gelten entsprechende Verteilungsgesetze. [3]

Siehe auch Gesetz der Verteilung von Morphlängen und die anderen Gesetze in Quantitative Linguistik.

Literatur

  • Gabriel Altmann: Verteilungen der Satzlängen. In: Klaus-Peter Schulz (ed.): Glottometrika 9. Brockmeyer, Bochum 1988, S. 147-169.
  • Gabriel Altmann: Wiederholungen in Texten. Brockmeyer, Bochum 1988. ISBN 3-88339-663-X
  • Karl-Heinz Best: Satzlängen im Deutschen: Verteilungen, Mittelwerte, Sprachwandel. In: Göttinger Beiträge zur Sprachwissenschaft 7, 2001, 7-31.
  • Karl-Heinz Best: Satzlänge. In: Reinhard Köhler, Gabriel Altmann, & Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ N.Y. 2005, S. 298-304. ISBN 3-11-015578-8
  • Emmerich Kelih: Untersuchungen zur Satzlänge in russischen und slowenischen Prosatexten. Band 1 & Band 2. Diplomarbeit, Graz 2002.
  • Emmerich Kelih, Peter Grzybek: Satzlängen: Definitionen, Häufigkeiten, Modelle. In: A. Mehler (Ed.): Quantitative Methoden in Computerlinguistik und Sprachtechnologie. [= Special Issue of: LDV-Forum. Zeitschrift für Computerlinguistik und Sprachtechnologie // Journal for Computational Linguistics and Language Technology]

Einzelnachweise

  1. Gejza Wimmer, Gabriel Altmann: The Theory of Word Length Distribution: Some Results and Generalizations. In: Peter Schmidt (Hrsg.): Glottometrika 15. Wissenschaftlicher Verlag Trier, Trier 1996, S. 112-133; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Towards a Theory of Word Length Distribution. In: Journal of Quantitative Linguistics 1, 1994, 98-106; http://www.uni-trier.de/uni/fb2/ldv/lql_wiki/index.php/Sentence_and_clause_length
  2. http://www.uni-trier.de/uni/fb2/ldv/lql_wiki/index.php/Length_of_syntactic_constructions
  3. http://www.uni-trier.de/uni/fb2/ldv/lql_wiki/index.php/Depth_of_syntactic_constructions

Weblinks

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Gesetz_der_Verteilung_von_Satzl%C3%A4ngen, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge