WikiLing - lemmaFull

AAAKöbler, Gerhard, Die Häufigkeit der zur Darstellung des Mittelhochdeutschen verwendeten Buchstaben

Köbler, Gerhard

Die Häufigkeit der zur Darstellung des Mittelhochdeutschen verwendeten Buchstaben

Das Mittelhochdeutsche ist die mittlere Sprachstufe des über das Germanische vom Indogermanischen abstammenden Hochdeutschen der Zeit von etwa 1070 bis ins Spätmittelalter (1350-1500). Ihm geht das aus dem südlichen Altfränkischen, aus dem Altalemannischen und aus dem Altbayerischen sowie dem Altthüringischen und wohl auch dem frühmittelalterlichen Langobardischen im Raum ungefähr zwischen Ruhr, Harz und den Alpen in den Jahren etwa zwischen 500 und 1070 bestehende Althochdeutsche voraus. Ihm folgt seit (dem Spätmittelalter oder) der Neuzeit das Neuhochdeutsche, das seit Martin Luther (1483-1546) das im Norden aus dem Altsächsischen und Mittelniederdeutschen erwachsende Neuniederdeutsche als Hochsprache verdrängt und die ebenfalls ältere Sprachstufen (Altniederfränkisch, Mittelniederländisch bzw. Altfriesisch) aufweisenden Sprachen Niederländisch und Friesisch auf Randgebiete einengt.

Das in Vereinfachung und Zusammenfassung der älteren germanistischen Wörterbücher des Mittelhochdeutschen vorgelegte mittelhochdeutsche Wörterbuch will den gesamten Wortschatz der mittelhochdeutschen Sprache aufgrund der bisherigen Literatur als einfache, streng alphabetisch geordnete Einheit erfassen. Hierfür setzt es eine auf der tatsächlichen Überlieferung aufbauende, Homonyme durch eingeklammerte Zahlenangaben individualisierende Hauptform jedes aufgrund seiner Bestandteile bestimmte Stichworts an, wie sie am ehesten der lautlichen Entwicklung vom Althochdeutschen zum Neuhochdeutschen entspricht. Hinzu kommen bei Bedarf durch die Quellen vermittelte oder dem Entwicklungsverständnis dienende Nebenformen, von deren durch das Alphabet festgelegen Stellung auf die Hauptform verwiesen wird.

Dem Stichwort folgen eine an sich überflüssige, aber wegen übergeordneter Zusammenhänge doch sinnvolle Sprachangabe (mhd.) und eine schlichte grammatische Bestimmung der Wortart (z. B. st. V., sw. M.). Danach werden dem heutigen Leser die Inhalte der Lemmata durch mehr oder weniger viele neuhochdeutsche Bedeutungsangaben verständlich gemacht, wobei an manchen Stellen auch eine jeweils in spitzen Klammern (»«) gesetzte Glied-für-Glied-Wiedergabe verwendet wird. Bei den modernen Verständnishilfen wird so gut wie möglich vom Anschaulichen zum Übertragenen vorwärts geschritten.

Gelegentlich lässt sich eine lateinische Vorlage eines mittelhochdeutschen Textes erkennen. In diesen Fällen sind lateinisch-mittelhochdeutsche Übersetzungsgleichungen feststellbar. Sie sind grundsätzlich in einer eigenen Rubrik (ÜG.:) verzeichnet.

Als nächstes legen Verweise und Hinweise binnensprachliche Zusammenhänge offen. Verweise (Vw.:) führen von Grundwörtern auf die mit ihnen gebildeten Zusammensetzungen und von Nebenformen auf Hauptformen. Hinweise (Hw.:) erschließen sonstige wahrscheinliche sprachliche Verbindungen oder Beziehungen.

Danach werden in grundsätzlich chronologischer Reihung die von der Literatur berücksichtigten literarischen Quellen in Form mehr oder weniger leicht auflösbarer Siglen verzeichnet, deren Zahl einen ersten verhältnismäßigen Rückschluss auf die Häufigkeit des Stichwortes im Mittelhochdeutschen ermöglicht. Stets wird dabei zur Erleichterung des Verständnisses die von der vorausgehenden Literatur angesetzte Normalform hinzugefügt. Die jeweils früheste Quelle wird mit einer Jahreszahl versehen, sodass das Wörterbuch erstmals für jedermann auf einen Blick das erste Auftreten eines mittehochdeutschen Wortes in der Überlieferung offen legt. Dabei werden zuerst die Quellen des Findebuchs in der Reihenfolge der dortigen Siglen verzeichnet. Im Anschluss daran sind weitere Siglen aus anderen Quellen in alphabetischer Reihenfolge verzeichnet, am Schluss stehen noch Angaben zu Vorkommen in Glossen und Urkunden.

Beeinflusst kann ein mittelhochdeutsches Wort von einer fremden Sprache sein. Als verschiedene Erscheinungsfälle werden dabei Fremdwort, Lehnwort, Lehnübersetzung, Lehnübertragung, Lehnschöpfung und Lehnbildung unterschieden. Nach Möglichkeit ist auf eine solche Interferenz (I.:) besonders hingewiesen.

Im weiteren Unterschied zu allen bisherigen mittelhochdeutschen Wörterbüchern werden systematisch Hinweise auf althochdeutsche Vorformen und Angaben zu sonstigen etymologischen Zusammenhängen (E.:) geboten. Dem folgen ebenfalls erstmals Aussagen zum Weiterleben (und negativ zum Untergang) im älteren (ält.) und gegenwärtigen Neuhochdeutschen (W.:), wobei im Einzelfall die Beschränkung auf das Frühneuhochdeutsche (1350-1650) hervorgehoben sein kann. Auf diese Weise wird erstmals die Einbettung des Mittelhochdeutschen in die Entwicklung vom Althochdeutschen zum Neuhochdeutschen umfassend in leicht verständlicher Art dargestellt.

Im Einzelfall werden mit dem jeweiligen Stichwort gebildete Redewendungen (R.:) aufgenommen, bei denen grundsätzlich die normalisierte Hauptform des Ansatzes verwendet wird. Am Schluss stehen Angaben zur verwerteten Literatur unter Einbeziehung der dortigen Normalformen, welche die Herkunft des Materials offenlegen. Dabei eröffnet das an dieser Stelle einbezogene Wörterbuch der mittelhochdeutschen Urkundensprache einen zusätzlichen Einblick in erste Nennung und Häufigkeit des jeweiligen Stichworts in den etwa 4000 von etwa 1200 bis 1300 verfassten, im Original der wissenschaftlichen Gegenwart überlieferten Urkunden der mittelhochdeutschen Wirklichkeit.

Über die bisherige Literatur hinaus will das Wörterbuch im Übrigen auch als zufällig angesehene Überlieferungslücken schließen. Deswegen entnimmt es beispielsweise den Zusammensetzungen auch die nicht einzeln belegten Grundwörter oder regelmäßig gebildeten Adverbien auch die ihnen zugrundeliegenden Adjektive. Dabei werden aus technischen Gründen die Zeichen *** für nicht belegte Wörter und * für (wahrscheinlich) nicht belegte Formen (am Ende des Ansatzes) verwendet.

In den 99363 erfassten Ansätzen und Verweisen sind 841903 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 8,4730 Zeichen. Zur Darstellung des Mittelhochdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Mittelhochdeutschen angepasst werden muss.

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als mittelhochdeutsche Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 66 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

Asc

Hex

Zeichen

Häufigkeit

28332

257

101

5402

230

6583

483

1000

228

22388

34728

100

18114

240

00F0

101

155617

235

00EB

275

113

2266

274

112

102

10281

103

27187

104

40319

105

46563

299

012B

12548

106

006A

1157

004A

107

006B

11710

004B

108

006C

44566

004C

109

006D

17575

004D

110

006E

77355

004E

111

006F

17581

004F

243

00F3

333

014D

3474

339

153

1020

339,772

153,0304

œ̄

246

00F6

1145

245

00F5

112

9536

113

305

114

66948

115

38283

116

49974

117

26648

363

016B

5349

252

00FC

8456

118

15622

119

17099

120

121

122

007A

17223

005A

Hieraus lassen sich folgende Häufigkeiten ermitteln:

Zeichen

Varianten

Häufigkeit

Prozent

a A ā æ ǣ ä

40427

4,80%

b B

22421

2,70%

c C

34736

4,10%

d D ð

18121

2,20%

e E ë ē Ē

157909

18,80%

f F

10289

1,20%

g G

27188

3,20%

h H

40323

4,80%

i I ī

59121

7,00%

j J

1159

0,10%

k K

11721

1,40%

l L

44573

5,30%

m M

17579

2,10%

n N

77363

9,20%

o O ó ō œ œ̄ ö õ

23231

2,80%

p P

9553

1,10%

305

0,00%

r R

66963

8,00%

s S

38318

4,60%

t T

50003

5,90%

u U ū ü

40456

4,80%

v V

15629

1,90%

w W

17114

2,00%

0,00%

122

0,00%

z Z

17225

2,00%

Summe

841898

100%

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:

e E ë ē Ē

157909

18,80%

n N

77363

9,20%

r R

66963

8,00%

i I ī

59121

7,00%

t T

50003

5,90%

l L

44573

5,30%

u U ū ü

40456

4,80%

a A ā æ ǣ ä

40427

4,80%

h H

40323

4,80%

s S

38318

4,60%

c C

34736

4,10%

g G

27188

3,20%

o O ó ō œ œ̄ ö õ

23231

2,80%

b B

22421

2,70%

d D ð

18121

2,20%

m M

17579

2,10%

z Z

17225

2,00%

w W

17114

2,00%

v V

15629

1,90%

k K

11721

1,40%

f F

10289

1,20%

p P

9553

1,10%

j J

1159

0,10%

305

0,00%

122

0,00%