AAAKöbler, Gerhard, Die Häufigkeit der zur Darstellung des Mittelhochdeutschen verwendeten Buchstaben
Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Mittelhochdeutschen verwendeten Buchstaben
Das Mittelhochdeutsche ist die mittlere Sprachstufe des über das Germanische vom Indogermanischen abstammenden Hochdeutschen der Zeit von etwa 1070 bis ins Spätmittelalter (1350-1500). Ihm geht das aus dem südlichen Altfränkischen, aus dem Altalemannischen und aus dem Altbayerischen sowie dem Altthüringischen und wohl auch dem frühmittelalterlichen Langobardischen im Raum ungefähr zwischen Ruhr, Harz und den Alpen in den Jahren etwa zwischen 500 und 1070 bestehende Althochdeutsche voraus. Ihm folgt seit (dem Spätmittelalter oder) der Neuzeit das Neuhochdeutsche, das seit Martin Luther (1483-1546) das im Norden aus dem Altsächsischen und Mittelniederdeutschen erwachsende Neuniederdeutsche als Hochsprache verdrängt und die ebenfalls ältere Sprachstufen (Altniederfränkisch, Mittelniederländisch bzw. Altfriesisch) aufweisenden Sprachen Niederländisch und Friesisch auf Randgebiete einengt.
Das in Vereinfachung und Zusammenfassung der älteren germanistischen Wörterbücher des Mittelhochdeutschen vorgelegte mittelhochdeutsche Wörterbuch will den gesamten Wortschatz der mittelhochdeutschen Sprache aufgrund der bisherigen Literatur als einfache, streng alphabetisch geordnete Einheit erfassen. Hierfür setzt es eine auf der tatsächlichen Überlieferung aufbauende, Homonyme durch eingeklammerte Zahlenangaben individualisierende Hauptform jedes aufgrund seiner Bestandteile bestimmte Stichworts an, wie sie am ehesten der lautlichen Entwicklung vom Althochdeutschen zum Neuhochdeutschen entspricht. Hinzu kommen bei Bedarf durch die Quellen vermittelte oder dem Entwicklungsverständnis dienende Nebenformen, von deren durch das Alphabet festgelegen Stellung auf die Hauptform verwiesen wird.
Dem Stichwort folgen eine an sich überflüssige, aber wegen übergeordneter Zusammenhänge doch sinnvolle Sprachangabe (mhd.) und eine schlichte grammatische Bestimmung der Wortart (z. B. st. V., sw. M.). Danach werden dem heutigen Leser die Inhalte der Lemmata durch mehr oder weniger viele neuhochdeutsche Bedeutungsangaben verständlich gemacht, wobei an manchen Stellen auch eine jeweils in spitzen Klammern (»«) gesetzte Glied-für-Glied-Wiedergabe verwendet wird. Bei den modernen Verständnishilfen wird so gut wie möglich vom Anschaulichen zum Übertragenen vorwärts geschritten.
Gelegentlich lässt sich eine lateinische Vorlage eines mittelhochdeutschen Textes erkennen. In diesen Fällen sind lateinisch-mittelhochdeutsche Übersetzungsgleichungen feststellbar. Sie sind grundsätzlich in einer eigenen Rubrik (ÜG.:) verzeichnet.
Als nächstes legen Verweise und Hinweise binnensprachliche Zusammenhänge offen. Verweise (Vw.:) führen von Grundwörtern auf die mit ihnen gebildeten Zusammensetzungen und von Nebenformen auf Hauptformen. Hinweise (Hw.:) erschließen sonstige wahrscheinliche sprachliche Verbindungen oder Beziehungen.
Danach werden in grundsätzlich chronologischer Reihung die von der Literatur berücksichtigten literarischen Quellen in Form mehr oder weniger leicht auflösbarer Siglen verzeichnet, deren Zahl einen ersten verhältnismäßigen Rückschluss auf die Häufigkeit des Stichwortes im Mittelhochdeutschen ermöglicht. Stets wird dabei zur Erleichterung des Verständnisses die von der vorausgehenden Literatur angesetzte Normalform hinzugefügt. Die jeweils früheste Quelle wird mit einer Jahreszahl versehen, sodass das Wörterbuch erstmals für jedermann auf einen Blick das erste Auftreten eines mittehochdeutschen Wortes in der Überlieferung offen legt. Dabei werden zuerst die Quellen des Findebuchs in der Reihenfolge der dortigen Siglen verzeichnet. Im Anschluss daran sind weitere Siglen aus anderen Quellen in alphabetischer Reihenfolge verzeichnet, am Schluss stehen noch Angaben zu Vorkommen in Glossen und Urkunden.
Beeinflusst kann ein mittelhochdeutsches Wort von einer fremden Sprache sein. Als verschiedene Erscheinungsfälle werden dabei Fremdwort, Lehnwort, Lehnübersetzung, Lehnübertragung, Lehnschöpfung und Lehnbildung unterschieden. Nach Möglichkeit ist auf eine solche Interferenz (I.:) besonders hingewiesen.
Im weiteren Unterschied zu allen bisherigen mittelhochdeutschen Wörterbüchern werden systematisch Hinweise auf althochdeutsche Vorformen und Angaben zu sonstigen etymologischen Zusammenhängen (E.:) geboten. Dem folgen ebenfalls erstmals Aussagen zum Weiterleben (und negativ zum Untergang) im älteren (ält.) und gegenwärtigen Neuhochdeutschen (W.:), wobei im Einzelfall die Beschränkung auf das Frühneuhochdeutsche (1350-1650) hervorgehoben sein kann. Auf diese Weise wird erstmals die Einbettung des Mittelhochdeutschen in die Entwicklung vom Althochdeutschen zum Neuhochdeutschen umfassend in leicht verständlicher Art dargestellt.
Im Einzelfall werden mit dem jeweiligen Stichwort gebildete Redewendungen (R.:) aufgenommen, bei denen grundsätzlich die normalisierte Hauptform des Ansatzes verwendet wird. Am Schluss stehen Angaben zur verwerteten Literatur unter Einbeziehung der dortigen Normalformen, welche die Herkunft des Materials offenlegen. Dabei eröffnet das an dieser Stelle einbezogene Wörterbuch der mittelhochdeutschen Urkundensprache einen zusätzlichen Einblick in erste Nennung und Häufigkeit des jeweiligen Stichworts in den etwa 4000 von etwa 1200 bis 1300 verfassten, im Original der wissenschaftlichen Gegenwart überlieferten Urkunden der mittelhochdeutschen Wirklichkeit.
Über die bisherige Literatur hinaus will das Wörterbuch im Übrigen auch als zufällig angesehene Überlieferungslücken schließen. Deswegen entnimmt es beispielsweise den Zusammensetzungen auch die nicht einzeln belegten Grundwörter oder regelmäßig gebildeten Adverbien auch die ihnen zugrundeliegenden Adjektive. Dabei werden aus technischen Gründen die Zeichen *** für nicht belegte Wörter und * für (wahrscheinlich) nicht belegte Formen (am Ende des Ansatzes) verwendet.
In den 99363 erfassten Ansätzen und Verweisen sind 841903 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 8,4730 Zeichen. Zur Darstellung des Mittelhochdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Mittelhochdeutschen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als mittelhochdeutsche Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 66 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc
Hex
Zeichen
Häufigkeit
97
61
a
28332
65
41
A
28
257
101
ā
5402
230
0
æ
6583
483
1000
ǣ
5
228
0
ä
77
98
62
b
22388
66
42
B
33
99
63
c
34728
67
43
C
8
100
64
d
18114
68
44
D
1
240
00F0
ð
6
101
65
e
155617
69
45
E
11
235
00EB
ë
13
275
113
ē
2266
274
112
Ē
2
102
66
f
10281
70
46
F
8
103
67
g
27187
71
47
G
1
104
68
h
40319
72
48
H
4
105
69
i
46563
73
49
I
10
299
012B
ī
12548
106
006A
j
1157
74
004A
J
2
107
006B
k
11710
75
004B
K
11
108
006C
l
44566
76
004C
L
7
109
006D
m
17575
77
004D
M
4
110
006E
n
77355
78
004E
N
8
111
006F
o
17581
79
004F
O
1
243
00F3
ó
1
333
014D
ō
3474
339
153
œ
1020
339,772
153,0304
œ̄
5
246
00F6
ö
1145
245
00F5
õ
4
112
70
p
9536
80
50
P
17
113
71
q
305
114
72
r
66948
82
52
R
15
115
73
s
38283
83
53
S
35
116
74
t
49974
84
54
T
29
117
75
u
26648
85
55
U
3
363
016B
ū
5349
252
00FC
ü
8456
118
76
v
15622
86
56
V
7
119
77
w
17099
87
57
W
15
120
78
x
49
121
79
y
122
122
007A
z
17223
90
005A
Z
2
Hieraus lassen sich folgende Häufigkeiten ermitteln:
Zeichen
Varianten
Häufigkeit
Prozent
A
a A ā æ ǣ ä
40427
4,80%
B
b B
22421
2,70%
C
c C
34736
4,10%
D
d D ð
18121
2,20%
E
e E ë ē Ē
157909
18,80%
F
f F
10289
1,20%
G
g G
27188
3,20%
H
h H
40323
4,80%
I
i I ī
59121
7,00%
J
j J
1159
0,10%
K
k K
11721
1,40%
L
l L
44573
5,30%
M
m M
17579
2,10%
N
n N
77363
9,20%
O
o O ó ō œ œ̄ ö õ
23231
2,80%
P
p P
9553
1,10%
Q
q
305
0,00%
R
r R
66963
8,00%
S
s S
38318
4,60%
T
t T
50003
5,90%
U
u U ū ü
40456
4,80%
V
v V
15629
1,90%
W
w W
17114
2,00%
X
x
49
0,00%
Y
y
122
0,00%
Z
z Z
17225
2,00%
Summe
841898
100%
Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
E
e E ë ē Ē
157909
18,80%
N
n N
77363
9,20%
R
r R
66963
8,00%
I
i I ī
59121
7,00%
T
t T
50003
5,90%
L
l L
44573
5,30%
U
u U ū ü
40456
4,80%
A
a A ā æ ǣ ä
40427
4,80%
H
h H
40323
4,80%
S
s S
38318
4,60%
C
c C
34736
4,10%
G
g G
27188
3,20%
O
o O ó ō œ œ̄ ö õ
23231
2,80%
B
b B
22421
2,70%
D
d D ð
18121
2,20%
M
m M
17579
2,10%
Z
z Z
17225
2,00%
W
w W
17114
2,00%
V
v V
15629
1,90%
K
k K
11721
1,40%
F
f F
10289
1,20%
P
p P
9553
1,10%
J
j J
1159
0,10%
Q
q
305
0,00%
Y
y
122
0,00%
X
x
49
0,00%