Köbler, Gerhard
Die Häufigkeit der zur
Darstellung des Mittelniederdeutschen verwendeten Buchstaben
Das
Mittelniederdeutsche (German Middle Low ISO 639-3 gml) ist die dem vom 9. bis zum
12. Jahrhundert bezeugten Altsächsischen (sowie in gewisser Weise auch dem
Altniederfränkischen zeitlich) ab etwa 1200 nachfolgende mittlere Sprachstufe
des Niederdeutschen im Raum etwa zwischen den deutschen Mittelgebirgen
(ich/ik-Linie an Ruhr und Harz) und der Nordsee und Ostsee bzw. den
skandinavischen und slawischen Sprachen, die zeitlich dem im Wesentlichen nur
mündlich lebenden Neuniederdeutschen bis in das 17. Jahrhundert vorausgeht. Es
unterscheidet sich vom etwa gleichzeitigen Mittelhochdeutschen vor allem durch
das Fehlen der Verschiebung von p, t und k sowie durch das Fehlen der
Diphthongierung langer Vokale (e/ei). Gegen 1600 wird es mit dem Niedergang der
Hanse vom Neuhochdeutschen als Schreibsprache verdrängt. Wichtige schriftlich
überlieferte Denkmäler sind Eike von Repgows Sachsenspiegel (um 1221-1224), die
Sächsische Weltchronik (13. Jh.), das Berliner Stadtbuch (Ende 14. Jh.),
Hermann Körners Chronica novella (ab 1416), das Redentiner Osterspiel (1464),
die bei Steffen Arndes in Lübeck 1494 gedruckte niederdeutsche Bibel, das von
Hans van Ghetelen in Lübeck 1498 gedruckte Tierepos Reynke de vos (Reineke
Fuchs), die Lübecker Bibel (Bugenhagenbibel von 1533/1534), Johannes Strickers
geistliches Drama De düdesche Schlörner (1584), Schriften Nikolaus (Nicolaus)
Gryses (1543-1614), Tönnies Fönnes Handbuch der russischen Sprache (1607) sowie
seit dem 13. Jahrhundert in allmählich steigender Zahl überlieferte Urkunden.
Die wichtigsten Wörterbücher des Mittelniederdeutschen sind Schiller/Lübben (1875ff.),
Lübben(/Walther) (1888, digitalisiert von Heiko Evermann 2008 und von Gerhard
Köbler) und Mittelniederdeutsches Handwörterbuch (Bd. 1ff. 1928ff., 2010
einschließlich f/v bis telderen erschienen, mehr als 1,2 Millionen Belege,
ungefähre Verdreifachung gegenüber Schiller/Lübben und Lübben/Walther,
geplanter Abschluss 2020).
Auf dieser Grundlage
habe ich zwecks Schließung einer bisherigen Lücke in Parallele zu einem
indogermanischen Wörterbuch (2006), einem germanischen Wörterbuch (2007),
(einem altgriechischen Wörterbuch, einem lateinischen Abkunfts- und
Wirkungswörterbuch,) einem gotischen Wörterbuch, einem altnordischen
Wörterbuch, einem altenglischen Wörterbuch, einem altfriesischen Wörterbuch,
einem altniederfränkischen Wörterbuch, einem altsächsischen Wörterbuch, einem
althochdeutschen Wörterbuch (1993) und einem mittelhochdeutschen Wörterbuch
(2007), ein möglichst vollständiges einfaches mittelniederdeutsches Wörterbuch
versucht, das für jedermann überall jederzeit unentgeltlich im Internet
zugänglich ist. Es umfasst (in seinem Zustand vom Jahresende 2013
einschließlich der erschlossenen, vermutlich nur zufällig nicht überlieferten
Wörter) rund 106221 Ansätze und Verweise, die strikt alphabetisch entsprechend
der angesetzten Schreibweise geordnet sind (knapp 80000 Ansätze, gut 25000
Verweise, insgesamt etwa 5400 DIN A4-Seiten). Es gliedert sich in Ansatz
(normalisierte Hauptform und Nebenformen), Sprachangabe (mnd.), grammatische
Bestimmung, neuhochdeutsche Bedeutungsangabe (»…« bei bloßen der
Verständnishilfe dienenden Lehnübersetzungen), Verweise (von Grundwörtern auf
Komposita und von Nebenformen auf Hauptformen), (sonstige) Hinweise, Quelle
(Angabe des Erstbelegs leider entsprechend den Vorlagen bisher nicht
vollständig möglich), Interferenzen (Lehnwort, Lehnübersetzung,
Lehnübertragung, Lehnschöpfung, Lehnbedeutung), Etymologie, Redewendung(en),
Literatur und Sonstiges.
In den 106221
erfassten Ansätzen und Verweisen sind 933151 Zeichen enthalten. Daraus
errechnet sich eine durchschnittliche Ansatzlänge von 8,7850 Zeichen. Zur
Darstellung des Mittelniederdeutschen ist grundsätzlich das Buchstabensystem
(Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten
Hinsichten auf Besonderheiten des Mittelniederdeutschen angepasst werden muss.
Ausgangspunkt sind
also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k,
l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als mittelhochdeutsche
Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26
Zeichen.
Die Häufigkeit ihrer
Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache
besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine
besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines
von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms
selbst ermittelt.
Dieses gelangt unter
der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung
aller 26 Buchstaben (z. B. a, b, c, d usw.) und 83 Buchstabenvarianten (z. B.
a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
26908 |
65 |
41 |
A |
32 |
225 |
0 |
á |
7 |
257,774 |
101,0306 |
ā̆ |
33 |
257 |
101 |
ā |
16315 |
226 |
0 |
â |
11 |
230 |
0 |
æ |
6604 |
228 |
0 |
ä |
5 |
229 |
0 |
å |
1 |
98 |
62 |
b |
19692 |
66 |
42 |
B |
44 |
99 |
63 |
c |
32063 |
67 |
43 |
C |
7 |
231 |
0 |
ç |
1 |
100 |
64 |
d |
31295 |
68 |
44 |
D |
46 |
101 |
65 |
e |
140803 |
69 |
45 |
E |
30 |
233 |
0 |
é |
14 |
275,774 |
113,0306 |
ē̆ |
76 |
275 |
113 |
ē |
28629 |
234 |
00EA |
ê |
13 |
102 |
66 |
f |
7958 |
70 |
46 |
F |
23 |
103 |
67 |
g |
29284 |
71 |
47 |
G |
46 |
104 |
68 |
h |
40094 |
72 |
48 |
H |
48 |
105 |
69 |
i |
37700 |
73 |
49 |
I |
12 |
299 |
012B |
ī |
13708 |
298 |
012A |
Ī |
1 |
238 |
00EE |
î |
18 |
106 |
006A |
j |
1013 |
74 |
004A |
J |
20 |
107 |
006B |
k |
31132 |
75 |
004B |
K |
30 |
108 |
006C |
l |
48304 |
76 |
004C |
L |
25 |
109 |
006D |
m |
20075 |
77 |
004D |
M |
35 |
110 |
006E |
n |
78551 |
78 |
004E |
N |
24 |
111 |
006F |
o |
13949 |
79 |
004F |
O |
12 |
243 |
00F3 |
ó |
2 |
333,774 |
014D,0306 |
ō̆ |
25 |
333 |
014D |
ō |
15613 |
332 |
014C |
Ō |
2 |
244 |
00F4 |
ô |
3 |
212 |
00D4 |
Ô |
1 |
246 |
00F6 |
ö |
5357 |
214 |
00D6 |
Ö |
2 |
555 |
022B |
ȫ |
9387 |
111,868 |
006F,0364 |
oͤ |
3 |
112 |
70 |
p |
19075 |
80 |
50 |
P |
98 |
113 |
71 |
q |
680 |
81 |
51 |
Q |
2 |
114 |
72 |
r |
77052 |
82 |
52 |
R |
50 |
115 |
73 |
s |
55804 |
223 |
00DF |
ß |
24 |
83 |
53 |
S |
39 |
116 |
74 |
t |
60041 |
84 |
54 |
T |
14 |
117 |
75 |
u |
10601 |
363 |
016B |
ū |
5362 |
251 |
00FB |
û |
2 |
252 |
00FC |
ü |
4207 |
470 |
01D6 |
ǖ |
2828 |
117,868 |
75,0364 |
uͤ |
1 |
367 |
016F |
ů |
44 |
117,815 |
0075,032F |
u̯ |
1 |
118 |
76 |
v |
25047 |
86 |
56 |
V |
45 |
119 |
77 |
w |
14425 |
87 |
57 |
W |
16 |
120 |
78 |
x |
173 |
121 |
79 |
y |
1129 |
89 |
59 |
Y |
2 |
122 |
007A |
z |
1160 |
90 |
005A |
Z |
4 |
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A á ā̆ ā â æ ä å |
49916 |
5,30% |
B |
b B |
19736 |
2,10% |
C |
c C ç |
32071 |
3,40% |
D |
d D |
31341 |
3,40% |
E |
e E é ē̆ ē ê |
169565 |
18,20% |
F |
f F |
7981 |
0,90% |
G |
g G |
29330 |
3,10% |
H |
h H |
40142 |
4,30% |
I |
i I ī Ī î |
51439 |
5,50% |
J |
j J |
1033 |
0,10% |
K |
k K |
31162 |
3,30% |
L |
l L |
48329 |
5,20% |
M |
m M |
20110 |
2,20% |
N |
n N |
78575 |
8,40% |
O |
o O ó ō̆ ō Ō ô Ô ö Ö ȫ oͤ |
44356 |
4,80% |
P |
p P |
19173 |
2,10% |
Q |
q Q |
682 |
0,10% |
R |
r R |
77102 |
8,30% |
S |
s ß S |
55867 |
6,00% |
T |
t T |
60055 |
6,40% |
U |
u ū û ü ǖ uͤ ů |
23045 |
2,50% |
V |
u̯ v V |
25093 |
2,70% |
W |
w W |
14441 |
1,50% |
X |
x |
173 |
0,00% |
Y |
y Y |
1131 |
0,10% |
Z |
z Z |
1164 |
0,10% |
Summe |
933012 |
100% |
|
Ordnet man die Buchstaben nach ihren Häufigkeiten, so
entsteht folgende Reihung:
E |
e E é ē̆ ē ê |
169565 |
18,20% |
N |
n N |
78575 |
8,40% |
R |
r R |
77102 |
8,30% |
T |
t T |
60055 |
6,40% |
S |
s ß S |
55867 |
6,00% |
I |
i I ī Ī î |
51439 |
5,50% |
A |
a A á ā̆ ā â æ ä å |
49916 |
5,30% |
L |
l L |
48329 |
5,20% |
O |
o O ó ō̆ ō Ō ô Ô ö Ö ȫ oͤ |
44356 |
4,80% |
H |
h H |
40142 |
4,30% |
C |
c C ç |
32071 |
3,40% |
D |
d D |
31341 |
3,40% |
K |
k K |
31162 |
3,30% |
G |
g G |
29330 |
3,10% |
V |
u̯ v V |
25093 |
2,70% |
U |
u ū û ü ǖ uͤ ů |
23045 |
2,50% |
M |
m M |
20110 |
2,20% |
B |
b B |
19736 |
2,10% |
P |
p P |
19173 |
2,10% |
W |
w W |
14441 |
1,50% |
F |
f F |
7981 |
0,90% |
Z |
z Z |
1164 |
0,10% |
Y |
y Y |
1131 |
0,10% |
J |
j J |
1033 |
0,10% |
Q |
q Q |
682 |
0,10% |
X |
x |
173 |
0,00% |