Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Althochdeutschen verwendeten Buchstaben
Das seit Jakob
Grimm (1819) so bezeichnete Althochdeutsche ist die älteste Sprachstufe der
hochdeutschen Sprache. Diese unterscheidet sich vom durch Rekonstruktion
gewonnenen Germanischen durch die vielleicht schon im 6. Jahrhundert
(Personenname Idorih auf der Lanzenspitze von Wurmlingen) einsetzende, aber
erst ab 750 besser belegte althochdeutsche Lautverschiebung (Verschiebung von
p, t, k zu Doppelspiranten [ff, zz, hh] oder Affrikaten [pf/ph, z/tz,
altoberdeutsch kh/ch] und von đ, ƀ,
ǥ zu t, b, g). Gegenüber dem um 1070 einsetzenden Mittelhochdeutschen, der
zweitältesten Sprachstufe der hochdeutschen Sprache, ist das Althochdeutsche
durch die vollen Vokale der nicht hochbetonten Silben gekennzeichnet, die im
Mittelhochdeutschen zu e oder i abgeschwächt sind.
Räumlich grenzt das
Althochdeutsche im Norden an das Altsächsische, zu dem noch Essen, Werden, das
Rothaargebirge und der Südharz gehören, und im Nordwesten an das
Altniederfränkische. Über die Westgrenze des geschlossenen althochdeutschen
Sprachgebietes lässt sich keine Sicherheit gewinnen. Im Osten (Thüringen)
fehlen umfangreiche Zeugnisse. Im Süden weist noch das Langobardische
althochdeutsche Züge auf.
Das Althochdeutsche
ist - abgesehen von den bloßen Nennungen althochdeutscher Personennamen und
Ortsnamen - durch rund 1200 Handschriften, in denen sich althochdeutsche
Elemente sehr verschiedenen Umfangs finden, überliefert. Die wichtigsten
althochdeutschen Schreiborte sind dabei in Bayern Salzburg, Mondsee, Passau,
Regensburg, Tegernsee und Freising, in Alemannien St. Gallen, Reichenau und
Murbach sowie im fränkischen Gebiet Weißenburg, Lorsch, Mainz, Frankfurt, Würzburg,
Bamberg, Fulda, Trier, Echternach und Aachen. Allerdings sind auch von
wichtigen Sprachdenkmälern die Entstehungsorte wie die Schreiborte nicht
bekannt und müssen neben den genannten Schreiborten weitere, nicht sicher
identifizierbare angenommen werden. Außerdem stammen die Schreiber eines
Schreiborts vielfach aus anderssprachigen Gebieten.
Zur Aufzeichnung
wird das lateinische Alphabet verwendet. Die lateinischen Schriftzeichen
ermöglichen nur eine unvollkommene Wiedergabe des althochdeutschen Lautsystems.
Zusätzliche Zeichen wurden gleichwohl für das Althochdeutsche nicht entwickelt.
Am nächsten
verwandt ist das Althochdeutsche mit dem Altniederdeutschen (Altsächsischen und
Altniederfränkischen). Mit diesem und dem Altfriesischen sowie dem Altenglischen
hat es viele Spracherscheinungen gemeinsam (Konsonantengemination, Bildung der
zweiten Person Singular Praeteriti der starken Verben, Suffixe -heit, -schaft,
-tum, Wortschatzübereinstimmungen). Von daher ist es im Gegensatz zum
ostgermanischen Gotischen und zum nordgermanischen Altnordischen dem sog.
Westgermanischen zuzurechnen.
In sich ist das
Althochdeutsche nicht einheitlich, so dass von althochdeutsch nur im Sinne
einer wissenschaftlichen Zusammenfassung verschiedener Einzelmundarten gesprochen
werden kann. Zu unterscheiden sind vor allem das altmitteldeutsche
Altfränkische und die altoberdeutschen Mundarten des Altbayerischen und
Altalemannischen (sowie das Thüringische und Langobardische). Das Altfränkische
lässt sich dabei weiter in Altsüdrheinfränkisch (Weißenburg), Altrheinfränkisch
(Mainz, Lorsch, Frankfurt, Fulda [seit 10. Jh.]), Altostfränkisch (Würzburg,
Bamberg, Fulda [bis 10. Jh.]) und Altmittelfränkisch (Trier, Echternach usw.)
(sowie das altniederdeutsche Altniederfränkische) gliedern.
Für
wissenschaftliche Zwecke wird das Althochdeutsche in seinen Ansätzen in der
Regel auf den Lautstand des in Fulda um 830 durch Übersetzung geschaffenen
althochdeutschen Tatian normalisiert. Dadurch werden zwar sowohl räumliche
Verschiedenheiten sowohl wie auch zeitliche Entwicklungen künstlich
vernachlässigt. Andererseits wird dadurch aber so viel praktische Übersicht
gewonnen, dass deswegen auch hier normalisiert wird.
Ediert sind die
althochdeutschen Quellen in unterschiedlichen Publikationen. Hervorzuheben sind
dabei vor allem die Ausgaben der umfassenderen Texte (Notker, Otfrid, Tatian,
Isidor, Mondseer Fragmente, Murbacher Hymnen), der kleineren Sprachdenkmäler
(Steinmeyer 1916, Köbler 1986), der Glossen (Steinmeyer/Sievers) und
zahlreicher einzelner Glossennachträge (zusammenfassend Köbler 1993) sowie die
Ausgaben der lateinischen frühmittelalterlichen Texte bzw. Handschriften.
In den 40794 erfassten Ansätzen und Verweisen
sind 315137 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche
Ansatzlänge von 7,7251 Zeichen. Zur Darstellung des Althochdeutschen ist
grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen
verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des
Althochdeutschen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des
lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s,
t, u, v, x, y, z). Hinzu kommen als althochdeutsche Zusatzzeichen gegenüber dem
Lateinischen j und w.
Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon
von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich
habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben
vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger
freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 55 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
29279 |
65 |
41 |
A |
15 |
257 |
101 |
ā |
3727 |
230 |
0 |
æ |
1 |
98 |
62 |
b |
8365 |
66 |
42 |
B |
28 |
99 |
63 |
c |
568 |
67 |
43 |
C |
3 |
100 |
64 |
d |
7044 |
68 |
44 |
D |
7 |
101 |
65 |
e |
17344 |
69 |
45 |
E |
7 |
275 |
113 |
ē |
1709 |
102 |
66 |
f |
8591 |
70 |
46 |
F |
17 |
103 |
67 |
g |
14301 |
71 |
47 |
G |
8 |
104 |
68 |
h |
14091 |
72 |
48 |
H |
8 |
105 |
69 |
i |
31395 |
73 |
49 |
I |
3 |
299 |
012B |
ī |
8723 |
106 |
006A |
j |
271 |
74 |
004A |
J |
6 |
107 |
006B |
k |
7527 |
75 |
004B |
K |
13 |
108 |
006C |
l |
16453 |
76 |
004C |
L |
14 |
109 |
006D |
m |
7555 |
77 |
004D |
M |
7 |
110 |
006E |
n |
29333 |
78 |
004E |
N |
3 |
111 |
006F |
o |
12877 |
79 |
004F |
O |
2 |
333 |
014D |
ō |
4789 |
112 |
70 |
p |
2331 |
80 |
50 |
P |
7 |
113 |
71 |
q |
7 |
114 |
72 |
r |
22437 |
82 |
52 |
R |
21 |
115 |
73 |
s |
15937 |
83 |
53 |
S |
35 |
116 |
74 |
t |
18310 |
84 |
54 |
T |
19 |
117 |
75 |
u |
14735 |
85 |
55 |
U |
5 |
363 |
016B |
ū |
1834 |
118 |
76 |
v |
178 |
86 |
56 |
V |
2 |
119 |
77 |
w |
7700 |
87 |
57 |
W |
23 |
120 |
78 |
x |
10 |
121 |
79 |
y |
13 |
122 |
007A |
z |
7474 |
90 |
005A |
Z |
1 |
|
|
|
|
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā æ |
33022 |
10,50% |
B |
b B |
8393 |
2,70% |
C |
c C |
571 |
0,20% |
D |
d D |
7051 |
2,20% |
E |
e E ē |
19060 |
6,00% |
F |
f F |
8608 |
2,70% |
G |
g G |
14309 |
4,50% |
H |
h H |
14099 |
4,50% |
I |
i I ī |
40121 |
12,70% |
J |
j J |
277 |
0,10% |
K |
k K |
7540 |
2,40% |
L |
l L |
16467 |
5,20% |
M |
m M |
7562 |
2,40% |
N |
n N |
29336 |
9,30% |
O |
o O ō |
17668 |
5,60% |
P |
p P |
2338 |
0,70% |
Q |
q |
7 |
0,00% |
R |
r R |
22458 |
7,10% |
S |
s S |
15972 |
5,10% |
T |
t T |
18329 |
5,80% |
U |
u U ū |
16574 |
5,30% |
V |
v V |
180 |
0,10% |
W |
w W |
7723 |
2,50% |
X |
x |
10 |
0,00% |
Y |
y |
13 |
0,00% |
Z |
z Z |
7475 |
2,40% |
Summe |
315164 |
100% |
Ordnet
man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
I |
i I ī |
40121 |
12,70% |
A |
a A ā æ |
33022 |
10,50% |
N |
n N |
29336 |
9,30% |
R |
r R |
22458 |
7,10% |
E |
e E ē |
19060 |
6,00% |
T |
t T |
18329 |
5,80% |
O |
o O ō |
17668 |
5,60% |
U |
u U ū |
16574 |
5,30% |
L |
l L |
16467 |
5,20% |
S |
s S |
15972 |
5,10% |
G |
g G |
14309 |
4,50% |
H |
h H |
14099 |
4,50% |
F |
f F |
8608 |
2,70% |
B |
b B |
8393 |
2,70% |
W |
w W |
7723 |
2,50% |
M |
m M |
7562 |
2,40% |
K |
k K |
7540 |
2,40% |
Z |
z Z |
7475 |
2,40% |
D |
d D |
7051 |
2,20% |
P |
p P |
2338 |
0,70% |
C |
c C |
571 |
0,20% |
J |
j J |
277 |
0,10% |
V |
v V |
180 |
0,10% |
Y |
y |
13 |
0,00% |
X |
x |
10 |
0,00% |
Q |
q |
7 |
0,00% |