AAAKöbler, Gerhard, Die Häufigkeit der zur Darstellung des Althochdeutschen verwendeten Buchstaben
Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Althochdeutschen verwendeten Buchstaben
Das seit Jakob Grimm (1819) so bezeichnete Althochdeutsche ist die älteste Sprachstufe der hochdeutschen Sprache. Diese unterscheidet sich vom durch Rekonstruktion gewonnenen Germanischen durch die vielleicht schon im 6. Jahrhundert (Personenname Idorih auf der Lanzenspitze von Wurmlingen) einsetzende, aber erst ab 750 besser belegte althochdeutsche Lautverschiebung (Verschiebung von p, t, k zu Doppelspiranten [ff, zz, hh] oder Affrikaten [pf/ph, z/tz, altoberdeutsch kh/ch] und von đ, ƀ, ǥ zu t, b, g). Gegenüber dem um 1070 einsetzenden Mittelhochdeutschen, der zweitältesten Sprachstufe der hochdeutschen Sprache, ist das Althochdeutsche durch die vollen Vokale der nicht hochbetonten Silben gekennzeichnet, die im Mittelhochdeutschen zu e oder i abgeschwächt sind.
Räumlich grenzt das Althochdeutsche im Norden an das Altsächsische, zu dem noch Essen, Werden, das Rothaargebirge und der Südharz gehören, und im Nordwesten an das Altniederfränkische. Über die Westgrenze des geschlossenen althochdeutschen Sprachgebietes lässt sich keine Sicherheit gewinnen. Im Osten (Thüringen) fehlen umfangreiche Zeugnisse. Im Süden weist noch das Langobardische althochdeutsche Züge auf.
Das Althochdeutsche ist - abgesehen von den bloßen Nennungen althochdeutscher Personennamen und Ortsnamen - durch rund 1200 Handschriften, in denen sich althochdeutsche Elemente sehr verschiedenen Umfangs finden, überliefert. Die wichtigsten althochdeutschen Schreiborte sind dabei in Bayern Salzburg, Mondsee, Passau, Regensburg, Tegernsee und Freising, in Alemannien St. Gallen, Reichenau und Murbach sowie im fränkischen Gebiet Weißenburg, Lorsch, Mainz, Frankfurt, Würzburg, Bamberg, Fulda, Trier, Echternach und Aachen. Allerdings sind auch von wichtigen Sprachdenkmälern die Entstehungsorte wie die Schreiborte nicht bekannt und müssen neben den genannten Schreiborten weitere, nicht sicher identifizierbare angenommen werden. Außerdem stammen die Schreiber eines Schreiborts vielfach aus anderssprachigen Gebieten.
Zur Aufzeichnung wird das lateinische Alphabet verwendet. Die lateinischen Schriftzeichen ermöglichen nur eine unvollkommene Wiedergabe des althochdeutschen Lautsystems. Zusätzliche Zeichen wurden gleichwohl für das Althochdeutsche nicht entwickelt.
Am nächsten verwandt ist das Althochdeutsche mit dem Altniederdeutschen (Altsächsischen und Altniederfränkischen). Mit diesem und dem Altfriesischen sowie dem Altenglischen hat es viele Spracherscheinungen gemeinsam (Konsonantengemination, Bildung der zweiten Person Singular Praeteriti der starken Verben, Suffixe -heit, -schaft, -tum, Wortschatzübereinstimmungen). Von daher ist es im Gegensatz zum ostgermanischen Gotischen und zum nordgermanischen Altnordischen dem sog. Westgermanischen zuzurechnen.
In sich ist das Althochdeutsche nicht einheitlich, so dass von althochdeutsch nur im Sinne einer wissenschaftlichen Zusammenfassung verschiedener Einzelmundarten gesprochen werden kann. Zu unterscheiden sind vor allem das altmitteldeutsche Altfränkische und die altoberdeutschen Mundarten des Altbayerischen und Altalemannischen (sowie das Thüringische und Langobardische). Das Altfränkische lässt sich dabei weiter in Altsüdrheinfränkisch (Weißenburg), Altrheinfränkisch (Mainz, Lorsch, Frankfurt, Fulda [seit 10. Jh.]), Altostfränkisch (Würzburg, Bamberg, Fulda [bis 10. Jh.]) und Altmittelfränkisch (Trier, Echternach usw.) (sowie das altniederdeutsche Altniederfränkische) gliedern.
Für wissenschaftliche Zwecke wird das Althochdeutsche in seinen Ansätzen in der Regel auf den Lautstand des in Fulda um 830 durch Übersetzung geschaffenen althochdeutschen Tatian normalisiert. Dadurch werden zwar sowohl räumliche Verschiedenheiten sowohl wie auch zeitliche Entwicklungen künstlich vernachlässigt. Andererseits wird dadurch aber so viel praktische Übersicht gewonnen, dass deswegen auch hier normalisiert wird.
Ediert sind die althochdeutschen Quellen in unterschiedlichen Publikationen. Hervorzuheben sind dabei vor allem die Ausgaben der umfassenderen Texte (Notker, Otfrid, Tatian, Isidor, Mondseer Fragmente, Murbacher Hymnen), der kleineren Sprachdenkmäler (Steinmeyer 1916, Köbler 1986), der Glossen (Steinmeyer/Sievers) und zahlreicher einzelner Glossennachträge (zusammenfassend Köbler 1993) sowie die Ausgaben der lateinischen frühmittelalterlichen Texte bzw. Handschriften.
In den 40794 erfassten Ansätzen und Verweisen sind 315137 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 7,7251 Zeichen. Zur Darstellung des Althochdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Althochdeutschen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als althochdeutsche Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 55 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc
Hex
Zeichen
Häufigkeit
97
61
a
29279
65
41
A
15
257
101
ā
3727
230
0
æ
1
98
62
b
8365
66
42
B
28
99
63
c
568
67
43
C
3
100
64
d
7044
68
44
D
7
101
65
e
17344
69
45
E
7
275
113
ē
1709
102
66
f
8591
70
46
F
17
103
67
g
14301
71
47
G
8
104
68
h
14091
72
48
H
8
105
69
i
31395
73
49
I
3
299
012B
ī
8723
106
006A
j
271
74
004A
J
6
107
006B
k
7527
75
004B
K
13
108
006C
l
16453
76
004C
L
14
109
006D
m
7555
77
004D
M
7
110
006E
n
29333
78
004E
N
3
111
006F
o
12877
79
004F
O
2
333
014D
ō
4789
112
70
p
2331
80
50
P
7
113
71
q
7
114
72
r
22437
82
52
R
21
115
73
s
15937
83
53
S
35
116
74
t
18310
84
54
T
19
117
75
u
14735
85
55
U
5
363
016B
ū
1834
118
76
v
178
86
56
V
2
119
77
w
7700
87
57
W
23
120
78
x
10
121
79
y
13
122
007A
z
7474
90
005A
Z
1
Hieraus lassen sich folgende Häufigkeiten ermitteln:
Zeichen
Varianten
Häufigkeit
Prozent
A
a A ā æ
33022
10,50%
B
b B
8393
2,70%
C
c C
571
0,20%
D
d D
7051
2,20%
E
e E ē
19060
6,00%
F
f F
8608
2,70%
G
g G
14309
4,50%
H
h H
14099
4,50%
I
i I ī
40121
12,70%
J
j J
277
0,10%
K
k K
7540
2,40%
L
l L
16467
5,20%
M
m M
7562
2,40%
N
n N
29336
9,30%
O
o O ō
17668
5,60%
P
p P
2338
0,70%
Q
q
7
0,00%
R
r R
22458
7,10%
S
s S
15972
5,10%
T
t T
18329
5,80%
U
u U ū
16574
5,30%
V
v V
180
0,10%
W
w W
7723
2,50%
X
x
10
0,00%
Y
y
13
0,00%
Z
z Z
7475
2,40%
Summe
315164
100%
Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
I
i I ī
40121
12,70%
A
a A ā æ
33022
10,50%
N
n N
29336
9,30%
R
r R
22458
7,10%
E
e E ē
19060
6,00%
T
t T
18329
5,80%
O
o O ō
17668
5,60%
U
u U ū
16574
5,30%
L
l L
16467
5,20%
S
s S
15972
5,10%
G
g G
14309
4,50%
H
h H
14099
4,50%
F
f F
8608
2,70%
B
b B
8393
2,70%
W
w W
7723
2,50%
M
m M
7562
2,40%
K
k K
7540
2,40%
Z
z Z
7475
2,40%
D
d D
7051
2,20%
P
p P
2338
0,70%
C
c C
571
0,20%
J
j J
277
0,10%
V
v V
180
0,10%
Y
y
13
0,00%
X
x
10
0,00%
Q
q
7
0,00%