AAAKöbler, Gerhard, Die Häufigkeit der zur Darstellung des Altenglischen verwendeten Buchstaben
Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Altenglischen verwendeten Buchstaben
Das Altenglische ist die zeitlich zwischen dem Germanischen und dem Mittelenglischen liegende Sprachstufe des Englischen. Ihr Beginn setzt vielleicht schon mit der auf den Rückzug der Römer (407) folgenden Landnahme germanischer Stämme auf der britischen, wohl seit der Mitte des ersten vorchristlichen Jahrtausends von Kelten besiedelten und seit 43 n. Chr. von den Römern eroberten Insel im Jahre 449 (vielleicht schon 428) ein, mit der eine räumliche Absonderung von den übrigen germanischen Stämmen einhergeht, welche faktisch die Wahrscheinlichkeit gesonderter Sprachentwicklung begünstigt. Aus dieser frühen Zeit sind aber keine altenglischen Texte überliefert, so dass sich der Anfang der Überlieferung um etwa 700 als Anfangszeitpunkt des Altenglischen anbietet. Im 11. Jahrhundert treten dann so viele, vor allem durch die den skandinavischen Einfällen seit 787 folgende normannische Eroberung Englands im Jahre 1066 (14. 10. 1066 Schlacht bei Senlac/Hastings) bewirkte Veränderungen (vor allem Abschwächung der vollen kurzen Endsilbenvokale zu e) ein, dass mit dem Ende dieses Jahrhunderts auch die altenglische Sprachstufe endet und das Mittelenglische beginnt. Gegen Ende des 12. Jahrhunderts werden Handschriften mit altenglischen Texten bereits allgemein nicht mehr verstanden.
Das Altenglische stammt aus dem nur durch Rekonstruktion erkennbaren Germanischen und ist somit eine germanistische Sprache. Über das Germanische gehört es zugleich zum Indogermanischen oder Indoeuropäischen, und zwar zur Gruppe der sogenannten Kentum-Sprachen (lat. centum = hundert), zu welchen außer dem Germanischen das Griechische, das Italische, das Keltische, das Hethitische und das Tocharische zählen und welche im Gegensatz zu den sogenannten Satem-Sprachen stehen.
Innerhalb des Germanischen unterscheidet man zwischen Ostgermanisch, Nordgermanisch und Westgermanisch. Das Altenglische entwickelt sich zusammen mit dem Altfriesischen, dem Altniederdeutsche (Altsächsischen, Altniederfränkischen) und dem Althochdeutschen aus dem Westgermanischen. Von diesem unterscheiden sich Ost- und Nordgermanisch vor allem durch das Fehlen der Verben tun, gehen, stehen und die Umbildung von gemeingermanisch uu zu ggw gegenüber uw im Westgermanische. Innerhalb des Westgermanischen steht das Altenglische dem Altfriesischen am nächsten und dem Altniederdeutschen näher als dem Althochdeutschen.
Geographisch umfasst das Altenglische England mit Ausnahme von Cornwall. Seine wichtigsten Schreiborte sind Winchester, Canterbury, London, York und Lindisfarne.
Dialektal (diatopisch) gliedert sich das Altenglische im wesentlichen nach den Siedlungsräumen der einzelnen nach Britannien gewanderten und seit etwa 600 von Irland - über Iona und Lindisfarne und York - wie Rom - über Kent - aus christianisierten germanischen Stämme, wobei die sprachwissenschaftliche Bestimmung dieser Dialekte sowohl aus der altenglischen als auch aus der mittelenglischen Überlieferung erfolgt. Danach unterscheidet man Kentisch, Westsächsisch und Anglisch. Dabei entspricht das nur bruchstückhaft überlieferte Kentische dem Siedlungsbereich der aus Jütland gekommenen Jüten im Bereich der heutigen, Canterbury als Hauptort einschließenden Grafschaft Kent und der Insel Wight. Das Westsächsische gehört zum Siedlungsgebiet der insgesamt in Essex, Sussex und Wessex siedelnden Sachsen südlich der Themse und westlich von Kent. Sein Hauptort ist Winchester. Es ist der am reichsten überlieferte Dialekt, der von der zweiten Hälfte des 10. Jahrhunderts an die Normalform des Altenglischen bietet (Spätwestsächsisch). Das im Endergebnis namengebende Anglische schließlich umfasst das nördlich der Themse liegende Siedlungsgebiet der aus dem Gebiet zwischen Flensburg und Schleswig gekommenen Angeln, das 867 von Skandinaviern (Dänen) erobert wurde (Denalagu). Es gliedert sich in das Ostanglische, nordöstlich von London, das recht unvollkommen überlieferte Mercische (zu mearc Mark, Grenze) zwischen Themse und Humber und das nur burchstückhaft überlieferte Northumbrische nördlich des Humber. Politisch lag dabei die Vorherrschaft zunächst in Northumbrien (Edwin, Oswald, Oswin), dann in Mercien (Penda, Offa) und schließlich in Wessex (Egbert 802-839, Alfred 879-900).
Zeitlich (diachronisch) lässt sich das Altenglische in das nicht überlieferte Uraltenglische, das von 700 bis etwa (900 oder) 950 reichende Frühaltenglische, zu dem vor allem die von Alfred dem Großen angefertigten oder angeregten westsächsischen Prosaübersetzungen gehören, und das Spätaltenglische (900 bzw. 950-1100), in dem besonders die Werke Aelfrics (um 1000) und Wulfstans verfasst sind, gliedern.
Sozial (diastratisch) erlaubt die Überlieferung kaum eine Unterscheidung, da die Umgangssprache so gut wie nicht erhalten ist.
Das somit vor allem dialektisch wie zeitlich in sich sehr differenzierte Altenglische bedarf für wissenschaftliche Zwecke einer normalisierenden Standardisierung. Hierfür hat Henry Sweet in der Einleitung zu seiner Ausgabe von König Alfreds altenglischer Übersetzung der lateinischen Cura Pastoralis Gregors des Großen das Frühwestsächsische Alfreds des Großen (Cura Pastoralis, Orosius, Parker-Handschrift der Sachsenchronik) zur Grundlage gemacht. Ihm sind die wichtigsten Grammatike (Cosijn, Sievers, Wright, Girvan) und das Wörterbuch Holthausens gefolgt, obgleich das Spätwestsächsiche Aelfrics (um 1000) der alfredischen Sprache überlegen sein dürfte.
Die altenglischen poetischen Denkmäler mit ihren insgesamt etwa 10000 Langzeilen sind vermutlich seit etwa 700 und im erheblichem Umfang im anglischen Sprachgebiet entstanden, aber fast durchwegs nur in vier westsächsischen Abschriften des 10. Jahrhunderts überliefert.
Die Beowulf-Handschrift des British Museum in London enthält drei altenglische Prosatexte, den Beowulf (1. Hälfte 8. Jh.?), und die fragmentarische Judith-Dichtung. Sie war wohl 1563 im Besitz von Laurence Nowell, Dekan von Lichfield und danach Sir Robert Cottons (1571-1631), in dessen Bibliothek sie 1731 durch Brand beschädigt wurde. Sie wurde 1815 von G. J. Thorkelin, 1833 von J. M. Kemble und 1882 in Faksimile von J. Zupitza veröffentlicht.
Die Caedmon-Handschrift der Bodleian Library in Oxford enthält Genesis (1. Hälfte 8. Jh.), Exodus (1. Hälfte 8. Jh.), Daniel, Christ und Satan. Sie gehörte einst dem Erzbischof James Usher, der sie Franciscus Junius schenkte, der 1655 den Erstdruck besorgte und dann die Handschrift der Universität Oxford überließ. Im Faksimile wurde sie 1927 von I. Gollancz herausgegeben.
Die Exeter- Handschrift der Kathedrale zu Exeter enthält vor allem Christ, Guthlac, Phönix, Juliana, Wanderer, Der Menschen Gaben, Des Vaters Lehren, Seefahrer, Der Menschen Gemüt, Widsith, Der Menschen Geschicke, Reimlied, Panther, Walfisch, Rebhuhn, Rede der Seele an den Leichnam (I), Deors Klage, Klage der Frau, Das jüngste Gericht, Botschaft des Gemahls, Ruine und Rätsel. Die Kathedrale von Exeter erhielt die Handschrift von Leofric, Bischof von Devon und Cornwall († 1072). Die erste vollständige Ausgabe erfolgte 1842 durch B. Thorpe, eine Ausgabe mit Übersetzung 1895 durch I. Gollancz, eine Faksimileausgabe 1933 durch R. W. Chambers, M. Förster und R. Flower.
Die Vercelli-Handschrift enthält Homilien, Andreas, Schicksale der zwölf Apostel, Rede der Seele an den Leichnam (II), Der Menschen Falschheit, Traumgesicht vom Kreuze, Elene, (Leben des Guthlac). Wie sie in die Dombibliothek von Vercelli gelangte, ist unbekannt. Sie wurde 1836 von M. G. Maier unter B. Thorpes Leitung erstmals und 1894 von R. Wülker in ihrem poetischen Teil und 1913 von M. Förster umfassend in Faksimile ediert.
Zu den poetischen Denkmälern kommen dann noch zahlreiche prosaische Texte. Neben verschiedenen kleineren, teilweise auch in Runen geschriebenen und seit etwa 700 überlieferten Texten sind hier vor allem die altenglischen Urkunden, die altenglischen Gesetze, die im 8. Jahrhundert einsetzenden mercischen Glossen, die Interlinearversion des Psalters und der Evangelien und die Übersetzungen der Cura Pastoralis Gregors des Großen (540-604), der Historia ecclesiastica Bedas (672-735), der De consolatione philosophiae des Boethius (480-524), der Soliloquia Augustins (354-430), der Disticha Catonis, der Metra Boethius' und der Dialoge Gregors des Großen durch König Alfred zu nennen.
Hinzuweisen ist daneben auf die reiche Namensüberlieferung sowie auf verschiedene Runeninschriften. Die Edition der altenglischen Denkmäler ist weit verstreut erfolgt und noch nicht abgeschlossen. Eine Zusammenfassung der ältesten - voralfredischen - Texte bietet Sweet, eine Zusammenfassung der poetischen Werke Grein sowie Krapp und Dobbie, einen Zusammenfassung der Urkunden Kemble, Thorpe und Robertson. Um Vereinigung wenigstens in einer Reihe bemühen sich auch die Bände der Early English Text Society.
Das führende altenglische Wörterbuch stammt von Bosworth/Toller, ist aber trotz späterer Ergänzungen (Supplement, Additions, Corrections) nicht vollständig. Das insofern bessere Wörterbuch Halls ist allerdings trotz einer späteren Ergänzung ebenfalls nicht erschöpfend, vernachlässigt lateinische Lemmata und verzeichnet die Quellen nur global. Sein Wortschatz lässt sich auf mehr als 40000 Wörter schätzen. Holthausens etymologisches Wörterbuch bietet deutsche Bedeutungsangaben, ist jedoch auf den Grundwortschatz beschränkt. Greins Wörterbuch erfasst nur die poetischen Denkmäler.
In den 25068 erfassten Ansätzen und Verweisen des Grundwortschatzes sind 177465 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 7,0793 Zeichen.
Zur Darstellung des Altenglischen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Altenglischen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q [1x], r, s, t, u, v, x, y, z). Hinzu kommen als altenglische Zusatzzeichen bzw. Sonderzeichen þ und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 67 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc
Hex
Zeichen
Häufigkeit
97
61
a
12736
65
41
A
10
225
0
á
2
257,774
101,0306
ā̆
1
257
101
ā
1949
230
0
æ
1561
198
00C6
Æ
1
483,774
01E3,0306
ǣ̆
33
483
1000
ǣ
2029
98
62
b
2981
66
42
B
12
99
63
c
6900
67
43
C
8
100
64
d
6697
68
44
D
2
101
65
e
17277
69
45
E
18
233
0
é
2122
201
00C9
É
2
279
117
ė
3402
275,774
113,0306
ē̆
45
275
113
ē
637
102
66
f
5278
70
46
F
12
103
67
g
8872
71
47
G
8
104
68
h
4323
72
48
H
3
105
69
i
8405
73
49
I
12
237
00ED
í
885
299,774
012B,0306
ī̆
34
299
012B
ī
1768
298
012A
Ī
3
107
006B
k
2
108
006C
l
9860
76
004C
L
6
109
006D
m
3881
77
004D
M
4
110
006E
n
17998
78
004E
N
4
111
006F
o
6749
333,774
014D,0306
ō̆
209
333
014D
ō
1033
339
153
œ
30
339,772
153,0304
œ̄
551
112
70
p
2184
80
50
P
4
113
71
q
1
114
72
r
11852
82
52
R
6
115
73
s
10456
83
53
S
26
116
74
t
7552
84
54
T
3
254
00FE
þ
3194
222
00DE
Þ
6
117
75
u
3673
363,774
016B,0306
ū̆
11
363
016B
ū
629
118
76
v
3
119
77
w
5460
87
57
W
6
120
78
x
213
121
79
y
2383
563
233
ȳ
560
122
007A
z
4
Hieraus lassen sich folgende Häufigkeiten ermitteln:
Zeichen
Varianten
Häufigkeit
Prozent
A
a A á ā̆ ā æ Æ ǣ̆ ǣ
18322
10,40%
B
b B
2993
1,70%
C
c C
6908
3,90%
D
d D
6699
3,80%
E
e E é É ė ē̆ ē
23503
13,30%
F
f F
5290
3,00%
G
g G
8880
5,00%
H
h H
4326
2,40%
I
i I í ī̆ ī Ī
11107
6,30%
K
k
2
0,00%
L
l L
9866
5,60%
M
m M
3885
2,20%
N
n N
18002
10,20%
O
o ō̆ ō œ œ̄
8572
4,90%
P
p P
2188
1,20%
Q
q
1
0,00%
R
r R
11858
6,70%
S
s S
10482
5,90%
T
t T
7555
4,30%
Þ
þ Þ
3200
1,80%
U
u ū̆ ū
4313
2,40%
V
v
3
0,00%
W
w W
5466
3,10%
X
x
213
0,10%
Y
y ȳ
2943
1,70%
Z
z
4
0,00%
Summe
176581
100,00%
Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
E
e E é É ė ē̆ ē
23503
13,30%
A
a A á ā̆ ā æ Æ ǣ̆ ǣ
18322
10,40%
N
n N
18002
10,20%
R
r R
11858
6,70%
I
i I í ī̆ ī Ī
11107
6,30%
S
s S
10482
5,90%
L
l L
9866
5,60%
G
g G
8880
5,00%
O
o ō̆ ō œ œ̄
8572
4,90%
T
t T
7555
4,30%
C
c C
6908
3,90%
D
d D
6699
3,80%
W
w W
5466
3,10%
F
f F
5290
3,00%
H
h H
4326
2,40%
U
u ū̆ ū
4313
2,40%
M
m M
3885
2,20%
Þ
þ Þ
3200
1,80%
B
b B
2993
1,70%
Y
y ȳ
2943
1,70%
P
p P
2188
1,20%
X
x
213
0,10%
Z
z
4
0,00%
V
v
3
0,00%
K
k
2
0,00%
Q
q
1
0,00%