Köbler, Gerhard

 

Die Häufigkeit der zur Darstellung des Altenglischen verwendeten Buchstaben

 

Das Altenglische ist die zeitlich zwischen dem Germanischen und dem Mittelenglischen liegende Sprachstufe des Englischen. Ihr Beginn setzt vielleicht schon mit der auf den Rückzug der Römer (407) folgenden Landnahme germanischer Stämme auf der britischen, wohl seit der Mitte des ersten vorchristlichen Jahrtausends von Kelten besiedelten und seit 43 n. Chr. von den Römern eroberten Insel im Jahre 449 (vielleicht schon 428) ein, mit der eine räumliche Absonderung von den übrigen germanischen Stämmen einhergeht, welche faktisch die Wahrscheinlichkeit gesonderter Sprachentwicklung begünstigt. Aus dieser frühen Zeit sind aber keine altenglischen Texte überliefert, so dass sich der Anfang der Überlieferung um etwa 700 als Anfangszeitpunkt des Altenglischen anbietet. Im 11. Jahrhundert treten dann so viele, vor allem durch die den skandinavischen Einfällen seit 787 folgende normannische Eroberung Englands im Jahre 1066 (14. 10. 1066 Schlacht bei Senlac/Hastings) bewirkte Veränderungen (vor allem Abschwächung der vollen kurzen Endsilbenvokale zu e) ein, dass mit dem Ende dieses Jahrhunderts auch die altenglische Sprachstufe endet und das Mittelenglische beginnt. Gegen Ende des 12. Jahrhunderts werden Handschriften mit altenglischen Texten bereits allgemein nicht mehr verstanden.

 

Das Altenglische stammt aus dem nur durch Rekonstruktion erkennbaren Germanischen und ist somit eine germanistische Sprache. Über das Germanische gehört es zugleich zum Indogermanischen oder Indoeuropäischen, und zwar zur Gruppe der sogenannten Kentum-Sprachen (lat. centum = hundert), zu welchen außer dem Germanischen das Griechische, das Italische, das Keltische, das Hethitische und das Tocharische zählen und welche im Gegensatz zu den sogenannten Satem-Sprachen stehen.

 

Innerhalb des Germanischen unterscheidet man zwischen Ostgermanisch, Nordgermanisch und Westgermanisch. Das Altenglische entwickelt sich zusammen mit dem Altfriesischen, dem Altniederdeutsche (Altsächsischen, Altniederfränkischen) und dem Althochdeutschen aus dem Westgermanischen. Von diesem unterscheiden sich Ost- und Nordgermanisch vor allem durch das Fehlen der Verben tun, gehen, stehen und die Umbildung von gemeingermanisch uu zu ggw gegenüber uw im Westgermanische. Innerhalb des Westgermanischen steht das Altenglische dem Altfriesischen am nächsten und dem Altniederdeutschen näher als dem Althochdeutschen.

 

Geographisch umfasst das Altenglische England mit Ausnahme von Cornwall. Seine wichtigsten Schreiborte sind Winchester, Canterbury, London, York und Lindisfarne.

 

Dialektal (diatopisch) gliedert sich das Altenglische im wesentlichen nach den Siedlungsräumen der einzelnen nach Britannien gewanderten und seit etwa 600 von Irland - über Iona und Lindisfarne und York - wie Rom - über Kent - aus christianisierten germanischen Stämme, wobei die sprachwissenschaftliche Bestimmung dieser Dialekte sowohl aus der altenglischen als auch aus der mittelenglischen Überlieferung erfolgt. Danach unterscheidet man Kentisch, Westsächsisch und Anglisch. Dabei entspricht das nur bruchstückhaft überlieferte Kentische dem Siedlungsbereich der aus Jütland gekommenen Jüten im Bereich der heutigen, Canterbury als Hauptort einschließenden Grafschaft Kent und der Insel Wight. Das Westsächsische gehört zum Siedlungsgebiet der insgesamt in Essex, Sussex und Wessex siedelnden Sachsen südlich der Themse und westlich von Kent. Sein Hauptort ist Winchester. Es ist der am reichsten überlieferte Dialekt, der von der zweiten Hälfte des 10. Jahrhunderts an die Normalform des Altenglischen bietet (Spätwestsächsisch). Das im Endergebnis namengebende Anglische schließlich umfasst das nördlich der Themse liegende Siedlungsgebiet der aus dem Gebiet zwischen Flensburg und Schleswig gekommenen Angeln, das 867 von Skandinaviern (Dänen) erobert wurde (Denalagu). Es gliedert sich in das Ostanglische, nordöstlich von London, das recht unvollkommen überlieferte Mercische (zu mearc  Mark, Grenze) zwischen Themse und Humber und das nur burchstückhaft überlieferte Northumbrische nördlich des Humber. Politisch lag dabei die Vorherrschaft zunächst in Northumbrien (Edwin, Oswald, Oswin), dann in Mercien (Penda, Offa) und schließlich in Wessex (Egbert 802-839, Alfred 879-900).

 

Zeitlich (diachronisch) lässt sich das Altenglische in das nicht überlieferte Uraltenglische, das von 700 bis etwa (900 oder) 950 reichende Frühaltenglische, zu dem vor allem die von Alfred dem Großen angefertigten oder angeregten westsächsischen Prosaübersetzungen gehören, und das Spätaltenglische (900 bzw. 950-1100), in dem besonders die Werke Aelfrics (um 1000) und Wulfstans verfasst sind, gliedern.

 

Sozial (diastratisch) erlaubt die Überlieferung kaum eine Unterscheidung, da die Umgangssprache so gut wie nicht erhalten ist.

 

Das somit vor allem dialektisch wie zeitlich in sich sehr differenzierte Altenglische bedarf für wissenschaftliche Zwecke einer normalisierenden Standardisierung. Hierfür hat Henry Sweet in der Einleitung zu seiner Ausgabe von König Alfreds altenglischer Übersetzung der lateinischen Cura Pastoralis Gregors des Großen das Frühwestsächsische Alfreds des Großen (Cura Pastoralis, Orosius, Parker-Handschrift der Sachsenchronik) zur Grundlage gemacht. Ihm sind die wichtigsten Grammatike (Cosijn, Sievers, Wright, Girvan) und das Wörterbuch Holthausens gefolgt, obgleich das Spätwestsächsiche Aelfrics (um 1000) der alfredischen Sprache überlegen sein dürfte.

 

Die altenglischen poetischen Denkmäler mit ihren insgesamt etwa 10000 Langzeilen sind vermutlich seit etwa 700 und im erheblichem Umfang im anglischen Sprachgebiet entstanden, aber fast durchwegs nur in vier westsächsischen Abschriften des 10. Jahrhunderts überliefert.

 

Die Beowulf-Handschrift des British Museum in London enthält drei altenglische Prosatexte, den Beowulf (1. Hälfte 8. Jh.?), und die fragmentarische Judith-Dichtung. Sie war wohl 1563 im Besitz von Laurence Nowell, Dekan von Lichfield und danach Sir Robert Cottons (1571-1631), in dessen Bibliothek sie 1731 durch Brand beschädigt wurde. Sie wurde 1815 von G. J. Thorkelin, 1833 von J. M. Kemble und 1882 in Faksimile von J. Zupitza veröffentlicht.

 

Die Caedmon-Handschrift der Bodleian Library in Oxford enthält Genesis (1. Hälfte 8. Jh.), Exodus (1. Hälfte 8. Jh.), Daniel, Christ und Satan. Sie gehörte einst dem Erzbischof James Usher, der sie Franciscus Junius schenkte, der 1655 den Erstdruck besorgte und dann die Handschrift der Universität Oxford überließ. Im Faksimile wurde sie 1927 von I. Gollancz herausgegeben.

 

Die Exeter- Handschrift der Kathedrale zu Exeter enthält vor allem Christ, Guthlac, Phönix, Juliana, Wanderer, Der Menschen Gaben, Des Vaters Lehren, Seefahrer, Der Menschen Gemüt, Widsith, Der Menschen Geschicke, Reimlied, Panther, Walfisch, Rebhuhn, Rede der Seele an den Leichnam (I), Deors Klage, Klage der Frau, Das jüngste Gericht, Botschaft des Gemahls, Ruine und Rätsel. Die Kathedrale von Exeter erhielt die Handschrift von Leofric, Bischof von Devon und Cornwall († 1072). Die erste vollständige Ausgabe erfolgte 1842 durch B. Thorpe, eine Ausgabe mit Übersetzung 1895 durch I. Gollancz, eine Faksimileausgabe 1933 durch R. W. Chambers, M. Förster und R. Flower.

 

Die Vercelli-Handschrift enthält Homilien, Andreas, Schicksale der zwölf Apostel, Rede der Seele an den Leichnam (II), Der Menschen Falschheit, Traumgesicht vom Kreuze, Elene, (Leben des Guthlac). Wie sie in die Dombibliothek von Vercelli gelangte, ist unbekannt. Sie wurde 1836 von M. G. Maier unter B. Thorpes Leitung erstmals und 1894 von R. Wülker in ihrem poetischen Teil und 1913 von M. Förster umfassend in Faksimile ediert.

 

Zu den poetischen Denkmälern kommen dann noch zahlreiche prosaische Texte. Neben verschiedenen kleineren, teilweise auch in Runen geschriebenen und seit etwa 700 überlieferten Texten sind hier vor allem die altenglischen Urkunden, die altenglischen Gesetze, die im 8. Jahrhundert einsetzenden mercischen Glossen, die Interlinearversion des Psalters und der Evangelien und die Übersetzungen der Cura Pastoralis Gregors des Großen (540-604), der Historia ecclesiastica Bedas (672-735), der De consolatione philosophiae des Boethius (480-524), der Soliloquia Augustins (354-430), der Disticha Catonis, der Metra Boethius' und der Dialoge Gregors des Großen durch König Alfred zu nennen.

 

Hinzuweisen ist daneben auf die reiche Namensüberlieferung sowie auf verschiedene Runeninschriften. Die Edition der altenglischen Denkmäler ist weit verstreut erfolgt und noch nicht abgeschlossen. Eine Zusammenfassung der ältesten  - voralfredischen - Texte bietet Sweet, eine Zusammenfassung der poetischen Werke Grein sowie Krapp und Dobbie, einen Zusammenfassung der Urkunden Kemble, Thorpe und Robertson. Um Vereinigung wenigstens in einer Reihe bemühen sich auch die Bände der Early English Text Society.

 

Das führende altenglische Wörterbuch stammt von Bosworth/Toller, ist aber trotz späterer Ergänzungen (Supplement, Additions, Corrections) nicht vollständig. Das insofern bessere Wörterbuch Halls ist allerdings trotz einer späteren Ergänzung ebenfalls nicht erschöpfend, vernachlässigt lateinische Lemmata und verzeichnet die Quellen nur global. Sein Wortschatz lässt sich auf mehr als 40000 Wörter schätzen. Holthausens etymologisches Wörterbuch bietet deutsche Bedeutungsangaben, ist jedoch auf den Grundwortschatz beschränkt. Greins Wörterbuch erfasst nur die poetischen Denkmäler.

 

In den 25068 erfassten Ansätzen und Verweisen des Grundwortschatzes sind 177465 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 7,0793 Zeichen.

 

Zur Darstellung des Altenglischen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Altenglischen angepasst werden muss.

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q [1x], r, s, t, u, v, x, y, z). Hinzu kommen als altenglische Zusatzzeichen bzw. Sonderzeichen þ und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.

 

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

 

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 67 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

 

Asc

Hex

Zeichen

Häufigkeit

97

61

a

12736

65

41

A

10

225

0

á

2

257,774

101,0306

ā̆

1

257

101

ā

1949

230

0

æ

1561

198

00C6

Æ

1

483,774

01E3,0306

ǣ̆

33

483

1000

ǣ

2029

98

62

b

2981

66

42

B

12

99

63

c

6900

67

43

C

8

100

64

d

6697

68

44

D

2

101

65

e

17277

69

45

E

18

233

0

é

2122

201

00C9

É

2

279

117

ė

3402

275,774

113,0306

ē̆

45

275

113

ē

637

102

66

f

5278

70

46

F

12

103

67

g

8872

71

47

G

8

104

68

h

4323

72

48

H

3

105

69

i

8405

73

49

I

12

237

00ED

í

885

299,774

012B,0306

ī̆

34

299

012B

ī

1768

298

012A

Ī

3

107

006B

k

2

108

006C

l

9860

76

004C

L

6

109

006D

m

3881

77

004D

M

4

110

006E

n

17998

78

004E

N

4

111

006F

o

6749

333,774

014D,0306

ō̆

209

333

014D

ō

1033

339

153

œ

30

339,772

153,0304

œ̄

551

112

70

p

2184

80

50

P

4

113

71

q

1

114

72

r

11852

82

52

R

6

115

73

s

10456

83

53

S

26

116

74

t

7552

84

54

T

3

254

00FE

þ

3194

222

00DE

Þ

6

117

75

u

3673

363,774

016B,0306

ū̆

11

363

016B

ū

629

118

76

v

3

119

77

w

5460

87

57

W

6

120

78

x

213

121

79

y

2383

563

233

ȳ

560

122

007A

z

4

 

 

 

 

Hieraus lassen sich folgende Häufigkeiten ermitteln:

Zeichen

Varianten

Häufigkeit

Prozent

A

a A á ā̆ ā æ Æ ǣ̆ ǣ

18322

10,40%

B

b B

2993

1,70%

C

c C

6908

3,90%

D

d D

6699

3,80%

E

e E é É ė ē̆ ē

23503

13,30%

F

f F

5290

3,00%

G

g G

8880

5,00%

H

h H

4326

2,40%

I

i I í ī̆ ī Ī

11107

6,30%

K

k

2

0,00%

L

l L

9866

5,60%

M

m M

3885

2,20%

N

n N

18002

10,20%

O

o ō̆ ō œ œ̄

8572

4,90%

P

p P

2188

1,20%

Q

q

1

0,00%

R

r R

11858

6,70%

S

s S

10482

5,90%

T

t T

7555

4,30%

Þ

þ Þ

3200

1,80%

U

u ū̆ ū

4313

2,40%

V

v

3

0,00%

W

w W

5466

3,10%

X

x

213

0,10%

Y

y ȳ

2943

1,70%

Z

z

4

0,00%

Summe

176581

100,00%

 

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:

E

e E é É ė ē̆ ē

23503

13,30%

A

a A á ā̆ ā æ Æ ǣ̆ ǣ

18322

10,40%

N

n N

18002

10,20%

R

r R

11858

6,70%

I

i I í ī̆ ī Ī

11107

6,30%

S

s S

10482

5,90%

L

l L

9866

5,60%

G

g G

8880

5,00%

O

o ō̆ ō œ œ̄

8572

4,90%

T

t T

7555

4,30%

C

c C

6908

3,90%

D

d D

6699

3,80%

W

w W

5466

3,10%

F

f F

5290

3,00%

H

h H

4326

2,40%

U

u ū̆ ū

4313

2,40%

M

m M

3885

2,20%

Þ

þ Þ

3200

1,80%

B

b B

2993

1,70%

Y

y ȳ

2943

1,70%

P

p P

2188

1,20%

X

x

213

0,10%

Z

z

4

0,00%

V

v

3

0,00%

K

k

2

0,00%

Q

q

1

0,00%