Köbler, Gerhard

 

Die Häufigkeit der zur Darstellung des Althochdeutschen verwendeten Buchstaben

 

Das seit Jakob Grimm (1819) so bezeichnete Althochdeutsche ist die älteste Sprachstufe der hochdeutschen Sprache. Diese unterscheidet sich vom durch Rekonstruktion gewonnenen Germanischen durch die vielleicht schon im 6. Jahrhundert (Personenname Idorih auf der Lanzenspitze von Wurmlingen) einsetzende, aber erst ab 750 besser belegte althochdeutsche Lautverschiebung (Verschiebung von p, t, k zu Doppelspiranten [ff, zz, hh] oder Affrikaten [pf/ph, z/tz, altoberdeutsch kh/ch] und von đ, ƀ, ǥ zu t, b, g). Gegenüber dem um 1070 einsetzenden Mittelhochdeutschen, der zweitältesten Sprachstufe der hochdeutschen Sprache, ist das Althochdeutsche durch die vollen Vokale der nicht hochbetonten Silben gekennzeichnet, die im Mittelhochdeutschen zu e oder i abgeschwächt sind.

 

Räumlich grenzt das Althochdeutsche im Norden an das Altsächsische, zu dem noch Essen, Werden, das Rothaargebirge und der Südharz gehören, und im Nordwesten an das Altniederfränkische. Über die Westgrenze des geschlossenen althochdeutschen Sprachgebietes lässt sich keine Sicherheit gewinnen. Im Osten (Thüringen) fehlen umfangreiche Zeugnisse. Im Süden weist noch das Langobardische althochdeutsche Züge auf.

 

Das Althochdeutsche ist - abgesehen von den bloßen Nennungen althochdeutscher Personennamen und Ortsnamen - durch rund 1200 Handschriften, in denen sich althochdeutsche Elemente sehr verschiedenen Umfangs finden, überliefert. Die wichtigsten althochdeutschen Schreiborte sind dabei in Bayern Salzburg, Mondsee, Passau, Regensburg, Tegernsee und Freising, in Alemannien St. Gallen, Reichenau und Murbach sowie im fränkischen Gebiet Weißenburg, Lorsch, Mainz, Frankfurt, Würzburg, Bamberg, Fulda, Trier, Echternach und Aachen. Allerdings sind auch von wichtigen Sprachdenkmälern die Entstehungsorte wie die Schreiborte nicht bekannt und müssen neben den genannten Schreiborten weitere, nicht sicher identifizierbare angenommen werden. Außerdem stammen die Schreiber eines Schreiborts vielfach aus anderssprachigen Gebieten.

 

Zur Aufzeichnung wird das lateinische Alphabet verwendet. Die lateinischen Schriftzeichen ermöglichen nur eine unvollkommene Wiedergabe des althochdeutschen Lautsystems. Zusätzliche Zeichen wurden gleichwohl für das Althochdeutsche nicht entwickelt.

 

Am nächsten verwandt ist das Althochdeutsche mit dem Altniederdeutschen (Altsächsischen und Altniederfränkischen). Mit diesem und dem Altfriesischen sowie dem Altenglischen hat es viele Spracherscheinungen gemeinsam (Konsonantengemination, Bildung der zweiten Person Singular Praeteriti der starken Verben, Suffixe -heit, -schaft, -tum, Wortschatzübereinstimmungen). Von daher ist es im Gegensatz zum ostgermanischen Gotischen und zum nordgermanischen Altnordischen dem sog. Westgermanischen zuzurechnen.

 

In sich ist das Althochdeutsche nicht einheitlich, so dass von althochdeutsch nur im Sinne einer wissenschaftlichen Zusammenfassung verschiedener Einzelmundarten gesprochen werden kann. Zu unterscheiden sind vor allem das altmitteldeutsche Altfränkische und die altoberdeutschen Mundarten des Altbayerischen und Altalemannischen (sowie das Thüringische und Langobardische). Das Altfränkische lässt sich dabei weiter in Altsüdrheinfränkisch (Weißenburg), Altrheinfränkisch (Mainz, Lorsch, Frankfurt, Fulda [seit 10. Jh.]), Altostfränkisch (Würzburg, Bamberg, Fulda [bis 10. Jh.]) und Altmittelfränkisch (Trier, Echternach usw.) (sowie das altniederdeutsche Altniederfränkische) gliedern.

 

Für wissenschaftliche Zwecke wird das Althochdeutsche in seinen Ansätzen in der Regel auf den Lautstand des in Fulda um 830 durch Übersetzung geschaffenen althochdeutschen Tatian normalisiert. Dadurch werden zwar sowohl räumliche Verschiedenheiten sowohl wie auch zeitliche Entwicklungen künstlich vernachlässigt. Andererseits wird dadurch aber so viel praktische Übersicht gewonnen, dass deswegen auch hier normalisiert wird.

 

Ediert sind die althochdeutschen Quellen in unterschiedlichen Publikationen. Hervorzuheben sind dabei vor allem die Ausgaben der umfassenderen Texte (Notker, Otfrid, Tatian, Isidor, Mondseer Fragmente, Murbacher Hymnen), der kleineren Sprachdenkmäler (Steinmeyer 1916, Köbler 1986), der Glossen (Steinmeyer/Sievers) und zahlreicher einzelner Glossennachträge (zusammenfassend Köbler 1993) sowie die Ausgaben der lateinischen frühmittelalterlichen Texte bzw. Handschriften.

 

In den 40794 erfassten Ansätzen und Verweisen sind 315137 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 7,7251 Zeichen. Zur Darstellung des Althochdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Althochdeutschen angepasst werden muss.

 

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als althochdeutsche Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.

 

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

 

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 55 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

 

Asc

Hex

Zeichen

Häufigkeit

97

61

a

29279

65

41

A

15

257

101

ā

3727

230

0

æ

1

98

62

b

8365

66

42

B

28

99

63

c

568

67

43

C

3

100

64

d

7044

68

44

D

7

101

65

e

17344

69

45

E

7

275

113

ē

1709

102

66

f

8591

70

46

F

17

103

67

g

14301

71

47

G

8

104

68

h

14091

72

48

H

8

105

69

i

31395

73

49

I

3

299

012B

ī

8723

106

006A

j

271

74

004A

J

6

107

006B

k

7527

75

004B

K

13

108

006C

l

16453

76

004C

L

14

109

006D

m

7555

77

004D

M

7

110

006E

n

29333

78

004E

N

3

111

006F

o

12877

79

004F

O

2

333

014D

ō

4789

112

70

p

2331

80

50

P

7

113

71

q

7

114

72

r

22437

82

52

R

21

115

73

s

15937

83

53

S

35

116

74

t

18310

84

54

T

19

117

75

u

14735

85

55

U

5

363

016B

ū

1834

118

76

v

178

86

56

V

2

119

77

w

7700

87

57

W

23

120

78

x

10

121

79

y

13

122

007A

z

7474

90

005A

Z

1

Hieraus lassen sich folgende Häufigkeiten ermitteln:

Zeichen

Varianten

Häufigkeit

Prozent

A

a A ā æ

33022

10,50%

B

b B

8393

2,70%

C

c C

571

0,20%

D

d D

7051

2,20%

E

e E ē

19060

6,00%

F

f F

8608

2,70%

G

g G

14309

4,50%

H

h H

14099

4,50%

I

i I ī

40121

12,70%

J

j J

277

0,10%

K

k K

7540

2,40%

L

l L

16467

5,20%

M

m M

7562

2,40%

N

n N

29336

9,30%

O

o O ō

17668

5,60%

P

p P

2338

0,70%

Q

q

7

0,00%

R

r R

22458

7,10%

S

s S

15972

5,10%

T

t T

18329

5,80%

U

u U ū

16574

5,30%

V

v V

180

0,10%

W

w W

7723

2,50%

X

x

10

0,00%

Y

y

13

0,00%

Z

z Z

7475

2,40%

Summe

315164

100%

 

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:

I

i I ī

40121

12,70%

A

a A ā æ

33022

10,50%

N

n N

29336

9,30%

R

r R

22458

7,10%

E

e E ē

19060

6,00%

T

t T

18329

5,80%

O

o O ō

17668

5,60%

U

u U ū

16574

5,30%

L

l L

16467

5,20%

S

s S

15972

5,10%

G

g G

14309

4,50%

H

h H

14099

4,50%

F

f F

8608

2,70%

B

b B

8393

2,70%

W

w W

7723

2,50%

M

m M

7562

2,40%

K

k K

7540

2,40%

Z

z Z

7475

2,40%

D

d D

7051

2,20%

P

p P

2338

0,70%

C

c C

571

0,20%

J

j J

277

0,10%

V

v V

180

0,10%

Y

y

13

0,00%

X

x

10

0,00%

Q

q

7

0,00%