AAAKöbler, Gerhard, Die Häufigkeit der zur Darstellung des Germanischen verwendeten Buchstaben
Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Germanischen verwendeten Buchstaben
Das Germanische ist eine indogermanische Sprache, die zur Gruppe der sogenannten Kentum-Sprachen gehört, aber mit keiner zweiten indogermanischen Sprache enger verwandt ist. Am nächsten stehen dem Germanischen das Keltische, das Italische, das Venetische, das Illyrische, das Baltische und das Slawische. Jedenfalls vom Keltischen ist es in früher Zeit auch beeinflusst worden.
Das Germanische ist im Zeitpunkt seiner ersten schriftlichen Überlieferung, wie sie nach wenigen älteren Einzelwörtern und Einzelnamen seit dem ersten nachchristlichen Jahrhundert allmählich einsetzt, keine einheitliche Sprache (mehr), sondern gliedert sich in verschiedene Sprachgruppen. Hierbei werden insbesondere Westgermanisch (Vorläufer des Altenglischen, Altfriesischen, Altniederdeutschen [Altniederfränkischen, Altsächsischen], Althochdeutschen einschließlich des Thüringischen und Langobardischen), Nordgermanisch (Urnordisch bis etwa 800 n. Ch.) und Ostgermanisch (Gotisch, Gepidisch, Vandalisch, Burgundisch, Rugisch, Skirisch) unterschieden, von denen das Nordgermanische und das Ostgermanische gegenüber dem Westgermanischen eine Reihe von gemeinsamen Unterscheidungsmerkmalen aufweisen (u. a. Fehlen der Verben tun, gehen, stehen, Umbildung von uu zu ggw im Nordgermanischen und Ostgermanischen gegenüber uw im Westgermanischen), Wie weit dem eine völlig einheitliche germanische Sprache vorausgeht, ist umstritten, Sie lässt sich jedenfalls durch tatsächliche Überlieferung nicht fassen. Immerhin lässt sich mit den gleichen guten Gründen wie für das Indogermanische ein im Wesentlichen einheitlicher Grundbestand des Germanischen vermuten, der allerdings nur im Wege der hypothetischen Rekonstruktion aus den überlieferten jüngeren Einzelsprachen zu gewinnen ist (Beispiel: urnord. gastiR, got. gasts, ae. giest, as. gast, ahd. gast führen auf germ. *gastiz Gast, anord. fiskr, got. fisks, ae. fisk, afries. fisk, as. fisk, ahd. fisk führen auf germ. *fiskaz Fisch).
Der Wortschatz des Germanischen wurde als Gesamtheit zuletzt von Torp, A./Falk, H. (Wortschatz der germanischen Spracheinheit) 1909, für die starken Verben von Elmar Seebold (1970) und für die Primäradjektive von Frank Heidermanns (1993) gesammelt und danach von Gerhard Köbler einfach und übersichtlich strikt alphabetisch zusammengefasst. Er enthält in seiner zuletzt festgelegten Fassung insgesamt 12051 mehr oder weniger allgemein anerkannte (normalisierte) Ansätze mit 68793 Zeichen (d. h. 5,7087 Zeichen pro Ansatz), die aber - wie nahezu alles in den Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen sind. Zu ihrer Darstellung ist grundsätzlich von den frühen Schreibern bis zu den gegenwärtigen Wissenschaftlern das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Germanischen angepasst werden muss(te). Dementsprechend umfasst diese Zeichenmenge nicht - wie das Lateinische - 24 Zeichen (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z), sondern wegen der drei germanischen Zusatzzeichen j, þ und w 27 Buchstaben (a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, þ, u, v, w, x, y, z).
Die Häufigkeit der Verwendung der einzelnen Buchstaben in den (normalisierten) Ansätzen hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (27 anerkannten) Buchstaben (z. B. a, b, c usw.) und (57) Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden leicht gerundeten Erkenntnissen:
Asc
Hex
Zeichen
Häufigkeit
97
61
a
11604
65
41
A
49
257
101
ā
16
98
62
b
1738
66
42
B
25
99
63
c
62
67
43
C
19
100
64
d
1811
68
44
D
6
273
111
đ
1
101
65
e
3101
69
45
E
7
275
113
ē
787
102
66
f
1125
70
46
F
7
103
67
g
2141
71
47
G
11
104
68
h
2087
72
48
H
3
105
69
i
3869
73
49
I
10
299
012B
ī
833
106
006A
j
1992
74
004A
J
5
107
006B
k
2792
75
004B
K
8
108
006C
l
3538
76
004C
L
12
109
006D
m
1562
77
004D
M
20
110
006E
n
6136
78
004E
N
9
111
006F
o
206
79
004F
O
3
333
014D
ō
3281
112
70
p
1028
80
50
P
6
113
71
q
4
81
51
Q
2
114
72
r
4158
82
52
R
11
115
73
s
3814
83
53
S
11
116
74
t
2749
84
54
T
18
254
00FE
þ
1469
117
75
u
3472
85
55
U
2
363,774
016B,0306
ū̆
3
363
016B
ū
293
118
76
v
47
86
56
V
11
119
77
w
2438
87
57
W
5
120
78
x
2
121
79
y
2
122
007A
z
372
Hieraus lassen sich in etwa folgende Häufigkeiten ermitteln:
Zeichen
Varianten
Häufigkeit
Prozent
A
a A ā
11669
17,00%
B
b B
1763
2,60%
C
c C
81
0,10%
D
d D đ
1818
2,60%
E
e E ē
3895
5,70%
F
f F
1132
1,60%
G
g G
2152
3,10%
H
h H
2090
3,00%
I
i I ī
4712
6,80%
J
j J
1997
2,90%
K
k K
2800
4,10%
L
l L
3550
5,20%
M
m M
1582
2,30%
N
n N
6145
8,90%
O
o O ō
3490
5,10%
P
p P
1034
1,50%
Q
q Q
6
0,00%
R
r R
4169
6,10%
S
s S
3825
5,60%
T
t T
2767
4,00%
Þ
þ
1469
2,10%
U
u U ū̆ ū
3770
5,50%
V
v V
58
0,10%
W
w W
2443
3,60%
X
x
2
0,00%
Y
y
2
0,00%
Z
z
372
0,50%
Summe
68793
100%
Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung
A
a A ā
11669
17,00%
N
n N
6145
8,90%
I
i I ī
4712
6,80%
R
r R
4169
6,10%
E
e E ē
3895
5,70%
S
s S
3825
5,60%
U
u U ū̆ ū
3770
5,50%
L
l L
3550
5,20%
O
o O ō
3490
5,10%
K
k K
2800
4,10%
T
t T
2767
4,00%
W
w W
2443
3,60%
G
g G
2152
3,10%
H
h H
2090
3,00%
J
j J
1997
2,90%
D
d D đ
1818
2,60%
B
b B
1763
2,60%
M
m M
1582
2,30%
Þ
þ
1469
2,10%
F
f F
1132
1,60%
P
p P
1034
1,50%
Z
z
372
0,50%
C
c C
81
0,10%
V
v V
58
0,10%
Q
q Q
6
0,00%
X
x
2
0,00%
Y
y
2
0,00%
Danach ist der am häufigsten zur Darstellung des in der Gegenwart anerkannten germanischen Wortschatzes verwendete Buchstabe das a vor n, i, r, e, s u, l und o, während c, v, q, x und y nur ziemlich selten gebraucht werden.