Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Indogermanischen verwendeten Buchstaben
Die seit der Mitte des 18. Jahrhunderts von Philologen
aus der gesamten weltweiten Textüberlieferung erschlossene Sprache des
vermuteten, nachträglich als Indogermanen bezeichneten Volkes, deren Wortschatz
zuletzt von Julius Pokorny gesammelt und danach von Gerhard Köbler einfach und
übersichtlich strikt alphabetisch geordnet wurde, enthält in ihrer zuletzt
festgelegten Fassung insgesamt 6263 Ansätze mit 26219 Zeichen (d. h. 4,18633
Zeichen pro Ansatz), die aber - wie nahezu alles in den Geisteswissenschaften -
, einer eigenen Geschichte und Zukunft unterworfen sind. Zu ihrer Darstellung
ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen
verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des
Indogermanischen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des
lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s,
t, u, v, x, y, z). Davon werden aber die vier Zeichen c, f, q und y für die
Darstellung des indogermanischen Wortschatzes nicht verwendet, sodass
jedenfalls die 20 Zeichen (a, b, d, e, g, h, i, k, l, m, n, o, p, r, s, t, u,
v, x, z) des lateinischen Alphabets für die Darstellung des Indogermanischen
verbleiben. Hinzu kommen als indogermanische Sonderzeichen, einschließlich von
vier Laryngallauten, die 15 Zeichen (bʰ, dʰ, gʰ, gᵘ̯,
gᵘ̯ʰ, H, h₁, h₂, h₃, i̯, kʰ, kᵘ̯,
pʰ, tʰ, þ), so dass sich ein Zeichensatz von 35 Zeichen ergibt.
Ausgesondert werden zusätzlich die vier silbischen Liquide l̥, m̥, n̥
und r̥, sodass sich ein Gesamtzeichensatz von 39 Zeichen ergibt.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (35, bei Trennung von l̥, m̥, n̥, und r̥ von l, m, n und r) 39 Buchstaben (z. B. a, b, c, d usw.) und (69) Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Z |
Häufigkeit |
97 |
61 |
a |
653 |
225 |
0 |
á |
5 |
257,774 |
101,0306 |
ā̆ |
72 |
257 |
101 |
ā |
454 |
257,769 |
101,0301 |
ā́ |
5 |
98 |
62 |
b |
188 |
98,688 |
0062,02B0 |
bʰ |
530 |
100 |
64 |
d |
623 |
273 |
111 |
đ |
10 |
100,688 |
0064,02B0 |
dʰ |
432 |
101 |
65 |
e |
3007 |
233 |
0 |
é |
40 |
232 |
0 |
è |
1 |
275,774 |
113,0306 |
ē̆ |
114 |
275 |
113 |
ē |
423 |
7703 |
1E+17 |
ḗ |
8 |
601 |
259 |
ə |
425 |
8337 |
2091 |
ₑ |
99 |
103 |
67 |
g |
489 |
103,785 |
67,0311 |
g̑ |
206 |
103,688 |
0067,02B0 |
gʰ |
264 |
103,785,688 |
0067,0311,02B0 |
g̑ʰ |
241 |
103,7512,815 |
0067,1D58,032F |
gᵘ̯ |
149 |
103,785,7512,815 |
0067,0311,1D58,032F |
g̑ᵘ̯ |
2 |
103,7512,815,688 |
0067,1D58,032F,02B0 |
gᵘ̯ʰ |
85 |
103,785,7512,815,688 |
0067,0311,1D58,032F,02B0 |
g̑ᵘ̯ʰ |
2 |
104 |
68 |
h |
13 |
72 |
48 |
H |
6 |
104,8321 |
68,2081 |
h₁ |
57 |
104,8322 |
68,2082 |
h₂ |
125 |
104,8323 |
68,2083 |
h₃ |
25 |
105 |
69 |
i |
1193 |
237 |
00ED |
í |
2 |
299,774 |
012B,0306 |
ī̆ |
52 |
299 |
012B |
ī |
126 |
105,815 |
0069,032F |
i̯ |
282 |
107 |
006B |
k |
1136 |
107,785 |
006B,0311 |
k̑ |
471 |
107,688 |
006B,02B0 |
kʰ |
5 |
107,7512,815 |
006B,1D58,032F |
kᵘ̯ |
160 |
107,7512,815,688 |
006B,1D58,032F,02B0 |
kᵘ̯ʰ |
3 |
108 |
006C |
l |
1238 |
108,805 |
006C,0325 |
l̥ |
39 |
108,805,772 |
006C,0325,0304 |
l̥̄ |
7 |
109 |
006D |
m |
858 |
109,805 |
006D,0325 |
m̥ |
23 |
110 |
006E |
n |
1070 |
110,805 |
006E,0325 |
n̥ |
93 |
111 |
006F |
o |
2006 |
243 |
00F3 |
ó |
77 |
333,774 |
014D,0306 |
ō̆ |
68 |
333 |
014D |
ō |
215 |
8338 |
2092 |
ₒ |
21 |
112 |
70 |
p |
873 |
112,688 |
0070,02B0 |
pʰ |
10 |
114 |
72 |
r |
1848 |
114,805 |
72,0325 |
r̥ |
108 |
114,805,772 |
0072,0325,0304 |
r̥̄ |
14 |
115 |
73 |
s |
2056 |
116 |
74 |
t |
1261 |
116,688 |
0074,02B0 |
tʰ |
28 |
254 |
00FE |
þ |
6 |
117 |
75 |
u |
1016 |
250 |
00FA |
ú |
18 |
363,774 |
016B,0306 |
ū̆ |
65 |
363 |
016B |
ū |
94 |
117,815 |
0075,032F |
u̯ |
874 |
739 |
2000 |
ˣ |
8 |
122 |
007A |
z |
42 |
|
|
|
|
Hieraus lassen sich folgende Häufigkeiten ermitteln |
|
|
|
Z |
zusammengefasste Zeichen |
Häufigkeit |
Prozent |
a á ā̆ ā ā́ |
1189 |
4,50% |
|
B |
b |
188 |
0,70% |
bʰ |
bʰ |
530 |
2,00% |
D |
d đ |
633 |
2,40% |
dʰ |
dʰ |
432 |
1,60% |
E |
e é è ē̆ ē ḗ ə ₑ |
4117 |
15,70% |
G |
g g̑ |
695 |
2,70% |
Gʰ |
gʰ g̑ʰ |
505 |
1,90% |
Gᵘ̯ |
gᵘ̯ g̑ᵘ̯ |
151 |
0,60% |
Gᵘ̯ʰ |
gᵘ̯ʰ g̑ᵘ̯ʰ |
87 |
0,30% |
h |
h |
13 |
0,10% |
H |
H |
6 |
0,00% |
h₁ |
h₁ |
57 |
0,20% |
h₂ |
h₂ |
125 |
0,50% |
h₃ |
h₃ |
25 |
0,10% |
I |
i í ī̆ ī |
1373 |
5,20% |
J |
i̯ |
282 |
1,10% |
K |
k k̑ |
1607 |
6,10% |
kʰ |
kʰ |
5 |
0,00% |
Kᵘ̯ |
kᵘ̯ kᵘ̯ʰ |
163 |
0,60% |
L |
l |
1238 |
4,70% |
l̥ |
l̥ l̥̄ |
46 |
0,20% |
M |
m |
858 |
3,30% |
m̥ |
m̥ |
23 |
0,10% |
N |
n |
1070 |
4,10% |
n̥ |
n̥ |
93 |
0,40% |
O |
o ó ō̆ ō ₒ |
2387 |
9,10% |
P |
p |
873 |
3,30% |
pʰ |
pʰ |
10 |
0,00% |
R |
r |
1848 |
7,00% |
r̥ |
r̥ r̥̄ |
122 |
0,50% |
S |
s |
2056 |
7,80% |
T |
t |
1261 |
4,80% |
tʰ |
tʰ |
28 |
0,10% |
Þ |
þ |
6 |
0,00% |
U |
u ú ū̆ ū |
1193 |
4,60% |
V |
u̯ |
874 |
3,30% |
X |
ˣ |
8 |
0,00% |
Z |
z |
42 |
0,20% |
Summe (ohne Sonderzeichen) |
|
26219 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung
E |
e é è
ē̆ ē ḗ ə ₑ |
4117 |
15,70% |
O |
o ó
ō̆ ō ₒ |
2387 |
9,10% |
S |
s |
2056 |
7,80% |
R |
r |
1848 |
7,00% |
K |
k
k̑ |
1607 |
6,10% |
I |
i í
ī̆ ī |
1373 |
5,20% |
T |
t |
1261 |
4,80% |
L |
l |
1238 |
4,70% |
U |
u ú
ū̆ ū |
1193 |
4,60% |
A |
a á
ā̆ ā ā́ |
1189 |
4,50% |
N |
n |
1070 |
4,10% |
V |
u̯ |
874 |
3,30% |
P |
p |
873 |
3,30% |
M |
m |
858 |
3,30% |
G |
g
g̑ |
695 |
2,70% |
D |
d đ
|
633 |
2,40% |
bʰ |
bʰ |
530 |
2,00% |
Gʰ |
gʰ
g̑ʰ |
505 |
1,90% |
dʰ |
dʰ |
432 |
1,60% |
J |
i̯ |
282 |
1,10% |
B |
b |
188 |
0,70% |
Kᵘ̯ |
kᵘ̯
kᵘ̯ʰ |
163 |
0,60% |
Gᵘ̯ |
gᵘ̯
g̑ᵘ̯ |
151 |
0,60% |
h₂ |
h₂
|
125 |
0,50% |
r̥ |
r̥
r̥̄ |
122 |
0,50% |
n̥ |
n̥ |
93 |
0,40% |
Gᵘ̯ʰ |
gᵘ̯ʰ
g̑ᵘ̯ʰ |
87 |
0,30% |
h₁ |
h₁
|
57 |
0,20% |
l̥ |
l̥
l̥̄ |
46 |
0,20% |
Z |
z |
42 |
0,20% |
tʰ |
tʰ |
28 |
0,10% |
h₃ |
h₃
|
25 |
0,10% |
m̥ |
m̥ |
23 |
0,10% |
h |
h |
13 |
0,10% |
pʰ |
pʰ |
10 |
0,00% |
X |
ˣ |
8 |
0,00% |
H |
H |
6 |
0,00% |
Þ |
þ |
6 |
0,00% |
kʰ |
kʰ |
5 |
0,00% |
Danach ist der am häufigsten zur Darstellung des in der Gegenwart anerkannten indogermanischen Wortschatzes verwendete Buchstabe das e (4117 15,7 Prozent), gefolgt von o (2387 9,1 Prozent), s (2056 7,8 Prozent), r (1970), k (1607) und i (1373), während kʰ, H, þ, x, pʰ, h und h₃ nur selten gebraucht werden.