Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Indogermanischen
verwendeten Buchstaben
Das Indogermanische ist die sprachwissenschaftlich
erschlossene, möglicherweise an der Grenze zwischen Europa und Asien um 2000 v.
Chr. gesprochene, nach dem Indischen im Osten und dem Germanischen im Westen
als Indogermanisch (oder nach dem Indischen im Osten und Europa im Westen
[wegen nichtindogermanischer europäischer Sprachen weniger treffend] als
Indoeuropäisch) benannte, in sich keineswegs statische, sondern durchaus sich
dynamisch verändernde Sprache. Sie ist örtlich die in rund 70 in der Gegenwart
noch gebräuchlichen Sprachen fortwirkende, ihre Angehörigen zu der am weitesten
verbreiteten Sprachgruppe der Erde verbindende Sprache. Außerdem ist sie
zeitlich die älteste bekannte und bislang auch die älteste noch erkennbare, in
das Dunkel der weitgehend unbekannten Vorzeit zurückreichende Vorstufe des auf
sie zurückführbaren Deutschen.
Zu der indogermanischen
Sprachenfamilie gehören im Einzelnen folgende (14 [bzw. 18]), teils
europäische, teils asiatische Sprachgruppen (mit Angabe des Zeitpunkts der
ältesten Überlieferung der entsprechenden Einzelsprachen): indisch vedisch (2. Jt. v. Chr.), Sanskrit (ca. 500 v.-700 n.
Chr.), iranisch avestisch (7. Jh. v.
Chr.), altpersisch (520-350 v. Chr), kurdisch, afghanisch, balutschisch, ossetisch,
sarmatisch, skythisch, armenisch (5.
Jh. n. Chr. [407]), tocharisch (v. 7.
Jh. n. Chr.), hethitisch (2. Jt. v.
Chr., überliefert in Keilschrift, im 19. Jh. v. Chr. weisen assyrische Quellen
auf Indogermanen in Südostanatolien hin,) luvisch, palaisch, lykisch, lydisch, phrygisch/dakisch (7. Jh. v. Chr.), griechisch (14. Jh. v. Chr.) pelasgisch,
albanisch (16./17. Jh. n. Chr.), illyrisch (v. Chr.) messapisch, italisch lateinisch (6. Jh. v. Chr.),
oskisch, umbrisch (v. Chr.), venetisch (v. Chr.), keltisch (2. H. 1. Jt. v. Chr.) gallisch, goidelisch, britannisch, germanisch gotisch (4. Jh. n. Chr.),
urnordisch (1. Jh. n. Chr.) bzw. altnordisch (12. Jh.), altenglisch (7. Jh. n.
Chr.), althochdeutsch (8. Jh. n. Chr.), altsächsisch (8.? bzw. 9. Jh. n. Chr.),
altniederfränkisch (9.? Jh.), altfriesisch (11. Jh. n. Chr.), baltisch litauisch, lettisch,
altpreußisch (Neuzeit) und slawisch bulgarisch
(9. Jh. n. Chr.), serbokroatisch, slowenisch, russisch, tschechisch,
slowakisch, polnisch, wendisch, sorbisch, polabisch, kaschubisch sowie
slowinzisch.
Da dieses Indogermanische infolge der Flüchtigkeit des
nur Gesprochenen in einer Welt ohne Schrift keine unmittelbar greifbaren
Überreste hinterlassen hat, muss es hilfsweise aus der erhaltenen Überlieferung
der von ihm abstammenden (14) Sprachgruppen bzw. der diesen angehörigen
Einzelsprachen zu wissenschaftlich-künstlichen, vielleicht in dieser Gestalt
nie und nirgends tatsächlich gesprochenen Formen rekonstruiert werden. Dabei
kann ein Ansatz grundsätzlich nur dann als schon indogermanisch anerkannt
werden, wenn er durch von einander unabhängige Zeugnisse mindestens zweier aus
dem Indogermanischen erwachsener Einzelsprachen (bzw. nach engerer Ansicht im
Germanischen und im Arischen [Indischen oder Iranischen] oder Hethitischen oder
Tocharischen) belegt ist. Zugleich ist allgemein festzustellen, dass sich Laute
genauer rekonstruieren lassen als Wörter und Wortformen (einschließlich
zusammengesetzter Verbformen), dass mögliche Bedeutungen oft unsicher bleiben
müssen und dass der Satzbau nur in gröbsten Umrissen nachgezeichnet werden
kann.
Das Ergebnis dieser seit dem ausgehenden 18. Jahrhundert
(William Jones [1786]) bzw. beginnenden 19. Jahrhundert (Franz Bopp
[1791-1867]) als erstes Beispiel vergleichender Sprachwissenschaft von der
internationalen indogermanischen bzw. indogermanistischen Sprachwissenschaft
durchgeführten idealtypisierenden Rekonstruktionstätigkeit hat zuletzt Julius
Pokorny (Indogermanisches etymologisches Wörterbuch, Bd. 1f. 1959ff.) in einem
semasiologisch vorgehenden Sammelwerk zusammengefasst, ohne die erst im Laufe
der Zeit vorgelegte, in Substanz und Methodik einigermaßen ungesicherte
Laryngaltheorie, welche die schon früher anerkannten indogermanischen Laute um
gewisse (3 bzw. 4) Laryngale (Kehlkopflaute h₁, h₂, h₃, bei
Unentscheidbarkeit H) bzw. weitere Murmelvokale vermehrt, zu berücksichtigen.
Pokorny hat sein Material grundsätzlich nach der im lateinisch geprägten
Abendland anerkannten alphabetischen Reihenfolge der Buchstaben (a , b, c, d
usw.) geordnet und dabei 29 Anfangsbuchstaben verwendet (a Seite 1, b Seite 91,
bʰ Seite 104, d Seite 175, dʰ Seite 233, e Seite 280, g
einschließlich g̑ Seite 349, gʰ einschließlich g̑ʰ Seite 407, gᵘ̯ einschließlich g̑ᵘ̯ und
gu̯
(sowie g̑u̯?) Seite 463, gᵘ̯ʰ einschließlich g̑ʰu̯ (g̑hu̯?)
Seite 487, h Seite 497, i Seite 499,
i̯ Seite 501, k einschließlich k̑
Seite 515, kʰ Seite 634 (nur
eine einzige Interjektion), kᵘ̯ (einschließlich kᵘ̯ʰ) Seite 635, l Seite 651 ohne l̥
als Anfangsbuchstabe, m Seite 693 ohne m̥
als Anfangsbuchstabe, n Seite 754, n̥
Seite 771, o Seite 772, p Seite 787,
(pʰ Seite 851,) r Seite 852, r̥ Seite 875, s Seite 876, t Seite 1053, u Seite 1103 und u̯
Seite 1108). Diese alphabetische
Ordnung gilt aber nur für die von ihm anerkannten (2044) Wurzeln (normalerweise
einsilbige, meist aus Konsonant, Vokal und Konsonant ([z. B. *bak-, *mel-,
*tor-], zuweilen aber auch aus Vokal (z. B. *a), aus Konsonant und Vokal (z. B.
*bē-), aus Vokal und Konsonant (z. B. *ab-), aus Konsonant, Konsonant,
Vokal und Konsonant (z. B. *bʰlāg̑-) oder aus Konsonant, Vokal,
Konsonant und Konsonant (z. B. *baˣmb-) oder anderen Lautfolgen bestehende
und in der Regel nicht mehr weiter auflösbare Sprachgrundelemente oft verbalen
Charakters).
Von den 2044 von Pokorny
anerkannten Wurzeln ist (im Gegensatz zu bei 14 Sprachgruppen insgesamt 16384
logisch-rechnerischen Möglichkeiten unterschiedlicher Nchweisbarkeit) tatsächlich
nur eine einzige (*tēu-) in allen 14 (freilich auch sehr unterschiedlich
umfangreich in Überlieferung bzw. Nachfolgesprachen bezeugten) Sprachgruppen
belegt. 8 Wurzeln sind in 13, 28 in 12, 36 in 11, 76 in 10, 85 in 9, 112 in 8,
146 in 7, 151 in 6, 221 in 5, 297 in 4, 406 in 3 Sprachgruppen nachgewiesen.
440 Ansätze sind nur in jeweils 2 der 14 Sprachgruppen ermittelbar.
1377 (= 67,4%) der Wurzeln
sind im Germanischen bezeugt, 1235 (= 60,4%) im Griechischen, 1098 (= 53,7%) im
Baltischen, 1008 (= 49,3%) im Indischen, 959 (= 46,9%) im Italischen, 941 (=
46%) im Slawischen, 920 (= 45%) im Keltischen, 682 (= 33,3%) im Iranischen, 572
(= 23%) im Armenischen, 325 (= 15,9%) im Albanischen, 260 (= 12,7%) im
Tocharischen, 155 (= 7,6%) im Hethitischen, 116 (= 5,6%) im Illyrischen und 81
(= 3,9%) im Phrygisch-Dakischen. Für die 682 Nachweise des Iranischen finden
sich dabei 577 (85%) auch in den (1088) Nachweisen des Indischen. Von den 81
Nachweisen des Phrygisch-Dakischen erscheinen dagegen nur jeweils 5% in den Nachweisen
des Italischen, Germanischen, Baltischen und Slawischen.
Entgegen der alphabetischen Ordnung der (2044) Wurzeln
hat Pokorny alle sachlich zu einer Wurzel gehörigen, lautlich-formal vor allem durch
Erweiterungen, aber auch durch andere Abänderungen wie etwa Ablaut vom
graphischen Erscheinungsbild der jeweiligen Wurzel abweichenden Ansätze aus
inhaltlichen Überlegungen in Wortnestern der sachlich bestimmenden Wurzel
zugesellt. Aus dieser sachlich-inhaltlichen Durchbrechung des rein
formal-alphabetischen
Ordnungsgrundsatzes ergibt sich ein gewisse Unübersichtlichkeit des
Zugangs zur indogermanischen Sprache. Für den sprachlich interessierten Laien
kann oder muss sie durch eine streng alphabetisch angeordnete Darstellung des
gesamten, über die (2044) Wurzeln hinausreichenden, mehr oder weniger
anerkannten indogermanischen Sprachmaterials ausgeglichen bzw. ergänzt werden.
Die aus der strengen formalen Reihung ihrerseits notwendig folgende alphabetisch-formale
Trennung von sprachlich-inhaltlich verwandten Wörtern kann oder muss wiederum durch Verweise
ausgeglichen werden.
Die Reihenfolge aller folglich im Interesse von Nutzern
strikt alphabetisch geordneten Ansätze (Lexeme) eines übersichtlichen indogermanischen
Wörterbuchs wird dabei durch das auf Grund der Rekonstruktionstätigkeit zu
vermutende, dem modernen Abc nachgebildete indogermanische „Alphabet“ bestimmt.
In diesem werden (wie im modernen Alphabet) kurze und lange Vokale nicht
unterschieden, wohl aber i und i̯, u und u̯. Das schwachtonige ə
wird wie e behandelt, die palatalen Laute g̑ und k̑ wie g und k, die
silbischen Liquide und Nasale l̥, m̥, n̥ und r̥ wie l, m, n
und r. Die (von Pokorny noch nicht verwendeten) Laryngale können, soweit Ansätze
mit Laryngalen bereits in den allgemeinen Darstellungen des Indogermanischen
geboten werden, (nutzerfreundlich sowohl) unter dem Konsonanten h (wie auch
unter den nach h angeführten Larnygalen h₁, h₂, h₃)
aufgeführt werden. Die Zeichen ₑ und ₒ (sowie Klammern, Sternchen,
Fragezeichen und Striche) werden für die Einordnung nicht beachtet. Klammern
und Fragezeichen zeigen Unsicherheiten und Nebenansätze an. Nebenansätze sind
außer als eigenständige Verweise grundsätzlich auch als Nebenform unter dem entsprechenden
Hauptansatz angeführt. Ununterbrochene und punktierte Unterstreichungen
erfassen die selbständigen, auch an ziffernmäßigen Angaben (z. B. ā 1/1
[d. h. Nr. 1 insgesamt und Nr. 1 im ersten Buchstaben), u̯rugʰi̯o-
2044/120 [d. h. Nr. 2044 insgesamt und Nr. 120 im letzten Buchstaben))
erkennbaren Wortansätze Pokornys, wobei die ununterbrochenen Unterstreichungen
die nicht weiter aufschlüsselbaren (primären) Wurzeln kennzeichnen. Striche
innerhalb der Ansätze trennen mögliche Einzelbestandteile (morphologische
Elemente) der Wörter von einander ab.
Insgesamt lassen sich bei der den erwähnten Grundsätzen
folgenden formalen Neuordnung des gesamten durch Rekonstruktion wahrscheinlich
zu machenden indogermanischen Wortschatzes (der 2044 Wurzeln) 6263 Ansätze und
Verweise in einzelnen Artikeln erfassen. Jeder von ihnen beginnt, da es ja eine
unmittelbare indogermanische Überlieferung nicht gibt, mit einem durch * (am
Lemmabeginn) als erschlossen oder rekonstruiert bezeichneten Ansatz, bei dem
eine für die Einordnung bestimmende Hauptform durch eine formal an eine andere
Stelle gehörige Nebenform ergänzt sein kann. Diesem Ansatz folgen die an sich
nicht nötige, aber in übergeordneten Zusammenhängen als Steuerungselement
verwendbare Angabe der Sprachzugehörigkeit (idg.), der Versuch einer
grammatikalischen Bestimmung der Wortart (z. B. Verb, Substantiv) bzw. des
Geschlechts (z. B. M., F., N.), der Versuch einer bedeutungsmäßigen
Erschließung für die neuhochdeutsche Sprache (durch Angabe von rund 8500
Bedeutungen, Interpretamenten oder „Übersetzungen“ [in neuer Rechtschreibung))
und der Verweis bzw. Hinweis auf abgeleitete, zugrundeliegende oder sonst
verwandte Wörter. Schließlich ist die Stelle angegeben, an welcher der
betreffende Ansatz bei Pokorny behandelt wird.
Die erschlossene Sprache des vermuteten, nachträglich als
Indogermanen bezeichneten Volkes enthält in ihren 6263 Ansätze 26219 Zeichen
(d. h. 4,18633 Zeichen pro Ansatz), die aber - wie nahezu alles in den
Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen
sind. Zu ihrer Darstellung ist grundsätzlich das Buchstabensystem (Alphabet)
des klassischen Lateinischen verwendet. Es muss aber in bestimmten Hinsichten
auf Besonderheiten des Indogermanischen angepasst werden, wobei jedoch im
Einzelnen leider verschiedene Unsicherheiten und Unschärfen in Kauf genommen
werden müssen.
Ausgangspunkt sind also die 24 Zeichen des lateinischen
Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y,
z). Davon werden jedoch die fünf Zeichen c, f, q, v und y für die Darstellung
des indogermanischen Wortschatzes meist nicht verwendet. Dementsprechend werden
nur 19 Zeichen des lateinischen Alpabets regelmäßig benützt (a, b, d, e, g, h,
i, k, l, m, n, o, p, r, s, t, u, x, z).
Hinzu kommen als indogermanische Sonderzeichen
einschließlich dreier Laryngallaute (h₁, h₂, h₃) bzw. bei
Unentscheidbarkeit vierer Laryngallaute (H, h₁, h₂, h₃ [ist
nicht bekannt, welcher der drei Laryngale bei der Rekonstruktion angesetzt
werden muss, wird H als Symbol dafür verwendet)) die 16 Zeichen (bʰ, dʰ,
gʰ, gᵘ̯, gᵘ̯ʰ, H, h₁, h₂, h₃,
i̯, kʰ, kᵘ̯, pʰ, tʰ, þ, u̯), so dass sich ein Zeichensatz von 35 Zeichen ergibt.
Bei Trennung vierer silbischer Liquide l̥, m̥, n̥ und r̥
von vier Liquiden entsteht ein Gesamtzeichensatz von 39 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn
meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber
in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen
habe ich sie mit Hilfe für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen
Datenverarbeitung selbverständlichen Vereinzelung aller (35, bei Trennung von l̥, m̥, n̥, und r̥ von l, m,
n und r) 39 Buchstaben (z. B. a, b, c, d usw.) und (69) Buchstabenvarianten (z.
B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
653 |
225 |
0 |
á |
5 |
257,774 |
101,0306 |
ā̆ |
72 |
257 |
101 |
ā |
454 |
257,769 |
101,0301 |
ā́ |
5 |
98 |
62 |
b |
188 |
98,688 |
0062,02B0 |
bʰ |
530 |
100 |
64 |
d |
623 |
273 |
111 |
đ |
10 |
100,688 |
0064,02B0 |
dʰ |
432 |
101 |
65 |
e |
3007 |
233 |
0 |
é |
40 |
232 |
0 |
è |
1 |
275,774 |
113,0306 |
ē̆ |
114 |
275 |
113 |
ē |
423 |
7703 |
1E+17 |
ḗ |
8 |
601 |
259 |
ə |
425 |
8337 |
2091 |
ₑ |
99 |
103 |
67 |
g |
489 |
103,785 |
67,0311 |
g̑ |
206 |
103,688 |
0067,02B0 |
gʰ |
264 |
103,785,688 |
0067,0311,02B0 |
g̑ʰ |
241 |
103,7512,815 |
0067,1D58,032F |
gᵘ̯ |
149 |
103,785,7512,815 |
0067,0311,1D58,032F |
g̑ᵘ̯ |
2 |
103,7512,815,688 |
0067,1D58,032F,02B0 |
gᵘ̯ʰ |
85 |
103,785,7512,815,688 |
0067,0311,1D58,032F,02B0 |
g̑ᵘ̯ʰ |
2 |
104 |
68 |
h |
13 |
72 |
48 |
H |
6 |
104,8321 |
68,2081 |
h₁ |
57 |
104,8322 |
68,2082 |
h₂ |
125 |
104,8323 |
68,2083 |
h₃ |
25 |
105 |
69 |
i |
1193 |
237 |
00ED |
í |
2 |
299,774 |
012B,0306 |
ī̆ |
52 |
299 |
012B |
ī |
126 |
105,815 |
0069,032F |
i̯ |
282 |
107 |
006B |
k |
1136 |
107,785 |
006B,0311 |
k̑ |
471 |
107,688 |
006B,02B0 |
kʰ |
5 |
107,7512,815 |
006B,1D58,032F |
kᵘ̯ |
160 |
107,7512,815,688 |
006B,1D58,032F,02B0 |
kᵘ̯ʰ |
3 |
108 |
006C |
l |
1238 |
108,805 |
006C,0325 |
l̥ |
39 |
108,805,772 |
006C,0325,0304 |
l̥̄ |
7 |
109 |
006D |
m |
858 |
109,805 |
006D,0325 |
m̥ |
23 |
110 |
006E |
n |
1070 |
110,805 |
006E,0325 |
n̥ |
93 |
111 |
006F |
o |
2006 |
243 |
00F3 |
ó |
77 |
333,774 |
014D,0306 |
ō̆ |
68 |
333 |
014D |
ō |
215 |
8338 |
2092 |
ₒ |
21 |
112 |
70 |
p |
873 |
112,688 |
0070,02B0 |
pʰ |
10 |
114 |
72 |
r |
1848 |
114,805 |
72,0325 |
r̥ |
108 |
114,805,772 |
0072,0325,0304 |
r̥̄ |
14 |
115 |
73 |
s |
2056 |
116 |
74 |
t |
1261 |
116,688 |
0074,02B0 |
tʰ |
28 |
254 |
00FE |
þ |
6 |
117 |
75 |
u |
1016 |
250 |
00FA |
ú |
18 |
363,774 |
016B,0306 |
ū̆ |
65 |
363 |
016B |
ū |
94 |
117,815 |
0075,032F |
u̯ |
874 |
739 |
2000 |
ˣ |
8 |
122 |
007A |
z |
42 |
|
|
|
|
Hieraus lassen sich
folgende Häufigkeiten ermitteln |
|
|
|
Zeichen |
Varianten |
Häufigkeit |
Prozent |
a á ā̆ ā ā́ |
1189 |
4,50% |
|
B |
b |
188 |
0,70% |
bʰ |
bʰ |
530 |
2,00% |
D |
d đ |
633 |
2,40% |
dʰ |
dʰ |
432 |
1,60% |
E |
e é è ē̆ ē ḗ ə ₑ |
4117 |
15,70% |
G |
g g̑ |
695 |
2,70% |
Gʰ |
gʰ g̑ʰ |
505 |
1,90% |
Gᵘ̯ |
gᵘ̯ g̑ᵘ̯ |
151 |
0,60% |
Gᵘ̯ʰ |
gᵘ̯ʰ g̑ᵘ̯ʰ |
87 |
0,30% |
h |
h |
13 |
0,10% |
H |
H |
6 |
0,00% |
h₁ |
h₁ |
57 |
0,20% |
h₂ |
h₂ |
125 |
0,50% |
h₃ |
h₃ |
25 |
0,10% |
I |
i í ī̆ ī |
1373 |
5,20% |
J |
i̯ |
282 |
1,10% |
K |
k k̑ |
1607 |
6,10% |
kʰ |
kʰ |
5 |
0,00% |
Kᵘ̯ |
kᵘ̯ kᵘ̯ʰ |
163 |
0,60% |
L |
l |
1238 |
4,70% |
l̥ |
l̥ l̥̄ |
46 |
0,20% |
M |
m |
858 |
3,30% |
m̥ |
m̥ |
23 |
0,10% |
N |
n |
1070 |
4,10% |
n̥ |
n̥ |
93 |
0,40% |
O |
o ó ō̆ ō ₒ |
2387 |
9,10% |
P |
p |
873 |
3,30% |
pʰ |
pʰ |
10 |
0,00% |
R |
r |
1848 |
7,00% |
r̥ |
r̥ r̥̄ |
122 |
0,50% |
S |
s |
2056 |
7,80% |
T |
t |
1261 |
4,80% |
tʰ |
tʰ |
28 |
0,10% |
Þ |
þ |
6 |
0,00% |
U |
u ú ū̆ ū |
1193 |
4,60% |
V |
u̯ |
874 |
3,30% |
X |
ˣ |
8 |
0,00% |
Z |
z |
42 |
0,20% |
Summe (39) |
|
26219 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so
entsteht folgende Reihung
E |
e é è
ē̆ ē ḗ ə ₑ |
4117 |
15,70% |
O |
o ó
ō̆ ō ₒ |
2387 |
9,10% |
S |
s |
2056 |
7,80% |
R |
r |
1848 |
7,00% |
K |
k k̑
|
1607 |
6,10% |
I |
i í
ī̆ ī |
1373 |
5,20% |
T |
t |
1261 |
4,80% |
L |
l |
1238 |
4,70% |
U |
u ú
ū̆ ū |
1193 |
4,60% |
A |
a á
ā̆ ā ā́ |
1189 |
4,50% |
N |
n |
1070 |
4,10% |
V |
u̯
|
874 |
3,30% |
P |
p |
873 |
3,30% |
M |
m |
858 |
3,30% |
G |
g g̑
|
695 |
2,70% |
D |
d
đ |
633 |
2,40% |
bʰ |
bʰ
|
530 |
2,00% |
Gʰ |
gʰ
g̑ʰ |
505 |
1,90% |
dʰ |
dʰ
|
432 |
1,60% |
J |
i̯
|
282 |
1,10% |
B |
b |
188 |
0,70% |
Kᵘ̯ |
kᵘ̯
kᵘ̯ʰ |
163 |
0,60% |
Gᵘ̯ |
gᵘ̯
g̑ᵘ̯ |
151 |
0,60% |
h₂ |
h₂
|
125 |
0,50% |
r̥ |
r̥
r̥̄ |
122 |
0,50% |
n̥ |
n̥ |
93 |
0,40% |
Gᵘ̯ʰ |
gᵘ̯ʰ
g̑ᵘ̯ʰ |
87 |
0,30% |
h₁ |
h₁
|
57 |
0,20% |
l̥
|
l̥
l̥̄ |
46 |
0,20% |
Z |
z |
42 |
0,20% |
tʰ |
tʰ
|
28 |
0,10% |
h₃ |
h₃
|
25 |
0,10% |
m̥ |
m̥ |
23 |
0,10% |
h |
h |
13 |
0,10% |
pʰ |
pʰ
|
10 |
0,00% |
X |
ˣ
|
8 |
0,00% |
H |
H |
6 |
0,00% |
Þ |
þ |
6 |
0,00% |
kʰ |
kʰ
|
5 |
0,00% |
Danach ist der am häufigsten zur Darstellung des in der
Gegenwart anerkannten indogermanischen Wortschatzes verwendete Buchstabe das e
(einschließlich des ə
4117 15,7 Prozent), gefolgt von o (2387 9,1 Prozent), s (2056 7,8 Prozent), r
(1970), k (1607) und i (1373), während kʰ, H, þ, x, pʰ, h und h₃
nur selten gebraucht werden. Davon lassen sich die vier silbischen Liquide auch
den vier Liquiden zuordnen. Entfernt man dann noch die für das Indogermanische
zwar von Pokorny vereinzelt verwendeten, aber nicht wirklich bedeutsamen
Zeichen pʰ,
tʰ, þ, ˣ und z, so ergibt sich für das Indogermanische vielleicht ein
ungefährer Gesamtzeichensatz von 30 Zeichen, der in fünf Vokale (a, e, i, o
,u), fünf stimmlose Plosive (p, t, k̑, k, kᵘ̯), fünf stimmhafte
Plosive (b, d, g̑, g, gᵘ̯), fünf aspirierte Plosive (bʰ, dʰ,
g̑ʰ, gʰ, gᵘ̯ʰ), zwei Nasale (m, n), vier
Frikative (s, h₁, h₂, h₃)
und
vier Approximanten (w, r, l, j) bzw. drei labiale Plosive (p, b, bʰ), drei
koronale Plosive (t, d, dʰ), drei velare Plosive (k, g, gʰ), die bei
Pokorny mit drei palatovelaren Plosiven (k̑, g̑, g̑ʰ) verbunden
sind, [sodass die Zahl der Buchstaben auf 27 sinkt], drei labiovelare Plosive (kᵘ̯,
gᵘ̯ , gᵘ̯ʰ), zwei Nasale (m, n), vier Frikative (s, h₁,
h₂, h₃) und vier Approximanten (w, r, l, j) gegliedert werden kann
und innerhalb der mehr oder weniger allgemein anerkannten Ansätze in den
ermittelten Häufigkeiten verwendet wird.