Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Indogermanischen verwendeten Buchstaben
Das Indogermanische ist die
sprachwissenschaftlich erschlossene, möglicherweise an der Grenze zwischen
Europa und Asien um 2000 v. Chr. gesprochene, nach dem Indischen im Osten und
dem Germanischen im Westen als Indogermanisch (oder nach dem Indischen im Osten
und Europa im Westen [wegen nichtindogermanischer europäischer Sprachen weniger
treffend] als Indoeuropäisch) benannte, in sich keineswegs statische, sondern
durchaus sich dynamisch verändernde Sprache. Sie ist örtlich die in rund 70 in
der Gegenwart noch gebräuchlichen Sprachen fortwirkende, ihre Angehörigen zu
der am weitesten verbreiteten Sprachgruppe der Erde verbindende Sprache.
Außerdem ist sie zeitlich die älteste bekannte und bislang auch die älteste
noch erkennbare, in das Dunkel der weitgehend unbekannten Vorzeit
zurückreichende Vorstufe des auf sie zurückführbaren Deutschen.
Zu
der indogermanischen Sprachenfamilie gehören im Einzelnen folgende (14 [bzw.
18]), teils europäische, teils asiatische Sprachgruppen (mit Angabe des
Zeitpunkts der ältesten Überlieferung der entsprechenden Einzelsprachen): indisch vedisch (2. Jt. v. Chr.),
Sanskrit (ca. 500 v.-700 n. Chr.), iranisch
avestisch (7. Jh. v. Chr.), altpersisch (520-350 v. Chr), kurdisch, afghanisch,
balutschisch, ossetisch, sarmatisch, skythisch, armenisch (5. Jh. n. Chr. [407]), tocharisch (v. 7. Jh. n. Chr.), hethitisch
(2. Jt. v. Chr., überliefert in Keilschrift, im 19. Jh. v. Chr. weisen
assyrische Quellen auf Indogermanen in Südostanatolien hin,) luvisch, palaisch,
lykisch, lydisch, phrygisch/dakisch (7.
Jh. v. Chr.), griechisch (14. Jh. v.
Chr.) pelasgisch, albanisch (16./17.
Jh. n. Chr.), illyrisch (v. Chr.)
messapisch, italisch lateinisch (6.
Jh. v. Chr.), oskisch, umbrisch (v. Chr.), venetisch (v. Chr.), keltisch (2. H. 1. Jt. v. Chr.)
gallisch, goidelisch, britannisch, germanisch
gotisch (4. Jh. n. Chr.), urnordisch (1. Jh. n. Chr.) bzw. altnordisch (12.
Jh.), altenglisch (7. Jh. n. Chr.), althochdeutsch (8. Jh. n. Chr.),
altsächsisch (8.? bzw. 9. Jh. n. Chr.), altniederfränkisch (9.? Jh.),
altfriesisch (11. Jh. n. Chr.), baltisch litauisch,
lettisch, altpreußisch (Neuzeit) und slawisch
bulgarisch (9. Jh. n. Chr.), serbokroatisch, slowenisch, russisch,
tschechisch, slowakisch, polnisch, wendisch, sorbisch, polabisch, kaschubisch
sowie slowinzisch.
Da dieses Indogermanische infolge der
Flüchtigkeit des nur Gesprochenen in einer Welt ohne Schrift keine unmittelbar
greifbaren Überreste hinterlassen hat, muss es hilfsweise aus der erhaltenen
Überlieferung der von ihm abstammenden (14) Sprachgruppen bzw. der diesen
angehörigen Einzelsprachen zu wissenschaftlich-künstlichen, vielleicht in
dieser Gestalt nie und nirgends tatsächlich gesprochenen Formen rekonstruiert
werden. Dabei kann ein Ansatz grundsätzlich nur dann als schon indogermanisch
anerkannt werden, wenn er durch von einander unabhängige Zeugnisse mindestens
zweier aus dem Indogermanischen erwachsener Einzelsprachen (bzw. nach engerer
Ansicht im Germanischen und im Arischen [Indischen oder Iranischen] oder Hethitischen
oder Tocharischen) belegt ist. Zugleich ist allgemein festzustellen, dass sich
Laute genauer rekonstruieren lassen als Wörter und Wortformen (einschließlich
zusammengesetzter Verbformen), dass mögliche Bedeutungen oft unsicher bleiben
müssen und dass der Satzbau nur in gröbsten Umrissen nachgezeichnet werden
kann.
Das Ergebnis dieser seit dem ausgehenden
18. Jahrhundert (William Jones [1786]) bzw. beginnenden 19. Jahrhundert (Franz Bopp
[1791-1867]) als erstes Beispiel vergleichender Sprachwissenschaft von der
internationalen indogermanischen bzw. indogermanistischen Sprachwissenschaft
durchgeführten idealtypisierenden Rekonstruktionstätigkeit hat zuletzt Julius
Pokorny (Indogermanisches etymologisches Wörterbuch, Bd. 1f. 1959ff.) in einem
semasiologisch vorgehenden Sammelwerk zusammengefasst, ohne die erst im Laufe
der Zeit vorgelegte, in Substanz und Methodik einigermaßen ungesicherte
Laryngaltheorie, welche die schon früher anerkannten indogermanischen Laute um
gewisse (3 bzw. 4) Laryngale (Kehlkopflaute h₁, h₂, h₃, bei
Unentscheidbarkeit H) bzw. weitere Murmelvokale vermehrt, zu berücksichtigen.
Pokorny hat sein Material grundsätzlich nach der im lateinisch geprägten
Abendland anerkannten alphabetischen Reihenfolge der Buchstaben (a , b, c, d
usw.) geordnet und dabei 29 Anfangsbuchstaben verwendet (a Seite 1, b Seite 91,
bʰ Seite 104, d Seite 175, dʰ Seite 233, e Seite 280, g
einschließlich g̑ Seite 349,
gʰ einschließlich g̑ʰ Seite 407, gᵘ̯ einschließlich g̑ᵘ̯ und gu̯ (sowie g̑u̯?) Seite 463, gᵘ̯ʰ einschließlich g̑ʰu̯ (g̑hu̯?) Seite 487, h Seite 497, i Seite 499, i̯ Seite 501, k
einschließlich k̑
Seite 515, kʰ Seite 634
(nur eine einzige Interjektion), kᵘ̯ (einschließlich kᵘ̯ʰ) Seite 635, l Seite 651 ohne l̥
als Anfangsbuchstabe, m
Seite 693 ohne m̥ als Anfangsbuchstabe, n Seite 754, n̥ Seite
771, o Seite 772, p Seite
787, (pʰ Seite 851,) r Seite 852, r̥ Seite 875, s Seite 876, t Seite 1053, u Seite 1103
und u̯ Seite 1108).
Diese alphabetische Ordnung gilt aber nur für die von ihm anerkannten (2044)
Wurzeln (normalerweise einsilbige, meist aus Konsonant, Vokal und Konsonant
([z. B. *bak-, *mel-, *tor-], zuweilen aber auch aus Vokal (z. B. *a), aus
Konsonant und Vokal (z. B. *bē-), aus Vokal und Konsonant (z. B. *ab-),
aus Konsonant, Konsonant, Vokal und Konsonant (z. B. *bʰlāg̑-)
oder aus Konsonant, Vokal, Konsonant und Konsonant (z. B. *baˣmb-) oder
anderen Lautfolgen bestehende und in der Regel nicht mehr weiter auflösbare
Sprachgrundelemente oft verbalen Charakters).
Von
den 2044 von Pokorny anerkannten Wurzeln ist (im Gegensatz zu bei 14
Sprachgruppen insgesamt 16384 logisch-rechnerischen Möglichkeiten
unterschiedlicher Nchweisbarkeit) tatsächlich nur eine einzige (*tēu-) in
allen 14 (freilich auch sehr unterschiedlich umfangreich in Überlieferung bzw.
Nachfolgesprachen bezeugten) Sprachgruppen belegt. 8 Wurzeln sind in 13, 28 in
12, 36 in 11, 76 in 10, 85 in 9, 112 in 8, 146 in 7, 151 in 6, 221 in 5, 297 in
4, 406 in 3 Sprachgruppen nachgewiesen. 440 Ansätze sind nur in jeweils 2 der
14 Sprachgruppen ermittelbar.
1377
(= 67,4%) der Wurzeln sind im Germanischen bezeugt, 1235 (= 60,4%) im
Griechischen, 1098 (= 53,7%) im Baltischen, 1008 (= 49,3%) im Indischen, 959 (=
46,9%) im Italischen, 941 (= 46%) im Slawischen, 920 (= 45%) im Keltischen, 682
(= 33,3%) im Iranischen, 572 (= 23%) im Armenischen, 325 (= 15,9%) im
Albanischen, 260 (= 12,7%) im Tocharischen, 155 (= 7,6%) im Hethitischen, 116
(= 5,6%) im Illyrischen und 81 (= 3,9%) im Phrygisch-Dakischen. Für die 682
Nachweise des Iranischen finden sich dabei 577 (85%) auch in den (1088)
Nachweisen des Indischen. Von den 81 Nachweisen des Phrygisch-Dakischen
erscheinen dagegen nur jeweils 5% in den Nachweisen des Italischen, Germanischen,
Baltischen und Slawischen.
Entgegen der alphabetischen Ordnung der
(2044) Wurzeln hat Pokorny alle sachlich zu einer Wurzel gehörigen,
lautlich-formal vor allem durch Erweiterungen, aber auch durch andere
Abänderungen wie etwa Ablaut vom graphischen Erscheinungsbild der jeweiligen
Wurzel abweichenden Ansätze aus inhaltlichen Überlegungen in Wortnestern der
sachlich bestimmenden Wurzel zugesellt. Aus dieser sachlich-inhaltlichen
Durchbrechung des rein formal-alphabetischen
Ordnungsgrundsatzes ergibt sich ein gewisse Unübersichtlichkeit des
Zugangs zur indogermanischen Sprache. Für den sprachlich interessierten Laien
kann oder muss sie durch eine streng alphabetisch angeordnete Darstellung des
gesamten, über die (2044) Wurzeln hinausreichenden, mehr oder weniger
anerkannten indogermanischen Sprachmaterials ausgeglichen bzw. ergänzt werden.
Die aus der strengen formalen Reihung ihrerseits notwendig folgende
alphabetisch-formale Trennung von sprachlich-inhaltlich verwandten Wörtern kann oder muss wiederum durch Verweise
ausgeglichen werden.
Die Reihenfolge aller folglich im
Interesse von Nutzern strikt alphabetisch geordneten Ansätze (Lexeme) eines
übersichtlichen indogermanischen Wörterbuchs wird dabei durch das auf Grund der
Rekonstruktionstätigkeit zu vermutende, dem modernen Abc nachgebildete
indogermanische „Alphabet“ bestimmt. In diesem werden (wie im modernen
Alphabet) kurze und lange Vokale nicht unterschieden, wohl aber i und i̯,
u und u̯. Das schwachtonige ə wird wie e behandelt, die palatalen
Laute g̑ und k̑ wie g und k, die silbischen Liquide und Nasale l̥,
m̥, n̥ und r̥ wie l, m, n und r. Die (von Pokorny noch nicht
verwendeten) Laryngale können, soweit Ansätze mit Laryngalen bereits in den
allgemeinen Darstellungen des Indogermanischen geboten werden,
(nutzerfreundlich sowohl) unter dem Konsonanten h (wie auch unter den nach h
angeführten Larnygalen h₁, h₂, h₃) aufgeführt werden. Die
Zeichen ₑ und ₒ (sowie Klammern, Sternchen, Fragezeichen und
Striche) werden für die Einordnung nicht beachtet. Klammern und Fragezeichen
zeigen Unsicherheiten und Nebenansätze an. Nebenansätze sind außer als
eigenständige Verweise grundsätzlich auch als Nebenform unter dem
entsprechenden Hauptansatz angeführt. Ununterbrochene und punktierte
Unterstreichungen erfassen die selbständigen, auch an ziffernmäßigen Angaben
(z. B. ā 1/1 [d. h. Nr. 1 insgesamt und Nr. 1 im ersten Buchstaben), u̯rugʰi̯o-
2044/120 [d. h. Nr. 2044 insgesamt und Nr. 120 im letzten Buchstaben))
erkennbaren Wortansätze Pokornys, wobei die ununterbrochenen Unterstreichungen
die nicht weiter aufschlüsselbaren (primären) Wurzeln kennzeichnen. Striche
innerhalb der Ansätze trennen mögliche Einzelbestandteile (morphologische
Elemente) der Wörter von einander ab.
Insgesamt lassen sich bei der den
erwähnten Grundsätzen folgenden formalen Neuordnung des gesamten durch
Rekonstruktion wahrscheinlich zu machenden indogermanischen Wortschatzes (der
2044 Wurzeln) 6263 Ansätze und Verweise in einzelnen Artikeln erfassen. Jeder
von ihnen beginnt, da es ja eine unmittelbare indogermanische Überlieferung
nicht gibt, mit einem durch * (am Lemmabeginn) als erschlossen oder
rekonstruiert bezeichneten Ansatz, bei dem eine für die Einordnung bestimmende
Hauptform durch eine formal an eine andere Stelle gehörige Nebenform ergänzt
sein kann. Diesem Ansatz folgen die an sich nicht nötige, aber in
übergeordneten Zusammenhängen als Steuerungselement verwendbare Angabe der
Sprachzugehörigkeit (idg.), der Versuch einer grammatikalischen Bestimmung der
Wortart (z. B. Verb, Substantiv) bzw. des Geschlechts (z. B. M., F., N.), der
Versuch einer bedeutungsmäßigen Erschließung für die neuhochdeutsche Sprache
(durch Angabe von rund 8500 Bedeutungen, Interpretamenten oder „Übersetzungen“
[in neuer Rechtschreibung)) und der Verweis bzw. Hinweis auf abgeleitete,
zugrundeliegende oder sonst verwandte Wörter. Schließlich ist die Stelle
angegeben, an welcher der betreffende Ansatz bei Pokorny behandelt wird.
Die erschlossene Sprache des vermuteten,
nachträglich als Indogermanen bezeichneten Volkes enthält in ihren 6263 Ansätze
26219 Zeichen (d. h. 4,18633 Zeichen pro Ansatz), die aber - wie nahezu alles
in den Geisteswissenschaften - , einer eigenen Geschichte und Zukunft
unterworfen sind. Zu ihrer Darstellung ist grundsätzlich das Buchstabensystem
(Alphabet) des klassischen Lateinischen verwendet. Es muss aber in bestimmten
Hinsichten auf Besonderheiten des Indogermanischen angepasst werden, wobei
jedoch im Einzelnen leider verschiedene Unsicherheiten und Unschärfen in Kauf
genommen werden müssen.
Ausgangspunkt sind also die 24 Zeichen
des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r,
s, t, u, v, x, y, z). Davon werden jedoch die fünf Zeichen c, f, q, v und y für
die Darstellung des indogermanischen Wortschatzes meist nicht verwendet.
Dementsprechend werden nur 19 Zeichen des lateinischen Alpabets regelmäßig
benützt (a, b, d, e, g, h, i, k, l, m, n, o, p, r, s, t, u, x, z).
Hinzu kommen als indogermanische
Sonderzeichen einschließlich dreier Laryngallaute (h₁, h₂, h₃)
bzw. bei Unentscheidbarkeit vierer Laryngallaute (H, h₁, h₂, h₃
[ist nicht bekannt, welcher der drei Laryngale bei der Rekonstruktion angesetzt
werden muss, wird H als Symbol dafür verwendet)) die 16 Zeichen (bʰ, dʰ,
gʰ, gᵘ̯, gᵘ̯ʰ, H, h₁, h₂, h₃,
i̯, kʰ, kᵘ̯, pʰ, tʰ, þ, u̯), so dass sich ein Zeichensatz von 35
Zeichen ergibt. Bei Trennung vierer silbischer Liquide l̥, m̥, n̥
und r̥ von vier Liquiden entsteht ein Gesamtzeichensatz von 39 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (35, bei Trennung von l̥, m̥, n̥, und r̥ von l, m, n und r) 39 Buchstaben (z. B. a, b, c, d usw.) und (69) Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
653 |
225 |
0 |
á |
5 |
257,774 |
101,0306 |
ā̆ |
72 |
257 |
101 |
ā |
454 |
257,769 |
101,0301 |
ā́ |
5 |
98 |
62 |
b |
188 |
98,688 |
0062,02B0 |
bʰ |
530 |
100 |
64 |
d |
623 |
273 |
111 |
đ |
10 |
100,688 |
0064,02B0 |
dʰ |
432 |
101 |
65 |
e |
3007 |
233 |
0 |
é |
40 |
232 |
0 |
è |
1 |
275,774 |
113,0306 |
ē̆ |
114 |
275 |
113 |
ē |
423 |
7703 |
1E+17 |
ḗ |
8 |
601 |
259 |
ə |
425 |
8337 |
2091 |
ₑ |
99 |
103 |
67 |
g |
489 |
103,785 |
67,0311 |
g̑ |
206 |
103,688 |
0067,02B0 |
gʰ |
264 |
103,785,688 |
0067,0311,02B0 |
g̑ʰ |
241 |
103,7512,815 |
0067,1D58,032F |
gᵘ̯ |
149 |
103,785,7512,815 |
0067,0311,1D58,032F |
g̑ᵘ̯ |
2 |
103,7512,815,688 |
0067,1D58,032F,02B0 |
gᵘ̯ʰ |
85 |
103,785,7512,815,688 |
0067,0311,1D58,032F,02B0 |
g̑ᵘ̯ʰ |
2 |
104 |
68 |
h |
13 |
72 |
48 |
H |
6 |
104,8321 |
68,2081 |
h₁ |
57 |
104,8322 |
68,2082 |
h₂ |
125 |
104,8323 |
68,2083 |
h₃ |
25 |
105 |
69 |
i |
1193 |
237 |
00ED |
í |
2 |
299,774 |
012B,0306 |
ī̆ |
52 |
299 |
012B |
ī |
126 |
105,815 |
0069,032F |
i̯ |
282 |
107 |
006B |
k |
1136 |
107,785 |
006B,0311 |
k̑ |
471 |
107,688 |
006B,02B0 |
kʰ |
5 |
107,7512,815 |
006B,1D58,032F |
kᵘ̯ |
160 |
107,7512,815,688 |
006B,1D58,032F,02B0 |
kᵘ̯ʰ |
3 |
108 |
006C |
l |
1238 |
108,805 |
006C,0325 |
l̥ |
39 |
108,805,772 |
006C,0325,0304 |
l̥̄ |
7 |
109 |
006D |
m |
858 |
109,805 |
006D,0325 |
m̥ |
23 |
110 |
006E |
n |
1070 |
110,805 |
006E,0325 |
n̥ |
93 |
111 |
006F |
o |
2006 |
243 |
00F3 |
ó |
77 |
333,774 |
014D,0306 |
ō̆ |
68 |
333 |
014D |
ō |
215 |
8338 |
2092 |
ₒ |
21 |
112 |
70 |
p |
873 |
112,688 |
0070,02B0 |
pʰ |
10 |
114 |
72 |
r |
1848 |
114,805 |
72,0325 |
r̥ |
108 |
114,805,772 |
0072,0325,0304 |
r̥̄ |
14 |
115 |
73 |
s |
2056 |
116 |
74 |
t |
1261 |
116,688 |
0074,02B0 |
tʰ |
28 |
254 |
00FE |
þ |
6 |
117 |
75 |
u |
1016 |
250 |
00FA |
ú |
18 |
363,774 |
016B,0306 |
ū̆ |
65 |
363 |
016B |
ū |
94 |
117,815 |
0075,032F |
u̯ |
874 |
739 |
2000 |
ˣ |
8 |
122 |
007A |
z |
42 |
|
|
|
|
Hieraus lassen sich
folgende Häufigkeiten ermitteln |
|
|
|
Zeichen |
Varianten |
Häufigkeit |
Prozent |
a á ā̆ ā ā́ |
1189 |
4,50% |
|
B |
b |
188 |
0,70% |
bʰ |
bʰ |
530 |
2,00% |
D |
d đ |
633 |
2,40% |
dʰ |
dʰ |
432 |
1,60% |
E |
e é è ē̆ ē ḗ ə ₑ |
4117 |
15,70% |
G |
g g̑ |
695 |
2,70% |
Gʰ |
gʰ g̑ʰ |
505 |
1,90% |
Gᵘ̯ |
gᵘ̯ g̑ᵘ̯ |
151 |
0,60% |
Gᵘ̯ʰ |
gᵘ̯ʰ g̑ᵘ̯ʰ |
87 |
0,30% |
h |
h |
13 |
0,10% |
H |
H |
6 |
0,00% |
h₁ |
h₁ |
57 |
0,20% |
h₂ |
h₂ |
125 |
0,50% |
h₃ |
h₃ |
25 |
0,10% |
I |
i í ī̆ ī |
1373 |
5,20% |
J |
i̯ |
282 |
1,10% |
K |
k k̑ |
1607 |
6,10% |
kʰ |
kʰ |
5 |
0,00% |
Kᵘ̯ |
kᵘ̯ kᵘ̯ʰ |
163 |
0,60% |
L |
l |
1238 |
4,70% |
l̥ |
l̥ l̥̄ |
46 |
0,20% |
M |
m |
858 |
3,30% |
m̥ |
m̥ |
23 |
0,10% |
N |
n |
1070 |
4,10% |
n̥ |
n̥ |
93 |
0,40% |
O |
o ó ō̆ ō ₒ |
2387 |
9,10% |
P |
p |
873 |
3,30% |
pʰ |
pʰ |
10 |
0,00% |
R |
r |
1848 |
7,00% |
r̥ |
r̥ r̥̄ |
122 |
0,50% |
S |
s |
2056 |
7,80% |
T |
t |
1261 |
4,80% |
tʰ |
tʰ |
28 |
0,10% |
Þ |
þ |
6 |
0,00% |
U |
u ú ū̆ ū |
1193 |
4,60% |
V |
u̯ |
874 |
3,30% |
X |
ˣ |
8 |
0,00% |
Z |
z |
42 |
0,20% |
Summe (39) |
|
26219 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung
E |
e é è
ē̆ ē ḗ ə ₑ |
4117 |
15,70% |
O |
o ó
ō̆ ō ₒ |
2387 |
9,10% |
S |
s |
2056 |
7,80% |
R |
r |
1848 |
7,00% |
K |
k k̑
|
1607 |
6,10% |
I |
i í
ī̆ ī |
1373 |
5,20% |
T |
t |
1261 |
4,80% |
L |
l |
1238 |
4,70% |
U |
u ú
ū̆ ū |
1193 |
4,60% |
A |
a á
ā̆ ā ā́ |
1189 |
4,50% |
N |
n |
1070 |
4,10% |
V |
u̯
|
874 |
3,30% |
P |
p |
873 |
3,30% |
M |
m |
858 |
3,30% |
G |
g g̑
|
695 |
2,70% |
D |
d
đ |
633 |
2,40% |
bʰ |
bʰ
|
530 |
2,00% |
Gʰ |
gʰ
g̑ʰ |
505 |
1,90% |
dʰ |
dʰ
|
432 |
1,60% |
J |
i̯
|
282 |
1,10% |
B |
b |
188 |
0,70% |
Kᵘ̯ |
kᵘ̯
kᵘ̯ʰ |
163 |
0,60% |
Gᵘ̯ |
gᵘ̯
g̑ᵘ̯ |
151 |
0,60% |
h₂ |
h₂
|
125 |
0,50% |
r̥ |
r̥
r̥̄ |
122 |
0,50% |
n̥ |
n̥ |
93 |
0,40% |
Gᵘ̯ʰ |
gᵘ̯ʰ
g̑ᵘ̯ʰ |
87 |
0,30% |
h₁ |
h₁
|
57 |
0,20% |
l̥
|
l̥
l̥̄ |
46 |
0,20% |
Z |
z |
42 |
0,20% |
tʰ |
tʰ
|
28 |
0,10% |
h₃ |
h₃
|
25 |
0,10% |
m̥ |
m̥ |
23 |
0,10% |
h |
h |
13 |
0,10% |
pʰ |
pʰ
|
10 |
0,00% |
X |
ˣ
|
8 |
0,00% |
H |
H |
6 |
0,00% |
Þ |
þ |
6 |
0,00% |
kʰ |
kʰ
|
5 |
0,00% |
Danach ist der am häufigsten zur Darstellung des in der Gegenwart anerkannten indogermanischen Wortschatzes verwendete Buchstabe das e (einschließlich des ə 4117 15,7 Prozent), gefolgt von o (2387 9,1 Prozent), s (2056 7,8 Prozent), r (1970), k (1607) und i (1373), während kʰ, H, þ, x, pʰ, h und h₃ nur selten gebraucht werden. Davon lassen sich die vier silbischen Liquide auch den vier Liquiden zuordnen. Entfernt man dann noch die für das Indogermanische zwar von Pokorny vereinzelt verwendeten, aber nicht wirklich bedeutsamen Zeichen pʰ, tʰ, þ, ˣ und z, so ergibt sich für das Indogermanische vielleicht ein ungefährer Gesamtzeichensatz von 30 Zeichen, der in fünf Vokale (a, e, i, o ,u), fünf stimmlose Plosive (p, t, k̑, k, kᵘ̯), fünf stimmhafte Plosive (b, d, g̑, g, gᵘ̯), fünf aspirierte Plosive (bʰ, dʰ, g̑ʰ, gʰ, gᵘ̯ʰ), zwei Nasale (m, n), vier Frikative (s, h₁, h₂, h₃) und vier Approximanten (w, r, l, j) bzw. drei labiale Plosive (p, b, bʰ), drei koronale Plosive (t, d, dʰ), drei velare Plosive (k, g, gʰ), die bei Pokorny mit drei palatovelaren Plosiven (k̑, g̑, g̑ʰ) verbunden sind, [sodass die Zahl der Buchstaben auf 27 sinkt], drei labiovelare Plosive (kᵘ̯, gᵘ̯ , gᵘ̯ʰ), zwei Nasale (m, n), vier Frikative (s, h₁, h₂, h₃) und vier Approximanten (w, r, l, j) gegliedert werden kann und innerhalb der mehr oder weniger allgemein anerkannten Ansätze in den ermittelten Häufigkeiten verwendet wird.