Köbler, Gerhard
Die Häufigkeit der zur
Darstellung des Altnordischen verwendeten Buchstaben
Das Altnordische ist neben dem Gotischen, Altenglischen,
Althochdeutschen, Altniederdeutschen (Altsächsischen, Altniederfränkischen) und
Altfriesischen eine germanistische Einzelsprache. Sie tritt nach den ältesten,
bis ins zweite nachchristliche Jahrhundert zurückreichenden Runeninschriften
des Urnordischen im 12. Jahrhundert in schriftlicher Überlieferung hervor.
Dabei betrifft die Aufzeichnung vor allem poetische und prosaische Literatur,
daneben auch Rechtstexte. Die Grenze zum Neunordischen wird bei etwa 1500
gezogen.
Der durch die Quellen überkommene Wortschatz der
verschiedenen altnordischen Einzelsprachen (altostnordisch = altdänisch,
altschwedisch; altwestnordisch, altnorwegisch, altisländisch, altfaröisch) ist schon
mehrfach lexikalisch erfasst worden. Die einzelnen Lexika sind aber insgesamt
noch unzureichend. Am besten gibt wohl den Grundwortschatz Jan de Vries'
Altnordisches etymologisches Wörterbuch, 2. A. Leiden 1962 wieder, das freilich
auch, da zu spekulativ, als etymologisch nicht völlig zuverlässig eingeschätzt
wird.
Immerhin ermöglicht es in Parallele zu entsprechenden
Arbeiten zum Indogermanischen (1980, 2. A. 1982), Germanischen (1981),
Gotischen (1981), Altniederdeutschen (2. A. 1982), Altfriesischen (1983),
Altenglischen (1985) und Althochdeutschen (3. A. 1987) eine erste, nach dem
altwestnordischen Altisländischen normalisierte streng alphabetisch geordnete
Erfassung des Grundwortschatzes, der sich auf etwa 12000 Wörter schätzen lässt.
Dabei beginnt der einzelne Artikel mit dem Lemma in einer normalisierten
Hauptform und eventuellen Nebenformen, welche grundsätzlich auch als Verweise
auf die Hauptform aufgenommen sind. Es folgt die Angabe der Sprache (an.). Dem
ist eine grammatikalische Bestimmung des Wortes angefügt. Bei der
anschließenden Ermittlung der Bedeutung ist ein Mittelweg zwischen ganz
spezieller Bedeutung im einzelnen Kontext und allgemeiner, durch die Kontexte
nicht immer gesicherter etymologisch ausgerichteter Bedeutung versucht worden.
Im Anschluss hieran werden fremdsprachliche Wörter angeführt, welche formal
oder inhaltlich das nationalsprachliche Wort beeinflusst haben (könnten).
Weiter werden Hinweise auf nahestehende Wörter gegeben, wie etwa von Grundwörtern
auf Komposita. Den Beschluss bildet meist ein Hinweis auf die einschlägige
Seitenzahl de Vries'. Darüberhinaus sind, soweit vorhanden, lateinische
Übersetzungsgleichungen angefügt, um deren altnordische Bestandteile das
Material de Vries' auch erweitert ist.
Formal ist erschlossenes Material durch * und sind
Homonyme durch (1), (2) usw., hapax legomena durch 1 kenntlich gemacht.
Klammern und Fragezeichen deuten Unsicherheiten und Vorbehalte an. Erkennbare Teile
von Wörtern sind durch Bindestriche abgesondert. Þ bzw. þ steht hinter t, ð hinter d, j hinter i, æ, ø, œ und ǫ
hinter y.
In den 12443 erfassten
Ansätzen und Verweisen sind 69496 Zeichen enthalten. Daraus errechnet sich eine
durchschnittliche Ansatzlänge von 5,5851 Zeichen. Zur Darstellung des
Altnordischen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen
Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten
des Altnordischen angepasst werden muss.
Ausgangspunkt sind
also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k,
l, m, n, o, p, q, r, s, t, u, v, x, y, z), wobei das q aber im Altnordischen
nicht verwendet wird. Hinzu kommen als altnordische Sonderzeichen j, þ und w
sowie æ, œ, ø, ǫ. Hieraus ergibt sich eine
Gesamtzeichenzahl von 30 (23 + 7) Zeichen.
Die Häufigkeit ihrer
Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache
besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine
besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines
von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms
selbst ermittelt.
Dieses gelangt unter
der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung
aller 30 Buchstaben (z. B. a, b, c, d usw.) und 60 Buchstabenvarianten (z. B.
a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
7458 |
65 |
41 |
A |
5 |
257 |
101 |
ā |
768 |
230 |
0 |
æ |
603 |
98 |
62 |
b |
1022 |
66 |
42 |
B |
29 |
384 |
180 |
ƀ |
3 |
99 |
63 |
c |
5 |
100 |
64 |
d |
1325 |
68 |
44 |
D |
13 |
240 |
00F0 |
ð |
1768 |
101 |
65 |
e |
2968 |
69 |
45 |
E |
17 |
275 |
113 |
ē |
154 |
102 |
66 |
f |
1982 |
70 |
46 |
F |
13 |
103 |
67 |
g |
3106 |
71 |
47 |
G |
27 |
104 |
68 |
h |
1443 |
72 |
48 |
H |
36 |
105 |
69 |
i |
5131 |
73 |
49 |
I |
4 |
299 |
012B |
ī |
580 |
298 |
012A |
Ī |
4 |
106 |
006A |
j |
1319 |
74 |
004A |
J |
4 |
107 |
006B |
k |
3306 |
108 |
006C |
l |
4622 |
76 |
004C |
L |
4 |
109 |
006D |
m |
1725 |
77 |
004D |
M |
10 |
110 |
006E |
n |
4495 |
78 |
004E |
N |
14 |
111 |
006F |
o |
979 |
79 |
004F |
O |
9 |
333 |
014D |
ō |
702 |
339 |
153 |
œ |
365 |
248 |
00F8 |
ø |
134 |
491 |
01EB |
ǫ |
713 |
112 |
70 |
p |
1197 |
114 |
72 |
r |
8205 |
82 |
52 |
R |
27 |
115 |
73 |
s |
4074 |
83 |
53 |
S |
25 |
116 |
74 |
t |
3391 |
84 |
54 |
T |
2 |
254 |
00FE |
þ |
493 |
222 |
00DE |
Þ |
3 |
117 |
75 |
u |
1573 |
363 |
016B |
ū |
522 |
362 |
016A |
Ū |
2 |
117,815 |
0075,032F |
u̯ |
1 |
118 |
76 |
v |
1525 |
86 |
56 |
V |
17 |
119 |
77 |
w |
29 |
120 |
78 |
x |
57 |
121 |
79 |
y |
1010 |
89 |
59 |
Y |
4 |
563 |
233 |
ȳ |
331 |
122 |
007A |
z |
142 |
Hieraus
lassen sich folgende Häufigkeiten ermitteln |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā æ |
8834 |
12,70% |
(a |
aA ā [ohne æ] |
8231 |
11,8 %) |
(ae |
æ |
603 |
0,9 %) |
B |
b B ƀ |
1054 |
1,50% |
C |
c |
5 |
0,00% |
D |
d D ð |
3106 |
4,50% |
E |
e E ē |
3139 |
4,50% |
F |
f F |
1995 |
2,90% |
G |
g G |
3133 |
4,50% |
H |
h H |
1479 |
2,10% |
I |
i I ī Ī |
5719 |
8,20% |
J |
j J |
1323 |
1,90% |
K |
k |
3306 |
4,80% |
L |
l L |
4626 |
6,70% |
M |
m M |
1735 |
2,50% |
N |
n N |
4509 |
6,50% |
O |
o O ō œ ø ǫ |
2902 |
4,20% |
(o |
o O ō [ohne œ, ø, ǫ] |
1690 |
2,4 %) |
(œ |
œ |
365 |
0,5 %) |
(ø |
ø |
134 |
0,2 %) |
(ǫ |
ǫ |
713 |
1,0 %) |
P |
p |
1197 |
1,70% |
R |
r R |
8232 |
11,80% |
S |
s S |
4099 |
5,90% |
T |
t T |
3393 |
4,90% |
Þ |
þ Þ |
496 |
0,70% |
U |
u ū Ū |
2097 |
3,00% |
V |
u̯ v V |
1543 |
2,20% |
W |
w |
29 |
0,00% |
X |
x |
57 |
0,10% |
Y |
y Y ȳ |
1345 |
1,90% |
Z |
z |
142 |
0,20% |
Summe (ohne Sonderzeichen) |
69495 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so
entsteht folgende Reihung
A |
a A ā æ |
8834 |
12,70% |
R |
r R |
8232 |
11,80% |
(a |
aA ā |
8231 |
11,8 %) |
I |
i I ī Ī |
5719 |
8,20% |
L |
l L |
4626 |
6,70% |
N |
n N |
4509 |
6,50% |
S |
s S |
4099 |
5,90% |
T |
t T |
3393 |
4,90% |
K |
k |
3306 |
4,80% |
E |
e E ē |
3139 |
4,50% |
G |
g G |
3133 |
4,50% |
D |
d D ð |
3106 |
4,50% |
O |
o O ō œ ø ǫ |
2902 |
4,20% |
U |
u ū Ū |
2097 |
3,00% |
F |
f F |
1995 |
2,90% |
M |
m M |
1735 |
2,50% |
(o |
o O ō |
1690 |
2,4 %) |
V |
u̯ v V |
1543 |
2,20% |
H |
h H |
1479 |
2,10% |
Y |
y Y ȳ |
1345 |
1,90% |
J |
j J |
1323 |
1,90% |
P |
p |
1197 |
1,70% |
B |
b B ƀ |
1054 |
1,50% |
(ǫ |
ǫ |
713 |
1,0 %) |
(ae |
æ |
603 |
0,9 %) |
Þ |
þ Þ |
496 |
0,70% |
(œ |
œ |
365 |
0,5 %) |
Z |
z |
142 |
0,20% |
(ø |
ø |
134 |
0,2 %) |
X |
x |
57 |
0,10% |
W |
w |
29 |
0,00% |
C |
c |
5 |
0,00% |