Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Altfriesischen verwendeten Buchstaben
Das Altfriesische ist neben dem Gotischen,
Altnordischen, Altenglischen, Altniederdeutschen (Altsächsischen,
Altniederfränkischen) und Althochdeutschen eine germanisch/germanistische
Einzelsprache. Sie tritt nach Einzelwörtern vor allem des 9. Jahrhunderts im
(11. bzw.) 13. Jahrhundert in schriftlicher Überlieferung hervor. Dabei
betrifft die Aufzeichnung vor allem Rechtstexte. Seine Grenze zum
Neufriesischen - bzw. dem von einigen Forschern darüber hinaus angenommenen
(zeitlich gesehenen und für die Zeit zwischen 1550 und 1800 angesetzten)
Mittelfriesischen - wird bei etwa 1550 gezogen (unübersehbare
Überlieferungslücke).
Der dadurch überkommene Wortschatz des
Altfriesischen ist schon mehrfach lexikalisch erfasst worden. Karl Freiherr von
Richthofens Wörterbuch aus der Mitte des 19. Jahrhunderts verzeichnet dabei
zwar auch die Belege der von ihm veröffentlichten Texte, ist aber sowohl
quellenmäßig wie auch sprachwissenschaftlich nur auf dem Stande seiner Zeit und
behandelt außerdem nicht jedes selbständige Wort als selbständigen Ansatz.
Ferdinand Holthausens Wörterbuch des frühen 20. Jahrhundets verbessert diesen
Stand durch die Aufnahme zahlreicher weiterer Wörter (ca. 1800) und durch
philologische Korrekturen. Sein nach Wortstämmen geordnetes, durch zwei
Nachträge ergänztes und gleichwohl möglicherweise nicht mehr als 60-75 Prozent
des überlieferten Wortschatzes erfassendes Werk ist aber sehr unübersichtlich
und in Einzelheiten überholt.
Aus diesem Grunde ist auf der Grundlage beider -
durchaus nicht vollkommener und vollständiger Wörterbücher und - in Parallele
zu einem indogermanisch-neuhochdeutschen Wörterbuch, einem
germanisch-neuhochdeutschen Wörterbuch, einem gotisch-neuhochdeutschen
Wörterbuch, einem altnordisch-neuhochdeutschen Wörterbuch, einem
altenglisch-neuhochdeutschen Wörterbuch, einem altniederdeutschen-neuhochdeutschen
Wörterbuch und einem althochdeutsch-neuhochdeutschen Wörterbuch auch ein
altfriesisch-neuhochdeutsches Wörterbuch mit rund 7500 Stichwörtern und
Verweisen in streng alphabetischer Reihenfolge erarbeitet worden. Dabei beginnt
der einzelne Artikel mit dem Lemma in einer normalisierten Hauptform und
eventuellen Nebenformen, die grundsätzlich auch als Verweise (verweisende
Ansätze) auf die Hauptform aufgenommen sind. Es folgen die Angaben der (ungefähren)
Anzahl (z. B. 1 für hapax legomena) der Belegstellen (und aus übergeordneten
Erwägungen die Angabe der [altfriesischen] Sprache). Dem
ist (grundsätzlich) eine grammatikalische Bestimmung des Wortes angefügt. Bei
der anschließenden Ermittlung der Bedeutung im Neuhochdeutschen ist ein
Mittelweg zwischen ganz besonderer Bedeutung im einzelnen, vermutlich öfter
auch vom Zufall bestimmten Kontext und allgemeinerer, durch die überlieferten
Kontexte nicht immer gesicherter etymologisch ausgerichteter Bedeutung
eingeschlagen worden. Im Anschluss hieran wird eine englische Bedeutung
angeführt. Darüber hinaus sind, soweit vorhanden, lateinische
Übersetzungsgleichungen angefügt. Weiter werden Verweise von Grundwörtern auf
Komposita und Hinweise auf nahestehende Wörter gegeben. Unter den Hinweisen
finden sich auch verwandte Wörter anderer germanischer/germanistischer Sprachen
(Gotisch, Altnordisch, Altenglisch, Altniederfränkisch, Altsächsisch,
Althochdeutsch, Mittelniederdeutsch, Mittelniederländisch, Mittelhochdeutsch
und Plattdeutsch/Neuniederdeutsch). Anschließend werden (die) Quellen des
Lemmas durch summarische Siglen angegeben, wobei gelegentlich eine Jahreszahl
für den ältesten Beleg angeführt wird. Im Anschluss hieran werden unter
Interferenz fremdsprachliche Wörter genannt, die formal oder inhaltlich das
nationalsprachliche Wort beeinflusst haben (könnten). Dem folgt (erstmals
grundsätzlich) die Etymologie des Lemmas. Danach wird unter Literatur die
lexikalische Fundstelle für das Stichwort offengelegt oder ein sonstiger
weiterführender Hinweis geboten. Vereinzelt folgen dem geläufige Redewendungen
oder Erklärungen von Besonderheiten eines Lemmas.
Erschlossenes Material ist durch * kenntlich
gemacht, wobei für erschlossene Lemmata der Asterisk am Beginn steht, für nicht
belegte, erschlossene Formen des Stichworts dagegen am Ende. Klammern und
Fragezeichen deuten Unsicherheiten und Vorbehalte an. Als Bausteine
etymologisch erkennbare Teile von Wörtern sind durch Bindestriche abgesondert.
Die Ordnung der Lemmata ist streng alphabetisch.
Lange und kurze Vokale werden dabei grundsätzlich nicht geschieden, doch folgt
bei Gleichheit im übrigen das Wort mit langem Vokal dem Wort mit kurzem Vokal
nach. Th steht hinter t, j hinter i.
Wie für das Indogermanische, Germanische,
Gotische, Altnordische, Altenglische, Altniederdeutsche und
Althochdeutsche so ist auch für das Altfriesische (erstmals) ein
neuhochdeutsch-altfriesisches Wörterbuch verfasst worden, welches das
Altfriesische von der neuhochdeutschen Sprache her aufschließen soll, indem es
eine Antwort etwa auf die Frage ermöglicht, wie das Altfriesische den
Sachverhalt bezeichnet, den das Neuhochdeutsche etwa als „Abend“, „Kopf“,
„Monat“, „Schulter“ oder „Wasser“ benennt. Dass auch hier noch manche Frage
bleibt und Verbesserungen möglich sind, versteht sich von selbst. Möge wie hier
auch insgesamt die germanistische Sprachforschung weiterführend eintreten und
die Grundlage für das Altfriesische überhaupt und damit für ein
altfriesisch-neuhochdeutsches wie ein neuhochdeutsch-altfriesisches Wörterbuch
verbessern - wie dies etwa durch die nahezu vollständige Verzettelung des
altfriesischen Wörterschatzes im Friesischen Institut in Groningen (Fries
Institut, Westersingel 28-30, Groningen) vorbereitet bzw. geschehen ist.
In den 12496 erfassten Ansätzen und Verweisen
des Grundwortschatzes sind 88758 Zeichen enthalten. Daraus errechnet sich eine
durchschnittliche Ansatzlänge von 7,1029 Zeichen. Zur Darstellung des
Altfriesischen ist grundsätzlich das Buchstabensystem (Alphabet) des
klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf
Besonderheiten des Altfriesischen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des
lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q[1x], r,
s, t, u, v, x, y, z). Hinzu kommen als altfriesische Sonderzeichen j und w. Hieraus ergibt sich eine
Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 54 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
6578 |
65 |
41 |
A |
3 |
257,774 |
101,0306 |
ā̆ |
5 |
257 |
101 |
ā |
534 |
226 |
0 |
â |
725 |
98 |
62 |
b |
1896 |
66 |
42 |
B |
4 |
99 |
63 |
c |
1142 |
100 |
64 |
d |
4595 |
101 |
65 |
e |
10396 |
69 |
45 |
E |
2 |
275,774 |
113,0306 |
ē̆ |
32 |
275 |
113 |
ē |
1141 |
234 |
00EA |
ê |
1202 |
102 |
66 |
f |
2307 |
70 |
46 |
F |
5 |
103 |
67 |
g |
2397 |
104 |
68 |
h |
4135 |
105 |
69 |
i |
6628 |
73 |
49 |
I |
2 |
299,774 |
012B,0306 |
ī̆ |
5 |
299 |
012B |
ī |
953 |
238 |
00EE |
î |
30 |
106 |
006A |
j |
341 |
74 |
004A |
J |
1 |
107 |
006B |
k |
3292 |
75 |
004B |
K |
2 |
108 |
006C |
l |
4405 |
76 |
004C |
L |
2 |
109 |
006D |
m |
2081 |
77 |
004D |
M |
4 |
110 |
006E |
n |
6971 |
78 |
004E |
N |
2 |
111 |
006F |
o |
2613 |
333,774 |
014D,0306 |
ō̆ |
17 |
333 |
014D |
ō |
763 |
244 |
00F4 |
ô |
17 |
112 |
70 |
p |
1326 |
80 |
50 |
P |
4 |
113 |
71 |
q |
33 |
114 |
72 |
r |
6421 |
82 |
52 |
R |
5 |
115 |
73 |
s |
4604 |
83 |
53 |
S |
3 |
116 |
74 |
t |
5393 |
117 |
75 |
u |
1868 |
85 |
55 |
U |
2 |
363 |
016B |
ū |
660 |
118 |
76 |
v |
677 |
119 |
77 |
w |
2099 |
87 |
57 |
W |
4 |
120 |
78 |
x |
80 |
121 |
79 |
y |
2 |
122 |
007A |
z |
290 |
|
|
|
|
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā̆ ā â |
7845 |
8,80% |
B |
b B |
1900 |
2,10% |
C |
c |
1142 |
1,30% |
D |
d |
4595 |
5,20% |
E |
e E ē̆ ē ê |
12773 |
14,40% |
F |
f F |
2312 |
2,60% |
G |
g |
2397 |
2,70% |
H |
h |
4135 |
4,70% |
I |
i I ī̆ ī î |
7618 |
8,60% |
J |
j J |
342 |
0,40% |
K |
k K |
3294 |
3,70% |
L |
l L |
4407 |
5,00% |
M |
m M |
2085 |
2,40% |
N |
n N |
6973 |
7,90% |
O |
o ō̆ ō ô |
3410 |
3,80% |
P |
p P |
1330 |
1,50% |
Q |
q |
33 |
0,00% |
R |
r R |
6426 |
7,20% |
S |
s S |
4607 |
5,20% |
T |
t |
5393 |
6,10% |
U |
u U ū |
2530 |
2,90% |
V |
v |
677 |
0,80% |
W |
w W |
2103 |
2,40% |
X |
x |
80 |
0,10% |
Y |
y |
2 |
0,00% |
Z |
z |
290 |
0,30% |
Summe |
88699 |
100% |
Ordnet
man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
E |
e E ē̆ ē ê |
12773 |
14,40% |
A |
a A ā̆ ā â |
7845 |
8,80% |
I |
i I ī̆ ī î |
7618 |
8,60% |
N |
n N |
6973 |
7,90% |
R |
r R |
6426 |
7,20% |
T |
t |
5393 |
6,10% |
S |
s S |
4607 |
5,20% |
D |
d |
4595 |
5,20% |
L |
l L |
4407 |
5,00% |
H |
h |
4135 |
4,70% |
O |
o ō̆ ō ô |
3410 |
3,80% |
K |
k K |
3294 |
3,70% |
U |
u U ū |
2530 |
2,90% |
G |
g |
2397 |
2,70% |
F |
f F |
2312 |
2,60% |
W |
w W |
2103 |
2,40% |
M |
m M |
2085 |
2,40% |
B |
b B |
1900 |
2,10% |
P |
p P |
1330 |
1,50% |
C |
c |
1142 |
1,30% |
V |
v |
677 |
0,80% |
J |
j J |
342 |
0,40% |
Z |
z |
290 |
0,30% |
X |
x |
80 |
0,10% |
Q |
q |
33 |
0,00% |
Y |
y |
2 |
0,00% |