Start Texte Suche Lexikon Alignierung Verweise Publikationen Visu Englische Version Litauische Version Deutsche Version

Das Lexikon

Das Lexikon enthält das Vokabular von Donelaitis‘ Texten, nach Lemmata sortiert. Es ist nach dem Konkordanzprinzip aufgebaut.

Im dunkelgrauen Kasten am Kopf jedes Lemmaeintrages sind folgende Informationen angegeben: die Wortart(en) des Lemmas, seine Akzentuierung, inhärente Kategorien (z.B. Flexionsklasse oder Genus) sowie (litauische) Glossen seiner Bedeutung in den konkreten Vorkommnissen im Text – so wird z.B. taip, das ein Adverb, eine Partikel oder eine Konjunktion sein kann, in Donelaitis‘ Texten in den Bedeutungen 'taip', 'taip pat', 'tiek', 'taigi, todėl', 'labai, daug' und 'taip (kaip)' verwendet. Dazu kommt ein Link zum entsprechenden Wörterbucheintrag im LKŽ und die zehn nächsten Nachbarn des Lemmas im Lemmavektorraum in den Texten des Corpus.

Unterhalb des grauen Kastens sind die einzelnen Belege des Lemmas aufgelistet in der Form, in der sie im annotierten Grundtext auftauchen. So kommt das Lemma taip in drei Schreibungen vor: „taip“, „taìp“ und „tâip“. Unter jeder Form ist angegeben, wie oft und in welchen Versen sie vorkommt. Die Vers-ID hat das Format Sigle_Seite bzw. Blatt_Zeilennummer(Versnummer). Ein Klick auf eine ID öffnet die betreffende Textstelle in der annotierten Leseansicht. Des Weiteren enthält jeder Eintrag eine Transliteration in das moderne litauische Alphabet, das moderne standardlitauische Äquivalent der Form, ihre Wortart, ihre Flektion, Morphologie und ihre 10 nächsten Nachbarn im Wortvektorraum in den Texten des Corpus.

Die Informationen des Lexikons werden aus der Annotation der Texte generiert. Die zusätzlichen Angaben zu den Nachbarn des Lemmas und seiner Formen im Wortvektorraum wurden mit dem word2vec Tool (Mikolov 2013) erzeugt. Eine Nähe im Vektorraum spiegelt i.d.R. paradigmatische, syntagmatische und/oder metrische Ähnlichkeiten zum Ausgangswort wieder.

Die Siglen aller Texte im Corpus sind hier aufgelöst.


;