Donelaitis‘ Texte (DM, DMN, DPPN, DPN) wurden vers- und wortweise aligniert mit dem Text von Georg H. F. Nesselmanns deutscher Übersetzung (DMN, DPPN, DPN). Donelaitis‘ und Nesselmanns hexametrische Verse wurden paarweise in Tabellen eingetragen: in der Zeile der litauische Text, in der Spalte der deutsche. Jedes Token im Vers hat eine ID im Format Sigle_Versnummer_Nummer des Tokens im Vers. Die Siglen aller Texte im Corpus sind hier aufgelöst. Die zusätzliche, mit „ExVe“ (für „externer Vers“) markierte Zeile bzw. Spalte dient der Alignierung von Wörtern, die in der deutschen Übersetzung in einem anderen Vers stehen als im litauischen Original.
Ziel der Alignierung ist, direkte Entsprechungen zwischen dem litauischen Original und der deutschen Übersetzung zu markieren. Entsprechungen werden durch ein „x“ im korrespondierenden Feld der Tabelle markiert (ein „y“ markiert untrennbare Wortgruppen und Idiome). Die Alignierung umfasst nicht nur Fälle, in denen einem litauischen Token ein deutsches Token entspricht (1:1-Alignierung), sondern auch solche, in denen: einem litauischen Token mehrere deutsche Token entsprechen (1:n); mehreren litauischen Token ein deutsches Token entspricht (n:1); ein litauisches Token kein deutsches Gegenstück hat (1:0); ein deutsches Token kein litauisches Gegenstück hat (0:1); oder sich ganze Wortgruppen entsprechen (n:m).
Bei der Alignierung gilt das von I. Dan Melamed (1998: 3) formulierte Prinzip. Es wird nur dann keine Enstprechung zwischen Token in Original und Übersetzung markiert, wenn die folgende Frage positiv zu beantworten ist: Wäre die Übersetzung dem Original ähnlicher, wenn man das anscheinend überzählige Wort einfach streichen würde?
Die Alignierungsrichtlinien finden Sie hier.