The Linguistic Information in the Electronic Corpus of Old Slavonic Texts
The Linguistic Information in the Electronic Corpus of Old Slavonic Texts
Author(s): Andrej Boyadzhiev, Tsvetana DimitrovaSubject(s): Language and Literature Studies
Published by: Институт за литература - БАН
Keywords: electronic corpora; linguistic annotation; lexicographic information; morphlogical and syntactic analysis
Summary/Abstract: Доклад посвящен включению лингвистических данных в электронном корпусе древних славянских текстов. Анализу подвергаются различные современные подходы в этом отношении. Приводятся сведения о форматах, использованных до сих пор в славянской научной традиции, а также делаются параллели с практикой включения языковых данных популярнейших проектов в области электронной обработки современных и древних языков. Подход авторов базирован на технологии языка описательной разметки XML (Extensible Markup Language) и все выводы сделаны на основании этого выбора.
Journal: Scripta & e-Scripta
- Issue Year: 2008
- Issue No: 6
- Page Range: 105-149
- Page Count: 45
- Language: English
- Content File-PDF