Модель анотації текстового корпусу  як засіб дослідження художньої картини світу

Гладкова Ганна Павлівна, асп.

Київський національний університет імені Тараса Шевченка

2010.– Vol. 4 : 524-528Pdf


Статтю присвячено розробці трирівневої моделі анотації лексичних одиниць художнього тексту, яка дозволяє проводити комплексне вивчення мовного явища у єдності його семантики, синтактики та прагматики, що у свою чергу дає змогу вийти на рівень аналізу картини світу художнього твору.

Ключові слова: корпус, анотація, XML, запит.


Статья посвящена разработке трехуровневой модели аннотации лексических единиц художественного текста, которая позволяет провести комплексное изучение исследуемого языкового явления в единстве его семантики, синтактики и прагматики и, таким образом, выйти на уровень анализа художественной картины мира.

Ключевые слова: корпус, аннотация, XML, запрос.


The paper describes a three-level annotation scheme for the lexical corpus designed for use in studies of language registers. The presented scheme incorporates semantics, syntax and pragmatics of lexical items, thus enabling the researcher to study the role they play in language world model arised from literary texts.

Key words: corpus, annotation, XML, query.


REFERENCES

  1. Гвишиани Н.Б. Практикум по корпусной лингвистике: Учебное пособие по английскому языку / Н.Б. Гвишиани. – М., Высшая школа, 2008. – 191 с.
  2. Archer D. et al. The UCREL semantic analysis system [Electronic resource] / Archer D., Piao S., Rayson P., McEnery T. // Proc. of the workshop on Beyond Named Entity Recognition Semantic labelling for NLP tasks in association with 4th International Conference on Language Resources and Evaluation (LREC 2004), 25th May 2004, Lisbon, Portugal. – Paris: ELRA, 2004. – pp. 7-12. – http://www.comp.lancs.ac.uk/ computing/users/paul/publications/usas_lrec04ws.pdf.
  3. Aston G., Burnard L. Introducing XAIRA: an XML-aware concordance program [Electronic resource] / Guy Aston, Lou Burnard. – Presentation at workshop held at TALC 2006. – http://www.oucs.ox.ac.uk/ rts/xaira/Talks/xaira-wkshop.odp.
  4. Baker P. A Glossary of Corpus Linguistics / Paul Baker, Andrew Hardie, Tony McEnery. – Edinburgh: Edinburgh University Press, 2006. – 187 p.
  5. Boag S. et al. XQuery 1.0: An XML Query Language [Electronic resource] / Scott Boag, Don Chamberlin, Mary F. Fernández. – 2007. – http://www.w3.org/TR/xquery.
  6. Bray T. et al. Extensible Markup Language (XML) 1.1 (Second Edition) [Electronic resource] / T. Bray, J. Paoli, C. M. Sperberg-McQueen. – http://www.w3.org/TR/2006/REC-xml11-20060816.
  7. Duchet J.-L. Alinea: a language independant tool for bi-text processing [Electronic resource] / JeanLouis Duchet, Oliever Kraif // JRC EU-Enlargement Workshop: Exploiting parallel corpora in up to 20 languages. JRC-Ispra, Italy, 26-27.09.2005. – http://langtech.jrc.it/0509_EU-Enlargement-Workshop.html.
  8. Garside R. The CLAWS Word-tagging System [Electronic resource] / Roger Garside // The Computational Analysis of English: A Corpus-based Approach. – London: Longman, 1987. – http://ucrel.lancs.ac.uk/ papers/ClawsWordTaggingSystemRG87.pdf.
  9. Gladkova G.P., Drozd A.A. Towards easier querying of XML-based linguistic corpora / G.P. Gladkova, A.А. Drozd // Таврический Вестник Информатики и Математики. – 2009. – № 2. – С. 71-77.
  10. Gries S. Corpora in cognitive linguistics: Corpus-based approaches to syntax and lexis / S. Gries (ed). – Berlin: Walter de Gruyter, 2006. – 352 p. – (Trends in linguistics. Studies and monographs; 172).
  11. Kennedy G. D. An Introduction to Corpus Linguistics / Graeme Kennedy. – London: Longman, 1998. 12. Piao S. A Highly Accurate Sentence and Paragraph Breaker [Electronic resource] / Scott Piao, 2008. – http://text0.mib.man.ac.uk:8080/scottpiao/sent_detector.