Projects per year
Abstract
Статья посвящена способам корпусного выравнивания и аннотирования параллельных текстов на уровне клаузы. Работа строится на основе создания китайско-русского дискурсивного параллельного корпуса. В качестве пилотного материала был выбран китайский официальный документ «Доклад о работе правительства КНР 2017» и его перевод на русский язык. Данная работа состоит из трех общих частей: 1) характеристика принципов выравнивания двух текстов; 2) установление принципов аннотирования выделяемых единиц и создание параллельного корпуса, в котором выравнивание осуществляется на уровне клаузы; 3) статистика по разным типам русских синтаксических аналогов китайских клауз и интерпретация полученной информации. В первой части рассматривается, как в параллельном корпусе производится деление текстов на клаузы: сначала сегментация осуществляется в китайском тексте, затем в переводном русском тексте выделяются соответствующие элементы, называемые русскими синтаксическими аналогами (РСА) китайских клауз. Во второй части представлены принципы анализа и классификации РСА. В изученном материале разметки представлены 9 типов РСА китайских клауз: простые предложения, сложные предложения, группы предложений, фрагменты простых предложений, предложений с однородными сказуемыми, сложных предложений, части бессоюзных сложных предложений, сложносочиненных предложений и сложноподчиненных предложений. В третьей части сделаны выводы о том, что в большинстве случаев китайской клаузе может соответствовать монопредикативная конструкция в русском переводе. В других ситуациях китайские клаузы переводятся непредикативными словосочетаниями, полупредикативными причастными и деепричастными оборотами, полипредикативными сложными предложениями и группами предложений.
Translated title of the contribution | Chinese-Russian Parallel Discourse Corpus: Alignment of Clauses and Statistical Analysis |
---|---|
Original language | Russian |
Pages (from-to) | 60-73 |
Number of pages | 14 |
Journal | Известия Уральского федерального университета. Серия 2: Гуманитарные науки |
Volume | 175 |
Issue number | 20 (2) |
DOIs | |
Publication status | Published - 2018 |
WoS ResearchAreas Categories
- Humanities, Multidisciplinary
Level of Research Output
- VAK List
Fingerprint
Dive into the research topics of 'Chinese-Russian Parallel Discourse Corpus: Alignment of Clauses and Statistical Analysis'. Together they form a unique fingerprint.Projects
- 1 Active
-
Научная группа «Новые информационные технологии в теоретической и прикладной лингвистике»
Бабенко, Л. Г., Гладров, В., Томмола, Х. Т., Демьянков, В., Тирадо, Р. Г., Норман, Б. Ю., Плотникова, А. М., Казарин, Ю. В., Дудорова, М. В., Воронина, Т. М., Мухин, М. Ю., Слаутина, М. В., Мухина, И. К., Ахманаева, Н. А., Шелегин, П. Е., Ян, И., Цуй, Я., Гуляева, Г. Е., Старикова, К. В., Тупикова, З. В., Кирсанова, А. И., Казарин, М. Ю., Болдырев, Н. Н., Ван, Ц., Могиленских, И. Д., Галиева, А. Р., Цыганов, Т. В., Глазырин, В. А., Степанова, А. Н., Романова, М. А., Пирожок, Е. А. & Эльстон-Бирон, А. В.
25/07/2014 → …
Project: Research › Research Group