КИТАЙСКО-РУССКИЙ ПАРАЛЛЕЛЬНЫЙ ДИСКУРСИВНЫЙ КОРПУС: ВЫРАВНИВАНИЕ НА УРОВНЕ КЛАУЗЫ И СТАТИСТИЧЕСКИЙ АНАЛИЗ

Translated title of the contribution: Chinese-Russian Parallel Discourse Corpus: Alignment of Clauses and Statistical Analysis

Research output: Contribution to journalArticlepeer-review

Abstract

Статья посвящена способам корпусного выравнивания и аннотирования параллельных текстов на уровне клаузы. Работа строится на основе создания китайско-русского дискурсивного параллельного корпуса. В качестве пилотного материала был выбран китайский официальный документ «Доклад о работе правительства КНР 2017» и его перевод на русский язык. Данная работа состоит из трех общих частей: 1) характеристика принципов выравнивания двух текстов; 2) установление принципов аннотирования выделяемых единиц и создание параллельного корпуса, в котором выравнивание осуществляется на уровне клаузы; 3) статистика по разным типам русских синтаксических аналогов китайских клауз и интерпретация полученной информации. В первой части рассматривается, как в параллельном корпусе производится деление текстов на клаузы: сначала сегментация осуществляется в китайском тексте, затем в переводном русском тексте выделяются соответствующие элементы, называемые русскими синтаксическими аналогами (РСА) китайских клауз. Во второй части представлены принципы анализа и классификации РСА. В изученном материале разметки представлены 9 типов РСА китайских клауз: простые предложения, сложные предложения, группы предложений, фрагменты простых предложений, предложений с однородными сказуемыми, сложных предложений, части бессоюзных сложных предложений, сложносочиненных предложений и сложноподчиненных предложений. В третьей части сделаны выводы о том, что в большинстве случаев китайской клаузе может соответствовать монопредикативная конструкция в русском переводе. В других ситуациях китайские клаузы переводятся непредикативными словосочетаниями, полупредикативными причастными и деепричастными оборотами, полипредикативными сложными предложениями и группами предложений.
Translated title of the contributionChinese-Russian Parallel Discourse Corpus: Alignment of Clauses and Statistical Analysis
Original languageRussian
Pages (from-to)60-73
Number of pages14
JournalИзвестия Уральского федерального университета. Серия 2: Гуманитарные науки
Volume175
Issue number20 (2)
DOIs
Publication statusPublished - 2018

WoS ResearchAreas Categories

  • Humanities, Multidisciplinary

Level of Research Output

  • VAK List

Fingerprint

Dive into the research topics of 'Chinese-Russian Parallel Discourse Corpus: Alignment of Clauses and Statistical Analysis'. Together they form a unique fingerprint.

Cite this