О проекте

Целью проекта является последовательное описание представительного фрагмента русской грамматики по данным Национального корпуса русского языка (www.ruscorpora.ru).

Материалом описания служит, таким образом, обширный массив преимущественно (но не исключительно) письменных текстов без каких бы то ни было жанровых и стилистических ограничений. Описание задумано как синхронное. Фрагментарно описываются и некоторые (микро)диахронические процессы (с XVIII по XXI в.), однако задачи последовательного микродиахронического исследования не ставится. Авторами описания используются количественные методы анализа корпусных данных.

Описание мыслится как строго эмпирически ориентированное и теоретически нейтральное: в нем по возможности учитываются данные, накопленные в рамках самых разных подходов и направлений современной лингвистики. Одной из определяющих черт представленного описания является его отчетливая типологическая направленность: материал русского языка представлен в нем не изолированно, а с учетом типологических данных по описываемому явлению, и в формате, наиболее удобном для межъязыкового сопоставления.

Настоящее описание во многом опирается на существующие грамматики русского языка: «академические» грамматики [Виноградов 1960] и [Шведова 1980]; монографические описания [Виноградов 1947]; [Исаченко 1954–1960]; [Timberlake 2004] и мн.др. Однако, будучи, с одной стороны, корпусно-, а с другой стороны – типологически-ориентированным, оно существенным образом отличается от всех имеющихся к настоящему моменту синхронных описаний русской грамматики.

Представленная грамматика призвана выполнять сразу несколько функций – дескриптивную, отчасти исследовательскую, отчасти справочную. Она адресована широкому кругу лиц: профессиональным лингвистам разных школ и направлений – не только русистам, но и типологам, и специалистам-теоретикам; преподавателям русского языка (в том числе русского как иностранного) и изучающим его студентам.

1. Материал описания

Описание выполнено на материале Национального корпуса русского языка (www.ruscorpora.ru), главным образом его Основного подкорпуса. Таким образом:

  • основной массив данных составляют (как и во всех предшествующих грамматических описаниях) письменные тексты;
  • круг жанров, стилей авторов максимально разнообразен: в рассмотрение включены не только художественные (как в большинстве предшествующих описаний), но и научные, официально-деловые, технические тексты; большое количество образцов повседневной спонтанной речи, в том числе интернет-коммуникации;
  • временной охват текстов – с нач. XVIII в. по нач. XXI в. (что несколько шире, чем в «академических грамматиках», ориентирующихся на тексты сер. XIX в. – сер. XX в.);
  • объем Основного корпуса – ок. 230 млн. словоупотреблений, тексты, вошедшие в него, снабжены подробной морфологической и семантической разметкой (сопоставимого количества легкодоступного материала не было в распоряжении авторов имеющихся грамматических описаний русского языка).

В качестве вспомогательных – в зависимости от конкретной задачи – эпизодически привлекаются и данные других подкорпусов Национального корпуса: Устного, Мультимедийного, Поэтического, Газетного, Диалектного, Синтаксически размеченного и др.

2. Теоретические и методологические принципы описания

Общими принципами описания являются:

а) ориентация на эмпирические данные (материал Национального корпуса русского языка)

В частности, в описании по возможности минимизированы:

  • искусственные примеры;
  • отрицательный материал («примеры под звездочкой»);
  • данные интроспекции.

Этот принцип, однако, не доведен до абсурда: в тех местах, где подобный материал оказывается полезен или единственно доступен, он привлекается; там же, где ему есть возможность противопоставить эмпирические данные, – предпочитаются эмпирические данные.

б) теоретическая нейтральность и открытость

Описание жестко не привязано ни к одной из существующих лингвистических теорий, что защищает его от опасности «устареть» вместе с теорией и обеспечивает его доступность самому широкому кругу читателей. При этом описание теоретически «открыто»: в нем по возможности учитываются последние достижения, сделанные в рамках самых разных лингвистических направлений. В частности, перед коллективом проекта стоит задача интеграции данных, не вошедших в предшествующие описания – в силу того, что данные были накоплены уже после их создания или же в чуждой авторам описания парадигме.

в) типологическая установка

Материал русского языка подается в настоящем описании в типологическом ракурсе. При необходимости в иллюстративных целях приводятся сопоставительные данные других языков. Описываемые явления характеризуются с точки зрения типологической частотности / уникальности и возможных аналогов в языках мира. Традиционной для русистики терминологии в большинстве случаев предпочитается терминология общетипологическая, делающая описание доступным не-русисту и открывающая возможности для дальнейшего межъязыкового сопоставления.

Поскольку массив привлекаемых данных достаточно представителен и легкодоступен для извлечения и обработки, авторами – впервые для такого рода масштабных описаний русской грамматики – последовательно приводятся не только качественные, но и количественные характеристики описываемых явлений.

Возможности корпусного подхода оказываются, в частности, особенно эффективны при изучении:

  • всех типов вариативности (в том числе и за пределами «литературной нормы»);
  • сочетаемости (на всех уровнях: морфем, словоформ, конструкций…);
  • «микродиахронических» языковых изменений;
  • исключений, отклонений от общих правил, закрытых классов лексем (с возможностью составления исчерпывающих списков).

Подобная информация – во многом доступная авторам прежних грамматических описаний лишь фрагментарно или вовсе недоступная – в настоящем описании представлена как можно более полно и последовательно.

3. Состав описания

Описание состоит из следующих разделов.

  • Морфология, в том числе:
    • словообразовательная морфология;
    • словоизменительная морфология;
    • грамматические категории.
  • Синтаксис (в т.ч. полипредикация).
  • Ключевые понятия общей семантики («Отрицание», «Модальность», «Презумпция» и др.).

Полностью за рамками рассмотрения оказываются:

  • Фонетика;
  • Лексическая семантика.

Единичными статьями представлен уровень Дискурса.

Наиболее детально на данный момент описаны грамматические категории разных частей речи, остальные разделы представлены отдельными статьями, число которых в дальнейшем планируется увеличивать.

4. Формат описания

Описание состоит из отдельных статей, разных по объему (примерно от 10 до 100 тыс. знаков). Каждая из статей является авторской и представляет собой относительно автономный, композиционно цельный фрагмент описания. Жесткой унификации статей ни в формальном, ни в содержательном плане не предполагается. Тем не менее:

  • авторы придерживаются одних и тех же общих принципов описания (перечисленных выше);
  • насколько это возможно и необходимо при таком формате, поддерживается единство терминологии;
  • каждая статья (за исключением немногочисленных вводных) в том или ином объеме содержит:
    • количественные корпусные данные;
    • фоновые типологические сведения;
    • обзор теоретических исследований данной области.

К немногим конвенциям по композиции статьи относится наличие в ней следующих обязательных разделов:

  • раздел Определение (краткая характеристика описываемого явления);
  • раздел Статистика: общие количественные корпусные данные по данному явлению (в некоторых случаях из композиционных соображений эти данные помещаются в основной текст, но так или иначе они обязательно присутствуют в статье);
  • раздел Основная литература (избранная библиография по теме, в т.ч. не только работы по русистике, но и теоретические и типологические работы).

Финальные версии статей выложены на сайт и снабжены системой ссылок (внутри статьи и между статьями, в т.ч. ссылками на конкретные подразделы других статей) и подробным общим Оглавлением. В уже вывешенных статьях возможны позднейшие изменения: дата последней версии указана на сайте. Также в тексте каждой статьи указан ее автор (авторы). Правила цитирования статей проекта см. в разделе Как ссылаться.

5. Участники проекта

В проекте принимает участие большая группа лингвистов из Москвы и Санкт-Петербурга (более 20-ти человек). Организационно проект в наибольшей степени связан с Отделом корпусной лингвистики и лингвистической поэтики Института русского языка им. В.В. Виноградова РАН. Коллектив проекта принципиально неоднороден и работает в тесном сотрудничестве, что обеспечивает необходимую полноту, методологическую корректность и теоретическую открытость описания. Это представители разных школ, лингвисты с несхожими исследовательскими интересами, навыками работы, теоретическими взглядами, методологическими установками, в т.ч.:

  • русисты;
  • лингвисты-теоретики;
  • специалисты по корпусным и квантитативным методам;
  • типологи
  • и др.

Каждая статья готовится специалистом по данной проблеме, обсуждается на семинарах проекта и проходит письменное научное редактирование.

Список участников проекта и подробную информацию о них см. в разделе Участники проекта.