Словарь сочетаемости поэтического корпуса

О словаре

Словарь сочетаемости Поэтического корпуса Национального корпуса русского языка



  • С какими именами чаще всего сочеталось прилагательное «милый» в поэзии XIX века?
  • Что может быть «озарено»? Отличается ли сочетамость предлогов «через» и «чрез»?
  • Какие глаголы встречаются в сочиненной группе «плакало и __»?


  • Этот словарь построен на материалах Поэтического корпуса НКРЯ и представляет данные о лексической сочетаемости имен прилагательных, существительных, глаголов и наречий, и а также о предложных и сочиненных группах. Предварительно корпус был размечен: для каждого слова определена часть речи, словарная форма, синтаксически зависимые от него слова и тип синтаксического отношения между главным и зависимым словом. В результате были получены цепочки из двух и трех слов вида «озарено + прошлое», «плакало + и + пело» (синтаксические би- и триграмы). В отличие от обычного поиска в корпусе, метод синтаксических n-грам позволяет обнаружить сочетания слов, расположенных далеко друг от друга в предложении, как например «окно» и «озарено» в стихотворении Аполлона Григорьева:


  • Всё спит; одно окно
  • В старинный сад свечой озарено...


  • И наоборот, не считается сочетанием пара слов «сад» и «озарено», расположенных рядом друг с другом, так как они не связаны синтаксически. Порядок следования слов не важен. В базе словаря собраны словосочетания, встретившиеся в корпусе не менее двух раз.

Разделы словаря



  1. Раздел Прилагательные отвечает на вопрос, с какими словами сочетаются имена прилагательные и прилагательные-местоимения в атрибутивной конструкции: «милый + друг», «который + год».
  2. Раздел Наречия отвечает на вопрос, какие глаголы, имена прилагательные, имена существительные и т. д. определяют наречия: «внезапно + оживил», «чуть + вбок».
  3. Раздел Глаголы отвечает на вопрос, какие слова употребляются в конструкциях, в которых вершиной является глагол (включая вершины-причастия и деепричастия): «ударится + прибой», «ударившись + о + пустоту».
  4. Раздел Имена отвечает на вопрос, какие слова употребляются в конструкциях с именем существительным-вершиной («луч + мороза») или с именем прилагательным-вершиной («похожий» + «на» + «звезду», «мил» + «ребенок», «чернее» + «ночи»).
  5. Раздел Предлоги отвечает на вопрос, с какими предлогами употребляются имена: «сквозь + туман», «по-над + лесом».
  6. Раздел Сочинение представляет употребление слов в сочиненных группах: «сядь, расскажи», «плакало + и + пело».

Как пользоваться словарем

  1. Укажите тип конструкции (например, Имена), следуя меню слева. По умолчанию - прилагательные
  2. Введите слово или часть слова в поле «Слово 1».
  3. Введите слово или часть слова в поле «Слово 2», чтобы ограничить выдачу по второму слову.
  4. Введите слово или часть слова в поле «Служебное слово», чтобы ограничить выдачу по служебному соединительному элементу словосочетания - предлогу (для разделов Глаголы, Имена) или союзу (Сочинение).
  5. Выберите подкорпус (тексты XIX века или тексты XX века). По умолчанию поиск ведется по материалам всего Поэтического корпуса.
  6. С помощью поля «Показывать ... строк» вы можете увеличивать или уменьшать количество отображаемых словосочетаний на странице. По умолчанию - 20
  7. Нажмите кнопку «Найти».


  • Поиск ведется по точным леммам, то есть по запросу «милый» будут найдены сочетания как «милый друг», так и «милым другом» и «милая старушка».
  • Учитывается любое совпадение подстроки, по началу, концу или середине слова в нашей базе словосочетаний.
  • В таблице ниже вы увидите словосочетания, для которых указано количество вхождений в корпусе (Count) и относительная частота - количество слов на 1 миллион словоупотреблений (Ipm).
  • По умолчанию частотный список отсортирован по убыванию количества вхождений (Count).
  • Поиск

    Способ ввода

    Выбор подкорпуса

  • 19 - подкорпус xix века
  • 20 - подкорпус xx века
  • Выбор раздела
  • 1 - Прилагательные
  • 2 - Наречия
  • 3 - Глаголы
  • 4 - Имена
  • 5 - Предлоги
  • 6 - Сочинение
  • Результаты

    Слово 1 Слово 2 Слово 3 IPM Count

    О проекте



    • Словарь подготовлен научно-учебной группой «Материалы к частотному словарю русской поэзии» Школы лингвистики НИУ ВШЭ в ходе проведения исследований по проекту № 18-05-0047 в рамках Программы «Научный фонд Национального исследовательского университета „Высшая школа экономики“ (НИУ ВШЭ)» в 2019 — 2020 гг. и в рамках государственной поддержки ведущих университетов Российской Федерации «5-100».


    • Использованы материалы Поэтического корпуса НКРЯ (Гришина и др. 2009) объемом 12,5 млн словоупотреблений. Материалы собраны в 2018 году и размечены автоматически с помощью синтаксического парсера UDpipe (Straka & Straková 2017). Частеречные признаки и леммы (словарные формы) скорректированы вручную. Поисковая система словаря учитывает тип синтаксического отношения в словосочетании (например, amod для прилагательного-эпитета) и часть речи элементов словосочетания.

    Разработчики

  • Ольга Ляшевская (предобработка корпуса, разработка концепции)
  • Анна Журавлева (предобработка корпуса, создание базы данных и поисковой системы)
  • Алексей Старченко (предобработка корпуса)
  • Екатерина Власова (разработка идеи и тестирование ресурса)
  • Кристина Литвинцева (разработка идеи и тестирование ресурса)
  • Надежда Буйлова (разработка идеи и тестирование ресурса)
  • Дарья Кошелева (разработка идеи и тестирование ресурса)
  • Лев Казакевич (разработка идеи и тестирование ресурса)
  • Дарья Петрова (разработка идеи и тестирование ресурса)
  • Благодарим Э. С. Клышинского за техническую поддержку и консультации!