Ранжирование документов при полнотекстовом поиске с учетом расстояния с использованием индексов с многокомпонентными ключами

Translated title of the contribution: Relevance ranking for proximity full-text search based on additional indexes with multi-component keys

Research output: Contribution to journalArticlepeer-review

Abstract

Рассматривается задача полнотекстового поиска с учетом расстояния. Применение индексов с многокомпонентными ключами позволяет существенно ускорить обработку запросов, включающих часто встречающиеся слова, в сравнении с обычными инвертированными индексами. Было показано, что если запросы состоят из очень часто встречающихся слов, то время поиска может быть сокращено в 130 раз. В данной статье изучается влияние на точность поиска, выдачу в результатах поиска релевантных документов, архитектуры индексов с многокомпонентными ключами. Рассмотрен ряд методов определения релевантности документов разных авторов. Каждый метод применен при поиске в обычном индексе, а затем при поиске с использованием индексов многокомпонентных ключей. Результаты экспериментов подтверждают, что для ряда методов расчета релевантности поиск с использованием индексов многокомпонентных ключей предоставляет близкие результаты при сравнении с поиском в обычном индексе.
Translated title of the contributionRelevance ranking for proximity full-text search based on additional indexes with multi-component keys
Original languageRussian
Pages (from-to)132-148
Number of pages17
JournalВестник Удмуртского университета. Математика. Механика. Компьютерные науки
Volume31
Issue number1
DOIs
Publication statusPublished - 2021

Keywords

  • Full-text search
  • Inverted indexes
  • Proximity search
  • Relevance ranking
  • Search engines
  • Threecomponent key indexes

ASJC Scopus subject areas

  • Mathematics(all)
  • Fluid Flow and Transfer Processes
  • Computer Science(all)

WoS ResearchAreas Categories

  • Mathematics

GRNTI

  • 50.05.00

Level of Research Output

  • VAK List

Fingerprint Dive into the research topics of 'Relevance ranking for proximity full-text search based on additional indexes with multi-component keys'. Together they form a unique fingerprint.

Cite this