РАНЖИРОВАНИЕ ДОКУМЕНТОВ ПРИ ПОЛНОТЕКСТОВОМ ПОИСКЕ С УЧЕТОМ РАССТОЯНИЯ С ИСПОЛЬЗОВАНИЕМ ИНДЕКСОВ С МНОГОКОМПОНЕНТНЫМИ КЛЮЧАМИ

Результат исследований: Вклад в журналСтатья

Аннотация

Рассматривается задача полнотекстового поиска с учетом расстояния. Применение индексов с многокомпонентными ключами позволяет существенно ускорить обработку запросов, включающих часто встречающиеся слова, в сравнении с обычными инвертированными индексами. Было показано, что если запросы состоят из очень часто встречающихся слов, то время поиска может быть сокращено в 130 раз. В данной статье изучается влияние на точность поиска, выдачу в результатах поиска релевантных документов, архитектуры индексов с многокомпонентными ключами. Рассмотрен ряд методов определения релевантности документов разных авторов. Каждый метод применен при поиске в обычном индексе, а затем при поиске с использованием индексов многокомпонентных ключей. Результаты экспериментов подтверждают, что для ряда методов расчета релевантности поиск с использованием индексов многокомпонентных ключей предоставляет близкие результаты при сравнении с поиском в обычном индексе.
Переведенное названиеRELEVANCE RANKING FOR PROXIMITY FULL-TEXT SEARCH BASED ON ADDITIONAL INDEXES WITH MULTI-COMPONENT KEYS
Язык оригиналаРусский
Страницы (с-по)132-148
Число страниц17
ЖурналВестник Удмуртского университета. Математика. Механика. Компьютерные науки
Том31
Номер выпуска1
DOI
СостояниеОпубликовано - 2021

ГРНТИ

  • 50.05.00 Теоретические основы программирования

Уровень публикации

  • Перечень ВАК

Fingerprint Подробные сведения о темах исследования «РАНЖИРОВАНИЕ ДОКУМЕНТОВ ПРИ ПОЛНОТЕКСТОВОМ ПОИСКЕ С УЧЕТОМ РАССТОЯНИЯ С ИСПОЛЬЗОВАНИЕМ ИНДЕКСОВ С МНОГОКОМПОНЕНТНЫМИ КЛЮЧАМИ». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать