Аннотация
Рассматривается задача полнотекстового поиска с учетом расстояния. Применение индексов с многокомпонентными ключами позволяет существенно ускорить обработку запросов, включающих часто встречающиеся слова, в сравнении с обычными инвертированными индексами. Было показано, что если запросы состоят из очень часто встречающихся слов, то время поиска может быть сокращено в 130 раз. В данной статье изучается влияние на точность поиска, выдачу в результатах поиска релевантных документов, архитектуры индексов с многокомпонентными ключами. Рассмотрен ряд методов определения релевантности документов разных авторов. Каждый метод применен при поиске в обычном индексе, а затем при поиске с использованием индексов многокомпонентных ключей. Результаты экспериментов подтверждают, что для ряда методов расчета релевантности поиск с использованием индексов многокомпонентных ключей предоставляет близкие результаты при сравнении с поиском в обычном индексе.
Переведенное название | Relevance ranking for proximity full-text search based on additional indexes with multi-component keys |
---|---|
Язык оригинала | Русский |
Страницы (с-по) | 132-148 |
Число страниц | 17 |
Журнал | Вестник Удмуртского университета. Математика. Механика. Компьютерные науки |
Том | 31 |
Номер выпуска | 1 |
DOI | |
Состояние | Опубликовано - 2021 |
Предметные области ASJC Scopus
- Mathematics(all)
- Fluid Flow and Transfer Processes
- Computer Science(all)
Предметные области WoS
- Математика
ГРНТИ
- 50.05.00 Теоретические основы программирования
Уровень публикации
- Перечень ВАК
- Russian Science Citation Index