На главную

RiSearch v.1.0 Manual

© С. Тарасов

Сортировка результатов

      Найденные документы могут быть отсортированны по релевантности, дате последней модификации документа, размеру или могуть быть представлены в порядке их размещения в индексе. Имейте в виду, что большинство вебсерверов не возвращают дату последней модификации для динамических документов и скрипт будет использовать дату индексации.

Релевантность

      Релевантность - это абстрактная мера соответствия документа запросу пользователя. RiSearch считает релевантность на основе числа слов из запроса в данном документе. Каждое слово увеличивает рейтинг документа на одну единицу. Если слово в документе находится в определенных местах (заголовок, ссылка, жирный текст или курсив) рейтинг документа может быть увеличен в соответствии с весами, указанными в конфигурационном файле. Затем рейтинг документа нормализуется с учетом наиболее часто встречающегося в данном документе слова (чтобы более длинный документ не получил больший рейтинг).

      Рассчитанный таким образом рейтинг затем может быть перерассчитан с учетом числа документов, в которых встречается данное слово. В результате более часто встречающиеся слова меньше влияют на общий рейтинг документа для многословных запросов.

Настройка

  1.  allow_sort_by_rating => 1,  - включение возможности сортировки результатов поиска по релевантности. Дополнительно, скрипт может сортировать документы по дате последнего изменения и размеру файла (allow_sort_by_date, allow_sort_by_size).

  2.  weight_title => 5,  - увеличение веса слова в зависимости от его расположения на странице. При сортировке по релевантности скрипт учитывает, сколько раз каждое слово встречается в данном документе. Каждое вхождение увеличивает рейтинг долумента на единицу. Используя параметры weight_title, weight_heading, weight_bold и т.д, Вы можете указать скрипту на сколько увеличивать рейтинг, если оно встречается в теге TITLE, заголовке документа, выделено жирным шрифтом, является ссылкой на другой документ, присутствует в метатегах.

  3.  word_freq => 1,  - включение нормализации рейтинга документа в соответствии с частотой данного слова (редкие слова будут иметь больший рейтинг). Данная опция может быть включена и отключена без переиндексации сайта.



http://risearch.org С.Тарасов, © 2000-2003