На главную
RiSearch Pro v.3.2 Manual© С. ТарасовКодировкиВы можете столкнуться с некоторыми проблемами в настройке скрипта, если на сайте используются кодировки, отличные от WIN-1251. По умолчанию скрипт должен работать с кодировкой 1251, при условии, что запрос приходит в той же кодировке. Если это условие не выполняется, Вам придется подредактировать скрипт.
В подавляющем большинстве случаев запрос на сервер поступает в кодировке 1251,
но некоторые сервера самостоятельно перекодируют запрос и только затем передают
его скрипту. Если Вы не уверены, этот вопрос можно прояснить у Вашего системного
администратора, или самостоятельно, как это описано ниже. В файле "search.pl"
после строки (предварительно ее раскомментировав) Если Ваш вебсервер перекодирует запрос прежде чем отдать его стрипту, появится проблема с формированием ссылок на последующие страницы с результатами поиска. Например, все Ваши файлы хранятся в кодировке windows-1251, запрос приходит в той же кодировке, но сервер его перекодирует и скрипт получает запрос уже в koi-8. Самое правильное в такой ситуации перенастроить сервер. Если же это невозможно, придется заниматься перекодировкой внутри скрипта.
Необходимо перекодировать запрос в нужную кодировку.
Еще один вопрос, который необходимо решить, это конвертация заглавных букв в строчные.
Для этого в файле "riconfig.pm" необходимо указать соответствующие коды символов.
Ниже приведены коды заглавных и строчных букв для трех наиболее употребительных кодировок.
Автоматическая перекодировка страниц
При индексации нескольких сайтов с использованием спайдера может
возникнуть проблема, если на одном из сайтов используется
кодировка windows-1251, а на другом koi8-r. Скрипт может
автоматически перекодировать страницы,
если сервер отдает правильную кодировку в HTTP заголовке.
Для этого необходимо для одной из кодировок указать функцию
перекодирования в таком виде:
В данном случае автоматически будут перекодированны документы в koi8-r и UTF-8 кодировках и в индексе все документы будут представлены в кодировке windows-1251.
Кроме того, скрипт может определять кодировку документа по мета-тегам:
Скрипт содержит следующие функции перекодирования: koi2win, win2koi и utf8_to_win1251. При необходимости добавьте свои собственные функции. |
![]() |
|
http://risearch.org | С.Тарасов, © 2000-2003 |
![]() |