На главную

RiSearch Pro v.3.2 Manual

© С. Тарасов

Добавление нового документа

      Добавление нового документа в индекс производится из панели администратора. Можно добавить как один документ, так и все документы с определенного сайта. Во втором случае можно ввести в поле ввода свой фильтр для каждого сайта (если оставить это поле пустым, будет использоваться фильтр из конфигурационного файла).

      Если необходимо добавить в индекс достаточно большой сайт, использование панели администратора не рекомендуется. Вебсервер может убить скрипт через определенное время и индекс может оказаться испорченным. В таких случаях безопаснее запустить скрипт add.pl через командную строку. При этом возможны следующие параметры:

  1.  -url=http://www.server.com/  - стартовая страница, с которой начнется индексация.

  2.  -type=P  - тип индексации (P - будет проиндексирована только одна страница; S - индексация всего сайта).

  3.  -rules=filter_filename  - имя файла с фильтром.

  4.  -list=filename  - Файл с адресами страниц (по одному адресу в каждой строке).

  5.  -login=login  - логин для доступа к закрытому сайту (используется только при индексации через HTTP).

  6.  -password=password  - пароль для доступа к закрытому сайту (используется только при индексации через HTTP).

      Если какой-либо параметр не указан, будет использоваться значение из конфигурационного файла. По умочанию (если нет параметра type) индексируется только один файл.

      Примеры:

  •  perl add.pl -url=http://www.server.com/ -type=P  - добавить одну страницу.

  •  perl add.pl -url=http://www.server.com/ -type=S  - добавить весь сайт http://www.server.com/ (используется фильтр из конфинурационного файла).

  •  perl add.pl -url=http://www.server.com/ -type=S -rules=filename  - добавить весь сайт http://www.server.com/ (используется фильтр из файла "filename").

  •  perl add.pl -list=filename -type=P  - добавить список страниц из файла.

  •  perl add.pl -list=filename -type=S  - добавить список сайтов.

      Данный скрипт можно также запускать через броузер как CGI-скрипт. Для этого нужно вызвать этот скрипт с параметром url (например: http://www.server.com/cgi-bin/add.pl?url=http://www.server.com/new_page.htm) Но в таком случае всегда будет индексироваться только указанный документ, к тому же, в конфигурационном файле нужно указать  allow_visitor_add_page => 1, . Таким образом вы можете позволить вашим посетителям добавлять в поисковую систему новые документы, которые сразу же будут доступны для поиска.

      При необходимости данный скрипт можно остановить нажав "Ctrl-C". Для продолжения индексации следует использовать скрипт "spider.pl":

 perl spider.pl -action=restart 

      Если необходимо добавить в индекс локальную страницу, воспользутесь скриптом admin.pl, запустив его из командной строки или через броузер:

 perl admin.pl -action=add_page -file=../index.htm -pass=password 

 http://www.yourserver.com/cgi-bin/admin.pl?action=add_page&file=../index.htm&pass=password 



http://risearch.org С.Тарасов, © 2000-2003