Установка 3-го парсера на хостинге 350mb.ru
Установка 3-го парсера на хостинге 350mb.ruМорда: СтандартнаяСераяЗеленая Главная / Портфель / Установка 3-го парсера на хостинге 350mb.ru Запомнить № 20:
Установка 3-го парсера на хостинге 350mb.ruОпубликовано:
12 февраля 2003Изменено:
14 августа 2003 | В данной инструкции будет описана установка парсера для основного домена, — для поддоменов она делается аналогично.Сначала загрузите требуемую версию парсера (CGI скрипт с поддержкой XML или без неё) для Linux Redhat 7.х из скачать сайта parser.ru, или из раздела скачать, на этом сайте.Оттуда же загрузите, Конфигурационный файл и файлы описания кодировок, а также SQL драйвер для MySQLРазархивируйте загруженные архивы с CGI скриптом, конфигурационным файлом и файлами описания кодировок, а также драйверами для MySQLЗагружаем по ftp (обязательно! в binary режиме) CGI скрипт parser3.cgi в каталог /public_html/cgi-bin и устанавливаем ему права 700 или -rwx --- --- (это самые жесткие права), т.е. разрешение на чтение, запись и выполнение только для владельца файла. На этом моменте следует остановиться подробнее — очень часто парсер не работает именно из-за того, что он был загружен на сервер не в binary, а в ASCII режиме. Файлы с расширением .cgi многие ftp-клиенты по-умолчанию загружают именно в ASCII режиме, — поэтому перед загрузкой внимательно проверьте настройки своего ftp-клиента.В /public_html/cgi-bin/lib (если такого каталога нет, создаем его) загружаем драйвер MySQL — libparser3mysql.soВ /public_html/cgi-bin/charsets (если такого каталога нет, создаем его) загружаем файлы таблиц перекодировки: koi8-r.cfg, windows-1250.cfg, windows-1251.cfg, windows-1257.cfgВ /public_html/cgi-bin (т.е. туда, где находится CGI скрипт парсера) загружаем конфигурационный файл — auto.pВ корневом .htaccess сайта назначаем parser3 обработчиком html файлов.
AddHandler parsed-html html
Action parsed-html /cgi-bin/parser3.cgi
<files ~ "\.p$">
Order allow,deny
Deny from all
</files>
Для проверки работоспособности парсера скачайте тестовую страницу http://parser.ru/off-line/download/utils/test.zip и разархивируйте её(_test.html) в /public_html и проверьте работоспособность установленного парсера, зайдя на эту страницу: http://www.your_domain.ru/_test.html.Послесловие:Поскольку на данном сервере каталог cgi-bin (т.е. там, где находится парсер) находится в пределах веб-пространства (каталог /public_html), — размещение конфигурационного файла auto.p в этом каталоге не самое безопасное решение, однако самое простое. При размещении его в другом месте (вне веб-пространства) необходимо установить переменную окружения CGI — CGI_PARSER_CONFIG в .htaccess указывающую реальный дисковый путь к этому файлу. Шаблон:SetEnv CGI_PARSER_CONFIG /home/логин/path_to/auto.pНапример можно создать каталог /parser3 и поместить туда конфигурационный auto.p и тогда этот шаблон будет выглядеть следующим образом:SetEnv CGI_PARSER_CONFIG /home/логин/parser3/auto.pА файл .htaccess будет таким:
SetEnv CGI_PARSER_CONFIG /home/логин/parser3/auto.p
AddHandler parsed-html html
Action parsed-html /cgi-bin/parser3.cgi
<files ~ "\.p$">
Order allow,deny
Deny from all
</files>
И далее нужно подправить первую строчку конфигурационного auto.p (определение метода @conf). Вместо:@conf[filespec]Нужно написать:@conf[/home/логин/parser3/auto.p]Т.е. определять этот метод с параметром показывающим размещение конфигурационного auto.p.Однако если вы не очень хорошо разбираетесь в тонкостях установки и настройки парсера, — не делайте этого.Важное замечание:Позже выяснилось (спасибо Евгению Савину), что не всё так хорошо на этом хостинге в плане установки переменных окружения CGI, — на хостинге не работает модуль mod_env, с помощью которого и устанавливаются переменная окружения CGI_PARSER_CONFIG, необходимая для выноса конфигурационного файла из веб-пространства. Следовательно, в настоящий момент, вы не можете вынести конфигурационный файл из веб-пространства, что не есть хорошо. Остаётся надеятся, что в будущем, эта проблема будет устранена, иначе при работе с парсером на этом хостинге, есть весьма серъёзная дырка.<< № 19 | Содержание | № 21 >>Из последнего№ 24 Работаем с .htpasswd 08.11.2003 (Изменено: 10.01.2004)№ 23 Самодокументирование парсерного кода 14.09.2003№ 22 Работаем с RSS 21.02.2003№ 21 Топологическая сортировка 16.02.2003№ 20 Установка 3-го парсера на хостинге 350mb.ru 12.02.2003ПолезноеХостинг350mb.ruParser 3Parser.ruУстановка и настройка Parser3WWWЛаборатория dkГлавная / Портфель / Установка 3-го парсера на хостинге 350mb.ru Запомнить Информация о сервереАвторРегистрация/настройки
содержание | 2 | Интернет Пиар
Используются технологии
uCoz