Subj : CGI.PERL.FAQ Часть 2.
-----------------------------------------
Составление FAQ начато: 20 окт 1998
Текущаяя версия от: 18 фев 1999 19:13
-----------------------------------------
-----------------------------------------
Авторы ответов:
Павел Аммосов <[email protected]>
Артур Пенттинен <[email protected]>
Михаил Поляков <[email protected]>
Григорий Строкин <[email protected]>
-----------------------------------------
ЧАСТО ОТВЕЧАЕМЫЕ ОТВЕТЫ ДЛЯ
FIDO7.RU.CGI.PERL
и
FIDO7.RU.PERL
---------------------------------------------------------------------
Присылайте также свои собственные ответы! (инфо в конце текста)
---------------------------------------------------------------------
Общий план FAQ fido7.ru.cgi.perl
A. Перл как язык
(1) Где взять перл и все с ним связанное
(2) Где взять документацию
(3) Как сделать на перле то-то: основные возможности языка
(4) ?
---------------------------------------------------------------------
B. Перл как средство для работы с CGI
(5) Как заставить WWW сервер выполнять CGI-скпирты
(6) Где взять примеры CGI-скриптов и документацию по CGI
(7) Как в CGI сделать то-то: основные приемы работы с CGI
(8) ?
В ЭТОЙ ЧАСТИ:
Б. ПЕРЛ КАК СРЕДСТВО РАБОТЫ С CGI
---------------------------------------------------------------------
(5) Как заставить WWW сервер выполнять CGI-скпирты
---------------------------------------------------------------------
(Q 5.1) Что такое CGI и как с ним работать
(Q 5.2) Как заставить WWW сервер исполнять CGI-программы?
(Q 5.3) Мой CGI-скрипт не работает! Как установить причину?
(Q 5.3) Ошибки HTTP 500 и 403. Что это значит и что с ними делать
(Q 5.4) Как заставить браузеры не кешировать выдаваемый результат?
(Q 5.5) Как перенаправить клиента на другой URL?
(Q 5.6) Как загрузить файл на сервер?
(Q 5.7) Как получить файл по URL?
ИТАК...
Б. ПЕРЛ КАК СРЕДСТВО РАБОТЫ С CGI
---------------------------------------------------------------------
(5) Как заставить WWW сервер выполнять CGI-скпирты
---------------------------------------------------------------------
(Q 5.1) Что такое CGI и как с ним работать
(A) CGI -- Common Gateway Interface. Cтандарт интерфейса внешних программ
с http-сервером.
Как работать:
HTTP -- клиент-серверный протокол, следовательно со стороны CGI, как
серверного процесса, все взаимодействие выглядит следующим образом:
1. Получение данных от клиента
2. Обработка данных
3. Выдача ответа клиенту.
Пункты 1 и 3 я в кратце опишу здесь, а 2, надеюсь, сделате сами.
Начнем с п.3 как наиболее простого.
3. Выдача данных клиенту: Обычно клиенту выдают текст в формате HTML (ничто
не мешает Вам отправить ему и картинку/видео/etc). Для того, чтобы сервер и
клиент вас поняли, необходимо сказать, что вы выдаете, c помощью заголовка
Content-Type: mime-type/mime-subtype. Обатите внимание на регистр и
последовательность -- если вы скажите нечто типа Content_type, то сервер
вас скорее всего не поймет. (Сообщение типа "500 Internal
Server Error" будет симптомом).
Пример:
print "Content-Type: text/html\n"; # Мы выдаем текст в формате HTML. Также
# можно: text/plain -- простой текст, в
# брузере отобразится аналогично тексту,
# заключённому между тегами <pre></pre>.
# image/gif -- Картинка, формат gif
# video/mpeg -- mpeg-видео
# И целая куча других форматов, см.
# файл mime.types из apache
print "\n"; # <-- еще одна пустая строка, обозначает конец вывода наших
# заголовков. ВАЖНО!
# Теперь мы можем написать свой текст клиенту
print "
<html>
<head>
<title>Моя первая CGI программа</title>
</head>
<body>
<h1>Моя первая CGI программа</h1>
</body>
</head>
";
## Все.
1. Прием данных от клиента
Взаимодействие с клиентом обеспечивается так: Он заполняет форму своими
значениями, нажимает на кнопку "submit", броузер кодирует данные
соответствующим образом и отправляет их серверу.
Определение форм
Производится тегами <form> и </form>. Тег определения форм имеет следующие
аттрибуты
action -- скрипт на сервере, который будет запущен на сервере для
обработки данных формы.
method -- тип взаимодействия с сервером. Может иметь значения GET и
POST.
+ еще некоторые специальные, которые вы можете посмотреть в учебнике
Формы не могут быть вложенными.
Элементы ввода
Определяются тегами <input>, <textarea> и <select>
тег <input>:
<input type=checkbox> -- Элемен ввода "Опция"
<input type=hidden> -- Элемент ввода, который не виден пользователю
<input type=file> -- в Netscape Navigator позволяет загрузить файл на сервер
<input type=image> -- Изображение. Если по нему шелкнуть, это вызовет submit
формы и серверу будут выданы две переменные вида name.x и name.y, где name
-- то, что вы пропишете в name=... тега <input>
<input type=password> -- Элемент ввода Пароль. Позволяет ввести строку,
которая на экране отображается звездочками. Никаких методов защиты при
передаче на сервер не применяется
<input type=radio> -- Радиокнопки
<input type=reset> -- Кнопка сброса значений формы на начальные
<input type=submit> -- Кнопка отправки формы на сервер
<input type=text> -- строка ввода
Все теги <input> имеют аттрибут name -- Наименование элемента. Служит для
идентификации при передаче на сервер, а также другие типа value, width, etc,
название и назначение которых можно опять-таки посмотреть в настоящем
руководстве.
Тег <textarea> -- Поле многострочного ввода.
Тег <select> -- списочный выбор
Пример:
<form action=/cgi-bin/myscript.pl method=GET>
Имя: <input type=string name=name><p>
Пол: <input type=radio name=gender value=male>Мужской
<input type=radio name=gender value=female>Женский
<input type=submit><input type=reset>
</form>
Как это будет видно в моей программе?
Это определяется методом формы, GET или POST
В случае GET сервер установит переменную окружения QUERY_STRING в виде
name1=vaue1&name2=value2&..&nameN=vauleN.
В случае POST аналогичная строка будет записана на стандартный ввод. Ее
длину можно получить через переменную окружения CONTENT_LENGTH.
В обоих случаях данные будут закодированы по следующему алгоритму:
Eсли ASCII код символа больше 32 и меньше 128, то он будет выдан без
изменения.
если символ - пробел, то он заменится на "+" (плюсик, без кавычек)
все остальное преабразуется в вид %xx, где xx -- шестнадцатеричный
код сивола. Если вам повезло и у вас "Русский apache", то он
преобразует его в нормальную кодировку.
Декодирование на perl
tr/+/ /;
s/%([0-9a-fA-F]{2})/pack("c",hex($1))/ge;
(списано из CGI.pm)
На самом деле, можно не возится со всем этим, а использовать модуль CGI.pm
(Имеется в поставке Perl 5.004 и более поздних. Если у вас perl версии 4
или 1, нужно срочно взять на CPAN новую версию perl)
Самый большой и последний пример
Предположим мы делаем поисковую систему, тогда у нас должен быть HTML с
формой и программа, которая будет выполнять поиск.
----------- резать здесь ----------
<html>
<head>
<title>Поиск</title>
</head>
<body>
<h1>Чего искать?</h1>
<form action=/cgi-bin/search.pl method=get>
Строка для поиска: <input type=text name=string width=70><p>
Искать в <input type=checkbox name=searchin value=internet>Интернет
<input type=checkbox name=searchin value=intranet>Интранет
<input type=checkbox name=searchin value=extranet>Экстранет<p>
<input type=submit value=Давай!><input type=reset value="Нет, не надо">
</form>
</body>
</html>
----------- резать здесь ----------
Программа:
----------- резать здесь ----------
#!/usr/bin/perl -- поменяйте, как надо
use CGI;
print "Content-Type: text/html\n\n"; # Не забудьте про два "\n"
$string = param("string");
@searchin = param("searchin"); # searchin это checkbox и его значения
# возвращаются списком
# Искать мы сегодня ничего не будем
print "<html>
<body>
<h1>Мы сегодня ничего не ищем</h1>
Но, если бы искали, то: <br>
Искали бы строку <b>$string</b><br>\n";
print "В <b>" . join(" ", @searchin) . "</b>\n";
print "
</body>
</html>
";
----------- резать здесь ----------
Да, кстати, если вы собираетесь писать в файлы с помощью CGI-программ, не
забывайте про file locking.
(Q 5.2) Как заставить WWW сервер исполнять CGI-программы?
(A)
Apache для Unix/Win32
Надо поравить конфигурационные файлы (я расчитываю, что у вас default
конфиги apache)
Способ 1
srm.conf
Директива ScriptAlias
ScriptAlias /cgi-bin/ /usr/local/apache/cgi-bin/
и в файле access.conf прописать
<Directory /usr/local/apache/cgi-bin/>
Options ExecCGI
</directory>
(если приглядется, там нужно только раскоментировать опции)
Это позволит вам помещать программы в каталог
/usr/local/apache/cgi-bin/ и они будут видны по URL
http://you/cgi-bin/program_name
Способ 2
Добавить в srm.conf директиву
AddHandler cgi-script .cgi
и вы сможете вызывать cgi-программу из любого каталога. Но она должна иметь
окончание .cgi и для этого каталога должно быть разрешено исполнение CGI
(Options ExecCGI в access.conf, написано выше).
Оба способа можно без проблем использовать совместно.
(Q 5.3) Мой CGI-скрипт не работает! Как установить причину?
Прежде чем читать дальше, убедитесь в том, что:
1) Вы запустили скрипт с командной строки (не через CGI!!!) и
он работает, а не говорит 'compilation stopped due to errors'
2) Скрипт не только работает, но и выдает нужный заголовок с пустой
строкой после него
3) (Для многопользовательских систем) Вы сделали тоже под пользователем,
под которым работает сервер (su -m имя_пользователя -c script в Unix)
и он столь же благополучно работает
(Q 5.3) Ошибки HTTP 500 и 403. Что это значит и что с ними делать
(A) error_log для того и служит, чтобы туда смотреть :-)
Основные причины:
Ошибка 403 "Forbidden"
Возникает, если сервер не может отдать вам содержимое по причине отсутствия
полномочий.
Проверьте:
Может ли user (для apache под Unix это обычно nobody), под которым работает,
сервер исполнять файл?
В частности, может ли сервер исполнять интерпретатор (в случае
скриптовых языков)?
Можно ли для этого каталога исполнять CGI? (Options ExecCGI для
apache)
Ошибка 500 "Internal Server Error"
Возникает в случае внутренней ошибки.
Проверьте:
Выводите ли вы строку "Content-Type:"?
Правильно ли вы ее выводите? (Content-type, Content_Type --
неправильно)
Заканчиваете ли вы хедеры пустой строкой? (Нельзя написать
print "Content-Type: text/html\n";
print "<HTML>\n";
Надо писать:
print "Content-Type: text/html\n\n"; # Два "\n"
print "<HTML>\n";)
Также, эта ошибка возникает, если CGI-программа завершилась с ненулевым
кодом возврата, что часто встречается в случае некомпилируемости вашего
скрипта perl'ом.
Совет: делайте
use CGI::Carp qw(fatalsToBrowser)
во время отладки, тогда вам выдадут сообщение об ошибке perl.
ИНФОРМАЦИЯ для тех, кто хочет добавить ответы!
Присылайте ответ ([email protected]) с указанием секции,
но без номера (у меня нумерация автоматическая) в
таком формате:
----------------------------------------------
faq_Q(Что такое хорошо, а что такое
плохо?)
faq_A Давно я не читал стихотворения Маршака,
так что наизусть не помню.
-----------------------------------------------
Слова faq_Q и faq_A будут автоматически заменены на
нужные номера. А аргумент faq_Q еще и вставлен в
оглавление. Кто хочет узнать, как это делается, см.
инфо про GNU m4 в самом конце.
---------------------------------------------------------------------
Свежая версия FAQ всегда будет находиться в Интернете:
часть A. Перл как язык
http://isabase.philol.msu.ru/~grg/ru.perl.FAQ.part-A.txt
часть B. Перл как средство работы с CGI
http://isabase.philol.msu.ru/~grg/ru.perl.FAQ.part-B.txt
---------------------------------------------------------------------
---------------------------------------------------------------------
Этот текст набран в редакторе VIM -- Vi IMproved (http://www.vim.org/)
---------------------------------------------------------------------
Timestamps, нумерция глав и вопросов, а также оглавление в этом тексте
сгенерированы автоматически с помощью макропроцессора GNU m4.
(ftp://ftp.nc.ras.ru/pub/gnu/m4-1.4.tar.gz) GNU m4 рулит!!
----------------------------------------------------------------------
m4-оригинал: http://isabase.philol.msu.ru/~grg/ru.perl.FAQ/
---------------------------------------------------------------------
---------------------------------------------------------------------
18 фев 1999 19:13, Григорий Строкин ([email protected])
---------------------------------------------------------------------
(Q 5.4) Как заставить браузеры не кешировать выдаваемый результат?
(A)
Выдавайте заголовки в таком виде:
print "Content-Type: type/sub-type\n"; # Подставьте Ваш тип/подтип
print "Pragma: no-cache\n"; # Для HTTP/1.0 клиентов
print "Cache-Control: no-cache\n"; # Для HTTP/1.1
print "Expires: Thu Jan 1 00:00:00 1970\n\n"; # Это уже любой браузер должен
# понять
(Q 5.5) Как перенаправить клиента на другой URL?
(A)
В заголовке напишите:
print "Status: 302\n";
# Или 301. Разница состоит в том, что по стандарту 301 значит "перемещён
# навсегда", а 302 -- "перемещён временно"
print "Location: ВАШ Новый URL\n";
# URL должен быть указан абсолютный
print "URI: ВАШ новый URL\n\n"; # Для http/1.0
Подробности: см. rfc1945(http/1.0), rfc2068(http/1.1)
(Q 5.6) Как загрузить файл на сервер?
(A)
В поставку CGI.pm входит пример file_upload.cgi.
Подробности CGI(3)
(Q 5.7) Как получить файл по URL?
(A)
Возьмите на CPAN библиотеку libwww-perl и смотрите lwpcook(3), там
написаны основы использования библиотеки и есть примеры.