КАК РАБОТАЕТ SQL?
SQL это язык ориентированный специально на реляционные базы данных.
Он устраняет много работы которую вы должны были бы сделать если бы
вы использовали универсальный язык программировани, например C. Чтобы
сформировать реляционную базу данных на C, вам необходимо было бы
начать с самого начала. Вы должны были бы определить объект - называемый
таблицей которая могла бы расти чтобы иметь любое число строк, а затем
создавать постепенно процедуры для помещения значений в нее и извлечения
из них. Если бы вы захотели найти некоторые определенные строки, вам
необходимо было бы выполнить по шагам процедуру, подобную следующей :
1. Рассмотрите строку таблицы.
2. Выполните проверку - является ли эта строка одной из строк которая вам нужна.
3. Если это так, сохраните ее где-нибудь пока вся таблица не будет проверена.
4. Проверьте имеются ли другие строки в таблице.
5. Если имеются, возвратитесь на шаг 1.
6. Если строк больше нет, вывести все значения сохраненные в шаге 3.
( Конечно, это не фактический набор C команд, а только логика шагов
которые должны были бы быть включены в реальную программу. )
SQL сэкономит вам все это. Команды в SQL могут работать со всеми
группами таблиц как с единым объектом и могут обрабатывать любое
количество информации извлеченной или полученной из их, в виде
единого модуля.
ЧТО ДЕЛАЕТ ANSI ?
Как мы уже рассказывали в Введении, стандарт SQL определяется с помощью
кода ANSI (Американский Национальный Институт Стандартов ).
SQL не изобретался ANSI. Это по существу изобретение IBM. Но другие
компании подхватили SQL сразу же, по крайней мере, одна компания (Oracle)
отбила у IBM право на рыночную продажу SQL продуктов.
После того как появился ряд конкурирующих программ SQL на рынке,
ANSI определил стандарт к которому они должны быть приведены
(определение таких стандартов и является функцией ANSI ).
Однако после этого, появились некоторые проблемы. Возникли они в результате
стандартизации ANSI в виде некоторых ограничений. Так как не всегда ANSI
определяет то, что является наиболее полезным, то программы пытаются
соответствовать стандарту ANSI не позволяя ему ограничивать их слишком
сильно. Это, в свою очередь, ведет к случайным несогласованности.
Программы Баз Данных обычно дают ANSI SQL дополнительные особенности
и часто ослабляют многие ограничения из большинства из них.
Следовательно, общие разновидности ANSI будут также рассмотрены.
Хотя мы очевидно не сможем объять каждое исключение или разновидность,
удачные идеи имеют тенденцию к внедрению и использованию в различных
программах даже когда они не определены стандартом ANSI.
ANSI - это вид минимального стандарта и вы можете делать больше чем он
позволяет, хотя и должны выполнять его указания при выполнении задач
которые он определяет.
ИНТЕРАКТИВНЫЙ И ВЛОЖЕННЫЙ SQL
Имеются два SQL: Интерактивный и Вложенный.
Большей частью, обе формы работают одинаково, но используются различно.
Интерактивный SQL используется для функционирования непосредственно
в базе данных чтобы производить вывод для использования его заказчиком.
В этой форме SQL, когда вы введете команду, она сейчас же выполнится
и вы сможете увидеть вывод (если он вообще получится) - немедленно.
Вложенный SQL состоит из команд SQL помещенных внутри программ,
которые обычно написаны на некотором другом языке (типа КОБОЛА или
Паскаль).
Это делает эти программы более мощными и эффективным. Однако, допуска
эти языки, приходится иметь дело с структурой SQL и стилем управления
данных который требует некоторых расширений к интерактивному SQL.
Передача SQL команд во вложенный SQL является выдаваемой ("passed off")
для переменных или параметров используемых программой в которую они были
вложены.
В этой книге, мы будем представлять SQL в интерактивной форме. Это
даст нам возможность обсуждать команды и их эффекты не заботясь о том как
они связаны с помощью интерфейса с другими языками.
Интерактивный SQL - это форма наиболее полезна непрограммистам.
Все что вы узнаете относительно интерактивного SQL в основном
применимо и к вложенной форме. Изменения необходимые для использования
вложенной формы будут использованы в последней главе этой книги.
СУБПОДРАЗДЕЛЕНИЯ SQL
И в интерактивной и во вложенной формах SQL, имеются многочисленные
части, или субподразделения. Так как вы вероятно столкнетесь с этой
терминологией при чтении SQL, мы дадим некоторые пояснения.
К сожалению, эти термины не используются повсеместно во всех
реализациях. Они подчеркиваются ANSI и полезны на концептуальном
уровне, но большинство SQL программ практически не обрабатывают их
отдельно, так что они по существу становятся функциональными
категориями команд SQL.
DDL ( Язык Определения Данных ) - так называемый Язык Описания Схемы
в ANSI, состоит из команд которые создают объекты ( таблицы, индексы,
просмотры, и так далее ) в базе данных.
DML (Язык Манипулирования Данными) - это набор команд которые
определяют какие значения представлены в таблицах в любой момент времени.
DCD (Язык Управления Данными) состоит из средств которые определяют,
разрешить ли пользователю выполнять определенные действия или нет.
Они являются составными частями DDL в ANSI. Не забывайте эти имена.
Это не различные языки, а разделы команд SQL сгруппированных по их
функциям.
РАЗЛИЧНЫЕ ТИПЫ ДАННЫХ
Не все типы значений которые могут занимать пол таблицы - логически
одинаковые. Наиболее очевидное различие - между числами и текстом.
Вы не можете помещать числа в алфавитном порядке или вычитать одно
им из другого. Так как системы с реляционной базой данных базируются
на связях между фрагментами информации, различные типы данных должны
понятно отличаться друга от друга, так чтобы соответствующие процессы и
сравнения. могли быть в них выполнены.
В SQL, это делается с помощью назначения каждому полю - типа данных
который указывает на тип значения которое это поле может содержать.
Все значения в данном поле должны иметь одинаковый тип. В таблице
Заказчиков, например, cname и city - содержат строки текста для оценки,
snum, и cnum - это уже номера. По этой причине, вы не можете ввести
значение Highest(Наивысший) или значение None(Никакой) в поле rating,
которое имеет числовой тип данных. Это ограничение удачно, так как оно
налагает некоторую структурность на ваши данные. Вы часто будете сравни-
вать некоторые или все значения в данном поле, поэтому вы можете выполнять действие только на определенных строках а не на всех. Вы не могли
бы сделать этого если бы значения полей имели смешанный тип данных.
К сожалению, определение этих типов данных является основной областью
в которой большинство коммерческих программ баз данных и официальный
стандарт SQL, не всегда совпадают. ANSI SQL стандарт распознает только
текст и тип номера, в то врем как большинство коммерческих программ
используют другие специальные типы.
Такие как, DATA(ДАТА) и TIME(ВРЕМЯ) - фактически почти стандартные типы( хотя точный формат их меняется ). Некоторые пакеты также поддерживают такие типы, как например MONEY(ДЕНЬГИ) и BINARY
(ДВОИЧНЫЕ). (MONEY - это специальная система исчисления используемая компьютерами.
Вся информация в компьютере передается двоичными числами и затем
преобразовываются в другие системы, что бы мы могли легко использовать их
и понимать.)
ANSI определяет несколько различных типов значений чисел, различи
между которыми - довольно тонки и иногда их путают. Разрешенные ANSI
типы данных перечислены в Приложении B.
Сложность числовых типов ANSI можно, по крайней мере частично, объяснить
усилием сделать вложенный SQL, совместимым с рядом других языков.
Два типа чисел ANSI , INTEGER(ЦЕЛОЕ ЧИСЛО) и DECIMAL
(ДЕСЯТИЧНОЕ ЧИСЛО) ( которые можно сокращать как INT и DEC,
соответственно ), будут адекватны для наших целей, также как и для целей
большинства практических деловых прикладных программ.
Естественно, что тип ЦЕЛОЕ можно представить как ДЕСЯТИЧНОЕ ЧИСЛО
которое не содержит никаких цифр справа от десятичной точки.
Тип для текста - CHAR ( или СИМВОЛ ), который относится к строке текста.
Поле типа CHAR имеет определенную длину, которая определяется максималь-
ным числом символов которые могут быть введены в это поле. Больше всего
реализаций также имеют нестандартный тип называемый VARCHAR(ПЕРЕ-
МЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой которая
может иметь любую длину до определенного реализацией максимума (обычно 254
символа ). CHARACTER и VARCHAR значения включаются в одиночные ка-
вычки как "текст".
Различие между CHAR и VARCHAR в том, что CHAR должен резервировать
достаточное количество памяти для максимальной длины строки, а VARCHAR
распределяет память так как это необходимо.
Символьные типы состоят из всех печатных символов, включая числа.
Однако, номер 1 не то же что символ "1". Символ "1" - только другой печат-
ный фрагмент текста, не определяемый системой как наличие числового значения 1. Например 1 + 1 = 2, но "1" + "1" не равняется "2".
Символьные значения сохраняются в компьютере как двоичные значения,
но показываются пользователю как печатный текст. Преобразование
следует за форматом определяемым системой которую вы используете.
Этот формат преобразования будет одним из двух стандартных типов
(возможно с расширениями) используемых в компьютерных системах:
в ASCII коде ( используемом во всех персональных и малых компьютерах )
и EBCDIC коде (Расширенном Двоично-Десятичном Коде Обмена Информации) (используемом в больших компьютерах).
Определенные операции, такие как упорядочивание в алфавитном порядке
значений пол, будет изменяться вместе с форматом. Применение этих
двух форматов будет обсуждаться в Главе 4.
Мы должны следить за рынком, а не ANSI, в использовании типа называемого
DATE(ДАТОЙ). ( В системе, которая не распознает тип ДАТА, вы конечно
можете объявить дату как символьное или числовое поле, но это сделает
большинство операций более трудоемкими. ) Вы должны смотреть свою
документацию по пакету программ которые вы будете использовать, чтобы выяснить точно, какие типы данных она поддерживает.
SQL НЕСОГЛАСОВАННОСТИ
Вы можете понять из предшествующего обсуждения, что имеются
самостоятельные несогласованности внутри продуктов мира SQL.
SQL появился из коммерческого мира баз данных как инструмент, и
был позже превращен в стандарт ANSI. К сожалению, ANSI не всегда
определяет наибольшую пользу, поэтому программы пытаются соответствовать
стандарту ANSI не позволяя ему ограничивать их слишком сильно.
ANSI - вид минимального стандарта - вы можете делать больше чем он это
позволяет, но вы должны быть способны получить те же самые результаты
что и при выполнении той же самой задачи.
ЧТО ТАКОЕ - ПОЛЬЗОВАТЕЛЬ?
SQL обычно находится в компьютерных системах которые имеют больше
чем одного пользователя, и следовательно должны делать различие между
ними ( ваше семейство PC может иметь любое число пользователей, но оно
обычно не имеет способов чтобы отличать одного от другого ). Обычно, в
такой системе, каждый пользователь имеет некий вид кода проверки прав
который идентифицирует его или ее (терминология изменяется ). В начале
сеанса с компьютером, пользователь входит в систему (регистрируется),
сообща компьютеру кто этот пользователь, идентифицированный с помощью
определенного ID(Идентификатора). Любое количество людей использующих
тот же самый ID доступа, являются отдельными пользователями; и аналогично,
один человек может представлять большое количество пользователей ( в разное
врем ), используя различные доступные Идентификаторы
SQL следует этому примеру. Действия в большинстве сред SQL приведены к
специальному доступному Идентификатору который точно соответствует
определенному пользователю. Таблица или другой объект принадлежит
пользователю, который имеет над ним полную власть.
Пользователь может или не может иметь привилегии чтобы выполнять действие
над объектом. Для наших целей, мы договоримся, что любой пользователь имеет
привилегии необходимые чтобы выполнять любое действие, пока мы не возвратимся специально к обсуждению привилегий в Главе 22.
Специальное значение - USER(ПОЛЬЗОВАТЕЛЬ) может использоваться
как аргумент в команде. Оно указывает на доступный Идентификатор
пользователя, выдавшего команду.
УСЛОВИЯ И ТЕРМИНОЛОГИЯ
Ключевые слова - это слова которые имеют специальное значение в SQL.
Они могут быть командами, но не текстом и не именами объектов.
Мы будем выделять ключевые слова печатая их ЗАГЛАВНЫМИ БУКВАМИ.
Вы должны соблюдать осторожность чтобы не путать ключевые слова
с терминами.
SQL имеет определенные специальные термины которые используются
чтобы описывать его. Среди них - такие слова как запрос, предложение,
и предикат, которые являются важнейшими в описании и понимании языка
но не означают что-нибудь самостоятельное для SQL.
Команды, или предложения, являются инструкциями которыми Вы обращаетесь
к SQL базе данных.
Команды состоят из одной или более отдельных логических частей называемых
предложениями. Предложения начинаются ключевым словом для которого они
являются проименованными, и состоят из ключевых слов и аргументов.
Например предложения с которыми вы можете сталкиваться - это " FROM
Salespeope " и " WHERE city = "London". Аргументы завершают или
изменяют значение предложения. В примерах выше, Salespeople - аргумент,
а FROM - ключевое слово предложения FROM.
Аналогично, " city = "London" " - аргумент предложения WHERE.
Объекты - структуры в базе данных которым даны имена и сохраняются в
памяти. Они включают в себя базовые таблицы, представления ( два типа
таблиц ), и индексы.
Чтобы показать Вам как формируются команды, мы будем делать это на
примерах. Имеется, однако, более формальный метод описания команд
использующих стандартизированные условные обозначения. Мы будем
использовать его в более поздних главах, для удобства чтобы понимать эти
условные обозначения в случае если вы столкнетесь с ним в других SQL
документах.
Квадратные скобки ( [ ] ) будут указывать части которые могут не использоваться, а многоточия ( ... ) указывать что все предшествующее им может
повторяться любое число раз.
Слова обозначенные в угловых скобках (<>) - специальные термины
которые объясняют, что они собой представляют. Мы упростили
стандартную терминологию SQL значительно, но без ухудшения его
понимания.
РЕЗЮМЕ
Мы быстро прошли основы в этой главе. Но нашим намерением и было -
просто пролететь над основами SQL, так чтобы вы могли понять идею
относительно всего объема.
Когда мы возвратимся к основе в следующей главе, некоторые вещи станут
более конкретными. Теперь вы знаете кое-что относительно SQL - какова
его структура, как он используется, как он представляет данные, и как
они определяются ( и некоторые несогласованности появляющиеся при этом ),
и некоторые условные обозначения и термины используемые чтобы описывать
их.
Все это - много информации для одной главы; мы не ожидаем что бы вы
запомнили все эти подробности, но вы сможете вернуться позже к ним если
понадобится.
По Главе 3, мы будем идти, показывая конкретно, как формируются команды
и что они делают. Мы представим вам команду SQL используемую чтобы
извлекать информацию из таблиц, и которая является наиболее широко
используемой командой в SQL. К концу этой главы, вы будете способны
извлекать конкретную информацию из вашей базы данных с высокой степенью
точности.