Організація баз даних та знань icon

Організація баз даних та знань




НазваОрганізація баз даних та знань
Сторінка1/19
Дата02.08.2012
Розмір1.62 Mb.
ТипКонспект
  1   2   3   4   5   6   7   8   9   ...   19

Міністерство освіти і науки України

Сумський державний університет


Організація баз даних та знань


Конспект лекцій


Суми

Видавництво СумДУ

2009

Міністерство освіти і науки України

Сумський державний університет


До друку та в світ

дозволяю на підставі

«Єдиних правил», п.2.6.14

Заступник першого проректора-

начальник організаційно-методичного

управління В.Б. Юскаєв


Організація баз даних та знань


Конспект лекцій

для студентів спеціальності

080402 – Інформаційні технології проектування

денної форми навчання


Усі цитати, цифровий та

фактичний матеріал,

бібліографічні відомості перевірені

запис одиниць відповідає стандартам


Укладач: А.В. Неня


Відповідальний за випуск

зав.секцією ІТП кафедри

інформатики, к.т.н., доц. І.В. Баранова


Декан факультету ЕлІТ С.І. Проценко


Суми

Видавництво СумДУ

2009

Міністерство освіти і науки України

Сумський державний університет


Організація баз даних та знань


Конспект лекцій

для студентів спеціальності

080402 – Інформаційні технології проектування

денної форми навчання


Затверджено

на засіданні секції інформаційних технологій проектування кафедри інформатики з дисципліни

«Інформаційні технології проектування»

Протокол № 10 від 05.05.2009


Суми

Видавництво СумДУ

2009

Організація баз даних та знань: Конспект лекцій/ Укладач А.В. Неня.– Суми: Вид-во СумДУ, 2009.– 199 с.


Секція інформаційних основ проектування

Кафедра інформатики

Зміст


С.

1 Основи проектування реляційних баз даних 5

1.1 Інформаційні системи з базами даних 5

1.2 Предметна область БД та її моделі 19

1.3 Реляційна модель даних 46

2 Введення в структуровану мову запитів - SQL 70

2.1 Елементи мови SQL 70

2.2 Припустимі типи даних 71

2.3 Оператори SQL 73

2.4 Використання імен кореляції (аліасів, псевдонімів) 82

2.5 Вбудовані функції 85

2.6 Використання підзапитів 90

2.7 Використання об'єднання, перетинання й різниці 94

2.8 Синтаксис оператора вибірки даних (SELECT). BNF-нотація 95

2.9 Порядок виконання оператора SELECT 103

2.10 Реалізація реляційної алгебри засобами оператора SELECT (Реляційна повнота SQL) 107

3 Основи проектування додатків баз даних 114

3.1 Функціональна модель ODBC 114

3.2 Об'єктна модель OLE DB 129

3.3 Реалізація доступу до БД у середовищі DELPHI 136

3.4 Проектування модулів додатків 157

4 VBA відкритий інтерфейс доступу до баз даних – ODBC 168

4.1 Структура модуля. Вікно проекту й Вікно коду 168

4.2 Типи даних 168

4.3 Оголошення 172

4.4 Правила іменування 175

4.5 Оператори 175

4.6 Операції 184

4.8 Написання надійних програм 195

4.9 Мистецтво налагодження 196

4.10 Доказ правильності програм 199

Список використаної літератури 201
^

1 Основи проектування реляційних баз даних




1.1 Інформаційні системи з базами даних




1.1.1 Інформація й дані


Перш ніж перейти до обговорення поняття інформаційної системи (ІС), спробуємо з'ясувати, що ж розуміється під словом інформація. Відповісти на це питання й просто, і складно: слово "інформація" пов'язане із широким колом понять.

Змістовна сторона поняття "інформація" дуже багатогранна й немає чітких семантичних меж. Однак завжди можна сказати, що можна з нею робити. Саме відповідь на це питання найчастіше й цікавить як системних аналітиків і розроблювачів ІС, так і користувачів інформації (її основних споживачів).

З погляду як користувачів, так і розроблювачів ІС, в інформації є одна важлива властивість - вона є одиницею даних, яка підлягає обробці. Звичайно інформація надходить споживачеві саме у вигляді даних: таблиць, графіків, малюнків, фільмів, усних повідомлень, які фіксують у собі інформацію певної структури й типу. Таким чином, дані виступають як засіб подання інформації у певній, фіксованій формі, придатній для обробки, зберігання й передачі. Хоча дуже часто терміни "інформація" й "дані" виступають як синоніми, варто пам'ятати про цю їхню істотну відмінність. Саме в даних інформація знаходить інтерпретацію у конкретній ІС.

При згадуванні про "форму" подання інформації варто сказати ще про одну, "людську" властивість інформації - її сприйняття різними категоріями людей. Дані можуть бути згруповані спільно у документ. Документ може мати або не мати певну внутрішню структуру. Дані можуть бути відображені на екрані дисплея комп'ютера. Документи можуть мати аудіо- або відеоформу. Розробляючи ІС, ніколи не потрібно забувати, для кого вони (системи) створюються й хто буде їх використовувати. Форма подання інформації в ІС визначає також і категорії користувачів. ІС створюються для конкретних груп користувачів, тобто вони, як правило, проблемно-орієнтовані.

Інформація є дані, яким надається деякий зміст (інтерпретація) у конкретній ситуації у рамках деякої системи понять. Інформація представляється за допомогою кодування даних і витягається шляхом їхнього декодування й інтерпретації.

У цьому визначенні фіксується три основних перетворення інформації й даних у процесі їхньої обробки в ІС: інформація – дані, дані – дані, дані – інформація.

На рис. 1.1 подані дві сторони визначення поняття інформації: функціональна й представницька. Перша загалом визначає коло дій над інформацією, а друга – результат виконання цих дій.





Рисунок 1.1 – Зміст поняття "інформація"

^

1.1.2 Інформаційні системи


Основною метою створення ІС є задоволення інформаційних потреб користувачів шляхом надання необхідної їм інформації на основі збережених даних. Потреба в інформації як такій не вичерпує поняття інформаційних потреб. Звичайно в поняття інформаційних потреб включають певні вимоги до якості інформаційного обслуговування й поводження системи в цілому (продуктивність, актуальність і надійність даних, орієнтація на користувача та ін.).

Під інформаційною системою розуміється організаційна сукупність технічних засобів, технологічних процесів і кадрів, що реалізують функції збору, обробки, зберігання, пошуку, видачі й передачі інформації.

Необхідність підвищення продуктивності праці у сфері інформаційної діяльності призводить до того, що як зовнішні засоби зберігання й швидкий доступ до інформації найчастіше використовуються засоби обчислювальної техніки (цифровий й аналоговий) на основі комп'ютерів. Сучасні ІС - складні комплекси апаратних і програмних засобів, технології й персоналу, які ще називають автоматизованими інформаційними системами. Структурно ІС містять у собі апаратне (hardware), програмне (software), комунікаційне (netware), проміжного шару (middleware), лінгвістичне й організаційно-технологічне забезпечення.

^ Апаратне забезпечення ІС містить у собі широкий набір засобів обчислювальної техніки, передачі даних, а також цілий ряд спеціальних технічних пристроїв (пристрою графічного відображення інформації, аудио- і відеопристрою, засобу мовного уведення й т.д.). Апаратне забезпечення є основою будь-якої ІС.

^ Комунікаційне (мережне) забезпечення містить у собі комплекс апаратних мережних комунікацій і програмних засобів підтримки комунікацій в ІС. Воно має істотне значення при створенні розподілених ІС й ІС на основі Інтернету.

^ Програмне забезпечення ІС забезпечує реалізацію функцій введення даних, їх розміщення на носіях, модифікації даних, доступ до даних, підтримку функціонування устаткування. Програмне забезпечення можна розділити на системне (яке вінчає процес вибору апаратно-програмного рішення, або платформи) і користувальницьке (яке застосовується для рішення завдань задоволення потреб користувача у комп'ютерному середовищі).

^ Лінгвістичне забезпечення ІС призначене для рішення завдань формалізації змісту повнотекстової й спеціальної інформації для створення пошукового образу даних (профілю). У класичному змісті звичайно воно включає процедури індексування текстів, їхню класифікацію й тематичну рубрикацію. Найчастіше ІС, що містять складно-структуровану інформацію, містять у собі тезауруси термінів і понять. Сюди можна віднести й створення процесорів спеціалізованих формальних мов кінцевих користувачів, наприклад мов для маніпулювання бухгалтерською інформацією й т.д. Найчастіше роботам по розробці лінгвістичного забезпечення не надається належного значення. Подібні недогляди найчастіше ведуть до несприйняття користувачами самої. Це відноситься в першу чергу до вузько спеціалізованих ІС.

У міру зростання складності й масштабів ІС важливу роль починає грати організаційно-технологічне забезпечення, що з'єднує різнорідні компоненти (апаратури, програми й персонал) у єдину систему й забезпечує процедури її керування й функціонування. Недооцінка цієї складової ІС найчастіше призводить до зриву строків впровадження системи й виводу її на виробничі потужності.

На рис. 1.2 наведені функції ІС через її основні структурні компоненти.





Рисунок 1.2 – Визначення інформаційної системи

^

1.1.3 Ітераційна процедура побудови ІС


Традиційно й повсюди, особливо на початкових етапах розвитку інформаційної інфраструктури організації, використовується так званий позадачний метод рішення завдань автоматизації, спрямований на рішення досить простих і зрозумілих керівництву завдань. Наприклад, виписка рахунків, підготовка документів. Кон'юнктурна перевага такого методу очевидна: досить швидко може бути отриманий результат, існування модної нині ІТ-служби виправдано. Даний метод дозволяє, з одного боку, начебто б не відставати від життя (наявність ІС в організації найчастіше є одним з визначальних факторів її конкурентноздатності), а з іншого боку - заощаджувати кошти на автоматизації. Вищевказаний підхід дозволяє використовувати службовців невисокої кваліфікації. Рано або пізно це стає гальмом у розвитку інформаційної інфраструктури організації.

Зміна напрямів бізнесу організації призводить до питання перегляду відносин до ІС в організації, тобто до питання - переробити або почати спочатку. Почати спочатку завжди вигідніше. Можна застосовувати вже добре відпрацьовані в інформатиці методики проектування "донизу" або "знизу-догори". Однак рано або пізно знову підніматимиться питання про відповідність вимогам сьогоднішнього дня.

Розроблювачі ІС фактично завжди користуються методикою "зсередини" (midlle of design): є деяка створена основа і навколо неї варто розвиватися у різних напрямах, не сильно нехтуючи сформованими традиціями. Таким чином, постулюється ітераційний підхід у розробці й створенні ІС, що визначається життєвою необхідністю.

Основна особливість реалізації концепції розробки ІС, орієнтованої на інтегровані процеси, - це наявність або відсутність складального конвеєра, оскільки необхідно збирати докупи багато технологічних процесів обробки інформації. При об'єднанні технологічних процесів обробки інформації збільшується швидкість проходження інформації у системі, прийняття рішень на основі інформаційних потоків стає частиною процесу обробки інформації, зменшується ієрархія управлінських структур.

Для того, щоб ІС жила довго і її експлуатація приносила відчутну вигоду, необхідно ретельно проектувати і її архітектуру, і її складові компоненти, зокрема БД, про які піде мова нижче.

^

1.1.4 Основні підходи до обробки інформації в автоматизованих ІС


Одним із головних питань розробки програмного забезпечення ІС є питання про співвідношення програм і даних, тому що вирішення цього питання, в остаточному підсумку, визначає вибір алгоритмів обробки інформації, апаратних засобів і технологічної платформи. Фундаментальним принципом у вирішенні питання про співвідношення програм і даних є концепція незалежності прикладних програм від даних, і неважливо, яка обробка даних передбачається: централізована або розподілена. Суть цієї концепції полягає не стільки у відділенні програм від даних, скільки у розгляді їх як самостійних взаємодіючих об'єктів.

Однією з останніх модифікацій цього принципу є концепція незалежності прикладних програм від даних разом із процедурами їхньої обробки (об’єктно-орієнтований підхід у програмуванні), що дозволяє вирішити ряд питань обробки даних, пов'язаних з інтерпретацією семантичного змісту даних.

Формування концепції БД (БД) і створення на її основі методу баз даних для вирішення завдань обробки інформації відбулося у 1962 році. До середини 60-х років минулого століття основною концепцією побудови програмного забезпечення була концепція файлової системи й так званий позадачний метод. Наприкінці 80-х років минулого століття була запропонована концепція об’єктно-орієнтованих баз даних й об’єктно-орієнтований підхід розроблення програм на основі обробки подій. На рис. 1.3 наведені основні риси для кожної з зазначених вище концепцій. На рис. 1.4 проведене зіставлення основних методів обробки даних.

Основний зміст позадачного методу зводиться до декомпозиції програми зі своїми окремими блоками даних та алгоритмами; методу баз даних – до наявних окремих описів логічної структури даних та єдиної точки зору щодо процедури обробки даних; об'єктно- орієнтованого методу, який полягає в тому, що програми розглядаються як сукупність об'єктів, між якими відбувається обмін інформацією.

Об'єкту притаманні такі властивості:

інкапсуляція – об'єкти наділяються структурою й мають певне поводження (набором операцій). Операції над об'єктами становлять його методи. Структура об'єкта схована від користувача, що маніпулює об'єктом через його операції. Об'єкт розглядається як абстракція реального світу. Для того, щоб об'єкт виконав деяку дію, йому потрібно послати повідомлення. Об'єкт взаємодіє з іншими об'єктами через події.





Рисунок 1.3 – Основні концепції обробки інформації





Рисунок 1.4 – Основні проблеми методів обробки інформації


  • спадкування – являє собою механізм, що дозволяє робити одні об'єкти з інших, при цьому властивості батьківського об'єкта зберігаються у нащадка;

  • поліморфізм – різні об'єкти можуть одержувати однакові повідомлення, але реагувати на них по-різному, відповідно до реалізації своїх однойменних методів.



^

1.1.5 Концепція баз даних


Базу даних у загальному випадку можна визначити як уніфіковану сукупність збережених і відтворених даних, що використовуються у рамках організації (Engles R.A., 1972 р.). Однак поняття БД не ґрунтується в цей час на єдиній концепції, скоріше це ціле сімейство пов'язаних між собою понять з ПО, програмного й апаратного забезпечення, аналізу й моделювання даних і додатків. Існує кілька визначень БД.

^ База даних (за Дж. Мартіном) є сукупність взаємозалежних даних, які спільно використовуються декількома додатками й зберігаються з мінімальною регульованою надлишковістю. Дані запам'ятовуються таким чином, щоб вони, у міру можливості, не залежали від програм. Для обробки даних застосовується загальний керуючий метод доступу. Якщо БД не перетинаються за структурою, то говорять про систему баз даних.

^ База даних (відповідно до матеріалів комітету КОДАСІЛ) складається зі всіх екземплярів записів, екземплярів наборів записів й областей, які контролюються конкретною схемою. Під схемою можна розуміти карту всієї логічної структури БД.

Для розроблювача ІС істотним моментом при використанні концепції баз даних (БД) є та обставина, що дані стають певним чином організовані, здобувають якусь упорядкованість і внутрішню структуру, а також те, що є деякий набір уніфікованих операцій обробки даних і декларативних засобів подання даних. До таких операцій варто віднести операції "Вставити" (Insert), "Додати" (Add), "Видалити" (Delete) і ряд інших. До декларативних засобів подання даних варто віднести мови визначення даних. Тобто використання даної концепції при створенні ІС припускає наявність мови визначення даних і мови маніпулювання даними, а також правил побудови інтерфейсів програм (додатків)із БД і користувачем.

Такий розподіл засобів маніпулювання даними і їхнього подання є деякою мірою умовним. Мова визначення даних служить для опису логічної структури (схеми) БД, а в деяких випадках і способів зберігання й доступу до даних. Мова маніпулювання даними надає алгоритмічні засоби побудови додатків для обробки елементів даних, які зберігаються у БД.

^

1.1.6 Системи керування базами даних


У випадку застосування концепції БД для створення ІС природно виникає запитання - а хто або що повинен все це підтримувати? Таким чином, постає питання про систему керування базою даних (СКБД). СКБД є складними програмними системами, що працюють на різних операційних платформах. Саме СКБД повинна надати засоби визначення й маніпулювання даними, зробивши дані незалежними від прикладних програм, що їх використовують.

До основних функцій СКБД необхідно віднести:

  • забезпечення мовних засобів опису та маніпуляції даними;

  • забезпечення підтримки логічної моделі даних;

  • забезпечення взаємодії логічної та фізичної структур даних;

  • забезпечення захисту та цілісності даних;

  • забезпечення підтримки БД в актуальному стані.

Системою керування базами даних (Data-base Management System) називається сукупність програмних засобів, необхідних для використання БД і подання розробникам і користувачам безліч різних подань даних.

^

1.1.7 Поняття про моделі даних


Подання інформації за допомогою даних вимагає уніфікованого підходу до поняття даних як незалежного об'єкта моделювання. Тому для розробника ІС вибір відповідної моделі даних є однією з найважливіших проблем. Вибір моделі даних спричиняє вибір засобів аналізу ПО, як області реального світу, що підлягає вивченню й обробці. Модель даних обмежує можливість вибору СКБД, тому що звичайно окремо взята модель підтримує певну модель даних. Таким чином, поняття моделі даних є одним із фундаментальних понять інформатики, від якого багато в чому залежать механізми реалізації ІС як програмно-апаратного комплексу.

^ Модель даних (Data Model) є логічна структура даних, що представляє притаманні цим даним властивості, незалежні від апаратного й програмного забезпечення й не пов'язані з функціонуванням комп'ютера.

Можна розглянути кілька аспектів моделювання в обробці даних:

  • інформаційне моделювання;

  • концептуальне моделювання (моделювання семантики ПО);

  • логічне моделювання даних;

  • фізичне моделювання:

  • створення моделей доступу до даних;

  • оптимізація фізичної організації даних в апаратному середовищі.

На рис. 1.5 ілюструється загальний зміст поняття моделі даних на теперішній час.





Рисунок 1.5 – Подання про інформаційну модель даних


Основні типи моделей й їхня еквівалентність

Наявність у СКБД певної структури даних призводить до поняття баз структурованих даних, тобто дані в таких БД повинні бути представлені як сукупність взаємозалежних елементів. Варто мати на увазі, що для кожного типу БД використовуються відповідні моделі даних.

У цей час для баз структурованих даних розрізняють три основних типи логічних моделей даних залежно від характеру підтримуваних ними зв'язків між елементами даних - мережну, ієрархічну й реляційну. Ознаками класифікації у цих моделях є: ступінь твердості (фіксації) зв'язку, математичне подання структури моделі й припустимих типів даних (див. таблицю 1.1).

Рис. 1.6 ілюструє особливості кожної моделі даних. При зіставленні моделей варто пам'ятати, що всі вони теоретично еквівалентні. Еквівалентність моделей полягає в тому, що вони можуть бути зведені одна до іншої шляхом формальних перетворень.


Таблиця 1.1 – Загальні характеристики моделей даних


Модель даних

Характер зв'язків між об'єктами

Формальне подання

Мережна

Напівтверді зв'язки

Довільний граф

Ієрархічна

Тверді зв'язки

Деревоподібна структура

Реляційна

Мінливі зв'язки

Плоский файл



  1   2   3   4   5   6   7   8   9   ...   19

Схожі:

Організація баз даних та знань iconОрганізація баз даних та знань
Організація баз даних та знань: Конспект лекцій/ Укладач А. В. Неня.– Суми: Вид-во СумДУ, 2009.– 199 с
Організація баз даних та знань iconМіністерство освіти І науки україни
Формування у слухачів знань, вмінь та навичок з проектування, розробки баз даних, використання сучасних мов запитів до баз даних,...
Організація баз даних та знань icon1. Назва модуля
Структури баз даних, реляційна модель даних, er-моделі реляцій­них баз даних, нормалізація баз даних, мова структурованих запитів...
Організація баз даних та знань iconОгляд сучасних систем інтеграції неоднорідних баз даних І знань
З єдиних позицій проаналізовано сучасний стан систем інтеграції неоднорідних баз даних і знань
Організація баз даних та знань iconПрограма, Робоча навчальна програма дисципліни “Організація баз даних та знань” Освітньо-кваліфікаційний рівень – «Бакалавр»

Організація баз даних та знань iconРекомендації щодо пошуку журналів, які входять до міжнародних науковометричних баз даних (scopus, Web of Science, Inspec)
Для визначення рівня наукових публікацій все частіше використовується поняття належності того чи іншого журналу до науково-метричних...
Організація баз даних та знань iconМодульна програма з навчальної дисципліни «Теорія баз даних»
Дисципліна «Теорія баз даних» є частиною курсу професійно-орієнтованих вибіркових дисциплін, являється важливой для базової підготовки...
Організація баз даних та знань iconКонспект лекцій Суми Видавництво Сумду 2009 Міністерство освіти І науки України Сумський державний університет
Організація баз даних та знань: Конспект лекцій/ Укладач А. В. Неня.– Суми: Вид-во СумДУ, 2009.– 199 с
Організація баз даних та знань iconSql azure Database як інноваційна технологія баз даних
Анотація: Розглядається підхід організації інноваційного методу використання баз даних. Детально описана на прикладі нова модель...
Організація баз даних та знань iconКонтрольні питання до екзамену з дисципліни «Адміністрування баз даних» Спеціальність «Економічна кібернетика», очне відділення, 10 семестр
Поняття тригера, хранимої процедури у сучасних реляційних субд. Активні бази даних
Додайте кнопку на своєму сайті:
Документи


База даних захищена авторським правом ©zavantag.com 2000-2013
При копіюванні матеріалу обов'язкове зазначення активного посилання відкритою для індексації.
звернутися до адміністрації
Документи