Нормалізація баз даних
Угруповання одних і тих же даних в таблиці може проводитися різними способами. Атрибути у відносини повинні групуватися за реляційному принципом, тобто має повністю мінімізуватися дублювання даних, а також спрощуватися процедура їх обробки з подальшим оновленням. Однією з першорядних завдань при проектуванні баз даних виступає усунення надмірності, а воно досягається за допомогою нормалізації.
Нормалізація баз даних являє собою якийсь формальний апарат обмежень на створення таблиць, що дозволяє усунути дублювання, з обов`язковим забезпеченням несуперечності збереженої інформації, зменшуючи трудовитрати, пов`язані з веденням та обслуговуванням бази даних. Операція нормалізації полягає в розкладанні вихідних таблиць бази даних на більш прості. На кожній із ступенів даного процесу таблиці обов`язково наводяться в нормальні форми. Кожна ступінь нормалізації характеризується певним набором обмежень, яким і повинні відповідати всі таблиці. Таким чином, здійснюється видалення з таблиць неключових інформації, яка є надлишковою.
Нормалізація баз даних грунтується на понятті функціональної залежності між атрибутами. Прийнято вважати, що один атрибут залежить від іншого, якщо в кожен момент часу певному значенню другого атрибута відповідає трохи більше, ніж одне значення першого.
Нормалізація баз даних - це загальне поняття, однак, його прийнято поділяти на кілька нормальних форм, про які й буде сказано далі.
Якої-небудь інформаційний об`єкт вважається відповідним першої нормальної формі, коли значення кожного його атрибуту є єдиним. Якщо у якогось атрибуту є повторюване значення, то не можна вважати об`єкт належить першій нормальній формі. Виходить, що можна створити ще якусь сутність, тобто інформаційний об`єкт.
Якої-небудь інформаційний об`єкт прийнято вважати приналежним до другої нормальної формі, коли він вже перебуває в першій нормальній формі, але кожен з його атрибутів, який не перебуває в потенційному ключі, повністю залежить у функціональному плані від кожного з потенційних ключів.
Якої-небудь інформаційний об`єкт прийнято вважати належним до третьої нормальної формі, якщо він вже перебуває в другій нормальній формі, але в ньому не присутній жодної транзитивної залежності неключових об`єктів від ключів. Під транзитивної залежністю прийнято розуміти очевидну залежність між полями.
Нормалізація бази даних ставить перед розробником основну мету, яка полягає в приведенні всіх відносин до третьої нормальної форми. Тільки так в подальшому можна буде створити ефективну інформаційну систему.
Нормалізація баз даних: основні правила
Варто сформулювати набір правил, яких слід притримувати в роботі з нормалізації. У першу чергу варто виключати повторювані групи. Необхідно формувати окрему таблицю, що зберігає кожен набір пов`язаних атрибутів, в якій і створити окремий ключ. Далі обов`язково виключити надлишкові дані. У випадках, коли залежність атрибута спостерігається тільки від частини ключа, то його необхідно виставити в окрему таблицю. Третє правило полягає в обов`язковому виключенні стовпців, не залежних від ключа. Атрибути слід помістити в ізольовану таблицю, якщо вони не роблять належного впливу на ключ. Обов`язково слід ізолювати незалежні множинні відносини. У даному випадку мова йде про те, що між декількома відносинами не проглядається конкретна зв`язок. І останнє, варто ізолювати множинні відносини, пов`язані семантично. На цьому нормалізація БД завершується, після чого настає процес розробки.