3 etapy normalizacji danych

Niektóre z ważnych etapów, które są zaangażowane w proces normalizacji danych, są następujące:

Istnieje kilka sposobów grupowania elementów danych w tabelach. Projektant bazy danych byłby zainteresowany wyborem sposobu, który zapewnia brak anomalii w grupowaniu danych. Anomalie te obejmują nadmiarowość danych, utratę danych i niepożądane relacje w danych.

Zdjęcie dzięki uprzejmości: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Normalizacja ma na celu wyeliminowanie anomalii w danych. Proces normalizacji obejmuje trzy etapy, z których każdy etap generuje tabelę w normalnej formie.

1. Pierwsza normalna forma:

Pierwszym krokiem w normalizacji jest umieszczenie wszystkich powtarzających się pól w osobnych plikach i przypisanie do nich odpowiednich kluczy.

Na przykładzie przetwarzania zamówienia zakupu w zamówieniu można zidentyfikować następujące elementy danych:

Identyfikator dostawcy

Nazwa dostawcy

Adres

Numer zamówienia

Data

Warunki płatnośći

Terminy wysyłki

S. No.

Kod produktu

Opis

Jednostka miary

Cena £

Zamówiona ilość

Ilość

Jak wyszczególniono powyżej, "warunki wysyłki" są powtarzane dla każdego numeru S., a w każdym zamówieniu będzie ich wiele. W pierwszym etapie normalizacji powtarzane elementy danych umieszczane są w osobnych tabelach. W ten sposób podzielimy elementy danych na dwie tabele, jak pokazano poniżej:

Kluczowe elementy danych są przedstawione wielkimi literami. Tabela znajduje się teraz w pierwszej normalnej formie (INF), ponieważ wszystkie powtarzające się elementy danych (pola) znajdują się w oddzielnej tabeli (tabela 1.2), a klucze pobierania zostały przypisane do każdej tabeli. Ponieważ w obu tabelach są dwa kluczowe elementy, można powiedzieć, że każda tabela ma klucze złożone / złożone. Ten proces normalizacji uprościł dane.

2. Druga postać normalna:

Na tym etapie normalizacji wszystkie inne niż kluczowe elementy, które są w pełni określone przez coś innego niż pełny klucz, są umieszczane w osobnej tabeli. Zwykle te nie-kluczowe elementy są zależne tylko od części złożonego klucza.

Biorąc pod uwagę tabelę 1.1, klucz złożony składający się z ID dostawcy i nr zamówienia nr. jest używany. Jednak inne niż kluczowe elementy, takie jak nazwa i adres dostawcy, zależą tylko od identyfikatora dostawcy, a nie od zamówienia nr. W związku z tym te nie-kluczowe elementy danych są umieszczane w osobnych tabelach wraz z kluczowym elementem danych-dostawca_ identyfikator.

Podobnie, inne niż kluczowe elementy danych, takie jak data, warunki płatności i warunki dostawy, zależą tylko od zamówienia nr. i dlatego są umieszczane w osobnej tabeli wraz z numerem zamówienia nr. jako kluczowy element. Teraz mamy trzy tabele zamiast Tabeli 1.1:

Podobnie możemy podzielić tabelę 1.2, oddzielając inne niż kluczowe elementy, takie jak opis, jednostka miary i cena, które zależą tylko od kodu produktu w tabeli. Podobnie, kod produktu, ilość i kwota zależna od numeru zamówienia nie, a numer S. są umieszczone w osobnej tabeli.

Druga normalna forma (2NF) jest już gotowa i jest pięć tabel.

3. Trzecia postać normalna:

Ten etap normalizacji umożliwia eliminację zbędnych elementów danych i tabel, które są podzbiorami innych tabel. Elementy nadmiarowe to te nie będące kluczowymi elementami danych, które są umieszczone w więcej niż jednej tabeli wirtualnych elementów danych.

Wirtualne elementy danych to te elementy, których wartość można obliczyć przy użyciu innych elementów, gdy wymagana jest wartość. Wartość elementu danych ilościowych w tabeli 1.2.2 można obliczyć, mnożąc ilość z ceną, eliminując w ten sposób takie zbędne elementy danych.

Jeśli w bazie danych przechowywana jest kolejna tabela nazywana tabelą wzorców dostawców, prawdopodobnie tabela 1.1.2 stanowi podzbiór tabeli wzorcowej dostawcy. Zatem ta tabela może również zostać wyeliminowana.

Trzecia postać normalna (3NF) oferuje grupowanie danych, które są proste, łatwe w utrzymaniu i przy minimalnej nadmiarowości.

W ten sposób normalizacja może pomóc w redukcji nadmiarowości, a także wyeliminować inne anomalie w danych. Opisany wyżej trzystopniowy proces normalizacji jest jedynie sugestywny. Dalsze próby mogą być podejmowane podczas projektowania baz danych, jeśli to konieczne, w oparciu o charakter danych.