viernes, 31 de agosto de 2012

Datos Normalizados


Diferencia entre los datos Normalizados en primera forma normal (1FN) y el universo de datos no normalizado

Antes del análisis y la comparación de los datos normalizados y los no normalizados, conozcamos que es la Normalización de datos: 
¿Qué es normalización?
Normalización es un proceso que clasifica relaciones, objetos, formas de relación y demás elementos en grupos, en base a las características que cada uno posee.
Identifican ciertas reglas, se aplica una categoría; si se definen otras reglas, se aplicará otra categoría.

La diferencia que existe entre los datos Normalizados en primera forma normal (1FN) y el universo de datos no normalizado:
El universo de datos no normalizado se refiere al conjunto de datos que están reunidos bajo un criterio en común, estos datos son una gran cantidad de información desorganizada y, en algunos casos, compleja para su análisis u otros usos, ya que tiene un albedrio de información, y en ello encontraremos muchas inconsistencias o ¨defectos¨, como las siguientes:
·         * La REDUNDANCIA de datos
* ERRORES DE ACTUALIZACION de datos.
FALTA DE INTEGRIDAD E INCONSISTENCIA en los datos.
En relación a tablas no normalizadas (cuando almacenamos información no normalizada):
·       *  Repetición de nombres de cada tabla.
·       *  Presencia de dos filas iguales.
·       *  Los datos de una misma columna de un mismo tipo.
·       *  De inserción: imposibilidad de adicionar datos en la BD por la ausencia de otros.
·       *  De borrado: pérdida no intencionada de datos debido a la eliminación de otros.
En cambio, cuando tenemos los datos organizados bajo ciertos criterios, como la Primera Forma Normal (1FN), se debe cumplir con lo siguiente:
·       *  Una relación R se encuentra en 1FN si y solo sí por cada renglón columna contiene valores atómicos.
·      *   Las celdas de las tablas poseen valores simples y no se permiten grupos ni arreglos repetidos como valores, es decir, contienen un solo valor por cada celda.
·       *  Todos los ingresos en cualquier columna (atributo) deben ser del mismo tipo.
·       *  Cada columna debe tener un nombre único, el orden de las columnas en la tabla no es importante.
·      *   Dos filas o renglones de una misma tabla no deben ser idénticas, aunque el orden de las filas no es importante.


EJEMPLOS DE LA 1FN:
Ejemplo 1:
En esta Guía de Pedido, la PK es el Nro_GI (número de guía) quién determina a los demás atributos de la tabla.

Ejemplo 2:
En este caso de la biblioteca, la PK es el CodLibro, quién determina a los demás atributos de la tabla.

Ejemplo 3:
En esta Informe de Notas, la PK esta conformada por el ID-Estudiante y el ID-Clave, quienes determinan a los demás atributos de la tabla.


Ejemplo 4:
En esta Boleta de Ventas, la PK es el Num_bol (número de boleta) quién determina a los demás atributos de la tabla.



Explique detalladamente que resuelve la segunda forma normal (2FN)

Una relación esta en 2FN si cumple con la 1FN y ademas todos los atributos que no son clave primaria, están en dependencia funcional completa con la clave primaria.
La segunda forma normal (2FN) resuelve:
La dependencia que deben tener los atributos que no son clave primaria, es decir, que cada uno de estos atributos debe tener dependencia funcional completa con la clave primaria.
Ejemplos:

 


Por otro lado, las fallas que presenta la 2FN son:
·       *  Problemas de almacenamiento que son causados por la Dependencia Transitiva (DT)

Como se ve en la figura la tabla Factura, se ve que Nombre_cliente, Direccion_cliente y Poblacion_cliente, dependen funcionalmente de Codigo_cliente, sin embargo Codigo_cliente no es clave primaria, por lo tanto existe una Dependencia Transitiva (DT), aqui es donde falla la 2FN y se procede a normalizar a 3FN.

Explique detalladamente que resuelve la tercera forma normal (3FN)



 Una relación R está en 3FN si y solo si esta en 2FN y todos sus atributos no primos dependen no transitivamente de la llave primaria.
Consiste en eliminar la dependencia transitiva que queda en una segunda forma normal, en pocas palabras una relación esta en tercera forma normal si está en segunda forma normal y no existen dependencias transitivas entre los atributos, nos referimos a dependencias transitivas cuando existe más de una forma de llegar a referencias a un atributo de una relación.
Un ejemplo de una tabla 2NF que falla en satisfacer los requerimientos de la 3NF es:




 Explique detalladamente que resuelve la cuarta forma normal (4FN)


Una tabla está en 4NF si y solo si esta en Tercera forma normal o en BCNF (Cualquiera de ambas) y no posee dependencias multivaluadas no triviales. La definición de la 4NF confía en la noción de una dependencia multivaluada. Una tabla con una dependencia multivaluada es una donde la existencia de dos o más relaciones independientes muchos a muchos causa redundancia; y es esta redundancia la que es suprimida por la cuarta forma normal.
Para entender mejor aún esto consideremos una afinidad (tabla) llamada estudiante que contiene los siguientes atributos: Clave, Especialidad, Curso tal y como se demuestra en la siguiente figura:
Para entender mejor aún esto consideremos una afinidad (tabla) llamada estudiante que contiene los siguientes atributos: Clave, Especialidad, Curso tal y como se demuestra en la siguiente figura:

Clave
Especialidad
Curso
S01
Sistemas
Natación
S01
Bioquímica
Danza
S01
Sistemas
Natación
B01
Bioquímica
Guitarra
C03
Civil
Natación
Existe dependencia de valores múltiples
Las dependencias de valores múltiples se definen de la siguiente manera: Clave ->->Especialidad y Clave->->Curso; Esto se lee "Clave multidetrmina a Especialidad, y clave multidetermina a Curso"
Para eliminar la redundancia de los datos, se deben eliminar las dependencias de valores múltiples. Esto se logra construyendo dos tablas, donde cada una almacena datos para solamente uno de los atributos de valores múltiples.
Para nuestro ejemplo, las tablas correspondientes son:
Tabla Eespecialidad
Clave
Especialidad
S01
Sistemas
B01
Bioquímica
C03
Civil



Tabla ECurso
Clave
Curso
S01
Natación
S01
Danza
B01
Guitarra
C03
Natación

A continuación otro ejemplo con similares características:


Y su solución se presentaría de la siguiente manera:
Ejemplo de pasos de la normalización desde la 1FN hasta la 4FN




Hallamos el PK: (C_Disquera, C_Grupo, C_Músico, C_Canción)

DMV:

DISCOXGRUPO(C_Grupo, C_Disco)
CANCIONXGRUPO(C_Grupo, C:Canción)
CANCIONXDISCO(C_Disco,C_Canción)

DFC:

DISQUERA (C_Disquera , N_Disquera, #_TelefonoDisquera, T_DireccionDisquera, T_CorreoElectronicoDisquera)

GRUPO (C_Grupo, N_Grupo, Q_Integrantes, Q_DiscosGrabados, #_TelefonoGrupo, T_GeneroMusical, T_CorreoElectronicoGrupo)

MUSICO (C_Musico ,N_Musico, D_Nacimiento, #_TelefonoMusico, T_CorreoElectronicoMusico)

CANCION (C_Canción, N_Canción, Q_DuraciónCanción)

DISCO (C_Disco, N_Disco, Q_EjemplaresVendidos, Q_Canciones, D_Lanzamientos, ~_Disco)

DISQUERA_GRUPO (C_Disquera, C_Grupo, C_Disco)

GRUPO_MUSICO (C_Grupo, C_Musico, N_Puesto)


Alumno: Alan Lazaro Vasquez
Curso: Base de Datos
Ciclo: 2012-2
Profesor: Luis Serna Jherry





No hay comentarios:

Publicar un comentario