Base de datos y archivos - dbms
La base de datos es un sistema de registros computarizados.
Se utiliza su información para operaciónes y toma de desiciónes en una empresa.
Se diseñan con diagramas de entidad-relación, los cuales representan las tablas y sus relaciónes con otras.
Los principales manipuladores de la BD son los administradores de datos y los administradores de base de datos. Los primeros se encargan de diseñar, a grandes rasgos, la base de datos según los datos que necesite la empresa; y además, estableciendo políticas de seguridad de datos.
Los segundos, crean la BD física, cumple con las políticas de los administradores de datos, y aseguran el rendimiento adecuado de la BD.
Relación BD con archivos físicos
En comparación a archivos físicos, almacenar datos en una BD tiene las siguientes ventajas:
- compactación del espacio físico
- velocidad superior para obtener datos
- información actualizada
- labor automático, en contraste al manual
Relación BD con archivos digitales
- Los datos en tablas en la BD pueden compartirse con, p ej. sucursales.
- Se reduce la redundancia de datos
- Se minimizan las inconsistencias
- Se asegura la integridad de los datos
- Se comple con la seguridad establecida por el administrador de datos.
- Se posibilita el equilibrio de recursos según terminal/proceso si es requerido.
- El programa no necesita ajustarse al diseño físico de la BD, es decir, una persona puede generar tablas con menor cantidad de columnas,y el programa, gracias al gestor de bd, lee registro a registro.
NIVELES EN EL DBMS
Nivel físico: Forma de almacenamiento de los datos en la máquina física.
Nivel conceptual: Diseño orientado a objetos, en donde se ignora su representación física.
Nivel visión: Es la forma en que se visualizan los datos. Entra en juego la limitación de visualización y seguridad de datos (un empleado no puede ver los sueldos de sus compañeros)
Base de datos distribuidas
- Las bases de datos distribuidas son bases de datos que se presentan relacionadas y distribuidas en forma lógica (p ej. en máquinas virtuales) interconectadas por la red.
Software y hardware involucrado
(H) nodo: El nodo es una computadora o máquina virtual. Puede ser nodo de transición, que ejecuta el administrador de transacciónes distribuídas; y el nodo de base de datos, que ejecuta el gestor de BD.
(S)
DDBMS: Sistema manipulador de BD distribuídas; son un conjunto de programas que gestionan este tipo de BD.
DTM: Administrador de transacciónes distribuídas: recibe las consultas y las traduce para su posterior procesamiento en el DBMS.
DBMS: Recupera y actualiza datos de/en la base distribuída, según lo recibido por el DTM.
DISTRIBUCIÓN DE DATOS:
Datos centralizados: La BD se encuentra en UN lugar físico y son los usuarios los que se encuentran distribuídos. Modelo cliente-servidor.
Datos replicados: (Espejos) Cada nodo espejo contiene a toda la BD y todos los nodos contienen la réplica de la misma BD.
Datos particionados (fragmentados) : Las tablas de la BD se dividen en fragmentos y éstos permanecen almacenados en diversos nodos.
PLANIFICADOR
El planificador es un programa que manipula planificiónes. Éstas son un conjnto de operaciónes y su órden.
BLOQUEOS
Los bloqueos son acciónes que esperan a un evento para ser realizadas.
Los bloqueos se pueden originar en forma:
Autónima: cada nodo es responsable por sus propios bloqueos.
Copia primaria: un nodo primario es responsable para todos los bloqueos de recursos.
CONTROL DE CONCURRENCIA:
Las concurrencias se dan, cuando:
Una transacción modifica con datos no actualizados.
Una recuperación recupera información parcialmente modificada.
Se solucionan los siguientes casos:
- Si hay datos duplicados, el gestor de BD debe localizar y actualizar las tablas.
- Si un nodo falla durante una actualización, el gestor de BD debe asegurar si el dato actualizado existe cuando se reconecte el nodo.
- En la sincronización de bloqueos en todos los nodos, se soluciona con tiempo máximo de espera.
ALGORITMOS DE CONTROL DE CONCURRENCIA:
Bloqueo de dos fases: Utiliza bloqueos de lecto escritura para realizar las transacciónes.
Timestamp: A cada consulta se le asigna una marca de tiempo; si hay conflictos en las consultas, entonces se serializan.
BASES DE DATOS JERÁRQUICAS
En las bases de datos jerárquicas, las tablas se encuentran jerarquizadas mediante vínculos padre hijo (P-H). Utiliza una estructura de árbol. Su nivel lógico no difiere del nivel físico.
Para buscar la información se realiza un recorrido de preorden en el árbol generando un árbol de ocurrencias, el cual contiene los posibles resultados.
Vínculos P-H
Los vínculos padre-hijo representa la relación 1:M de las tablas. Éstos permiten generar el posterior árbol de ocurrencias. Físicamente se implementan como punteros.
Vínculos virtuales P-H
Cuando hay hijos que pueden tener muchos padres, es decir, relación M:M se utilizan punteros conocidos como vínculos PH virtuales. Su implementación rompe con el esquema de árbol.
Restricciónes de integridad
- No hay hijo sin padre (salvo el raíz)
- La eliminación de un hijo implica eliminar recursivamente a sus hijos, pero no a su padre.
- Si hay vínculos virtuales, el registro no se podrá eliminar.
- Si un hijo tiene padres del mismo tipo, él debe duplicarse.
- Si un hijo tiene padres de diferentes tipos, uno de ellos será su padre físico y los demás serán padres virtuales.
0 comentarios:
Publicar un comentario
Dejanos tu comentario