Una base de datos distribuida, o por sus siglas en inglés DDB (Distributed Database), la podemos entender como una base de datos tradicional dividida en diferentes partes físicamente dispersas y que se acceden de forma lógica, tal como se accede a una base de datos centralizada por medio de un Sistema de Administración de Bases de Datos.
Como podemos observar, en esta definición de base de datos distribuida, mucho del trabajo tiene que ver con el Sistema Manejador o de Administración de Bases de Datos Distribuidas; por ello, no podemos hablar de bases de datos sin antes definir formalmente qué es un Sistema de Administración de Bases de Datos Distribuidas:
Un Sistema de Administración de Bases de Datos Distribuidas, o por si siglas en inglés DDBMS (Distributed Database Managment System), rige el almacenamiento y procesamiento de datos lógicamente relacionados a través de sistemas de computadoras interconectadas, en las cuales tanto las funciones de datos como de procesamiento se distribuyen entre varios sitios (Rob, Peter 2004).
Un Sistema de Administración de Base de Datos Distribuida debe realizar todas las funciones de un sistema de administración de base de datos centralizado y manejar todas las funciones necesarias impuestas por la distribución de los datos y procesamiento; además, debe realizar estas funciones adicionales transparentemente para el usuario. Las funciones transparentes de acceso a los datos del Sistema de Administración de Bases de Datos Distribuidas se iliustran en la Figura 1.
La base de datos lógica mostrada en la Figura 1 se compone de dos fragmentos, A1 y A2, localizados en los sitios 1 y 2, respectivamente. María puede consultar la base de datos como si fuera local, y también Tomás. Ambos usuarios "ven" sólo una base de datos lógica y no tienen que saber los nombres de los fragmentos. De hecho, los usuarios ni siquiera necesitan saber que la base de datos está dividida en dos fragmentos distintos, ni necesitan saber la ubicación de éstos.
Componentes del Sistema de Administración de BDD |
De acuerdo con Peter Rob (2004), el Sistema de Administración de Bases de Datos Distribuidas debe incluir (por lo menos) los siguientes componentes:
De acuerdo con Peter Rob (2004), el Sistema de Administración de Bases de Datos Distribuidas debe incluir (por lo menos) los siguientes componentes:
La Figura 2 ilustra la interacción entre los componentes. La comunicación entre procesadores de transacciones y procesadores de datos es posible mediante un conjunto de reglas o protocolos utilizados por el Sistema de Administración de Bases de Datos Distribuidas.