1.2 Características de las bases de datos distribuidas
Imprime este documento

De acuerdo con Peter Rob (Rob, 2004), un DDBMS rige el almacenamiento y procesamiento de datos lógicamente relacionados a través de sistemas de computadoras interconectadas, en las cuales tanto las funciones de datos como de procesamiento se distribuyen entre varios sitios. De esta manera, un DDBMS debe contar por lo menos con las siguientes características o funciones para ser considerado como distribuido:

  • Interface de aplicación para interactuar con el usuario final o con programas de aplicación y con otros sistemas de administración de base de datos (DBMS) dentro de la base de datos distribuida.
  • Validación para analizar las solicitudes de datos.
  • Transformación para determinar qué componentes de solicitud de datos se distribuyen y cuáles son locales.
  • Optimización de consultas para encontrar la mejor estrategia de acceso. (¿Cuáles fragmentos deben ser accesados por la consulta y cómo, si las hay, se deben sincronizar las actualizaciones de los datos?)
  • Mapeo para determinar la ubicación de los datos de fragmentos locales y remotos.
  • Interface de E/S para leer o escribir datos de o en medios de almacenamiento locales y permanentes.
  • Formateo para presentar los datos para su representación al usuario final o un programa de aplicación.
  • Seguridad para proporcionar privacidad tanto en bases de datos locales como en remotas.
  • Respaldo y recuperación para garantizar la disponibilidad y recuperabilidad de la base de datos en caso de una falla.
  • Administración de base de datos para el administrador de la base de datos.
  • Control de concurrencia para manejar el acceso simultáneo a los datos y para garantizar su consistencia a través de los fragmentos en el DDBMS.
  • Manejo de transacciones para garantizar que los datos pasen de un estado consistente a otro. Esta actividad incluye la sincronización de transacciones locales y remotas, lo mismo que transacciones a través de segmentos múltiples distribuidos.

La Fgura 1 ilustra cómo un sistema manejador de base de datros centralizado (DBMS) maneja las interacciones entre el usuario final y la base de datos, y sirve de base para una comparación con un sistema manejador de base de datos totalmente distribuido (DDBMS).

Figura 2. Sistema de administración de base de atos totalmente distribuido.

Tal como se ilustra en la Figura 1, el DBMS:

  1. Recibe la solicitud de una aplicación (o de un usuario).
  2. Valida, analiza y descompone la solicitud. La solicitud podría incluir operaciones matemáticas o lógicas, o ambas, tales como seleccionar a todos los clientes con saldos de más de $1,000. La solicitud podría requerir datos de una sola tabla, o acceso a varias.
  3. Determina la ruta de los componentes de los datos lógicos a los datos físicos solicitados.
  4. Descompone la solicitud en varias operaciones I/O de disco.
  5. Busca, localiza, lee y valida los datos.
  6. Garantiza la consistencia, la seguridad y la integridad.
  7. Valida los datos de conformidad con las condiciones, si las hay, especificadas por la solicitud.
  8. Presenta los datos seleccionado en el formato requerido.

Todas estas actividades ocurren tras bambalinas, es decir, son transparentes para el usuario.

Un DDBMS debe realizar todas las funciones de un sistema de administración de base de datos centralizado, y además manejar todas las funciones necesarias impuestas por la distribución de los datos y procesamiento, además de realizar estas funciones adicionales transparentemente para el usuario. Las funciones transparentes de acceso a los datos del DDBMS se ilustran en la Figura 2.

Figura 2. Sistema de administración de base de atos totalmente distribuido.

 

La base de datos lógica mostrada en la Figura 2 se compone de dos fragmentos, A1 y A2, localizados en los sitios 1 y 2, respectivamente. María puede consultar la base de datos como si fuera local, y también Tomás. Ambos usuarios "ven" sólo una base de datos lógica y no tienen que saber los nombres de los fragmentos. De hecho, los usuarios ni siquiera necesitan saber que la base de datos está dividida en dos fragmentos distintos, ni necesitan saber la ubicación de éstos.

La diferencia entre el procesamiento y almacenamiento de los datos lleva varios escenarios distribuidos, en los cuales el Sistema Manejador de Base de Datos (DBMS) logra un grado de distribución (del procesamiento o de los datos, o ambos).

Anterior Siguiente