BASE DE DATOS DISTRIBUIDAS
¿Qué son?
Es un conjunto de múltiples bases de datos lógicamente relacionadas las
cuales se encuentran distribuidas en diferentes espacios lógicos (pej.
un servidor corriendo 2 máquinas virtuales) e interconectados por una
red de comunicaciones. Dichas BDD tienen la capacidad de realizar
procesamiento autónomo, esto permite realizar operaciones locales o
distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un
sistema en el cual múltiples sitios de bases de datos están ligados por
un sistema de comunicaciones de tal forma que, un usuario en cualquier
sitio puede acceder los datos en cualquier parte de la red exactamente
como si estos fueran accedidos de forma local.
Uso
Como toda base de datos,
la base de datos distribuida consiste en un almacén de datos, es decir
en un conjunto de datos almacenado de manera sistemática siempre
dispuesto a ser utilizado. Pero tiene una particularidad que la
diferencia y que consiste en que estos datos están almacenados en
distintas máquinas que integran un sistema y que tienen conexión entre
si.
Ventajas
- Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez
- Fiabilidad/disponibilidad, en un determinado momento / intervalo. Varios sitios, duplicaciones,evitan fallos
- Modularidad
- Mejora del rendimiento, BD más pequeñas,operaciones de menor volumen
- Crecimiento incremental, añadiendo poder de procesamiento y almacenamiento
Desventajas
- Complejidad del sistema, desarrollo de software más costoso, problemas de sincronización, dificultad para conocer la corrección de los algoritmos paralelos, detección de caídas de nodos
- Dependencia de la red de comunicaciones, sobrecarga de procesamiento de mensajes
- Dificultad de diseño, fases adicionales
- Poca madurez de los productos comerciales, orientados a replicación
- Funciones de administración compleja, sincronización y coordinación
- Dificultad de cambio, inexistencia de metodologías
- Personal especializado
INTEGRACION DE DATOS
La integración de datos es el problema de combinar datos que residen en
distintos sistemas, posiblemente heterogéneos entre sí y proporcionar a
los usuarios finales una vista unificada de estos datos. Por ejemplo: En
el caso de los sistemas de información medica que contiene información
clínica sobre los pacientes, la integración tiene generalmente como
propósito el facilitar a los usuarios (ya sea personal clínico,
administrativo, de investigación o el propio paciente) una vista
unificada de la información clínica recogida durante el proceso de
atención de los pacientes. Esta información no se limita únicamente a la
recogida en un departamento sino que incluye la información aportada
por la institución o el conjunto de instituciones donde el paciente ha
sido atendido alguna vez. Esta situación da lugar al concepto de
historia clínica electrónica.
Existen tres factores clave que cabe tener en consideración a la hora de afrontar un proyecto de integración de datos, independientemente de que sean clínicos o no. Estos son: autonomía de las fuentes de datos a integrar, su heterogeneidad y su distribución.
Existen tres factores clave que cabe tener en consideración a la hora de afrontar un proyecto de integración de datos, independientemente de que sean clínicos o no. Estos son: autonomía de las fuentes de datos a integrar, su heterogeneidad y su distribución.
SISTEMAS DE BASE DE DATOS DISTRIBUIDAS
Los Sistemas de Bases de Datos Distribuidas representan
más naturalmente la estructura geográficamente
descentralizada de una organización, aumentan la
disponibilidad de los datos, reducen el tráfico de
comunicación y es justificable, además, por el
abaratamiento de los costos en el equipamiento y la
infraestructura de comunicaciones de las redes de computadoras.
El diseño de las Bases de Datos Distribuidas posee las
fases del diseño centralizado y cuenta, además, con
dos nuevos problemas que caracterizan el proceso de
distribución de datos, e incluyen la determinación
de: cómo dividir la base de datos en componentes para
localizarlos en diferentes sitios, qué cantidad de datos
debe ser replicados y cómo deben los fragmentos replicados
ser localizados.
Existen varias definiciones sobre qué es un
sistema distribuido pero hay divergencias entre ellas, para
nuestros propósitos es suficiente expresar que un sistema
distribuido es una colección de computadoras
independientes interconectadas entre sí que aparecen ante
los usuarios del sistema como una única computadora
Ventajas
-
El acceso a los datos es más rápido
debido a que los datos se localizan más cercanos al
lugar donde se utilizan.
-
El procesamiento es rápido debido a que
varios nodos intervienen en el procesamiento de una carga de
trabajo
-
Nuevos nodos se pueden agregar fácil y
rápidamente.
-
La probabilidad de que una falla en un solo nodo
afecte al sistema es baja y existe una autonomía e
independencia entre los nodos.
-
Control local de los datos con que se
interactúa.
-
Mayor tolerancia a los fallos
Desventajas
-
Es más complicado el control y la
manipulación de los datos
-
Es compleja el aseguramiento de la integridad de la
información en presencia de fallas no predecibles
tanto de componentes de hardware como de software. La
integridad se refiere a la consistencia, validez y exactitud
de la información.
-
El control de concurrencia y los mecanismos de
recuperación son mucho más complejos que en un
sistema centralizado dado que los datos pueden estar
replicados.
AMBIENTE CON MULTIPLES PROCESADORES
La palabra multiusuario se refiere a un concepto de sistemas
operativos, pero en ocasiones también puede aplicarse a programas de
computadora de otro tipo (ej. aplicaciones de base de datos) e incluso a
sistemas de cómputo. En general se le llama multiusuario a la característica de
un sistema operativo o programa que permite proveer servicio y procesamiento a
múltiples usuarios simultáneamente, estrictamente es pseudo-simultáneo (tanto
en paralelismo real como simulado).
En contraposición a los sistemas monousuario, que proveen servicio y
procesamiento a un sólo usuario, en la categoría de multiusuario se encuentran
todos los sistemas que cumplen simultáneamente las necesidades de dos o más
usuarios, que comparten los mismos recursos. Actualmente este tipo de sistemas
se emplean especialmente en redes, pero los primeros ejemplos de sistemas
multiusuario fueron los centralizados, que los usuarios compartían a través del
uso de múltiples dispositivos de interfaz humana.
ASPECTOS IMPORTANTES DE LOS SISTEMAS DE BASE DE DATOS
Los
sistemas de base de datos son ampliamente usados, especialmente en las
universidades, centros de investigación, banca de seguros, líneas aéreas, telecomunicaciones, recursos humanos, tiendas, supermercados, etc.
Como se
puede observar, las base de datos forman parte importante de la mayoría de empresas actuales, las personas o usuarios no son
conscientes de su uso debido a las interfaces, pero en el desarrollo diario de los quehaceres estas ocupan los
principales planos, de hecho las base de datos forman parte de la vida de las
personas.
SGBD MÁS
USADOS
Entre los
sistemas gestores de base de datos más usados, tenemos entre otros de acuerdo
al tipo de licencia, Libres:
- MySQL: Perteneciente a Sun Microsystems (también existe una versión no libre y más completa).
- Postgresql.
- Open Office Database: De Sun Microsystems.
- SQLite: Con licencia GPL, entre otros.
Privativos
- Oracle Database: Perteneciente a Oracle Corporation.
- Fox Pro.
- Magic.
- Microsoft SQL sever.
- Microsoft Access.
- ADABAS: Perteneciente a IBM.
- Paradox.
No hay comentarios:
Publicar un comentario