El desarrollo de los sistemas de bases de datos SBD, permitieron a las organizaciones almacenar y recuperar datos a demanda, de manera eficiente y rápida. En este sentido los SBD más usados sonlos basados en el modelo relacional, los cuales permiten hacer consultas y cambios sobre los datos de manera rápida, cuidando la validez y correctitud de estos.
Este
forma de manejo y almacenamiento de datos, propició la generación
de nuevas necesidades sobre los datos, tanto a nivel empresarial como
científico, las cuales consisten en determinar de qué manera, los
datos pueden responder preguntas complejas que requieran descubrir
relaciones o patrones sobre estos, como por ejemplo que porcentaje de
ventas se espera para el próximo año, basado en las ventas de años
anteriores, o indicar el comportamiento esperado de una enfermedad,
basado en estudios previos.
Para resolver estas necesidades surgieron los: Almacenes de datos, datamart, sistemas de inteligencia de negocios y minería de datos, los cuales están orientados a responder estas preguntas, por lo que su principal requerimiento es la lectura sobre grandes cantidades de datos. En este punto los sistemas tradicionales comenzaron a presentar limitaciones, principalmente en la rapidez en la que podría responder a las consultas, lo que llevo al desarrollo de nuevos sistemas optimizados para lectura.
Una de las soluciones propuestas que da respuesta eficiente a este requerimiento son los Sistemas de de base de datos orientados a columna SBDOC, los cuales aunque se basan en el modelo relacional realizan algunos cambios en la manera en que trabajan internamente, entre los cambios más importantes esta la forma en que almacenan los datos en disco duro, la cual se realiza por columnas, a diferencia de los sistemas tradicionales donde se realiza por registros, por lo que también son llamados “de almacenamiento por columna”.
Gracias a la forma en que almacenan y manejan los datos, estos sistemas pueden realizar búsquedas complejas sobre terabytes de datos en cuestión de segundos o menos, pero en contraparte la escritura de nuevos datos de manera individual es lenta comparado con los sistemas tradicionales. Hasta ahora esto ha sido compensado con un módulo de carga masiva de datos, debido a que la mayoría de aplicaciones que utilizan a los SBDOC realizan la carga de datos de esta manera; pero continúan los estudios que buscan disminuir los tiempos de escritura de datos individuales, algunos de los cuales proponen sistemas híbridos donde convergen los enfoques de almacenamiento por registro y almacenamiento por columna.
Aunque los estudios sobre los SBDOC datan de la década de los 70s no fue sino hasta el 2000 que se comenzaron a desarrollar de manera comercial, y han ido evolucionando a tal punto que actualmente existe gran variedad de SBDOC libres y comerciales , y se considera que es un área donde aun hay mucha investigación por realizar.
Prof(a).
Mercy Ospina
Universidad
Central de Venezuela
