Almacenamiento de datos
¿Qué es el almacenamiento de datos?
El almacenamiento de datos es el almacenamiento electrónico de una gran cantidad de información por parte de una empresa u organización. El almacenamiento de datos es un componente vital de la inteligencia empresarial que emplea técnicas analíticas sobre datos empresariales.
El concepto de almacenamiento de datos fue introducido en 1988 por los investigadores de IBM Barry Devlin y Paul Murphy. La necesidad de almacenar datos evolucionó a medida que los sistemas informáticos se volvieron más complejos y manejaban cantidades cada vez mayores de datos. Un libro clave sobre el almacenamiento de datos es «Building the Data Warehouse» de WH Inmon, que se publicó por primera vez en 1990 y se ha reimpreso varias veces desde entonces.
Cómo funciona el almacenamiento de datos
El almacenamiento de datos se utiliza para proporcionar una mayor comprensión del desempeño de una empresa al comparar datos consolidados de múltiples fuentes heterogéneas. Un almacén de datos está diseñado para ejecutar consultas y análisis de datos históricos derivados de fuentes transaccionales.
Una vez que los datos se han incorporado al almacén, no cambian y no se pueden alterar, ya que un almacén de datos ejecuta análisis de eventos que ya han ocurrido enfocándose en los cambios en los datos a lo largo del tiempo. Los datos almacenados deben almacenarse de manera segura, confiable, fácil de recuperar y fácil de administrar.
Hay ciertos pasos que se toman para crear un almacén de datos. El primer paso es la extracción de datos, que implica recopilar grandes cantidades de datos de múltiples puntos de origen. Una vez que se han compilado los datos, pasan por la limpieza de datos, el proceso de peinar los datos en busca de errores y corregir o excluir los errores encontrados.
Los datos limpiados luego se convierten de un formato de base de datos a un formato de almacén. Una vez que se almacenan en el almacén, los datos se clasifican, consolidan, resumen, etc. para que estén más coordinados y sean más fáciles de usar. Con el tiempo, se agregan más datos al almacén a medida que se actualizan las múltiples fuentes de datos.
Conclusiones clave
- El almacenamiento de datos es el almacenamiento electrónico de una gran cantidad de información por parte de una empresa u organización.
- Un almacén de datos está diseñado para ejecutar consultas y análisis de datos históricos derivados de fuentes transaccionales con fines de inteligencia empresarial y minería de datos.
- El almacenamiento de datos se utiliza para proporcionar una mayor comprensión del desempeño de una empresa al comparar datos consolidados de múltiples fuentes heterogéneas.
Consideraciones especiales: minería de datos
Las empresas pueden almacenar datos para su uso en exploración y minería de datos, buscando patrones de información que les ayuden a mejorar sus procesos comerciales. Un buen sistema de almacenamiento de datos también puede facilitar que los diferentes departamentos de una empresa accedan a los datos de los demás.
Por ejemplo, un almacén de datos podría permitir a una empresa evaluar fácilmente los datos del equipo de ventas y ayudar a tomar decisiones sobre cómo mejorar las ventas o optimizar el departamento. La empresa puede optar por centrarse en los hábitos de gasto de sus clientes para posicionar mejor sus productos y aumentar las ventas.
Con el almacenamiento de datos, la empresa puede recopilar datos históricos de los gastos de sus clientes durante los últimos 20 años, digamos, y ejecutar análisis de estos datos. La información resultante podría proporcionar información sobre las preferencias de sus consumidores; la hora del día, mes o año con mayores ventas; o el cliente con mayor gasto del año.
El almacenamiento y la gestión de datos efectivos también son los que hacen posible los procesos, como iniciar reservas de viajes y utilizar cajeros automáticos.
El proceso de minería de datos se divide en cinco pasos:
- Las organizaciones recopilan datos y los cargan en sus almacenes de datos.
- Luego almacenan y administran los datos, ya sea en servidores internos o en la nube.
- Los analistas comerciales, los equipos de gestión y los profesionales de tecnología de la información acceden a los datos y determinan cómo quieren organizarlos.
- El software de la aplicación luego ordena los datos en función de los resultados del usuario
- El usuario final finalmente presenta los datos en un formato fácil de compartir, como un gráfico o una tabla.
Almacenamiento de datos frente a bases de datos
Un almacén de datos no es necesariamente el mismo concepto que una base de datos estándar. Una base de datos es un sistema transaccional que está configurado para monitorear y actualizar datos en tiempo real para tener solo los datos más recientes disponibles. Un almacén de datos está programado para agregar datos estructurados durante un período de tiempo. Por ejemplo, una base de datos puede tener solo la dirección más reciente de un cliente, mientras que un almacén de datos puede tener todas las direcciones en las que el cliente ha vivido durante los últimos 10 años.