MODELADO EN BIG DATA

MODELADO EN BIG DATA. SERIE BIG DATA Y LOS NEGOCIOS

Editorial:
GARCIA-MAROTO EDITORES
Ano de edición:
Materia
Empresa
ISBN:
978-84-16806-26-3
Páxinas:
112
Encadernación:
Rústica (Tapa blanda)
-5%
21,00 €
19,95 €
IVE incluído
Consulte disponibilidad

Actualmente nos encontramos en la era del Big Data, en la que una buena parte de las organizaciones generan grandes cantidades de datos a lo largo de su actividad cotidiana. Estos volúmenes de datos se recopilan constantemente a medida que se realiza cada transacción, se completa la revisión de cada empleado, y en general se persigue alcanzar una posición de liderazgo. Estos datos constituyen una pieza fundamental de los sistemas que ejecuta una organización. Las bases de datos que alimentan estos sistemas han sido diseñadas de tal manera que los procesos empresariales de una organización sean lo más eficientes posible. La justificación para utilizar herramientas como el Big Data surge cuando los usuarios de estos negocios necesitan analizar toda esta información, para determinar, por ejemplo: cuántas transacciones se realizaron este año, desde qué región se realizaron más o menos transacciones y cuáles son los gustos generales de nuestros clientes.

Para afrontar los desafíos relacionados con el uso de sistemas transaccionales debemos realizar diseños eficientes de recogida y almacén de datos, para el análisis y generación de informes empresariales y que contenga toda la información relevante del negocio.

En este libro se abordan los conceptos y mecanismos de recolección, modelado y almacenado eficiente de datos como importantes proveedores de información para los negocios. Se centra en el modelado de sus diseños físicos y lógicos como tarea esencial en el manejo de datos. El diseño físico determina el rendimiento y la funcionalidad del almacén de datos, mientras que el diseño lógico es la opinión que presentamos a los desarrolladores y usuarios para capturar los requisitos del negocio.

El contenido recogido en este libro puede ser de interés tanto para lectores que no tengan una formación técnica, como para aquellos con formación o amplia experiencia en el mundo de las TIC. Pensando en los primeros, se introducen con claridad los aspectos básicos de uso de las tecnologías de gestión de la información, facilitando su comprensión para un amplio espectro de lectores, independientemente de cuáles sean sus conocimientos o su experiencia. Para los lectores con un nivel técnico elevado este libro aporta, además de conocimientos específicos en herramientas para el trabajo con datos, una formación muy orientada a la utilización de ciertas herramientas para resolver problemas reales de las organizaciones.

Para tratar de alcanzar estos objetivos, los temas se introducen por un lado a un nivel eminentemente aplicado, de forma que los lectores sin conocimientos técnicos previos puedan visualizar y comprobar, vía ejemplos y ejercicios, las posibilidades que ofrece el trabajo con datos. Por otro lado, pensando en aquellos lectores que tengan una formación técnica suficiente, los principios teóricos esbozados y el uso de las herramientas propuestas constituyen una rigurosa introducción al manejo de los datos.

El contenido del libro se ha estructurado de forma que se ofrezca una visión global de la recolección y el almacenado de datos y se distribuye en cinco capítulos.

El primer capítulo introduce los conceptos fundamentales para entender el modelo de negocio. El segundo capítulo se adentra en el modelado lógico de los datos, dando pautas de diseño desde el punto de vista del multidimensional. El tercer capítulo introduce técnicas de modelado físico y carga de datos, que usarán las aplicaciones empresariales. Aunque en los capítulos anteriores se utiliza un caso de uso de análisis del Clickstream en comercio electrónico como base práctica de aplicación del modelo, en capítulo cuarto se ofrece además un caso de éxito real de aplicación de análisis de datos de huella electrónica. Finalmente, el quinto capítulo aborda la selección de atributos importantes en el caso de uso complementario de la evaluación del riesgo en las transacciones de comercio electrónico.

Si se trabajan de forma suficiente los temas señalados, los lectores serán capaces de:

Conocer las diferentes etapas del modelado de los datos.Identificar los hechos, dimensiones y sus relaciones para generar modelos de almacenamiento que alimenten con datos importantes y de calidad los procesos de inteligencia de negocio.Valorar los aspectos más relevantes para asegurar la calidad de los datos.Reconocer los problemas de calidad de los datos y conocer los mecanismos necesarios para resolver estos problemas.
El libro se ha estructurado con un carácter eminentemente aplicado y a lo largo de los distintos capítulos se proponen ejercicios y actividades, siguiendo el principio: "la mejor forma de aprender es haciendo". Por último, cabe señalar que este libro se ha concebido como un texto de introducción al trabajo con datos y se ha redactado procurando que pueda utilizarse como manual de referencia para realizar una primera toma de contacto con estos procesos. Por ello, los conceptos se abordan de forma relativamente sencilla pero rigurosa. En cualquier caso, debe tenerse en cuenta que los temas objeto de estudio, si bien son sumamente interesantes, presentan un cierto grado de complejidad; y por este motivo se ha optado por mostrar cómo se deben abordar de manera muy práctica, sin entrar en los fundamentos teóricos y matemáticos de los mismos. En definitiva, este libro debe considerarse como lo que es; un manual de introducción al modelado y la carga de datos, con un marcado enfoque aplicado; por lo que puede ser especialmente idóneo para utilizarse en un curso de introducción a la materia.

">