En la actualidad vivimos en pleno desarrollo digital donde la información es fundamental para el logro de objetivos en los procesos de gestión. Cada día podemos interactuar con mayor facilidad en la tecnología digital como búsqueda por internet, avisos digitales, servicios financieros, comunicaciones, etc., donde podemos dividirlo en grupos como Data Science, Big Data y Data Analytics.
El proceso de Data Analytics consiste en: selección del conjunto de datos, análisis de las propiedades de datos, transformación del conjunto de datos de entrada, selección y aplicación de la técnica de minería de datos, extracción de conocimientos e interpretación y evaluación de datos para su mejor desarrollo.
Las técnicas de Data Analytics provienen de la inteligencia artificial y de la estadística tales como árbol de decisión, agrupamiento o clustering, regresión lineal y reglas de asociación.
En Data Analytics tenemos los ejemplos de uso referidos a los hábitos de compras en supermercados según el cliente que realiza de acuerdo a una mayor cantidad inusual de compra de un producto generando ventas compulsivas. También podemos observar los patrones de fuga donde la minería de datos ayuda a analizar los clientes proclives a darse de baja según su comparación de su comportamiento frente a clientes de baja del pasado. Otro ejemplo que cabe mencionar es la detección de fraudes según patrones característicos. Asimismo, en la Dirección estratégica analizar datos del personal para contratar un nuevo talento humano en la empresa. Y no olvidemos el Análisis del comportamiento de los visitantes en internet, para tener mayor información histórica.
Las herramientas de software son variadas tales como: Dynamic Data Web, KXEN, Statistica Data Minería, entre otros.
El análisis exploratorio de datos, permite hallar relación entre variables y/o atributos de una base de datos. Existen tipos de datos categóricos, datos numéricos y datos numéricos continuos. Cuentan con el uso de herramientas utilizadas entre ellos se ven: histogramas, Bicolor, Dotplot y diagrama de dispersión.
Data Analytics se basa en árbol de decisión con la mayor ventaja de asignar “scores” a los datos mejorando su mejor entendimiento no requieren suposiciones a cerca de los datos. Y la desventaja es tratar variables “target” binarias.
Clustering sirve para encontrar patrones de datos. Se encuentra los algoritmos de detección de grupos para mejorar Data Analytics. Aprender por observación en comparación por casos. El algoritmo con mayor uso es el Algoritmo de k-medias, detectando grupos basados en distancia.
Reglas de asociación sirven para especificar los eventos que ocurren simultáneamente. Es buena porque tiene confianza, apoyo y mejoría (Lift). A su vez la generación de reglas tiene muchos pasos: generación de matriz de co-ocurrencias para un ítem. Luego más matrices para dos o tres ítems hasta un numero total de ítems. Recordando que cada paso incrementa exponencialmente el tiempo.
Finalmente, vemos la gran importancia de Data Analytics para el mejor desarrollo en la organización de acuerdo a las habilidades estadísticas que ofrece un aprendizaje continuo en comunicación y visualización de datos.
Siclica Business & Consulting, te brindamos mayor información en tecnología. No te olvides seguirnos en nuestras redes sociales para que te enteres de nuevas noticias.