Concepto de Data Mining o Minería de datos de Microsoft.

El siguiente artículo es un preludio de algunos temas que se ven en el curso de Business Intelligence de la IT Academy que comienza este 6 de abril !!.
Para mayor información, visitar el siguiente sitio web:
Data Mining es el nombre que se le da a la Minería de datos. Se lo llama minería porque el proceso es igual al de la extracción de mineral:
1)      Primero se extrae el mineral.
2)      Luego, por medio de procesos químicos, se purifica.
3)      Finalmente se tiene el mineral valioso purificado.
La minería de datos, es el proceso de extraer datos, procesarlos para obtener la valiosa información. El proceso de purificar es clasificar la información que es importante.
Por ejemplo, el ejército de estados unidos tenía un registro de los inmigrantes que podrían causar actos terroristas antes del atentado del 11 de septiembre del 2001. Mediante minería de datos tenían identificado al líder de los atentados Mohammed Atta y a otros 3 secuestradores. La minería de datos contenía antecedentes de los inmigrantes, religión, antecedentes penales y otros datos que le permitían suponer quién podría cometer actos terroristas. Lamentablemente el presidente de los Estados Unidos no le dio la debida importancia al informe
En este ejemplo, el primer paso es:
1.      Extraer los datos, donde se recolectan los datos de todos los inmigrantes sospechosos que son miles.
2.      Por medio de algoritmos de Data Mining se depuran los datos y se encuentran ciertos patrones de datos como ser muchos viajes, muchos contactos y reuniones. Vínculos con políticos en el pasado.

Data Mining de SQL Server


Dentro de Analysis Services, existe un módulo llamado Data Mining. Data Mining de Microsoft es una aplicación complementaria de Analysis Services que permite tomar decisiones, predecir el futuro, encontrar patrones de datos. Al instalar Analysis Services automáticamente se instala la minería de datos.
A continuación, se mostrarán algunos ejemplos de posibles escenarios en los cuales se puede usar el DataMining. 

Usos de Data Mining, clasificar datos

Cuando una empresa realiza muchas ventas de muchos productos a muchos clientes, es difícil clasificar y encontrar patrones de comportamiento que nos permitan mejorar las ventas. Data Mining ayuda mucho a agrupar y encontrar datos difícilmente encontrados mediante la intuición y consultas normales.
En un supermercado por ejemplo usando Data Mining, un supermercado determinó que las mujeres casadas de 25-40 representaban el 70% del supermercado y mediante un análisis, llegaron a determinar cuáles son los productos que más se lleva la gente (artículos de limpieza, comida, refrescos). Al analizar la información, colocaron los productos más comprados más cerca unos de otros y en el recorrido del supermercado, incluyeron artículos orientados a la rama femenina (maquillaje con descuentos, adornos de hogar y ropa para bebé). Las ventas del supermercado subieron en un 5% el primer mes. Luego de perfeccionar y analizar respuestas, perfeccionaron y colocaron más artículos dentro de las rutas más habituales y subieron a 9% las ventas.[1]
La clasificación y orientación del servicio y el estudio del cliente gracias a Data Mining es una tarea sencilla y muy moderna.

Determinar la aceptación de una tarjeta de crédito


En Norteamérica como en Europa, el uso de tarjetas de crédito reemplaza al uso del dinero en casi todas las transacciones. Para tener una tarjeta de crédito, los clientes deben tener solvencia para demostrar que son dignos de recibir una tarjeta de crédito. Los bancos, deben analizar cuidadosamente si la persona tiene la solvencia para pagar las deudas que contrae mediante la tarjeta de crédito. Caso contrario, el banco tendría que asumir la deuda causándole serias pérdidas.
Data Mining, lo que hace es recibir los datos del cliente (ingresos, estado bancario, deudas de hipotecas, número de hijos, estados financieros). Esos datos son comparados con clientes del banco más antigüos. Data Mining lo que hace es comparar al solicitante de tarjetas de crédito con los clientes de características similares y obtiene un veredicto. Es decir, el resultado del Data Mining suele ser el factor determinante para decidir la vida de la familia que solicita una tarjeta de crédito.

Determinar empleados potenciales


De manera similar a las tarjetas de crédito, muchas empresas utilizan Data Mining para determinar que candidatos que entran a una empresa rendirán bien o podrían tener más éxito.
Para ello, es muy importante que la empresa sea grande (con muy pocos empleados, la precisión de Data Mining no es buena porque tiene muy poco conocimiento del tema, mientras si tiene conocimiento de varios empleados, el sistema de Data Mining se convierte en un sistema experto en el tema y sus resultados son más precisos).
Lo que se hace para definir las características de los empleados exitosos, es tener un registro de los datos de todos los empleados (Universidad a la que asistió, si tuvo empleos previos, notas y calificaciones de exámenes en la Universidad y postgrados, historial del empleado, idiomas aprendidos, cursos tomados).
Luego se analiza y clasifica a los empleados exitosos determinando que factores comunes tienen entre ellos.
Por ejemplo una empresa determinó que los postulantes que asistieron a buenas universidades y eran buenos alumnos en ellas, lograban tener mayor éxito empresarial. Otro factor que encontraron es que los empleados con mejores resultados obtuvieron excelentes resultados en pruebas psicotécnicas.
Con estos datos, la contratación de personal se enfocó más en estas características logrando tener un excelente plantel que les dio buenos resultados a futuro.

Apoyo en campañas de Marketing


Se utiliza bastante la minería de datos para ver el impacto de los comerciales en las ventas. Por ejemplo, con Data Mining, se puede:
·         Clasificar cuál es el principal mercado. Por ejemplo, una empresa telefónica determinó utilizando Data Mining que a los comerciales mediante mensajes de texto quienes más respondían era gente de 10 a 35 años, mientras que la gente mayor era renuente a responder mensajes mediante mensajes de texto en celulares. Muy probablemente porque la gente mayor no está acostumbrada a responder a mensajes de texto comerciales.
·         Verificar las campañas más efectivas. Por ejemplo, una empresa de refrescos gaseosos, verificó el aumento de sus ventas al realizar un comercial de televisión donde ofrecía dar vasos con el logotipo de la empresa gaseosa. El comercial después de ver los datos de ventas, no incrementó las ganancias de la empresa considerablemente.
·         Continuando con el ejemplo de las gaseosas, al ver que las ventas no incrementaron considerablemente, se analizó al mercado. Luego de analizar a la gente que compraba la gaseosa utilizando un muestreo y analizándolo con Data Mining, se comprobó que los principales compradores eran padres de familia. El comercial realizado era de jóvenes y parejas en una piscina con la gaseosa. Si los principales compradores eran padres de familia, urgía cambiar el comercial a un área enfocada a familias. Cuando se cambió el comercial a un comercial más orientado a familia, las ventas aumentaron en 10 %.

Quién puede usar Data Mining de Microsoft ?


Data Mining es una tarea de Análisis de datos. Antes de usar herramientas de Data Mining, los ejecutivos utilizaban fórmulas estadísticas y teoremas muy complejos para predecir datos y tomar decisiones. Posteriormente aparecieron herramientas de Data Mining que si bien facilitaban el trabajo, todavía existían tareas que se realizaban manualmente y que requerían conocimientos estadísticos avanzados.
Data Mining de Microsoft sigue la filosofía de Microsoft en todos sus productos. “Facilitar el uso y hacerlo accesible y sencillo a la mayor cantidad de personas”. La sencillez de su uso hace que sea muy atractivo para varios usuarios. La tarea de toma de decisiones y la complejidad de los algoritmos, es algo transparente para el usuario. El usuario ahora se limita a colocar los datos de entrada y recibir los resultados.

Productos de la competencia de Microsoft



Existen diferentes herramientas de Data Mining que son la competencia de Microsoft Data Mining. Entre ellas:
·         SAS, uno de los principales líderes en Business Intelligence
·         SPSS Clementine, una excelente herramienta
·         IBM (Intelligent Miner)
·         Oracle
·         Angoss KnowledgeSTUDIO
·         KXEN
Una gran ventaja de Microsoft Data Mining es que viene incluido con la licencia de SQL Server, mientras que los mencionados productos de la competencia son aplicaciones externas con un costo adicional. 


Referencias
www.msdn.com
www.wikipedia.org





Comentarios

Entradas populares de este blog

The Deep Sea: una web interactiva para explorar las profundidades el mar y descubrir las extrañas criaturas que viven en él

Detectar el usuario de Windows utilizando C#

Lo nuevo de SQL Server 2008 respecto a SQL Server 2005