Entradas

Mostrando entradas de marzo, 2018

SSIS con filas duplicadas - Cómo evitarlas en Excel u otro formato

Imagen
Introducción de como evitar filas duplicadas usando SSIS En este nuevo artículo mostraremos cómo eliminar filas duplicadas de Excel utilizando SSIS. Para logarlo, utilizaremos un componente externo denominado SSIS Package from Melissa Data . Requisitos SQL Server Integration Services (que se instala con SQL Server) El instalador del paquete de Melissa  SSDT instalado Presentación de Melissa Data Dicho componente incluye varias Tareas de SSIS entre las cuales se tienen las siguientes: MatchUp es la tarea que se utilizará en este ejemplo. Se usa para eliminar datos duplicados. El componente Contact Verify valida la información de contacto verificando que la dirección sea válid, que sea coherente la ciudad y estado, valida el correo electrónico, si existen palabras raras o sospechosas y mucho más. El Fuzzy Match compara datos de acuerdo a diferentes algoritmos de comparación  como ser el algoritmo de Jaro, N-Gram, MDKeyboard y muchos más. El Generalized Cleanser