Data-Driven Wannabe

Todo lo que tenga que ver con “Data” está de moda en cualquier post, webinar, ebook o evento de marketing que se precie. Siempre se habla sobre el valor de los datos y del valioso recurso que suponen para marcas, agencias, plataformas tecnológicas, editores, organizaciones, etc. No obstante, para muchos profesionales y empresas conseguir retornos en sus inversiones en estrategias de marketing basadas en datos (data-driven) está siendo como cazar unicornios. El motivo principal de ese problema es que los datos únicamente son útiles si son de calidad.

Que levante la mano quién no se sienta decepcionado y frustrado cada vez que recibe una campaña que realmente no le aporta valor. Pues con total seguridad sea un problema de “basura” (podrían ser por otros problemas, pero cuento con que vuestras estrategias de orquestación y activación de marketing son excelentes).

Y es que, en muchas ocasiones, nos obsesionamos con construir una estrategia de marketing brillante orquestada con el mejor stack tecnológico del mercado (y sabemos que eso no es barato), pero después lo alimentamos con datos de muy poca calidad, o lo que en este post denominamos como basura.

El garbage in, garbage out arruina más estrategias de marketing que las tácticas mal implementadas o los productos y servicios sin valor alguno. Es tan así, que IBM estima que los datos de mala calidad -erróneos- cuestan a la economía de Estados Unidos 3,1 billones de dólares cada año.

Por lo que, es hora de cambiar ese método por uno más beneficioso y que, permitidme el atrevimiento, he bautizado como: garbage in, canela en rama out.

Manos a la obra.

Con este post os quiero dejar algunas pautas y consejos para coger el toro por los cuernos, porque ya os aviso que esperar sentados a que os lluevan datos de calidad, no es una opción.

Comencemos por lo básico. ¿Qué significa que los datos sean de calidad?

Pues bien, como no quiero haceros perder el tiempo, os diré que significa que no sean de calidad. Si tus datos no están limpios, son incorrectos y están desactualizados, tus mensajes no llegarán de forma óptima y con valor a los destinatarios a los que se dirigen. Y, en consecuencia, gastarás más dinero y obtendrás tasas de engagement más bajas, reduciendo drásticamente el retorno de la inversión. Como veis, un mal negocio.

Pero esperad, todavía habrá alguien que pensará que su caso es especial y que todos los datos que recoge son de calidad. Si ese eres tú, siento mucho decirte que estás equivocado. No se debe subestimar nunca la capacidad del garbage in de colarse en nuestras bases de datos de distintas formas:

  • Datos que faltan: campos de formularios que se dejan vacíos, intencionadamente o no. Te digo todo y no te digo nada.
  • Datos desactualizados: información que era correcta cuando se ingresó, pero que desde entonces ha cambiado. ¿Todavía tienes mi número de fax?
  • Datos mal etiquetados: datos introducidos en campos incorrectos y que, por tanto, se asignan a elementos erróneos.
  • Datos sin confirmar: datos que no han pasado ningún proceso de normalización, estandarización y verificación. Te digo que soy Messi y aquí paz y después gloria.
  • Datos duplicados: Registros y fichas de clientes duplicadas que corresponden a la misma persona. Es difícil tener todos los fragmentos de la identidad de una persona para conformar una visión única en un entorno omnicanal.
  • Errores: Faltas de ortografía, errores tipográficos y variaciones en nombres o formatos. No todo el mundo tiene la prosa de Arturo Pérez-Reverte.
  • Datos falsos: desde nombres falsos hasta cosas sin sentido con el fin de completar un campo obligatorio. Quién no haya puesto en un campo de email [email protected] que tire la primera piedra.

Si tratas de ejecutar estrategias de marketing con datos de baja calidad, nunca tendrás la capacidad de proporcionar experiencias relevantes y personales a tus clientes, no podrás conocer el método de contacto preferido de un lead potencial, no estarás seguro de que el mensaje está llegando a una audiencia que quiere o necesita recibirlo, etc. Comprender la diferencia entre clean data (canela en rama) y dirty data (garbage) y los efectos que pueden tener en los resultados es solo el primer paso. Ahora necesitamos saber qué debes tener en cuenta para orquestar una estrategia de marketing data-driven con datos de calidad.

Las directrices de la NCIA

Independientemente del tipo de datos que tengas o quieras gestionar, existe un conjunto mínimo de prácticas que te ayudarán a determinar la calidad del dato y que debes cumplir siguiendo las directrices de la NCIA. Tranquilos no es una agencia gubernamental que os vaya a perseguir, sino que son las siglas de: (N)ormalizados, (C)ompletos, (I)dentificativos y (A)ctuales.

Normalizados

Significa asegurarse de que todos los conjuntos y tipos de datos (números de teléfono, direcciones postales, correos electrónicos, etc.) siguen el mismo formato.

En este punto, para ejemplificar, los números de teléfono sirven como un buen modelo. Es conocido por todos que los números de teléfono móvil en España contienen 9 dígitos. Si estuviéramos normalizando manualmente estos datos, nuestro primer paso sería verificar que cada uno tuviera el número adecuado de dígitos, pero también nos interesaría asegurarnos de que todos los números de móvil se presenten de la misma manera. Por ejemplo, si miras tu base de datos, seguro que encuentras números de teléfono presentados en los siguientes formatos:

Una buena práctica, para mejorar la normalización de los datos es realizar pequeñas y sencillas modificaciones en las fuentes de entrada de estos. Así pensemos, en un formulario que pregunta entre otros campos por el “cargo profesional”. Si lo dejamos como un campo libre nos encontraremos variaciones de este tipo:

Mientras que, si cambiamos ese campo libre por una lista de opciones, pasaríamos a recoger siempre el mismo. Algo que parece tan básico después tiene implicaciones enormes en, por ejemplo, la facilidad a lo hora de crear segmentos como podéis ver a continuación:

Completos

Una vez que los datos se hayan normalizado, es hora de analizarlos para saber si están completos. Manteniéndonos con el ejemplo del número de teléfono, una vez normalizado, se puede examinar fácilmente dicho número para ver si todos los elementos necesarios están presentes.

Sobre esto un consejo bueno, bonito y barato y donde no necesitas ser un maestro de nivel 70 usando magia arcana. Utiliza, siempre que puedas, estándares internacionales (ISO, RFC, etc.) para tus datos. De ese modo, siguiendo dos estándares, RFC 3696y 2822 para correos electrónicos y E.164 para teléfonos, podrás establecer medidas de normalización y completitud muy efectivas con sencillas expresiones regulares (RegExp) aplicadas en las fuentes de entrada o cuando estés trabajando en las plataformas de datos.

Paralelamente, se puede comprobar la validez dentro de criterios de calidad que pueden variar en función de tus objetivos. Así, por ejemplo, se puede verificar un código postal para asegurarse de que tenga el número correcto de dígitos y que coincida con la ciudad o país que también figura en el registro.

Identificativos

La tercera directriz tiene que ver con qué los datos de personas tienen que permitir identificar de forma clara. Aquí pensar en cuántos registros duplicados puedes encontrar en un CRM, plataforma de Marketing Automation, ERPs, etc.

En muchas ocasiones, esto es debido a que estas plataformas incorporan funcionalidades muy limitadas de resolución de identidad (muchas veces basadas sólo en coincidencias de email o números de teléfono) que no detectan a tiempo patrones para detectar duplicados, ni tampoco tienen las herramientas y, muchas veces, la potencia necesaria para ejecutar las fusiones necesarias que ayuden a construir la vista única o lo que se conoce como Golden Record. De ese modo, si Pepe Zubizarreta utiliza dos direcciones de email diferentes, se crearán dos registros, a pesar de que gran parte del resto de información es casi la misma.

Es precisamente en este punto, donde conocer y saber identificar a tus clientes cobra más sentido que nunca. Si como marca puedes identificar a tu consumidor en los distintos momentos y canales, tendrás capacidad de analizar, personalizar y entregar mensajes de manera más efectiva en el momento y lugar adecuado. Además, si puedes identificarlo, podrás comprender mejor quién es, qué compró, su historial de relación con la marca… y, por ende, determinar si las próximas interacciones que pensabas orquestar son relevantes y adecuadas en su contexto.

Sin lugar a duda, si sigues estos pasos, los datos tendrán mayor calidad porque estarán normalizados, completos y corresponderán a personas identificables. Pero todavía falta un elemento crucial para poder contestar a preguntas como las que siguen: ¿Juan Pedrosa todavía vive en Granada? ¿Laura Muñoz usa todavía la dirección de correo electrónico [email protected]? ¿El teléfono de Alejandro Pérez sigue siendo el mismo?

Actualizados

Una vez que se haya asegurado la validez de los datos, el siguiente paso es preocuparse porque estén actualizados. Si no se hace, tendrás problemas que van desde la imposibilidad de contactar con los clientes hasta entregar experiencias que quizá aportaban valor a una persona en los 90 pero no hoy.

La capacidad de tener datos de calidad para conocer a los clientes de forma precisa requiere la integración de todas las fuentes de datos y una compresión omnicanal avanzada para mantenerse al día y aportar valor en cada interacción. Porque, por ejemplo: ¿El cliente que ahora te compra online es el mismo que solía comprarte en la tienda?

Conclusión

El momento del marketing data-driven ha llegado para quedarse. Las interacciones online y offline de las marcas con sus potenciales interesados (clientes o leads) ofrecen la posibilidad de conocer mucho sobre las personas. Son los datos los que impulsan ese conocimiento para obtener análisis más significativos y acciones más segmentadas e inteligentes. Cuando obtenemos datos precisos y de alta calidad, podemos tomar mejores decisiones y establecer estrategias de marketing exitosas. Cuando sabemos cómo aportar valor en el momento y lugar adecuado a nuestros clientes o leads, podemos orquestar nuestras campañas de forma personalizada y avanzar entregando siempre mensajes o interacciones que aporten valor real.

Caminante, son tus huellas el camino, y nada más; caminante, no hay camino: se hace camino al andar. Y es que, lo que habéis podido leer en este post son sólo las primeras indicaciones para que podáis recorrer vuestro propio camino y conseguir el deseado garbage in, canela en rama out 😉

Todo lo que tenga que ver con “Data” está de moda en cualquier post, webinar, ebook o evento de marketing que se precie. Siempre se habla sobre el valor de los datos y del valioso recurso que suponen para marcas, agencias, plataformas tecnológicas, editores, organizaciones, etc. No obstante, para muchos profesionales y empresas conseguir retornos en sus inversiones en estrategias de marketing basadas en datos (data-driven) está siendo como cazar unicornios. El motivo principal de ese problema es que los datos únicamente son útiles si son de calidad.

Que levante la mano quién no se sienta decepcionado y frustrado cada vez que recibe una campaña que realmente no le aporta valor. Pues con total seguridad sea un problema de “basura” (podrían ser por otros problemas, pero cuento con que vuestras estrategias de orquestación y activación de marketing son excelentes).

Y es que, en muchas ocasiones, nos obsesionamos con construir una estrategia de marketing brillante orquestada con el mejor stack tecnológico del mercado (y sabemos que eso no es barato), pero después lo alimentamos con datos de muy poca calidad, o lo que en este post denominamos como basura.

El garbage in, garbage out arruina más estrategias de marketing que las tácticas mal implementadas o los productos y servicios sin valor alguno. Es tan así, que IBM estima que los datos de mala calidad -erróneos- cuestan a la economía de Estados Unidos 3,1 billones de dólares cada año.

Por lo que, es hora de cambiar ese método por uno más beneficioso y que, permitidme el atrevimiento, he bautizado como: garbage in, canela en rama out.

Manos a la obra.

Con este post os quiero dejar algunas pautas y consejos para coger el toro por los cuernos, porque ya os aviso que esperar sentados a que os lluevan datos de calidad, no es una opción.

Comencemos por lo básico. ¿Qué significa que los datos sean de calidad?

Pues bien, como no quiero haceros perder el tiempo, os diré que significa que no sean de calidad. Si tus datos no están limpios, son incorrectos y están desactualizados, tus mensajes no llegarán de forma óptima y con valor a los destinatarios a los que se dirigen. Y, en consecuencia, gastarás más dinero y obtendrás tasas de engagement más bajas, reduciendo drásticamente el retorno de la inversión. Como veis, un mal negocio.

Pero esperad, todavía habrá alguien que pensará que su caso es especial y que todos los datos que recoge son de calidad. Si ese eres tú, siento mucho decirte que estás equivocado. No se debe subestimar nunca la capacidad del garbage in de colarse en nuestras bases de datos de distintas formas:

  • Datos que faltan: campos de formularios que se dejan vacíos, intencionadamente o no. Te digo todo y no te digo nada.
  • Datos desactualizados: información que era correcta cuando se ingresó, pero que desde entonces ha cambiado. ¿Todavía tienes mi número de fax?
  • Datos mal etiquetados: datos introducidos en campos incorrectos y que, por tanto, se asignan a elementos erróneos.
  • Datos sin confirmar: datos que no han pasado ningún proceso de normalización, estandarización y verificación. Te digo que soy Messi y aquí paz y después gloria.
  • Datos duplicados: Registros y fichas de clientes duplicadas que corresponden a la misma persona. Es difícil tener todos los fragmentos de la identidad de una persona para conformar una visión única en un entorno omnicanal.
  • Errores: Faltas de ortografía, errores tipográficos y variaciones en nombres o formatos. No todo el mundo tiene la prosa de Arturo Pérez-Reverte.
  • Datos falsos: desde nombres falsos hasta cosas sin sentido con el fin de completar un campo obligatorio. Quién no haya puesto en un campo de email [email protected] que tire la primera piedra.

Si tratas de ejecutar estrategias de marketing con datos de baja calidad, nunca tendrás la capacidad de proporcionar experiencias relevantes y personales a tus clientes, no podrás conocer el método de contacto preferido de un lead potencial, no estarás seguro de que el mensaje está llegando a una audiencia que quiere o necesita recibirlo, etc. Comprender la diferencia entre clean data (canela en rama) y dirty data (garbage) y los efectos que pueden tener en los resultados es solo el primer paso. Ahora necesitamos saber qué debes tener en cuenta para orquestar una estrategia de marketing data-driven con datos de calidad.

Las directrices de la NCIA

Independientemente del tipo de datos que tengas o quieras gestionar, existe un conjunto mínimo de prácticas que te ayudarán a determinar la calidad del dato y que debes cumplir siguiendo las directrices de la NCIA. Tranquilos no es una agencia gubernamental que os vaya a perseguir, sino que son las siglas de: (N)ormalizados, (C)ompletos, (I)dentificativos y (A)ctuales.

Normalizados

Significa asegurarse de que todos los conjuntos y tipos de datos (números de teléfono, direcciones postales, correos electrónicos, etc.) siguen el mismo formato.

En este punto, para ejemplificar, los números de teléfono sirven como un buen modelo. Es conocido por todos que los números de teléfono móvil en España contienen 9 dígitos. Si estuviéramos normalizando manualmente estos datos, nuestro primer paso sería verificar que cada uno tuviera el número adecuado de dígitos, pero también nos interesaría asegurarnos de que todos los números de móvil se presenten de la misma manera. Por ejemplo, si miras tu base de datos, seguro que encuentras números de teléfono presentados en los siguientes formatos:

Una buena práctica, para mejorar la normalización de los datos es realizar pequeñas y sencillas modificaciones en las fuentes de entrada de estos. Así pensemos, en un formulario que pregunta entre otros campos por el “cargo profesional”. Si lo dejamos como un campo libre nos encontraremos variaciones de este tipo:

Mientras que, si cambiamos ese campo libre por una lista de opciones, pasaríamos a recoger siempre el mismo. Algo que parece tan básico después tiene implicaciones enormes en, por ejemplo, la facilidad a lo hora de crear segmentos como podéis ver a continuación:

Completos

Una vez que los datos se hayan normalizado, es hora de analizarlos para saber si están completos. Manteniéndonos con el ejemplo del número de teléfono, una vez normalizado, se puede examinar fácilmente dicho número para ver si todos los elementos necesarios están presentes.

Sobre esto un consejo bueno, bonito y barato y donde no necesitas ser un maestro de nivel 70 usando magia arcana. Utiliza, siempre que puedas, estándares internacionales (ISO, RFC, etc.) para tus datos. De ese modo, siguiendo dos estándares, RFC 3696y 2822 para correos electrónicos y E.164 para teléfonos, podrás establecer medidas de normalización y completitud muy efectivas con sencillas expresiones regulares (RegExp) aplicadas en las fuentes de entrada o cuando estés trabajando en las plataformas de datos.

Paralelamente, se puede comprobar la validez dentro de criterios de calidad que pueden variar en función de tus objetivos. Así, por ejemplo, se puede verificar un código postal para asegurarse de que tenga el número correcto de dígitos y que coincida con la ciudad o país que también figura en el registro.

Identificativos

La tercera directriz tiene que ver con qué los datos de personas tienen que permitir identificar de forma clara. Aquí pensar en cuántos registros duplicados puedes encontrar en un CRM, plataforma de Marketing Automation, ERPs, etc.

En muchas ocasiones, esto es debido a que estas plataformas incorporan funcionalidades muy limitadas de resolución de identidad (muchas veces basadas sólo en coincidencias de email o números de teléfono) que no detectan a tiempo patrones para detectar duplicados, ni tampoco tienen las herramientas y, muchas veces, la potencia necesaria para ejecutar las fusiones necesarias que ayuden a construir la vista única o lo que se conoce como Golden Record. De ese modo, si Pepe Zubizarreta utiliza dos direcciones de email diferentes, se crearán dos registros, a pesar de que gran parte del resto de información es casi la misma.

Es precisamente en este punto, donde conocer y saber identificar a tus clientes cobra más sentido que nunca. Si como marca puedes identificar a tu consumidor en los distintos momentos y canales, tendrás capacidad de analizar, personalizar y entregar mensajes de manera más efectiva en el momento y lugar adecuado. Además, si puedes identificarlo, podrás comprender mejor quién es, qué compró, su historial de relación con la marca… y, por ende, determinar si las próximas interacciones que pensabas orquestar son relevantes y adecuadas en su contexto.

Sin lugar a duda, si sigues estos pasos, los datos tendrán mayor calidad porque estarán normalizados, completos y corresponderán a personas identificables. Pero todavía falta un elemento crucial para poder contestar a preguntas como las que siguen: ¿Juan Pedrosa todavía vive en Granada? ¿Laura Muñoz usa todavía la dirección de correo electrónico [email protected]? ¿El teléfono de Alejandro Pérez sigue siendo el mismo?

Actualizados

Una vez que se haya asegurado la validez de los datos, el siguiente paso es preocuparse porque estén actualizados. Si no se hace, tendrás problemas que van desde la imposibilidad de contactar con los clientes hasta entregar experiencias que quizá aportaban valor a una persona en los 90 pero no hoy.

La capacidad de tener datos de calidad para conocer a los clientes de forma precisa requiere la integración de todas las fuentes de datos y una compresión omnicanal avanzada para mantenerse al día y aportar valor en cada interacción. Porque, por ejemplo: ¿El cliente que ahora te compra online es el mismo que solía comprarte en la tienda?

Conclusión

El momento del marketing data-driven ha llegado para quedarse. Las interacciones online y offline de las marcas con sus potenciales interesados (clientes o leads) ofrecen la posibilidad de conocer mucho sobre las personas. Son los datos los que impulsan ese conocimiento para obtener análisis más significativos y acciones más segmentadas e inteligentes. Cuando obtenemos datos precisos y de alta calidad, podemos tomar mejores decisiones y establecer estrategias de marketing exitosas. Cuando sabemos cómo aportar valor en el momento y lugar adecuado a nuestros clientes o leads, podemos orquestar nuestras campañas de forma personalizada y avanzar entregando siempre mensajes o interacciones que aporten valor real.

Caminante, son tus huellas el camino, y nada más; caminante, no hay camino: se hace camino al andar. Y es que, lo que habéis podido leer en este post son sólo las primeras indicaciones para que podáis recorrer vuestro propio camino y conseguir el deseado garbage in, canela en rama out 😉