Farmacias Peruanas es el retailer especializado en farmacias y boticas más grande del Perú. La compañía maneja las dos marcas top of mind de la industria: Inkafarma y Mifarma. Parte del grupo Intercorp, la compañía cuenta con más de 20,000 colaboradores que trabajan en más de 2,000 puntos de venta en costa, sierra y selva peruana.

 

Dos marcas en dos ambientes distintos 

Los más de 2,000 puntos de venta que congregan las marcas Inkafarma y Mifarma diariamente generan información relevante sobre ventas y, en general, patrones de consumo de sus clientes. Así, levantan a diario información por regiones en distintas bases de datos que finalmente se concentraban en dos servidores diferentes. El problema para el cliente consistía en que, si bien es cierto se recogía la data con mediana tranquilidad, resultaba difícil de analizar en tanto dichos grandes volúmenes apenas conseguían concentrarse (con horas de desfase) y tomaba más de un día el generar insights a partir de su información. 

El hecho de que la data generada por ambas cadenas se albergue en dos servidores diferentes se explica por el hecho de que Mifarma había sido recientemente adquirida por Intercorp, holding empresarial peruano que posee la propiedad de Inkafarma. En consecuencia, la integración de la data tanto de Inkafarma como de Mifarma se presentó como todo un reto. En ese sentido, Rolando Castro, Director de TI de Farmacias Peruanas, refiere: “Hay un visión de InRetail de migrar nuestra información a la nube. En el caso de Farmacias Peruanas la complejidad era mayor pues no se trataba de solo un sistema, sino de dos sistemas diferentes en proceso de integración. No podíamos convivir con dos sistemas de información distintos. Existía el problema de la lentitud en las cargas, lo que estaba dificultando nuestro objetivo de democratizar la data.

Las fuentes de datos para ambas marcas, Inkafarma y Mifarma, eran las ventas de las farmacias ubicadas a nivel nacional. En el caso de Mifarma, la data se concentraba en una base de datos Oracle albergada in-house en las oficinas de la empresa; Inkafarma lo hacía también en una base de datos Oracle ubicada en un data center de IBM. En ese sentido, la necesidad de Farmacias Peruanas era analizar dicha data lo más pronto posible antes del ‘siguiente día’ para poder, a partir del análisis de las ventas, tomar decisiones de gestión el ‘día previo’.

Antes de que el cliente llegue a Xertica, el proceso en mención era lento y la información demoraba alrededor de nueve horas en procesar. Con la integración de las operaciones de ambas marcas, el riesgo de que el tratamiento de datos se vuelva aún más lento crecía.

 

Iniciando la migración

La información que se extrajo de ambos servidores era esencialmente de ventas. La migración incluyó entre las dos marcas alrededor de 200 tablas, algunas maestras y otras transaccionales de la venta del día. Se subió información desde el año 2015, con el fin de contar con un sólido historial. 

Los insights que se sacaban de dichos servidores totalizaban la venta diaria, generaban comparaciones año a año, entre otros. Toda esa lógica estaba en código PL/SQL de Oracle. Para poder aprovechar las facilidades de la nube, Xertica utilizó BigQuery de Google Cloud Platform (GCP). En consecuencia, se tradujo el código PL/SQL a SQL de BigQuery.

La extracción se hace directamente de las fuentes de datos a través de una conexión VPN (Virtual Private Network). Una vez terminado el proceso de extraer la información diaria, se da lugar al proceso ELT (Extract, Load and Transform), con el uso de la herramienta Matillion en la extracción y cargado de datos. Una vez que los datos son cargados por completo, se inicia el proceso de transformación y se llega a las tablas finales que Farmacias Peruanas requiere para la obtención de insights, que sirven para generar las estrategias de impacto en el consumidor. 

 

Menor tiempo de procesamiento, más insights

Cuando finalizó la implementación, el resultado final fue que todos estos procesos de ambas marcas, que adicional a los cálculos de ventas, sumó también nueva data sobre stocks y ventas generadas a través del canal online, se ejecutaban en un máximo de 2 horas y 30 minutos, el proceso empezó a correr todos los días a partir de las 3 am y terminaba a las 5:30 am, con lo cual al amanecer ya tienen los insights del día anterior en time-to-market.

El componente diferencial del proyecto liderado por Xertica fue el uso de la herramienta BigQuery de GCP para el análisis de grandes volúmenes de información, este fue el principal componente que hizo la diferencia entre lo que se tenía anteriormente (ambientes DW tradicionales on premise) versus lo que BigQuery puede ofrecer a nivel de tiempo de respuesta y volúmenes de información procesada. En la actualidad, todos estos volúmenes de millones de registros, son procesados en cortos períodos de tiempo. 

BigQuery es un producto serverless, altamente escalable y económicamente rentable que nos permite tener un Data Warehouse con funcionalidades de ML y un motor BI integrado. Es uno de los productos estrella de Google Cloud Platform, que tiene cada vez más y más adeptos por todo el mundo.

Finalmente, conformar un equipo de trabajo comprometido y abocado al proyecto fue fundamental. Al respecto, Lisbeth Atachagua, Líder de Data de Farmacias Peruanas, enfatiza: “Por el lado de Xertica fueron muy accesibles en asignar recursos humanos a total disposición de Farmacias Peruanas para resolver in situ los pain points que retrasaron inicialmente el cronograma de trabajo. A partir de ese momento, el plan empezó a correr conforme a lo estipulado y con los resultados esperados por el negocio”.