Los datos lo son todo.
Ricardo Jiménez-Peris es CEO y fundador de LeanXcale, empresa que desarrolla una base de datos óptima para la aceleración de data pipelines en bancos, aseguradoras y empresas financieras.
Conversamos con este ingeniero y doctor en ciencias informáticas sobre su empresa y sobre el sector de alta especialización e innovación en el que se mueve.
Eres coautor del libro «Database Replication», ¿nos puedes contar qué es la replicación de base de datos y cuáles son sus beneficios?
La replicación es la técnica para conseguir tolerar fallos y proporcionar alta disponibilidad. La idea es que se mantienen los mismos datos en dos o más servidores de forma sincronizada, y si un servidor sufre una caída, el resto sigue dando servicio.
La replicación también se emplea para escalar la carga de lectura. Si la carga de trabajo fuera 100% escritura, un clúster de servidores no escalaría, todos harían el trabajo que haría un único servidor sin replicar. Pero si hay lecturas en esa carga de trabajo, entonces esas lecturas se hacen en un único servidor, con lo que se puede escalar.
Desafortunadamente, con la replicación sólo se puede escalar logarítmicamente. Es la técnica que emplean las bases de datos de código abierto, y en la que yo fui uno de los pioneros. Este libro básicamente da la formación sobre estas técnicas.
LeanXcale e INFORMA tienen un acuerdo estratégico por vuestra tecnología. ¿Nos podrías de hablar de esta experiencia, de vuestro aporte tecnológico y de su relevancia para las empresas data-driven?
INFORMA, para tener actualizada su base de datos de marketing, necesita procesar más de 1.700 millones de registros. Con esta base de datos es con la que proporciona información a sus clientes. Este procesamiento, utilizando la base de datos líder del mercado, tardaba unas 27 horas. Con LeanXcale, el mismo proceso se ejecuta 72 veces más rápido.
El resultado ha sido tan satisfactorio que INFORMA ha solicitado un acuerdo de licencias ilimitadas de LeanXcale, con la idea de utilizar LeanXcale en muchos de sus otros procesos de datos.
Lo cierto es que, por sus características, LeanXcale es especialmente diferencial en escenarios como el que plantea INFORMA, de aceleración de data pipelines, donde periódicamente hay que procesar grandes volúmenes de datos rápidamente. Esto es habitual en empresas data-driven, que utilizan grandes cantidades de información para tomar sus decisiones.
En estas situaciones, LeanXcale aporta varias ventajas respecto al resto de soluciones que existen: inserta registros a una gran velocidad, escala tanto como sea necesario y lo hace de forma lineal (el resto sube los costes exponencialmente), y los tiempos de consultas son muy rápidos.
Además, lo hace con un coste inferior a cualquier otra solución del mercado por el precio de sus licencias, el ahorro en hardware derivado de su mayor eficiencia, y la necesidad de menos mano de obra por la sencillez de su arquitectura.
¿Cómo se optimiza el motor de bases de datos? ¿Cuáles son los elementos clave?
Para conseguir optimizar el motor, lo primero necesario ha sido mucha investigación unida a un gran esfuerzo. Nos hemos enfocado en mejorar principalmente la velocidad de ingesta y la escalabilidad de nuestra base de datos, y eso ha requerido trabajar muy duro en el desarrollo del motor.
Básicamente, a un ritmo semanal, se inventaba una variante de un algoritmo, se implementaba y evaluaba, se caracterizaban los problemas y vuelta a empezar, así durante años.
Como resultado, tenemos un motor único, totalmente optimizado para nuestras necesidades, y que ofrece algunas características que no se pueden encontrar en ninguna otra parte, como las agregaciones online o el particionamiento bidimensional, gracias a la innovación continua.
Años atrás, hablar de gestión de bases de datos era hablar de SQL. Pero hoy en día se han superado las limitaciones tecnológicas, por ejemplo, en escalabilidad o en la ingesta de datos. ¿Cómo ha sido esta evolución?
Tradicionalmente, el mundo de las bases de datos se dividía entre las SQL, también llamadas relacionales, y las NoSQL, entre ellas las bases de datos clave-valor. Las primeras ofrecen rapidez y facilidad de consulta, pero son ineficientes en ingesta de datos y escalan modestamente con un aumento exponencial del coste al escalar. Las segundas, por su parte, tiene el punto débil en las consultas, que tienen muy poca funcionalidad y llevan mucho esfuerzo desarrollar, pero proporcionan ingestión rápida y escalan bien.
En LeanXcale hemos querido acabar con esta dualidad, y ofrecer una base de datos que reúna lo mejor de los dos mundos. Y así hemos conseguido crear una base de datos relacional con todas las ventajas de las bases de datos clave-valor al mismo tiempo. Esto solo ha sido posible a través de muchos años de investigación y un desarrollo que muy pocas empresas en el mundo han podido acometer, pero el resultado no ha podido ser mejor. Ofrecemos tiempos mejores que la competencia, tanto en ingestión, como en consultas, y todo con una arquitectura sencilla y escalable.
Si nos centramos en el sector financiero, ¿qué impacto tiene el procesamiento de datos actualmente y cuál es vuestro aporte al sector?
Hoy en día, creo que uno de los activos más valiosos de una compañía financiera son sus datos. Las empresas del sector manejan cantidades ingentes de datos, que utilizan para hacer predicciones y tomar decisiones. Cuantos más datos utilices, más precisión tendrás. Cuanto más rápido y más frecuentemente proceses esos datos, más valor podrás aportar al negocio.
En estos momentos, el gran problema con el que se encuentran las compañías no es tanto conseguir esos datos, sino tener la capacidad técnica de procesarlos con la agilidad que requiere el negocio. Si tienes un proceso semanal y tu proceso tarda más de 24 horas, y el proceso falla el sábado, ya no da tiempo a acabar el proceso durante el fin de semana, que es la ventana temporal donde se tendría que completar. Esto genera una pérdida de eficiencia y de predictibilidad, y en un entorno tan competitivo no te puedes permitir eso.
Lo que hemos demostrado ya en varios clientes, es que LeanXcale acelera enormemente el procesamiento de datos en data pipelines de finanzas y seguros, entre uno y dos órdenes de magnitud, y al reducir los tiempos los procesos se hacen predecibles y se posibilita aprovechar toda la información disponible, además de abaratarse el coste respecto a otras soluciones. El aumento de velocidad es tal, que permite que procesos semanales pasen a ser diarios, o incluso se puedan realizar en tiempo real.
Es, por ejemplo, lo que sucedía en CESCE, otro de nuestros clientes. Esta empresa, una de las líderes mundiales en crédito y caución, no podía utilizar toda la información de sus clientes que había reunido, ya que el tiempo de procesamiento era demasiado alto. Nosotros hemos reducido su tiempo de procesamiento del cálculo de riesgos en más de 250 veces.
A largo plazo, ¿cuáles serán los principales retos a los que deberá enfrentarse LeanXcale y el sector?
El sector de las bases de datos está cambiando mucho en los últimos años. Han aparecido multitud de fabricantes dispuestos a desafiar el tradicional dominio de las grandes empresas del sector, y nos dirigimos a un mercado mucho más fragmentado, lo que probablemente se traduzca en una mayor especialización. Así como ahora encontramos soluciones más genéricas que aplican a un gran número de casos de uso, dentro de poco veremos soluciones mucho más específicas con un mercado objetivo más reducido.
Por eso, será fundamental elegir un nicho en el que la base de datos es diferencial, y ser líder en ese segmento. Y LeanXcale claramente destaca respecto a la competencia como base de datos de data pipelines analíticos en los sectores de finanzas y seguros, y es donde nos estamos posicionando con fuerza.
Por último, vuestra empresa ha sido reconocida por su alto grado de innovación, ganando el Innovation Radar Prize otorgado por la Comisión Europea, entre otros galardones. ¿Cuál es la clave para estar en la cresta de la ola en materia de innovación?
LeanXcale es una empresa que nació para llevar al mercado los resultados de más de 20 años de investigación. Su tecnología incluye dos patentes concedidas en Europa y Estados Unidos, y otras 10 invenciones que están siendo patentadas. La Comisión Europea eligió a LeanXcale para este galardón porque es el estereotipo de lo que le gustaría que ocurriera en toda Europa: que los mejores investigadores dediquen su investigación a resolver problemas que tienen aplicación en el mercado y creen startups para convertir a Europa en el líder tecnológico. Europa tiene el cerebro para ello, pero hasta ahora carecía de una cultura de emprendimiento y de suficientes fondos de capital riesgo deeptech que apoyaran la creación de estas start ups.
En este sector debes estar en constante evolución. Si hoy eres bueno en algo, tienes que trabajar en que sea mejor mañana, y cuando sea mejor, en hacerlo aún mejor. Nunca puedes dar por concluido el desarrollo del producto y debes innovar de forma continua. Y nos encanta el reto que supone estar a la vanguardia tecnológica del sector. Estamos decididos a demostrar que en España se puede innovar igual o mejor que en Silicon Valley. Pero creo que al final, como en otros aspectos de la vida, la clave por la que preguntas es simplemente la pasión por la tecnología innovadora y el trabajo arduo y constante para llevar esas innovaciones a nuestros clientes a través de nuestro producto.