PAULA SOLANAS

El costat fosc de les dades vol veure la llum

Després del ‘big data’, arriba el ‘dark data’, la informació que les empreses recullen però que no fan servir per a res

El costat fosc de les dades vol veure la llum Zoom

El món s’està convertint a poc a poc en un abocador de dades. L’era digital ens ha fet capaços de generar més informació de la que podem comprendre i, en poc temps, hem passat de parlar de megabytes a endinsar-nos en l’univers dels zettabytes. Segons la majoria de previsions, l’univers digital de dades arribarà als 44 zettabytes el 2020 o, cosa que és el mateix, a un trilió de gigues. El que comença a preocupar algunes empreses és que el 80% d’aquesta informació els passa per davant sense que la puguin capturar, un percentatge que podria arribar al 93% en els pròxims quatre anys, segons un estudi del gegant tecnològic nord-americà IBM. Després del fenomen del big data, hi ha un nou anglicisme que apunta a una altra oportunitat de negoci que podria beneficiar companyies de tot el món: el dark data o les dades fosques.

Aquest concepte fa referència a tota la informació que les empreses i organitzacions generen i recullen però no fan servir per a res. Segons el professor del màster de Business Intelligence de la UOC i analista de la consultora G2 Jorge Fernández, la millor metàfora per entendre aquest nou fenomen és imaginar una canonada per on passa aigua contínuament sense caure enlloc. La dificultat d’accedir a aquestes dades o el simple fet de desconèixer la seva existència fan que les empreses perdin informació valuosa que els podria ajudar a optimitzar els seus processos. L’expert detalla que es tracta principalment de tres tipus de dades: en primer lloc, les que s’esborren en tan sols uns minuts; en segon, la informació que no es processa correctament, i, finalment, aquelles dades que existeixen, però que no s’analitzen. Com s’aconsegueix que aquestes dades surtin de la foscor?

Una de les primeres companyies a endinsar-se en aquesta matèria fosca de la informació és catalana. Datumize és el projecte de Nacho Lafuente, un enginyer entestat a fer que les dades ocultes acabin sortint a la llum. “He treballat molts anys en multinacionals del món digital com Oracle o Siemens i és increïble la quantitat d’informació malbaratada”, explica. La idea la va arrencar tot sol i des de casa seva. L’empresari va començar a treballar en un prototip amb un dels seus antics clients, el grup turístic balear Globalia. La companyia va plantejar-li un repte: esbrinar què buscaven els milions de clients que entraven a la seva pàgina web i marxaven sense reservar cap viatge.

Així doncs, va desenvolupar un primer prototip de programari per capturar aquestes dades i convertir-les en informació valuosa per a l’empresa. De fet, Lafuente assegura que es tracta d’un sistema semblant al que fan servir els serveis d’espionatge de les agències de seguretat nacional. “És com tenir un telèfon capaç d’escoltar totes les converses que passen per l’empresa i regenerar-les per saber si diuen alguna cosa interessant”, explica l’enginyer. La informació arriba per dues vies: d’una banda, a través de la xarxa de comunicacions interna de l’empresa i, de l’altra, dels ordinadors connectats. “L’empresa no ha de canviar res, nosaltres despleguem el programari i capturem les dades que poden ser útils”, explica Lafuente.

Aquell prototip inicial va agradar a Globalia, que es va adonar que sovint els seus clients buscaven destinacions o hotels que no tenien en la seva oferta, i que necessitaven incorporar. Un temps després, les vendes creixen un 3%. Va ser aleshores quan Lafuente va constituir Datumize el juliol del 2014 i, des de llavors, l’empresa ha tancat una ronda de finançament d’un milió d’euros, liderada per Inveready, un dels fons d’inversió més actius d’Espanya. Amb seu a Viladecans, l’empresa dóna feina a un equip de dotze persones i ha passat de gestionar quatre clients el primer any a una quinzena el 2016. L’any passat va facturar al voltant d’uns 80.000 euros i espera acabar el 2016 quintuplicant aquest xifra fins als 400.000 euros. A més, vol tancar una nova ampliació de capital abans de l’estiu vinent per incorporar un nou soci de capital risc i instal·lar-se en unes oficines més grans.

Les dues tècniques principals per recuperar aquesta informació són la mineria de processos i la captura de dades. En el primer cas, es tracta d’analitzar els sistemes d’informació de les empreses per descobrir quins processos s’hi amaguen -com treballar un mur “amb un pic i una pala”, puntualitza Fernández- mentre que el segon utilitza un programari una mica més intrusiu. En aquest cas, el tractament és més semblant a “punxar una trucada” i aconseguir capturar en una foto totes les dades que entren i surten de la companyia.

Es podria dir que el big data i el dark data formen part de la mateixa família, però responen a problemes diferents. Segons Fernández, el primer s’adreça a la gestió de grans volums d’informació i, en molts casos, fa servir grans centres d’emmagatzematge que impliquen un cost molt alt per a les empreses. Per contra, les dades fosques se centren en els processos operatius de les organitzacions i fan servir dades que l’empresa ja té sense ser-ne conscient. “El big data s’ha sobredimensionat i pretén que les empreses intentin construir naus espacials, sense tenir la tecnologia suficient i amb una despesa astronòmica”, explica l’acadèmic. Fernández defensa que aquesta manera de fer ha provocat que el dark data encara estigui a les beceroles, i se’n parli més teòricament que a la pràctica. De fet, aquest concepte no ha aparegut encara en cap radar dels que publica Gartner sobre noves tecnologies.

La novetat de les dades fosques, però, fa que encara hi hagi desacords entre els experts sobre com interpretar-les. Segons Fernández, el dark data no implica cap risc de seguretat a les empreses, més enllà del que implica qualsevol tipus d’informació penjada al núvol. Però la consultora Gartner -que va batejar el concepte- assegura que guardar dades “per si de cas” pot arribar a comportar més riscos que beneficis, i que les empreses haurien de tenir més cura amb els registres que deixen al núvol. Encara que el món empresarial sigui el protagonista del relat, aquest fenomen també afecta els usuaris. Com? Doncs precisament perquè en aquest mar fosc de bits en desús també hi ha informació personal que corre el risc de patir ciberatacs en qualsevol moment.

D’altra banda, el dark data es presenta com un aliat per a les institucions públiques. Concretament, és una via per rastrejar el frau i aconseguir guanyar en transparència. “Et permet seguir en tot moment el recorregut que fa la informació, cosa que pot ser molt útil, per exemple, en l’adjudicació de concursos o feines públiques”, explica Fernández. El mateix sistema es pot aplicar per lluitar contra l’espionatge industrial i el robatori de dades a grans corporacions, així com el frau bancari.

Datumize també tempteja una altra tecnologia que és a l’ordre del dia. Ha desenvolupat un nou producte que utilitza el famós internet de les coses per recollir dades sobre el comportament de les vendes al sector minorista. Es tracta d’un petit dispositiu anomenat Datumize Observer, que es col·loca a les botigues per capturar tot el que hi passa i obtenir informació de cada venda. El projecte pilot l’han fet amb una multinacional estrangera del sector de la papereria -de la qual prefereixen no dir el nom- que distribueix a una xarxa de 30.000 botigues minoristes. “No tenen cap manera de saber què passa quan els seus productes surten de la fàbrica, perquè són dades que s’escapen del seu control”, explica. Quan acabi el pilot, l’empresa té clients interessats a aplicar la tecnologia en el sector retail. “El fabricant no té cap manera de saber a quin ritme es ven el jersei verd a les botigues de barri”, raona. Per aplicar-ho, reconeix que Datumize ha de fer una tasca “d’evangelització” perquè les empreses encara no veuen el dark data com una prioritat.

Aquest any l’empresa ha estrenat una filial a Hong Kong, amb una persona centrada a expandir el negoci a l’Àsia, on ja té alguns clients. Tot i així, l’objectiu immediat és consolidar-se a Espanya, on assegura que no tenen competència, i obrir-se camí en el mercat europeu. De moment, han aconseguir despertar l’interès del món corporatiu, que ha entès que les dades són el petroli del segle XXI. Ara caldrà veure si l’amenaça de perdre el 80% d’aquest preuat botí empeny el negoci de les dades fosques més enllà del que ha aconseguit el big data.