David
Rowan en Edge.org
«En un mundo de datos masivos, se necesita una curva exponencialmente creciente
de estadísticas para ver con claridad lo subyugados que estamos a los
poderes del procesador de datos. Cada día, según IBM, generamos colectivamente
2,5 quintillones de bytes un tsunami de datos estructurados y no
estructurados que crece, según los cálculos de IDC, un 60% al año. Walmart
arrastra cada hora un millón de transacciones al por menor en una base de
datos que hace mucho que sobrepasó los 2,5 petabytes; Facebook procesa 2,5
billones de piezas de contenido y 500 terabytes de datos al día; y Google,
cuya división de YouTube obtiene ella sola 72 horas de vídeos nuevos cada
minuto, acumula 24 petabytes de datos en un solo día. No es de extrañar
que la estrella del rock de Silicon Valley ya no sea el genial ingeniero
de software, sino el científico de datos, orientado a la analítica,
cada vez más venerado.
Es cierto que hay enormes beneficios públicos en el
procesamiento inteligente de estos zetta y yottabytes de los ya ilimitados
ceros y unos. La genómica de bajo costo permite a los oncólogos
localizar tumores con más precisión todavía usando la magia algorítimca de
la medicina personalizada; los análisis bayesianos en tiempo
real permiten a las fuerzas de la contrainteligencia identificar a
los malos, o al menos intentarlo, en los nuevos enfoques de minería
de datos para luchar contra el terrorismo. Y no nos olvidemos de
las ventajas comerciales para las empresas que convierten números
brutos en información procesable: según Economist Intelligence Unit, las empresas
que emplean análisis de datos efectivos suelen superar a sus semejantes en
los mercados bursátiles por un factor del 250%.
Aunque nuestras vidas son incesablemente recogidas en el mundo basado en
datos, dichos beneficios le son negados a una clase inferior de datos que
está surgiendo con rapidez. Cualquier ciudadano que carezca del mínimo
conocimiento de las nuevas herramientas algorítimicas, o del mínimo acceso
a ellas, estará cada vez en mayor desventaja en grandes áreas de la
participación económica, política y social. Será más difícil que los datos
marginados establezcan una solvencia personal o una influencia política;
serán discriminados por los mercados de valores y las redes sociales.
Tenemos que empezar a considerar la alfabetización sobre datos un
requisito, una competencia fundamental en una democracia del siglo XXI, y
para hacer campaña, y puede que incluso para legislar, para proteger los
intereses de aquellos que se han quedado atrás.
Los datos marginados
son perjudicados de dos maneras principales. La primera, se enfrentan a
las desventajas sistémicas en los mercados que están nominalmente abiertos
a todos. Los mercados de valores, por ejemplo. Cualquier operador humano
de hoy es lo suficientemente audaz como para competir con los algoritmos
de alta frecuencia, y los operadores de baja latencia deberían ser
conscientes de hasta qué punto las probabilidades están en su contra. Como
descubrió recientemente Andrei Kirilenko, economista jefe de la CFTC,
junto a un grupo de investigadores de Princeton y la Universidad de
Washington, los operadores de alta frecuencia más agresivos tienden a
lograr los beneficios mayores lo que sugiere que lo más conveniente para
el pequeño inversor es simplemente dejárselo a las máquinas?. No es
una coincidencia que el poder en una franja de otros sectores lo
estén acumulando quienes controlan los algoritmos, sean los
"microtargeters" de la campaña de Obama, o los estrategas de
mejora del rendimiento, o la agricultura de precisión impulsada con datos.
La segunda, el poder
absoluto se está acumulando en un pequeño grupo de supermineros de datos
cuya influencia solo tiene parangón con la ausencia de su rendición de
cuentas. Tu identidad es cada vez más lo que dicen los que es: agencias de
crédito, empleadores, fechas posibles, incluso la Agencia Nacional de
Seguridad estadounidense tiene una visión fijada sobre ti basada en tu
flujo de datos online, canalizados a través de los motores de búsquedas,
las redes sociales y los sitios que puntúan la "influencia", no
importa lo imprecisos o desfasados que sean los resultados. Y buena suerte
si intentas corregir los errores o las falsas impresiones que están
perjudicando tus posibilidades: como los usuarios marginados de servicios
como Instagram o Facebook van entendiendo cada vez más, depende de
ellos, no de ti, cómo se usarán tus datos personales. El cliente puede ser
de hecho el producto, pero sin duda debería existir el deber por parte
de dichos servicios de informar claramente al cliente respecto a la no posesión
de su producción digital.
Los datos, como
sabemos, son el poder y a medida que nuestra métrica personal se vuelve
cada vez más fácilmente acumulable y almacenable, ese poder necesita un
fuerte reequilibrio hacia nosotros como individuos y como ciudadanos.
Hemos obstaculizado el progreso médico dejando que las empresas
farmacéuticas controlaran de forma selectiva y a veces confusa la
liberación de los datos de los ensayos clínicos. En esta era emergente de
yottabytes, aseguremos la soberanía de las personas sobre las bases de datos
haciendo responsables a quienes tienen las claves de la máquina.»
No hay comentarios:
Publicar un comentario