miércoles, 27 de marzo de 2013

El nuevo analfabetismo

David Rowan en Edge.org
«En un mundo de datos masivos, se necesita una curva exponencialmente creciente de estadísticas para ver con claridad lo subyugados que estamos a los poderes del procesador de datos. Cada día, según IBM, generamos colectivamente 2,5 quintillones de bytes un tsunami de datos estructurados y no estructurados que crece, según los cálculos de IDC, un 60% al año. Walmart arrastra cada hora un millón de transacciones al por menor en una base de datos que hace mucho que sobrepasó los 2,5 petabytes; Facebook procesa 2,5 billones de piezas de contenido y 500 terabytes de datos al día; y Google, cuya división de YouTube obtiene ella sola 72 horas de vídeos nuevos cada minuto, acumula 24 petabytes de datos en un solo día. No es de extrañar que la estrella del rock de Silicon Valley ya no sea el genial ingeniero de software, sino el científico de datos, orientado a la analítica, cada vez más venerado.


Es cierto que hay enormes beneficios públicos en el procesamiento inteligente de estos zetta y yottabytes de los ya ilimitados ceros y unos. La genómica de bajo costo permite a los oncólogos localizar tumores con más precisión todavía usando la magia algorítimca de la medicina personalizada; los análisis bayesianos en tiempo real permiten a las fuerzas de la contrainteligencia identificar a los malos, o al menos intentarlo, en los nuevos enfoques de minería de datos para luchar contra el terrorismo. Y no nos olvidemos de las ventajas comerciales para las empresas que convierten números brutos en información procesable: según Economist Intelligence Unit, las empresas que emplean análisis de datos efectivos suelen superar a sus semejantes en los mercados bursátiles por un factor del 250%.

Aunque nuestras vidas son incesablemente recogidas en el mundo basado en datos, dichos beneficios le son negados a una clase inferior de datos que está surgiendo con rapidez. Cualquier ciudadano que carezca del mínimo conocimiento de las nuevas herramientas algorítimicas, o del mínimo acceso a ellas, estará cada vez en mayor desventaja en grandes áreas de la participación económica, política y social. Será más difícil que los datos marginados establezcan una solvencia personal o una influencia política; serán discriminados por los mercados de valores y las redes sociales. Tenemos que empezar a considerar la alfabetización sobre datos un requisito, una competencia fundamental en una democracia del siglo XXI, y para hacer campaña, y puede que incluso para legislar, para proteger los intereses de aquellos que se han quedado atrás.

Los datos marginados son perjudicados de dos maneras principales. La primera, se enfrentan a las desventajas sistémicas en los mercados que están nominalmente abiertos a todos. Los mercados de valores, por ejemplo. Cualquier operador humano de hoy es lo suficientemente audaz como para competir con los algoritmos de alta frecuencia, y los operadores de baja latencia deberían ser conscientes de hasta qué punto las probabilidades están en su contra. Como descubrió recientemente Andrei Kirilenko, economista jefe de la CFTC, junto a un grupo de investigadores de Princeton y la Universidad de Washington, los operadores de alta frecuencia más agresivos tienden a lograr los beneficios mayores lo que sugiere que lo más conveniente para el pequeño inversor es simplemente dejárselo a las máquinas?. No es una coincidencia que el poder en una franja de otros sectores lo estén acumulando quienes controlan los algoritmos, sean los "microtargeters" de la campaña de Obama, o los estrategas de mejora del rendimiento, o la agricultura de precisión impulsada con datos.

La segunda, el poder absoluto se está acumulando en un pequeño grupo de supermineros de datos cuya influencia solo tiene parangón con la ausencia de su rendición de cuentas. Tu identidad es cada vez más lo que dicen los que es: agencias de crédito, empleadores, fechas posibles, incluso la Agencia Nacional de Seguridad estadounidense tiene una visión fijada sobre ti basada en tu flujo de datos online, canalizados a través de los motores de búsquedas, las redes sociales y los sitios que puntúan la "influencia", no importa lo imprecisos o desfasados que sean los resultados. Y buena suerte si intentas corregir los errores o las falsas impresiones que están perjudicando tus posibilidades: como los usuarios marginados de servicios como Instagram o Facebook van entendiendo cada vez más, depende de ellos, no de ti, cómo se usarán tus datos personales. El cliente puede ser de hecho el producto, pero sin duda debería existir el deber por parte de dichos servicios de informar claramente al cliente respecto a la no posesión de su producción digital.

Los datos, como sabemos, son el poder y a medida que nuestra métrica personal se vuelve cada vez más fácilmente acumulable y almacenable, ese poder necesita un fuerte reequilibrio hacia nosotros como individuos y como ciudadanos. Hemos obstaculizado el progreso médico dejando que las empresas farmacéuticas controlaran de forma selectiva y a veces confusa la liberación de los datos de los ensayos clínicos. En esta era emergente de yottabytes, aseguremos la soberanía de las personas sobre las bases de datos haciendo responsables a quienes tienen las claves de la máquina.»

No hay comentarios:

Publicar un comentario