Big Data y Data Mining ¿Oportunidad o distopía? Presente y futuro de su influencia en los procesos de cambio social.

El concepto Big Data hace referencia a los grandes volúmenes de datos almacenados y procesados a gran escala que no pueden trabajarse a un nivel inferior para extraer conocimientos, crear valor, descubrir tendencias, las formas en la que cambian los mercados, las organizaciones, las relaciones sociales, las de los ciudadanos con los políticos, etc. Pero esto es sólo el principio. La era del Big Data marca el inicio de una gran transformación, desafía la forma en que vivimos y nos relacionamos con el mundo. Una de las cosas más llamativas es que, seguramente, la sociedad acabará desprendiéndose de su obsesión por la causalidad a cambio de correlaciones simples: no saber por qué sino solo el qué. Esto da un vuelco a siglos de prácticas establecidas y desafía nuestras comprensiones más básicas sobre la forma de tomar decisiones y comprender la realidad. En esencia, el Big Data versa sobre predicciones. La verdadera revolución no se encuentra tanto en las computadoras y sistemas que calculan en base a los datos sino en los datos en sí mismos y en la forma en la que los usamos. Sirva como ejemplo la imagen de un caballo, si en lugar de capturar una simple foto tomamos una serie de imágenes y las proyectamos por encima de los 24 frames por segundo, el cambio cuantitativo nos ha llevado a un cambio cualitativo: de la fotografía hemos pasado al cine. Ocurre de forma similar con el Big Data: modificando la cantidad, modificamos la esencia.

Los resultados de la sociedad de la información son fáciles de observar: un móvil en cada bolsillo, un ordenador en cada mochila y grandes sistemas informáticos en la trastienda de un sinfín de actividades sociales, comerciales, sanitarias o lúdicas. Pero menos notoria resulta la información en sí. Sin embargo, tras medio siglo después de la introducción de los ordenadores, los datos han comenzado a acumularse hasta el punto en el que se produce un nuevo fenómeno. No solo se trata de que el mundo esté inundado con más datos que nunca, sino que la información acumulada crece cada vez más rápidamente. El cambio de escala ha dado lugar a un cambio de estado, el cambio cuantitativo ha dado lugar a un cambio cuantitativo (Mayer-Schönberger y Cukier, 2013).

El Data Mining (Minería de Datos) es el estudio de la recogida, depuración, procesamiento, análisis y obtención de información útil a partir de datos. Existe una amplia variedad en cuanto a los problemas, dominios, aplicaciones, representaciones y formulaciones de datos susceptibles de encontrar aplicación. Por tanto, el término Data Mining es un amplio paraguas que se utiliza para describir diferentes aspectos del procesamiento de datos. Puede ser considerado uno de los componentes fundamentales de las técnicas y sistemas de Big Data. Básicamente, las técnicas de Data Mining se articulan en torno a tres fases: recolección de datos; extracción de características y depuración de los datos, y el procesamiento analítico junto con la elaboración de algoritmos (Aggarwal 2015).

El volumen y variedad de datos que están siendo continuamente generados sobre todos los aspectos de la vida cotidiana y el mundo en que vivimos crece exponencialmente y estos datos se generan, almacenan y gestionan, cada vez más, en tiempo real, de forma exhaustiva y relacional. Lo que antes era privado o desconocido está siendo revelado a un conjunto diverso de individuos, corporaciones, gobiernos, e instituciones que los emplean, o pueden emplearlos, en la toma de decisiones de acuerdo con sus propios intereses, siendo así, las decisiones políticas y empresariales están cada vez más basadas en los datos empíricos masivamente recogidos y gestionados por tecnócratas. Las consideraciones éticas, políticas y legales que la revolución del Big Data plantea están principalmente en relación a temas como la seguridad basada en la monitorización de datos personales y rastros digitales dejados, directa o indirectamente, por los individuos, privacidad, creación de perfiles, clasificación socio económica, así como en el establecimiento de líneas rojas en relación a gobierno anticipatorio, gobernanza tecnocrática corporativa, bloqueos tecnológicos, pertenencia y propiedad intelectual. Es cada vez más difícil participar en la vida diaria sin dejar algún rastro debido al papel mediador de las tecnologías digitales, el software y el uso de

identificadores indexables. Todo ello almacenado en distintas bases de datos que, no solo incluyen las huellas digitales de los individuos (los datos que ellos mismos dejan), sino también la sombra de sus datos (información sobre ellos generada por otros), cada vez más capaces de proporcionar información sobre ubicación, rutas, interacciones y transacciones a lo largo del espacio y el tiempo. Estos datos pueden ser almacenados indefinidamente creando un universo que lo recuerda todo y nada olvida. Las huellas y sombras digitales proporcionan un ampliamente detallado registro de la vida diaria de cada individuo: patrones de consumo, trabajo, viaje, comunicación, juego, interacciones con organizaciones, así como pensamientos e intereses. No solamente los sujetos, sino también los objetos como instituciones, transacciones y territorios pueden estar sometidos a este profundo escrutinio. Las huellas y sombras digitales están fragmentadas y dispersas, repartidas entre servidores de decenas de organizaciones diversas, estando sujetos tanto a la integración como a la división según los casos. Por el momento, a lo sumo, constituyen “oligopticones”, visiones limitadas de puntos de vista que no abarcan toda la información disponible en Internet, que solo por parte de algunas agencias de inteligencia gubernamentales podrían ser integrados en aras de acercarse a configurar un “panopticón” digital (el ojo divino que todo lo ve). La tendencia, sin embargo, dada la relacionalidad de los datos y el valor de su amplificación, es hacia la combinación de visiones oligoópticas que permitan mayor potencia escrutadora, analítica y predictiva (Kitchin, 2014).

Existen aspectos negativos y riesgos potenciales que las nuevas tecnologías llevan aparejados junto con su enorme potencial para mejorar el bienestar de la Humanidad. Desde el punto de vista de Greenfield y Cowen, el impacto social de Internet es interpretado como de aislamiento y atomización. El contacto social a través de redes virtuales es una forma huera de interacción social que sitúa a multitud de individuos fuera de la realidad propia de la presencia física más plena de emociones y significados. Las redes sociales y los sitios y aplicaciones móviles para gaming son considerados agentes primarios en este proceso. Los contenidos dominantes de Internet, al menos en cuanto acceso masivo, están profundamente relacionados con el entretenimiento hedonista que, en el mejor de los casos, no sólo inhiben el crecimiento de las identidades personales y la inteligencia social necesaria para proporcionar autonomía y empoderar a los individuos como actores sociales y políticos, sino que sirven como equivalente funcional de un anestésico, un opio que embota los sentidos, la comprensión y el pensamiento crítico. Desde esta perspectiva, Internet se estaría convirtiendo en un lugar donde las masas no se movilizan con fines revolucionarios sino en el que son despojadas de su identidad personal y de su influencia política y social (Greenfield, 2015; Cowen, 2013). Eric Schmidt y Jared Cohen consideran a la pérdida de privacidad provocada por el uso generalizado de Internet como una potencial amenaza trascendental contra las democracias establecidas al posibilitar el control y la infiltración sobre cualquier movimiento revolucionario o de protesta que emplee Internet como herramienta de acción o comunicación. Para atenuar esta amenaza abogan por la definición de un nuevo “contrato social” que vele por los derechos de la ciudadanía al tiempo que domestique y ponga límites a los efectos perversos de las TIC (Schmidt y Cohen, 2013).

Según Simone Ficher-Hübner y Leonardo Martucci, existen serios riesgos en el terreno de la privacidad individual propiciados por los sistemas de inteligencia colectiva basados en la gestión de Big Data. El perfil es el conjunto de datos que incorporan las características significativas de un sujeto. Su objetivo es representar el grado en el que un individuo exhibe rasgos o habilidades según lo requerido por el ámbito de análisis al cual se le desea someter. Los datos utilizados para construir perfiles se toman principalmente de las entradas realizadas por el propio individuo en distintos entornos y pueden ser explícita o implícitamente revelados, así como implícitamente derivados. Los datos revelados explícitamente son la información y declaraciones sobre sí mismos que los individuos directamente divulgan. Los datos revelados implícitamente hacen referencia a la información obtenida automáticamente por los sensores y sistemas de control que hacen un seguimiento de las actividades de los individuos. Los datos implícitamente derivados son aquellos que pueden inferirse a partir del conjunto de datos recolectados y no son directamente producidos o recogidos de los individuos, generalmente son obtenidos a partir de los resultados del análisis estadístico del conjunto de datos disponibles. Por ejemplo, las redes sociales contienen datos explícitamente revelados publicados por los usuarios; los programas de fidelización recogen los datos de los clientes que viajan, compran o se alojan en hoteles, actividades de las que se obtienen datos implícitamente revelados. Tanto redes sociales como empresas que adoptan programas de fidelización, derivan datos implícitos sobre los hábitos de los clientes. La recogida, enlace, cálculo, comparación y corrección estadística de datos con el objetivo de crear perfiles y detectar patrones puede tener impactos significativos en la privacidad individual ya que permite conocer perfiles de personalidad, comportamiento, intereses y hábitos para determinar, analizar y/o predecir conductas. Frecuentemente los datos se obtienen y los perfiles se elaboran sin el conocimiento de las personas afectadas. La elaboración de perfiles puede tener beneficios para los usuarios de los distintos servicios y redes sociales a través de la oferta de mejores y más personalizados productos que contemplen tanto los intereses del individuo como de la sociedad en general o posibilitando análisis de riesgos y posibles fraudes. Como ya se ha apuntado, el principal impacto negativo reside en la categorización de las personas en categorías predeterminadas que pueden privarlas injustificadamente de acceder a determinados servicios o facilitar otras formas de discriminación. Además, las técnicas de elaboración de perfiles permiten la predicción, a través de cálculos estadísticos, de datos tan sensibles como opiniones políticas, creencias religiosas o identidad sexual (Fischer-Hübner y Martucci, 2014).

Coevolucionando de forma retroalimentada con el Big Data encontramos los Sistemas de Inteligencia Artificial General (IAG). La Inteligencia Artificial (IA) es la rama de la ciencia y la ingeniería encargada del estudio, diseño y creación de máquinas, sistemas y software inteligente. Los sistemas de IA estrecha, como algoritmos para jugar al ajedrez o destinados a gestionar el comercio internacional de valores, trabajan solo en ámbitos específicos. Algunos investigadores llevan años trabajando en sistemas de IAG que, yendo más allá, tienen como objetivo “pensar” y planificar transversalmente en ámbitos en los que, por el momento, solamente los humanos podemos. La IAG solo existe actualmente en sus formas más primitivas. Sin embargo, el poder de computación de los supercomputadores más avanzados se acerca al del cerebro humano y una encuesta realizada en 2012 encontró que los principales investigadores de IA creen que hay una probabilidad del 10% que dentro de dos décadas se desarrollarán sistemas AGI capaces de desempeñar la mayoría de los puestos de trabajo que los humanos asumen hoy en día, con una probabilidad del 50% de este tipo de sistemas estén disponibles para el año 2050. La IAG proporcionaría ventajas en muchas áreas: recursos computacionales, velocidad de comunicación, profundidad de pensamiento, capacidad de duplicación y de edición, coordinación de objetivos y racionalidad. La transición desde una IAG inferior a los niveles humanos hacia sistemas de IAG que superen con mucho nuestras capacidades podría producirse rápidamente. La rapidez de tal cambio podría concentrar el poder en manos de un solo grupo o nación. Si algunos actores controlan la inteligencia artificial muy avanzada, mientras que otros no lo hacen, podrían obtener una ventaja estratégica decisiva sobre todos los demás. Los sistemas de IAG podrían superar las capacidades humanas en la formulación de estrategias, hackeo informático, manipulación social, investigación y productividad económica. Un sistema con una ventaja lo suficientemente potente en cualquiera de estas dimensiones podría proporcionar una superioridad decisiva a sus poseedores. También existen riesgos significativos de accidentes durante el desarrollo. Incluso los primitivos sistemas de IA que tenemos hoy han llegado a comportarse de manera altamente impredecible con el fin de completar las tareas programadas. Del mismo modo, por encima de un nivel humano de IAG, los sistemas podrían ejecutar acciones inesperadas y altamente destructivas si llegasen a considerar que con ellas podrían seguir un camino lógico y eficiente imprevisto para completar las tareas para las que se han diseñado. Los principales investigadores en el campo de la IA creen que, aunque lo más probable es que los resultados del desarrollo de la IAG para el conjunto de la Humanidad sean positivos, existe alrededor de un 7% de probabilidad de resultados

extremadamente negativos o catástrofe existencial (Beckstead et al. 2014).

Repasando los aspectos positivos aparejados a las nuevas tecnologías y los sistemas Big Data, encontramos grandes potenciales susceptibles de beneficiar a, prácticamente, todos los sectores de

la sociedad y la industria. En sectores como los de Internet, transporte, finanzas, energía, medios de comunicación y entretenimiento o la seguridad y la investigación policial, el Big Data permite el acceso, análisis y correlación de los datos en tiempo real a través de múltiples herramientas altamente escalables, de fácil manejo y con un hardware relativamente accesible. Por ejemplo, la producción y consumo de energía pueden ser mejor ajustados a través de contadores inteligentes. Los diversos recursos pueden ser gestionados más eficientemente al tiempo que se disminuye el impacto medioambiental. Los riesgos pueden ser más fácilmente reconocidos y evitados, reduciendo las consecuencias indeseadas de la toma de decisiones e identificando oportunidades que, de otro modo, se habrían perdido. La medicina puede adaptarse mejor a las características de los pacientes y la prevención basada en históricos y correlaciones va ganado importancia continuamente. La minería y tratamiento de datos en el terreno socio económico permitirá una mejor comprensión de los principales problemas que nuestro sistema afronta: inestabilidad

financiera, carencias de recursos y conflictos. También presta mayor rapidez y precisión en la adaptación a los cambios. Por ejemplo, facilitará la gestión en tiempo real de desafíos tales como escenarios de evacuación o programas de estímulo económico. Además, surgen nuevas oportunidades de servicios personalizados (Helbing, 2015). En el terreno de la sanidad el impacto de los sistemas Big Data será creciente como resultado de la personalización de la asistencia. Los sistemas de salud emplean como principales fuentes de datos los estudios genéticos, las pruebas y análisis médicos y los datos de gestión y atención a los pacientes. El tratamiento de estos flujos de datos puede ser empleado para comprobar hipótesis en investigación, innovación y disminución de costes a través de la eficiencia.

Los datos recabados en las redes sociales pueden analizarse para comprender dinámicas sociales capaces de ayudar en la creación de distintas herramientas de gobernanza participativa. La gobernanza tecnológicamente asistida tiene como objetivo descubrir y predecir tendencias, cambios en la sociedad, así como profundizar en la comprensión de los procesos sociales para promover el crecimiento económico sostenible y mejorar la salud y la calidad de vida. (Hrushikesha, 2015). En el sector financiero el tratamiento masivo de datos puede ayudar a identificar y comprender las necesidades del cliente para ofrecerle nuevos servicios que incrementen sus oportunidades de negocio y beneficio además de la elaboración de estrategias para retenerle. También se aplican soluciones relacionadas con la gestión de riesgos y detección de fraudes a través de patrones de comportamiento en entornos de banca online, tarjetas de crédito, empleados o blanqueo de capitales. En la distribución al por menor, la gestión de inventarios, recomendaciones de productos, trazado demográfico del cliente y análisis de tendencias del mercado ayuda a mejorar el servicio, optimizar costes y aumentar beneficios. En el terreno industrial, el mantenimiento preventivo de equipos e instalaciones, las previsiones de demanda y detección de patrones en los costes de los inputs serán cada vez más decisivas no solo para la competitividad sino también para la propia supervivencia de las empresas (Hareesh, 2015).

En cuanto a nuevo paradigma como ágora global, el uso de las nuevas tecnologías es clave en la creación de debates colectivos y fundamental en la diseminación de nuevas ideas o la difusión de formas organizativas, posibilitando un espacio comunicativo alternativo al orden hegemónico en el que la ciudadanía puede adquirir nuevos roles y convertirse gradualmente en protagonistas de la comunicación política (Sola-Morales, 2016). En este espacio común, la gente corriente puede encontrar y mantener una audiencia al producir contenido de interés para un determinado segmento combinando herramientas como el blogging, las redes sociales y el streaming (Batyko, 2016). Estos cambios en el paisaje mediático digital han facilitado a los individuos construir su marca personal que ha llegado a simbolizar la búsqueda de la micro celebridad, de la autoexpresión en línea y de los cambios en la sociedad, grandes o pequeños, que pueden inducirse a través de la difusión de las ideas individuales (Lagore, 2016).

Existen también autores que argumentan que se sobredimensiona el impacto que las nuevas tecnologías han tenido en realidad sobre la economía y la sociedad. Para Karl Albrecht, la economía de Internet se parece cada vez más a la “vieja” economía, con un pequeño número de mega-corporaciones dominando el sector, explotándolo implacablemente y erigiendo barreras de entrada para los posibles competidores. Tampoco ha contribuido a disminuir la brecha de riqueza y desigualdad. Muchos puestos de trabajo de la clase media han desaparecido, los salarios reales se han estancado o disminuido y el reparto de los masivos beneficios generados se ha acumulado en las cúpulas en las manos de altos ejecutivos y grandes accionistas. Otra de las predicciones sobre el impacto de Internet que Albrecht evalúa como errónea es la fundada en la idea de que “Internet hará que todos estemos mejor informados”. En lugar de eso, los nuevos canales informativos en feroz competencia mutua, han simplificado y superficializado la información hasta el punto de diseñar formatos y contenidos enfocados únicamente en llamar la atención y atraer fácilmente a la audiencia aumentando el peso de los contenidos relacionados con la violencia, el conflicto, la vulgaridad, el voyerismo y el uso indiscriminado e injustificado del sexo (Albrecht, 2014). Paul Krugman, por su parte, señala que la influencia de más de cuatro décadas de era digital en el crecimiento económico, pese a todos los avances en las TIC, ha sido poco relevante, al menos en el crecimiento mensurable en términos monetarios. Han sido muy eficaces generando grandes titulares pero con modestos resultados económicos (Krugman, 2015).

En cualquier caso, resulta evidente que la revolución en el ámbito de las tecnologías de la computación y la información, dentro de las cuales los sistemas Big Data, en ellas cimentados y nutridos, van a adoptar un papel de creciente relevancia, así como el crecimiento exponencial del acceso y uso de las redes de comunicaciones, se han convertido en uno de los principales factores de cambio que es necesario tener en cuenta para abordar una teoría del cambio social en el siglo XXI. Aunque la sociología tiende a rechazar la idea de que haya una causa única dominante en las dinámicas de cambio social, la influencia de la “revolución Big Data” es y será decisiva en la economía, la creación y difusión de conocimiento, las relaciones políticas y sociales, los medios de comunicación y el entretenimiento.

BIBLIOGRAFÍA

Aggarwal, Charu. 2015. Data Mining: The Textbook. New York: Springer.
Albrecht, Karl. 2014. “The Information Revolution’s Broken Promises.” The Futurist. http://www.karlalbrecht.com/downloads/Albrecht-IR-BrokenPromises-WorldFutureSociety.pdf.
Batyko, Richard. 2016. “Ground-Up Expert: Everyday People and Blogs.” In Debates for the Digital Age: The Good, the Bad, and the Ugly of Our Online World, 176–89. Santa Barbara: Praeger.

Beckstead, Nick, Nick Bostrom, Niel Bowerman, Owen Cotton-Barratt, William MacAskill, Seán ÓhÉigeartaigh, y Toby Ord. 2014. “Unprecedented Technological Risks.” Global Priorities Project. http://globalprioritiesproject.org/2015/02/unprecedented-technological-risks/.

Cowen, Tyler. 2013. Average Is Over. Powering America Beyond The Age Of The Great Stagnation. New York: Penguin Books.
Fischer-Hübner, Simone, y Leonardo Martucci. 2014. “Privacy in Social Collective Intelligence Systems.” In Social Collective Intelligence. Combining the Powers of Humans and Machines to
Build a Smarter Society, 105–24. Heidelberg: Springer.
Greenfield, Susan. 2015. Mind Change: How Digital Technologies Are Leaving Their Mark on Our
Brains. New York: Random House.
Hareesh, Boinepelli. 2015. “Applications of Big Data.” In Big Data A Primer, 161–79. New Delhi: Springer.

Helbing, Dirk. 2015. Thinking Ahead – Essays on Big Data, Digital Revolution, and Participatory Market Society. Zürich: Springer.

Hrushikesha, Mohanty. 2015. “Big Data: An Introduction.” In Big Data. A Primer, 11:1–28. Studies in Big Data. New Delhi: Springer.
Kitchin, Rob. 2014. The Data Revolution. Big Data, Open Data, Data Infrastructures and Their

Consequences. Los Angeles: Sage.

Krugman, Paul. 2015. “The Big Meh.” The New York Times, May 25. http://www.nytimes.com/2015/05/25/opinion/paul-krugman-the-big-meh.html?_r=0.
Lagore, Justin. 2016. “Self-Promotion for All! Content Creation and Personal Branding in the Digital Age.” In Debates for the Digital Age: The Good, the Bad, and the Ugly of Our Online World, 190– 205. Santa Barbara: Praeger.
Mayer-Schönberger, Viktor, and Kenneth Cukier. 2013. Big Data. A Revolution That Will Transform How We Live, Work, and Think. New York: Houghton Mifflin Harcourt Publishing Company.
Schmidt, Eric, and Jared Cohen. 2013. The New Digital Age: Reshaping the Future of People, Nations and Business. New York: ALFRED A. KNOPF.
Sola-Morales, Salomé. 2016. “Rethinking Digital Democracy in a Time of Crisis: The Case of Spain.” In Debates for the Digital Age: The Good, the Bad, and the Ugly of Our Online World, 129–46. Santa Barbara: Praeger.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.