lunes, 20 de mayo de 2013

Christakis: Las redes sociales ayudan a predecir epidemias

Nicholas Christakis muestra como las redes sociales ayudan a predecir epidemias

Transcripción


Durante los últimos 10 años he tratado de dar con la forma y la razón por la que los seres humanos se congregan en redes sociales. Y el tipo de red social de la que hablo no es la reciente variedad virtual sino más bien del tipo de redes sociales en las que los humanos nos hemos congregado durante cientos y miles de años desde que aparecimos en la sabana africana. Así, entablo amistades y relaciones laborales, y relaciones fraternales y de parentesco con otra gente, quienes a su vez tienen relaciones con otras personas. Y esto se extiende indefinidamente en la distancia. Y se tiene una red que se parece a esto. Cada punto es una persona. Cada línea entre puntos es una relación entre dos personas... distintos tipos de relaciones. Así se obtiene esta suerte de tejido de humanidad en el que todos estamos inmersos.

Con mi colega James Fowler hemos estado estudiando durante bastante tiempo las reglas matemáticas, sociales, biológicas y psicológicas que gobiernan la forma de ensamblaje de estas redes y las reglas similares que gobiernan la forma en que operan, en que afectan nuestras vidas. Y hace poco nos preguntábamos si sería posible sacar ventaja de este conocimiento para encontrar maneras de mejorar el mundo, de hacer algo mejor, para solucionar las cosas y no sólo para entenderlas. Uno de los primeros temas que pensamos abordar era la forma de predecir epidemias.

Y la técnica actual para predecir epidemias -en el CDC o algún otro organismo nacional- es sentarse en el lugar que uno esté y recolectar datos de médicos y laboratorios en el terreno que informen de la prevalencia o la incidencia de ciertas condiciones. Pacientes así, así y así han sido diagnosticados [por aquí] u otros pacientes lo han sido [por allí] y todos estos datos van a un repositorio central con cierta demora. Y si todo va bien, en una o dos semanas, uno sabrá en qué estado estaba hoy la epidemia. En realidad hace cosa de un año se hizo conocida esta noción de tendencia gripal en Google, en relación a la gripe, según la cual mirando el comportamiento de búsqueda hoy podíamos saber de la gripe... el estado actual de la epidemia, la prevalecencia actual de la epidemia.

Pero lo que hoy quiero mostrarles es un medio por el cual podríamos tener no sólo alertas rápidas de una epidemia sino también detección temprana de la misma. Y, de hecho, esta idea puede usarse no sólo para predecir epidemias de gérmenes sino también para predecir epidemias de todo tipo. Por ejemplo, cualquier cosa que se propague por contagio social puede ser comprendida de este modo, desde las ideas de la izquierda como el patriotismo, el altruismo o la religión hasta prácticas como las dietas o la compra de libros bebidas, cascos de bicicleta [y] otras medidas de seguridad; o productos que la gente podría adquirir, la compra de artículos electrónicos, cualquier cosa en la que haya propagación interpersonal. Una especie de difusión de la innovación podría ser entendida y predicha con el mecanismo que ahora voy a mostrarles.

Así, como todos probablemente saben, la manera clásica de pensar en esto es la "difusión de la innovación" o "curva de adopción". Aquí en el eje Y tenemos el porcentaje de personas afectadas y en el eje X tenemos el tiempo. Al principio no hay demasiadas personas afectadas, y se tiene esta curva sigmoidea clásica o curva en forma de S. La razón de esta forma es que muy al principio digamos que una o dos personas están afectadas o infectadas y luego ellos afectan, o infectan, a dos personas que a su vez afectan a 4, 8, 16, etc., y se obtiene la fase de crecimiento de la epidemia en la curva. Y, finalmente, se satura la población. Hay cada vez menos personas que todavía pueden ser infectadas y entonces se tiene la meseta de la curva, y se obtiene esta curva sigmoidea clásica. Y esto vale para gérmenes, ideas, adopción de productos, comportamientos y similares. Pero las cosas no se difunden aleatoriamente en las poblaciones humanas. Se difunden en redes. Porque, como dije, vivimos nuestras vidas en redes y estas redes tienen un tipo particular de estructura.

Ahora, si vemos una red como ésta... Ésta tiene 105 personas. Y las líneas representan... los puntos son las personas y las líneas las relaciones de amistad. Puede verse que las personas ocupan distintas ubicaciones en la red. Y hay distintos tipos de relaciones entre las personas. Pueden darse relaciones de amistad, relaciones fraternales, relaciones maritales, relaciones laborales, relaciones vecinales, etc. Y distintos tipos de cosas se difunden por diferentes tipos de lazos. Por ejemplo, las enfermedades de transmisión sexual se esparcirán por los vínculos sexuales. O, por ejemplo, el hábito de fumar podría ser influencia de los amigos. O el altruismo y las donaciones caritativas podrían estar influenciados por los compañeros de trabajo, o por los vecinos. Pero no todas las ubicaciones de la red son iguales.

Así, si miran esto van a captar de inmediato que diferentes personas tienen distinta cantidad de conexiones. Algunas personas tienen 1 conexión, algunas tienen 2, algunas tienen 6, algunas tienen 10. Y esto se llama el "grado" de un nodo o la cantidad de conexiones que tiene un nodo. Pero hay algo más. Si uno mira los nodos A y B, ambos tienen 6 conexiones. Pero si uno mira esta imagen [de la red] a vista de pájaro, puede apreciar que hay algo muy diferente entre los nodos A y B. Déjenme preguntarles esto, puedo fomentar esta intuición haciendo una pregunta: ¿Quién les gustaría ser si un germen se esparciera por la red, A o B? (Audiencia: B) Nicholas Christakis: B, obviamente. B está ubicado al borde de la red. Ahora, ¿quién les gustaría ser si se propagara por la red un chisme jugoso? A. Y uno tiene una apreciación inmediata de que va a ser más probable que A dé primero con lo que se está propagando en virtud de su ubicación estructural dentro de la red. A, de hecho, es más central y esto se puede formalizar matemáticamente. Por lo tanto, si quisiéramos seguir algo que se está propagando por una red, lo ideal sería poner sensores en los individuos del centro de la red, incluyendo el nodo A, y monitorear a esas personas que están justo en el centro de la red, para, de algún modo, detectar en forma temprana lo que sea que se esté difundiendo por la red.

Así, si los viéramos contraer un germen o una información uno sabría, muy pronto, que todos están por contraer el germen o por enterarse de esa información. Y esto sería mucho mejor que monitorear a 6 personas elegidas al azar sin hacer referencia a la estructura de la población. Y, de hecho, si uno pudiera hacer eso lo que vería sería algo como esto. De nuevo, en el panel de la izquierda tenemos la curva de adopción en forma de S. En la línea roja punteada mostramos cómo sería la adopción en las personas elegidas al azar y en la línea de la izquierda, desplazada a la izquierda, mostramos cómo sería la adopción en los individuos del centro de la red. En el eje Y están las instancias acumulativas de contagio y en el eje X está el tiempo. Y a la derecha, mostramos los mismos datos, pero aquí con incidencia diaria. Y lo que aquí mostramos, como en este caso, es que hay pocas personas afectadas, cada vez más y más hasta llegar aquí, y aquí es el pico de la epidemia. Pero desplazado a la izquierda se ve lo que ocurre con los individuos del centro. Y esta diferencia en tiempo entre los dos es la detección temprana, la alerta temprana que se dispara sobre una epidemia inminente en la población humana.

El problema, sin embargo, es que el mapeo de redes sociales humanas no siempre es posible. Puede que sea caro, [muy difícil], antiético, o, francamente, imposible de realizar. Entonces: ¿cómo podemos averiguar cuáles son las personas centrales de una red sin, de hecho, mapear la red? Y surgió la idea de explotar un hecho muy antiguo o un hecho conocido de las redes sociales que dice así: ¿sabías que tus amigos tienen más amigos que tú? Tus amigos tienen más amigos que tú. Y esto se conoce como la paradoja de la amistad. Imaginen una persona muy popular en la red social -como un anfitrión de una fiesta con cientos de amigos- y un misántropo que tiene un solo amigo; si uno toma una persona al azar, es mucho más probable que conozca al anfitrión. Y si señala al anfitrión como amigo, ese anfitrión tiene cientos de amigos, por lo tanto tiene más amigos que uno. Y esto, en esencia, es lo que se conoce como la paradoja de la amistad. Los amigos de las personas elegidas al azar tienen más alto grado y están más al centro que la propia gente elegida al azar.

Y uno puede hacerse una idea intuitiva de esto si piensa en la gente del perímetro de la red. Si uno elige a esta persona el único amigo que tendrá para elegir es esta persona, quien, por construcción, debe tener al menos dos o, normalmente, más amigos. Y eso sucede en cada nodo periférico. De hecho, sucede en toda la red conforme uno se desplaza, cualquiera que elijamos, cuando nomine alguien al azar... cuando una persona al azar nomina a un amigo uno se mueve más cerca del centro de la red. Así, pensamos en explotar esta idea para estudiar si podíamos predecir fenómenos dentro de las redes. Porque ahora, con esta idea, podemos tomar una muestra aleatoria de gente, hacer que elijan a sus amigos, y esos amigos estarán más al centro, y podríamos hacer eso sin tener que mapear la red.

Hemos probado esta idea con un brote de la gripe H1N1 en la universidad de Harvard en el otoño y el invierno de 2009, hace apenas unos meses. Tomamos 1.300 estudiantes seleccionados al azar, hicimos que elijan a sus amigos y seguimos a los estudiantes elegidos al azar y a sus amigos diariamente para ver si tenían o no la epidemia de gripe. Y lo hicimos pasivamente observando si habían ido a los servicios de salud universitarios. Les pedimos también que nos envíen un correo un par de veces por semana. Y sucedió exactamente lo que predijimos. El grupo aleatorio está en la línea roja. La epidemia en el grupo de amigos se desplazó a la izquierda, por aquí. Y la diferencia entre los dos es de 16 días. Monitoreando el grupo de amigos pudimos tener una alerta 16 días antes de una epidemia inminente en esta población humana.

Ahora, además de eso, si uno fuese un analista que trata de estudiar una epidemia o de predecir la adopción de un producto, por ejemplo, lo que podría hacer es tomar una muestra aleatoria de la población, pedirle que elijan a sus amigos y seguir a los amigos, y seguir tanto a los aleatorios como a los amigos. Entre los amigos, la primera evidencia de un salto sobre cero en la adopción de innovación, por ejemplo, sería la evidencia de una epidemia inminente. O uno podría ver la primera vez que divergen las dos curvas, como se muestra a la izquierda. ¿Cuándo los aleatorios... cuándo despegaron los amigos y dejaron a los aleatorios y su curva empezó a desplazarse? Y eso, como indica la línea blanca, se produjo 46 días antes del pico de la epidemia. Así que esta sería una técnica mediante la cual se podría alertar más de un mes y medio antes la epidemia de gripe en una población en particular.

Debo decir que la antelación con la que puede conocerse una noticia depende de una serie de factores. Podría depender de la naturaleza del patógeno, distintos patógenos, usando esta técnica, se obtienen distintas alertas, u otros fenómenos que se están extendiendo o, francamente, de la estructura de la red humana. En nuestro caso, aunque no era necesario, pudimos, de hecho, mapear la red de estudiantes.

Este es un mapeo de 714 estudiantes y sus vínculos de amistad. Y en un minuto voy a poner este mapeo en movimiento. Vamos a tomar cortes diarios de la red durante 120 días. Los puntos rojos van a ser casos de gripe y los puntos amarillos van a ser amigos de las personas con gripe. Y el tamaño de los puntos va a ser proporcional a la cantidad de amigos con gripe. Así, puntos más grandes significan más amigos con gripe. Y si miran esta imagen, aquí estamos en el 13 de septiembre, van a ver algunos casos iluminados. Van a ver una especie de florecimiento de la gripe en el medio. Aquí estamos el 19 de octubre. La pendiente de la curva de la epidemia se está acercando ahora, en noviembre. Bang, bang, bang, bang, van a ver un gran florecimiento en el medio, y luego van a ver una especie de nivelación, cada vez menos casos hasta fines de diciembre. Y este tipo de visualización puede mostrar que las epidemias como éstas echan raíces y afectan primero a los individuos del centro antes de afectar a otros.

Ahora, como he estado sugiriendo, este método no se limita a los gérmenes, sino, en realidad, a cualquier cosa que se propague en la población. La información se propaga en la población. Las normas se propagan en la población. Los comportamientos pueden propagarse en la población. Y comportamiento puede significar comportamiento criminal o electoral, o del cuidado de la salud como el tabaco o las vacunas, o la adopción de productos u otro tipo de comportamiento relacionado con la influencia interpersonal. Si soy capaz de hacer algo que afecta a los demás a mi alrededor, esta técnica puede proporcionar una alerta o detección temprana sobre la adopción en la población. La clave es que, para que funcione, tiene que haber influencia interpersonal. No puede deberse a un mecanismo de difusión que afecte a todos por igual.

Ahora, los mismos conocimientos de las redes pueden ser explotados también de otras maneras por ejemplo, para seleccionar personas específicas para intervenciones. Muchos de Uds. están familiarizados probablemente con la noción de inmunidad de grupo. Así, si tenemos una población de mil personas y queremos hacer que la población sea inmune a un patógeno no tenemos que inmunizar a todos. Si inmunizamos a 960 de ellos es como si hubiéramos inmunizado al 100% de ellos. Porque incluso si una o dos de las personas no inmunes se infectan, no hay nadie a quien puedan infectar. Están rodeados de personas inmunizadas. Así que el 96% es tan bueno como el 100%. Bueno, algunos científicos han estimado qué pasaría si se toma una muestra aleatoria del 30% y de estas 1.000 personas se inmuniza a 300. ¿Se obtendría alguna inmunidad a nivel poblacional? Y la respuesta es no. Pero si uno toma este 30%, estas 300 personas, y hacemos que elijan a sus amigos y tomamos la misma cantidad de dosis de vacunas y vacunamos a los amigos de los 300, los 300 amigos, se obtiene el mismo nivel de inmunidad de grupo que si vacunáramos al 96% de la población con mucha mayor eficiencia y una restricción presupuestaria estricta.

Y pueden usarse ideas similares, por ejemplo, para enfocar la distribucion de cosas como mosquiteros en el mundo en desarrollo. Si pudiésemos identificar la estructura de las redes en los pueblos podríamos elegir a quién darle las intervenciones para fomentar este tipo de propagación. O bien, francamente, para publicitar todo tipo de productos. Si pudiéramos entender cómo seleccionar, eso podría afectar la eficiencia de lo que estamos tratando de lograr. Y, de hecho, podemos usar datos de todo tipo de fuentes hoy en día [para hacerlo].

Este es un mapeo de 8 millones de usuarios de teléfono en un país europeo. Cada punto es una persona, y cada línea representa un volumen de llamadas entre personas. Y podemos usar estos datos obtenidos de manera pasiva para mapear estos países enteros y comprender dónde se ubica cada quien en la red. Sin tener que interrogarlos en absoluto podemos obtener este tipo de conocimiento estructural. Y otras fuentes de información, que Uds. sin duda conocen, están disponibles a partir de las interacciones de correo electrónico, interacciones en línea, redes sociales virtuales, etc. Y, de hecho, estamos en la era de lo que llamaría esfuerzos de recolección de datos "masivo-pasivos". Hay todo tipo de maneras de recolectar datos en forma masiva para crear redes de sensores para seguir a la población y comprender lo que sucede en la población e intervenir en la población para mejor. Porque estas nuevas tecnologías nos dicen no sólo quién habla con quién sino dónde está cada uno y lo que están pensando en base a lo que están subiendo a internet, y lo que están consumiendo en base a sus compras. Y todos estos datos administrativos pueden juntarse y ser procesados para comprender el comportamiento humano en modos nunca antes posibles.

Por ejemplo: podríamos usar las compras de combustible de transportistas. Los transportistas hacen lo suyo y compran combustible. Vemos una suba en la compra de combustible de los transportistas y sabemos que una recesión está por terminar. O podemos analizar la velocidad a la que se mueve la gente con sus celulares en la autopista y la compañía telefónica puede ver, conforme la velocidad disminuye, que hay un atasco de tráfico. Y se puede enviar esa información a los clientes, pero sólo a los clientes que están en esa misma autopista ubicados detrás del atasco. O podemos monitorear diagnósticos médicos, de forma pasiva, y ver la difusión de innovación en productos farmacéuticos en las redes de médicos. O, de vuelta, podemos seguir los hábitos de compra de la gente y observar cómo estos tipos de fenómenos pueden difundirse en las poblaciones humanas.

Y creo que hay tres maneras en que pueden usarse estos datos masivo-pasivos. Una es totalmente pasiva como acabo de describir. Por ejemplo, el caso de los transportistas en el que no se interviene en la población de ningún modo. Otro es casi activo, como el ejemplo que di de la gripe, en el que pedimos a la gente que elija a sus amigos, y luego controlamos pasivamente a sus amigos: ¿tienen la gripe o no? Y luego la advertencia. Y otro ejemplo sería si uno es una compañía telefónica, averigua quiénes son el centro de la red, y le pregunta a esa gente: "¿Podrías mandarnos un sms con tu temperatura todos los días? Y uno junta ingentes cantidades de información de la temperatura de la gente pero de los individuos del centro. Y se es capaz, a gran escala, de monitorear una epidemia inminente con una participación mínima de la gente. O podría ser algo completamente activo, sé que los próximos oradores también hablarán de esto hoy, donde la gente participará globalmente en wikis o fotografiando, o siguiendo elecciones, y subiendo información de modo que pueda consolidarse para comprender los procesos sociales y los fenómenos sociales.

De hecho, la disponibilidad de estos datos, creo, anuncian una nueva era de lo que tanto yo como otros daríamos en llamar "ciencias sociales de cómputo". Es como cuando Galileo inventó -o no inventó- utilizó un telescopio y pudo ver el firmamento de otra manera; o cuando Leeuwenhoek conoció el microscopio -o en realidad lo inventó- y pudo ver la biología de manera nueva. Pero ahora tenemos acceso a estos datos que nos permiten entender los procesos sociales y los fenómenos sociales de una forma totalmente nueva que nunca antes fue posible. Y con esa ciencia podemos entender exactamente cómo el todo viene a ser más grande que la suma de las partes. Y, en realidad, podemos usar estos conocimientos para mejorar la sociedad y el bienestar del hombre.

Gracias.

TED

No hay comentarios:

Publicar un comentario