Los científicos crean una utensilio para explorar miles de millones de mensajes en las redes sociales, prediciendo potencialmente turbulencias políticas y financieras – ScienceDaily
Durante miles de años, la gente ha contemplado el cielo nocturno a simple vista y ha contado historias sobre las pocas estrellas visibles. Luego inventamos los telescopios. En 1840, el filósofo Thomas Carlyle afirmó que «la historia del mundo no es más que la biografía de los grandes hombres». Luego comenzamos a publicar en Twitter.
Ahora los científicos han inventado una herramienta para mirar en profundidad los miles de millones de publicaciones publicadas en Twitter desde 2008 y han comenzado a descubrir la vasta galaxia de historias que contienen.
«Lo llamamos Storywrangler», dice Thayer Alshaabi, un estudiante de doctorado en la Universidad de Vermont que codirigió la nueva investigación. «Es como un telescopio para ver, en tiempo real, todos estos datos que la gente comparte en las redes sociales. Esperamos que la gente los use por sí mismos, de la misma manera que usted puede mirar las estrellas y hacer sus preguntas».
La nueva herramienta puede proporcionar información sin precedentes, minuto a minuto, sobre la popularidad, desde movimientos políticos en ascenso hasta fracasos de taquilla; desde el asombroso éxito del K-pop hasta los signos de nuevas enfermedades emergentes.
La historia de Storywrangler, una selección y análisis de más de 150 mil millones de tweets, y algunos de sus hallazgos clave se publicaron el 16 de julio en la revista. Avances científicos Ciencia.
EXPRESIONES DE LAS MUCHAS
El equipo de ocho científicos que inventó Storywrangler, de la Universidad de Vermont, Charles River Analytics y MassMutual Data Science, recopila alrededor del diez por ciento de todos los tweets realizados todos los días en todo el mundo. Para cada día, dividen estos tweets en bits individuales, así como en pares y tríos, generando frecuencias de más de un billón de palabras, hashtags, identificadores, símbolos y emojis, como «Super Bowl», «Black Lives Matter», » gravitacional «. ondas «,» #metoo «,» coronavirus «y» dieta cetogénica «.
«Esta es la primera herramienta de visualización que le permite ver oraciones de una, dos y tres palabras, en 150 idiomas diferentes, desde el comienzo de Twitter hasta hoy», dice Jane Adams, coautora del nuevo estudio que recientemente terminó un puesto tres años como artista residente en visualización de datos en el Centro de Sistemas Complejos de UVM.
La herramienta en línea, impulsada por la supercomputadora UVM en Vermont Advanced Computing Core, proporciona una lente poderosa para visualizar y analizar el auge y la caída de palabras, ideas e historias todos los días entre personas de todo el mundo. «Es importante porque muestra los discursos más importantes a medida que ocurren», dice Adams. «Es cuantificar la atención colectiva». Aunque Twitter no representa a toda la humanidad, es utilizado por un grupo muy grande y diverso de personas, lo que significa que «codifica la popularidad y la difusión», escriben los científicos, ofreciendo una nueva visión del discurso no solo de los famosos. , como personajes políticos y celebridades, sino también las «expresiones de muchos» cotidianos, señala el equipo.
En una prueba sorprendente del vasto conjunto de datos del Storywrangler, el equipo demostró que podría usarse para predecir posibles turbulencias políticas y financieras. Examinaron el cambio porcentual en el uso de las palabras «rebelión» y «represión» en varias regiones del mundo. Descubrieron que el aumento y la caída de estos términos se asociaron significativamente con el cambio de un índice de riesgo geopolítico bien establecido para esos mismos lugares.
¿QUÉ ESTÁ PASANDO?
La historia global ahora escrita en las redes sociales trae miles de millones de voces – comentando y compartiendo, quejándose y atacando – y, en todos los casos, grabando – sobre guerras mundiales, gatos raros, movimientos políticos, nueva música, qué hay para cenar, enfermedades mortales, fútbol favorito estrellas, esperanzas religiosas y chistes sucios.
«Storywrangler nos brinda una forma basada en datos para indexar lo que la gente normal está hablando en las conversaciones cotidianas, no solo lo que los reporteros o autores han elegido; no se trata solo de las élites educadas, ricas o culturales», dice el matemático aplicado Chris Danforth, un profesor de la Universidad de Vermont que codirigió la creación de StoryWrangler con su colega Peter Dodds. Juntos dirigen el Computational Story Lab de UVM.
«Esto es parte de la evolución de la ciencia», dice Dodds, experto en sistemas complejos y profesor del Departamento de Ciencias de la Computación de la UVM. «Esta herramienta puede permitir nuevos enfoques en el periodismo, formas efectivas de examinar el procesamiento del lenguaje natural y el desarrollo de historias computacionales».
Durante siglos se ha debatido sobre cómo pocas personas poderosas dan forma al curso de los acontecimientos. Pero, por supuesto, si supiéramos lo que dijeron todos los agricultores, soldados, comerciantes, enfermeras y adolescentes durante la Revolución Francesa, tendríamos un conjunto de historias muy diferentes sobre el ascenso y el reinado de Napoleón. «Aquí está la pregunta profunda», dice Dodds, «¿qué pasó? ¿Qué pasó realmente?»
SENSOR GLOBAL
El equipo de UVM, con el apoyo de la National Science Foundation, está utilizando Twitter para demostrar cómo la charla distribuida en las redes sociales puede actuar como una especie de sistema de sensores global: qué sucedió, cómo reaccionó la gente y qué podría suceder a continuación. Pero otras transmisiones de redes sociales, desde Reddit hasta 4chan y Weibo, en teoría, también podrían usarse para impulsar Storywrangler o dispositivos similares: rastrear la reacción a eventos noticiosos importantes y desastres naturales; seguir la fama y el destino de los líderes políticos y las estrellas del deporte; y abrir una perspectiva de conversación informal que pueda proporcionar información sobre las dinámicas que van desde el racismo hasta la ocupación, las amenazas emergentes para la salud y los nuevos memes.
En el nuevo Avances científicos Ciencia En el estudio, el equipo presenta una muestra del visor en línea de Storywrangler, con tres eventos globales destacados: la muerte del general iraní Qasem Soleimani; el inicio de la pandemia COVID-19; y las protestas de Black Lives Matter tras el asesinato de George Floyd por la policía de Minneapolis. El conjunto de datos de Storywrangler registra un aumento repentino en los tweets y retweets usando el término «Soleimani» el 3 de enero de 2020, cuando Estados Unidos asesinó al general; el fuerte aumento de «coronavirus» y emojis de virus durante la primavera de 2020 con la propagación de la enfermedad; y una oleada de uso del hashtag «#BlackLivesMatter» a partir del 25 de mayo de 2020, el día en que George Floyd fue asesinado.
«Hay un hashtag que se inventó mientras estoy hablando en este momento», dice Chris Danforth de UVM. «No sabíamos que lo estábamos buscando ayer, pero aparecerá en los datos y se convertirá en parte de la historia».