Según un artículo publicado en Science, la digitalización de más de cinco millones de libros por parte de Google puede convertirse en una poderosa herramienta para analizar cuantitativamente tendencias culturales, uso de léxico, cambios gramaticales, censura, o la fama relativa de diferentes personajes.
Cuando un satélite espacial logra construir el mapa de las anisotropías de la radiación de fondo de microondas, lo hace como herramienta para poder investigar el pasado del Universo. Si un neurocientífico diseña una nueva técnica histológica que le permite dibujar un conectoma y mapear el cableado neuronal del cerebro humano, no lo hace en busca de bonitas imágenes sino también como una nueva herramienta de investigación. Y cuando los genetistas empiezan a acumular genomas de organismos como el orangután, el perro, el Homo sapiens, o la mosca de la fruta; los utilizarán como herramienta para encontrar similitudes, diferencias, o datos inesperados que arrojen luz sobre nuestra evolución, características físicas, o pistas para curar enfermedades.
Una osada analogía
En una osada analogía con la genómica, investigadores de Harvard creen que la digitalización de 500.000 millones de palabras contenidas en más de cinco millones de libros realizada por Google, convertirse en una especie de “registro fósil digital de la cultura humana”; una herramienta de análisis cuantitativo que en manos de lingÁ¼istas, historiadores y sociólogos permita ver nacer una nueva disciplina llamada culturómica, cuyos primeros resultados empezarán a llegar en los próximos meses.
Una gran diferencia respecto telescopios espaciales o secuenciadores de ADN es que cualquier persona conectada a internet puede empezar a manejarla. Juguemos: Introduciendo “soccer” en el visor de Google Books Ngram puedes ver en qué momento empezó a hacerse popular el fútbol en Estados Unidos. Y escribiendo palabras entre comas como “Mexico, Spain”, descubrirás qué país ha ido ganando relevancia a lo largo del tiempo, y cual perdiéndola.
Escribiendo palabras como “Mexico, Spain”, descubrirás qué país ha ido ganando relevancia a lo largo del tiempo, y cual perdiéndola.
Para la mayoría de usuarios esta aplicación significará sólo un divertimento más para comparar la fama de sus personajes favoritos, o ver en qué momento de la historia empezó a utilizarse una determinada palabra. Pero para los investigadores que han participado en la elaboración de esta herramienta, sus posibilidades son mucho más ambiciosas. “Hemos estado preguntándonos sobre la cultura humana y la construcción de nuestras sociedades desde mucho antes de la llegada de la ciencia”, dice el investigador de Harvard Jean-Baptiste Michel, uno de los líderes del proyecto. “Pero curiosamente, no creo que nunca hayamos dispuesto de una manera cuantitativa de abordar estas cuestiones. Esta herramienta nos permitirá analizar aspectos de la cultura humana de una manera reproducible, y que nos podrá ofrecer conclusiones muy interesantes”.
Un ámbito por definir
El ámbito y posibilidades de la culturómica todavía está por definir. Uno de los autores del artículo publicado en Science, el lingÁ¼ista Stephen Pinker, habla de “descubrir la materia oscura del léxico que no estaba presente en diccionarios”, de analizar si la fama de las celebridades es más efímera ahora que hace 50 años, o de descubrir cuantas nuevas palabras se generan cada año. Por ejemplo, parece que el idioma inglés acumula 8.500 nuevas palabras cada año, pero pocas de ellas aparecen en los diccionarios.
Todo esto ya se podía investigar de una manera más convencional, pero la base de datos creada por Google Books (el 4% de todos los libros que han sido impresos a lo largo de la historia) permite hacerlo con una dimensión hasta ahora imposible.
Las primeras críticas no han tardado en llegar. Algunos lingÁ¼istas apuntan a errores derivados de la falta de contexto, expresiones que pueden ser construidas de diferentes maneras, o dudas sobre si realmente pueden representar la historia cultural. Otros se muestran disgustados con el término culturomics, y lo consideran un exceso de frivolidad. Los creadores de la herramienta defienden su simplicidad: cualquiera puede introducir la palabra “racism” o “sexism” y ver en qué momento de la historia empezaron a cobrar más relevancia pública. Pero sobre todo resaltan que se trata sólo del comienzo; una especie de genoma cultural en el que empezaremos a rastrear en busca de datos lingÁ¼ísticos o evolución del lenguaje.
Como en cualquier ciencia nueva, de momento con esta herramienta sólo han dado un primer paso. Pero sin duda ofrece la posibilidad de hacer un tipo de análisis estadístico sobre influencias culturales inexistente hasta el momento. Quizás con esta herramienta, un día podremos comprobar la asimilación o fracaso del propio término culturomics.