Google lo sabe todo. Sabe demasiado. Recuerda al colega sabelotodo que te acaba las frases. Pedantería en estado puro. Ya no es que sepa cosas, es que sabe de ti. Antes no era así. Cualquier búsqueda en Google hace unos años arrojaba unos resultados asépticos. De enciclopedia digital. Eran datos sobre la cuestión en concreto. Datos desparramados en enlaces. ¿”Pizza”, “pancakes” o “Rafa Nadal”? Te devolvía una lista de enlaces. Búscate la vida.

Sin embargo, si lanzas la misma búsqueda hoy… te sorprenderá con un mapa y las pizzerías a tu alrededor, las mejores recetas de pancakes o el resultado en directo de Rafa Nadal. Google sabe, no lo que dices, sino lo que quieres decir. Se empieza a parecer más a mamá que a tu amigo sabihondo. No querías resultados del origen de la “pizza” sino “pizzerías cercanas”. Él lo sabe. Escribiste “pancakes” por pereza cuando lo que querías expresar era “mejores recetas de pancakes». Ahí están las recetas. Y, evidentemente, no pusiste “Rafa Nadal” esperando un link a Wikipedia con su biografía, sino con el fin de darle seguimiento a esos cuartos de final del Open de Australia. Ahí tienes el resultado. “Actualizado hace un minuto”, te recuerda Google.

Google además es cuidadoso, tiene su inteligencia emocional, sabe que no es lo que te conteste sino cómo te conteste: las pizzerías mejor en mapa, las recetas son más fáciles de seguir en vídeo y los resultados deportivos siempre en marcador. Minuto y resultado. ¿Cómo Google sabe tanto y por qué sabe tanto? ¿cómo ha conseguido posicionarse como nuestra enciclopedia 24/7? ¿cuáles son sus fuentes y cómo ha aprendido tanto en estos años? ¿ha aprendido más cosas o ha aprendido de nosotros? Vamos allá.

La clave: estás programado y eres hackeable.

«Los datos sólo son información», he oído algunas veces. La realidad es que la información son sólo las piezas del Lego, una unidad mínima o la parte más pequeña e indivisible de todo el tinglado. Esta es la visión inocente para los profanos en la materia.  Cuando hablo de datos o Data me refiero a la recopilación, relación, organización y almacenamiento de la información para procesarla generando conocimiento. Conocimiento generado por un sistema formado por algoritmos que tiene la capacidad de «auto-aprender» (cambiando y ajustando los algoritmos a medida que procesa la información y conoce el entorno). Auto-aprender qué información tiene que ofrecerle al cliente y de qué manera para producir en el cliente una determinada conducta. Machine learning, lo llaman por ahí.

Como las recomendaciones de contenido que te ofrecen YouTube o Netflix. Ambos tiene un objetivo: que no te apartes de la pantalla. Con este fin el algoritmo de recomendación de Netflix sabe lo que te va a gustar y qué ofrecerte. Lo sabe con una probabilidad: la serie A coincide un 95% con tus gustos, la serie B un 80%. A medida que vas viendo series, tus gustos e intereses se modifican. Su algoritmo lo detecta, va aprendiendo qué y cómo te influye y automáticamente actualiza lo que sabe de ti. De la misma forma, Cambridge Analytica mostró publicidad acorde a los debilidades de cada ciudadano para decantar el voto hacia la campaña de Trump o favorable al Brexit.

El conocimiento sobre ti unido al conocimiento de la neurociencia permite cambiar una percepción de una empresa, impulsar un comportamiento de compra, modificar un voto o romper una idea profundamente arraigada. Resumiendo, para conseguir hackearte, sólo hacen falta tres cosas: conocimientos de neurociencia, una gran capacidad informática y muchos datos . Y tú sólo tienes influencia en el último punto, por tanto, si los Gobiernos y/o las empresas logran hackear o piratear el sistema operativo humano, las personas más fáciles de manipular serán aquellas que crean en el libre albedrío.

Yuval Noah Harari expone que la tecnología ha avanzado hasta el punto en que muchas de nuestras creencias más cercanas están siendo desafiadas, no por ideas filosóficas, sino por tecnologías prácticas. Durante más de 10 años Harari ha expuesto lo que ahora han demostrado experimentos neuropsicológicos tras medir la actividad neuronal: el libre albedrío y la gestión individual consciente no existe. No tenemos libertad en nuestra toma de decisiones. Lo que creemos decidir, ya lo decidió el cerebro. Y un posible sistema que conozca cómo funciona el cerebro humano y con qué datos se ha construido su pensamiento podría piratear el sistema con los inputs adecuados generando nuevos patrones de conducta. Ese sistema podría comprenderte mejor de lo que te entiendes a ti mismo y, por lo tanto, podría manipularte, mejorarte o reemplazarte.

Los seres humanos sólo estamos procesando información dentro de un mapa mental que da lugar mecánicamente a nuestro comportamiento. Entonces, las decisiones que creemos que estamos tomando y decidiendo conscientemente, en realidad es solo una ilusión que puede reducirse a lo que nuestro cerebro nos dice que hagamos

Hannah Crichlow, neurocientífica de Princeton y autora The Science of Fate

Lo que Harari llama “Hacking Humans” o la manipulación de nuestro libre albedrío puede tener graves riesgos. La tecnología a día de hoy tiene la capacidad de afectar a la gente a gran escala. Por eso Google, como otras grandes empresas, tienen un rol de design ethicist o diseñador ético en lo referente a algoritmos. Es el caso de Tristan Harris que aparece en The Social Dilemma, antiguo design ethicist de Google graduado en Stanford en ética de la persuasión. ¿Se puede persuadir con ética? En cualquier caso, es la única manera moral de hacerlo. «Ética» y «Filosofía», esas asignaturas que nunca supiste qué pintaban en tu plan de estudios (tú querías ser ingeniero, ¡esas son asignaturas para gente de letras!) y que ahora son determinantes para construir una sociedad mejor o acabar en el mundo feliz de Aldous Huxley, adoctrinados y pastoreados por una tecnopedia (como la hipnopedia pero educados a través de la tecnología en lugar del sueño).

La ética marcará el futuro de las corporaciones y de las sociedades sin embargo, aquí en España, la ley Wert y ahora la ley Celaá lanzan la enésima pedrada sobre este sistema mal llamado «educativo» carente de ética y filosofía, bases del pensamiento crítico y por tanto de la educación plena. Mientras tanto, la Unión Europea ha asignado a la Ética un papel central en su política de investigación científica e innovación tecnológica (desde el programa Horizonte 2020, todas las investigaciones e innovaciones tecnocientíficas deben incluir un análisis crítico de sus implicaciones éticas, sociales y ambientales). ¿Quién teme a la ética?

Para conmover a los más escépticos recomiendo este artículo de Harari «Why Technology Favors Tyranny«. Hitler no podía construir un mensaje a medida para cada una de las debilidades de cada cerebro. Ahora sí es posible. No es Black Mirror, es el mundo de los datos. El llamado oro del siglo XXI.

Google

Google se fundó hará poco más de 22 años, en 1998, con dinero de amigos y algunos inversores (Jeff Bezos, entre ellos). Internet y el mundo ha cambiado mucho desde entonces pero todavía a día de hoy si buscáis en Google «Google in 1998» os devolverá resultados con la imagen que tenía en 1998.

Google en 1998 cuándo sólo contaba con información de la “open web”

Google en 1998 cuándo sólo contaba con información de la “open web”

En 2011, Google arrancó el proyecto Google Brain, un proyecto de investigación y desarrollo de aplicaciones prácticas de la inteligencia artificial (IA). Y la cosa fue a tope, en 2012 ficharon a Raymond Kurzweil como director de ingeniería y dos años más tarde adquirían la startup especializada en sistemas de IA DeepMind. Y en 2015 ya teníamos algo que nos afecta a lo que se relata en este artículo: nació RankBrain, un sistema de inteligencia artificial basado en redes neuronales para interpretar las consultas de los usuarios. Lo que hace RankBrain es relacionar la página web con los conceptos del contexto incluso cuándo la página web no menciona explícitamente los conceptos. Por ejemplo, los conceptos «napolitana», «margarita» o «tropical» están relacionados con pizza (más abajo en «Conocimiento común y cálculos» contaré de dónde saca Google la información de los conceptos). Desde entonces, Google no ha parado de evolucionar el desarrollo de la inteligencia artificial (y las redes neuronales), el año pasado publicaban su sistema Google Neuronal Matching un sistema para contextualizar palabras según la frase que las contiene. Por ejemplo, en la frase «quiero cambiar una bombilla», «cambiar» significa «reemplazar» mientras que en la frase «quiero cambiar el brillo de la pantalla», «cambiar» significa «reajustar». En estos dos productos de inteligencia artificial la diferencia radica en que RankBrain relaciona las páginas con los conceptos y Google Neuronal Matching relaciona las palabras con las búsquedas. Todo va de relaciones. Y todavía no hemos relacionado las búsquedas con lo que Google sabe de ti.

Google introdujo en 2018

Google introdujo en 2018 «neuronal matching»

Vamos a poner un ejemplo práctico para entender como funcionan las redes neuronales. Fijémonos en lo que sabe tu mamá de la pizza y de ti. Sabe lo que es una «pizza», un objeto comestible, generalmente redondo, con una base de ingredientes de masa de harina y levadura, queso mozzarella, tomate y orégano, que se sirve caliente y que es un plato popularizado en la ciudad (es relativamente fácil encontrar una pizzería o comprar los ingredientes para realizarla). Ella sabe que hay muchos tipos de pizza: margarita (sabe que realmente es la única, la verdadera), napolitana, siciliana, tropical (opina muchas cosas de la tropical que no expondremos aquí). Tu mami evidentemente sabe de la relación existente entre la pizza y tú, sabe que, en general, te gusta mucho, aunque obviamente unas más que otras, según el tipo de pizza y según la pizzería, que sueles cenar pizza tres veces al mes (siempre fuera de casa, normalmente el fin de semana), que te gustan especialmente las que realiza la pizzería de la esquina de tu casa (sabe dónde vives y sabe las pizzerías que merodean alrededor de tu cueva). Sabe que tu preferida es la napolitana y que, en concreto, le das 5 estrellas a la pizza napolitana de la pizzería de la esquina. Además sabe los horarios de las pizzerías y en concreto (como siempre le hablas de la de la esquina) sabe que la pizzería de la esquina cierra los martes por descanso del personal. Por todo esto, si un sábado llamas a tu madre a las 21h y te pregunta qué vas a cenar  y tu contestas, «¿Pizza?», ella te dirá «¿Y si vas a la pizzería de la esquina de tu casa, esa que hace la Napolitana que tanto te gusta?». 

Tu mamá acaba de relacionar y contextualizar en cuestión de milisegundos toda la información que tiene de ti y del concepto «pizza». Transformando información en conocimiento y generándote información relevante a tu última pregunta. Google funciona igual. Sin quererte tanto.

Ejemplo ilustrativo gráfico y esquemático de relación de información en una red neuronal para el término

Ejemplo ilustrativo gráfico y esquemático de relación de información en una red neuronal para el término «pizza». Nuestras más sinceras disculpas a todos los data-scientists.

¿Qué tienen que ver tu mamá y Google? Pues que tu madre lleva toda tu vida recopilando información sobre ti, de lo que te gusta y lo que no, de qué recomendarte y cómo guiarte por la vida. Google sólo unos años y ¿sabes qué? Confías más en Google que en tu mamá. Sí, ahora es cuando empiezas a entender a Yuval Noah Harari y todo eso de que cuidado con la tecnología y la inteligencia artificial, lo de hackearte y conocerte mejor que a ti mismo. Volvamos a Google. Para entender cómo Google ha conseguido esto, hay que ir al grano en dos temas clave:

  • (1) Las fuentes de información de Google
  • (2) Cómo Google organiza la información y la presenta

Las fuentes de información de Google

1. Lo que Google aprende por su cuenta

La información que obtiene de forma automática, esta información es información contenida en páginas webs de la denominada «open web» y también es información de hechos conocidos de la humanidad y de conceptos, términos o entidades que Google consulta en páginas de licencia abierta o que le proveen otras empresas privadas.

1.1. Información de la «open web»

Ya conoces los resultados de Google: esos enlaces azules ordenados por páginas y seguidos de una breve descripción, incluso a veces estos resultados ramifican en más enlaces hacia subsecciones de la página.

Después del Dato indexado en la red de búsqueda de Google

Después del Dato indexado en la red de búsqueda de Google

Estos enlaces llevan a páginas web que Google ha detectado y registrado siguiendo las instrucciones proporcionadas por los desarrolladores o las personas que gestionan dichas páginas web. Estas son las denominadas “open webs” o webs indexables y accesibles, en contraposición a la denominada “deep web”.

Los propietarios de estos sitios tienen el control para decirle al rastreador de Google (aka Googlebot) qué páginas debe rastrear e indexar, e incluso indicar qué partes de una página deben aparecer como un fragmento de texto cuándo se realice una búsqueda en Google. Con estas herramientas de Google, los creadores o desarrolladores de las páginas web deciden si quieren ser descubiertos por Google e incluso mejorar la presentación de su web si se realiza una búsqueda relacionada. Evidentemente esto se hace con el objetivo de obtener más tráfico gratuito de personas que buscan la información y/o los productos/servicios que se ofrecen en la página web. Cada día Google envía visitantes a más de 100 millones de sitios web diferentes.

1.2. Conocimiento común y cálculos

Aunque empresas de todos los tamaños y personas creativas trabajan para generar contenido, productos y servicios únicos también hay información que pertenece a la categoría de “conocimiento común”: información que no fue creada de manera única o que no «pertenece» a ninguna persona, sino es un conjunto de hechos conocidos o fruto de un cálculo. La fecha de nacimiento de Napoleón, la altura del Mont Blanc, la hora exacta en Londres o la raíz cuadrada de 348. Por tanto hay dos tipos de lo que Google considera “conocimiento común”:

  1. El derivado del resultado de cálculos. Es información que Google calcula directamente como por ejemplo las horas de salida y puesta del sol para cada ubicación en función de la latitud y la longitud.
  2. Los hechos conocidos. Esta información está indexada de fuentes externas.

Google indexa esta información de hechos conocidos de fuentes de licencia abierta como pueden ser Wikipedia, The Encyclopedia of Life, Johns Hopkins University CSSE COVID-19 Data, Data Commons Project, o una base de datos de conocimiento abierto de datos estadísticos que comenzaron en colaboración con U.S. Census, la oficina de estadísticas laborales (Bureau of Labor Statistics), Eurostat, el Banco Mundial y muchos otros.

1.3. Contratos y partnerships

¿Cómo organizar y contextualizar palabras y frases sueltas que Google encuentra en las páginas web? Esto es lo que se conoce como datos no estructurados. Para que los sistemas automatizados de Google puedan contextualizar, organizar y presentar hechos contextualizados y en formatos útiles deben pasar estos datos por bases de datos estructuradas, como las bases de conocimiento público de Wikidata que permite de forma automática interrogar sobre lo que denomina “declaraciones” (statements).

Un statement de Wikidata

Un statement de Wikidata

Por ejemplo si ejecutamos esta petición a Wikidata (copiamos y pegamos esta URL en el navegador): https://www.wikidata.org/w/api.php?action=wbgetentities&sites=enwiki&titles=Berlin&props=descriptions&languages=en&format=json

Nos devolverá información sobre Berlín en formato JSON así:

Respuesta de Wikidata a la consulta sobre Berlín

Respuesta de Wikidata a la consulta sobre Berlín

Analicemos la petición que realiza la URL:

  • http://www.wikidata.org/w/api.php es la URL principal de acceso a la API.
  • action = wbgetentities le dice a la API que desea ejecutar una acción de obtener datos de entidades.
  • sites = enwiki significa obtener los datos de Wikipedia en inglés.
  • títulos = Berlin indica el título de la página para obtener datos.
  • props = descriptions indica qué propiedades o características debe obtener de las entidades, en este caso la descripción de las entidad.
  • languages = en significa filtrar los resultados al idioma inglés.
  • format = json indica que los resultados se desean en el formato de salida JSON.

Si se modifican estos parámetros se puede consultar cualquier cosa registrada en Wikidata, por ejemplo ejecutando la siguiente URL en el navegador obtendremos información en español para la ciudad de Sevilla:

https://www.wikidata.org/w/api.php?action=wbgetentities&sites=eswiki&titles=Sevilla&props=descriptions&languages=es&format=json

Para algunos tipos de datos concretos, como los resultados deportivos, la cartelera o la parrilla televisiva y letras de canciones, existen proveedores que organizan la información en un formato estructurado y ofrecen soluciones técnicas (APIs como la de Wikidata) para ofrecer información actualizada (muy actualizada, esto es clave) y estructurada. Google trabaja con licencias específicas para explotar los datos de estas empresas y con ello garantizar que cuando buscas, en tiempo real, cómo va el derbi entre el Atleti y el Real Madrid puedas obtener el resultado actualizado hace pocos segundos.

Para temas de información sensible (como pueden ser temas de salud o de participación cívica) donde es fundamental que la información esté contrastada y provenga de una autoridad competente, según Google trabajan con organizaciones como las autoridades de salud locales, como la CDC en los EE. UU. (Centers for Disease Control and Prevention) y organizaciones no partidistas y sin ánimo de lucro como Democracy Works.

1.4. Información y conocimiento generado a través de IA y machine-learning

A través de la inteligencia artificial y el machine-learning (aprendizaje automático, un subconjunto de la disciplina de inteligencia artificial), Google ha desarrollado formas innovadoras de obtener conocimiento. Por ejemplo la función Popular Times ayuda a medir las multitudes por ejemplo para visitar el supermercado local cuando hay menos gente. 

«Popular times» de Google. Predice en tiempo real la ocupación de un lugar durante todo el día.

Estas estadísticas de Google pueden ser de ayuda para tener en cuenta las aglomeraciones en tiempos de COVID19. Google también ha trabajado otras situaciones de crisis, desde mapas de incendios forestales basados ​​en datos de satélites hasta pronósticos de inundaciones generados por inteligencia artificial, para ayudar a las personas a mantenerse fuera de peligro cuando ocurre un desastre.

2. Lo que las personas y las empresas le contamos a Google

¿Y la información que NO está disponible en la “open web” ni a través de contratos con terceros o que no puede obtenerse por análisis predictivos? Entonces Google no la puede obtener a no ser que las personas y las empresas se la faciliten. Evidentemente ahí nace el interés de Google por fomentar y persuadir a personas y empresas a proporcionar dicha información a Google a cambio de visibilidad o una mejor experiencia de usuario. 

2.1. Las empresas y Google MyBusiness

Los negocios locales pueden reclamar su perfil comercial (Google MyBusiness) y así aparecer en la red de búsqueda de Google aunque carezcan de sitio web. Cada mes, en promedio, estos resultados de búsqueda locales generan más de 2 mil millones de visitas a sitios web de empresas, así como llamadas telefónicas incluyendo pedidos de comida y reservas.  Recordemos que, de esta manera, Google ya cuenta con la localización del negocio y el navegador tiene mi ubicación aproximada. Por tanto, Google ya es capaz de ofrecerme los negocios a mi alrededor que puedan ser de mi interés.

Información de

Información de «El Aquanauta» en Google MyBusiness

Sin embargo la información local cambia constantemente. Por ejemplo, a raíz de COVID-19 se han modificado horarios e incluso muchas empresas han cerrado parcial o totalmente. Google se ha visto obligado a comunicarse con las empresas y actualizar todo tipo de detalles como pueden ser los horarios o si ofrecen comida para llevar o servicio de entrega a domicilio. Desde que arrancó la crisis COVID-19 Google ha realizado más de 3 millones de actualizaciones en empresas como farmacias, restaurantes y tiendas de comestibles que ya se han visualizado más de 20 mil millones de veces en Google Maps y en su red de búsqueda.

2.2. Los feeds de producto/servicios

Otras empresas como aerolíneas, minoristas y fabricantes también proporcionan a Google datos sobre sus productos e inventario a través de feeds directos (generalmente documentos JSON o XML que las empresas ponen a disposición de Google y las mismas empresas se encargan de tener actualizados para que Google ofrezca y de visibilidad al inventario actualizado) . De esta manera, cuando buscas un vuelo de Barcelona a Madrid, o deseas más información sobre las especificaciones del último televisor de Samsung OLED de 65”, Google puede proporcionarte la información directamente desde la fuente.

Ejemplo de feed para Google Merchant Center

Ejemplo de feed para Google Merchant Center

2.3. Lo que Google sabe de ti

A pesar de que el foco ahora mismo está en Facebook, Google sabe mucho más de la mayoría de nosotros. Cuánto sabe Google de ti depende en cierto grado de tu configuración de privacidad y, sobre todo, de los dispositivos, productos y servicios que usas. Google es el líder indiscutible en la carrera de los gigantes tecnológicos para acumular datos de usuarios (recuerda, el nuevo oro), gracias a su enorme variedad de servicios, dispositivos y porque sigue siendo el líder en el negocio de la publicidad digital (37% frente al 22% de Facebook). Sí, sabe todo lo que has escrito en su buscador y todos los videos que has visto en YouTube.

Pero esto es sólo el principio. También puede saber dónde has estado, qué has comprado y con quién te comunicas. Básicamente Google sabe:

  • Tus búsquedas.
  • Los vídeos que miras en YouTube.
  • Información de voz y audio, es decir, lo que dices cuando usas funciones de audio en Android o mediante dispositivos de hogar controlados por voz de Google.
  • Tu actividad de compra online e incluso offline si la empresa tiene actividad online y tiene digitalizada la ficha de cliente por medio de un identificador común como por ejemplo tu email.
  • Personas con las que te comunicas o compartes contenido.
  • Tu actividad en sitios y aplicaciones de terceros que utilizan los servicios de Google.
  • Los anuncios y el contenido que ves en las páginas web que usan la red o la tecnología de Google, así como las interacciones con ese contenido.
  • Tu historial de navegación de Chrome que sincronizaste con tu cuenta de Google.
  • Datos de ubicación, que Google puede recopilar directamente a través de datos GPS o inferir de otros sensores y datos, incluidas direcciones IP, routers Wi-Fi cercanos y sensores Bluetooth.

NOTA: Google solía usar el contenido de tus correos de Gmail para personalizarte la publicidad pero ya no lo hace porque, según ellos, los otros datos que tiene de ti son más eficientes.

Douglas Schmidt de la Universidad de Vanderbilt hizo un estudio en 2018 dónde refleja que los servicios de Google y Chrome están enviando masivamente datos a Google incluso cuando el usuario no realiza ninguna acción, incluidos los datos de ubicación (asumen que no has elegido no compartir dicha información). Y casi la mitad de los datos no son consumidores que han elegido hacer uso de un servicio de Google sino que provienen de la interacción de personas con marcas a través de los servicios de Google para anunciarse.

Ubicación, ubicación, ubicación

Dejar que Google rastree tu ubicación le permite saber dónde trabajas y dónde vives, predecir cuándo debes salir de casa e incluso decirte cuándo necesitas un paraguas. Intrínsecamente esto le da a Google una imagen increíblemente detallada de nuestras vidas. Esta imagen crecerá a medida que adquiramos productos de Google de su gama de hardware (cámaras Nest, termostatos, Google Home Hub o su móvil «Pixel») que añadirán más cámaras y micrófonos a tu vida.

A Google le gustaría conocer tu ubicación actual

A Google le gustaría conocer tu ubicación actual

Agrupando todos estos datos de cada uno de nosotros, Google obtendría una foto acertada de cómo somos, qué rutinas tenemos, con quién nos relacionamos y lo que nos interesa o preocupa en cada momento así como nuestro estado de ánimo. Sí, te podría conocer como si te hubiera parido. Si además agrupa los datos de grupos de usuarios obtiene perfiles sociológicos. Por ejemplo, sólo para el caso de las búsquedas en Google, Google Trends es un maravilloso ejemplo de ello. Google Trends recoge cada año las preocupaciones o intereses de las personas reflejado en las búsquedas que han realizado en Google. Ojo, los datos que muestra Google Trends son datos relativos, no valores absolutos, por lo que no podremos saber qué volumen de la población (exactamente) tiene interés por un determinado tema. Para saber más os recomiendo el artículo de Alberto Rodríguez, ¿cómo funciona Google Trends y como interpretar sus datos?

Y como somos animales de costumbres y además dados unos patrones culturales y un ámbito geográfico todos nos parecemos mucho, Google aplica estos principios en su autocompletador. Utiliza nuestro historial de búsquedas, nuestro idioma y lo que ha buscado gente cercana a nosotros relacionado con lo que ya hemos puesto para ayudarnos a completar la búsqueda. Si no tiene información (por ejemplo, estamos en modo incógnito) mostrará las tendencias populares.

Autocompletador de Google en modo incógnito en Islas Baleares

Autocompletador de Google en modo incógnito en Islas Baleares

Esto puede generar disonancias de conceptos y polarización de la sociedad como puede verse en el documental The Social Dilemma. Google no te está ayudando a autocompletar para que llegues a la verdad contrastada sino con lo que buscaron personas afines a ti. Por tanto, lo normal es que acabes buscando con los mismos términos que la gente que se parece a ti al dejarte llevar por el autocompletado, llegando, por tanto, a las mismas páginas que han consultado los que son afines a ti y reafirmando las mismas ideas. Al margen de si podrías estar equivocado. En The Social Dilemma, el co-inventor de Google Drive, Gmail Chat y algunas de las funciones más populares de Facebook explica que si buscas en Google el término «el cambio climático es», se muestran diferentes resultados en el cuadro de autocompletar, no según los hechos, sino según tu ubicación y los datos que Google tiene de ti. Por tanto, a muchas personas se les autocompletará la búsqueda con los peligros del cambio climático y a otras con la falsa alarma del cambio climático… y todo en función de lo que ya pensaban antes y lo que piensa la gente que les rodea. La pescadilla que se muerde la cola aunque neurocientíficamente maravilloso pues nos produce satisfacción el saber que tenemos razón y reforzarnos en nuestros razonamientos. A tu cerebro no le importa la verdad sino tener razón y Google podría ser ese amigo que siempre te da la razón. Es un amigo que dura lo que tardan en llegar los problemas.

Lo cuenta Barack Obama en la entrevista concedida a David Letterman:

En una especie de experimento durante la revolución acontecida en Egipto, se escogió a un liberal, un conservador y un llamado «moderado» y se les solicitó que hicieran una búsqueda en Google:

– Escribid «egipto».

Lo hicieron. El conservador obtuvo respuestas relacionadas con la «Hermandad Musulmana» (o los «Hermanos Musulmanes»), el liberal obtuvo respuestas relacionadas con la «Plaza Tahrir» (el lugar dónde estaban teniendo lugar las protestas públicas masivas en El Cairo) y para el moderado Google sugirió «Lugares de vacaciones en El Nilo»… Cualquiera que fuera tu sesgo o tus prejuicios, hacía allí te encaminaba Google.

2.4. Lo que le cuentas a Google

Google persuade a las personas para que compartan sus conocimientos y valoraciones sobre los lugares (si te molesta que Google haga esto, aquí tienes los pasos a seguir para que Google Maps no te solicite escribir reseñas de los sitios que visitas). Gracias a millones de contribuciones enviadas por los usuarios todos los días, desde reseñas y calificaciones hasta fotos, respuestas a preguntas, actualizaciones de direcciones y más, Google actualiza la información local en su red de búsqueda y Google Maps.

Cómo Google organiza la información y la presenta

Google quizá sea tu amigo pero sobre todo es una empresa. Una empresa que si no te da el mejor resultado posible a tus consultas deja de ser relevante para ti. Si deja de ser relevante ya no es tu referente de consulta. Si deja de ser tu referente, si deja de ser la página de consulta de millones de personas, si deja de ser su amigui-que-todo-lo-sabe en el bolsillo deja de centralizar gran parte del tráfico de Internet. Si esto sucede, viene el drama. Porque nadie quiere anunciarse en una página donde nadie consulta nada. Y en un negocio como el de Google que más del 80% de los ingresos provienen de la publicidad, la publicidad es la clave para que la rueda siga girando. El 80% de los ingresos en un negocio que en 2019 generó $148.000M es mucho mucho dinero. Bien vale la pena darte siempre la mejor respuesta posible a tu consulta. Ni Android, ni Píxel, ni Chrome, ni Google Home, ni Waymo. Aquí la gallina de los huevos de oro que sostiene todo el tinglado es la publicidad.

¿Cuánto facturó Google este año?

¿Cuánto facturó Google este año?

Por tanto, está muy bien tener datos, pero al final, lo que cuenta para que vuelvas, para que siempre vuelvas, para que todo lo busques en Google, ya no es responderte con lo que sea que estás buscando sino resolverte, adivinarte, lo que sólo intuías que buscabas y responderte en un formato que ni sospechabas que era exactamente lo que necesitabas. Porque el negocio que genera necesidad no quiebra nunca y todos las culturas han tenido su oráculo. ¿»Pizza»? Listado de pizzerías en mapa a tu alrededor, ¿»pancake»? Recetas de pancake en vídeo con reseñas de 5 estrellas ¿Rafa Nadal? Resultados en marcador del Open de Australia actualizados hace 1 minuto. 

Google organiza, prioriza y selecciona su respuesta para que vuelvas. Cuándo realizas esa búsqueda de «pancake», Google puede tener indexadas miles de millones de páginas webs que tienen relación con el término «pancake». Tiene que contestarte rápido, muy rápido para que te siga pareciendo un servicio genial. No basta con haber recopilado una ingente cantidad de información, tiene que tenerla  organizada, interpretada y conocer de antemano cómo mostrarte los resultados de manera que lo que obtengas, sea lo que necesitabas.

Búsqueda de

Búsqueda de «pancakes» en Google en 2012 y en 2020

Buscabas «pancake» en 2012 y básicamente Google te devolvía enlaces a páginas web. Ahora, encuentras enlaces de recetas, vídeos, datos sobre “pancakes”, información nutricional, restaurantes que sirven “pancakes” y algunas cosas más. La forma en que Google organiza e interpreta la información no deja de evolucionar, especialmente a medida que dispone de nuevos formatos de contenido y de nueva información (la que recopila por su cuenta y sobretodo la que va obteniendo sobre ti).

Google utiliza tres principios básicos:

  1. Organiza la información mediante lo que llama «formatos enriquecidos» en función del tipo de información. Si buscas trabajo, querrás ver un listado de puestos acorde a tus capacidades mientras que si buscas un restaurante diferentes opciones en un mapa te será más útil en tu elección. Presentar la información en un carrusel de imágenes o un mapa ayuda a encontrar la información más relevante y útil. Google ha comprobado que las personas pasan más tiempo en las páginas web que encuentran a través de estos formatos que a través de los enlaces clásicos.
  2. Organiza la información de tal forma que sea fácil navegar y profundizar. Igual que sucede con «pizza», «pancake» o «Rafa Nadal», la mayoría de las búsquedas no tienen una respuesta única, a menudo son preguntas abiertas como «ideas para postres». Google intenta que sea fácil e intuitivo refinar tu búsqueda a medida que avanzas. Por ejemplo, si buscas «merengue», es posible que veas una lista de temas relacionados junto con preguntas relacionadas que otras personas han hecho. Él aprende de ti y de millones de usuarios el proceso humano a seguir para generar un resultado concreto desde pregunta abiertas.
  3. Organiza la información de forma que los resultados que devuelve puedan priorizarse en función de la situación e intereses del usuario. Para que todo lo que sabe sea realmente útil para ti, debe ordenar priorizando la información más fiable y útil. La base de su sistema es una comprensión profunda de la información, desde el idioma y el contenido visual hasta el contexto, como el tiempo, el lugar y lo que sabe de ti, lo que le permite seleccionar los resultados más relevantes y de mayor calidad disponibles que coincidan con tu intención de búsqueda.

En los casos en los que hay una única respuesta, como por ejemplo: «¿En qué año se celebró la primera gala de los Oscar?», el año concreto es el resultado más útil, por lo que aparecerá en la parte superior de la página. Fin. Pero normalmente las consultas pueden tener muchas interpretaciones. Si buscas «pizza»; es posible que estés buscando restaurantes cercanos, opciones de entrega, recetas de pizza o muchas más. Clasificar una receta de pizza como lo más relevante tiene sentido, pero Google ha aprendido que es más probable que las personas que buscan «pizza» busquen restaurantes, por lo que enseñará un mapa con los restaurantes locales. Compara esto con una consulta del tipo “pancake», donde encontrarás que es más probable que las personas busquen recetas, por lo que las recetas a menudo tienen una clasificación más alta y un mapa con restaurantes que sirven pancakes puede aparecer más abajo en la página.

Comparativa de resultados de la búsqueda

Comparativa de resultados de la búsqueda «pizza» y la búsqueda de «pancake» en Google

Conclusión

No es magia, es una enorme cantidad de información entrelazada y contextualizada convirtiendo esta información en conocimiento. Conocimiento del mundo, de ti y de mí, de las culturas y de las sociedades. ¿Es bueno, es malo? Bueno, Google nunca te ha engañado. Es su misión: organizar la información del mundo para que todos puedan acceder a ella y usarla. Y tú has aceptado todos los términos y condiciones de sus productos. Pero son tus datos, tú consientes o no consientes. Sólo ten en cuenta que tu información, tus hábitos, tus rutinas y comportamiento, tus debilidades y fortalezas, tus necesidades y con quien te relacionas forman parte de la «información del mundo» y es tu responsabilidad lo que haces con esta información. Y por último, por favor, no seas inocente, Google no siempre va a contarte la verdad, ni a resolverte las grandes incógnitas de la humanidad. Sólo en la ética y la filosofía encontrarás las respuestas a las grandes preguntas de la vida. Google te dirá lo que quieres escuchar, lo que haga falta para que siempre vuelvas y sigas buscando.

Un buen amigo nunca lo haría, tu mamá tampoco.

¿Vas a pedir un Google Home a los reyes magos?

Misión de Google: organizar la información del mundo para que todos puedan acceder a ella y usarla.

Misión de Google: organizar la información del mundo para que todos puedan acceder a ella y usarla.

Términos y condiciones del servicio Google

Términos y condiciones del servicio Google

Bibliografía

[1] – Google blog – Organizing the world’s information: where does it all come from?

[2] – Towards Data Science – Yuval Noah Harari and Fei-Fei Li on Artificial Intelligence: Four Questions that Impact All of Us

[3] – Yuval Noah Harari –Why Technology Favors Tyranny

[4] – Hannah Crichlow – The Science of Fate

[5] – Revista de Prensa – ¿Quién teme a la crítica?

[6] – Wikidata – Retrieve and use data of Wikidata

[7] – Professor Douglas C. Schmidt, Vanderbilt University – Google Data Collection 

[8] – Bloomberg – Google Turning Its Lucrative Web Search Over to AI Machines

[9] – Google blog – How Google organizes information to find what you’re looking for

[10] – Google blog – Acerca de Google

Newsletter