The Internet: How Search Works

Hola, mi nombre es Juan. Lidero los equipos de búsqueda y
aprendizaje automático de Google. Creo que es increíblemente inspirador que personas de todo el mundo recurran a los motores de búsqueda para
hacer preguntas triviales e increíblemente importantes. Por eso es una gran
responsabilidad darles las mejores respuestas que podamos. Hola, mi nombre es Akshaya y
trabajo en el equipo de búsqueda de Bing. Hay muchas ocasiones en las que
comenzaremos a investigar la inteligencia artificial
y el aprendizaje automático, pero tenemos que abordar cómo
van a utilizar esto los usuarios, porque al final del día,
queremos tener un impacto en la sociedad. Hagamos una pregunta sencilla. ¿ Cuánto tiempo se tarda en viajar a Marte? ¿ De dónde provienen estos resultados y por qué aparece este
antes que el otro? Bien, profundicemos y
veamos cómo el motor de búsqueda convirtió su solicitud en un resultado.

Lo primero que necesita
saber es que cuando realiza una búsqueda, el motor de búsqueda en realidad no
accede a la World Wide Web para ejecutar su búsqueda en tiempo real. Y eso se debe a que hay
más de mil millones de sitios web en Internet y
cada minuto se crean cientos más. Entonces, si el motor de búsqueda
tuviera que revisar cada sitio para
encontrar el que desea, tomaría una eternidad. Entonces, para agilizar su búsqueda, los motores de búsqueda
escanean constantemente la web con anticipación para registrar la información que podría
ayudarlo con su búsqueda más adelante. De esa forma, cuando busques
sobre viajes a Marte, el buscador
ya tiene lo necesario para darte una respuesta en tiempo real. Así es como funciona. Internet es una red de páginas
conectadas entre sí mediante hipervínculos. Los motores de búsqueda
ejecutan constantemente un programa llamado Spider que
recorre estas páginas web para recopilar información sobre ellas. Cada vez que encuentra un hipervínculo, lo sigue hasta
haber visitado todas las páginas que puede encontrar en
Internet.

Para cada página que visita la araña, registra cualquier información que
pueda necesitar para una búsqueda agregándola a una
base de datos especial llamada índice de búsqueda. Ahora, volvamos a
la búsqueda anterior y veamos si podemos
descubrir cómo el motor de búsqueda obtuvo los resultados. Cuando preguntas cuánto tiempo se
tarda en viajar a Marte, el motor de búsqueda busca
en cada una de esas palabras en el índice de búsqueda para
obtener inmediatamente una lista de todas las páginas de
Internet que contienen esas palabras. Pero simplemente buscar estos términos de búsqueda podría generar millones de páginas, por lo que el motor de búsqueda debe
poder determinar las mejores coincidencias para mostrárselas primero. Aquí es donde la cosa se vuelve complicada
porque es posible que el motor de búsqueda necesite adivinar lo que
estás buscando. Cada motor de búsqueda
utiliza su propio algoritmo para clasificar las páginas según
lo que cree que desea. El algoritmo de clasificación del motor de búsqueda
puede verificar si su término de búsqueda
aparece en el título de la página, puede verificar si todas las
palabras aparecen una al lado de la otra, o cualquier otra cantidad de cálculos que lo ayuden a determinar mejor qué páginas desea.
ver y cuáles no.

Google inventó el
algoritmo más famoso para elegir los resultados más relevantes
para una búsqueda teniendo en cuenta cuántas otras páginas web
enlazaban a una página determinada. La idea es que si
muchos sitios web piensan que una página web es interesante, entonces probablemente sea la que
estás buscando. Este algoritmo se llama Page Rank, no porque clasifica las páginas web, sino porque lleva el nombre de
su inventor, Larry Page, uno de los fundadores de Google.

Debido a que un sitio web a menudo genera
ingresos cuando lo visita, los spammers intentan constantemente
encontrar formas de engañar al algoritmo de búsqueda
para que sus páginas aparezcan más arriba en los resultados. Los motores de búsqueda
actualizan periódicamente sus algoritmos para evitar que sitios falsos o no confiables
lleguen a la cima. En última instancia, depende de usted
estar atento a estas páginas que no son confiables mirando la dirección web y
asegurándose de que sea una fuente confiable. Los programas de búsqueda siempre están evolucionando para mejorar los algoritmos
y arrojar mejores resultados y resultados más rápidos que sus competidores. Los motores de búsqueda actuales
incluso utilizan información que usted no ha proporcionado explícitamente
para ayudarle a limitar su búsqueda. Entonces, por ejemplo,
si hiciera una búsqueda de parques para perros, muchos motores de búsqueda
le darían resultados para todos los parques para perros cercanos, aunque no haya
escrito su ubicación. Los motores de búsqueda modernos
también entienden algo más que las palabras de una página, también entienden lo que realmente significan
para encontrar la que mejor coincida con lo que estás buscando.

Por ejemplo, si buscas un
lanzador rápido, sabrá que estás
buscando un atleta. Pero si buscas una jarra grande, encontrarás opciones
para tu cocina. Para entender mejor las palabras
utilizamos algo llamado aprendizaje automático, un tipo de inteligencia artificial. Permite que los
algoritmos de búsqueda busquen no sólo letras
o palabras individuales en la página, sino que comprendan el
significado subyacente de las palabras. Internet está creciendo exponencialmente, pero si los equipos que diseñan
motores de búsqueda hacen bien nuestro trabajo, la información que deseas
siempre debería estar a unas pocas teclas de distancia..

As found on YouTube