Indexar una web es el proceso mediante el cual llevamos las páginas de nuestro sitio web a la base de datos de un buscador. En este post vamos a referirnos concretamente a Google pero el proceso es similar para el resto de buscadores (Bing, Yahoo, etc). También puedes necesitar hacer este proceso al contrario pero eso es otro tema.
Un índice es una lista ordenada de capítulos, materias, artículos, etc, clasificado según diversos criterios. El índice de Google es similar al índice de una biblioteca donde se mostraría la información de todos los libros que hay en la misma.
Para indexar una web en Google el buscador enumera (indexa) todas las páginas web que conoce.
Jerarquía de contenidos de las páginas web
Todo sitio web tiene una jerarquía que se debe estructurar en base a la comodidad e intuición del usuario y a su vez fácilmente entendible para los buscadores. Insistimos que debemos tener en cuenta al usuario.
De manera individual nos puede parecer muy fácil navegar por nuestra web pero, debemos tener en cuenta que ese sitio no es para ti sino para la gente que te visita y son ellos los que principalmente deberán sentirse cómodos a la hora de navegar.
De cara al usuario y a nosotros mismos la página más importante es el home pero no deberemos saturarlo con demasiada información. Si el home impide encontrar fácilmente lo que se busca, el usuario se irá a otro sitio.
Contenido jerarquizado para indexar una web en Google
Debemos organizar el contenido en diferentes niveles o capas que a su vez deben estar estructuradas de manera lógica que es como el usuario, en principio, las buscará.
Comenzando por el home (el home también es una página del sitio), un sitio web se compone de diferentes páginas con niveles, de mayor a menor importancia.
Categorías, subcategorías y productos si por ejemplo hablamos de una tienda online; si es un blog tenemos el home, las categorías del blog, etc.
Nuestro objetivo será organizar toda la información disponible de cara a la navegación del usuario, sin perder de vista que una buena estructura hará que Google pueda analizar fácilmente nuestras páginas.
Arañas de Google o Crawler
Entre los términos que tenemos que entender cuando pensamos en indexar una web en Google está el de crawler o araña de Google, término del que oímos bastante cuando empezamos en SEO.
La araña es realmente un software, un robot y probablemente unos super ordenadores que diariamente visitan y analizan miles de sitios web en el mundo.
Cuando publicamos nuestro sitio web este no es conocido para Google, pero cuando avisamos que estamos ahí Google enviará su robot o crawler para analizar y comenzar la indexación de nuestra web.
Ya sea por el sitemap u otros elementos Google va a empezar a navegar empezando por el home, a través de las diferentes páginas internas que tengamos en nuestro sitio.
Google hará este proceso también de forma automática, aunque no le digamos nada, pero podemos acelerar el trámite solicitando la indexación a través de Google Search Console.
Una vez detectada la web el robot llega a nuestro sitio, toma la información y la devuelve al buscador que por lo tanto va a conocer de la estructura, la jerarquía de nuestra web.
A partir de este momento Google va a empezar a navegar por las diferentes páginas, subpáginas, subcategorías que tengamos en nuestro sitio web.
Aquí es donde debemos ponérselo lo más fácil posible a Google pues el motor entra y en pocos segundos conoce las páginas, la estructura y la jerarquía que tiene nuestro sitio.
Elementos adicionales al indexar una web en Google
Elemento a tener en cuenta y de suma importancia es la velocidad del sitio web, si nuestro sitio es muy lento Google va a pensarlo un par de veces antes de volver a navegar en él.
El proceso de indexación es automático, no tenemos que hacer nada, y funciona igualmente para el resto de buscadores.
Otro elemento de importancia son los enlaces internos y los enlaces externos o link building que facilitan mucho el proceso de crawler. No es recomendable tener en nuestro sitio páginas sueltas, que no enlazan con ninguna otra página, o por decirlo de otra forma, un tema que no enlaza con ningún otro tema.
Si las páginas están enlazadas unas con otras, esa conexión nos ayuda a nosotros los humanos y a la vez esa conexión le da la señal a Google para que siga a las otras páginas.
Recordemos que internet en la gran red mundial y precisamente ese es el trabajo de un crawler, enlazar unas páginas con otras, conectar un sitio con otro sitio.
Por ejemplo, si iniciáramos una conversación cualquiera de forma natural un tema nos lleva a otro tema. Esta idea de tono conversacional es importante y podremos sacar provecho de cara a los buscadores. Indican calidad y robustez de nuestro sitio web.
En aras de no hacer esta entrada demasiado larga dejamos la conversación aquí. Continuaremos con otros elementos en otro post.
En este enlace podrás encontrar información oficial que nos brinda Google para describir el proceso y que nuestras páginas se incluyan en los resultados de búsqueda.