Formation référencement naturel – Devenir premier sur Google

Partager sur facebook
Partager sur twitter
Partager sur pinterest

Notions de base de moteur de recherche

Pour devenir un SEO efficace, vous avez non seulement besoin de comprendre les principes des facteurs sur la page et hors page, mais vous devez également comprendre les utilisateurs et comment fonctionne Internet. Cette compréhension vous donne une base solide dans la façon dont la recherche fonctionne et comment les utilisateurs interagissent avec le Web.

De quoi est fait le World Wide Web?
Le web est fondamentalement une collection de pages et de fichiers reliés entre eux par un ensemble complexe d’hyperliens. Ces hyperliens permettent aux utilisateurs et aux moteurs de recherche de naviguer sur le Web pour découvrir de nouveaux contenus. Avant que les moteurs de recherche n’existent, la seule façon de trouver votre chemin sur le Web était de taper l’adresse exacte de la page que vous vouliez ou de cliquer sur les hyperliens qui vous mèneraient à des pages différentes.

Les fichiers peuvent être un certain nombre de choses, y compris:

Images
Vidéos
PDFs
Javascript
Ces fichiers peuvent être utilisés pour améliorer les pages Web afin qu’ils soient plus que du texte brut. Au tout début d’Internet, ces fichiers étaient très difficiles à explorer par les moteurs de recherche, et encore moins à comprendre et à indexer. C’était en partie parce que la technologie d’exploration n’était pas très avancée, mais aussi parce que l’exploration et l’indexation de fichiers autres que le texte et les images nécessitaient beaucoup de ressources que les moteurs de recherche n’avaient pas ou ne pouvaient pas se permettre à ce moment.

En raison de l’amélioration de leurs ressources et de leur technologie, associée à l’introduction de connexions Internet à haute vitesse, les pages Web sont devenues bien plus riches en termes de types de contenu qu’elles peuvent fournir.

Cependant, les moteurs de recherche peuvent encore avoir du mal à explorer et à indexer certains types de contenu. Ils s’améliorent tout le temps et ont apporté des améliorations significatives, mais pour le moment, vous devez être conscients de leurs difficultés. Nous abordons ceci plus en détail ci-dessous dans la section “Problèmes potentiels pour les moteurs de recherche”.

En tant que SEO, vous devez être conscient de ces types de fichiers afin que vous puissiez enrichir les sites Web avec lesquels vous travaillez, ce qui peut finalement donner aux utilisateurs une meilleure expérience. En même temps, vous devez savoir comment ces types de fichiers peuvent causer des problèmes.

Histoire et but des moteurs de recherche
Le World Wide Web a été dominant pendant environ 25 ans et a connu une croissance phénoménale à cette époque. Au début des années 1990, lorsque le Web était jeune, il était beaucoup plus difficile pour un internaute moyen de créer son propre site Web. Les sites Web étaient principalement hébergés par des entreprises ou des amateurs de technologie.

De nos jours, il n’y avait pas de «moteur de recherche» – les sites Web ont été découverts par le bouche à oreille ou l’une des rares pages de type «Quoi de neuf sur le Web? Ce n’était pas très efficace pour commencer, mais au fur et à mesure que le web grandissait au cours des deux prochaines années, il devenait évident qu’une solution s’imposait.

Au cours de 1993/4, les premiers moteurs de recherche Web ont vu le jour suivis au cours des deux prochaines années par de nombreux moteurs commerciaux, y compris Excite, AltaVista et Yahoo !. Le nombre de pages Web et d’utilisateurs a augmenté au point où la découverte du contenu que vous recherchiez simplement n’était plus gérable via une liste centralisée.

Google lui-même a commencé en 1996 et s’appelait BackRub lorsque Larry Page et Sergey Brin ont commencé à travailler dessus. Ils ont été le premier moteur de recherche à réaliser la puissance et le potentiel des hyperliens en tant que signe de confiance et d’autorité, ils en ont parlé en détail dans leur article publié en 1997. Peu de temps après, PageRank est né et a poussé Google avant leurs concurrents. à la fois la pertinence et la qualité de leurs résultats.

Le World Wide Web se compose maintenant de milliards de pages Web, et les moteurs de recherche sont une partie quotidienne de la vie de la plupart des gens.

Pour une histoire vraiment approfondie des moteurs de recherche, techniquement datant de 1945, nous vous recommandons de jeter un oeil à l’histoire du moteur de recherche.

3 étapes des moteurs de recherche: Crawling, indexation et classement.
Il y a 3 zones principales à comprendre lorsqu’on regarde les moteurs de recherche: Crawling, Indexing, et Ranking. Nous allons les examiner en détail au cours de ce module, mais ils peuvent être résumés:

Crawling – C’est le processus que les moteurs de recherche utilisent pour découvrir de nouveaux contenus. Ils ont des programmes sophistiqués qui visitent les pages Web et suivent les liens sur eux pour trouver de nouvelles pages.
Indexation – Les moteurs de recherche conservent une copie du contenu de toutes les pages Web qu’ils ont visitées. Cet index est stocké sur une grande collection d’ordinateurs, de telle sorte qu’il peut être recherché très rapidement.
Classement – C’est le domaine des moteurs de recherche que SEO est le plus concerné. Quand un utilisateur effectue une recherche sur n’importe quel moteur de recherche, le moteur a besoin d’une «recette» (algorithme) qu’il peut utiliser pour évaluer les pages de son index afin de déterminer celles qui sont les plus pertinentes et ainsi déterminer dans quelle position ils sont retournés à l’utilisateur.
Pour vous aider à vous familiariser un peu avec ce processus, voici une vidéo utile de Google qui l’explique assez bien. Bien que nous n’ayons pas toujours l’impression que les vidéos de Google sont bonnes pour les praticiens, elles produisent parfois de bonnes vidéos comme celle-ci.
Un qui donnent un bon aperçu de ce qu’ils pensent:

Développements récents de moteur de recherche
Pendant de nombreuses années, les moteurs de recherche ont déterminé quelles pages étaient les plus pertinentes pour une requête donnée en se basant uniquement sur le contenu de ces pages et sur la manière dont les autres pages du site s’y référaient. Toutes les informations que les moteurs de recherche ont examinées pour déterminer la pertinence ont été encapsulées dans le Web lui-même.

Toute personne recherchant un mot spécifique ou une phrase de recherche obtiendrait les mêmes résultats que tous ceux qui ont cherché dans le même pays.

Cependant, au cours des dernières années, cela a changé de deux façons importantes:

Réseautage social – Des sites tels que Facebook et Twitter fournissent aux moteurs de recherche des indices importants sur les pages Web dont les gens parlent ou ont partagé entre eux. Cela a signifié que ces indices (que nous appelons des signaux) ont fourni des informations supplémentaires aux moteurs de recherche, leur permettant de changer la «recette» pour déterminer le classement d’un site.
Recherche personnalisée – De même, les moteurs de recherche ont pu utiliser l’utilisation du réseau social d’un utilisateur spécifique, et leurs recherches précédentes, pour déterminer ce qui est le plus important pour eux personnellement. Cela signifie que maintenant différents utilisateurs recherchant la même phrase de recherche peuvent voir des résultats quelque peu différents.
Il y a eu aussi d’autres développements majeurs au cours des dernières années qui ont changé la façon dont les gens cherchent. Google en particulier est devenu beaucoup plus avancé en utilisant l’apprentissage automatique et les données utilisateur pour prédire les meilleurs résultats pour une requête donnée. Deux fonctionnalités de Google démontrent cette capacité et montrent les progrès qu’elles ont réalisés:

Google Suggest – lancé en août 2008, Google Suggest utilise des algorithmes avancés et l’apprentissage automatique pour prévoir ce que vous recherchez. Lorsque vous commencez à saisir votre requête, Google vous suggère des mots-clés, ce qui vous permet d’affiner votre requête au fur et à mesure et d’obtenir des idées pour ce que vous voulez.
Google Instant – lancé en septembre 2010, Google Instant a considérablement modifié la manière dont les internautes effectuent des recherches en créant des résultats dynamiques lorsque l’utilisateur a tapé sa requête. Les résultats seraient mis à jour “en direct” sans que l’utilisateur ait à appuyer sur Entrée
En tant que SEO, il est important de ne pas seulement être conscient de ces développements, mais aussi de leur impact sur votre travail. En particulier, vous devez comprendre comment ils peuvent changer la façon dont les gens recherchent et les types de mots-clés qu’ils utilisent.

Action de la leçon:

Accédez à Google et affinez une requête de recherche à l’aide de Google Instant. Commencez par une requête où vous recherchez un produit ou un service. Ensuite, remplacez la requête par celle où vous recherchez une entreprise locale, notez comment les résultats de la recherche changent
Voici quelques exemples de ce que vous devriez rechercher.

Une recherche de “cookies au chocolat” me montre des résultats d’image et quelques recettes:

Maintenant, si je change ma recherche en “boutiques de biscuits au chocolat de Londres”, je vois des résultats locaux et une carte:
Différents types de recherches
Au fur et à mesure que vous utilisez les moteurs de recherche modernes, vous remarquerez différents types de recherches renvoyées. Les résultats de recherche «traditionnels» sont souvent appelés «dix liens bleus» – se référant à des résultats de recherche typiques contenant dix liens vers des pages individuelles sur des sites spécifiques sans autre contexte.

Cependant, les moteurs de recherche se sont éloignés des dix liens bleus traditionnels au fil des ans et ont commencé à incorporer différents types de contenu. Cela est devenu connu sous le nom de recherche universelle ou mixte et inclus des choses telles que les suivantes:

Histoires de nouvelles
Images
Entreprises locales
Résultats marqués (par exemple, étoiles)
Des produits
Vidéos
Un-box / “réponse” résultats
Que ceux-ci apparaissaient ou non dans vos résultats de recherche dépendraient du mot-clé que vous avez utilisé et de ce que les moteurs de recherche ont ressenti lorsque vous avez utilisé ce mot-clé. Par exemple, si vous recherchez “Microsoft logo”, il est probable que vous souhaitiez trouver des images du logo Microsoft. Par conséquent, vous seriez présenté des images dans les résultats de recherche:

Remarquez comment il y a des résultats de recherche réguliers sous les images, c’est ce qui fait que ce résultat est un résultat fusionné. Les moteurs de recherche utilisent souvent les données qu’ils collectent à partir du comportement de l’utilisateur pour décider s’ils veulent ou non afficher des résultats fusionnés. Par exemple, s’ils trouvent que les utilisateurs cliquent souvent à partir des résultats standard sur des images, ils peuvent décider d’afficher certaines images dans les résultats standard pour créer un résultat fusionné.

Si vous ne souhaitez pas de résultats fusionnés, vous pouvez limiter votre recherche à un seul type de résultat. Il y a trois façons principales de le faire:

En cliquant sur l’un d’eux, vous obtiendrez uniquement des résultats pour les images et les résultats de recherche habituels n’apparaîtront pas.

Comme nous l’avons appris ci-dessus, les moteurs de recherche utiliseront les données des utilisateurs pour décider quand montrer ces résultats mélangés. Cependant, en ce qui concerne les résultats des nouvelles, ils peuvent également regarder l’afflux de nouveaux contenus provenant de sites d’information pour prendre connaissance des dernières nouvelles. Quand ils voient cela, ils peuvent commencer à montrer la boîte de nouvelles dans les résultats de recherche pertinents.

Regardons un exemple d’aujourd’hui que j’écris ceci. J’ai cherché “Bob Diamond” qui jusqu’à il y a quelques jours, n’aurait probablement pas déclenché des résultats de nouvelles. Cependant, comme il est mentionné dans beaucoup de reportages, on me donne la boîte de nouvelles en haut des résultats de recherche:

Notez également les résultats de The Telegraph et The Daily Mail qui sont des résultats très frais. Cela signifie que ce résultat de recherche particulier est en train de changer beaucoup ce qui est logique parce que Bob Diamond est le centre d’attention en ce moment. Nous avons donc non seulement la boîte de nouvelles, nous avons également des résultats de nouvelles fraîches qui ont radicalement changé ce résultat de recherche.

Vous devez être conscient de la rapidité avec laquelle les résultats de recherche peuvent changer en raison de ce type de comportement. Parfois, les mots-clés commerciaux peuvent également être affectés. Sur la base de notre exemple actuel, faisons une recherche pour “diamant”:

Bien que quelqu’un qui cherche “diamant” ne cherche probablement pas de nouvelles sur Bob Diamond, la boîte de nouvelles est toujours au sommet des résultats. Il y a aussi un nouvel article de nouvelles de BBC montrant. Si vous exécutez www.77diamonds.com alors vous pouvez voir une baisse des clics et du trafic parce que le domaine a été poussé vers le bas par la boîte de nouvelles et l’article de la BBC.

Qu’est-ce que la recherche mixte signifie pour les référenceurs?
En tant que SEO, vous devez être conscient que de telles choses peuvent se produire et peuvent affecter vos classements et votre trafic. En ce qui concerne les nouvelles comme l’exemple ci-dessus, malheureusement, ce genre de chose est largement hors de votre contrôle.

Il y a des choses que vous pouvez contrôler cependant. Vous disposez d’un certain nombre d’options et pouvez configurer différents comptes pour tirer parti des résultats mixés.

Si vous êtes une entreprise locale, vous pouvez configurer un compte Google My Business et recevoir des résultats tels que:

Si vous êtes un magasin de commerce électronique, vous pouvez configurer un compte Google Merchant et avoir une chance de s’afficher pour des résultats comme celui-ci:

Il est important d’être conscient des types de résultats mixtes qui s’appliquent à votre entreprise et, si vous le pouvez, profitez-en pour augmenter le trafic vers votre site Web.

Options de recherche
Google vous donne un certain nombre d’options pour affiner vos résultats de recherche. Vous pouvez afficher ces options supplémentaires en développant les options de cette section:

Une fois développé, vous verrez beaucoup d’options:

Ces options peuvent aider à réduire un ensemble donné de résultats de recherche à un petit ensemble pour les rendre plus utiles. En particulier, la modification du paramètre de localisation peut vous aider à avoir une meilleure idée de la manière dont les résultats de recherche diffèrent d’un pays à l’autre. Rappelez-vous, bien que vous puissiez toujours voir des résultats personnalisés, il est donc préférable d’utiliser un navigateur propre pour cela.

Actions de la leçon:
Essayez de déclencher l’affichage d’une nouvelle dans les résultats de recherche Google
Essayez de rechercher un mot clé qui déclenche à la fois les images et les résultats du produit
En plus de la détection automatique des différents types de requête que les moteurs de recherche effectuent, il y a des moments où vous voulez spécifier exactement ce que vous cherchez dans les moindres détails. L’un des moyens les plus puissants de le faire est d’utiliser des opérateurs de recherche qui sont des mots-clés spéciaux qui donnent à vos recherches plus de puissance ou de flexibilité. Cette leçon vous donnera une introduction à eux et vous montrera quelques exemples de comment ils peuvent vous aider.

Qu’est-ce qu’un opérateur de recherche?
Un opérateur de recherche vous permet d’affiner un ensemble de résultats de recherche en fournissant des paramètres et des informations supplémentaires. Il existe de nombreux paramètres différents que vous pouvez utiliser et beaucoup d’entre eux sont utiles pour un certain nombre de tâches de référencement, certains de ces paramètres peuvent être combinés pour affiner les résultats de recherche encore plus.

Les opérateurs de recherche varient selon le moteur de recherche, mais il existe un certain nombre d’outils communs que vous pouvez utiliser pour chacun d’eux. Les résultats obtenus dépendront massivement du niveau auquel le site en question a été exploré et indexé. Un opérateur de recherche réduit simplement ce qui est dans l’index d’un moteur de recherche, si une page particulière n’est pas indexée ou n’a jamais été explorée, un opérateur de recherche peut ne pas la trouver.

Quelques exemples d’opérateurs de recherche
Voici quelques exemples rapides d’opérateurs de recherche utiles pour les référenceurs.

Trouver un nombre approximatif de pages indexées sur un domaine donné:

L’opérateur “site:” demande au moteur de recherche d’afficher uniquement les pages du domaine qui suit, dans ce cas – les pages de www.distilled.net. Notez que Google ne vous montrera pas nécessairement la liste complète des pages indexées – pour voir que vous devez aller à la dernière page de résultats et cliquez sur le lien pour «répéter la recherche avec les résultats omis inclus».

Recherche d’opportunités de publication pour le renforcement des liens:

L’opérateur “inurl:” demande au moteur de recherche d’afficher uniquement les pages dont l’adresse (“URL”) contient les mots ou les symboles qui suivent, dans ce cas “guest-post”.

Combiner des opérateurs de recherche

Certains opérateurs de recherche peuvent être combinés, les deux exemples ci-dessus “site:” et “inurl:” peuvent être combinés pour former quelque chose comme ceci:

Cela limite les résultats à ceux qui ont des vêtements dans l’URL uniquement à partir de www.zappos.com.

Vous pouvez utiliser un plus grand nombre d’opérateurs de recherche. Pour en obtenir une liste plus complète, essayez cette liste dans Google Guide.

Veillez également à compléter notre module interactif sur les opérateurs de recherche avancée.

Autres moteurs de recherche
Il est important de ne pas ignorer les opérateurs de recherche sur d’autres moteurs de recherche. Alors que vous passerez la majeure partie de votre temps à utiliser des opérateurs sur Google, il y en a d’autres qui sont très utiles pour le référencement ailleurs.

Opérateurs spécifiques Bing & Yahoo

Il y a deux opérateurs que Bing et Yahoo utilisent, ce qui peut être très utile pour les SEO.

1. linkfromdomain: opérateur

Cet opérateur vous montrera quels sites Web sont liés à partir du domaine que vous entrez. Voici un exemple:

Les résultats qui vous sont retournés seront une liste de domaines auxquels distilled.net est relié. Cela peut être très utile pour la création de liens, c’est-à-dire si vous cherchez à obtenir un lien à partir d’un site, vous pouvez voir à qui d’autre ils sont déjà liés et étudier pourquoi.

2. Sites Web hébergés sur la même adresse IP

Bing et Yahoo vous permettent de vérifier quels sites Web sont hébergés sur la même adresse IP à l’aide de l’opérateur ip:

La liste renvoyée sera des domaines hébergés sur la même adresse IP.

Avantages des opérateurs de recherche
Du point de vue du référencement, les opérateurs de recherche peuvent vous faire gagner beaucoup de temps et vous fournir des données supplémentaires sur la façon dont les moteurs de recherche ont indexé votre site Web. Ils peuvent vous aider à effectuer un certain nombre de tâches utiles.

Voici quelques exemples de la façon dont les SEO peuvent utiliser les opérateurs de recherche:

Prospection de liens – recherche de sites Web plus ciblés pour obtenir des liens à partir, par exemple, d’un post de positionnement d’invité
Audits techniques de sites Web: recherche d’URL avec des paramètres étranges ou recherche de versions dupliquées du site Web
Recherche de contenu – recherche de types de contenu spécifiques tels que des fichiers PDF ou des fichiers Excel
Actions de la leçon:
Allez vérifier le nombre de pages indexées dans Google pour un domaine sur lequel vous travaillez
Comment ça marche
Rampant sur le web permet aux moteurs de recherche de faire deux choses essentielles:

Découvrez les nouvelles pages susceptibles de contenir du contenu précieux qu’elles souhaitent montrer à leurs utilisateurs
Découvrez quand les pages existantes sont mises à jour avec un nouveau contenu
Les moteurs de recherche font cela en utilisant des programmes avancés qui sont capables de recueillir des informations sur une page donnée. Ces programmes sont souvent appelés “robots” ou “araignées”. Parcourir le Web nécessite d’énormes quantités de ressources techniques. Par conséquent, les moteurs de recherche utilisent des algorithmes pour déterminer les pages à explorer, la fréquence de leur exploration et la profondeur de leur exploration. Cela leur permet de faire l’utilisation de leurs ressources aussi efficacement que possible. La leçon importante pour un SEO à retenir ici est que les moteurs de recherche ne seront pas automatiquement explorer vos pages encore et encore, sauf s’ils ont de bonnes raisons de le faire.

Une fois qu’un robot d’exploration a accédé à votre site Web, il consulte votre fichier robots.txt qui lui indique les pages (le cas échéant) qu’il n’est pas autorisé à explorer. Vous pouvez en apprendre plus sur les fichiers robots.txt dans le module Technical SEO de la leçon Crawling and Indexing.

En supposant qu’il n’y a pas de blocage, un robot commence à explorer les pages de votre site Web. En cours de route, il va enregistrer toutes les URL qu’il trouve sur d’autres URL et les ajouter à une grande liste d’URL qu’il pourra explorer plus tard.

Il existe une différence cruciale entre l’exploration et l’indexation. L’exploration est la découverte des URL, tandis que l’indexation signifie la collecte d’informations à partir de ces URL, telles que les mots sur l’URL et la position de ces mots sur la page.

Problèmes potentiels pour les Crawlers
Les Crawlers sont des programmes informatiques incroyablement avancés. Cependant, ils sont toujours des programmes informatiques et ont des limites.

Technologies Web pouvant causer des problèmes aux robots d’exploration

Les pages Web utilisent une grande variété de technologies et certaines d’entre elles peuvent être difficiles à comprendre pour les robots d’exploration. Les crawlers deviennent de plus en plus avancés et s’améliorent tout le temps, mais traditionnellement ils ont lutté quand ils rencontrent des choses telles que:

Javascript
AJAX
Flash
Chacune de ces technologies est souvent conçue pour améliorer une page Web et offrir une meilleure expérience utilisateur, ce qui est une bonne chose. Mais en tant que SEO, vous devez être conscient que l’intégration de ceux-ci dans vos pages peut causer des problèmes quand il s’agit d’explorer votre contenu.

Si vous souhaitez en savoir plus sur ces technologies ou même commencer à apprendre les bases de leur rédaction, consultez ces guides d’intro:

Introduction à Javascript sur les écoles W3
Introduction à AJAX dans les écoles W3
Article de Wikipedia sur Adobe Flash
Formes de contenu pouvant causer des problèmes aux robots d’exploration

Il existe d’autres formes de contenu que les robots peuvent souvent trouver difficiles à comprendre, le plus souvent ce sont des vidéos et des images. Alors que les robots peuvent détecter et identifier la présence d’une vidéo ou d’une image sur une page, ils ne sont toujours pas capables d’interpréter le contenu. Encore une fois, ils s’améliorent tout le temps mais ils sont loin d’être parfaits sur ce front.

Par exemple, si vous placez du texte dans une image, il sera très difficile à comprendre pour les robots d’exploration, ce qui devrait toujours être évité. L’utilisation de la vidéo pour améliorer une page pour les utilisateurs est excellente, mais vous devez vous assurer qu’il y a suffisamment de contenu autour de la vidéo pour aider à la mettre en contexte.

L’apprentissage clé ici est de s’assurer que tout votre contenu est accessible aux robots des moteurs de recherche. Si vous utilisez des technologies ou des formats de contenu tels que ceux décrits ci-dessus, vous devez vous assurer que le contenu important peut toujours être consulté et indexé.

Types de chenilles
Chaque moteur de recherche aura ses propres robots d’exploration et nous les identifions avec des noms différents – vous avez peut-être déjà entendu parler de googlebot par exemple. En plus du nom descriptif court, tous les robots ont un nom plus long et plus détaillé qui contient des informations complètes sur leur version et leur origine.

Ces noms sont appelés agents d’utilisateur. Une chose importante à noter ici est que les agents utilisateurs peuvent également être utilisés pour identifier les types de navigateur tels que Google Chrome ou Internet Explorer. En principe, chaque programme d’ordinateur pouvant accéder à un site Web doit avoir un agent utilisateur associé le décrivant. Vous pouvez voir l’agent utilisateur de votre propre navigateur en visitant un site comme celui-ci.

En termes de robots d’exploration, chaque moteur de recherche peut avoir un certain nombre de robots d’exploration à des fins différentes. Vous pouvez afficher une liste complète des robots d’exploration Google avec leur agent d’utilisateur dans cette liste. Comme vous pouvez le voir, les moteurs de recherche auront des robots qui effectuent une fonction spécifique, comme la découverte et l’exploration de contenu pour les appareils mobiles ou l’exploration d’images.

Vous devriez vous familiariser avec ce à quoi ressemble un agent utilisateur typique afin de pouvoir facilement les reconnaître lors de l’exécution de tâches techniques de référencement. Voici quelques exemples:

Agent utilisateur Google Chrome:

Mozilla / 5.0 (Windows NT 10.0; WOW64) AppleWebKit / 537.36 (KHTML, comme Gecko) Chrome / 47.0.2526.106 Safari / 537.36
Notez que 47.0.2526.106 est la version actuelle de Chrome, donc cela va changer avec le temps.

Agent utilisateur Googlebot:

Mozilla / 5.0 (compatible, Googlebot / 2.1; + http: //www.google.com/bot.html)
Pour une liste complète des agents utilisateurs connus, consultez cette liste complète.

Nous devrions ajouter rapidement une note ici sur l’utilisation du mot “Mozilla” en tant qu’agent utilisateur Google Chrome. Cela peut être déroutant car nous avons évidemment Mozilla Firefox qui est un navigateur concurrent. Internet Explorer a également “Mozilla” dans le cadre de son agent d’utilisateur, nous avons donc voulu clarifier les choses ici un peu.

Le problème est en fait plus historique et le terme «Mozilla» a été initialement inventé par Netscape, les créateurs de Netscape Navigator qui était un navigateur Internet précoce. Netscape s’est identifié comme “Mozilla” et est rapidement devenu l’un des navigateurs les plus populaires, car il avait un certain nombre de fonctionnalités que les autres navigateurs n’ont pas. Par conséquent, de nombreux sites Web ont commencé à fonctionner correctement lorsqu’ils ont détecté un agent utilisateur contenant “Mozilla”. Après un certain temps, d’autres navigateurs ont commencé à l’émuler et à “spoofer” leur agent utilisateur afin qu’il contienne “Mozilla”. Cela a même continué jusqu’à la récente version de Google Chrome, comme nous pouvons le voir ci-dessus.

Pour plus de lecture à ce sujet, consultez cet historique des messages des agents utilisateurs.

Actions de la leçon:
Trouver l’agent utilisateur de votre version actuelle de Google Chrome
Une fois que les moteurs de recherche ont exploré les pages et extrait le contenu d’une page, ils doivent transmettre toutes ces informations dans leur index. Toutes les informations sont organisées et disponibles pour servir aux utilisateurs lorsqu’ils entrent une requête de recherche. Les moteurs de recherche utiliseront leurs algorithmes pour interpréter le contenu d’une page et l’importance de cette page par rapport aux pages ayant un contenu similaire.

Qu’est-ce qu’un index Web?
Fondamentalement, un index Web est une base de données de pages et pour les moteurs de recherche il contiendra des milliards de pages. Les moteurs de recherche utilisent des milliers de serveurs basés dans le monde entier pour stocker toutes ces pages et les rendre rapidement accessibles via leur recherche.

Récupération de l’information
Lorsqu’un utilisateur recherche un mot clé, il ne recherche pas réellement sur le Web. Ils recherchent un index du web. Les moteurs de recherche vont regarder leur index et extraire des pages qui contiennent ce mot-clé ou des mots qui sont étroitement liés. Il peut être utile de réfléchir à certaines des façons dont la pertinence peut être mesurée au-delà de l’utilisation simple des mots clés.

Nous explorerons les avantages et les faiblesses des algorithmes suivants pour mieux expliquer les concepts:

Utilisation simple des mots-clés
Fréquence de terme * Fréquence de document inverse (Tf * idf);
Co-occurrence;
Modélisation de sujets.
Bien que nous ne puissions pas savoir exactement quels algorithmes les moteurs de recherche utilisent, il est clair qu’ils utilisent une forme de modélisation de sujet et la compréhension des concepts vous donnera une certaine compréhension de ce qui se passe dans les coulisses. Si vous voulez en savoir plus, tous les principaux moteurs de recherche publient des articles de revues à la fine pointe de l’indexation et de la modélisation des sujets, mais à la base, cela signifie que l’utilisateur peut afficher des pages qui peuvent se rapporter contiennent en fait le mot qu’ils ont cherché.

Tous les exemples ci-dessous proviennent de cet article approfondi sur LDA (méthodologie de modélisation par sujet) de SEOmoz.

Mot-clé
Le plus simple des modèles, cette idée dit que les moteurs de recherche regardent le niveau de surface au contenu et demandent “Est-ce que ce contenu contient le terme recherché?” Voici un exemple de SEOmoz:

Il est clair que cette méthodologie n’est pas très utile pour comparer la pertinence de deux documents qui mentionnent tous deux notre expression.

Fréquence des durées * Fréquence des documents inversés
Ce modèle parle de la fréquence à laquelle un terme est utilisé sur une page par rapport à sa prévalence dans un usage plus large (basé sur un corpus de documents dans la langue cible). Essentiellement il pondère des mentions de mots généralement rares plus hauts que des mots communs:

Co-occurrence
Ce modèle postule que les moteurs de recherche peuvent dire, sur Internet, que certaines phrases sont utilisées ensemble, et que par conséquent, lorsqu’une de ces expressions est utilisée, la page peut toujours être classée même si quelqu’un effectue une requête pour l’autre terme. Par exemple, [clark kent] est souvent utilisé aux côtés de [superman], donc les mentions de [clark kent] rendent plus probable qu’une page parle de superman plutôt que de simplement mentionner le mot:

Modélisation de sujets
Ce concept est le plus compliqué des quatre. En analysant des relations plus complexes entre l’occurrence de différents mots et expressions, les moteurs de recherche peuvent acquérir une compréhension des sujets sous-jacents des documents et des phrases. En superposant les sujets à d’autres façons de mesurer la pertinence, les moteurs de recherche peuvent grandement améliorer la qualité de leurs résultats.

La modélisation des sujets est étroitement liée à l’identification des entités – quelque chose voit plus d’importance depuis l’introduction du graphe des connaissances.

Voici un exemple.

Il convient de noter que les moteurs de recherche utilisent une combinaison d’autres signaux sur la page et des liens vers cette page, pour décider quel score il devrait avoir pour un mot clé donné. Nous ne savons pas avec certitude combien de signaux il y a, mais Google a confirmé qu’ils regardent plus de 200 en décidant quel score assigner à une page.

Les facteurs les plus étroitement liés au classement peuvent tous être trouvés dans la section Métriques de l’enquête biannuelle SEOmoz Search Ranking Factors.

Mise en cache
Afin de tirer le meilleur parti de leurs ressources, les moteurs de recherche conserveront une version en cache d’une page qu’ils utiliseront à des fins de classement. C’est cette version en cache d’une page qui est utilisée lorsque les moteurs de recherche décident quelles pages sont les plus pertinentes pour la requête d’un utilisateur à ce moment donné. Le cache du moteur de recherche d’une page sera souvent au moins quelques heures ou quelques jours, ce qui signifie parfois que la version en direct de la page est différente de la version en cache que les moteurs de recherche ont.

Il est important que les référenceurs en soient conscients, car cela peut souvent signifier que les modifications apportées à une page n’auront aucun effet sur les classements tant que la page n’aura pas été mise en cache. Par exemple, si vous ajoutez un nouveau contenu à votre page dans le but de cibler davantage de mots clés, vous ne verrez probablement pas d’amélioration dans les classements de ces mots clés tant que les moteurs de recherche n’auront pas trouvé ce contenu ve ajouté.

Comment vérifier le cache d’une page
Dans Google Chrome, vous pouvez suivre ces étapes:

Quand tu tapes une recherche, vous verrez le cache Google de la page:

Vous pouvez également consulter la version en texte seulement de la page qui vous montrera exactement quels éléments de texte Google peut voir. C’est utile pour voir si un contenu précieux est caché de Google:

Dans Bing, vous pouvez suivre ces étapes:

Actions de la leçon:
Allez vérifier le cache d’un site web dans Google et Bing, comparez les caches avec la version live des sites et essayez de repérer les différences
La dernière partie du processus est la partie que la plupart d’entre nous verrons quotidiennement – les résultats de notre recherche. C’est la partie sur laquelle nous nous intéressons le plus.

Que se passe-t-il lorsque vous lancez une recherche?
Voici un schéma simple de ce qui se passe lorsqu’un utilisateur effectue une recherche sur Google:

Source de l’image de “How Google Works” sur GoogleGuide

Il s’agit d’un processus très simplifié, le processus réel a de nombreuses parties mobiles et une puissance de calcul très avancée pour arriver à un ensemble de résultats de recherche.

Quand un utilisateur recherche un mot-clé, les moteurs de recherche vérifient leur index pour les pages qui correspondent ou correspondent étroitement. Ces pages se verront ensuite attribuer une note basée sur des centaines d’autres signaux relatifs à cette page. Les pages seront ensuite classées par score et les résultats seront affichés à l’utilisateur.

Les développements des dernières années ont vu les moteurs de recherche utiliser les données de comportement de l’utilisateur pour améliorer les résultats de recherche. Par exemple, ils sont capables de mesurer le temps qui s’écoule entre le moment où un utilisateur quitte un ensemble de résultats de recherche pour accéder à un site Web et le retour aux mêmes résultats de recherche. Si un site Web montre régulièrement que les utilisateurs n’y passent que quelques secondes, cela pourrait indiquer à Google qu’il n’est pas bon pour l’utilisateur.

Les moteurs de recherche peuvent également utiliser la personnalisation pour améliorer les résultats de recherche.

Recherche personnalisée
Comme nous l’avons découvert, les moteurs de recherche recueillent souvent des données sur le comportement de l’utilisateur pour connaître leur degré de satisfaction à l’égard d’un ensemble donné de résultats. Cela ne se limite pas à l’amélioration des résultats de recherche pour tout le monde, il est maintenant très commun pour les individus de voir des résultats très différents en fonction de leur propre historique de recherche et de leur comportement.

Google, en particulier, a été très actif dans la promotion de la recherche personnalisée, au point même de s’interroger sur les données personnelles qu’ils collectent auprès des utilisateurs. Ils ont d’abord introduit la recherche personnalisée en 2005 mais l’ont généralisée aux utilisateurs non connectés en 2009.

Google peut faire certaines choses pour vous fournir des résultats personnalisés selon que vous êtes connecté à un compte Google ou non.

Si vous êtes connecté à votre compte Google, Google utilisera l’historique Web associé à ce compte pour personnaliser les résultats de recherche. Ils vont regarder les sites Web que vous visitez souvent et peuvent choisir d’afficher ces sites Web plus haut dans leur classement qu’ils ne le feraient pour les autres utilisateurs. Vous pouvez consulter votre historique Web à cette adresse si vous possédez un compte Google.

Si vous n’êtes pas connecté à un compte Google, nous tenterons toujours de personnaliser vos résultats, mais nous utiliserons un cookie d’une durée de 180 jours. C’est le grand changement qu’ils ont opéré en 2009 et qui a encore plus personnalisé les résultats.

Du point de vue du référencement, il y a quelques choses à savoir sur la recherche personnalisée:

Le logiciel de vérification de classement devient légèrement moins utile
Fournir une bonne expérience utilisateur est encore plus important
Lors de la vérification manuelle des classements des clients, vous devez utiliser un navigateur “propre” sans historique de recherche, sinon vous risquez de trouver des résultats inexacts
Cherchez plus votre monde

En janvier 2012, Google a fait un autre grand pas vers des résultats de recherche personnalisés. Cette fois, ils se sont beaucoup déplacés vers l’intégration avec Google+, qui est leur passage dans les réseaux sociaux. Nous voyions déjà l’effet de Google+ sur les résultats de recherche réguliers avec des résultats annotés qui avaient été “explorés” par des personnes de nos cercles:

Notez que Jonathon et Gianluca ont attribué +1 à ces URL qui s’affichent lorsque je suis connecté à mon compte Google. Cela peut évidemment affecter la façon dont j’interagis avec les résultats de la recherche et ceux sur lesquels je clique.

Avec Google Recherche Plus dans le monde, Google est allé encore plus loin et donnera la priorité aux photos qui ont été partagées par des amis de vos cercles sur Google+:

Notez les noms des personnes dans vos cercles au bas des images en haut.

Pour les référenceurs, il y a plusieurs choses à savoir:

Tenez-vous au courant de la façon dont Search Plus votre Monde et Google+ sont intégrés dans votre secteur
Assurez-vous que les sites Web sur lesquels vous travaillez sont actifs sur Google+ et qu’ils ont au moins obtenu leur configuration de compte et leur mise à jour
Encouragez l’interaction de l’utilisateur sur Google+
Actions de la leçon:
Connectez-vous à votre compte Google dans un navigateur, ouvrez un autre navigateur dans lequel vous êtes déconnecté. Maintenant, recherchez les mêmes mots clés et essayez de repérer les différences dans les résultats de recherche. Pourquoi ces différences se produisent-elles?
Nommez cinq types de fichiers que les moteurs de recherche peuvent avoir du mal à explorer et à indexer correctement
Images, vidéo, Javascript, Flash et AJAX
Quelles sont les trois étapes de base suivies par les moteurs de recherche?
Ramper, indexer et classer
Décrire deux façons dont la recherche personnalisée affecte le travail des référenceurs
La vérification de classement devient moins précise et l’expérience utilisateur devient plus importante
Quel opérateur de recherche utiliseriez-vous pour vérifier le nombre approximatif de pages indexées dans Google?
site: domain.com

Laisser un commentaire

webinaire agence webmarketing

Profitez maintenant du meilleur Webinaire composé des secrets et stratégies que personne ne vous dévoilera, rejoignez maintenant plus de 24.500 entreprises qui ont profité des secrets.

Partagez cet article avec vos amis

Partager sur facebook
Partager sur google
Partager sur twitter
Partager sur linkedin