Google : Google Présentation du moteur de recherche

accueil
plan
CDI
SES
photos
Web
Brico
Resto
philo

 

 

accueil
plan
CDI
SES
photos
Web
Brico
Resto
philo

 



Présentation : Google de Googol = 10 à la puissance 10
(site à consulter : http://www.silicon.fr/ )
société fondée en 1995 par Larry Page et Sergey Brin

Premier projet nommé BackRub + d'infos sur http://www.7-dragons.com/ méthode d'analyse de liens pointant vers un site qui permet d'évaluer la pertinence et la popularité du site (d'autres infos sur ce site : http://www.precisement.org/ avec une méthode de recherche sur internet à voir qui est simple et peux être utilisée dans un CDI)

La société Google Inc est créée en septembre 1998
En août 1999, 3 millions de recherches par jour
En septembre 2003, 3 milliards de pages référencées dans son index
En novembre 2005, 125 milliards de dollars de capitalisation boursière
31 milliards de recherche par mois sur Google dans le monde en 2008
+ de 60 milliards en 2012


Un moteur de recherche permet de trouver les occurences d'un mot à l'intérieur d'une base de données
Les robots (ou crawlers, spiders) (plus d'infos sur le site : http://www.robotstxt.org/) vont de page en page en fonction des liens qui sont sur les sites et récupèrent ainsi la totalité des informations ; ils indexent par les mots clès trouvés leurs différentes bases de données. Les "index" des grands moteurs de recherche contiennent des milliards de pages web. Le moteur Google effectue cette opération d'indexation tous les mois environ, cela s'appelle la Google Dance. (site intéressant : http://www.webrankinfo.com/ ). Les bases de données de Google sont appelées data centers, elles sont situées dans le monde entier, voir les implantations
Plus un site met de liens vers votre site personnel, plus votre site sera populaire. Google calcule ainsi son indice de popularité. Tout dépend aussi de la popularité du site qui met le lien sur ses pages, cela n'aura pas la même influence si c'est Yahoo qui pointe vers votre site ou le site des pages perso de votre cousin... (voir PageRank d'un site)

Google est le premier sur le marché des moteurs de recherche, vous pouvez consulter le site suivant pour connaître les mesures d'audience et de fréquentation

Google vit de la publicité sur son moteur de recherche, pour en savoir + cette publicité est textuelle essentiellement et tient compte du contexte (mots clés sur les pages du site) et variée sur les sites partenaires. De plus Google revend sa technologie, et met à disposition son moteur pour des intranets. Google répond aussi à vos questions, ce service est néanmoins payant

 

Recherche simple dans Google
1/ Page d'accueil de Google :

http://www.google.fr/

Dans l'espace prévu à cet effet (long rectangle) vous pouvez taper différents mots clés :
internet par exemple puis Entrée, vous obtenez une première page qui est le résultat de votre recherche avec 10 sites sélectionnés, 2 liens commerciaux en haut de page sur fond bleu et sur la droite de l'écran des liens commerciaux supplémentaires. Le résultat de la première page est extrait d'un total de plus de 2 400 000 000. Ce qui est bien sûr démesuré en termes d'analyse de chaque page. Vous pouvez sélectionner sur la première page d'accueil de Google différents boutons : Web, Pages francophones, France
pour les pages francophones le résultat total est de 59 900 000, pour la France de 48 700 000
dans les 3 cas, Google fait des recherches dans des bases différentes, pour le web dans la totalité de l'index, pages francophones dans les pages écrites en langue française et France dans les pages où les serveurs sont situés sur le territoire français (le n° IP pour internet protocol permet de repérer le serveur).
Un site complet : http://www.commentcamarche.net/

Exemple mettre le mot internet dans l'espace de recherche prévu à cet effet :

Premier site de la première page :

Accueil - internet.gouv.fr
L'action de l'Etat français en matière de société de l'information.
www.internet.gouv.fr/ - 19k - En cache - Pages similaires

 

Première ligne :

Accueil - internet.gouv.fr

Cette ligne correspond au titre du site sélectionné, vous pouvez le vérifier en faisant Favoris puis Ajouter, vous obtenez une fenêtre de Windows Ajout de favoris
Nom : Accueil - internet.gouv.fr
Google n'affiche que le début des titres
On retrouve ce titre dans la barre de Windows en haut du navigateur, suivi de Microsoft Internet Explorer si vous utilisez IE comme navigateur.
Le mot est affiché en gras

 

Deuxième ligne :

L'action de l'Etat français en matière de société de l'information.

Cette deuxième ligne est un extrait textuel du site ou d'une balise META qui est non visible mais qui décrit le site.
Un site complet sur le monde l'internet et des moteurs : http://www.abondance.com/

 

Troisième ligne :

www.internet.gouv.fr/ - 19k - En cache - Pages similaires

La troisième ligne comprend plusieurs informations intéressantes :

www.internet.gouv.fr/
pour un même nom de domaine Google peut afficher deux sites, le deuxième étant décalé sur la droite, c'est un maximun.

19k : taille de la page du fichier source (en kilo-octets), sans les images

Date de la dernière mise à jour, cette date n'est affichée que si elle récente, donc pour des sites assez importants qui mettent leurs pages à jour quotidiennement

En cache : Google, entre deux visites des sites, (plusieurs semaines) garde les informations dans des bases de données et peut ainsi restituer les archives sauvegardées dans ses serveurs, plus d'infos sur Google help (option très intéressante)

les mots clés sont soulignés et nous avons la date de la dernière sauvegarde ou "consultation" pour reprendre les termes de Google

Pages similaires : ce sont des sites qui traitent du même sujet

 

Le correcteur orthographique de Google : il permet d "Essayez avec cette orthographe", Google analyse le mots clé de la recherche et propose celui qui lui paraît le plus opportun.

 

Recherche d'Images : http://www.google.fr/imghp?hl=fr&tab=wi&q=
Google identifie les images dans les serveurs par leur nom (image.gif, image.jpg), par le descriptif associé à l'image (ou info-bulle), par le texte de l'image. Un clic sur l'image et s'ouvre une page divisée en deux. Dans la partie supérieure, l'image plus grande ou identique et dans la partie inférieure, la page où est extraite l'image ("Image dans son contexte original, sur la page")
Attention à la mention : cette image est peut être protégée par copyright ("Il est possible que l’image soit réduite et protégée par les droits d’auteur")
à droite de l'écran, vous pouvez : supprimer le cadre supérieur et/ou cliquer sur Résultats d'image et revenir à la page précédente

 

Recherche dans les forums

un site à consulter : http://www.usenet-fr.net/

http://groups.google.fr/

exemple : tapez le nom suivant : canal saint martin

Google affiche le nom des différents forums dans lesquels le mot clé est identifié. Si vous cliquez sur le titre en bleu vous avez le message, en dessous vous avez une courte description du message, mots extraits du corps du message puis l'adresse du forum en vert. Si vous cliquez sur un forum, vous obtenez une page qui liste les messages classés par ordre chronologique et ainsi de suite vous pouvez affiner votre recherche dans un forum bien précis.

 

Recherche dans le répertoire ou annuaire :

http://www.google.fr/dirhp?hl=fr&tab=wd&q=

Google fait sa recherche parmi des fiches descriptives de sites. Le résultat fait apparaître le mot clé (en gras) recherché parmi le titre, le résumé ou l'adresse (URL) du site. "L'Annuaire Google commence avec une collection de sites Web choisis par des évaluateurs volontaires de l'ODP", Google s'est associé à Open Directory Project, pour une aide en ligne

Le plus simple est de procéder en 2 temps :
- recherchez dans la catégorie qui vous intéresse
- mettez le mot clé recherché quand vous êtes sur la page d'accueil de la catégorie
exemple : Journaux World > Français > Régional > Europe > France > Actualité et médias > Journaux
ensuite vous choisissez le journal et cliquez sur le lien correspondant

 

NB :

- Google ne tient pas compte de l'accentuation des mots clés
exemple : pays niçois et pays nicois

- idem pour la casse des mots (majuscule ou minuscule)
exemple : ibm ou IBM

- Google tient compte de l'ordre des mots : place République ou République place, voir la troisième ligne et comparer
d'où l'intérêt de faire attention à l'ordre des mots. Il faut faire preuve de bon sens... :-)

- Google ignore les mots vides : le, la, les, où, du, de, des, avec, ... mais dans la pratique les résultats sont différents, entre la théorie et la pratique ... il y a des différences, essayez par exemple : place République et place de la République ... surtout à partir de la ligne 3

- Si vous voulez exactement l'expression dans sa totalité : mettez-là entre guillemets exemple : éditions Gallimard

 

Un mot ou un autre :
thé ou café avec l'opérateur ou : OR, à mettre en anglais et en MAJUSCULE, essayez les expressions suivantes : thé ou café ; thé OU café ; thé OR café ; tea OR coffee et observez les résultats. dans le premier cas, le "ou" est pris comme un mot clé, dans le deuxième cas c'est pratiquement la même chose, avec le OR (troisième cas) on voit bien la séparation, idem en anglais sauf sur un site où l'on a les deux termes. L'opérateur OR doit être en majuscule ou faites touche AltGr + F6 = | vous pouvez essayer : thé | café ... mais vous avez parfois des sites où il y a les deux mots clés, internet n'est pas une science exacte, de plus c'est très évolutif entre la date de saisie de ce texte et votre lecture des présentes pages...

 

Un mot sans un autre : utilisez le tiret exemple : Paris sans ses hôtels, essayez paris -hôtels il faut bien coller le tiret au mot à enlever sinon Google interprète le tiret comme un mot vide (sans valeur pour sa recherche), faites d'autres essais : chien -chat ; jour -nuit ; ying -yang ...

 

Recherche sur le début d'un mot ou troncature, en général nous utilisons l'astérisque mais avec Google c'est sans effet, notre moteur fait une recherche sur les lettres données et uniquement sur ces lettres. Par exemple si vous tapez : Tintin vous obtiendrez le site officiel du personnage d'Hergé mais en tapant : tinti* (les résultats n'ont rien à voir), de même avec chien, chienne, chiennes* les résultats ne sont pas "à mettre en toutes les mains"... pour un public averti...

 

La recherche sur un moteur de recherche n'est pas une science exacte pour l'utilisateur, elle varie dans le temps (et dans l'espace). Il faut faire preuve de bon sens et affiner sa recherche. Réfléchissez bien aux mots clés ; attention aux mots trop "larges" ou vagues ou génériques (exemple : internet, ville, politique,... Il faut une méthode (vois la page méthodologie) et bon surf... :-)

© supercdi | accueil | plan COURS SES ES