|
Présentation : Google de Googol = 10 à la puissance
10
(site à consulter : http://www.silicon.fr/
)
société fondée en 1995 par Larry Page et Sergey
Brin
Premier projet nommé BackRub
+ d'infos sur http://www.7-dragons.com/
méthode d'analyse de liens pointant vers un site qui permet d'évaluer
la pertinence et la popularité du site (d'autres infos sur ce site
: http://www.precisement.org/
avec une méthode de recherche sur internet à voir qui est
simple et peux être utilisée dans un CDI)
La société Google Inc est créée
en septembre 1998
En août 1999, 3 millions de recherches par jour
En septembre 2003, 3 milliards de pages référencées
dans son index
En novembre 2005, 125 milliards de dollars de capitalisation boursière
31 milliards de recherche par mois sur Google dans le monde en 2008
+ de 60 milliards en 2012
Un moteur de recherche permet de trouver les occurences d'un mot
à l'intérieur d'une base de données
Les robots (ou crawlers, spiders) (plus d'infos sur
le site : http://www.robotstxt.org/) vont de page en page en fonction
des liens qui sont sur les sites et récupèrent ainsi la
totalité des informations ; ils indexent par les mots clès
trouvés leurs différentes bases de données.
Les "index" des grands moteurs de recherche contiennent des
milliards de pages web. Le moteur Google effectue cette opération
d'indexation tous les mois environ, cela s'appelle la Google
Dance. (site intéressant : http://www.webrankinfo.com/
). Les bases de données de Google sont appelées data
centers, elles sont situées dans le monde entier, voir
les implantations
Plus un site met de liens vers votre site personnel, plus votre site sera
populaire. Google calcule ainsi son indice de popularité.
Tout dépend aussi de la popularité du site qui met le lien
sur ses pages, cela n'aura pas la même influence si c'est Yahoo
qui pointe vers votre site ou le site des pages perso de votre cousin...
(voir PageRank d'un site)
Google est le premier sur le marché des moteurs de recherche, vous
pouvez consulter le site
suivant pour connaître les mesures d'audience et de fréquentation
Google vit de la publicité sur son moteur de recherche, pour
en savoir + cette publicité est textuelle essentiellement
et tient compte du contexte (mots clés sur les pages du site) et
variée sur les sites partenaires. De plus Google revend sa technologie,
et met à disposition son moteur pour des intranets. Google
répond aussi à vos questions, ce service est néanmoins
payant
|
Recherche simple dans Google
1/ Page d'accueil de Google :
|
http://www.google.fr/ |
Dans l'espace prévu à cet effet (long rectangle) vous pouvez
taper différents mots clés :
internet
par exemple puis Entrée, vous obtenez une première
page qui est le résultat de votre recherche avec 10 sites sélectionnés,
2 liens commerciaux en haut de page sur fond bleu et sur la droite de
l'écran des liens commerciaux supplémentaires. Le résultat
de la première page est extrait d'un total de plus de 2 400 000
000. Ce qui est bien sûr démesuré en termes d'analyse
de chaque page. Vous pouvez sélectionner sur la première
page d'accueil de Google différents boutons : Web, Pages francophones,
France
pour les pages francophones le résultat total est de 59 900 000,
pour la France de 48 700 000
dans les 3 cas, Google fait des recherches dans des bases différentes,
pour le web dans la totalité de l'index, pages francophones
dans les pages écrites en langue française et France dans
les pages où les serveurs sont situés sur le territoire
français (le n° IP pour internet
protocol permet de repérer le serveur).
Un site complet : http://www.commentcamarche.net/
|
Exemple mettre le mot internet dans l'espace de recherche prévu
à cet effet : |
Premier site de la première page :
Accueil - internet.gouv.fr
L'action de l'Etat français en matière de société de l'information.
www.internet.gouv.fr/ - 19k - En cache - Pages similaires
|
Première ligne :
Accueil - internet.gouv.fr
Cette ligne correspond au titre du site sélectionné,
vous pouvez le vérifier en faisant Favoris puis Ajouter,
vous obtenez une fenêtre de Windows Ajout de favoris
Nom : Accueil - internet.gouv.fr
Google n'affiche que le début des titres
On retrouve ce titre dans la barre de Windows en haut du navigateur, suivi
de Microsoft Internet Explorer si vous utilisez IE comme navigateur.
Le mot est affiché en gras
|
Deuxième ligne :
L'action de l'Etat français en matière de société de l'information.
Cette deuxième ligne est un extrait textuel du site ou
d'une balise
META qui est non visible mais qui décrit le site.
Un site complet sur le monde l'internet et des moteurs : http://www.abondance.com/
|
Troisième ligne :
www.internet.gouv.fr/ - 19k - En cache - Pages similaires
La troisième ligne comprend plusieurs informations intéressantes
:
www.internet.gouv.fr/
pour un même nom de domaine Google peut afficher deux sites, le
deuxième étant décalé sur la droite, c'est
un maximun.
19k : taille de la page du fichier source (en kilo-octets), sans
les images
Date de la dernière mise à jour, cette date n'est
affichée que si elle récente, donc pour des sites assez
importants qui mettent leurs pages à jour quotidiennement
En
cache : Google, entre deux visites des sites, (plusieurs semaines)
garde les informations dans des bases de données et peut
ainsi restituer les archives sauvegardées dans ses serveurs,
plus d'infos sur Google
help
(option très intéressante)
les mots clés sont soulignés et nous avons la date de la
dernière sauvegarde ou "consultation" pour reprendre
les termes de Google
Pages similaires : ce sont des sites qui traitent du même
sujet
|
Le correcteur orthographique de Google : il permet d "Essayez
avec cette orthographe", Google analyse le mots clé de
la recherche et propose celui qui lui paraît le plus opportun.
|
Recherche d'Images : http://www.google.fr/imghp?hl=fr&tab=wi&q=
Google identifie les images dans les serveurs par leur nom (image.gif,
image.jpg), par le descriptif associé à l'image (ou
info-bulle), par le texte de l'image. Un clic sur l'image et s'ouvre
une page divisée en deux. Dans la partie supérieure, l'image
plus grande ou identique et dans la partie inférieure, la page
où est extraite l'image ("Image dans son contexte original,
sur la page")
Attention à la mention : cette image est peut être protégée
par copyright ("Il est possible que l’image soit réduite
et protégée par les droits d’auteur")
à droite de l'écran, vous pouvez : supprimer le cadre supérieur
et/ou cliquer sur Résultats d'image et revenir à la page
précédente
|
Recherche dans les forums
un site à consulter : http://www.usenet-fr.net/
http://groups.google.fr/
exemple : tapez le nom suivant : canal
saint martin
Google affiche le nom des différents forums dans lesquels le mot
clé est identifié. Si vous cliquez sur le titre en bleu
vous avez le message, en dessous vous avez une courte description du message,
mots extraits du corps du message puis l'adresse du forum en vert.
Si vous cliquez sur un forum, vous obtenez une page qui liste les messages
classés par ordre chronologique et ainsi de suite vous pouvez
affiner votre recherche dans un forum bien précis.
|
Recherche dans le répertoire ou annuaire :
http://www.google.fr/dirhp?hl=fr&tab=wd&q=
Google fait sa recherche parmi des fiches descriptives de sites. Le résultat
fait apparaître le mot clé (en gras) recherché parmi
le titre, le résumé ou l'adresse (URL) du site. "L'Annuaire
Google commence avec une collection de sites Web choisis par des évaluateurs
volontaires de l'ODP", Google s'est associé à Open
Directory Project, pour
une aide en ligne
Le plus simple est de procéder en 2 temps :
- recherchez dans la catégorie qui vous intéresse
- mettez le mot clé recherché quand vous êtes sur
la page d'accueil de la catégorie
exemple : Journaux World > Français > Régional > Europe > France > Actualité
et médias > Journaux
ensuite vous choisissez le journal et cliquez sur le lien correspondant
|
NB :
- Google ne tient pas compte de l'accentuation des mots clés
exemple : pays niçois et pays nicois
- idem pour la casse des mots (majuscule ou minuscule)
exemple : ibm ou IBM
- Google tient compte de l'ordre des mots : place
République ou République
place, voir la troisième ligne et comparer
d'où l'intérêt de faire attention à l'ordre
des mots. Il faut faire preuve de bon sens... :-)
- Google ignore les mots vides : le, la, les, où, du, de,
des, avec, ... mais dans la pratique les résultats sont différents,
entre la théorie et la pratique ... il y a des différences,
essayez par exemple : place
République et place
de la République ... surtout à partir de la ligne 3
- Si vous voulez exactement l'expression dans sa totalité : mettez-là
entre guillemets exemple : éditions
Gallimard
|
Un mot ou un autre :
thé ou café avec l'opérateur ou : OR, à
mettre en anglais et en MAJUSCULE, essayez les expressions suivantes
: thé ou café ; thé OU café ; thé OR
café ; tea OR coffee et observez les résultats. dans le
premier cas, le "ou" est pris comme un mot clé, dans
le deuxième cas c'est pratiquement la même chose, avec le
OR (troisième
cas) on voit bien la séparation, idem en anglais sauf
sur un site où l'on a les deux termes. L'opérateur OR
doit être en majuscule ou faites touche AltGr + F6 = | vous
pouvez essayer : thé | café ... mais vous avez parfois des
sites où il y a les deux mots clés, internet n'est pas une
science exacte, de plus c'est très évolutif entre la date
de saisie de ce texte et votre lecture des présentes pages...
|
Un mot sans un autre : utilisez le tiret exemple : Paris
sans ses hôtels, essayez paris
-hôtels il faut bien coller le tiret au mot à enlever
sinon Google interprète le tiret comme un mot vide (sans valeur
pour sa recherche), faites d'autres essais : chien -chat ; jour -nuit
; ying
-yang ...
|
Recherche sur le début d'un mot ou troncature, en
général nous utilisons l'astérisque mais avec
Google c'est sans effet, notre moteur fait une recherche sur les lettres
données et uniquement sur ces lettres. Par exemple si vous tapez
: Tintin vous obtiendrez le site officiel du personnage d'Hergé
mais en tapant : tinti* (les résultats n'ont rien à voir),
de même avec chien, chienne, chiennes* les résultats ne sont
pas "à mettre en toutes les mains"... pour un public
averti...
|
La recherche sur un moteur de recherche n'est pas une science exacte
pour l'utilisateur, elle varie dans le temps (et dans l'espace). Il faut
faire preuve de bon sens et affiner sa recherche. Réfléchissez
bien aux mots clés ; attention aux mots trop "larges"
ou vagues ou génériques (exemple : internet, ville, politique,...
Il faut une méthode (vois la page méthodologie) et bon surf...
:-)
|
|