Bien souvent, la solution proposée pour ré-écrire une URL sans ‘www’ vers une URL avec est du type:

RewriteCond %{HTTP_HOST} mysite\.com$ [NC]
RewriteCond %{HTTP_HOST} !^www\.mysite\.com$ [NC]
RewriteRule ^(.*)$ http://www.mysite.com/$1 [L, R=301]

Mais c’est juste une solution qui complique la maintenance d’un hébergement utilisant des vhosts ou virtual hosts.

Avec un CMS comme Drupal , il est par exemple possible d’avoir le même code utilisé pour toute une pléïade de sites ayant des noms de domaine différents. Le .htaccess est partagé par tous les sites, et s’assurer que tous les sites dont la configuration DNS pointe vers l’installation Drupal unique sont correctement configurés peut s’avérer hasardeux et source d’erreurs.

Je vous propose une solution générique, quel que soit le nom de domaine:

# vérifier que HTTP_HOST n’est pas vide
RewriteCond %{HTTP_HOST} !^$ [NC]
# qu’il manque ‘www’
RewriteCond %{HTTP_HOST} !^www\. [NC]
# toujours vrai pour mémoriser la valeur de HTTP_HOST dans %1
RewriteCond %{HTTP_HOST} ^(.*)$ [NC]
# construit la redirection à partir de l’URI (extraite de RewriteRule) et du nom de domaine (provenant de la dernière RewriteCond)
RewriteRule ^(.*)$ « http://www.%1/$1″ [L, R=301]
# et voilà !

Testé avec Apache 2.2.3.

Et chez vous, ça fonctionne ?

Average Rating: 4.6 out of 5 based on 243 user reviews.

Les moteurs de recherche ne savent toujours pas faire de recherche phonétique, en voici la démonstration.

Je cherchais où acheter une nouvelle boite de pastilles lave-vaisselle écologiques de marque Rainette (dans mon souvenir, j'ai jeté la boite et l'emballage des pastilles ne présentes aucune mention de la marque). Leur avantage : des demi-doses pour utiliser moins de produits détergeants (réduire les doses, c'est la première façon d'être respectueux de l'environnement sans changer de produit) et une composition visiblement moins agressive au vu de l'état de mes couverts et de la vaisselle après plusieurs semaines de lavage.

Or, pas moyen de trouver vaisselle rainette ni sur Exalead. Impossible également avec vaisselle rainet.

Pourtant, la marque a bien un site internet, elle communique même abondamment sur l'emballage du produit (jeté depuis longtemps).

Il existe bel et bien, il s'agit de Rainett, avec 2 "t" ! Il fallait y penser. Et comment ai-je fini par les trouver ? Grâce à Yahoo!, qui fait mieux que les autre en suggérant la recherche "produit rainett".

Comme Yahoo! n'est pas le moteur de recherche le plus populaire, je conseille aux marques d'étudier comment les consommateurs mémorisent leurs noms de produits, et d'amender le contenu de leur site internet pour refléter les différentes orthographes pratiquées par leur public. Elles peuvent également déposer différents noms de domaine et utiliser par exemple des framesets pour ramener les visiteurs vers le site principal, tout en donnant aux moteurs des contenus alternatifs ciblés sur une orthographe précise de leurs marques.

Qu'en dites-vous ? Comment procédez-vous ?

Average Rating: 4.7 out of 5 based on 300 user reviews.

Comment savoir quel moteur de recherche est le plus utilisé par les internautes, et donc sur lequel devoir concentrer les efforts d’optimisation du référencement de votre site ?

Les analystes américains sont décidémment très ingénieux. Ils n’ont pas cherché à compter le temps passé sur chaque moteur, ni les visites générées par chaque moteur sur un panel de sites représentatif d’un pays ou d’une langue.

Non, ils ont compté le nombre de requêtes effectuées par les Internautes. Peu importe qu’elles soient fructueuses ou infructueuses. Peu importe qu’elles génèrent ou non du trafic. Non, juste le nombre de requêtes sur une période donnée.

Les résultats détaillés pour octobre 2006 aux États-Unis sont sur le site de Nielsen Netratings.

Cela permet de démontrer que l’utilisation de Yahoo comme moteur de recherche a le vent en poupe (tient, le service communication financière de Yahoo va être content) car il progresse plus vite que les autres moteurs (voilà que leur politique de partenariat pour insérer un peu partout des formulaire de recherche sur leur moteur porte ses fruits).

Mais le critère me semble très fragile: plus un moteur est rapide, même peu pertinent dans ses résultats, plus l’internaute saisit des requêtes de reformulation successive pour tenter de trouver ce qu’il cherche. Et mieux le moteur est classé dans ce palmarès construit à l’aune du nombre de requêtes traitées, sans pour autant être celui le plus souvent utilisé avec succès et satisfaction.

Une autre approche est l’audience apportée à un panel de sites. Le dernier exemple francophone encore maintenu après l’abandon du baromètre abondance est celui de secrets2moteurs. mais là aussi il y a un biais. Xiti mesure beaucoup de micro-sites perso qui sont bien mieux pris en compte par Google que par Yahoo (dont l’indexation est beaucoup moins complète en volume de pages et en nombre de site). Il en résulte que la seule force de frappe en volume de Google lui confère une meilleure part de marché, et celle des autres moteurs est sous-estimée. Le panel pro du baromètre Abondance proposait d’ailleurs une bonne solution: construire un référentiel pour une typologie donnée de sites, qui permette aux sites qui en relèvent de se situer par rapport à des sites similaires.

Dommage qu’il n’existe pas un moyen plus fiable et transparent de connaître l’audience de chaque moteur, car finalement tous les investissements publicitaires en mots clefs sponsorisés se font, au départ, sur la base de la part de marché de chacun…

Qu’en dites-vous ?

Average Rating: 4.5 out of 5 based on 287 user reviews.

Vous avez 80% de l’audience de votre site en provenance de Google. Pouvez-vous dire que votre référencement est parfait et que rien ne peut être fait pour l’améliorer ?

Vous avez 15% d’audience en provenance de tous les moteurs de recherche, du plus gros au plus petit. Devez-vous en déduire que votre démarche de référencement naturel a échoué ?

Comme souvent, les chiffres pris isolément sont trompeurs.

Avoir 20 visites par semaine en provenance de Google sur un total de 25 ne démontre pas la qualité de votre référencement. Cela démontre juste que Google a bien voulu passer du temps à indexer votre site alors que personne d’autre ne le mentionne, et qu’il présente quelques contenus avec des termes originaux (voire des fautes d’orthographe ou de frappe) pouvant attirer une poignée d’internautes par semaine.

Quand 40.000 visites représentent 15% de votre audience, en ayant pris soin de distinguer les visites en référencement naturel de celles en liens sponsorisés, cela peut juste indiquer que vous avez extrêmement bien diversifié vos sources de trafic et êtes peu dépendants des moteurs de recherche.

Enfin, si 50% de vos visiteurs provenant des moteurs de recherche viennent avec des expressions recherchées qui ne correpondent pas à votre activité, mais dont les combinaisons se trouvent par hasard sur votre site, il est clair que le référencement de votre site ne tient pas sa promesse: vous apporter des visiteurs motivés par votre activité.

La qualité de votre référencement organique ne s’évalue pas à la part d’audience provenant de Google, Yahoo, Voila ou MSN.

Il faut en revanche évaluer:

  • votre position dans les résultats de recherche (SERP) sur vos noms de marques et produits phare
  • votre visibilité sur les thématiques de votre activité
  • comparer votre visibilité à celle de vos concurrents
  • la qualité des visites apportées par le référencement naturel (transformations, re-visite, nombre de pages vues, durée de la visite) comparé aux autres affluents
  • la cohérence des expressions de recherche utilisées avec votre activité
  • l’évolution dans le temps de la part du référencement naturel
  • votre présence sur les principaux moteurs de recherche, dans des proportions voisines des parts de marché auditées

Mais être en bonne position sur les termes que vous croyez être ceux de votre public potentiel n’est pas non plus une fin en soi.

Un référencement organique réussi est un référencement qui valorise votre site et attire des visiteurs motivés sur toute la palette des expressions, des formulations, des requêtes utilisées par les internautes ayant une démarche active de recherche dans votre secteur d’activité.

Pour y parvenir, il faut développer une connaissance aigüe de votre public et de son vocabulaire. D’où l’importance d’associer le département commercial et le marketing à la démarche de référencement. Un outil proposant une forme de data-mining de votre audience vous apportera également une aide précieuse pour maintenir et élargir le vocabulaire utilisé sur votre site.

Diriez-vous que votre site a besoin d’un accompagnement en référencement naturel ?

Average Rating: 4.8 out of 5 based on 225 user reviews.

Quels sont les expressions de recherche et les mots clefs effectivement utilisés par les internautes qui seraient de bons visiteurs (qualifiés, pertinents) pour votre site internet, votre activité, votre "business" ?

Voilà bien une question fondamentale qui constitue une étape pivot dans la préparation et l'optimisation du référencement d'un site web. Aucun travail de SEO ne peut se permettre de passer outre cette étape.

Mais comment s'y prendre ? Un détour par hasard sur le site d'Olivier Andrieu, porte parole historique des référenceurs en France, m'a fait re-découvrir un outil que j'avais oublié: le keyword search engine.

Je profite de l'attribution du prix Goncourt aujourd'hui au livre "Les Bienveillantes" pour tester l'outil. Il faut préciser que ce livre est LE phénomène commercial de la rentrée littéraire (premier roman, 900 pages, top des ventes en librairie depuis début septembre, prix de l'Académie Française la semaine dernière, prix Goncourt élu au premier tour de scrutin aujourd'hui).

Quel est le résultat avec l'expression "les bienveillantes" ?

Nombre de fois où la requête les bienveillantes a été saisie le mois dernier sur le Web (estimation) :ZERO, oui, ZERO.

Certes, l'outil suggère d'autres formulations, avec des occurences cette fois-ci, mais ZERO avec le titre du livre !!??. Certes, l'outil ne prétend pas être exact. Et comment pourrait-il l'être en fait ?

Une certitude, il est loin d'être juste: car d'après les statistiques de visites d'un site qui n'est pas en première position sur cette recherche, donnent plus de 500 visites avec cette expression au mois d'Octobre, et 500 autres contenant cette expression combinée avec d'autres termes.

A vrai dire, un tel outil, qui soit fiable, transparent dans ses sources, et crédible dans ses résultats ferait beaucoup de bien à l'activité du référencement : il serait beaucoup plus simple pour tous les acteurs de travailler les expressions de recherche qu'ils ciblent et de trouver leur véritable public à moindre frais, qu'il s'agissent de campagnes AdWords ou de référencement naturel. Mais il faudrait soit la coopération des moteurs de recherche (le souhaient-ils ?) soit des éditeurs de site (là encore, le tabou n'est-il pas trop grand ?).

Et vous, comment faites-vous ? Seriez-vous intéressés par un tel outil ? 

 

Average Rating: 4.9 out of 5 based on 282 user reviews.

Pour ceux qui se risquent encore à faire du "cloaking" à l'attention des moteurs de recherche, voici une bonne source pour connaitre les véritables adresses IP des robots, comme GoogleBot, Exabot ou Yahoo Slurp.

Cela vient de l'interface de démo de Crawltrack, un outil de tracking des passages de robots. Voir la liste des robots venus sur ce site pendant 1 an.  Ce n'est pas 100% complet car rien ne dit que d'autres IP ne sont pas utilisées pour auditer d'autres sites, et des faux robots ont pu se glisser dans la liste, mais c'est quand même un bon début.

Spywords surveille également les passages de robots, mais ne donne pas cette information.

Pour ceux qui sont pressés, whois.arin.net donne une large plage d'adresses comme appartenant à Google (ne dit pas qu'il s'agit de la seule plage d'adresses) :

OrgName:    Google Inc.
OrgID:      GOGL
Address:    1600 Amphitheatre Parkway
City:       Mountain View
StateProv:  CA
PostalCode: 94043
Country:    US

NetRange:   66.249.64.0 – 66.249.95.255
CIDR:       66.249.64.0/19
NetName:    GOOGLE
NetHandle:  NET-66-249-64-0-1
Parent:     NET-66-0-0-0-0
NetType:    Direct Allocation
NameServer: NS1.GOOGLE.COM
NameServer: NS2.GOOGLE.COM
Comment:
RegDate:    2004-03-05
Updated:    2004-11-10

OrgTechHandle: ZG39-ARIN
OrgTechName:   Google Inc.
OrgTechPhone:  +1-650-318-0200
OrgTechEmail:  arin-contact@google.com

# ARIN WHOIS database, last updated 2006-10-18 19:10

Average Rating: 4.7 out of 5 based on 168 user reviews.