Outil de détection des Mot clefs les plus important

le Ven 5 Aoû 2011 01:57

Bonjour

Je suit en train de coder un outil pour détecter les mots clef les plus importants d'une pages.

le voici : http://fr.webmaster-rank.info/analyse/
Merci de le tester et de me donner vos avis ;)

Pour le coté technique

----------------
Je me suit très fortement inspiré de la méthode TD-IDF
Je prend de multiples critère pour calculer une note composé :

Critère sur la page "on page", importance dans la page
- longueur du mots "log"
- fréquence du mots dans la page
- nombre de mot de la page "sqrt"

Critère externe "off page", importance sur l'ensemble des autres page déjà testé
- nombre de document unique contenant le mots. "unité"
- nombre total d'occurrences du mots sur les autres pages. & nombre d'occurrences par page contenant ce mot "log"


Pour l'instant les donnée sont totalement brute et le reflet d'un simple algo,
je n'ai pas encore rajouté de bidouillage visant à gommer certaines erreurs.
Pour l'échelle, j'en ais mis une une arbitrairement car je ne sait pas encore a quoi ressemblerons les valeurs.


n°1 : Essayez SEO Soft, le logiciel de référencement open source

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40







    
 

le Ven 5 Aoû 2011 06:35

Ultra rapide ! A peine un clic et pouf...

Deux petites suggestions :

1: retirer les articles (de, d') de la liste des MC renvoyés
2: Mettre un choix (par ex. bouton radio) pour faire apparaitre soit des MC de 1, 2 ou 3 mots

+


Lexique informatique - referencement anglophone

Avatar de l’utilisateur   
rsw
Like Rank Total : 5.5    
Actif
 
Messages : 2086
Inscription : Mar 24 Mai 2011 13:43
Localisation : Paris

le Ven 5 Aoû 2011 07:14

Bonjour,
Bonne idée, mais les résultats sont assez étonnants (voir réellement faux) pour l'instant. Bien normal je suppose c'est pour ca que nous testons :
- Dans la liste des mots clés, j'ai des mots clés qui ne se retrouvent pas isolés comme par exemple le mot clé "séléction d'accessoires" pour quoi les mots ne sont pas comptabilisés séparément ? De même j'ai un "imagination.", un "travail. avec" ou "pour un".
- J'ai l'impression que l'outil ne considère pas les mots clés majuscules et minuscules comme identiques.
- J'ai aussi l'impression qu'il ne prend que les textes et pas les menus, les alts des images, les meta-title et description qui sont pourtant très importants.
Il y a donc quelques corrections. Bonne initiative.



sergio95810    
Actif
 
Messages : 10
Inscription : Dim 10 Jan 2010 13:55
Localisation : Vauréal (95)

le Ven 5 Aoû 2011 08:05

Merci RSW.
Pour le nombre de mots clef c'est prévu pour la suite.
1 - ce n'est pas exclut en mode bidouille de l'outil.
Il faut que je regarde préalablement un peut des résultats, pour voir si cela vient du système ou de la page qui contiendrait trop de ces mots clef.

2- Le travail sur plusieurs MC est différent et complémentaire, donc je travaille déjà sur 1MC.


n°1 : Essayez SEO Soft, le logiciel de référencement open source

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40

le Ven 5 Aoû 2011 08:12

Merci sergio95810
Bonjour,
- Dans la liste des mots clés, j'ai des mots clés qui ne se retrouvent pas isolés comme par exemple le mot clé "séléction d'accessoires" pour quoi les mots ne sont pas comptabilisés séparément ? De même j'ai un "imagination.", un "travail. avec" ou "pour un".

C'est erreur ne sont pas normale, peut être un encoding mal compris par l'outil
Tu peut me donner l'url testée.


- J'ai l'impression que l'outil ne considère pas les mots clés majuscules et minuscules comme identiques.

Idem, il devrait. :(

- J'ai aussi l'impression qu'il ne prend que les textes et pas les menus, les alts des images, les meta-title et description qui sont pourtant très importants.
Il y a donc quelques corrections. Bonne initiative.

Pour l'instant il prend en considération contenue texte+ title+description.
Pur les ALT je verrais peut être plus tard, mais j'ai le sentiment que ces données sont très peut pertinente (keyword styuffing,etc...)


n°2 : Restez informé, suivez toutes les actualités du référencement et des moteurs de recherches

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40

le Ven 5 Aoû 2011 09:14

Salut nifrou, et les autres.

Quelques remarques après un premier test :

1) Effectivement très rapide, chapeau bas. :D

2) Les valeurs indiquées dans le tableau de résultat ne contiennent aucune unité ; difficile de l’interpréter quand on est entre 64 et 72 du min au max.
Trouver et indiquer une échelle pertinente faciliterait la compréhension (exemple %). :o

3) La meta keyword ne sert à rien, mais la méta desc est parfois utilisée pour le snipet, donc ce serait intéressant de l'analyser aussi. ;)

4) Une extension très intéressante, quand tu auras le temps, analyser la page citée, et toutes celles qui sont liées sur le domaine. Je sais, c'est lourd à coder, mais si l'on à 400 pages différentes, les analyser une par une est rédhibitoire ; et c'est le poids des KW du site qui va servir aux moteurs de recherche pour "quantifier" un site sur un KW. donc se serait une indication précieuse. :P

5) Pourquoi ne pas ajouter une ch'tite fonction qui permet de sauvegarder les résultats dans un tableau (en csv) avec la date ? cela permettrait de faire un suivi au fil des modifications pour chaque site. :idea:

Voila un premier jet de réflexions, bon courage ! tu vas voir, on va t'en demander encore tout plein. :mrgreen:



ricoclic    
Nouveau
 
Messages : 4
Inscription : Dim 6 Mar 2011 08:49
Localisation : fluctuante

le Ven 5 Aoû 2011 09:29

salut ricoclic

1) merci, oui c'est rapide je me suit développé une petite fonction PHP de téléchargement bas niveau très rapide (et surtout qui supporte l'html compressé).

2) Oui il faut maintenant que je travaille sur l’échelle, par compte la valeur et une valeur très "ibride" donc il n'y à pas d'unité... j'espere trouver

3) en plus de la page, j'ai inclut la description et le title dans le calcul

4) c'est l'objectif final de ce travail, j’intégrerais cette fonctionnalités dans SEO FIX

5) super intéressant comme idée :), j'y cours

merci pour toutes ces idées ;)


n°2 : Restez informé, suivez toutes les actualités du référencement et des moteurs de recherches

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40

le Ven 5 Aoû 2011 09:44

C'est pas pour dire du mal mais quand-même, y a pas de raison de se priver, hein, quand on peut :) ...

... mais maintenant qu'il y a SEOsof/seoFix/ le tester de MC et celui de PR...., cette page ne reflète pas trop la réalité des "Outils Gratuits" et mériterait un bon coup de rajeunissement > http://fr.webmaster-rank.info/?outils_r ... nt_gratuit :P


Lexique informatique - referencement anglophone

Avatar de l’utilisateur   
rsw
Like Rank Total : 5.5    
Actif
 
Messages : 2086
Inscription : Mar 24 Mai 2011 13:43
Localisation : Paris

le Ven 5 Aoû 2011 10:02

Tout à fait, tu a s raison RSW :)
Cela devient de plus en plus urgent, ça avec une page de présentation de SEOFIX bien travaillé.
Il faudrait que je me décide à laisser tomber un peut le dev des outils pour faire un peut d’écriture web et aussi du webmarketing


n°2 : Restez informé, suivez toutes les actualités du référencement et des moteurs de recherches

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40

le Ven 5 Aoû 2011 10:12

Après avoir testé le logiciel je vois que "spécifiques" est le mot clé le plus important de ma page alors qu'il n'apparaît que 2 fois sur toute la page. Normal docteur ?


5 crédits nécessaire (1 ligne(s) + 2 Lien(s) en signature + 1 profil WWW + 0 mise(s) en forme)
Vous avez seulement 4 crédits de disponible :(
Vérifiez les nouvelles rêgles des signatures du forum, SVP

Avatar de l’utilisateur   
openeyes
Like Rank Total : 1    
Actif
 
Messages : 388
Inscription : Mar 24 Aoû 2010 14:43
Localisation : Thionville - Lorraine

le Ven 5 Aoû 2011 10:47


n°3 : Vous appréciez une discussion, augmentez sont Like Rank afin d'en faire profiter les autres membres
Vous appréciez la réponse d'un membre, remerciez-le en votant dans sa page de profil (cliquez sur son nom pour l'ouvrir)

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40

le Ven 5 Aoû 2011 11:37

Je viens de remarquer en testant page w3c/html 4.01 transitionnal/utf8

- Que ce caractère là [ • ] était comptabilisé comme MC
- Que les résultats sont TRES différents si on met ou pas le -http://


Installation Windows - referencement google

Avatar de l’utilisateur   
rsw
Like Rank Total : 5.5    
Actif
 
Messages : 2086
Inscription : Mar 24 Mai 2011 13:43
Localisation : Paris

le Ven 5 Aoû 2011 13:29

Merci Nifrou pour le travail réalisé. :)


Améliorer le contenu de votre site : Rédaction Web.
Avoir un : Audit de référencement.

Avatar de l’utilisateur   
Madrileño
Like Rank Total : 12    
Actif
 
Messages : 2645
Inscription : Ven 2 Mai 2008 03:35
Localisation : Europe

le Ven 5 Aoû 2011 15:27

Encore une tite remarque :

Les mots séparés par un point ne sont pas différenciés ; exemple cheeseburger.ingrédients.

Ni les mots qui commencent par une majuscule face à la version minuscule ; émincés / Émincés.

Cordialement, Rico. :mrgreen:



ricoclic    
Nouveau
 
Messages : 4
Inscription : Dim 6 Mar 2011 08:49
Localisation : fluctuante

le Ven 5 Aoû 2011 16:37

nifrou a écrit:salut, pour http://www.openeyes.fr ?


Oui :?


5 crédits nécessaire (1 ligne(s) + 2 Lien(s) en signature + 1 profil WWW + 0 mise(s) en forme)
Vous avez seulement 4 crédits de disponible :(
Vérifiez les nouvelles rêgles des signatures du forum, SVP

Avatar de l’utilisateur   
openeyes
Like Rank Total : 1    
Actif
 
Messages : 388
Inscription : Mar 24 Aoû 2010 14:43
Localisation : Thionville - Lorraine

le Ven 5 Aoû 2011 16:46

Merci je note tout cela :)
je m'absente quelque jours, ça me fait pas mal d'amélioration à apporter des que je revient :)


n°1 : Essayez SEO Soft, le logiciel de référencement open source

Avatar de l’utilisateur   
nifrou
Like Rank Total : 10.5    
Administrateur
 
Messages : 1870
Inscription : Ven 29 Fév 2008 03:40







    
 

Retourner vers Les outils web & le logiciel SEO Soft




Autres sujets proches :
Outil de gestion d'échange de lien       09/07/2011
rectangle "TAGS"? outil pour mots clés idéaux?       21/12/2011
Mot clef et forum       22/12/2011
Recherche outil d'alerte temps de chargement       29/12/2011
Outil de référencement gratuit !       20/01/2012
outil de ping       05/05/2012
Densité des mots clef       30/06/2009
Nom de domaine .fr ou .com important ? + Avis       28/08/2009