[phpBB Debug] PHP Warning: in file [ROOT]/viewtopic.php on line 2342: file_get_contents(http://www.like-rank.com/profile.php?id=eyIwIjoiZW56b3NwaGVyZSIsIjEiOiIzNnBvc2l0aW9ucyIsIjIiOiJwZnJzOTEiLCIzIjoicGhpbG5leHQiLCI0IjoiYmc2MiIsIjUiOiJwZnJzOTEiLCI2IjoiZW56b3NwaGVyZSIsIjciOiJwaGlsbmV4dCIsIjgiOiJwZnJzOTEifQ,,): failed to open stream: HTTP request failed! HTTP/1.1 404 Not Found
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 89: imagepng([ROOT]/urltoico/img/www.wifrance.com.png): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 83: file_put_contents([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 84: imagepng([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 18: getimagesize([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 22: imagecreatefrompng([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 26: imagecopyresampled() expects parameter 2 to be resource, boolean given
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 27: imagepng([ROOT]/urltoico/img/fr.wikipedia.org.png): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 86: unlink([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 83: file_put_contents([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 84: imagepng([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 18: getimagesize([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 22: imagecreatefrompng([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 26: imagecopyresampled() expects parameter 2 to be resource, boolean given
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 27: imagepng([ROOT]/urltoico/img/fr.wikipedia.org.png): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 86: unlink([ROOT]/urltoico/img/fr.wikipedia.org.pngB.PNG): Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 265: file_get_contents(http://g.etfv.co/tartarus.org): failed to open stream: HTTP request failed! HTTP/1.1 403 Forbidden
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 274: file_put_contents([ROOT]/urltoico/img/tartarus.org.png): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 83: file_put_contents([ROOT]/urltoico/img/alx2002.free.fr.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 84: imagepng([ROOT]/urltoico/img/alx2002.free.fr.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 18: getimagesize([ROOT]/urltoico/img/alx2002.free.fr.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 22: imagecreatefrompng([ROOT]/urltoico/img/alx2002.free.fr.pngB.PNG): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 26: imagecopyresampled() expects parameter 2 to be resource, boolean given
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 27: imagepng([ROOT]/urltoico/img/alx2002.free.fr.png): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 86: unlink([ROOT]/urltoico/img/alx2002.free.fr.pngB.PNG): Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 265: file_get_contents(http://g.etfv.co/www.jerome-pasquelin.fr): failed to open stream: HTTP request failed! HTTP/1.1 403 Forbidden
[phpBB Debug] PHP Warning: in file [ROOT]/urltoico/index.php on line 274: file_put_contents([ROOT]/urltoico/img/www.jerome-pasquelin.fr.png): failed to open stream: Aucun fichier ou dossier de ce type
[phpBB Debug] PHP Warning: in file [ROOT]/includes/session.php on line 1045: Cannot modify header information - headers already sent by (output started at [ROOT]/includes/functions.php:3906)
[phpBB Debug] PHP Warning: in file [ROOT]/includes/functions.php on line 4808: Cannot modify header information - headers already sent by (output started at [ROOT]/includes/functions.php:3906)
[phpBB Debug] PHP Warning: in file [ROOT]/includes/functions.php on line 4810: Cannot modify header information - headers already sent by (output started at [ROOT]/includes/functions.php:3906)
[phpBB Debug] PHP Warning: in file [ROOT]/includes/functions.php on line 4811: Cannot modify header information - headers already sent by (output started at [ROOT]/includes/functions.php:3906)
[phpBB Debug] PHP Warning: in file [ROOT]/includes/functions.php on line 4812: Cannot modify header information - headers already sent by (output started at [ROOT]/includes/functions.php:3906)
ancres moteur de recherche

Vous aimez ? Like-Rankez ;) Like-Rank


ancres moteur de recherche

le Mer 2 Oct 2013 13:01

Salut tout le monde.
Je suis en train de développer mon propre moteur de recherche

Pour l'instant c'est que du php/mysql.

Quand l'utilisateur tape un mot clé je dois lui afficher aussi des liens vers Recherches associées au mot clé qu'il a tapé.

Exemple : s'il tape "annuaire"
J'affiche des liens :
annuaire pages blanches
annuaire portable
annuaire international
annuaire belgique
annuaire suisse
annuaire mobile
annuaire mairie
annuaire belge

C'est là que je bloque, je sais pas sur quoi me baser pour trouver ces ancres..
Alors si quelqu'un a une idée je suis preneur..





enzosphere




le Mer 2 Oct 2013 14:08     Re : ancres moteur de recherche      

Bah la question est loin d'être simple à traiter et doit certainement avoir déjà fait l'objet de nombreuses recherches universitaires (à trouver).
En gros, il faut que tu trouves un critère pour discerner la proximité "sémantique" entre les diverses expressions, et que tu injectes une peréquation pour discerner celles qui sont les plus volumiques (recherchées) parmis les expressions proches, si tu veux t'inspirer de ce qui se fait.
Google fonctionnait (avant le knowledge graph, et pour ce que j'en sais), en utilisant les cooccurences pour déterminer les requètes qu'on trouvait dans le même environnement et batissait ainsi un champs lexical parmi lesquels il choisissait les expressions qu'il considèrait comme associées. Avec le knowledge graph, je ne sais pas comment il fait.
Bref, bon courage, parceque si la question est simple, son traitement l'est nettement moins. ;)



Merci de : enzosphere



36positions



le Mer 2 Oct 2013 16:52     Re : ancres moteur de recherche      

Tu peux peut etre essayer de scrapper l'auto completion de Google au fur et à mesure pour te constituer une base de données d'expressions connexes.
De manière secondaire il va falloir que tu gères les fautes d'orthographe, le singulier/pluriel, masculin / feminin etc....Tu as des classes PHP avec des dictionnaires qui te permettent de gérer justement la lémmatisation

Il y a un outil de lemmatisation en version beta ici .
Comme dit 36positions ce n'est pas un petit chantier auquel tu t'attaques!



Merci de : enzosphere



pfrs91



le Jeu 3 Oct 2013 09:34     Re : ancres moteur de recherche      

Je ne suis pas d'accord avec les réponses précédentes. La démarche est simple : en fait tu stockes les recherches demandées et lors d'une nouvelle recherche tu proposes la liste des recherches précédentes comprenant tout ou partie du (ou des) mot saisi.
Bon y'a un peu de boulot pour proposer dans l'ordre d'abord les plus demandées mais bon...
Après, bien sûr, tu peux attaquer les problèmes de fautes diverses et de multiples orthographes, puis ensuite te poser la question de l'environnement sémantique.



Merci de : enzosphere



philnext


le Jeu 3 Oct 2013 12:07     Re : ancres moteur de recherche      

la finalité de ce "moteur" de recherches ... c'est quoi en fait ???
et le codage ou autres ... laissent plus qu'à désirer ( pour l'instant j'espère ...)
exemple je taPPPPe " fonds d'écran " et j'obtiens UNE réponse :
panneaux michelin | photos de vieux panneaux de signalisations routières micheli
http : / / w w w .photoguide.cz/panneaux-michel
new - cartes postales anciennes >> plaque municipale | puy de dome | bornes | plaques | p...
panneaux michelin, carte postale anciennes. photos de vieux panneaux de signalisations routières michelin

y a pas comme un bug ou plus grave là ... ???





bg62



le Jeu 3 Oct 2013 12:14     Re : ancres moteur de recherche      

philnext a écrit:Je ne suis pas d'accord avec les réponses précédentes. La démarche est simple : en fait tu stockes les recherches demandées et lors d'une nouvelle recherche tu proposes la liste des recherches précédentes comprenant tout ou partie du (ou des) mot saisi.
Bon y'a un peu de boulot pour proposer dans l'ordre d'abord les plus demandées mais bon...
Après, bien sûr, tu peux attaquer les problèmes de fautes diverses et de multiples orthographes, puis ensuite te poser la question de l'environnement sémantique.

Sauf qu'avec ta méthode si il y a beaucoup de mots dans son moteur il n'est pas prêt d'avoir des recherches connexes qui répondent à chaque fois.
C'est dangereux de faire ça de manière brute comme ça car les utilisateurs peuvent détourner ce qui est affiché (je te dis ça pour l'avoir fait il y a quelques années ^^)

Trop dépendant des utilisateurs là si on mise tout sur cette méthode mais par contre c'est un complément pour arriver à des termes précis



Merci de : enzosphere



pfrs91



le Jeu 3 Oct 2013 13:14     Re : ancres moteur de recherche      

@36positions, merci pour ces conseils. effectivement je me rends compte qui c'est pas simple comme algo.
@pfrs91, merci à toi aussi, t'as l'air de bien d'y connaitre ;) je suis en train de lire la doc que tu m'as fournis.
@philnext merci, j'ai pensé à ta méthode, mais malheureusement pour démarrer j'ai pas trop de requêtes de la part des visiteurs. -> à étudier..
@bg62 le but d'un moteur de recherche c'est de chercher en fait ! sinon c'est la version bêta du moteur de recherche, il n'y a que 30000 url d'indexée.. pour l'instant
et je suis entrain de finaliser le crawl global.

Bon aprèm à tous :wink2:





enzosphere


le Jeu 3 Oct 2013 15:22     Re : ancres moteur de recherche      

Ma réponse est dans l'environnement actuel c'est à dire rajouter une fonction sympathique mais pas primordiale pour un moteur de recherche.
D'ailleurs certains moteurs (duckduckgo par exemple) ne l'utilisent pas pour à la fois anonymiser et ne pas biaiser les recherches.
Je ne connais pas ton projet mais mon conseil serait de consacrer ton énergie au crawl à l'algo de pertinence et aux performances.
Je continue de penser que ma proposition est la meilleure en terme de rapport efficacité/coûts de dev.
Le seul bémol sérieux est effectivement celui soulevé c'est la problématique de 'détournement' mais bon ça se règle...





philnext


le Jeu 3 Oct 2013 16:53     Re : ancres moteur de recherche      

Ton approche est pas mal si il y a beaucoup d'internautes qui font des recherches sur un spectre très large.
En réel tu risques de te retrouver avec la loi des 20 /80 et donc 80% de tes termes qui n'auront pas d'expressions connexes.

@enzosphere tu as bcp de recherches déjà ? Si oui, combien d'expressions distinctes?
D'ailleurs tu a combien de termes associés en moyenne par URL?





pfrs91






Retourner vers Développement d'un site web

 


  • Articles en relation
    Réponses
    Vus
    Dernier message
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 4 invités
 


  • Information sur les posteurs
  • pfrs91

    Habitué
    Remerciements : 86
    Mon blog SEO / Web Jeromeweb.net
    312 Messages
    3 sur ce sujet
    Inscription Oct 2012
    site web
  • enzosphere

    Occasionnel
    Remerciements : 32
    Avatar du membre
    93 Messages
    2 sur ce sujet
    Inscription Mai 2013
  • philnext

    Régulier
    Remerciements : 239
    Avatar du membre
    641 Messages
    2 sur ce sujet
    Inscription Fév 2012
  • 36positions

    Impliqué
    Remerciements : 347
    Avatar du membre
    « Ne craignez jamais de vous faire des ennemis ; si vous n'en avez pas, c'est que vous n'avez rien fait. » - Georges Clemenceau
    3414 Messages
    1 sur ce sujet
    Inscription Aoû 2011
    site web
  • bg62

    Impliqué
    Remerciements : 558
    Avatar du membre
    3539 Messages
    1 sur ce sujet
    Inscription Déc 2010
    site web

allez en bast