Intelligence Center
Chercher sur Intelligence Center
La recherche d'informations sur le net Actualité des moteurs de recherche
Accueil

Comment trouver des
Weblogs
Outils de traduction Actualités, News
Infos sociétés, bilans

MP3
Images, Photos

Cartes Plans Itinéraires
Web invisible
Définitions
Bases de données

Outils de recherche
Bibliothèques en ligne
Bibliographie
Outils de recherche
L'ULTRABAR
Moteurs de recherche
Moteurs disparus
Annuaires
Métamoteurs
Cartographie du web
Agents intelligents
Google :
Actualité quotidienne
Astuces, fonctions...
Langues et pays

Stratégie de Google Inc.

Actualités

Faits marquants
International news

Ressources spécialisées


Faits marquants
juin 2003

faits marquants sélection de l'actualité des outils de recherche
Une sélection de l'actualité des moteurs de recherche
 
 
L'actu quotidienne de Google

International news : L'actualité des moteurs dans les médias internationaux
Actuellement

Archives Faits marquants :
mai 2003mars 2003janvier 20033eme trimestre 20021er trimestre 2002
avril 2003février 20034eme trimestre 20022eme trimestre 20022001
 
 
Juin 2003
 

Microsoft prépare son nouveau moteur de recherche

  19 juin 2003
On en parle depuis avril, Microsoft prépare SON moteur de recherche. Et depuis avril, le passage du spider MSNBOT sur les sites web est de plus en plus fréquent. Microsoft posséde l'un des sites majeurs de la planète, MSN, mais ne dispose pas de sa propre technologie de recherche et d'indexation puisque ses portails fonctionnent avec la base Inktomi (racheté par Yahoo!). Et puis Microsoft a clairement déclaré vouloir concurrencer Google qu'il trouve menaçant, celui-ci développant peu à peu tous les services essentiels que l'on peut retrouver sur un portail de recherche. La FAQ MSNBOT précise que Microsoft n'a pas fixé de date mais qu'il a au final l'intention d'intégrer le contenu crawlé aux résultats de MSN Search. Voila pour l'index. Le doute sur la volonté de Microsoft de développer un moteur est complètement levé lorsque l'on regarde les offres d'emploi de MSN Search. L'entreprise recherche un Group Program Manager, un responsable pour diriger l'équipe de développeur du futur moteur. Une rumeur prétend que Microsoft ayant échoué dans le rachat de Google, la firmede Seattle doit maitenant développer un moteur capable de véritablement concurrencer Google mais également Overture qui a racheté Altavista et FAST/AlltheWeb. A suivre...#
[Source : Pandia]
 
 

Accès au Semantic Web pour le nouveau moteur de Sinequa

  19 juin 2003

Dans son dernier communiqué, Sinequa, éditeur de logiciels et de services spécialisés dans la recherche d'information vient d'annoncer le support des technologies Adobe afin de faciliter l’intégration, l’utilisation et la diffusion des technologies liées au "Semantic Web". La nouvelle version de son moteur de recherche Intuition aura pour objectif de permettre aux entreprises d’accéder au Semantic Web. En effet, la version 4 d’Intuition implémentera le format XMP d’Adobe. XMP permet la diffusion de contenu de façon transparente, que ce soit sur support papier, Web, livre électronique ou tout autre média. La norme XMP fournit une infrastructure ouverte, basée sur des métadonnées XML. Grâce à cette intégration, la future version d’Intuition pourra indexer des métadonnées encapsulées dans les fichiers images, PDF ou tout autre fichier binaire. De plus, les bases de connaissances d’Intuition version 4 seront compatibles avec la norme RDF. De cette manière, il deviendra possible d’utiliser les fonctions de recherche et de navigation sémantiques d’Intuition pour retrouver des fichiers multimédia tels que des images, des sons ou des vidéos.
Sinequa édite des solutions de recherche d'information (moteurs, catalogue, navigation) et équipe des portails web comme Allocine, LaRedoute ou des entreprises comme Net2One ou Arisem. #
[Source : Sinequa].

 
 
Altavista étend sa base multimédia à 550 millions de fichiers
  18 juin 2003
Altavista a annoncé hier que sa base multimédia (fichiers images, audio et vidéo) comptait désormais 550 millions de fichiers- ce qui en fait l'index multimédia le plus important du monde puisque comportant 125 millions de fichiers de plus que son plus proche conncurrent (à savoir Google).Une anonce qu'il faut relativiser puisque Google annonce 425 millions de fichiers pour sa seule recherche d'images et que les 550 millions d'Altavista concernent les images plus le son et la vidéo. Néanmoins, Altavista semble avoir dépassé Google en terme d'indexation des images (donc 540 millons contre 425). Pour la vidéo et l'audio, l'index comporte désormais 11 millons de fichiers incluant les formats les plus populaires tels que le MP3 ou le MPEG. Altavista a inclut des millions de fichiers issus de ses index de pays étrangers et à d'autre part amélioré ses fonctions de recherche d'images : l'internaute peut désormais rechercher selon des critère de taille d'image et de résolution (petite, moyenne, grande, 640x480, 800x600,...). En outre, le nouvel index inclut maintenant des images professionnelles issues de fournisseurs majeurs tels que Corbis (Groupe Microsoft). Pour accéder à la recherche mulimédia, il vous suffit de cliquer sur les onglets MP3/Audio, Vidéo ou Images. #
> plus sur les moteurs de recherche d'images
[Source : Overture]
 
 
Google en question(s)
  12 juin 2003
Google est le moteur de recherche leader, en France (59,9% de part de marché *) et dans le monde (55,2% **).
Normal (ou du moins habituel) dans ces conditions que le moteur californien accapare la majorité des attentions, des inquiétudes et des attaques du monde du web. Les webmasters guettent fébrilement le positionnement de leurs sites, et les journaux, magazines et webzines écrivent beaucoup sur Google. Pour certains, écrire sur Google plutôt que sur Altavsita ou Alltheweb, c'est une audience assurée. A tel point que certains journaux multiplient les articles sur le moteur sans réellement connaître leur sujet. Andrew Orlowski du Register (San Francisco) a fait très fort dans ce domaine : beaucoup de lignes écrites à partir de pures spéculations…
Ex : Blog noise is 'life or death' for Google, Google to fix blog noise problem.
Google est observé et particulièrement depuis le début de l'année, les attaques sont devenues fréquentes à son sujet avec une dizaine d'articles hebdomadaires plus ou moins durs.
Cette semaine ne fait pas exception à la règle :

[Suite]
 
 
 
Le métamoteur Turbo10 se connecte à plus de 1000 moteurs
  5 juin 2003
Le métamoteur britannique Turbo10 a présenté le 29 mai une nouvelle fonctionnalité intéressante : la possibilité de se connecter à plus de 1000 moteurs spécialisés ou généralistes. Turbo10 interroge par défaut altavista.com, dogpile.com, google.com, hotbot.com, lycos.com, metacrawler.com , search.msn.com et yahoo.com, donc des moteurs plutôt anglophones.
Vous pouvez choisir de rajouter, grâce au module "My Collection", les moteurs figurant dans une liste assez impressionnante (1170 à ce jour). Vous pouvez choisir un moteur généraliste comme voilà.fr ou des moteurs spécialisés. Ce qui permet à Turbo10 d'explorer (un peu) le fameux "web invisible" ou "web profond" (l'équipe a même déposé la marque Deep Net !). Car cette liste propose des moteurs internes de portails, vastes bases de données universitaires ou sites de e-commerce : zdnet.com, amazon.com, europages.net (annuaire de sociétés), imdb.com (cinéma), dictionary.com (dicos et thésauri), eea (european environment agency), encyclopedia.com, findarticles.com (archives d'articles depuis 1998), etc…Une fois constituée votre collection de moteurs, celle-ci apparaîtra dans un menu déroulant à droite de votre boite de requête.
C'est pour l'instant très américain, les ressources francophones sont rares (google.de est présent mais pas encore google.fr). Aussi, vous pouvez proposer le moteur de votre site ou développé par votre société ou toute autre moteur que vous souhaiteriez voir ajouté à la base.
Le CEO (PDG) de Turbo 10 Nigel Hamilton explique : "se connecter à 1000 moteur est seulement la partie immergée de l'iceberg. En créant un système automatisé, on peut se connecter à plusieurs milliers …". La liste des moteurs de recherche est d'ailleurs mise à jour toute les 5 minutes et leur nombre est indiqué sur la page d'accueil de Turbo10.
Pour une version bêta, c'est assez rapide (malgré une surcharge annoncée). Par contre, la navigation n'est pas toujours des plus intuitives et la page des résultats, un peu dense, manque de lisibilité.#
>Ce nouveau Turbo10 a été présenté lors de la 12ème semaine des conférences internationales sur le World Wide Web à Budapest.
> Plus sur les métamoteurs
[Source : Intelligence Center, Turbo10]
 
 
 Les moteurs de recherche du futur
  2 juin 2003
Lors de la 12ème semaine des conférences internationales sur le World Wide Web à Budapest, a été évoqué le futur (proche) des moteurs de recherche. Rapides, intelligents, personnalisés selon les besoins de l'utilisateur. C'est ce que devraient être les moteurs de recherche du futur.
c..François SchuitenTandis que sous le capot les moteurs se sont considérablement amélioré depuis le début du web, d'apparence, ils ne changent guère.
Mais les ingénieurs travaillent sur de nouvelles interfaces et technologies de recherche qui pourraient améliorer de manière significative les pages de résultats. On peut par exemple s'attendre à évoluer parmi les résultats grâce une interface graphique ou personnaliser les résultats de Google.
Une équipe de chercheur japonais de NEC a présenté un document intitulé "Mining the Peanut Gallery" (PDF) décrivant un outil qui permettrait à des consommateurs d'obtenir automatiquement des revues de presse sur un produit. L'outil Review Seer fonctionnerait sur le recueil de notation de produits effectués par les internautes sur les newsgroups usenet ou sur les forums de sites web. Les internautes pourraient préciser leur recherche en indiquant les fonctionnalités du produit et les tranches de prix souhaitées. Un tel outil doit faire face à certaines difficultés de l'ordre de la subjectivité humaine : comme ces revues de produits qui ne comportent de nombreux commentaires négatifs puis se terminent avec une phrase positive…

D'autres intervenants se sont concentrés sur les nouvelles manières de présenter les résultats aux internautes.
Ben Shneiderman, professeur d'informatique à l'université du Maryland, est convaincu que la plupart des personnes communique mieux avec leurs ordinateurs quand elles peuvent voir des données avec des interface graphiques, plutôt que simplement les lire ou les écrire. Il a ainsi présenté plusieurs outils de recherche visuelle, comme le "TimeSearcher", qui permet d'illustrer par des graphiques les résultats de recherche. des données de résultat de recherche.
Quant aux outils PhotoMesa et PhotoFinder, ils combinent navigateur et moteur de recherche spécialement conçus pour rechercher des images numériques

Par la suite les moteurs de recherche pourront consulter les cookies (problème de confidentialité à la clé !) afin de déduire de ses recherches passées que l'utilisateur recherche tel type d'info plutôt qu'un autre (quand vous recherchez avocat vous vous intéressez plutôt au fruit et non au juriste). L'utilisation des cookies pourraient aussi ne renvoyer que les nouvelles informations ou les données adaptées à la localisation géographique. de l'internaute.
Mais la personnalisation des résultats de recherche ne sera possible tant qu'un moteur comme Google (déjà connu pour sa vitesse) ne sera pas 10 fois plus rapide !
Google pourrait accroître sa vitesse de recherche en utilisant des techniques développées par les chercheurs de l'Université de Stanford ("génitrice" des fondateurs de Google Page et Brin) qui ont présenté leurs travaux à la conférence.
Sepandar Kamvar, un de ces chercheurs, précise que beaucoup de fausses idées ont été écrites sur l'impact de leurs travaux : "Si nos résultats de recherche sont mis en oeuvre, Google ne pourra pas être 5 fois plus rapide, mais nous espérons toutefois un gain de vitesse de l'ordre de 30%".Selon Kamvar, on pourra bientôt espérer, à l'issue de ces travaux, accélérer la vitesse de recherche, rafraîchir les résultats et les personnaliser.
Le co-fondateur de Google Sergei Brin était parmi le public de la conférence.

A noter que La plupart de ces fonctionnalités évoquées pour des moteurs en ligne existent déjà pour via de gros logiciels de KM et de veille à interface propriétaire et installés localement sur un serveur : Arisem KM Server, Digimind Evolution…#
[Source : Wired News]

 
 
Nouvelle Analyse de la fraîcheur des index des moteurs   2 juin 2003

Greg Notess vient de publier sur Searchenginshowdown la dernière version de ses statistiques sur "la fraîcheur" des index des moteurs. La précédente remontait au 20 octobre 2002.
Cette étude analyse le degré de rafraîchissement des données des moteurs (mesure effectuée le 17 mai ). 8 moteurs (MSN et HotBot à travers Inktomi, Google, AlltheWeb, AltaVista, Gigablast, Teoma et WiseNut) sont comparés à travers 6 requêtes concernant des pages de sites web rafraîchies tous les jours et qui indiquent cette date de mise à jour en clair.
Il ressort principalement que :
- la plupart des moteurs affichent des résultats indexés ces derniers jours
- mais la majeure partie des bases de données est vielle d'un mois environ
- quelques pages n'ont pas été ré indexées depuis très longtemps (comme certaines de AltheWeb non réactualisées depuis septembre 2001)
Le classement prend en compte la date de la page la plus récente et la date de la page la plus ancienne.
C'est Inktomi pour MSN et Hotbot qui prend la 1ère place avec les pages les plus récentes qui datent d'1 jour, les plus anciennes de 51 jours. Google recule donc d'une place par rapport à la mesure d'octobre. Sa page la plus récente date de 2 jours, la plus ancienne de 165 jours (il est vrai que Google ne rafraîchit pas ses pages régulièrement. Le rafraîchissement peut ainsi curieusement stopper pendant 3 à 4 jours puis reprendre quotidiennement).Suit ensuite Alltheweb qui pourrait occuper une meilleure place sans quelques pages très anciennes datant de 400 ou 599 jours. Car ses pages les plus récentes ont 1 jour. Teoma et Wisenut ne progressent que très lentement dans le domaine de la fraîcheur de leurs index puisque leurs pages les plus récentes ont respectivement 41 et 133 jours...#
[Source : Search Engine Showdown]

 
 
 
Archives
 
Faits marquants mai 2003
Correction orthographique sur AlltheWeb
Google Colombie
60% des résultats identiques sur les moteurs ?
Le retour de Northern Light ?
Wondir, un nouvel outil de recherche
Nouvelle version de Net2One
Nouvelles fonctions sur AlltheWeb
3 nouveaux pays pour Google
Barres d'outils : dynamisez vos recherches !
Google News lance des versions régionales
MSN lance un service d'alerte de dépêches
Daypop : nouvelle fonction + interview de son créateur
Google proposera un moteur spécifique aux blogs

Lancement du weblog inFLUX
Google Alert V2
Copernic Agent lance sa version 6.1
Google offre des dépêches en français
Lancement de Weblogues.com
Décisions de justice et passé
 
Faits marquants avril 2003
4 nouveaux pays pour Google
Sondages en ligne : des résultats trompeurs
Une nouvelle version pour Ask Jeeves
Nouvelles fonctions sur Alltheweb

8 nouveaux pays pour Google
Google en chiffres
Google News mélange les sources
Yahoo.com rafraîchit son interface de recherche
Transfert.net, Chroniques de Cybérie, le retour...
Microsoft s'intéresse aux moteurs de recherche
Les recherches sur Al-Jazeera explosent
News Now monte en puissance
Un rafraîchissement quotidien pour Wisenut ?
Google Taiwan
Les gagnants des Blogs d'Or 2003
KartOO rénove sa version HTML
mars 2003  
février 2003  
janvier 2003     
Faits marquants 4ème trimestre 2002 : octobre-novembre-décembre

Faits marquants 3ème trimestre 2002 : juillet-août-septembre

Faits marquants 2ème trimestre 2002 : avril-mai-juin

Faits marquants 1er trimestre 2002 : janvier-février-mars

Faits marquants 2001