|
Faits
marquants
juin 2003
| | Une sélection de l'actualité des moteurs de recherche | | | L'actu quotidienne de Google |
International news :
L'actualité des moteurs dans les médias internationaux
Actuellement
| | | Juin 2003 | | Microsoft prépare son nouveau moteur de recherche | 19 juin 2003 | On en parle depuis avril, Microsoft prépare SON moteur de recherche. Et depuis avril, le passage du spider MSNBOT sur les sites web est de plus en plus fréquent. Microsoft posséde l'un des sites majeurs de la planète, MSN, mais ne dispose pas de sa propre technologie de recherche et d'indexation puisque ses portails fonctionnent avec la base Inktomi (racheté par Yahoo!). Et puis Microsoft a clairement déclaré vouloir concurrencer Google qu'il trouve menaçant, celui-ci développant peu à peu tous les services essentiels que l'on peut retrouver sur un portail de recherche. La FAQ MSNBOT précise que Microsoft n'a pas fixé de date mais qu'il a au final l'intention d'intégrer le contenu crawlé aux résultats de MSN Search. Voila pour l'index. Le doute sur la volonté de Microsoft de développer un moteur est complètement levé lorsque l'on regarde les offres d'emploi de MSN Search. L'entreprise recherche un Group Program Manager, un responsable pour diriger l'équipe de développeur du futur moteur. Une rumeur prétend que Microsoft ayant échoué dans le rachat de Google, la firmede Seattle doit maitenant développer un moteur capable de véritablement concurrencer Google mais également Overture qui a racheté Altavista et FAST/AlltheWeb. A suivre...# [Source : Pandia] | | | Accès au Semantic Web pour le nouveau moteur de Sinequa | 19 juin 2003 | Dans son dernier communiqué, Sinequa, éditeur de logiciels et de services spécialisés dans la recherche d'information vient d'annoncer le support des technologies Adobe afin de faciliter lintégration, lutilisation et la diffusion des technologies liées au "Semantic Web". La nouvelle version de son moteur de recherche Intuition aura pour objectif de permettre aux entreprises daccéder au Semantic Web. En effet, la version 4 dIntuition implémentera le format XMP dAdobe. XMP permet la diffusion de contenu de façon transparente, que ce soit sur support papier, Web, livre électronique ou tout autre média. La norme XMP fournit une infrastructure ouverte, basée sur des métadonnées XML. Grâce à cette intégration, la future version dIntuition pourra indexer des métadonnées encapsulées dans les fichiers images, PDF ou tout autre fichier binaire. De plus, les bases de connaissances dIntuition version 4 seront compatibles avec la norme RDF. De cette manière, il deviendra possible dutiliser les fonctions de recherche et de navigation sémantiques dIntuition pour retrouver des fichiers multimédia tels que des images, des sons ou des vidéos. Sinequa édite des solutions de recherche d'information (moteurs, catalogue, navigation) et équipe des portails web comme Allocine, LaRedoute ou des entreprises comme Net2One ou Arisem. # [Source : Sinequa]. | | | Altavista étend sa base multimédia à 550 millions de fichiers | 18 juin 2003 | Altavista a annoncé hier que sa base multimédia (fichiers images, audio et vidéo) comptait désormais 550 millions de fichiers- ce qui en fait l'index multimédia le plus important du monde puisque comportant 125 millions de fichiers de plus que son plus proche conncurrent (à savoir Google).Une anonce qu'il faut relativiser puisque Google annonce 425 millions de fichiers pour sa seule recherche d'images et que les 550 millions d'Altavista concernent les images plus le son et la vidéo. Néanmoins, Altavista semble avoir dépassé Google en terme d'indexation des images (donc 540 millons contre 425). Pour la vidéo et l'audio, l'index comporte désormais 11 millons de fichiers incluant les formats les plus populaires tels que le MP3 ou le MPEG. Altavista a inclut des millions de fichiers issus de ses index de pays étrangers et à d'autre part amélioré ses fonctions de recherche d'images : l'internaute peut désormais rechercher selon des critère de taille d'image et de résolution (petite, moyenne, grande, 640x480, 800x600,...). En outre, le nouvel index inclut maintenant des images professionnelles issues de fournisseurs majeurs tels que Corbis (Groupe Microsoft). Pour accéder à la recherche mulimédia, il vous suffit de cliquer sur les onglets MP3/Audio, Vidéo ou Images. # > plus sur les moteurs de recherche d'images [Source : Overture] | | | Google en question(s) | 12 juin 2003 | Google est le moteur de recherche leader, en France (59,9% de part de marché *) et dans le monde (55,2% **). Normal (ou du moins habituel) dans ces conditions que le moteur californien accapare la majorité des attentions, des inquiétudes et des attaques du monde du web. Les webmasters guettent fébrilement le positionnement de leurs sites, et les journaux, magazines et webzines écrivent beaucoup sur Google. Pour certains, écrire sur Google plutôt que sur Altavsita ou Alltheweb, c'est une audience assurée. A tel point que certains journaux multiplient les articles sur le moteur sans réellement connaître leur sujet. Andrew Orlowski du Register (San Francisco) a fait très fort dans ce domaine : beaucoup de lignes écrites à partir de pures spéculations
Ex : Blog noise is 'life or death' for Google, Google to fix blog noise problem. Google est observé et particulièrement depuis le début de l'année, les attaques sont devenues fréquentes à son sujet avec une dizaine d'articles hebdomadaires plus ou moins durs. Cette semaine ne fait pas exception à la règle : [Suite] | | | | Le métamoteur Turbo10 se connecte à plus de 1000 moteurs | 5 juin 2003 | Le métamoteur britannique Turbo10 a présenté le 29 mai une nouvelle fonctionnalité intéressante : la possibilité de se connecter à plus de 1000 moteurs spécialisés ou généralistes. Turbo10 interroge par défaut altavista.com, dogpile.com, google.com, hotbot.com, lycos.com, metacrawler.com , search.msn.com et yahoo.com, donc des moteurs plutôt anglophones. Vous pouvez choisir de rajouter, grâce au module "My Collection", les moteurs figurant dans une liste assez impressionnante (1170 à ce jour). Vous pouvez choisir un moteur généraliste comme voilà.fr ou des moteurs spécialisés. Ce qui permet à Turbo10 d'explorer (un peu) le fameux "web invisible" ou "web profond" (l'équipe a même déposé la marque Deep Net !). Car cette liste propose des moteurs internes de portails, vastes bases de données universitaires ou sites de e-commerce : zdnet.com, amazon.com, europages.net (annuaire de sociétés), imdb.com (cinéma), dictionary.com (dicos et thésauri), eea (european environment agency), encyclopedia.com, findarticles.com (archives d'articles depuis 1998), etc
Une fois constituée votre collection de moteurs, celle-ci apparaîtra dans un menu déroulant à droite de votre boite de requête. C'est pour l'instant très américain, les ressources francophones sont rares (google.de est présent mais pas encore google.fr). Aussi, vous pouvez proposer le moteur de votre site ou développé par votre société ou toute autre moteur que vous souhaiteriez voir ajouté à la base. Le CEO (PDG) de Turbo 10 Nigel Hamilton explique : "se connecter à 1000 moteur est seulement la partie immergée de l'iceberg. En créant un système automatisé, on peut se connecter à plusieurs milliers
". La liste des moteurs de recherche est d'ailleurs mise à jour toute les 5 minutes et leur nombre est indiqué sur la page d'accueil de Turbo10. Pour une version bêta, c'est assez rapide (malgré une surcharge annoncée). Par contre, la navigation n'est pas toujours des plus intuitives et la page des résultats, un peu dense, manque de lisibilité.# >Ce nouveau Turbo10 a été présenté lors de la 12ème semaine des conférences internationales sur le World Wide Web à Budapest. > Plus sur les métamoteurs [Source : Intelligence Center, Turbo10] | | | Les moteurs de recherche du futur | 2 juin 2003 | Lors de la 12ème semaine des conférences internationales sur le World Wide Web à Budapest, a été évoqué le futur (proche) des moteurs de recherche. Rapides, intelligents, personnalisés selon les besoins de l'utilisateur. C'est ce que devraient être les moteurs de recherche du futur. Tandis que sous le capot les moteurs se sont considérablement amélioré depuis le début du web, d'apparence, ils ne changent guère. Mais les ingénieurs travaillent sur de nouvelles interfaces et technologies de recherche qui pourraient améliorer de manière significative les pages de résultats. On peut par exemple s'attendre à évoluer parmi les résultats grâce une interface graphique ou personnaliser les résultats de Google. Une équipe de chercheur japonais de NEC a présenté un document intitulé "Mining the Peanut Gallery" (PDF) décrivant un outil qui permettrait à des consommateurs d'obtenir automatiquement des revues de presse sur un produit. L'outil Review Seer fonctionnerait sur le recueil de notation de produits effectués par les internautes sur les newsgroups usenet ou sur les forums de sites web. Les internautes pourraient préciser leur recherche en indiquant les fonctionnalités du produit et les tranches de prix souhaitées. Un tel outil doit faire face à certaines difficultés de l'ordre de la subjectivité humaine : comme ces revues de produits qui ne comportent de nombreux commentaires négatifs puis se terminent avec une phrase positive
D'autres intervenants se sont concentrés sur les nouvelles manières de présenter les résultats aux internautes. Ben Shneiderman, professeur d'informatique à l'université du Maryland, est convaincu que la plupart des personnes communique mieux avec leurs ordinateurs quand elles peuvent voir des données avec des interface graphiques, plutôt que simplement les lire ou les écrire. Il a ainsi présenté plusieurs outils de recherche visuelle, comme le "TimeSearcher", qui permet d'illustrer par des graphiques les résultats de recherche. des données de résultat de recherche. Quant aux outils PhotoMesa et PhotoFinder, ils combinent navigateur et moteur de recherche spécialement conçus pour rechercher des images numériques
Par la suite les moteurs de recherche pourront consulter les cookies (problème de confidentialité à la clé !) afin de déduire de ses recherches passées que l'utilisateur recherche tel type d'info plutôt qu'un autre (quand vous recherchez avocat vous vous intéressez plutôt au fruit et non au juriste). L'utilisation des cookies pourraient aussi ne renvoyer que les nouvelles informations ou les données adaptées à la localisation géographique. de l'internaute. Mais la personnalisation des résultats de recherche ne sera possible tant qu'un moteur comme Google (déjà connu pour sa vitesse) ne sera pas 10 fois plus rapide ! Google pourrait accroître sa vitesse de recherche en utilisant des techniques développées par les chercheurs de l'Université de Stanford ("génitrice" des fondateurs de Google Page et Brin) qui ont présenté leurs travaux à la conférence. Sepandar Kamvar, un de ces chercheurs, précise que beaucoup de fausses idées ont été écrites sur l'impact de leurs travaux : "Si nos résultats de recherche sont mis en oeuvre, Google ne pourra pas être 5 fois plus rapide, mais nous espérons toutefois un gain de vitesse de l'ordre de 30%".Selon Kamvar, on pourra bientôt espérer, à l'issue de ces travaux, accélérer la vitesse de recherche, rafraîchir les résultats et les personnaliser. Le co-fondateur de Google Sergei Brin était parmi le public de la conférence.
A noter que La plupart de ces fonctionnalités évoquées pour des moteurs en ligne existent déjà pour via de gros logiciels de KM et de veille à interface propriétaire et installés localement sur un serveur : Arisem KM Server, Digimind Evolution
# [Source : Wired News] | | | Nouvelle Analyse de la fraîcheur des index des moteurs | 2 juin 2003 | Greg Notess vient de publier sur Searchenginshowdown la dernière version de ses statistiques sur "la fraîcheur" des index des moteurs. La précédente remontait au 20 octobre 2002. Cette étude analyse le degré de rafraîchissement des données des moteurs (mesure effectuée le 17 mai ). 8 moteurs (MSN et HotBot à travers Inktomi, Google, AlltheWeb, AltaVista, Gigablast, Teoma et WiseNut) sont comparés à travers 6 requêtes concernant des pages de sites web rafraîchies tous les jours et qui indiquent cette date de mise à jour en clair. Il ressort principalement que : - la plupart des moteurs affichent des résultats indexés ces derniers jours - mais la majeure partie des bases de données est vielle d'un mois environ - quelques pages n'ont pas été ré indexées depuis très longtemps (comme certaines de AltheWeb non réactualisées depuis septembre 2001) Le classement prend en compte la date de la page la plus récente et la date de la page la plus ancienne. C'est Inktomi pour MSN et Hotbot qui prend la 1ère place avec les pages les plus récentes qui datent d'1 jour, les plus anciennes de 51 jours. Google recule donc d'une place par rapport à la mesure d'octobre. Sa page la plus récente date de 2 jours, la plus ancienne de 165 jours (il est vrai que Google ne rafraîchit pas ses pages régulièrement. Le rafraîchissement peut ainsi curieusement stopper pendant 3 à 4 jours puis reprendre quotidiennement).Suit ensuite Alltheweb qui pourrait occuper une meilleure place sans quelques pages très anciennes datant de 400 ou 599 jours. Car ses pages les plus récentes ont 1 jour. Teoma et Wisenut ne progressent que très lentement dans le domaine de la fraîcheur de leurs index puisque leurs pages les plus récentes ont respectivement 41 et 133 jours...# [Source : Search Engine Showdown] | | | | | | | Faits marquants mai 2003 Correction orthographique sur AlltheWeb Google Colombie 60% des résultats identiques sur les moteurs ? Le retour de Northern Light ? Wondir, un nouvel outil de recherche Nouvelle version de Net2One Nouvelles fonctions sur AlltheWeb 3 nouveaux pays pour Google Barres d'outils : dynamisez vos recherches ! Google News lance des versions régionales MSN lance un service d'alerte de dépêches Daypop : nouvelle fonction + interview de son créateur Google proposera un moteur spécifique aux blogs Lancement du weblog inFLUX Google Alert V2 Copernic Agent lance sa version 6.1 Google offre des dépêches en français Lancement de Weblogues.com Décisions de justice et passé | | Faits marquants avril 2003 4 nouveaux pays pour Google Sondages en ligne : des résultats trompeurs Une nouvelle version pour Ask Jeeves Nouvelles fonctions sur Alltheweb 8 nouveaux pays pour Google Google en chiffres Google News mélange les sources Yahoo.com rafraîchit son interface de recherche Transfert.net, Chroniques de Cybérie, le retour... Microsoft s'intéresse aux moteurs de recherche Les recherches sur Al-Jazeera explosent News Now monte en puissance Un rafraîchissement quotidien pour Wisenut ? Google Taiwan Les gagnants des Blogs d'Or 2003 KartOO rénove sa version HTML | | mars 2003 février 2003 janvier 2003 | Faits marquants 4ème trimestre 2002 : octobre-novembre-décembre | Faits marquants 3ème trimestre 2002 : juillet-août-septembre | Faits marquants 2ème trimestre 2002 : avril-mai-juin | Faits marquants 1er trimestre 2002 : janvier-février-mars | Faits marquants 2001 | | | | |
|