Internet: la boite à Spam
Danny Sullivan de Google a réagi aux plaintes concernant le courrier indésirable dans la recherche des moteurs de recherche demandant à un individu de documenter le courrier indésirable en utilisant le formulaire. Le consommateur a signalé et Danny a répondu que les bons rapports de spam se traduisent souvent par « un saut en profondeur pour connaître les réseaux et envisager des mesures étendues ». Il jonque « rapports pour aider. » Google a constamment déclaré étudier les rapports de spam et nous avons remarqué les actions des moteurs de recherche au fil des ans sur ces rapports. Ainsi, même si Yahoo peut avoir besoin de temps pour faire quelque chose, en particulier pour des défis supplémentaires supplémentaires, Yahoo agit finalement. Brin et Webpage, qui se sont dits satisfaits en tant qu’individus diplômés du Stanford College, étaient intéressés par l’idée d’extraire ce moyen de la masse de données accumulées sur Internet. Ils ont commencé à opérer à partir du dortoir de Page à Stanford pour concevoir un nouveau type de technologie moderne de recherche, qu’ils ont nommé BackRub. Le véritable secret a finalement été d’utiliser les capacités permanentes des internautes en surveillant les «liens de support» de chaque site Internet, c’est-à-dire la quantité d’autres pages Web qui leur sont associées. La plupart des listes de moteurs de recherche viennent de renvoyer un résumé des sites Web classés selon la fréquence d’apparition d’une expression de recherche sur eux. Brin et la page Web ont incorporé à la fonction de recherche la quantité de backlinks que chaque site Web a connus; c’est-à-dire qu’un site Web avec un grand nombre d’hyperliens serait logiquement un peu plus bénéfique qu’un seul avec seulement quelques backlinks, et le moteur de recherche positionnerait donc le site Web fortement lié plus sur une liste d’options. De plus, un hyperlien provenant d’un site Internet fortement connecté serait un «vote» beaucoup plus utile qu’un simple provenant d’un site Web plus imprécis. Au milieu de 1998, Brin et Page ont commencé à obtenir du financement extérieur (l’un de leurs tout premiers traders était Andy Bechtolsheim, cofondateur de Sunlight Microsystems, Inc.). Ils ont finalement recueilli environ 1 million de dollars auprès d’investisseurs, de leur famille et de leurs amis et ont installé des magasins dans la zone de loisirs de Menlo, dans l’État de Californie, sous le titre Moteurs de recherche, qui était dérivé d’une faute d’orthographe du nom initialement prévu de Page, googol (une statistique phrase pour le numéro un suivi de 100 zéros). Vers le milieu de l’année 1999, lorsque les moteurs de recherche ont obtenu une circulaire de financement en capital de 25 000 $, ils avaient absorbé 500 000 problèmes par jour. L’action a commencé à exploser en 2000, lorsque Yahoo est devenu le moteur de recherche client de l’un des nombreux sites Web les plus appréciés, Google !. En 2004, lorsque Google! dispensés des services professionnels de Google, les consommateurs effectuaient des recherches sur les moteurs de recherche 200 millions de fois par jour. Cette croissance ne fait que se poursuivre: fin 2011, les moteurs de recherche géraient chaque jour quelques milliards de recherches. L’étiquette de l’entreprise est devenue si omniprésente qu’elle est entrée dans le lexique comme un verbe: google est devenu une expression fréquente pour naviguer sur le net. Pour accueillir cette masse remarquable de données, Yahoo a développé 11 centres d’information à travers le monde, chacun d’eux contenant plusieurs 100 milliers d’hôtes (essentiellement des PC multiprocesseurs et des disques durs montés dans des racks exclusivement construits). Les systèmes informatiques interconnectés de Google comptent probablement plusieurs milliards. Le cœur du fonctionnement de Google est néanmoins constitué de trois éléments exclusifs de code informatique: Yahoo Submit System (GFS), Bigtable et MapReduce. GFS s’occupe du stockage des données Web en «morceaux» sur un certain nombre de machines; Bigtable est certainement le programme de base de données de l’entreprise; et MapReduce est utilisé par Yahoo pour produire des informations de plus grande envergure (par exemple, en assemblant un index de pages Web qui contiennent la phrase «Chicago», «théâtre» et «participative»). A lire sur: