Langsame Suche: Google Mail umfasst mehr Daten als der Index der Websuche

Jürgen Vielmeier


Interessante Frage, die gerade heiß auf Quora diskutiert wird: Warum braucht Google mehr als drei Sekunden, um den Posteingang von GMail zu durchsuchen, aber nicht einmal eine Sekunde, um Suchergebnisse aus dem weltweiten Netz zurückzuliefern. Die Antwort, die viele von euch auf den ersten Blick ebenso überraschen dürfte wie mich: Weil Google bei der Suche auf dem GMail-Server mehr Daten durchforsten muss als bei der Websuche.

Wie bitte?

Der Google-Suchindex erfasst das öffentliche Web, zumindest sehr große Teile davon. 40 Milliarden Websites dürften aktuell im Zwischenspeicher sein, kennen dürfte Google wohl mehr als eine Billion Seiten. Der Suchriese hat mehr als 100 Millionen Gigabyte Suchdaten (100 Petabyte) gespeichert, was allerdings auch Bildsuche und Videodaten umfasst. Der Suchindex der Websuche dürfte bedeutend kleiner sein. Bei 200 Millionen GMail-Nutzern und einem Durchschnitt von 1 Gigabyte pro Nutzer wären das 200 Petabyte an Daten.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 12.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück Apple AirPods gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

Quora-Nutzer Adam D’Angelo schreibt dazu, und Ex-Google-Mitarbeiter widersprechen ihm nicht:

  • Das Mehr an Daten bei GMail dürfte ein Mehr an Servern bedeuten, die bei einer Suche beansprucht werden.
  • Das Zauberwort heißt „Caching“: Google legt für die Websuche einen Zwischenspeicher der wichtigsten Ergebnisse an, die allen Nutzern präsentiert werden. Die Suchergebnisse für GMail dagegen sind gewissermaßen personalisiert und müssen in Echtzeit verfügbar sein.

GMail-Suchergebnisse sind darüber hinaus nach Zeit sortiert, was mehr Genauigkeit erfordert. Websuch-Ergebnisse sortiert Google nach Relevanz, was Annäherungen erlaubt. Hier ist Zeit nicht der wichtigste Faktor. Wer aber seine E-Mails durchsucht, will schon, dass eine Nachricht, die vor 30 Sekunden eingetroffen ist, darin auftaucht. Verfolgt die Diskussion hier.

Google lässt dich jetzt selbst bestimmen, welche Quellen du in der Suche häufiger siehst. Mit zwei schnellen Klicks kannst du BASIC thinking kostenlos als bevorzugte Quelle hinzufügen und damit unabhängigen Tech-Journalismus unterstützen. Vielen Dank!

(Jürgen Vielmeier)

Du möchtest nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 12.000 smarte Leser bekommen jeden Tag UPDATE, unser Tech-Briefing mit den wichtigsten News des Tages – und sichern sich damit ihren Vorsprung. Hier kannst du dich kostenlos anmelden.

STELLENANZEIGEN
Praktikant/in Social Media (m/w/d)
Kids Camp America Gmbh in München, Frankfurt am Main...
Social Media Marketing Manager (d/w/m)
BavariaDirekt in München
Praktikant (w/m/d) Marketing & Social Med...
Bübchen Skincare GmbH in Düsseldorf
Junior Sales Manager (m/w/d) Online Marketing
Sellwerk GmbH & Co. KG in Düsseldorf, Dormagen, Duis...
Software Sales Manager / Software Business De...
RAYLASE GmbH in Wessling
Marketing Content Specialist (all genders)
The Boston Consulting Group GmbH - BCG in München
Projektmanager Digital / Social Media (w/m/d)...
Heimrich & Hannot GmbH in Köln
Digital Excellence Manager Oncology befristet...
AstraZeneca in Hamburg
THEMEN:
Teile diesen Artikel
Jürgen Vielmeier ist Journalist und Blogger seit 2001. Er lebt in Bonn, liebt das Rheinland und hat von 2010 bis 2012 über 1.500 Artikel auf BASIC thinking geschrieben.