Facebook: 500 Terabyte Daten täglich
Das soziale Netzwerk hat am Donnerstag erstmals auch Statistiken zu seinem Datencenter bekannt gegeben. Demnach verursachen die 955 Millionen Facebook-Mitglieder jeden Tag mehr als 500 Terabyte an Daten in Form von knapp 2,5 Milliarden Postings, 2,7 Milliarden Likes sowie 300 Millionen Bildern. Das System ist dazu in der Lage, knapp 105 Terabyte Daten in einer halbe Stunde zu überprüfen.
Optimierung für Werbekunden
Facebook hat außerdem den nach eigenen Angaben größten Hadoop Cluster mit mehr als 100 Petabyte an Daten. Damit übertrifft man selbst den vormaligen Rekordhalter Yahoo bei weitem. "Keinen kümmert es, wenn man 100 Petabyte an Daten in seinem Datencenter gespeichert hat, die Daten aber nicht nutzen kann", gibt Jay Parikh, Vice President of Engineering bei Facebook, zu bedenken. Demnach werden die Erkenntnisse, insbesondere im Werbebereich, auch an die Kunden von Facebook weitergereicht.
"Wir können genau auf Basis von Alter, Interessen, Geschlecht oder Standort sagen, für wen eine bestimmte Werbung besonders interessant sein könnte." Facebook ist mittlerweile sogar dazu in der Lage, vorauszusagen, wie sich Änderungen am System auf die Nutzer auswirken wird. Dadurch sind langwierige Tests an kleinen Prozentzahlen der Nutzer über "Gatekeeper", dem Testsystem von Facebook, nicht mehr notwendig.
Datenbank soll aufgeteilt werden
Facebook gab auch Details zu Project Prism bekannt, bei dem die derzeit noch in einem Datencenter gespeicherten Daten auf mehrere Standorte aufgeteilt werden soll. Die Daten sollen sich zukünftig in den US-Bundesstaaten Kalifornien, Virginia, Oregon, North Carolina sowie Schweden befinden.
-
Kommentar
-
Hintergrund
-
Hintergrund