Blog Viewer

Wieviel Internet archiviert die Wayback Machine wirklich?

By Ulrich Kampffmeyer posted 11-19-2015 12:47

  

Ein sehr interessanter Artikel auf Forbes "How Much Of The Internet Does The Wayback Machine Really Archive?": http://bit.ly/Wayback-Machine
Fast 20 Jahre, mehr als 23 Petabyte, über 445 Milliarden Webseiten - und dennoch ein Tropfen auf den heißen Stein, ein ganz geringer Teil des Internets nur. Da Verfahren und Algorithmen nicht bekannt sind, lässt sich der Wert des Internet Archive nur sehr bedingt einschätzen. Oft bestimmen auch nur Zufälle die Webseiten und die Häufigkeit der Snapshots. Ein bisschen seltsam ist es schon, dass 2 pornografische Seiten, ein Hotel auf Hawai und verschiedene Shops ganz oben auf der Liste der am häufigsten gecrawlten Seiten stehen.

Bei PROJECT CONSULT hatten wir uns auch daher entschlossen, selbst alle unsere Webseiten zu archivieren (leider ohne die Social Media Kanäle, die wir zusätzlich nutzen). In einem Blogbeitrag hatten wir den Nutzen des Internet Archive direkt mit unseren archivierten Webseiten bei Qumram verglichen: http://bit.ly/PC_Web-Archive
Die Bewahrung der Geschichte des Webs ist immer noch ungelöst. Und wie vor Jahrzehnten von mir schon angemerkt, wie befinden uns im Dunklen Zeitalter der frühen Informationskultur. Trotz all der verfügbaren Informationen aus Sicht von Archivaren und Historikern in einem sehr dunklen Zeitalter.

Quelle bei PROJECT CONSULT: http://bit.ly/internet_archiv

0 comments
315 views