For faster navigation, this Iframe is preloading the Wikiwand page for Wayback Machine.

Wayback Machine

Wayback Machine
Ilustracja
Logo archiwum
Typ strony

Archiwum cyfrowe

Data powstania

24 października 2001[1]

Autor

Brewster Kahle, Bruce Gilliat

Właściciel

Internet Archive

Rejestracja

Opcjonalna

Strona internetowa

Wayback Machineamerykańskie archiwum cyfrowe World Wide Web i innych informacji dostępnych w Internecie. Zostało upublicznione w październiku 2001 roku przez Brewstera Kahle’a i Bruce’a Gilliata[2]. Należy do Internet Archive[3], organizacji nonprofit mającej swoją siedzibę w San Francisco. Serwis był notowany w rankingu Alexa na miejscu 161[4] (maj 2020)

Historia

[edytuj | edytuj kod]

Wayback Machine zostało utworzone, aby zapobiec problemowi bezpowrotnej utraty treści zgromadzonej na stronach internetowych, w momencie kiedy są one edytowane lub zamykane[5]. Usługa ta pozwala użytkownikom na przeglądanie zarchiwizowanych wersji witryn, które przez archiwum nazywane są „trójwymiarowym indeksem”[6]. Kahle i Gilliat utworzyli to archiwum z nadzieją na archiwizację całego Internetu i zapewnienie „powszechnego dostępu do wiedzy”[7].

Wayback Machine rozpoczęło archiwizację stron internetowych w 1996 r., z zamiarem upublicznienia całej usługi pięć lat później[8]. Kahle sporadycznie umożliwiał naukowcom dostęp do zasobów nieukończonej wówczas bazy, dostępnej na taśmie cyfrowej[9]. W piątą rocznicę powstania, archiwum zostało upublicznione podczas ceremonii w Uniwersytecie Kalifornijskim w Berkeley[10]. Do tego czasu Wayback Machine zgromadziło ponad 10 miliardów zarchiwizowanych stron[11].

Nazwa usługi jest aluzją do serialu telewizyjnego Rocky, Łoś Superktoś i przyjaciele, w którym występuje pies Peabody, podróżujący w czasie za pomocą wehikułu o nazwie „WABAC Machine”[12].

W 2002 roku budżet Wayback Machine sfinansowany m.in. przez kilka korporacji, fundacji (w tym Kahle/Austin Foundation, National Science Foundation, Bibliotekę Kongresu i Markle Foundation) i osoby prywatne wyniósł 10 milionów dolarów[13].

Aspekty techniczne

[edytuj | edytuj kod]

Oprogramowanie zostało przystosowane do indeksowania i pobierania, przy pomocy robotów internetowych, wszystkich publicznie dostępnych stron WWW, hierarchii Gopher oraz systemu grup dyskusyjnych Usenet[14]. Dane zbierane przez „crawlery” nie zawierają wszystkich informacji dostępnych w Internecie, ponieważ dostęp do części z nich może być ograniczany przez ich wydawcę lub przechowywany w niedostępnych bazach. Odpowiedzią na tę sytuację było utworzenie przez Internet Archive w 2005 r. strony Archive-It.org. Umożliwiła ona instytucjom i twórcom zbieranie, przechowywanie oraz tworzenie kolekcji treści i archiwów cyfrowych[15].

Częstotliwość powstawania snapshotów zależna jest od danej witryny[16]. Wayback Machine archiwizuje sam kod HTML, ale nie obrazy. Te są pobierane ze stron źródłowych[17].

Przyrost zasobów w Wayback Machine

[edytuj | edytuj kod]

W 2003 roku, zaledwie dwa lata po oficjalnym upublicznieniu usługi, zasoby Wayback Machine rosły w tempie 12 terabajtów/miesiąc. Pierwsze 100 TB zostało przekroczone w czerwcu 2004[18]. W 2009 Wayback Machine mieściło już ok. trzech petabajtów danych, które rosły w tempie 100 TB każdego miesiąca[19]. W styczniu 2013 r. spółka posiadała w bazie 240 miliardów adresów URL. W październiku 2013 r. na stronie powstała opcja „Save a Page”, która umożliwiała użytkownikowi zgłoszenie konkretnej witryny do archiwizacji[20]. W grudniu 2014 r. liczba zarchiwizowanych witryn wzrosła do ponad 435 miliardów, co stanowiło prawie dziewięć petabajtów danych, rosnących w tempie 20 terabajtów tygodniowo[21]. Całkowita ilość danych w lipcu 2016 r. osiągnęła wynik 15 petabajtów[22], natomiast we wrześniu 2018 r. wyniosła już ponad 25 petabajtów[23].

Zastosowanie

[edytuj | edytuj kod]

Od początku działalności w 2001 r., Wayback Machine stało się obiektem badań, zarówno pod kątem tego, w jaki sposób przechowywane są zgromadzone w bazie dane, jak i odnośnie do samych zarchiwizowanych stron dostępnych w archiwum. Do 2013 r. badacze napisali około 350 artykułów, które dotyczyły Wayback Machine. Pochodziły one głównie z takich obszarów nauki, jak technologia informacyjna, bibliotekoznawstwo oraz nauki społeczne. Naukowcy z tej ostatniej grupy wykorzystują Wayback Machine m.in. do analizy tego, jak rozwój witryn zachodzący stale od połowy lat 90., wpłynął na rozwój danego przedsiębiorstwa[24].

Skrypty archiwizacyjne w Wayback Machine mają na celu zachowanie jak największej liczby działających hiperłączy, które z racji ulotności danych w Internecie, mogłyby zostać utracone. Indyjscy badacze przeprowadzili analizę dotyczącą skuteczności zapisywania hiperłączy zawartych w naukowych publikacjach dostępnych online w Wayback Machine i wynik ten stanowił ponad połowę[25].

Przypisy

[edytuj | edytuj kod]
  1. Whois Record for WayBackMachine.org. whois.domaintools.com. [dostęp 2019-01-22]. (ang.).
  2. John Cook: Web site takes you way back in Internet history. seattlepi.com, 2001-11-01. [dostęp 2018-04-14]. (ang.).
  3. Internet Archive launches WayBack M. burmalibrary.org, 2001-10-25. [dostęp 2018-04-14]. (ang.).
  4. Alexa Internet: Archive.org Site Info. alexa.com, 2020-05-11. [dostęp 2020-05-11]. (ang.).
  5. Greg R. Notess. The Wayback Machine: The Web’s Archive. „online”. 26, s. 59-61, marzec-kwiecień 2002. EBSCOhost. 
  6. The Wayback Machine. [dostęp 2019-01-25]. (ang.).
  7. 20,000 Hard Drives on a Mission | Internet Archive Blogs. blog.archive.org. [dostęp 2019-01-25]. (ang.).
  8. Internet Archive: Wayback Machine. archive.org. [dostęp 2019-01-25]. (ang.).
  9. John Cook: Web site takes you way back in Internet history. 2001-11-01. [dostęp 2019-01-25]. (ang.).
  10. Wayback Goes Way Back on Web. „Wired”, 2001-10-28. [dostęp 2019-01-25]. (ang.). 
  11. Sanjay K. Arora, Yin Yin, Jan Youtie, Philip Shapira. Using the wayback machine to mine websites in the social sciences: A methodological resource. „Journal of the Association for Information Science and Technology”. 67 (8). ISSN 2330-1635. 
  12. Heather Green: A Library as Big as the World. 2002-02-28. [dostęp 2019-01-28]. (ang.).
  13. Judy Tong: RESPONSIBLE PARTY -- BREWSTER KAHLE; A Library Of the Web, On the Web. nytimes.com, 2002-09-08. [dostęp 2018-04-14]. (ang.).
  14. Brewster Kahle: Archiving the Internet. [dostęp 2019-01-28]. [zarchiwizowane z tego adresu (2012-04-03)]. (ang.).
  15. Jeff Kaplan: Archive-It: Crawling the Web Together. 2014-10-27. (ang.).
  16. Kalev Leetaru: The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web. 2016-01-28. [dostęp 2019-01-28].
  17. Zrzut ekranu może być dowodem w sądzie. 21 października 2021. [dostęp 2021-11-20].
  18. Internet Archive: Petabox. archive.org. [dostęp 2019-01-28]. (ang.).
  19. Lucas Mearian: Internet Archive to unveil massive Wayback Machine data center. Computerworld.com, 2009-03-19. [dostęp 2019-01-28].
  20. Alexis Rossi: Fixing Broken Links on the Internet. archive.org, 2013-10-25. [dostęp 2019-01-28].
  21. Internet Archive Frequently Asked Questions. [dostęp 2019-01-28].
  22. Can the manipulation of big data change the way the world thinks?. [dostęp 2019-01-28]. (ang.).
  23. Zachary Crockett: Inside Wayback Machine, the internet’s time capsule. 2018-09-28. [dostęp 2019-01-28]. (ang.).
  24. Sanjay K. Arora, Yin Li, Jan Youtie, Philip Shapira. Using the wayback machine to mine websites in the social sciences: A methodological resource. „Journal of the Association for Information Science and Technology”. 67, s. 1904–1915, 2015-05-05. DOI: 10.1002/asi.23503. ISSN 2330-1635. (ang.). 
  25. B.T. Sampath Kumar, K.R. Prithviraj. Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs. „Journal of Information Science”. 41 (1). s. 71-81. DOI: 10.1177/0165551514552752. ISSN 0165-5515. (ang.). 

Linki zewnętrzne

[edytuj | edytuj kod]
{{bottomLinkPreText}} {{bottomLinkText}}
Wayback Machine
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?