Aller au contenu

« Internet Archive » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Révocation des modifications de 2a01:e34:eded:b480:991b:a223:5ab4:ebf (retour à la dernière version de 2a01:cb14:d1f:fd00:1c7:6aa0:a40:ceba) ; Vandalisme
Balises : LiveRC Annulation
Balises : Contenu remplacé Révoqué Éditeur visuel
Ligne 19 : Ligne 19 :
}}
}}


test {{Portail|bases de données|Internet|sciences de l'information et des bibliothèques|Édition numérique|entreprise|San Francisco}}
'''{{Langue|en|Internet Archive}}''' (ou '''IA''') est un [[Association à but non lucratif|organisme à but non lucratif]] consacré à l’[[archivage du Web]] qui agit aussi comme [[bibliothèque numérique]]. Ces [[archivage électronique|archives électroniques]] sont constituées de clichés [[instantané (informatique)|instantanés]] (copie de pages prises à différents moments) de pages web, de logiciels, de films, de livres et d’enregistrements audio.

Pour assurer la stabilité et la [[sécurité des données]] archivées, un [[site miroir]] fonctionnel est conservé à la [[Bibliotheca Alexandrina]] en [[Égypte]]<ref>[http://archive.bibalex.org/ Internet Archive à la nouvelle bibliothèque d’Alexandria].</ref>. L’IA met gratuitement ses collections à la disposition des chercheurs, historiens et universitaires. Située dans le [[Richmond District (San Francisco)|Richmond District]], au sud du [[Presidio de San Francisco]], elle est membre de l'[[American Library Association]] et est officiellement reconnue comme bibliothèque par l'[[État de Californie]]<ref>{{en}} [https://archive.org/iathreads/post-view.php?id=121377 {{Langue|en|Internet Archive officially a library}}], 2 mai 2007</ref>.

Le [[robot d'indexation]] utilisé par IA est [[Heritrix]], un [[logiciel libre]]. Le logiciel de numérisation de livres, libre également, est Scribe<ref>{{en}} [http://sourceforge.net/projects/scribesw/ Scribe Software]</ref>.

== Histoire ==
[[Fichier:Internet Archive headquarters exterior February 2008.jpg|alt= Le premier siège d'Internet Archive au Presidio, une ancienne base militaire américaine à San Francisco, de 1996 à 2009|vignette|Le premier siège d'Internet Archive au Presidio, une ancienne base militaire américaine à San Francisco, de 1996 à 2009.]]
''Internet Archive'' fut fondée en [[1996]] par [[Brewster Kahle]]. En raison de leurs objectifs {{incise|la préservation de la connaissance humaine et l'accessibilité des collections à tous}}, les fondateurs de IA comparent ce projet à celui plus ancien de la [[bibliothèque d'Alexandrie]].

== Services d'Internet Archive ==

[[Image:Internet Archive - Bibliotheca Alexandrina.jpg|vignette|droite|upright|Photo prise à la [[Bibliotheca Alexandrina]] : elle contient une copie des documents d’Internet Archive.]]
[[Image:Servers at the Internet Archive.jpg|vignette|droite|upright|Serveurs d'Internet Archive.]]

=== Wayback Machine ===

La ''Wayback Machine''<!-- Laisser en minuscule tant que la page française est une redirection. Si on met la bonne typo, on n'a pas de lien vers wiki en, puisque la page française existe (redirection). --> (littéralement « la machine à revenir en arrière ») est la partie des clichés du Web développé par ''Internet Archive''. ''Wayback Machine'' a été créé par [[Brewster Kahle]] afin de stocker et indexer tout ce qui se trouve sur le web<ref>{{lien web|auteur=Judy Tong|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|titre=Responsible Party - Brewster Kahle ; A Library Of the Web, On the Web|éditeur =''[[The New York Times]]''|date=8 septembre 2002|consulté le=}}</ref>. La Wayback Machine est mise à jour à partir du contenu d'[[Alexa (Internet)|Alexa]]. Ce service permet aux utilisateurs de voir les versions archivées de pages Web à travers le temps : c'est l'« index à trois dimensions ».

Les clichés sont disponibles de six à douze mois après leur capture. La fréquence des [[instantané (informatique)|instantanés]] est variable, toutes les mises à jour de sites Web ne sont pas enregistrées, et des intervalles de plusieurs semaines peuvent être observés.

En 2006, la Wayback Machine contenait près de deux [[pétaoctet]]s de données. Le volume augmente à un rythme de {{unité|20|[[téraoctet]]s}} par mois, soit une augmentation de deux tiers par rapport aux douze téraoctets par mois qui étaient le taux de croissance en 2003. Cette croissance est supérieure à la quantité de texte contenue dans les plus importantes bibliothèques du monde, notamment la [[Bibliothèque du Congrès]]. En 2009, la Wayback Machine contenait près de trois pétaoctets de données et son augmentation était de {{unité|100|téraoctets}} par mois. Les données sont archivées dans des systèmes fabriqués par Capricorne Technologies, des Petabox racks.

L'appellation « ''Wayback Machine'' » renvoie à des épisodes du ''[[The Rocky and Bullwinkle Show]]'', où M. Peabody, un chien à l'air professoral et son assistant Sherman (un animal de compagnie humain), utilisent une [[machine à remonter le temps]] appelée « WABAC Machine » pour décrire des évènements historiques célèbres<ref>{{en}} [http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm A Library as Big as the World] - Heather Green, ''[[BusinessWeek]]'', 28 février 2002</ref>.

En 2015, la [[Russie]] aurait par erreur bloqué l'intégralité du site ''Wayback Machine''<ref>{{Lien web|url=http://www.zdnet.fr/actualites/the-wayback-machine-victime-de-surblocage-en-russie-39821624.htm|titre=The Wayback Machine, victime de surblocage en Russie|éditeur=[[ZDNet]]|consulté le = 2015-06-30}}</ref>.

=== Archive-It ===

Les utilisateurs désireux d'archiver en permanence et immédiatement leurs données peuvent utiliser, moyennant un abonnement, le service {{lien|Archive-It}} de IA<ref>{{en}} [http://www.news.com/8301-10784_3-6067173-7.html Preserving the Web one group at a time] - Stefanie Olsen, [[CNET (site web)|CNET]], {{1er}} mai 2006</ref>. Les données recueillies sont périodiquement indexées par la [[Wayback Machine]]. En {{date-|décembre 2007}}, ce service avait créé plus de 230 millions d'[[Uniform Resource Locator|URL]] pour 466 collections publiques, y compris des organismes gouvernementaux, des universités et des institutions culturelles.

Exemple d'organismes ou institutions participant à Archive-It :
* {{lien|Electronic Literature Organization}},
* les Archives d'État de [[Caroline du Nord]],
* le {{lien|Texas State Library and Archives Commission}},
* l'[[Université Stanford]],
* la [[Bibliothèque nationale australienne]],
* le [[Groupe de bibliothèques de recherche]].

=== Collections ===
{{À compléter|à faire=compléter les collections en ajoutant les sous-sections "Logiciels" et "Images"}}

En plus des archives Web, les services d{{'}}''Internet Archive'' conservent d'importantes collections de médias numériques qui sont soit du [[Domaine public (propriété intellectuelle)|domaine public]] soit titulaires d'une licence permettant leur redistribution, comme les [[Licence Creative Commons|licences Creative Commons]]. Les médias sont organisés en collections par type (images animées, son, texte, etc.) et en sous-collections selon différents critères. Chaque collection principale comprend une sous-collection ''Community'', où les apports du public en général peuvent être archivés.

==== Images vidéos ====

Mis à part les longs métrages, la collection vidéo de l'Internet Archive comprend des actualités, des classiques de la [[bande dessinée]], de la propagande pro et antiguerre et des documents plus éphémères des Archives Prelinger comme des publicités<ref>{{Lien web |langue=fr-FR |prénom= |nom= |titre=Les Archives Prelinger – réemploi, archive(s), préservation |url=https://cinemadoc.hypotheses.org/3776 |site=Cinémadoc |consulté le=2022-03-13}}</ref>, des films éducatifs et industriels et des collections de films amateurs.

==== Sons ====

La collection audio regroupe de la musique, des [[Livre audio|livres audio]], des émissions d'information, des spectacles radiophoniques anciens et une grande variété d'autres fichiers audio. La sous-collection ''Live Music Archive'' comprend {{formatnum:40000}} enregistrements de concerts d'artistes indépendants<ref>{{Lien web |langue=en |titre=Free Music : Download & Streaming : Live Music Archive : Internet Archive |url=https://archive.org/details/etree |site=archive.org |consulté le=2022-03-13}}</ref>, ainsi que des artistes plus établis et des ensembles musicaux avec des règles moins strictes sur l'enregistrement des concerts tels que le [[Grateful Dead]].

==== Textes ====

Cette collection rassemble des textes du [[Projet Gutenberg]], des textes de diverses bibliothèques à travers le monde ainsi qu'une collection de documents et de notes issues de [[ARPANET]]. Avec plus de 7 millions de livres, l'Internet Archive est la deuxième plus grosse bibliothèque numérique de livres en libre accès dans le monde après [[Google Livres|Google Books]]. Tous les documents numérisés et mis en ligne par les internautes ou les institutions sont océrisés et convertis en fichiers EPUB pour liseuses ou MOBI pour Kindle et jouissent d'un archivage pérenne sur de nombreux serveurs dans le monde (Californie, Égypte, Chine, [[Pays-Bas]], etc.)<ref>Mathieu Andro, Emmanuelle Asselin, Marc Maisonneuve (2012), ''Bibliothèques numériques : logiciels et plateformes'', Paris, ADBS.</ref>.

La [[Bibliothèque Sainte-Geneviève]] est la première bibliothèque française à participer au projet dès {{date-|mars 2010}}<ref>https://archive.org/details/bibliothequesaintegenevieve</ref>. En France, l'École des Ponts ParisTech (depuis {{date-|août 2012}})<ref>https://archive.org/details/ecole-des-ponts</ref>, l'Institut national de la recherche agronomique (depuis {{date-|janvier 2015}})<ref>https://archive.org/details/inra</ref>, Sciences Po Paris (depuis {{date-|juin 2015}})<ref>https://archive.org/details/sciencespo</ref>, la Bibliothèque Interuniversitaire de Santé (depuis {{date-|janvier 2018}})<ref>https://archive.org/details/bibliothequeinteruniversitairedesante</ref>, la Bibliothèque universitaire des langues et civilisations (depuis septembre 2019)<ref>https://archive.org/details/bulac?tab=about</ref>, la [[Bibliothèque nationale de France]] (depuis février 2019)<ref>{{Lien web |langue=en |titre=Gallica : Free Texts : Free Download, Borrow and Streaming : Internet Archive |url=https://archive.org/details/bnfgallica |site=archive.org |consulté le=2022-03-21}}</ref>, puis les Bibliothèques de l'École normale supérieure (depuis décembre 2020) y participent également<ref>https://archive.org/details/bibliotheques-ecole-normale-superieure-images?tab=about</ref>.

=== Bibliothèque libre ===

''Internet Archive'' est membre de l{{'}}''{{lien|Open Content Alliance}}'' et exploite l{{'}}''[[Open Library]]'', où plus de {{formatnum:200000}} livres numérisés appartenant au domaine public sont consultables en ligne et imprimables<ref>{{en}} [http://www.informationweek.com/story/showArticle.jhtml?articleID=196701339 Internet Archive Claims Progress Against Google Library Initiative] - Antone Gonsalves, ''InformationWeek'', 20 décembre 2006</ref>{{,}}<ref>{{en}} [http://chronicle.com/wiredcampus/index.php?id=2235?=atwc The Open Library Makes Its Online Debut] - ''Chronicle of Higher Education'', ''The Wired Campus'', 9 juillet 2007</ref>. Le système de numérisation de livres ''Scribe'' sert à cette fin<ref>{{en}} Stefanie Olsen, [http://news.com/An+open-source+rival+to+Googles+book+project/2100-1025_3-5915690.html?tag=ne.gall.related ''An open-source rival to Google's book project''] - [[CNET (site web)|CNET]], 26 octobre 2005</ref>.

Lors de la pandémie de coronavirus, Internet Archive met à disposition des Américains des livres sous droits d'auteurs afin que ces derniers puissent étudier pendant le confinement<ref name="nation">{{lien web|url=https://www.thenation.com/article/society/publishers-are-taking-the-internet-to-court/|lang=en|titre=Publishers Are Taking the Internet to Court|auteur=Maria Bustillos|date=10 septembre 2020}}.</ref>. Plusieurs éditeurs ne sont pas d'accord et Internet Archive retire l'accès aux livres concernés le {{date|16 juin 2020}}<ref name="nation"/>. Malgré tout, les éditeurs attaquent en justice le site et un procès est prévu pour 2021<ref name="nation"/>.

== Controverses ==

=== Site de la scientologie ===

À la fin de l'année 2002, Internet Archive a effacé différents sites critiques à l'égard de la [[scientologie]] recensés par la Wayback Machine<ref>{{en}} [http://news.com/2100-1023-959236.html Net archive silences Scientology critic] - Lisa M. Bowman, [[CNET (site web)|CNET]], 24 septembre 2002</ref>. Le message d'erreur indique que c'était à la suite d'une « demande formulée par le propriétaire du site »<ref>{{en}} [https://archive.org/iathreads/post-view.php?id=778 Exclusions from the Wayback Machine] - 23 septembre 2002</ref>. Il a par la suite été précisé que les avocats de l'[[Église de Scientologie]] avaient exigé le retrait, sans aucun motif juridique, et que les propriétaires de ces sites ne voulaient pas que leurs pages soient retirées<ref>{{Lien archive |langue=en |auteur=Ernest Miller |url=http://research.yale.edu/lawmeme/modules.php?name=News&file=article&sid=350 |titre=Sherman, Set the Wayback Machine for Scientology |date=24 septembre 2002 |horodatage archive=20021004005930 }}</ref>.

=== Les archives internet comme preuve ===

==== Contentieux civil aux États-Unis ====

===== Telewizja Polska =====

En {{date-|octobre 2004}}, dans une affaire appelée « ''Telewizja Polska SA vs Echostar Satellite'' », un juriste tente d'utiliser les archives de la Wayback Machine comme source d'éléments de preuve recevables, probablement pour la première fois.

[[Telewizja Polska]] est le fournisseur de [[TVP Polonia]] et de [[EchoStar Communications|EchoStar]] exploitant le [[Dish Network]]. Avant le procès, EchoStar a indiqué qu'il avait l'intention d'utiliser des clichés provenant de la Wayback Machine comme preuve du contenu passé du site de Telewizja Polska. Telewizja Polska a déposé une requête ''{{lien|trad=Motion in limine|fr=in limine}}'' pour supprimer les clichés justifiants de ouï-dire et des sources non authentifiés, mais le juge Arlander Keys a rejeté les affirmations de Telewizja Polska et a refusé d'exclure ces éléments de preuve lors du procès<ref>{{en}} [http://cyberlaw.stanford.edu/packets002728.shtml Internet Archive’s Web Page Snapshots Held Admissible as Evidence] - Lauren Gelman, ''Packet 2 (3)'', 17 novembre 2004</ref>. Toutefois, au moment du procès, le juge de la cour du district, Ronald Guzman, en première instance, a annulé les conclusions du juge Keys, et a conclu que ni l'Internet Archive ni les pages sous-jacentes (c'est-à-dire le site de Telewizja Polska) n'étaient admissibles comme preuve. Le juge Guzman a estimé que l'impression d'une page internet n'était pas une preuve d'authentification de l'information<ref>{{en}} [http://www.strozllc.com/docs/pdf/PROVING_WEB_HISTORY_Jrl_of_Internet_Law_Feb%202006.pdf Proving Web History: How to use the Internet Archive] - Beryl A. Howell, ''Journal of Internet Law 3-9'', février 2006 {{pdf}}</ref>.

===== Healthcare Advocates, Inc. =====

En 2003, Healthcare Advocates, Inc. a été accusée dans un procès de violation de marque. La poursuite a tenté d'utiliser du matériel internet archivé accessible ''via'' Internet Archive. Après avoir perdu ce procès, la compagnie a tenté de poursuivre Internet Archive pour violation de la [[Digital Millennium Copyright Act|DMCA]] et le ''[[Computer Fraud and Abuse Act]]''. Ils ont fait valoir que, puisqu'ils avaient installé un fichier [[robots.txt]] sur leur [[Site web|site Web]], il aurait dû être évité par le robot d'IA<ref>{{en}} Jessica Dye, ''Website Sued for Controversial Trip into Internet Past'', ''EContent'', 28 (11): 8-9, 2005</ref>. La première plainte a été déposée le {{date-|26 juin 2003}}, et ils ont ajouté le fichier robots.txt, le {{date-|8 juillet 2003}}, les pages devant être retirées rétroactivement. Le procès s'est réglé à l'amiable<ref>{{en}} [https://arstechnica.com/news.ars/post/20060831-7634.html Internet Archive Settles Suit Over Wayback Machine] - Eric Bangeman, ''Ars technica'', 31 aout 2006</ref>.

Robots.txt est utilisé dans le cadre du protocole d'exclusion des robots (''{{lang|en|Robots Exclusion Standard}}''), une norme d'application volontaire qu'IA applique et qui interdit aux robots d'indexer certaines pages marquées par le créateur comme hors limite. En conséquence, l'IA a supprimé un certain nombre de sites Web qui sont maintenant inaccessibles ''via'' la Wayback Machine. Ceci est parfois dû à un nouveau propriétaire qui plaçait un fichier robots.txt interdisant l'indexation du site. Les administrateurs disent travailler sur un système qui permettra l'accès aux archives précédentes tout en excluant les éléments créés après l'ajout du fichier.

En 2006, IA appliquait la règle du Robots.txt rétroactivement. Si un site bloque IA, à l'instar de Healthcare Advocates, toutes les pages précédemment archivées depuis ce domaine sont également supprimées. Dans les cas de sites bloqués, seul le fichier robots.txt est archivé. Cette pratique semble être préjudiciable aux chercheurs accédant à des informations disponibles dans le passé.

Toutefois, IA précise également que « parfois un propriétaire de site Web nous contacte directement et nous demande d'arrêter l'indexation ou l'archivage d'un site. Nous nous conformons à ces demandes. » Ils ont aussi expliqué qu'{{citation|Internet Archive n'est pas intéressé par la préservation ou l'offre d'accès à des sites Web ou d'autres documents Internet appartenant à des personnes qui ne voudraient pas que leur matériel soit archivé}}.

==== Loi des brevets ====

L'[[United States Patent and Trademark Office|Office des brevets aux États-Unis]] et, sous réserve que des exigences supplémentaires soient remplies (par exemple, fournir une déclaration officielle de l'archiviste), l'[[Office européen des brevets]] accepteront une datation d'Internet Archive comme preuve de la publication d'une [[Page web|page Web]]. Ces dates sont utilisées pour déterminer si une page Web est disponible avant par exemple la date de dépôt d'une demande de brevet.

=== Droit d'auteur ===

==== Grateful Dead ====

En {{date-|novembre 2005}}, le téléchargement gratuit des concerts de [[Grateful Dead]] a été supprimé du site. [[John Perry Barlow]] a identifié [[Bob Weir]], [[Mickey Hart]] et [[Bill Kreutzmann]] comme les instigateurs de ce changement<ref>{{en}} [http://www.iht.com/bin/print_ipub.php?file=/articles/2005/12/01/business/deadheads.php Wrath of Deadheads stalls a Web crackdown] - Jeff Leeds et Jesse Fox Mayshark, ''[[International Herald Tribune]]'', {{1er}} décembre 2005</ref>. Le {{date-|30 novembre}}, un ''[[Post (informatique)|post]]'' sur le forum de [[Brewster Kahle]] a résumé ce qui semble être le compromis atteint entre les membres du groupe. Les concerts ''live'' peuvent être téléchargés ou écoutés, et les enregistrements seront disponibles pour écoute seulement. Les concerts ont, depuis, été ajoutés<ref>{{en}} [https://archive.org/iathreads/post-view.php?id=49553 Good News and an Apology: GD on the Internet Archive] - [[Brewster Kahle]] et Matt Vernon, Live Music Archive Forum, {{1er}} décembre 2005</ref>.

==== Suzanne Shell ====

Le {{date-|12 décembre 2005}}, la militante {{Lien|lang=en|fr=Suzanne Shell}} a réclamé la somme de {{unité|100000|[[Dollar américain|dollars]]}} pour l'archivage de son site « profane-justice.org » entre 1999 et 2004<ref>{{en}} [http://blog.ericgoldman.org/archives/waybackshell.pdf Internet Archive v. Shell] - Lewis T. Babcock, Civil Action No. 06cv01726LTBCBS, 13 février 2007 {{pdf}}</ref>. Le {{date-|20 janvier 2006}}, Internet Archive a déposé une action en jugement déclaratoire dans le district du nord de la Californie, demandant au tribunal de juger qu'IA ne violait pas les droits d'auteur de Shell.

Shell a répondu et a déposé une autre plainte contre IA pour l'archivage de son site, elle invoquait la violation de ses conditions de service<ref>{{en}} [http://www.informationweek.com/industries/showArticle.jhtml?articleID=198001674 Colorado Woman Sues To Hold Web Crawlers To Contracts] - Thomas Claburn, ''InformationWeek'', 16 mars 2007</ref>. Le {{date-|13 février 2007}}, un juge du district du Colorado a rejeté toutes les demandes, sauf celle de rupture de contrat<ref>{{Lien web |titre=Internet Archive v. Suzanne Shell - Phillips Nizer LLP Internet Library of Law and Court Decisions |url=https://archive.wikiwix.com/cache/index2.php?url=http://www.phillipsnizer.com/library/cases/lib_case456.cfm#federation=archive.wikiwix.com |site=phillipsnizer.com ''via'' archive.wikiwix.com |consulté le=2022-03-13}}</ref>.

Le {{date-|25 avril 2007}}, IA et Shell ont conjointement annoncé le règlement de leur litige. IA a déclaré : {{citation|Internet Archive n'a aucun intérêt à insérer des informations dans la Wayback Machine de personnes qui ne veulent pas voir leurs contenus web archivés. Nous reconnaissons que {{Mme}} Shell possède un droit d'auteur valide et applicable dans son site et nous regrettons que l'inscription de son site dans la Wayback Machine ait abouti à ce contentieux. Nous sommes heureux d'avoir cette affaire derrière nous.}} Shell a déclaré : {{citation|Je respecte l'objectif et la valeur historique d'Internet Archive. Je n'ai jamais eu l'intention d'interférer avec cet objectif ni de causer aucun dommage<ref>{{en}} [https://archive.org/iathreads/post-view.php?id=119669 Internet Archive and Suzanne Shell Settle Lawsuit], 25 avril 2007</ref>.}}

==== Situation du droit d'auteur en Europe ====

En Europe, la Wayback Machine peut parfois enfreindre les lois sur le droit d'auteur. Seul le créateur peut décider de l'endroit où son contenu est publié ou reproduit, les pages devront être supprimées des archives sur demande du créateur<ref>{{de}} [http://www.jurpc.de/aufsatz/20020029.htm The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?], Martin Bahr, 14 janvier 2002, ''Internet-Zeitschrift für Rechtsinformatik und Informationsrecht: JurPC''</ref>.

==Concurrents==
En Europe ''{{lang|en|European Internet Archive}}'' est un concurrent<ref>https://www.nextinpact.com/lebrief/46192/european-internet-archive-se-lance</ref>.

== Notes et références ==
{{Traduction/Référence|en|Internet Archive|400867220}}
{{Références |colonnes=2}}

== Annexes ==
{{Autres projets|commons=Category:Internet Archive}}
=== Bibliographie ===

* {{en}} S. Aya, W. Y. Arms, L. Walle, B. Kot, R. Mitchell, et P. Dmitriev, « A research library based on the historical collections of the Internet Archive », ''D-Lib'' magazine, 12(2), 4, 2006
* {{en}} S. Hackett, B. Parmanto, et X. Zeng, « Accessibility of Internet websites through time », In ''ACM SIGACCESS Accessibility and Computing'' {{numéro|77-78}}, ACM, 2004, {{pp.|32-39}}
* {{en}} E. Jaffe, E., et S. Kirkpatrick, « Architecture of the internet archive », In ''Proceedings of SYSTOR 2009: The Israeli Experimental Systems Conference'', ACM, 2009, {{p.|11}}
* {{en}} B. Kahle, ''The Internet Archive'', 2012
* {{en}} C. McKay, ''Ephemeral to enduring: the Internet Archive and its role in preserving digital media'', Information Technology and Libraries, 23(1), 3, 2004
* {{en}} T. Schwarz, M. Baker, S. Bassi, B. Baumgart, W. Flagg, C. van Ingen, ... et M. Shah, « Disk failure investigations at the internet archive », In ''Work-in-Progess session'', NASA/IEEE Conference on Mass Storage Systems and Technologies (MSST2006), 2006

=== Article connexe ===
* [[Internet Arcade]]

=== Liens externes ===

* {{Site officiel|en|https://archive.org}}
* {{en}} [http://waybackmachine.org/ The Wayback Machine]
{{Liens|site officiel=-}}

{{Palette|Bibliothèque numérique}}
{{Portail|bases de données|Internet|sciences de l'information et des bibliothèques|Édition numérique|entreprise|San Francisco}}


[[Catégorie:Bibliothèque numérique en ligne]]
[[Catégorie:Bibliothèque numérique en ligne]]

Version du 1 septembre 2022 à 20:37

Internet Archive
Logo de l'Internet Archive
Serveurs du site miroir de la Bibliotheca Alexandrina
Serveurs du site miroir conservé à la Bibliotheca Alexandrina

Création 1996
Fondateurs Voir The Board
Forme juridique Organisme à but non lucratif
Slogan Universal access to all knowledge[1]Voir et modifier les données sur Wikidata
Siège social 300 Funston Avenue, Richmond District, San Francisco, Californie
Drapeau des États-Unis États-Unis
Direction Julien Masanès
Président Brewster Kahle (depuis )[2],[3]Voir et modifier les données sur Wikidata
Activité Archivage et préservation du Web
Produits Cover Art Archive (d)Voir et modifier les données sur Wikidata
Partenaires Digital Public Library of America[4]Voir et modifier les données sur Wikidata
Effectif 122 ()[5]Voir et modifier les données sur Wikidata
Site web archive.orgVoir et modifier les données sur Wikidata
Chiffre d'affaires 29,4 M$ ()[5]Voir et modifier les données sur Wikidata
Bilan comptable 10,8 M$ ()[5]Voir et modifier les données sur Wikidata
Résultat net 4,1 M$ ()[5]Voir et modifier les données sur Wikidata

test

  1. « https://www.youtube.com/watch?v=8YYJPtCXf4I » (consulté le )
  2. « Public Access to Digital Materials », bibliothèque du Congrès (consulté le ) : « APPOINTMENTS ; Internet Archive 1996-present ; Director, Co-Founder »
  3. « Declaration of Brewster Kahle in Support of Petition to Set Aside National Security Letter », Wired (consulté le )
  4. « https://dp.la/browse-by-partner » (consulté le )
  5. a b c et d « https://projects.propublica.org/nonprofits/organizations/943242767/202233199349312193/full »