Créé en 1996 à San Francisco au tout début de l’Internet, l’Internet Archive est un site web à but non-lucratif qui s’est donné pour mission de garder la mémoire du Web.
En 2002, il a signé avec la BA un accord en vertu duquel cette dernière devrait en assurer une sauvegarde et en créer deux sites miroirs. Suite à cet accord, la BA a intégré les machines d’archivage web de la 1re génération, y compris une copie de la collection d’archives web couvrant la période 1996-2001 à l’époque. En 2006, la BA a remplacé l’infrastructure initiale d’archivage web de capacité de 100 To par une nouvelle conception (interface) acquise de l’Internet Archive originale et munie d’une capacité de stockage de 1.5 pétaoctets répartis sur 23 racks ; celle-ci a reflété, à ce temps, une décennie d’archivage web à compter de 1996. En 2008, la BA a encore ajouté un autre 1.4 pétaoctets de capacité ayant pour source les machines qui ont été conçues et montées localement. Dès lors, la capacité s’est accrue deux fois en dépendant toujours du matériel localement assemblé. A présent, les archives de la BA jouissent d’une capacité de stocker 4.9 pétaoctets de données variables, et sont utilisées non seulement pour l’archivage web, mais également en grande partie pour la sauvegarde du contenu numérique, principalement composé d’une très grande collection de livres numérisés par la BA.
La collection d’archivage web de la BA peut être accédée par les utilisateurs nationaux, régionaux et internationaux, via la Wayback Machine sur le site (web.archive.bibalex.org).
Le nombre de hits (visites) est en croissance annuelle.
L’Internet Archive est le 1er centre en son genre au-delà des frontières des Etats-Unis. Il sert, non seulement de sauvegarde aux données des archives mères, mais aussi de centre d’informations pour l’Afrique et le Moyen Orient.