Библиотека Конгресса США намеревается архивировать все сообщения популярной социальной сети Twitter для своей коллекции. В настоящий момент в Twitter публикуется 400 миллионов сообщений ежесуточно. Напомним, что каждое сообщение ограничено 140 символами. Однако это всё равно невероятный объем данных измеряемый гигабайтами.
Пока проект еще в планах. У библиотеки есть полный архив, но пока инициаторам непонятно как осуществлять сортировку исходных данных и как именно должен выглядеть пользовательский интерфейс системы. Плюс к тому публиковаться будут только те твиты, срок которых превышает 6 месяцев.
В любом случае, к сожалению, база предназначена только для некоммерческого внутрибиблиотечного использования и сохранения. Система будет доступна только для зарегистрированных посетителей Библиотека Конгресса США по библиотечным карточкам.