Жили-были данные. Ладные и стройные. И
жил рядом с ними Энтропий Хаоситович, да не достигнуть ему никогда числа Эн,
для которого их ладность да стройность были как скрежет по кастрюле и звон
комара летней ночью вместе взятые. Короче говоря, прямо кушать не мог, так ему
не нравилось, когда они структуру приобретали и сохраняли ее надолго. С
информацией в целом он поделать ничего не мог, во всяком случае пока реальность
остается объективной. Но данные живут на носителях, а еще они должны быть
понятными, для них нужен язык, пусть даже бинарный, всего из двух значений
состоящий. Вот тут-то и ловил их Энтропий! То носитель прихлопнет, то искажений
нашлет. Сгоревшие и сгнившие книги. Рассыпающаяся в архивах кинопленка.
Рыдающие над сгоревшим винчестером тетеньки-бухгалтеры. Исчезает язык – и никто
не понимает даже сохраненные данные, застывают они, как муха в янтаре, до тех
пор, пока кто-нибудь не догадается проанализировать странные закорючки на
выкопанном черепке.
Если серьезно, то вся привычная для нас
цивилизация построена на обработке данных. Речь идет не только об
информационных технологиях – без обмена информацией, обучения даже мотыгой
землю не вскопаешь. Вне информационных потоков получается Маугли. Что уж
говорить о технологическом обществе. Я даже не буду перечислять критично
зависимые от обработки данных сферы деятельности. Даже наша картина мира
формируется информационным пространством. Картинка настоящего и прошлого в
отсутствие доступа к прямым свидетелям – это чистое обращение к документальным
источникам. Но вот интересный парадокс: мы часто говорим о лавинообразном росте
объемов данных, интересуемся скоростью их передачи в пространстве, а вот как
обстоят дела с их сохранностью и передачей во времени? Причем передачей на
действительно большую временную дистанцию?
История обработки данных – это во
многом история поиска надежного носителя и языка кодирования. С этими
проблемами человечество встретилось давным-давно. Сначала полагались сугубо на
свою память и устную речь. В принципе, такие сообщения могли быть очень
живучими, и передаваться из поколения в поколение. Если везло, конечно. С
появлением письма передача упростилась. Вот только от юзеров уже требовалось
умение декодировать сообщения, проще говоря, умение читать, да и проблема
искажения данных при передаче оставалась актуальной. Один из важных бонусов
книгопечатания в свое время – как раз снижение количества случайных или
намеренных ошибок при переписывании рукописей. Речь изначально шла о духовной
литературе, в которой ошибки были крайне нежелательны – Европа того времени
задорно и с упоением воевала и по менее значительным поводам.
Принципиальные изменения произошли с
появлением машиночитаемых носителей, сначала аналоговых, а потом и цифровых.
Главный подарок «цифры» – возможность многократного копирования данных без
потери содержания. Такое резервирование серьезно повысило шансы на сохранность
данных. С другой стороны, появились и специфические проблемы, связанные с
быстрой эволюцией доступных носителей и способов кодирования данных. Это на
рисунок оленя на стене пещеры можно смотреть невооруженным глазом и с коптящим
факелом. Чтобы узнать, что находится внутри файла, нужна масса вещей – от
работающей электростанции до устройств отображения и алгоритмов декодирования.
Сохранность данных – проблема
универсальная, актуальная и для крупной корпорации, и для личного архивчика.
Нам же тоже хочется сохранить свои дорогие мелочи. Показать как-нибудь внукам
фотку дедушки на деревянной лошадке, тьфу, с самым первым айфоном и удариться в
воспоминания о временах, когда смарты еще носили отдельно от мозга.
На чем же мы сохраняем свои данные?
Если говорить о стойкости различных электронных носителей, то нужно сразу
учесть, что заявленная и реальная стойкость могут сильно отличаться.
Производители по понятным причинам действуют по суворовскому принципу: «Пиши
поболе, чего их, супостатов, жалеть!» И не врут же – в идеальных лабораторных
условиях все может быть, а заявленные сроки лет в сто все равно мало кто
проверит. Реальный срок жизни носителя зависит от множества факторов – от
тщательности производства до аккуратности сбережения. Так, например, для
болванок CD-R/RW тоже были заявлены десятилетия
хранения, а сколько личных архивов мы потеряли в реальности?
Запись на магнитных носителях
достаточно уязвима. Приснопамятные дискеты не всегда нормально работали даже
будучи только что распакованными. Классическим винчестерам угрожают
размагничивание и механические неполадки. Стандартный срок их надежной службы –
три-пять лет. Механика в классическом винчестере выйдет из строя гораздо
быстрее, чем диск потеряет необходимые магнитные характеристики. Но в рекламных
таблицах и инфографике вы увидите те цифры, которые будут больше. Да, данные
можно будет, если постараться, восстановить, но операция будет нетривиальная. В
SSD движущихся частей нет, но есть ограничение на количество циклов перезаписи
ячеек. Если не трогать, то лет пятьдесят должен протянуть. Простая флэшка
теоретически выдаст сопоставимый результат. Кто возьмется проверить и записать
на нее архив с действительно важными данными? Магнитные ленты до сих пор
применяются для хранения больших архивов. Стоят такие системы тучу денег и в
общем-то не предназначены для организации активной работы с архивом. Как и
любая механическая система, лента изнашивается и стареет, причем при
интенсивном использовании быстрее. Так что паспортные данные о сроке хранения –
тоже сугубо справочные цифры для идеальных условий. Реалистичные цифры
составляют порядка десяти-двадцати лет.
Технология оптической записи
потенциально весьма долговечна. Мы имеем дело с физическими питами/лэндами и
отражающим напылением. Размагничиваться нечему, достаточно обеспечить защиту от
механических повреждений. С записываемыми дисками ситуация печальней. У
активного слоя могут быть разные рецептуры. Объединяет их неизбежное ухудшение
свойств с течением времени. Болванки стареют, даже если на них ничего не
записано и ими никто не пользуется. Были специальные марки болванок с более
стабильным несущим слоем, даже диски в картриджах, но кто их видел на
действительно массовом рынке?
У всех оптических дисков, по оценкам
архивных служб, примерно одинаковый гарантированный срок хранения. Для CD и DVD
– это пять-десять лет, причем DVD-подобные диски чуть прочней, так как несущий
слой находится между пластиковыми пластинами. Сколько продержатся Blu-ray-носители, которые только несколько лет как на
широком рынке, точно пока не знает никто. Теоретически они должны оказаться
надежнее. Как бы то ни было, от старых добрых царапин, как и от гриппа,
универсального лекарства пока не придумали. Так что, даже если смотреть на
заявленные характеристики, больше ста лет нам никто и не обещает.
А ведь мало сохранить носитель, его еще
надо на чем-то прочитать. Представьте, что нашли коробку с пятидюймовыми
дискетами, – и куда их прикажете вставлять? А ведь дискеты – это не так уж и
давно было. Даже если вы найдете аппарат для чтения какого-нибудь старого
картриджа, сможете ли подключить его архаичный порт к современному компьютеру и
найти для него драйверы, когда компания-производитель уже давным-давно ушла с
рынка? А остановиться-то рынок не может, объемы данных растут, новые носители
должны соответствовать им прямо сейчас, принося прибыль разработчикам. Я уже
молчу про форматы файлов и способы кодирования. На заре компьютерной эры даже
привычная бинарная логика была не единственным вариантом развития умной
техники.
Так что, счастливые обладатели бэкапов,
имейте в виду: то, что у вас на полочке лежит запасной диск, не означает, что
вы сможете воспользоваться записанными данными лет через двадцать. Ладно,
подручные бэкапы, но десять-двадцать лет как горизонт планирования исторической
сохранности – это несерьезно.
А как же облака? Действительно, в
облаках устойчивость данных достигается за счет их многократного резервирования
и распределения. Не буду вдаваться в нюансы рынка, а их там предостаточно, но
ведь облако тоже должно на чем-то накапливать и хранить информацию. Если
меняются технологии, данные нужно переносить. Проблему длительного хранения
облака радикально не решают. Вопрос надо ставить иначе: сколько протянет та или
иная копия до того, когда понадобится ее перезаписать? В облаке данные должны
находиться в процессе постоянного использования и перезаписи. Как только этот
процесс по какой-то причине, будем надеяться, неглобальной, прервется, мы
вернемся в исходную точку: цифровая информация будет достаточно быстро утеряна.
Вывод: даже в облаках в длительной перспективе шансы есть только у тех данных,
к которым будут постоянно обращаться, перенося их на все новые и новые
носители. Поэтому задача всех современных носителей, по сути, сводится к тому,
чтобы дожить до следующей перезаписи на новое поколение. Реальность такова, что
массовых технологий, способных сохранить данные хотя бы для нескольких поколений
потомков, сейчас просто нет! Чего там фантасты фантазировали про запись
человеческого сознания? Максимум сто лет, и клиент все равно готов. Я
определенно хотел бы посмотреть, кто и как будет читать такие записи через
тысячу лет.
Шанс того, что далекие потомки будут
знать о Древнем Египте больше, чем о нашем времени, не так уж мал, как может
показаться на первый взгляд. Один серьезный катаклизм – и всё, останемся в
истории «темным цифровым веком».
А пирамиды будут стоять, как и стояли
раньше. И глиняные таблички с клинописью еще полежат. У наскальной живописи
гарантийный срок хранения вообще измеряется десятками тысяч лет. Если, конечно,
не придут какие-нибудь бабаи с гранатометами и не разобьют все на хрен, как это
сделали в свое время с буддистскими статуями талибы в Афганистане. Если
рассчитывать на тысячи лет, нужно что-то не такое заметное. Артефакты должны
быть выполнены обязательно на стойком носителе и с помощью надежного принципа
записи, подразумевающего чтение даже на неоригинальном оборудовании. Или вовсе
без него.
Фирма Hitachi пару лет назад
представляла прототип системы записи данных на небольших стеклянных пластинках.
Двоичный код гравируется лазером в толще кварцевого стекла. Плотность записи
получалась на уровне CD. Объем данных на пластинке два на два сантиметра – 25
мегабайт. Скромненько, но, если понадобится, данные с пластинки можно считать с
помощью обычного микроскопа, а не только на специальном оборудовании. Кварц –
штука довольно прочная, устойчивая к химикатам, так что храниться пластинка
сможет действительно долго. Остается, правда, проблема последующей расшифровки
записи при утрате сведений об исходном способе кодирования. Промышленные версии
носителей обещали представить в 2015-м, так что скоро узнаем, что у японцев получится
в итоге.
Бинарный код в кварцевом стекле – это
хорошо, но некоторые архивисты предлагают пойти еще дальше и отказаться от
цифровой записи вообще, возродив на новом технологическом уровне такую,
казалось бы, технологическую древность, как микрофиши. Суть в том, что в стекло
запаиваются миниатюрные изображения текстов, картинок, схем или что там еще
потребуется, выполненные на миниатюрных металлических (золото или платина)
пластинках. Дополнительного декодирования не требуется, равно как и особого оборудования,
только увеличительная техника.
А что останется от наших данных, если
исчезнет человечество? Пожалуй, хорошие шансы будут все-таки у аналоговых
носителей. Пределы Солнечной системы уже покинули несколько аппаратов, на
бортах которых содержатся послания с информацией о Земле и ее обитателях. Это
«Пионер-10», «Пионер-11» и два «Вояджера». Причем в создании всех этих посланий
принял участие один человек – профессор Карл Саган. Пластинки «Пионеров» и
«Вояджеров» отличались по содержимому и принципу записи. Послания «Пионеров»
выгравированы на пластинах анодированного алюминия и содержат простые рисунки.
«Вояджер» же несет настоящий мультимедийный диск с аналоговой записью музыки,
человеческой речи и звуков Земли. В комплект входит иголка, а на футляре диска
выгравирован мануал с пояснением внеземной цивилизации, как все это собрать и
прослушать запись. Наивно, конечно, но так решили в семидесятые. Впоследствии
провели полусерьезный эксперимент, в котором ученым, не принимавшим участие в
создании посланий, предлагали расшифровать записи на «космических» пластинках.
Забавно, но ни один участник эксперимента не смог расшифровать послания
полностью. Будем надеяться, что если уж не братья по разуму, то какой-нибудь
Больцмановский мозг, возникший в результате случайных флуктуаций вакуума, хоть
что-нибудь да поймет. Если заинтересуется, конечно.
Считается, что примерный срок жизни
биологического вида – около десяти миллионов лет. Времечко ожидается
неспокойное. Меньше чем в одном световом годе от Солнечной системы пройдет
звезда Глизе 710. Статистическая вероятность того, что за пару миллионов лет в
Землю врежется несколько комет или астероидов, перезапустив или вообще обнулив
эволюцию живых форм, довольно высока. Не исключен близкий взрыв сверхновой. К
этому моменту «Пионер-10» уже давно пролетит мимо Альдебарана, а «Пионер-11»
прогуляется по созвездию Стрельца. Или Орла – как судьба сложится. Так что
маленькие алюминиевые пластинки потенциально станут самыми надежными
материальными памятниками канувшему в Лету современному человечеству.