Big data и реинкарнация магнитной ленты

Перспективные задачи иногда дают второе дыхание устаревающим разработкам. На них опираются всегда, в то время, когда требуется проверенное годами ответ. Так происходит на данный момент и с применением кассет для хранения громадных количеств данных.

Магнитная лента в первый раз была использована для хранения кода программы на счётной машине UNIVAC в первой половине 50-ых годов XX века. Активное применение кассет для хранения любой информации длилось до недавнего времени. Картриджи стримеров оставались одним из самых удачных и надёжных вариантов хранения архивных копий.

Big data и реинкарнация магнитной ленты

Магнитная лента на ЭВМ UNIVAC (фото: briosolutions.com).

Неспешно спрос на них понижался. Этому содействовало появление твёрдых дисков со всё большей низкой ценой и плотностью записи. К 2008 году магнитная лента уже еле могла составлять борьбу дисковым массивам кроме того в своеобразных областях применения.

К 2012 году темпы понижения количеств рынка ленточных накопителей составили 14% в год, и разработку уже в мыслях хоронили. Но тогда же произошло наводнение в Таиланде, которое длилось сто семьдесят пять дней. Среди затопленных индустриальных территорий были и те, на которых выпускалась продукция для Western Digital, Seagate и Toshiba. Неспециализированное число создаваемых в мире твёрдых дисков уменьшилась на четверть. Цены на них взлетели до 60%, а уровень качества изготовления упало.

Приблизительно одновременно с этим был запущен множество долговременных научных проектов, генерирующих огромное количество данных. В случае если их обработку эргономичнее делать на массивах оперативной либо флеш-памяти (IMDG / SSD), то оптимальный метод хранения определяется низкой себестоимостью и надёжностью. Вариантов организации последнего оставалось не так уж большое количество.

Новые опыты CERN на БАКе, исследования радиоастрономии и генетики – всё это потребовало снова искать оптимальные методы хранения информации. Так магнитная лента взяла вторую жизнь.

Big data и реинкарнация магнитной ленты

Один лишь проект SKA будет каждый день генерировать поток данных, превышающий совокупный количество трафика в сети (изображение: SPDO/Swinburne Astronomy Productions).

хранения подразделения и Глава обработки данных CERN Альберто Пэйс (Alberto Pace) отмечает, что у современных роботизированных ленточных библиотек имеется четыре преимущества если сравнивать с массивами твёрдых дисков.

Первое из них (как ни необычно) – скорость. Да, роботу может потребоваться до срока секунд, дабы лишь выбрать нужную кассету из архива и поместить её в считывающее устройство. Но после этого линейное чтение осуществляется в четыре раза стремительнее, чем с сетевых дисковых хранилищ.

Второе – надёжность. В случае если магнитная лента порвётся, то её возможно за пара секунд. Наряду с этим будут потеряны много мегабайт данных, но б?льшую часть удаётся машинально вернуть за счёт избыточности. В то время, когда из строя выходит жёсткий диск, то довольно часто все терабайты данных на нём утрачиваются безвозвратно.

На конкретных цифрах это выглядит более наглядно. Неспециализированный количество данных CERN сейчас превышает 50 ПБ. Каждый год из них теряется более чем ста терабайт по обстоятельству поломки твёрдых дисков (не редкость, что какой-то RAID-массив разрушается полностью). Менее гигабайта в год теряется из-за повреждений магнитных лент.

Big data и реинкарнация магнитной ленты

Ленточное хранилище данных в CERN (фото: hardware.slashdot.org).

Третье – минимальное потребление энергии за счёт хранения в неактивном состоянии. Лента протягивается через магнитные головки лишь для операций чтения/записи, а б?льшую часть времени находится в картриджа. Исходя из этого ленточные накопители в десятки раз экономичнее массивов твёрдых дисков при долгой эксплуатации.

Четвёртое – безопасность. Случайно либо злонамеренно удалить все сведенья с твёрдых дисков возможно за пара мин.. Оператор просто не успеет подметить и остановить процесс, а восстановление потребует для того чтобы же количества чистых твёрдых дисков. Полное стирание всех кассет заняло бы месяцы, а потому скрыто сделать это фактически нереально.

Сотрудники научно-исследовательской лаборатории IBM в Цюрихе показывают ещё на два серьёзных отличия. На данный момент средняя цена хранения гигабайта образовывает четыре цента для кассет и десять – для твёрдых дисков. Вдобавок гарантированное время хранения кассет в шесть раза больше.

Картридж для стримера – пассивное устройство. Лежащая в архиве магнитная лента разрушается весьма медлительно. При адекватных условиях хранения она остаётся читаемой кроме того через три десятилетия. Жёсткий диск устроен значительно сложнее. Его конструкция запланирована на периодическую либо кроме того круглосуточную работу. Долгое нахождение в неактивном состоянии ведет к нарушению функционирования его механической части. В пролежавшем более пяти лет диске при первом же включении может заклинить шпиндельный двигатель.

Big data и реинкарнация магнитной ленты

Обслуживание совокупности StorageTek (фото: bnl.gov).

Само собой разумеется, недочётов у ленточных накопителей также хватает. Роботизированное хранилище требует обслуживания, а из-за малого времени произвольного доступа такие совокупности уже ни при каких обстоятельствах не станут главным (и тем более – единственным) вариантом. Но кассеты так же, как и прежде занимают ответственное место в иерархической структуре хранения информации.

С «громадными данными» на данный момент сталкиваются не только в науке. Они попадают во все сферы судьбы и деятельно внедряются в современные бизнес-процессы. В соответствии с отчёту Эндрю Лёна (Andrew Leung) из Университета штата Калифорния, около 90% информации на любом предприятии теряет актуальность через пара месяцев. Эти сведенья ещё владеют сокровищем, но вряд ли пригодятся в скором будущем. Магнитная лента – совершенный вариант для их архивации.

Big data и реинкарнация магнитной ленты

Картридж Сони LTX2500G (фото: itdevicesonline.com).

Современные картриджи стримеров имеют ёмкость более чем шести терабайт при применении большой степени сжатия, но этого всё равняется не хватает. Два года назад Fujifilm создала прототип кассеты ёмкостью 35 ТераБайт. на данный момент компания трудится над методами расширить количество одного картриджа до ста терабайт.

HP Surestore (Benchmark) DLT1 в работе


Похожие статьи: