Подробнее про A-SIS

Немного подробностей о вышеупомянутой новинке: технологии де-дупликации - A-SIS (Advanced Single Instance Storage).

Технология базируется на существующей у файловой системы WAFL, использующейся внутри системы хранения, функции вычисления 16-разрядного “хэша”, уникальной контрольной суммы для каждого записываемого 4kb-блока. Занесенный в специальную внутреннюю базу данных, такой хэш позволяет для каждого записываемого блока проверить, не существует ли такой точно блок уже записанным на диск. Логично было бы, в случае если абсолютно точно такой блок данных уже присутствует на диске (а хэш-функция позволяет устанавливать идентичность блоков данных с абсолютной точностью), не занимать место на диске под еще одну копию данных, а хранить в каждом новом экземпляре блока данных только ссылку на единственную его копию.

Такой очевидный трюк “виртуализации” хранения данных к сожалению до сих пор не был реализован в “живой природе” по причине слишком высокой нагрузки на систему хранения при всех сопутствующих данному действию операциях (вычисление хэша, сохранение в базе данных, выборка по базе, создание линка и т.д.). Тем не менее те или иные реализации де-дупликации данных начали появляться, правда их реализации страдали многими “детскими болезнями”. Одной из первых такую технологию предложила год назад компания Network Appliance, правда, она была весьма ограничена в применении, поскольку использовалась только на “файловом” уровне, то есть определяла дубликаты файлов на NAS-системе, и работала только для задач резервного хранения, совместно с непростой и дорогой системой резервного копирования NetBackup технологического партнера NetApp компании Symantec (ранее Veritas).

?? вот теперь, наконец, представлена полноценная система де-дупликации, работающая не только для файлов и для резервного копирования, но и для вообще любого, в том числе для “блочного” типа доступа, то есть работающего не только для NAS, но и для SAN! Не только для резервного копирования, где, без сомнения, де-дупликация сама по себе была черезвычайно полезна, даже несмотря на необходимость использования “тяжелого” и дорогого NetBackup, но и для любых используемых данных вообще!
Утверждается, что эффективность применения де-дупликации A-SIS может составлять от 20:1 до 50:1 “компрессии” хранимой емкости!

Еще более привлекательной эту технологию делает запланированная цена лицензии (как и все прочие функции системы хранения NetApp она уже существует в коде системы, и лишь включается введением соответствующей лицензии):
для Nearstore - бесплатно (!), для FAS - 3000$.

Где же нас Как насчет performance impact, влияния новой опции на производительность? Сам NetApp называет ее “незначительной” (1-3%), однако ждем более независимых и более “численных” результатов.
Так или иначе, никакого другого эпитета для этой технологии, чем весьма девальвированное в последнее время слово “революционный”, мне по этому поводу на язык не приходит.

См. также сообщения в компьютерной прессе:

C-News
E-Week
TechTarget

Оставить комментарий