Posts tagged ‘btrfc’

Лучше Чем Настоящий FibreChannel - виртуализация

Вообще же полемика между “Настоящим FibreChannel” и “Ненастоящим” (или как говорит NetApp - Лучше Чем Настоящим FibreChannel) сводится к допустимости или недопустимости виртуализации ресурсов, допустимости или недопустимости использования “абстрактного представления” в системе хранения.

С этой точки зрения ситуация довольно забавна. Представьте себе, что нынче, в 2009 году кто-то начнет пропагандировать какой-нибудь, например, MS-DOS, с аргументами вида: “Только у нас - Настоящее прямое управление памятью! Не какая-то там жульническая “виртуальная память” где-то на каких-то дисках, или еще черт знает где, которая то есть, то нет, она ненадежна, она тормозит, и так далее. Только у нас - Настоящая Оперативная Память!”

Никто не спорит, что Оперативная память это хорошо. Когда ее много. Особенно когда ее Очень Много. Вообще никаких проблем. Симметрикс - классная машина, если вы можете позволить себе его купить (и содержать). Но на практике жизнь заставляет искать решения, не решающиеся лобовым “таранным ударом” гигагерцев и терабайтов. ?? вот тут уже “Настоящая Оперативная Память” уже начинает иметь свои, очень серьезные недостатки. ?? напротив, полная недостатков и компромиссов “Виртуальная память” позволяет делать вещи, которые иначе просто не реализовать.

Трудно представить, во что бы превратилась современная техника, пошедшая по пути Настоящей Оперативной Памяти, без многозадачности, без виртуализации, без “защищенного режима” и прочих “грязных трюков”. Зато был бы пуризм “Настоящести”, и никаких компромиссов.

С “виртуальной памятью” компьютерный мир “смирился” и подружился уже давно. Относительно недавно подружился и с виртуализацией процессоров и вычислительных систем вообще, в виде многочисленных гипервизорных систем, от VMware начиная. Пришла пора понять и принять виртуализованный сторадж. ?? NetApp делает в этом направлении один из наиболее основательных шагов.

Лучше Чем Настоящий FibreChannel - Дедупликация

Несколько слов о том, почему, собственно, именно NetApp занял сейчас такую значительную долю рынка дедупликации, и что мешает сделать то же самое другим вендорам.
Ну конечно, в значительной мере, свою роль сыграло бесплатное предложение данного функционала, как я уже говорил ранее, лицензия на Deduplication поставляется бесплатно. ?? это, безусловно, способствовало широкому распространению технологии. Та же история была сыграна в свое время с рынком iSCSI, на котором NetApp так же занял значительную его часть (увы, не в России, которая до сих пор для себя iSCSI и его преимущества, по существу, не открыла)

Однако никакая бесплатность не сработала бы, если бы продукт был бы неработоспособен в принципе.
Что же мешает сделать то же самое, реализовать ту же, рассмотренную ранее модель с оффлайновой дедупликацией, ведь вроде все по описанию просто? В чем же дело?

А дело вновь в “волшебных пузырьках”, которые называются WAFL. :)

Один из блоггеров NetApp, за которым я внимательно слежу и читаю все его выпуски, уже не раз тут упомянутый Костадис Руссос, полемизируя с “блогорупором EMC” Чаком Холлисом, который использовал в одном из постов в приложении к продуктам EMC слова “Настоящий FibreChannel” (Real FibreChannel), в противовес “всяким там эмуляциям, SAN-ам из NAS-а, и прочим ‘виртуальным’ стораджам”, стал использовать термин “Лучше Чем Настоящий FibreChannel” (Better Than Real FibreChannel).

??так, чем же NetApp Лучше Чем Настоящий FibreChannel.

Вы уже знаете, что система хранения NetApp для организации и доступа к данным на дисках использует специальную логическую структуру, особую “файловую систему”, под названием WAFL - Write Anywhere File Layout. К подробностям о ней, ее устройстве и всяких интересных штуках, отсылаю к моим предыдущим постам на эту тему.
Для нас сейчас интересен один аспект.

Дело в том, что использование дедупликации для любой системы хранения влечет за собой немедленную и очень сильную фрагментацию данных. Очевидно, что если мы заменяем, в последовательно записанных данных, каждые несколько блоков на ссылку куда-то в недра ранее записанных данных, которые являются полностью идентичными вновь записанным, то старательно последовательно записанный фрагмент превращается в хаотически размазанный по всему стораджу.

Это настоящий кошмар для любого “класического стораджа”, который любой ценой стремится минимизировать random-компоненту доступа, так как на нем эффективность его резко падает как на записи (особенно), так и на чтении (большое “замусоривание” кэша и отсутствие эффективного “предсказания”/”read ahead”).

Но ведь вспомните, такой режим “постоянно-рандомной записи и чтения” есть по сути “нативный” режим для WAFL! Блоки WAFL записываются и считываются произвольно и рандомно не только в случае дедуплицирования данных, но и при обычной, естественной работе, которой стораджи NetApp занимаются уже много лет!
То есть переход от “классического” к “дедуплицированному” хранилищу, и вызванная этим “фрагментация данных”, такая катастрофическая для “классического” стораджа, вполне обычна и повседневна для NetApp, и включение дедупликации на быстродействии системы хранения никак не отразится!

Что, кстати подтверждают и реальные пользователи, которые называют величины падения производительности при переходе к дедуплицированным данным, там где их удается замерить, в считаные единицы процентов.

То есть, проблема использования дедупликации это, по сути, проблема решения задачи обеспечения производительности на фрагментированных данных со случайным чтением.
А так как NetApp давно и успешно решил для себя внутри проблему доступа к фрагментированным данным, то и переход к дедупликации не будет для него болезненным, или коль-нибудь заметно отражающимся на его производительности.
(я уже приводил цифры, когда тщательно, искуственно, и специально подготовленный не встречающемся в реальной жизни фрагментированием, дисковый раздел имел сниженную производительность всего на 10-15 процентов)

Вот что нам дает такая классная штука, как придуманная и написанная аж в 92 году специальная “файловая система”, вот в чем преимущества “виртуальных стораджей” над “настоящим FibreChannel”. Вот чего “настоящий FibreChannel” не может.