Posts tagged ‘maintenance’

Как проверить и восстановить целостность WAFL?

Возможно вы уже знакомы с так называемым special boot menu, которое появляется, если при загрузке с сериальной консоли нажать Ctrl-C. Любопытно, что кроме 6 предлагаемых вариантов, в этом меню есть и скрытые варианты. Например, если туда, вместо предлагаемых номеров, ввести WAFL_check [aggrname], где [aggrname] это имя соответствующего аггрегейта, то начнется подробная проверка консистентнсти WAFL на нем. Это может помочь если, по какой-то причине, состояние дисков и WAFL на них настолько нарушено, что система хранения не загружается, или не в состоянии разрулить проблему обычными средствами.

По сути это аналог fsck в single mode для привычных unix-type filesystem.

Пример:

Special boot options menu will be available.
NetApp Release 7.0.4P1: Mon Feb 27 14:36:15 PST 2006
Copyright (c) 1992-2006 Network Appliance, Inc.
Starting boot on Sat Mar 24 15:36:18 GMT 2007
(1) Normal boot.
(2) Boot without /etc/rc.
(3) Change password.
(4) Initialize all disks.
(4a) Same as option 4, but create a flexible root volume.
(5) Maintenance mode boot.
Selection (1-5)? WAFL_check aggr01
Sat Mar 24 15:38:15 GMT [wafl.vol.inconsistent:ALERT]: Aggregate aggr01 is inconsistent. Please contact NetApp Customer Support.
Sat Mar 24 15:38:15 GMT [raid.vol.replay.nvram:info]: Performing raid replay on volume(s)
Sat Mar 24 15:38:15 GMT [raid.cksum.replay.summary:info]: Replayed 0 checksum blocks.
Sat Mar 24 15:38:15 GMT [raid.stripe.replay.summary:info]: Replayed 0 stripes.
Checking aggr01…
WAFL_check NetApp Release 7.0.4P1
Starting at Sat Mar 24 15:38:17 GMT 2007
Phase 1: Verify fsinfo blocks.
Phase 2: Verify metadata indirect blocks.
Phase 3: Scan inode file.
Phase 3a: Scan inode file special files.
Phase 3a time in seconds: 9
Phase 3b: Scan inode file normal files.
(inodes 5%)
(inodes 10%)

(inodes 92%)
(inodes 97%)
(inodes 99%)

Следует также отметить, что не зря эта команда запрятана так далеко и неочевидно. WAFL зарекомендовала себя чрезвычайно стабильной и надежной файловой системой, и нужда в таком своеобразном fsck возникает, на самом деле, очень редко.

Maintenance mode

??значально я ориентировал тематику этого блога на людей, впервые входящих в “мир энтерпрайс-стораджей” и недавно познакомившихся с системами NetApp, поэтому стараюсь поддерживать “популярную” тематику, не заползая в малоинтересные начинающим дебри и детали.
Но знаю, что читают меня и уже “действующие” нетапп-админы. Прошу у них прощения, что по причине выбранной аудитории я не даю особо много интересного для такого advanced-уровня.

Долго думал, стоит ли такое упоминать в блоге вообще. Но решил помянуть, без особых подробностей. А то еще уроните что-нибудь, будете потом меня клясть ;)

В контроллерах NetApp, так как это, по сути, “сервер”, есть “BIOS”. Это не совсем то, что мы привыкли под этим словом видеть на x86-серверах. Но он будет очень сильно знаком админам sparc-серверов, так как сделан в виде привычного для них OpenBoot.
Это некая модульная pre-boot программа, которая много что умеет.
Попасть в нее можно подключив к системе хранения консольный кабель (а также через RLM, по моему, тоже можно), остановив и перегрузив контроллер.

Вряд ли в нее стоит лезть начинающему админу, тем более, что быстро убить все данные системы там есть мест гораздо более одного.

Тем не менее штука любопытная, с множеством возможностей не только по быстрому убитию всей системы, но и, например, для восстановления в случае какой-то катастрофической по последствиям поломки.

??нтересные посты с кратким описанием имеющихся команд консоли Maintenance Mode можно почитать в блоге A NetApp Technical Diary независимого блоггера Криса Кранца, этот же блог сейчас транслируется и в общую директорию блоггеров NetApp.