Posts tagged ‘support’

Как получать поддержку: Часть 2

Теперь, поговорив в прошлых постах об общих вопросах поддержки, и о конкретной процедуре открытия кейса, рассмотрим полезные для нашей деятельности ссылки и “чеклист” наших действий по “поиску правды”..

Что вы, как пользователь системы, должны знать, уметь и сделать, чтобы поддержка не огорчала.

Начнем с основ.

1. Надеюсь, вы уже скачали и прочли NetApp Support Owner’s Guide. Для него есть русский перевод, правда не самой последней версии этого документа, но если у вас сложности с английским – читайте русский перевод, он вполне годится.

2. У вас включен и настроен NetApp Autosupport – служба, которая доставляет в поддержку NetApp логи системы и уведомления о том, что на ней происходит штатного и нештатного. Наличие таких данных, в том числе не только “моментальных”, а, в том числе, на протяжении периода времени до момента отказа, очень важное подспорье в анализе причин проблем, не недооценивайте его. С данными автосаппорта поддержка не только видит, что “все сломалось”, но также может посмотреть “когда сломалось”, “что делалось прямо перед этим”, “как работало, когда было еще не сломано”, и так далее.

3. Возможно вы установили и используете NetApp’s Remote Support Diagnostics Tool – компонет для RLM/SP, позволяющий поддержке удаленно коннектиться через него непосредственно в вашу систему хранения.

Что вам стоит сделать (проверить, если вы это делали раньше, и сделать, если еще не сделали)

1. Проверьте полноту и правильность информации, которую вы завели по своей системе и аккаунту в целом в support.netapp.com. Проверьте актуальность адреса (компании и, отдельно, доставки запчастей, если они отличаются), телефонных номеров, контактных данных (телефон, адреса email) ответственных за контакты с поддержкой.

Что делать, если необходимо обратиться в поддержку:

1. DON’T PANIC! :) Начните с того, что постарайтесь четко и однозначно сформулировать проблемную ситуацию. Поддержка оказывается на английском языке, но все мы понимаем, что иногда и на русском-то бывает сложно сформулировать и объяснить проблему. Начните с того, что опишите и запишите проблему на русском (на родном для вас языке), но обязательно запишите, оформите это как связный текст. Затем пройдите несколько раз, сокращая текст и уточняя, устраняя возможные неясности, неточноти и “мутные” места описания. Постарайтесь сократить его до минимально необходимого размера. Запишите максимально короткими и ясными предложениями.
Подумайте, какие дополнительные данные могут понадобиться в саппорте (логи, за какой период, данные perfstat, stats, что-то еще). Далее либо найдите того, кто вам поможет перевести данный текст на английский (не пользуйтесь автоматическими переводчиками!), либо, если это невозможно, тогда посылайте текст на русском, сделав в начале кейса приписку, что “case description language below is russian, please route it to appropriate person”. Да, это возможно. Разбор вашего текста и нахождение понимающего по-русски может занять какое-то время, но NetApp большая компания, в ней много народу работает, из очень разных стран, есть и русские, есть и разные восточноевропейцы, понимающие русский, так что практика показывает, что если вы совсем никак не можете по-английски, то это не является барьером для получения поддержки, на самом деле.

2. Подготовьте необходимые данные для идентификации вашей системы, такие как ее серийный номер (Serial ID), System ID, Purchase Order Number (это все можно найти, например, на странице вашей системы в http://mysupport.netapp.com/eservice/SupportHome.jsp. Таким вещам полезно всегда быть под руками и не только для NetApp. В моей практике я специально собрал все такие данные на все оборудование, потратив неделю времени, на отдельную страничку внутреннего портала, потратил неделю, зато теперь все под руками в самом экстренном случае.

3. Соберите и держите под руками необходимые данные о работе системы, такие как логи /etc/messages и syslog, актуальные результаты perfstat, сделанные во время набюдаемой проблемы. ??спользуемые версии, от версий Data ONTAP, до версий прошивок дисков, полок, и так далее. Если вы заводите кейс с высоким приоритетом (выше 3), подготовьтесь к тому, что позвонить с уточнениями могут в любое, в том числе нерабочее для вас время. Высокие приоритеты начинают колбасить всю группу поддержки и вовлекают в процесс много руководства. С одной стороны не стоит злоупотреблять, с другой - повышение приоритета, по моему опыту, хорошо гальванизирует саппорт, если ваша заявка зависла в Unassigned (Бывает, чо уж скрывать. У всех бывает). Помните, однако, также про разницу во временных поясах.

4. Заведите кейс (case) на странице службы поддержки в вашем аккаунте на http://mysupport.netapp.com/eservice/SupportHome.jsp
Снова: если есть проблема с английским, то не пользуйтесь автопереводчиком (а то он вам напереводит - не разгребете потом), либо найдите человека, который напишет вам перевод вашего текста, написанного на русском, либо посылайте на русском с припиской, которая поможет идентифицировать текст как русский и отправить его к понимающему этот язык. Напомню, официально поддержка на русском не оказывается, но неофициально компания часто идет навстречу.

TIPS: Если вы можете худо-бедно писать по-английски, но, например как я, часто “плаваете” в грамматической правильности выражений и сомневаетесь в ясности и понятности того, что вы пишете в ходе переписки с англоязычной поддержкой, могу порекомендовать вам полезный способ использования автопереводчика, например http://translate.google.com или http://www.bing.com/translator/ (не недооценивайте последний, MS проделала за несколько лет довольно серьезную работу) для проверки вашего текста “обратным переводом”.

Обычно я пишу на английском, а потом, чтобы убедиться, что получившееся разбирается в понятный текст и я не путаю никакие слова, я копирую предложение или его фрагмент в автопереводчик “английский -> русский”, и смотрю, получается ли хотя бы примерно то, что я хотел сказать? То есть я не использую переводчик как в чистом виде переводчик, к сожалению автоперевод все еще, для такого грамматически непростого языка, как русский, создает неприемлемого качества вывод, тем более для такого критичного содержимого, как переписка с поддержкой. Но в этом случае вы используете автопереводчик как своеобразный “валидатор”, парсер. Если то, что вы насочиняли, “распарсилось” в хотя бы приемлемый и понятный вам текст с англйийского на русский, то скорее всего его разберет и человек. Если нет – меняйте, подбирайте слова, упрощайте фразу до тех пор, пока даже тупой автопереводчин не начнет понимать то, что вы пишете. Это даст гарантию, что вас и ваш английский разберет и нормальный человек. Не стоит стесняться выражений типа Данила, ай нид хелп. Ваша задача быть абсолютно ясным, а не развлекать индийцев литературным английским.

Методы “самопомощи” (можно использовать как до обращения в поддержку, так и во время ожидания).

1. Поищите ответы по ключевым словам вашей ситуации на:

а. NetApp KnowledgeBase: https://kb.netapp.com/support/index?page=home&access=s

b. Пользовательском коммьюнити https://communities.netapp.com/welcome, а также в русскоязычной группе https://communities.netapp.com/groups/netapp-ru

c. Поищите зацепки в списке известных багов: http://mysupport.netapp.com/NOW/cgi-bin/bol/

d. Понятнее сообщения EMS (Enterprise Messaging System) в логах NetApp станут, если вы введете их в Syslog Translator: http://mysupport.netapp.com/eservice/ems. Если вы столкнулись с kernel panic в системе, то помочь разобраться в причинах может помочь Data ONTAP Panic Message Analyzer: http://mysupport.netapp.com/NOW/cgi-bin/pmsg/

d. Наконец, Google. Как ни банально бы прозвучал такой совет. В интернете есть несколько англоязычных форумов, где можно найти встретившихся со сходной с вашей проблемой, и Гугл довольно неплохо находит соответствующий тред по ключевым словам. Попробуйте вычленить для поиска в Google более-менее уникальную группу ключемых слов, например номера и коды ошибок в выводе, фрагменты сообщения об ошибке, взятые в кавычки в качестве строки поиска (точное соответствие), и так далее.

2. Проверьте вопросы совместимости с помощью NetApp Interoperability Matrix Tool: http://mysupport.netapp.com/NOW/products/interoperability/
Помните, “работает” не равно “поддерживается” или “будет работать всегда с любым релизом DOT”.

3. Вся информация по конфигурации и допустимым лимитам “железа” стораджей NetApp собирается на Hardware Universe: http://hwu.netapp.com/Home/Index

В следующем посте я “проинтервьюирую” сотрудника техподдержки в российском офисе NetApp. Он ответил на мои вопросы и порекомендовал ряд интересных “типсов” и “триксов”, которые можно использовать при обращении в поддержку.

Как получать поддержку. Часть 1

Продолжим наш разговор, про то, как правильно использовать вендорскую техподдержку.

Несколько недель назад на Хабре была забавная статья про то, как обращаются в поддержку представители разных стран. Автор работает в компании, клиенты которой есть по всему миру и сравнивает характер пользователей различных стран. Там он, правда, некритически, как мне кажется, относится к “русским”. Потому что у (условных) “русских” обращение в поддержку выглядит так:

Что-то работает не так. Пойти поискать в гугле и яндексе. Написать в форум ixbt или sysadmins.ru пост вида: “Ребята, у меня что-то не работает так, как должно. Как исправить?”. Подождать неделю. Через неделю обнаружить в треде 28 страниц флейма, кто более говно – HP или IBM (в итоге все стороны сходятся, что – Oracle), объяснений что у топикстартера кривые руки, и что под Линуксом все работает, и вообще, что автор – лох. Снова поискать в гугле. Написать пост в ЖЖ в ru_root. Почитать комменты. Попереводить найденное в гугле с помощью Google Translate. Ничего не найдя, спустя две недели, тяжело вздохнуть, и завести кейс. ?? получить через 40 минут в нем сообщение, что это была бага, поправленная пару недель назад, в патче таком-то, вот ссылка.

Не пренебрегайте вендорской поддержкой и не недооценивайте ее возможности. В конце концов, раз уж она у вас есть, вы заплатили за нее деньги, часто – большие деньги, то пользуйтесь ей. “На том конце” – люди, получающие зарплату из ваших денег, обычно подготовленные, владеющие материалом, умеющие “находить концы”, и по многу лет занимающиеся железками, которые вы сами, быть может, увидели впервые полгода назад.
Да, конечно, не все сотрудники саппорта “одинаково полезны”, тем не менее, это совсем не является поводом для того, чтобы не доверять и не пользоватьс их помощью. Тем более, что, часто, именно от нас, от кастомеров и нашей “подготовки”, в том числе правильного заведения кейса, зависит качество получаемой поддержки.
Но об этом мы подробнее поговорим в следующих постах серии.

Пока же, немного о том, что нам, как кастомерам, дано в качестве интерфейса взаимодействия с поддержкой.

Continue reading ‘Как получать поддержку. Часть 1’ »

Как получать поддержку: Часть 0

Одной из наиболее болезненных и чувствительных тем для любого пользователя энтерпрайзных систем, является вендорская поддержка. В этой и следующих публикациях в блоге я постараюсь раскрыть то, как получать поддержку вендора. Не секрет, что для наиболее эффективной поддержки, для скорейшего получения результата, приходится приложить усилия не только службе техподдержки, но и вам. Я постараюсь перечислить и описать все, что вам, с вашей стороны как клиента, нужно сделать, чтобы поддержка радовала, работала быстро, не “тупила”, и задачи решались максимально быстро.

Начнем с основ. С того, какая поддержка у NetApp есть, и как оно все работает.

Сперва разберемся, что есть Hardware Warranty, и что в нее входит,и что такое Software Subscription, и что входит в нее, и чем одно от другого отличается. Я заметил, что для некоторых моих читателей эти понятия не вполне ясны. ??так.

Continue reading ‘Как получать поддержку: Часть 0’ »

Работа саппорта NetApp: чему равен NBD

Я попросил одного пользователя NetApp, расположенного вне Москвы (с Москвой как раз все просто, и не слишком интересно  да?) поделиться информацией об оперативности работы службы сервиса NetApp. Как вы помните, стандартный сервисный уровень по доставке вышедших из строя запчастей у NetApp, это Next Business Day (NBD), что в условиях страны, растянутой на 9 часовых поясов и с отдаленными точками, куда “только вертолетом можно долететь”, представляет собой известный челлендж для любого сервиса.

Городок с населением 250 000 чел, 660 км Москвы, пользователь - крупное промпредприятие.

Вылетало за время эксплуатации системы три диска.

Далее выдержки из логов кейсовой системы NetApp по этому стораджу (форматирование потерялось, но не суть), я выделил даты событий, дата и время даны по калифорнийскому (PST) времени, в котором работает саппорт NetApp. Первая – регистрация события по отчету autosupport, второе – реакция человека в саппорте, командующего складу на отгрузку. Далее – когда запчасть доставлена на сайт фактически. Доставка производится со склада в Москве (и Петербурге).


1) Case #: 2xxxx Status:
Closed
Priority:
Occasional disruption or problem (P3)
Symptom:
DSKFLT:Disk /aggrsata/plex0/rg0/0a.19 Shelf 1 Bay 3 [NETAPP X269_SMOOS01TSSX NA01] S/N [9QJ7W7V4]
System Name: NETAPP2040-2 Bug #: Reference #:
Serial Number: 200000xxxxx Part Number: FAS2040-R5 System ID: 135xxxx OS Version: 8.0.1RC1 7-MODE AutoSupport: ON
Case text : Customer Input - 03/10/2012 12:52:00 PST
Visibility  : PUBLIC     Note :
I need help. My disk drive has failed. Help me. Send me new disk.
RMA  DSKFLT:Disk /aggrsata/plex0/rg0/0a.19 Sh - 03/10/2012 18:27:30 PST : WF_BATCH   Status: Delivered    Assigned To:  Ahamed Hussain
Update : ‘Return Order from PR ‘80009xxxx - 03/10/2012 22:15:59 PST : TPL_APL   Status: Closed    Assigned To:  Ahamed Hussain
1. We will ship one
SP-269A-R5
to replace the failed part. This part w ill be shipped to the following address and contact:

12 марта – диск у нас

2) Case #: 20027xxxx Status:
Closed
Priority:
Occasional disruption or problem (P3)
Symptom:
DSKFLT:Disk /aggrsas2/plex0/rg0/0d.01.10 Shelf 1 Bay 10 [NETAPP X410_S15K7288A15 NA00] S/N [3SJ0VS340000xxxxx]
System Name: NETAPP2040-2 Bug #: Reference #:
Serial Number: 200000xxxx Part Number: FAS2040-R5 System ID: 135xxx OS Version: 8.0.1RC1 7-MODE AutoSupport: ON
Update : Case text : Symptom - 12/24/2011 18:23:47 PST : ASUP_PP   Status: Assigned To:  RAI Ranjit Visibility  : PUBLIC     Note :
DSKFLT:Disk /aggrsas2/plex0/rg0/0d.01.10 Shelf 1 Bay 10 [NETAPP X410_S15K7288A15 NA00] S/N [3SJ0VS3400009034xxxx]
Update : ‘Return Order from PR ‘8000869583 - 12/26/2011 00:50:51 PST : TPL_APL   Status: Closed    Assigned To:  Kabra Mitesh Visibility  : PUBLIC

28 декабря – диск у нас.

3) Case #: 200275xxxx Status:
Closed
Priority:
Occasional disruption or problem (P3)
Symptom:
DSKFLT:File system Disk /aggrsata/plex0/rg0/0a.24 Shelf 1 Bay 8 [NETAPP X269_SMOOS01TSSX NA01] S/N [9QJ7WHD6] failed.
System Name: NETAPP2040-2 Bug #: Reference #:
Serial Number: 20000xxxx Part Number: FAS2040-R5 System ID: 13509xxxxOS Version: 8.0.1RC1 7-MODE AutoSupport: ON
Update : Case text : Symptom - 12/17/2011 14:33:21 PST : ASUP_PP   Status: Assigned To:  Dey Tanmoy Visibility  : PUBLIC     Note :
DSKFLT:File system Disk /aggrsata/plex0/rg0/0a.24 Shelf 1 Bay 8 [NETAPP X269_SMOOS01TSSX NA01xxx] S/N [9QJ7WHD6xxx] failed.
Update : ‘Return Order from PR ‘8000865813 - 12/19/2011 01:36:21 PST : TPL_APL   Status: Closed    Assigned To:  Rao Sandeep Visibility  : PUBLIC

21 декабря – диск у нас.

Отмечу –что все три диска вылетали на выходных, а NBD начинался в понедельник.

С батарейкой (питание для NVMEM, другой кейс. прим. romx) все печальнее – пришлось 2 дня сильно пинать саппорт (пороли чушь) через русский netapp, огромное спасибо Роману Ройфману и Денису Атаманенко за оперативную помощь и участие - короче, супер саппорт!


Вот такие результаты, по моему вполне неплохие, и приятный отзыв.

Отдельно хочу объяснить лишний раз то, как исчисляется в сервисе Next Business Day.

Во-первых, как я уже сказал выше, в стране российских размеров любая ограниченная временем доставка вынуждена учитывать самолетные расписания. Поэтому Next Business Day трактуется как Best Available Flight (ближайший самолет), это нормально, у UPS нет штата гарипоттеров на метлах, они вынуждены работать с рейсами гражданской авиации. Если на Краснодар есть 10 рейсов в день, а на, допустим, Салехард, только один рейс “Когалымавиа” в два дня, то это также накладывает свои возможности на сроки доставки, ничего тут не поделать. Смотрим реалистично на окружающий мир, да?

Во-вторых о том, когда начинается и когда заканчивается Business Day. Бизнес день начинается утром, в 8 утра, и заканчивается в 5 вечера. Если гарантийный эвент происходит после окончания рабочего дня (или не успевает  попасть в отгрузку в российский UPS до конца этого рабочего дня) , то он обрабатываетя, как произошедший в рабочее время следующего рабочего дня. Если поломка происходит в выходные, или, допустим, в 8 вечера в пятницу, то бизнес-день, которым будет начата реакция на данное событие, будет понедельник. Что, собственно, вытекает из названия Business Day. Соответственно Next Business Day для события, случившегося вечером в пятницу, будет вторник.

Также следует учитывать разницу в часовых поясах, время в кейсах саппорта NetApp дается по Стандартному Тихоокеанскому американскому времени (PST, GMT-8:00), так как головной офис расположен в Калифорнии. Однако поддержка для EMEA это Бангалор, ??ндия (GMT+5:30). Это смещение таже следует учитывать при исчислении Business Day, потому что если у нас рабочий день еще в разгаре, в Калифорнии (или ??ндии) он мог еще не начаться или уже закончиться, и они прочитают ваш кейс (и отдадут команду на отгрузку со склада) только когда наступит  рабочий день. Может повезти, но общее правило таково.

Если такой режим не устраивает – есть круглосуточный вариант (SupportEdge Standard и Premium, за деньги), но при этом помните, что и вы, в свою очередь, должны иметь круглосуточную службу, например, если запчасть приезжает в 4 утра в субботу, курьера надо встретить и запчасть у него принять, что логично, то есть 24х7 сервис требует такого же участия и вас. Оно логично, как мне кажется. Просто это надо хорошо осознавать заказывая такой уровень поддержки. ??ли же каждый раз договариваться с курьером службы доставки о переносе сроков. ?? нельзя, если у вас по кейсу выставлен priority – high, и индусы работники техподдержки сели решать вашу проблему, сказать им вечером пятницы, “чуваки, давайте, пока, у меня, там пиво, девки, рокенрол сегодня, давайте там, до встречи в понедельник”. В этом случае ваш кейс просто бросят, и вы будете его всю следующую неделю поднимать и требовать к себе внимания. Круглосуточная поддержка она с обеих сторон круглосуточная.

В общем, вот такие вот “вести с мест”. Спасибо пользователю за предоставленные материалы и возможность написать этот пост.

Ранее я уже интересовался темой, и писал аналгичный пост в 2010 году, с другими похожими примерами, и сходными результатами.

Обновление NetApp Support Site (ex-NOW)

А тем временем, в выходные, выкатилась, наконец, Phase 2 обновления самого важного для пользователя сайта NetApp – NetApp Support Site (http://support.netapp.com/), бывшего “NetApp on Web”, NOW (http://now.netapp.com/).

Для владельцев и пользователей систем хранения NetApp это самый важный и самый используемый веб-ресурс компании. К сожалению, многие годы он был довольно отсталым, неудобным, а найти что-либо на нем часто представляло собой серьезную проблему.

Скоро сказка сказывается, да нескоро дело делается. Весь прошлый год в NetApp работали над обновлением этого “портала поддержки пользователей”, и вот, наконец, в начале марта, все новые возможности были выпущены “в продакшн”.

По работе с новым порталом выпущен специальный 111-страничнй документ, в котором многое расписано подробно и детально. Но начать использовать его можно и “методом тыка”. Попробуйте, нам теперь с этим жить.

Syslog Translator

Несмотря на то, что в целом ONTAP стремится быть понятной и “самоописательной”, как в своих командах, так и в сообщениях в логах, в них нередко встречаются сообщения довольно “загадочные”.

Для того, чтобы лучше разобраться в сообщениях syslog, на сайте NOW (NetApp on Web) есть полезная служба: System Log Translator
ниже – скриншот:

image

Например, мы видим в логе сообщение:

[scsitarget.partnerPath.misconfigured:error]: FCP Partner Path Misconfigured - Host I/O access through a non-primary and non-optimal path was detected.

Введенное в Syslog Translator оно покажет следующее:

image

Уже гораздо понятнее что делать и куда бечь.

Утилита сбора диагностических данных nSANity

Любопытую утилитку предлагает NetApp, на сайте NOW, в разделе инструментов (нужен логин в NOW!).

nSANity Diagnostic and Configuration Data Collector 1.1.14

Это сборщик диагностической и конфигурационной информации. Причем не только для NetApp.

# Data ONTAP Storage Controllers
# Windows 2003 and 2008 hosts
# VMware ESX hosts (excluding i variants)
# Linux hosts with kernel 2.6
# Solaris hosts
# AIX hosts
# HP-UX 11i hosts
# Brocade switches
# McData switches (EOS, EOSn)
# Cisco switches (IOS, NXOS and SANOS)
# QLogic switches

Работает по следующим протоколам:

# HTTP/HTTPS is used for communicating with Data ONTAP
# SSH is used for communicating with Cisco, Brocade, VMware ESX, Linux, Solaris, AIX and HP-UX.
# WMI is used for communicating with Windows hosts
# A telnet fallback is available for McData switches when SSH is not enabled

Запускается так:

c:\> nsanity ontap://root:*@storage1

при этом спросит пароль рута (звездочку можно заменить на собственно пароль, что, понятно, не рекомендуется)

Собранный пак инфы в gzip можно развалить на отдельные файлы так:

c:\> nsanity –x zipfilename.gz

Есть версия под Linux и Windows.

Руководство владельца

В техбиблиотеку Netwell выложен очень полезный, переведенный на русский документ: “Руководство владельца системы хранения”. Это подготовленный сервисным отделом NetApp документ, в котором подробно рассматриваются вопросы того, как работает техподдержка на установленную у пользователя систему хранения NetApp.
Рассмотрено множество полезных практических вопросов:

  • Что входит в поддержку для разных ее уровней
  • Как настроить службу Autosupport
  • Как открыть кейс в NOW (NetApp on Web)
  • Что такое “уровень кейса”, как его поднять в случае необходимости
  • При каки случаях какие действия следует предпринимать для наилучшей скорости реакции
  • Полезные ссылки на файлы и документы на сайте NOW
  • Наилучшие методы решения той или иной задачи
  • …многое другое

Не забывайте, что каждая проданная система обеспечивается вендорской поддержкой, в сервисе работают опытные и компетентные специалисты, ежедневно решающие множество проблем, поэтому, прежде чем создать на каком-нибудь русскоязычном форуме тему “Купили тут нетапп тока он чото не работает как надо, подскажите куда рыть-то?” обратитесь с этим в его родной саппорт. Вероятность получения действенного и компетентного совета там будет выше в разы.