EMC VNXe 3150 не стартира HUP

Имаме VNXe3150, който всъщност не иска да стартира. Поддръжката вече не е върху нея, нито е прекалено стоманена, но все пак би било добре да се спести.

Историята е кратка:
Преди няколко месеца беше изпразнена и консервирана, след което все още работеше безотказно. Взехме го преди няколко дни и искахме да го стартираме. Тогава единият контролер току-що стартира, а другият спира по време на зареждане (въз основа на светодиодите). Половин крак работи отлично, помислихме, че няма нищо лошо, нека погледнем в контролер. Вчера обаче не го достигнахме само в сервизен режим.
Опитахме се да рестартираме първо unisphere и след това цялата кутия, но оттук нататък изобщо не можахме да я достигнем.
Успях да извлека процеса на зареждане от него на конзола, но за съжаление за мен не е достатъчно да се определи дали е възстановим.
Някой виждал ли е това преди? Или има шанс да се оползотворят или да се поставят в опасни отпадъци?

Приветствам всякакви идеи/помощ.

Коментари

(thmir v | 08. 29. 2017, k - 18:53)

При нулиране опитайте да нулирате всички сменяеми компоненти, дискове, контролери и т.н. включете всичко обратно в първоначалното му положение, след което го включете.
Предупреждава за ssd на изхода на конзолата, но това не е непременно проблем. Не мисля, че има други недостатъци в него.
Инсталирах такъв и преди, но сега наистина не съм намерил док, в който напр. това би било повторно изображение. и определено можете да го преинсталирате, ако е било толкова разстроено.
Той все пак отговаря на Ping или вече не?

(пн | 29/08/2017, к - 20:43)

Благодаря, ще опитам утре.
За съжаление не пинг.:(

(moe | 31 август 2017 г., чет. 16:51)

За съжаление не помогна. Изходът на конзолата е непроменен.
Опитах се да търся в посока "reimage", но според всички описания трябва първо да стигна до него на unisphere или cli.

Може да има някои други съвети?

(thmir v | 31.08.2017, четвъртък - 22:09)

Добре, тогава ще ви дам още идеи:)

Проверете ги, ако някой от тях ви премести напред (между другото, тъй като имате само конзолна връзка, разделите CLI са подходящи).
Ако не можете да влезете, ще се опитам да започна на половин крак: само SPA трябва да бъде включен или ако светодиодът за предупреждение свети, SPB

Намерих запис за грешката на SSD, но това все още може да е проблем. Светодиодът за предупреждение на гърба на един от SP (на един от тях) светва?
https://community.emc.com/thread/201576?start=0&tstart=0

Може би ако успеете по някакъв начин да осъществите достъп до него, би си струвало да съберете данни за услугата за него, това ще разкрие повече от това:
https://emcservice.force.com/CustomersPartners/kA2j0000000QVcgCAG

Дори това ми напомни, не можете ли да изтриете конфигурацията и да стартирате хранилището, просто изчакайте конфигурационния файл?:
https://community.emc.com/thread/225221?start=0&tstart=0

(пн | 04/09/2017, ч - 22:03)

Засега изглежда като половин успех. След няколко повторни места и рестартиране, един от SP (spb) стартира и стигна до подкана за вход. svc_diag съобщи, че е в сервизен режим, докато връстникът (спа) е недостъпен.
svc_dc не беше успешен. Изглежда, че работи добре, но в крайна сметка премества файла и вече не мога да го намеря във файловата система. Все едно да не го преместите, а да го изтриете.

след svc_reimage spb стартира в нормален режим без IP. Дадох му IP (svc_network) и след това опитах отново svc_dc, но резултатът е подобен. В момента SP статус: spb-нормално; недостъпно за връстници.

Засега съм тук. Unisphere обаче все още не работи, на него е отворен само SSH портът, а другият sp не дава сигнал за живот за себе си.
На SPB индикаторът за състояние мига, което според HIG може да означава две неща:
1. Драйверът на операционната система е стартиран
2. Неизправност, възникна системна грешка, която причинява някои
ресурси за съхранение, за да станат недостъпни. SP
не работи и светодиодът за състояние мига
(виж бележката)

Състоянието на другия SP, от друга страна, е непроменено.

(thmir v | 09. 09. 2017, k - 00:01)

Е, това е напредък, имам сервизен код, за който намерих това (макар и без отговор, но може би):
https://community.emc.com/thread/217045?start=0&tstart=0
SSH във всеки SP и изпълнете следното: svc_cdca --list-cdca (избройте всички кеширани мръсни луни за текущ SP) svc_cdca --clear (изчистете всички кеш мръсни луни за текущ SP, подгответе всички системни луни за автоматично fsck.) И това трябва да свърши работа.

Изходът на svc_dc по принцип трябва да бъде тук:
/ EMC/backend/service/data_collection /

Може да опитате да го премахнете от сервизен режим:
https://community.emc.com/docs/DOC-40085
Тези команди трябва да се изпълняват на база SP.
За да въведете SP отново в нормален режим, изпълнете последователно следните команди:
услуга @ спа спа:

> svc_rescue_state -c
услуга @ спа спа:

Ако това не помогне, в предишните връзки имаше едно, което обяснява Ръчно инсталиране, или може да не сте го опитали, като подадете конфигурационния файл от USB стик?
https://community.emc.com/thread/225221?start=0&tstart=0

(пт | 05.09.2017, к - 15:52)

Отговорете thmir Na, това е напредък, имате съобщение

Нещото се развива. Една от страниците вече работи (spb). Отидете на ssh, unisphere, вижте дисковете.
Другата страна, от друга страна, не отива. Все още е в недостижимо състояние. Инструментите Unisphere и CLI не го виждат и не получавам подкана на конзола.
Междувременно при нас дойде контролерът, който определихме. Опитвам се да заместя некоректния в момента кандидат. Всяко описание казва, че също трябва да прехвърля SSD в новия SP. Тъй като обаче пише грешка, пропускам тази стъпка (описанието „замени SSD“ ми казва да го поставя в сервизен режим -> не знам). Мисля, че двете СП ще влязат в някакво противоречиво състояние. Мога ли да започна нещо в това състояние, което поставя и двата SP във фабрично състояние? Всъщност няма данни за него, така че може би това би било най-ясно.