Полезни космически проблеми и решения

Системите за съхранение като предмет на разговор

Използвани космически проблеми и решения. Част 3.

И така, в предишните две публикации на тази тема (част 1, част 2) се опитах да покажа какво полезно пространство се сравнява със суровото пространство, защо първото винаги е по-малко от второто и защо ние, като сме платили за цели терабайта, уж не получаваме изобщо терабайта, за които сме платили.

Процесът на преминаване от суров към използваем е процес на получаване на някаква функционалност от тъпи байтове, „обмен на байтове за допълнителни функции и защита на данните“. Обикновено, колкото повече губим в байтове, толкова повече получаваме функционалност (разбира се, ако това е правилната система за съхранение;)

Един от блогърите на NetApp, когото чета постоянно, Костадис Русос, използва термините „Real Fiber Channel“ (който нашите скъпи конкуренти толкова много обичат) и „Better Than Real FiberChannel“ в публикациите си, особено в споровете си с EMC:)

Нека видим къде NetApp е „По-добър от истинския FiberChannel“.

Постът е планиран да бъде дълъг, разбих го на няколко части, които ще преминат на няколко етапа, така че направете кафе;)

? Начинът, по който пространството намалява по пътя от „необработени данни“ до „използваеми данни + функционалност“?

Първият аспект по-скоро не е свързан с нашия случай, но ние също ще го изброим. Това са така наречените „маркетингови байтове”. Повечето читатели знаят, че преди сто години е имало проблем с преобразуването от „двоични“ в „десетични“ байтове. Тоест „килобайт“ не е 1000 байта, а 1024 байта.

Шега с брада: „Шофьорът смята, че има 1000 байта в килобайт, а програмистът смята, че има 1024 метра в килобайт“

И така, капацитетът в „двоични байтове“ се оказва по-голям, което е много популярно сред търговците на компании за твърди дискове: „А при папагалите съм много по-дълъг!“ (в) Боа констриктор

Строго погледнато, вече по обяд, преди сто години, беше взето решение ISO (Международната организация по стандартизация) да се използват специални представки за „двоични байтове“, за да се разграничат двоичните и десетичните фактори, те звучат необичайно и малко смешно: не килограми, но kibi (би - двоични ", двоични единици)," mega "-" mebi "и т.н.
Но засега има нещо и от диск от един „терабайт“ (както го нарича производителят), който всъщност е „тебибайт“, „изчезва“ поради това почти сто мегабайта.

Аспект номер две - секторът 520 байта е с 8 байта по-голям от често използвания. Защо се прави по този начин, писах тук и тук. Това намалява дисковия капацитет с около 1/64, подобрявайки надеждността на съхранението и позволявайки дедупликация.