metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2010-09-03 06:36 pm

Отказоустойчивость и теория вероятности

А вот скажите, где бы почитать про первый сабж в совокупности со вторым?

А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).

Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.

Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решать жесточайшими пиздюлями персоналу выключающему компыорганизационными методами и покупкой надежного оборудования и софта. То бишь 1000 баксов на софт+10000 на сервер+100000 на оракл.

[identity profile] oldmann.livejournal.com 2010-09-03 08:30 pm (UTC)(link)
который положит хуй на NDA, и рискуя вылететь с работы и получить иск, сдаст тебе конфиденциальные данные чиста за попиздеть.

[identity profile] volger.livejournal.com 2010-09-04 04:39 am (UTC)(link)
У гугля было исследования по винчестерам, из того, что они выяснили - оптимальная температура от 35 до 45 градусов, ниже или выше - хуже. А еще, что производители врут в 3 раза по-поводу вроде как раз MTBF. А также про влияния характеристик, сообщаемых S.M.A.R.T., что случаев, когда смарт молчал в трубочку и винт сдох - много, но вот если уж смарт что-то вякнул, то вероятность выхода винчестера резко повышается, причем для разных сообщений там приведено, где-то видел перевод данного руководства с информативными комментариями (примерно как УК с комментариями :-) ).
Еще как-то читал статью (чуть ли не в википедии про RAID), что raid5-raid6 по-производительности получается очень фиговый для СУБД (даже в случае аппаратного контроллера), там кажется было решение в виде raid 10.

Про отказоустойчивость и теорию вероятности в применении к кампутерной технике - это что-то такое в институте читали, убей не помню только название предмета, всякие там 0.9999*0.9999*0.995.

ЗЫ а если у заказчика какой-то особо красивый админ что-то там "выдернет" - это разве вам не пофиг? Или это такой заказчик, который примерно как свой директор, т.е. отдуваться придется не им, а вам?

[identity profile] permea-kra.livejournal.com 2010-09-04 05:31 am (UTC)(link)
0. отключить reset/power buttom. поставить на автовключение.
1. Купить фулл-тавер, привинтить упс внутри.
2. Таки райд. Либо две базы.

[identity profile] fraks-nsk.livejournal.com 2010-09-04 06:55 am (UTC)(link)
>> УПС поможет, но только в том случае, если не вырвут провод прямо из упса.

Хм... такте ощущение что сервер стоит прям рядом с бухгалтером и УПСов там нет.

Первейшие организационные методы
- помещение серверной с максимально ограниченным доступом
- отдельный выделенный сервер стоящий в серверной
- УПС

Это первейшие минимальные орг. действия.
Любые другие без этих первых - бессмысленны.

[identity profile] metaclass.livejournal.com 2010-09-04 06:56 am (UTC)(link)
Это работает только для большого количества винтов - тогда их сдыхает примерно этому закону и подчиняется.

[identity profile] fraks-nsk.livejournal.com 2010-09-04 07:00 am (UTC)(link)
>> Ставить базу на другой комп - нельзя по условиям сертификации

А кто вам тогда разрешит менять железо и раскидывать данные по другим железкам?
Задача поставлена некорректно.

"Серверная" - это может быть отгороженный гипсокартоном угол, но обязательно с дверью пол замком.

[identity profile] metaclass.livejournal.com 2010-09-04 07:16 am (UTC)(link)
Невменяемые работники, запертые в жестяной коробке с кучей оборудования и опасным производством, им эта обстановка выламывает даже те остатки мозгов, которые у них были.

[identity profile] metaclass.livejournal.com 2010-09-04 07:31 am (UTC)(link)
1) Там нет серверной.
2) Система по условиям использования и сертификации стоит в одном единственном опечатанном компе, т.е. сервер ставить отдельный нельзя.

ну и прочая, и прочая. В общем, я ж пишу - адовы условия.

[identity profile] metaclass.livejournal.com 2010-09-04 07:32 am (UTC)(link)
Железо мы как раз имеем право менять, у нас на оное пайцза от надзорных органов имеется.

[identity profile] enternet.livejournal.com 2010-09-04 07:43 am (UTC)(link)
Работают не с абсолютными вероятностями, а с произведением вероятности на стоимость последствий.
Пример простоя предприятия:
1) Винт с ценной информацией сдохнет. сам. раз в три года обычно. 100000$ * 1/(3*365) = 100$
2) Сдохнет вся локальная сеть предприятия на один день. Раз в год обязательно бывает. 10000$ * 1/365 = 27$
Итого, видно, что бакап в данном случае - это первоочередной приоритет. Но может быть и наоборот.

[identity profile] fraks-nsk.livejournal.com 2010-09-04 08:35 am (UTC)(link)
Если есть физический доступ к компу и его нельзя никак ограничить - то все другие действия бессмысленны.

[identity profile] fraks-nsk.livejournal.com 2010-09-04 09:01 am (UTC)(link)
Измените условия сертификации.
Пусть будет не один комп а одна комната или один ящик. Закрытый и опломбированный.

[identity profile] norguhtar.livejournal.com 2010-09-04 12:33 pm (UTC)(link)
Эта проблема решается использованием NUT и преобразователями RS-232 -> Ethernet если надо события отлавливать далеко от UPS. Хотя использование преобразователя кажется вуду, но практика показала, что это универсальнее плат в UPS и что самое смешное стоит тех же денег.

[identity profile] metaclass.livejournal.com 2010-09-04 12:38 pm (UTC)(link)
nut не все упсы понимает. Я удолбся пытаться подключить к нему socomec sicon.

[identity profile] metaclass.livejournal.com 2010-09-04 12:39 pm (UTC)(link)
Слушай, а что тут с размерностями величин?
Ведь 1/(3*365) имеет размерность день^-1 т.е. 100 - это в не в баксах, а в баксах на день.

[identity profile] norguhtar.livejournal.com 2010-09-04 12:52 pm (UTC)(link)
Он большинство понимает. Мы покупаем только те что понимает :)

[identity profile] enternet.livejournal.com 2010-09-04 01:05 pm (UTC)(link)
1/(3*365) - это день/день, это я так вероятность наступления события обозначил - в один день из трёх лет он сдохнет )

[identity profile] metaclass.livejournal.com 2010-09-04 01:42 pm (UTC)(link)
А почему мы рассматриваем именно день? А не, например, "в один час из трех лет он сдохнет"?

[identity profile] enternet.livejournal.com 2010-09-04 02:01 pm (UTC)(link)
Да ради бога, можно хоть фемтосекунды. На общую оценку приоритетов это не влияет. Да, это очень грубая оценка. Но физически её смысл вполне понятен. Если ты возьмешь часы, то ты просто уточнишь ситуацию в 24 раза. А я вот оцениваю вероятность события как "сдохнет сегодня или нет". Вот и вся разница.

[identity profile] permea-kra.livejournal.com 2010-09-04 03:58 pm (UTC)(link)
Дык а в чем проблема? Он получается из предположения число распадов в единицу времени = константа * количество. Отсюда вероятность отвала в единицу времени для одного винта вполне считается.

[identity profile] black-angel-by.livejournal.com 2010-09-04 08:33 pm (UTC)(link)
ребе, для бекапов отлично подойдёт неттоп, засунутый ВНУТРЬ сервера. Если что - это устройство резервного копирования :)

[identity profile] black-angel-by.livejournal.com 2010-09-04 08:40 pm (UTC)(link)
не, я серьёзно. Можно найти тот, который удачно впишется в отсек 5"25.
А наезжать за по сути встроеный комп поидеи не должны, иначе народ с продвинутыми серверами (IPMI/iKVM) отгреб бы дополнительный гемморой за встроеный сервисный комп.

[identity profile] black-angel-by.livejournal.com 2010-09-04 09:19 pm (UTC)(link)
но остаются знакомые в гарантийных отделах фирм, торгующих компами ;) Они и словей таких (NDA) не слышали :)

[identity profile] black-angel-by.livejournal.com 2010-09-04 09:21 pm (UTC)(link)
гм, Теория Вероятности и Мат Статистика ? ТВиМС :)
Я на ней такие хрени считал, как щас помню :)

[identity profile] oldmann.livejournal.com 2010-09-04 09:23 pm (UTC)(link)
не репрезентативная выборка.

Page 2 of 3