metaclass: (Default)
[personal profile] metaclass
А вот скажите, где бы почитать про первый сабж в совокупности со вторым?

А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).

Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.

Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решать жесточайшими пиздюлями персоналу выключающему компыорганизационными методами и покупкой надежного оборудования и софта. То бишь 1000 баксов на софт+10000 на сервер+100000 на оракл.

Date: 2010-09-04 04:39 am (UTC)
From: [identity profile] volger.livejournal.com
У гугля было исследования по винчестерам, из того, что они выяснили - оптимальная температура от 35 до 45 градусов, ниже или выше - хуже. А еще, что производители врут в 3 раза по-поводу вроде как раз MTBF. А также про влияния характеристик, сообщаемых S.M.A.R.T., что случаев, когда смарт молчал в трубочку и винт сдох - много, но вот если уж смарт что-то вякнул, то вероятность выхода винчестера резко повышается, причем для разных сообщений там приведено, где-то видел перевод данного руководства с информативными комментариями (примерно как УК с комментариями :-) ).
Еще как-то читал статью (чуть ли не в википедии про RAID), что raid5-raid6 по-производительности получается очень фиговый для СУБД (даже в случае аппаратного контроллера), там кажется было решение в виде raid 10.

Про отказоустойчивость и теорию вероятности в применении к кампутерной технике - это что-то такое в институте читали, убей не помню только название предмета, всякие там 0.9999*0.9999*0.995.

ЗЫ а если у заказчика какой-то особо красивый админ что-то там "выдернет" - это разве вам не пофиг? Или это такой заказчик, который примерно как свой директор, т.е. отдуваться придется не им, а вам?

Date: 2010-09-04 09:21 pm (UTC)
From: [identity profile] black-angel-by.livejournal.com
гм, Теория Вероятности и Мат Статистика ? ТВиМС :)
Я на ней такие хрени считал, как щас помню :)

Date: 2010-09-05 06:39 am (UTC)
From: [identity profile] metaclass.livejournal.com
Она родимая. Единственное но - я не помню, как ее применять к событиям типа "однократно наступающий пиздец" :)

Date: 2010-09-05 06:59 am (UTC)
From: [identity profile] w00dy.livejournal.com
событие оно не зависит от того пиздец это или нет. Вам же нужна зависимость вероятности от времени, вот её и расчитывайте.

Date: 2010-09-05 05:49 pm (UTC)
From: [identity profile] black-angel-by.livejournal.com
это мат. статистика. Нормальне распределение, гаусовское и т д...

Profile

metaclass: (Default)
metaclass

April 2017

S M T W T F S
      1
2345678
9101112 131415
16171819202122
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 1st, 2025 03:28 am
Powered by Dreamwidth Studios