metaclass | Отказоустойчивость и теория вероятности

А вот скажите, где бы почитать про первый сабж в совокупности со вторым?

А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).

Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.

Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решать ~~жесточайшими пиздюлями персоналу выключающему компы~~организационными методами и покупкой надежного оборудования и софта. То бишь 1000 баксов на софт+10000 на сервер+100000 на оракл.

Flat | Top-Level Comments Only

From:

volger.livejournal.com

У гугля было исследования по винчестерам, из того, что они выяснили - оптимальная температура от 35 до 45 градусов, ниже или выше - хуже. А еще, что производители врут в 3 раза по-поводу вроде как раз MTBF. А также про влияния характеристик, сообщаемых S.M.A.R.T., что случаев, когда смарт молчал в трубочку и винт сдох - много, но вот если уж смарт что-то вякнул, то вероятность выхода винчестера резко повышается, причем для разных сообщений там приведено, где-то видел перевод данного руководства с информативными комментариями (примерно как УК с комментариями :-) ).
Еще как-то читал статью (чуть ли не в википедии про RAID), что raid5-raid6 по-производительности получается очень фиговый для СУБД (даже в случае аппаратного контроллера), там кажется было решение в виде raid 10.

Про отказоустойчивость и теорию вероятности в применении к кампутерной технике - это что-то такое в институте читали, убей не помню только название предмета, всякие там 0.9999*0.9999*0.995.

ЗЫ а если у заказчика какой-то особо красивый админ что-то там "выдернет" - это разве вам не пофиг? Или это такой заказчик, который примерно как свой директор, т.е. отдуваться придется не им, а вам?

black-angel-by.livejournal.com

гм, Теория Вероятности и Мат Статистика ? ТВиМС :)
Я на ней такие хрени считал, как щас помню :)

metaclass.livejournal.com

Она родимая. Единственное но - я не помню, как ее применять к событиям типа "однократно наступающий пиздец" :)

w00dy.livejournal.com

событие оно не зависит от того пиздец это или нет. Вам же нужна зависимость вероятности от времени, вот её и расчитывайте.

это мат. статистика. Нормальне распределение, гаусовское и т д...

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

IT-redneck

Отказоустойчивость и теория вероятности

Отказоустойчивость и теория вероятности

no subject

no subject

no subject

no subject

no subject

Profile

April 2017

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags