Отказоустойчивость и теория вероятности
Sep. 3rd, 2010 06:36 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
А вот скажите, где бы почитать про первый сабж в совокупности со вторым?
А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).
Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.
Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решатьжесточайшими пиздюлями персоналу выключающему компыорганизационными методами и покупкой надежного оборудования и софта. То бишь 1000 баксов на софт+10000 на сервер+100000 на оракл.
А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).
Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.
Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решать
no subject
Date: 2010-09-03 06:55 pm (UTC)Для разработки и тестирования большинство продуктов оракла бесплатны.
no subject
Date: 2010-09-03 07:05 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2010-09-03 07:10 pm (UTC)no subject
Date: 2010-09-03 07:17 pm (UTC)вашу мать.
Что у вас там за мега-задачи которые нельзя регулярным ночным бэкапом за несколько сотен баксов решить?
Вычислительный центр Беларусь банка? Белаз? Белкалий? Впрочем последние два на MSSQL на моей памяти.
У нас тут немелкие заводы случается на интербэйзах видеть - и ничего.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-03 07:29 pm (UTC)(no subject)
From:no subject
Date: 2010-09-03 07:37 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-03 08:06 pm (UTC)http://www.google.com/search?as_q=data+loss+probability&hl=en&num=100&as_epq=&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images
no subject
Date: 2010-09-04 04:39 am (UTC)Еще как-то читал статью (чуть ли не в википедии про RAID), что raid5-raid6 по-производительности получается очень фиговый для СУБД (даже в случае аппаратного контроллера), там кажется было решение в виде raid 10.
Про отказоустойчивость и теорию вероятности в применении к кампутерной технике - это что-то такое в институте читали, убей не помню только название предмета, всякие там 0.9999*0.9999*0.995.
ЗЫ а если у заказчика какой-то особо красивый админ что-то там "выдернет" - это разве вам не пофиг? Или это такой заказчик, который примерно как свой директор, т.е. отдуваться придется не им, а вам?
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-04 07:43 am (UTC)Пример простоя предприятия:
1) Винт с ценной информацией сдохнет. сам. раз в три года обычно. 100000$ * 1/(3*365) = 100$
2) Сдохнет вся локальная сеть предприятия на один день. Раз в год обязательно бывает. 10000$ * 1/365 = 27$
Итого, видно, что бакап в данном случае - это первоочередной приоритет. Но может быть и наоборот.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-05 08:29 am (UTC)no subject
Date: 2010-09-06 05:37 am (UTC)