Отказоустойчивость и теория вероятности
Sep. 3rd, 2010 06:36 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
А вот скажите, где бы почитать про первый сабж в совокупности со вторым?
А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).
Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.
Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решатьжесточайшими пиздюлями персоналу выключающему компыорганизационными методами и покупкой надежного оборудования и софта. То бишь 1000 баксов на софт+10000 на сервер+100000 на оракл.
А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).
Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.
Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решать
no subject
Date: 2010-09-03 06:55 pm (UTC)Для разработки и тестирования большинство продуктов оракла бесплатны.
no subject
Date: 2010-09-03 07:05 pm (UTC)no subject
Date: 2010-09-04 06:56 am (UTC)no subject
Date: 2010-09-04 03:58 pm (UTC)no subject
Date: 2010-09-03 07:10 pm (UTC)no subject
Date: 2010-09-03 07:17 pm (UTC)вашу мать.
Что у вас там за мега-задачи которые нельзя регулярным ночным бэкапом за несколько сотен баксов решить?
Вычислительный центр Беларусь банка? Белаз? Белкалий? Впрочем последние два на MSSQL на моей памяти.
У нас тут немелкие заводы случается на интербэйзах видеть - и ничего.
no subject
Date: 2010-09-03 07:27 pm (UTC)Если шо, оно сейчас так и работает - с регулярными бэкапами и тому подобным. За последние 12 лет финансовые данные ни разу не терялись, но вот ебля с восстановлением эмпирическими методами пару раз была.
А я хочу сделать, чтобы а) восстанавливалось само б) без вуду-знаний
no subject
Date: 2010-09-03 07:32 pm (UTC)Вы их не сразу комитите?
Херится база, которая реплицируется раз в час?
Херится веник?
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-03 07:40 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-06 05:12 am (UTC)2 metaclass - ребе, сейчас пороюсь в загашниках, была одна интересная статья именно о винтах и рейдах
no subject
Date: 2010-09-03 07:29 pm (UTC)no subject
Date: 2010-09-03 07:32 pm (UTC)no subject
Date: 2010-09-03 07:37 pm (UTC)no subject
Date: 2010-09-03 07:42 pm (UTC)no subject
Date: 2010-09-03 07:48 pm (UTC)no subject
Date: 2010-09-03 07:55 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2010-09-03 08:06 pm (UTC)http://www.google.com/search?as_q=data+loss+probability&hl=en&num=100&as_epq=&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images
no subject
Date: 2010-09-04 04:39 am (UTC)Еще как-то читал статью (чуть ли не в википедии про RAID), что raid5-raid6 по-производительности получается очень фиговый для СУБД (даже в случае аппаратного контроллера), там кажется было решение в виде raid 10.
Про отказоустойчивость и теорию вероятности в применении к кампутерной технике - это что-то такое в институте читали, убей не помню только название предмета, всякие там 0.9999*0.9999*0.995.
ЗЫ а если у заказчика какой-то особо красивый админ что-то там "выдернет" - это разве вам не пофиг? Или это такой заказчик, который примерно как свой директор, т.е. отдуваться придется не им, а вам?
no subject
Date: 2010-09-04 09:21 pm (UTC)Я на ней такие хрени считал, как щас помню :)
no subject
Date: 2010-09-05 06:39 am (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2010-09-04 07:43 am (UTC)Пример простоя предприятия:
1) Винт с ценной информацией сдохнет. сам. раз в три года обычно. 100000$ * 1/(3*365) = 100$
2) Сдохнет вся локальная сеть предприятия на один день. Раз в год обязательно бывает. 10000$ * 1/365 = 27$
Итого, видно, что бакап в данном случае - это первоочередной приоритет. Но может быть и наоборот.
no subject
Date: 2010-09-04 12:39 pm (UTC)Ведь 1/(3*365) имеет размерность день^-1 т.е. 100 - это в не в баксах, а в баксах на день.
no subject
Date: 2010-09-04 01:05 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2010-09-05 08:29 am (UTC)no subject
Date: 2010-09-06 05:37 am (UTC)