Отказоустойчивость и теория вероятности
А вот скажите, где бы почитать про первый сабж в совокупности со вторым?
А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).
Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.
Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решатьжесточайшими пиздюлями персоналу выключающему компыорганизационными методами и покупкой надежного оборудования и софта. То бишь 1000 баксов на софт+10000 на сервер+100000 на оракл.
А то я не совсем соображу, как работают с вероятностями событий типа "винт накрылся", если у нас есть только характеристики типа MTBF, а распределение вероятности сдохнуть в течение жизни винта я не знаю, причем не только количественно но и качественно (хотя и очевидно, что с временем эта вероятность нарастает, а MTBF это что-то вроде середины в оном распределении).
Хочу количественно сравнить разные варианты решения проблемы отказоустойчивости в случае "простой системы на 10-20 минут в день всем пофиг, но данные после физически выполненной операции терять неприемлемо, и желательно чтобы данные восстанавливались автоматически". Плюс еще иногда выполняемая автоматическая репликация этих данных на другой сервер, но канал связи с этим сервером есть не всегда, поэтому использовать его в качестве резервного нельзя, а репликация в случае умирания и восстановления одной из баз не должна нарушаться.
Что-то мне подсказывает, что я пытаюсь решать самодельными техническими средствами проблемы, которые нужно решать
no subject
(Anonymous) 2010-09-03 06:55 pm (UTC)(link)Для разработки и тестирования большинство продуктов оракла бесплатны.
no subject
no subject
no subject
no subject
no subject
вашу мать.
Что у вас там за мега-задачи которые нельзя регулярным ночным бэкапом за несколько сотен баксов решить?
Вычислительный центр Беларусь банка? Белаз? Белкалий? Впрочем последние два на MSSQL на моей памяти.
У нас тут немелкие заводы случается на интербэйзах видеть - и ничего.
no subject
Если шо, оно сейчас так и работает - с регулярными бэкапами и тому подобным. За последние 12 лет финансовые данные ни разу не терялись, но вот ебля с восстановлением эмпирическими методами пару раз была.
А я хочу сделать, чтобы а) восстанавливалось само б) без вуду-знаний
no subject
Вы их не сразу комитите?
Херится база, которая реплицируется раз в час?
Херится веник?
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
2 metaclass - ребе, сейчас пороюсь в загашниках, была одна интересная статья именно о винтах и рейдах
no subject
no subject
no subject
no subject
no subject
no subject
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
http://www.google.com/search?as_q=data+loss+probability&hl=en&num=100&as_epq=&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images
no subject
Еще как-то читал статью (чуть ли не в википедии про RAID), что raid5-raid6 по-производительности получается очень фиговый для СУБД (даже в случае аппаратного контроллера), там кажется было решение в виде raid 10.
Про отказоустойчивость и теорию вероятности в применении к кампутерной технике - это что-то такое в институте читали, убей не помню только название предмета, всякие там 0.9999*0.9999*0.995.
ЗЫ а если у заказчика какой-то особо красивый админ что-то там "выдернет" - это разве вам не пофиг? Или это такой заказчик, который примерно как свой директор, т.е. отдуваться придется не им, а вам?
no subject
Я на ней такие хрени считал, как щас помню :)
no subject
(no subject)
(no subject)
no subject
Пример простоя предприятия:
1) Винт с ценной информацией сдохнет. сам. раз в три года обычно. 100000$ * 1/(3*365) = 100$
2) Сдохнет вся локальная сеть предприятия на один день. Раз в год обязательно бывает. 10000$ * 1/365 = 27$
Итого, видно, что бакап в данном случае - это первоочередной приоритет. Но может быть и наоборот.
no subject
Ведь 1/(3*365) имеет размерность день^-1 т.е. 100 - это в не в баксах, а в баксах на день.
no subject
(no subject)
(no subject)
no subject
no subject