metaclass: (Default)
[personal profile] metaclass
Исследовал случай повреждения БД firebird. Разгреб внутренние структуры, сравнил страницы данных от битой базы и хорошего бэкапа.
Поперек страницы битой базы - ряд байт 0xFF с шагом в 16 байт от 4 до 8 штук, прямо поперек страницы.
Шаг возникновения последовательностей - 512 байт, т.е. сектор диска.
Причем в эту страницу, насколько я понимаю, месяца три никто ничего не записывал (старые данные).

Хрен знает, что с этим делать, ничему верить нельзя.

Date: 2016-03-06 07:21 pm (UTC)
From: [identity profile] pascendi.livejournal.com
Как известно, люди делятся на две категории: те, кто регулярно делают бэкапы, и те, кто теперь уже точно будут регулярно делать бэкапы :-)

Жесткие диски, как и любые другие средства хранения данных, подвержены деградации.
(deleted comment)

Date: 2016-03-07 11:34 am (UTC)
From: [identity profile] pascendi.livejournal.com
У Вас никогда не сыпалась поверхность жесткого диска? Не выходил из строя встроенный контроллер?
Вы счастливый человек.
Что не избавляет от необходимости делать бэкапы, однако.

Date: 2016-03-07 11:40 am (UTC)
From: [identity profile] metaclass.livejournal.com
У этого персонажа посыпалась поверхность мозга, так что общаться с ним, в целом, бесполезно.

Date: 2016-03-08 05:25 pm (UTC)
From: [identity profile] anonim-legion.livejournal.com
И слава богу, что у него нет бэкапа.

Date: 2016-03-06 07:27 pm (UTC)
From: [personal profile] alll
А база на рейде жила или на одиночном диске?

Date: 2016-03-06 07:50 pm (UTC)
From: [identity profile] metaclass.livejournal.com
Одиночный.
Я теперь сижу с фейспалмом и пытаюсь вспомнить, почему я не выл и не орал, когда железо для этих рабочих мест планировалось.

Date: 2016-03-06 08:53 pm (UTC)
From: [personal profile] alll
Ну, зато теперь есть железный аргумент для будущих случаев планирования.

Date: 2016-03-06 09:12 pm (UTC)
From: [identity profile] kranov.livejournal.com
какой аргумент? он сейчас все починит, вот еслиб данные просрали и потом полгода заного набивать по бумажкам, тогда да.

Date: 2016-03-06 07:37 pm (UTC)
From: [identity profile] kranov.livejournal.com
firebird-у давно пора в каждый блок добавлять контрольную сумму и при чтении (и особенно при бекапе) проверять и грязно ругаться Data file corrupted Header block magic number is bad

Date: 2016-03-06 07:49 pm (UTC)
From: [identity profile] metaclass.livejournal.com
Да, потому что его регулярно используют в неадекватных условиях, типы бытового железа, хренового питания и прочего такого трэша.

Date: 2016-05-21 06:23 am (UTC)
From: [identity profile] e-c-r-d.livejournal.com
А не "бытовой" ли дериват файрбёрда во всяких бухгалтерски-пенсионных х.ёвинах пользуют? Вот и суют его по привычке куда не нать, КМК.
Принцип экономии мЫшления, чорт его дери

Date: 2016-05-21 06:47 am (UTC)
From: [identity profile] metaclass.livejournal.com
В смысле, "бытовой"? У FB вроде одна версия на всех.

"будем искатьŒ!"

Date: 2016-05-21 01:58 pm (UTC)
From: [identity profile] e-c-r-d.livejournal.com
йоооопссс. Весело, чо
Edited Date: 2016-05-21 01:59 pm (UTC)

Date: 2016-03-06 07:59 pm (UTC)
From: [identity profile] http://users.livejournal.com/_slw/
а как ты узнал что база битая?
а как ты получил актуальную копию?
а винт из этого говна ты выкручивал и к себе втыкал дабы самостоятельно прочитать?

Date: 2016-03-06 08:03 pm (UTC)
From: [identity profile] metaclass.livejournal.com
Битая база - из логов, копию из бэкапа, говно стоит у черта на рогах и сломанный кусок базы я тупо скопировал туда подключившись.

Date: 2016-03-06 08:14 pm (UTC)
From: [identity profile] http://users.livejournal.com/_slw/
ну т.е. вариант что битый контроллер/память ты не исключил, т.к. возможно сломанный кусок ты прочитал из кеша, а не с диска.

Date: 2016-03-06 08:24 pm (UTC)
From: [identity profile] metaclass.livejournal.com
Это возможно, да.

Date: 2016-03-07 02:42 am (UTC)
From: [identity profile] antisemit-ru.livejournal.com
1.Как можно любую базу размещать на одиночном диске?
2. Как можно обходиться без регулярных бэкапов, желательно, в разных местах? У системщика же всегда компов хватает...

Date: 2016-03-07 11:42 am (UTC)
From: [identity profile] metaclass.livejournal.com
Одиночный диск это какой-то запредельный идиотизм, да.
Бэкапы на разных местах есть есть, но в конечном итоге данные с последнего момента бэкапа или репликации все равно придется как-то восстанавливать.

Date: 2016-03-07 01:51 pm (UTC)
From: [identity profile] antisemit-ru.livejournal.com
Более того. Держать что-то на сервере, не обновляя раз в год его дисковую подсистему, как-то тоже неправославненько.

Date: 2016-03-07 05:19 pm (UTC)
From: [identity profile] berezovsky.livejournal.com
ты ненавидишь жидов?

Date: 2016-03-07 06:02 pm (UTC)
From: [identity profile] metaclass.livejournal.com
В советской белоруссии жыды ненавидят антисемитов :)

Date: 2016-03-08 01:52 am (UTC)
From: [identity profile] antisemit-ru.livejournal.com
Это вас волнует?

Date: 2016-03-07 02:21 pm (UTC)
From: [identity profile] ynot.livejournal.com
Не вижу тэга "пни упавшего" - сейчас вам пятьдесят человек расскажут, как хорошо делать бэкапы, использовать рэйд, купить облако, резервировать оборудование, пользоваться винчестерами проверенных марок, не забывать о стабильном электропитании, иметь специального отдельного инженера для работы с железом, купить наконец нормальную базу данных оракель или нормально пользоваться еще более нормальной бесплатной базой мусекель и т.п.

Date: 2016-03-07 02:37 pm (UTC)
From: [identity profile] metaclass.livejournal.com
Так я с большего уже все починил.
А вот что рейд надо использовать и продумать способ онлайн бэкапа куда-нибудь за пределы здания (в коем электропитание и помехи и оборудование стопицоткиловаттных мощностей) - это факт.

Date: 2016-03-10 02:14 am (UTC)
From: [identity profile] fraks-nsk.livejournal.com
Рейд без админа - деньги на ветер.
Был свидетелем когда на рейде поочередно сдохли все винты, рейд забил своими воплями все логи но логи естественно никто никогда не смотрел. Все логично пришло к тому что в рейде сдох последний винт и все встало. Результат - что с рейдом, что без.

Date: 2016-03-13 03:59 am (UTC)
ext_646638: (Default)
From: [identity profile] rdia.livejournal.com
В вашем примере очевидно всё продержалось значительно дольше, чем на одном винте. А вот если сделать систему авто включения в рейд новых жёстких дисков раз в 3 года, так вообще можно 30 лет не подходить!

Date: 2016-03-08 05:26 pm (UTC)
From: [identity profile] anonim-legion.livejournal.com
И покупать циску вместо dlink.

Date: 2016-03-08 05:59 pm (UTC)
From: [identity profile] berezovsky.livejournal.com
А штуки типа FF FF FF FF FF разве не отзеркалятся в рейде на второй веник?

Date: 2016-03-08 06:01 pm (UTC)
From: [identity profile] anonim-legion.livejournal.com
Если они пришли из битой памяти - отзеркалятся. А вот что будет делать raid 1, если он считает два одинаковых сектора с винтов, а они внезапно разные (и вообще, делает ли он такую сверку?) - мне неизвестно. По логике вещей, должна вылететь ошибка чтения.

Date: 2016-03-15 08:09 am (UTC)
From: [identity profile] cottidianus.livejournal.com
линуксовый md пометит диск с FF сектором Failed и засинкает в него секторы со второго диска

Profile

metaclass: (Default)
metaclass

April 2017

S M T W T F S
      1
2345678
9101112 131415
16171819202122
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 29th, 2025 05:56 pm
Powered by Dreamwidth Studios