metaclass | База данных как API

Наткнулся на баг в Firebird: http://tracker.firebirdsql.org/browse/CORE-2848
В трекере написано, что исправлено (после перехода на 2.5.3 и backup/restore) но у меня продолжает появлятся, причем только в сложносочиненных условиях (нагруженные продакшены, с сотнями апдейтов в секунду и сотнями юзеров).

Сама по себе ошибка глобальных проблем не несет - у меня процессы умеют в самовосстановление после ошибок, но иногда то ли эта же ошибка, то ли что-то смежное в менеджере блокировок приводит к странному эффекту: один из процессов fb_inet_server.exe зависает, начиная бесконечно крутится, кушая CPU в цикле рекурсивных вызовов типа
"fb_inet_server!down_grade+0x62", в то время, как все остальные процессы ждут завершения этого, ничего не записывая и не читая. Если грохнуть кушающий процесс - все продолжает работать, накрывается только работа того коннекта, который обрабатывал зависший процесс.
Воспроизвести на столе пока не получается, если по хорошему, то надо бы дампы повисшего сервера, базы данных и блокировок спихнуть разработчикам на изучение.

Один из вариантов обойти ошибку (и заодно добавить новой полезной функциональности) на данный момент: сократить нагрузку на таблицу, на которой возникает проблема (в ней сотни раз в секунду выполняются update, и в это же время ее читают несколько десятков транзакций). Это можно сделать, если изменения таблицы в БД заменить на изменения на ее копии в памяти сервера приложений, в БД скидывать результат раз в 15-30 секунд (чтобы восстановить состояние сервиса при его рестарте).

Так вот, внезапно при такой переделке оказывается, что БД и конкретно эта таблица у нас играет роль API между десятком различных модулей, UI и разного рода сервисами.
Т.е. самый прямой вариант обмениваться данными между подсистемами, который работает всегда - это реляционная БД, с транзакциями, лаконичным SQL в качестве языка преобразования данных в нужный формат и заодно разного рода аудитом на триггерах, при необходимости.

А если я это перенесу в сервис приложений, то внезапно вместо 3 почти однообразных клиентских подключений к СУБД (дельфи-клиенты, .NET веб-сервис и clojure сервис-приложений), у меня появится необходимость взаимодействовать с сервером приложений через некий велосипедный протокол (скорее всего, что-нибудь на тему RESTful сервисов, они на CRUD хорошо укладываются). Или же придется во всю эту конструкцию еще и добавлять MQ сервис и тащить в продакшен или ActiveMQ (жаба в виде кложури уже есть) или RabbitMQ (тогда нашим инженерам придется осиливать эксплуатацию эрланговских приложений), потому что задача на очереди укладывается еще лучше чем на БД.

И поверх этого - разного рода костыли и велосипеды на предмет аудита, преобразований и расширения данных (вот например, чем заменить join на справочники, если у тебя вместо таблицы в БД - какая-то хреновина не пойми на каком языке, да еще не факт что подключенная к БД, а не получающая информацию из очередей).

Flat | Top-Level Comments Only

From:

justy-tylor.livejournal.com

Для этих задач применяются логические движки, с поддержкой forward chaining и backward chaining. Вот только они обычно недоразвитые (предназначены для мелкого подмножества задач, когда-то затребованного при их создании) и сильно муторны в интеграции. По сути, в SQL (или SPARQL) СУБД используются такие же недоразвитые движки, но процесс интеграции намного более привычен для широких народных масс.

Варианты:
1. Впихивать пока впихивается.
2. Искать движки, более подходящие под требуемое подмножество задач.
3. Писать ещё один, свой.

From:

Дмитрий Васильев (from livejournal.com)

Все правильно делаете.
Это можно сделать, если изменения таблицы в БД заменить на изменения на ее копии в памяти сервера приложений, в БД скидывать результат раз в 15-30 секунд (чтобы восстановить состояние сервиса при его рестарте).
Если в firebird действительно критические баги, то лучше уж на постгрес переехать.

From:

metaclass.livejournal.com

На данный момент времени обход багов или даже воспроизведение их в виде пригодном для починки разработчиками будет дешевле чем переезд.
А переезд пока осуществляется методом "новые проекты поддерживают разные СУБД" и медленной миграцией функционала из СУБД в сервера приложений. Вот описанное в посте - это одновременно обход бага, добавление новых юзеро-полезных фич и убирание части вендор-лока на определенную СУБД.

From:

Дмитрий Васильев (from livejournal.com)

А чем вендор-лок на постгрес хуже, чем вендор-лок на JVM или на clojure, на которой будет написан сервер приложений? Тем более что этот сервер приложений все равно будет какую-то СУБД использовать.

From:

ynot.livejournal.com

не очень понятно, "вы жалуетесь или хвастаетесь" - т.е. если вам все равно эту новую функциональность нужно/хочется добавлять, то тут уж конечно нужно делать "как надо" - а если вам можно просто быстро косяк побороть (и он где-то вроде бы не исключено, что про кривые блокировки), может быть, попробовать разгрузить эту самую табличку чисто архитектурными и датабейзными методами - вынести чтение "текущего состояния" куда-нибудь на отдельную табличку, посмотреть на подозрительно длинные или неявно стартующие транзакции, партицировать табличку, вручную там лочить все подряд "с запасом" - я не очень в курсе, чо firebird может предложить. Т.е. в пределах недели трудозатрат там должен быть маневр для применения "метода интеллектуального тыка" с ненулевой вероятностью положительного результата.

Edited Date: 2014-10-31 06:12 pm (UTC)

From:

zaharchenko

А не легчели в конечном счете будет сам баг пофиксить, а то чую костыли эти ваши ещё маленьку тележку багов наплодят

From:

metaclass.livejournal.com

Нет, починка бага это длительный дурдом с общением с разработчиками Firebird, ожиданием новой версии, итд.
Причем, судя по количеству аналогичных багов, формальные доказательства правильности с менеджером блокировок там вроде рядом не ходили.
Ну и есть идея таки вынести логику из БД, чтобы можно было разные СУБД использовать, поэтому рано или поздно что-нибудь подобное делать придется.

From:

permea-kra.livejournal.com

>чтобы можно было разные СУБД использовать,

Гм. А зачем?

From:

permea-kra.livejournal.com

>чтобы можно было разные СУБД использовать,

Гм. А зачем?

From:

metaclass.livejournal.com

А потому что использование особенностей конкретной СУБД, по ходу, приводит к разного рода дичи, как сейчас вот.

From:

permea-kra.livejournal.com

Скажем так, мне глубоко неочевидно, что дублирование функционала в аппсервере не приведет к еще бОльшему количеству глюков.

Кроме того, привязка к конкретной СУБД позволяет интересоваться только особенностями одной СУБД, а так придется изучать все, которые придут в голову клиентам.

Ну и напоследок, вынос функционала из СУБД приведет к необходимости 1) регулярно таскать данные туда-сюда 2) реализовывать кучу функционала по работе с большими данными ручками и 3) ручками заботиться о целостности данных

Поэтому если речь идет не о примитивных случаях, замах на кроссбазоданность вызывает у меня подозрения.

From:

metaclass.livejournal.com

1) как таскать данные в этой задаче я уже придумал - там достаточно просто сделать эффективное кэширование, которое сократит обмен данными между БД и аппсервером в стопицот раз.
2) функционал больших данных будет делать БД. С ним как раз проблем нет, проблемы с маленькой горячей табличкой.
3) целостность данных тоже будет делать БД, это все СУБД делают более-менее одинаково.

основная проблема - это то, что общение с БД из любых языков программирования - стандартная много раз решенная задача, а вот если БД заменить на аппсервер или там общаться через очереди, начинается всякая херня - в одном языке AMQP одной версии, в другом STOMP клиент собирается только по четным фазам луны, в третьем клиент недописан и нужно ручками отвечат на heartbeat запрос и прочее такое.

From:

berezovsky.livejournal.com

А если так.
Апдейт таблицы заменить на апдейт вьюшки.
Сделать триггер перед апдейтом, который выполняет роль шейпера - например, делает инсерт в другую таблицу.
Сервис по тихой грусти переебашивает вьюшку и апдейтит исходную табличку.

From:

metaclass.livejournal.com

А там как раз наоборот.
Делается инсерт в таблицу, на ней триггер. который обновляет вот эту горячую таблицу (первая таблица, условно говоря - события, вторая - состояние объектов-источников событий).

From:

dmitry shamov (from livejournal.com)

Я так развлекался в университете. Препод попросил написать "аську". Я взял сделал файлик аксесс. И там лог с транзакциями. Все апдейтят, клиенты по таймеру читают все что выше их транзакции. У препода волосы шевелились. Я говорю вопервых тут используется TCP-IP ибо сетевой диск как раз через сетку и расшарен и даже сокеты. Только я решил использовать уровень выше.

Flat | Top-Level Comments Only

Profile

metaclass

April 2017

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Nov. 24th, 2025 05:35 am

IT-redneck

База данных как API

База данных как API

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

April 2017

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags