metaclass | Если не RDBMS, то что?

Entry tags:

Если не RDBMS, то что?

http://metaclass.livejournal.com/706440.html?thread=13096072#t13096072
Можно ли делать опердени не на RDBMS, не возвращаясь на уровень 70х годов, с иерархическими базами и прочими обработками на клиенте по курсорам?

Вариант "есть транзакции с ACID и есть оптимизированное по индексам выполнение filter/map/fold/reduce внутри базы" меня в принципе устроит. За исключением того, что SQL более лаконичен, вроде бы, если не делать внутри языка DSL аналогичный ему.

Например: select User_Name from Users where User_ID=?User_ID превращается во что-то вроде
let UserName UserID =
Users |> filter (fun u -> u.User_ID=UserID) |> map (fun u->u.User_Name) |> tryFirst

На LINQ же будет что-то вроде: from u in Users where u.User_ID=User_ID select u.User_Name

И все равно это же надо выполнять в СУБД, чтобы вся таблица не фетчилась на клиента или апп-сервер.

Threaded | Top-Level Comments Only

Вы бы лучше о совершенстве луноликого думали. Все бы было больше пользы.

Луноликий - это кто?

Мне видится так:
-если это мелкое прототипное говнишко без сложных запросов, то монга только в путь. Можно даже утешать себя, что она «будет скейлиться».
-если нужны сложные запросы и данных меньше десятков (может быть сотен, но тут уже нужно напрягаться) гигабайт, то RDBMS это прелестно. Серьёзно, какой смысл изобретать велосипед? SQL отличный язык, работает всё быстро, все грабли, которые можно было, уже давно пройдены (по крайней мере если это постгря/мс/оракл, а не какой-нибудь файрбёрд, да).
-если данных уже сильно больше (сотни гигабайт) и много записи (потому что все приличные RDBMS умеют делать кластер с одним записывающим и пачкой отвечающих на чтение), то только тогда стоит думать обо всяких хадупах сотоварищи, потому что запросы писать будет ощутимо сложнее и поддерживать всё это тоже.
Ну и есть две маргинальные технологии не для всех случаев, использующие eventual consistency:
-CouchDB. Вкратце: хранятся иерархические документы а-ля JSON; на все ноды можно писать, со всех нод можно читать; во всех запросах на модификацию должна присутствовать старая версия документа, по ней сервер делает дельту и прицепляет к ней время; каждая нода делает паблиш всех таких дельт на все остальные ноды, из-за этого, с одной стороны, сильно уменьшается промежуток, в который можно прочитать «старые данные», а с другой нагрузка на ноды растёт линейно с количеством нод, поэтому кластеризация служит только для повышения надёжности, а не для улучшения скорости. Поэтому это крутая штука, которая реально «магически» работает со случаями вроде «у нас инстанс кауча на телефоне полностью автономный, делаем любые вообще модификации, подключаемся к сети и всё автоматически консистентно сливается, все конфликты разруливаются по принципу "кто последний тот и прав"». Проблема только в том, что это всё не рассчитано на сотни гигабайт данных и большие нагрузки, а сложные запросы можно делать только мапредьюсом на JS, что не очень круто и не очень быстро.
-Riak. Eventual consistency в дистиллированной форме; по сути это просто движок для CRDT (Commutative Replicated Data Types — типы данных, которые всегда можно слить между собой, независимо от порядка модификации. Например, set без операции удаления или логи — сколько бы нод отдельно друг от друга не писало, всегда можно слить между собой). При этом из коробки балансировка нод, балансировка между консистентностью записи, консистентностью чтения и latency, механизм для автоматического нахождения конфликтов (vector clocks). Хорошо масштабируется в смысле увеличения производительности от количества нод (впрочем, с помощью механизма балансировки консистентности можно сделать аналог кауча с гарантированной консистентностью — например, можно сделать операцию чтения не завершающейся до тех пор, пока все ноды не получат свою копию данных). Не очень хорошо со сложными запросами (снова MapReduce на JS). Есть из коробки индексирование по произвольным полям, но работает не очень. Соль же в том, что если данные являются CRDT (key-value c last writer wins, кстати, является CRDT), то всё будет работать очень круто и магически.

Риак выглядит привлекательно.

Это обязаны знать все!

Так просветите же необразованную деревенщину, ребе!

Ребе, вы ж в курсе о IQueryable. Если ваш линк провайдер умный, то он построит запрос и выполнит его в базе.

Нашли, чему завидовать.

Видел я те запросы. Лучше бы их не было.

А что с ними не так? Для простых действий аля "сходить в базу выбрать что-то" вполне хватает.

Для простых случаев и SQL хватает с ADO.NET
Речь о сложных, с 15-этажными джоинами, подзапросами, CTE и группировкой по критерию, введенному юзером )

Некоторые даже этому завидуют: http://metaclass.livejournal.com/703593.html
Интересно, есть ли иностранцы, которые так прутся от Удвоенного?

ребе, вы вот тут чота рассуждаете, асид-хуясид. а между тем получили вендорлокин на файрбёрд - ВСЁ, все (фантомные) преимущества ушли сосать хуй.

не нужны 15этажные джоины. они говно.

АутистыЫЫЫ! (http://metaclass.livejournal.com/678493.html?thread=11757917&)

zodb же!
(serialized objects, btree, кровь, кишки, коровники прилагаются. Запросы на питоне)
Правда скейлится на кластер или rdbms backend'ом или за деньги.

Нэт, кауч развалится быстрее к хуям, ответственно заявляю. Riak - будет работаць и не жужжать.

Вот кстати да. Откуда вообще ноги у файрбёрда растут? из делфей?

ребе, эти 15 этажные запросы потом никто поддерживать не сможет, не говоря уже о том чтобы разобраться. Не, за много денег конечно разберутся, но проще будет выкинуть к хуям и переписать заново.

как вы красиво говорите

А что за наязчивое желание избавится от RDBMS, я никак не пойму? Кривыми ОРМ или как?

Сейчас модно посредством nosql :)

Народ осознал что ему в большинстве случаев нужен просто удобный storage с быстрыми простыми запросами и хорошей масштабируемостью. Реляционность это замечательно, но нафиг не нужна.

+1 кстати.
За то время, что нормализуется схема данных, можно уже забацать прототип без sql (да хоть на файлах) и пойти ~~рубиться в квейк~~показать целевой группе~~инвесторов~~ пользователей

PS Я несколько утрирую, но это так

А ведь если взять тот же мускуль и руками (в своем приложении) распределять данные по разным инстансам мускуля, забыв про джойны всякие, то оно и получится. То есть "просто удобный storage с быстрыми простыми запросами и хорошей масштабируемостью". Или я чего-то не понимаю?

Threaded | Top-Level Comments Only

Page 1 of 3

Если не RDBMS, то что?

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject