BigData - это когда вместо схемы мусор, а разработчики боятся джоинов?
http://habrahabr.ru/company/beeline/blog/218669/
В статье вроде все не сильно страшно, но вот вопрос - откуда такая боязнь join-ов?
Если там таблица c размерностями мизерного размера и помещается вместе с индексами в кэш, то join на нее достаточно дешевый, чтобы на него было пофиг совершенно, по сравнению с вычитыванием каких-нибудь сотен миллионов записей из таблицы фактов.
Впрочем, если в реляционную БД попытаться засунуть неструктурированные данные и попытаться их нормализовать, а еще не дай бог попытаться поверх этого сделать иммутабельность, то запросы действительно вырождаются в десятиэтажные джоины (и все равно я особой проблемы в этом не вижу).
В статье вроде все не сильно страшно, но вот вопрос - откуда такая боязнь join-ов?
Если там таблица c размерностями мизерного размера и помещается вместе с индексами в кэш, то join на нее достаточно дешевый, чтобы на него было пофиг совершенно, по сравнению с вычитыванием каких-нибудь сотен миллионов записей из таблицы фактов.
Впрочем, если в реляционную БД попытаться засунуть неструктурированные данные и попытаться их нормализовать, а еще не дай бог попытаться поверх этого сделать иммутабельность, то запросы действительно вырождаются в десятиэтажные джоины (и все равно я особой проблемы в этом не вижу).
no subject
Потом пришел инспектор к владельцу магазина, разбил ему лицо, и посоветовал чуть сэкономить на кабаках, зато нанять еще двух кассирш. Пообещав, что в случае неисполнения в течении двух недель - ноги сломает.
Кассирш наняли, уменьшилась нагрузка на персонал, уменьшилась длина очереди на кассе, а ширина хари у владельца магазина тоже слегка уменьшилась.
Без подобного подхода, любая оптимизация - это "вы будете работать больше за те же деньги, а прибыль от этого пойдет на прокорм дяди".
no subject
В действительности дурная кассирша может создать проблемы с фискальными органами.