BigData - это когда вместо схемы мусор, а разработчики боятся джоинов?
http://habrahabr.ru/company/beeline/blog/218669/
В статье вроде все не сильно страшно, но вот вопрос - откуда такая боязнь join-ов?
Если там таблица c размерностями мизерного размера и помещается вместе с индексами в кэш, то join на нее достаточно дешевый, чтобы на него было пофиг совершенно, по сравнению с вычитыванием каких-нибудь сотен миллионов записей из таблицы фактов.
Впрочем, если в реляционную БД попытаться засунуть неструктурированные данные и попытаться их нормализовать, а еще не дай бог попытаться поверх этого сделать иммутабельность, то запросы действительно вырождаются в десятиэтажные джоины (и все равно я особой проблемы в этом не вижу).
В статье вроде все не сильно страшно, но вот вопрос - откуда такая боязнь join-ов?
Если там таблица c размерностями мизерного размера и помещается вместе с индексами в кэш, то join на нее достаточно дешевый, чтобы на него было пофиг совершенно, по сравнению с вычитыванием каких-нибудь сотен миллионов записей из таблицы фактов.
Впрочем, если в реляционную БД попытаться засунуть неструктурированные данные и попытаться их нормализовать, а еще не дай бог попытаться поверх этого сделать иммутабельность, то запросы действительно вырождаются в десятиэтажные джоины (и все равно я особой проблемы в этом не вижу).
no subject
О теме поста:
Мне предлагали работу Старшего Инженера в МТС. За 45 т.р.(~1500$), в декабре 2013 года. Мне кажется, для Старшего Инженера это маловато. Не сомневаюсь, что автор статьи, уважаемый билайновский программист, имеющий опыт работы в Голландии, Европе и на Луне имеет больше денег. Но он один - а данных много. Вот отсюда и возникает необходимость в БигДата.
Кстати, будь моя воля - я бы запретил оператору сотовой связи торговать аппаратурой связи.
no subject
no subject
no subject