BigData - это когда вместо схемы мусор, а разработчики боятся джоинов?
http://habrahabr.ru/company/beeline/blog/218669/
В статье вроде все не сильно страшно, но вот вопрос - откуда такая боязнь join-ов?
Если там таблица c размерностями мизерного размера и помещается вместе с индексами в кэш, то join на нее достаточно дешевый, чтобы на него было пофиг совершенно, по сравнению с вычитыванием каких-нибудь сотен миллионов записей из таблицы фактов.
Впрочем, если в реляционную БД попытаться засунуть неструктурированные данные и попытаться их нормализовать, а еще не дай бог попытаться поверх этого сделать иммутабельность, то запросы действительно вырождаются в десятиэтажные джоины (и все равно я особой проблемы в этом не вижу).
В статье вроде все не сильно страшно, но вот вопрос - откуда такая боязнь join-ов?
Если там таблица c размерностями мизерного размера и помещается вместе с индексами в кэш, то join на нее достаточно дешевый, чтобы на него было пофиг совершенно, по сравнению с вычитыванием каких-нибудь сотен миллионов записей из таблицы фактов.
Впрочем, если в реляционную БД попытаться засунуть неструктурированные данные и попытаться их нормализовать, а еще не дай бог попытаться поверх этого сделать иммутабельность, то запросы действительно вырождаются в десятиэтажные джоины (и все равно я особой проблемы в этом не вижу).
no subject
no subject
no subject
no subject
при этом и размер данных все время растет и и количество запросов растет
миллиард записей это мало, представь себе базу по покупкам и транзакциям какого нибудь Wallmart, миллионы покупателей, миллиарды транзакций, вошло, ушло и тп
no subject
no subject
no subject
Мне отчего-то всегда казалось, что nosql нужен скорее для случаев, когда sql избыточен, ну там хуякхуяквпродакшен. Той же berkeleydb в обед сто лет и кого можно вот этим всем удивить, казалось бы.
no subject
IMHO до триллиона записей — это еще не биг, хотя, конечно, от данных зависит. ))
no subject
О теме поста:
Мне предлагали работу Старшего Инженера в МТС. За 45 т.р.(~1500$), в декабре 2013 года. Мне кажется, для Старшего Инженера это маловато. Не сомневаюсь, что автор статьи, уважаемый билайновский программист, имеющий опыт работы в Голландии, Европе и на Луне имеет больше денег. Но он один - а данных много. Вот отсюда и возникает необходимость в БигДата.
Кстати, будь моя воля - я бы запретил оператору сотовой связи торговать аппаратурой связи.
no subject
no subject
no subject