metaclass | В порядке безумия

В порядке безумия

http://plumqqz.livejournal.com/364288.html
Я вот как-то не задумывался, что в приложениях, предназначенных для exUSSR базы данных с большим количеством текстовых полей в таблицах в win-1251 будут в два раза меньше чем в utf8.
Интересно, нельзя ли в базе сделать кастомную кодировку, аналогичную utf8, но чтобы в ней символы, цифры, русские и приравненные к ним буквы чтобы занимали 1 байт, а английские и прочие умляуты - 2 и прочее. Сразу бы вопрос размера базы снялся.

Flat | Top-Level Comments Only

Купите уже больше памяти/диска и не изобретайте костыли.

Да я тоже так думаю.
Но вот для баз в несколько терабайт размером и на хороших дисках, внезапно, экономия в два раза начинает иметь смысл. Плюс еще ускорение работы в два раза чисто за счет i/o.

Базы в пару терабайт зачастую партиционированы на куски по несколько десятков гиг, которые с легкостью влазят целиком в память

А что по сегодняшним меркам пара терабайт -- это объём? Это ж за разумные деньги делается. Хоть SAS на 15k, хоть SSD.

P.S. в моём тестовом стенде 1TiB RAM :-P

У меня как-то не складывается.
Вот собирался сделать себе сервак для виртуализации - памяти побольше, диски в рейде, материнка плата более-менее приличная - так в итоге получается, что он себя не окупит.
Т.е. пиковая его производительность мне нужна, когда я интенсивно делаю какую-нибудь трэшатину, но загрузить его в среднем хотя бы на 50% - я один лично не смогу, я столько работы не делаю, а больше некому. :)

А можно поинтересоваться, что в "несколько терабайтной" базе этой храниться будет? Фамилии/имена всех жителей России от начала времён и до конца жизни Вселенной?

А то вся флибуста - это такие-то жалкие 301 гигабайт со всеми толстыми и достоевскими. И всё равно не дотягивает.

Запись всех разговоров и мыслей жителей Минска и окрестностей за 21-25 века.

В трекер только что добавлен пункт "переговорить с куратором насчет утечки данных в Таиланде".

Там вроде все в архивах.

Да не будет там в два раза. Служебной информации тоже хватает. К тому же большие текстовые данные отлично жмутся как позаписьно так и постранично.

Flat | Top-Level Comments Only

В порядке безумия

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject