metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2013-04-18 10:21 pm

В порядке безумия

http://plumqqz.livejournal.com/364288.html
Я вот как-то не задумывался, что в приложениях, предназначенных для exUSSR базы данных с большим количеством текстовых полей в таблицах в win-1251 будут в два раза меньше чем в utf8.
Интересно, нельзя ли в базе сделать кастомную кодировку, аналогичную utf8, но чтобы в ней символы, цифры, русские и приравненные к ним буквы чтобы занимали 1 байт, а английские и прочие умляуты - 2 и прочее. Сразу бы вопрос размера базы снялся.

[personal profile] alll 2013-04-18 07:53 pm (UTC)(link)
ребе, не останавливайтесь на полдороге - жмите уже текстовые поля потоковым компрессором
один чорт на перекодировку utf8r <-> utf8 процессор напрягать

[identity profile] berezovsky.livejournal.com 2013-04-18 07:55 pm (UTC)(link)
аппаратно зипировать

[identity profile] metaclass.livejournal.com 2013-04-18 07:55 pm (UTC)(link)
Вы тащемта не поверите, но базы данных это сами вроде делают :)

[identity profile] plumqqz.livejournal.com 2013-04-18 08:17 pm (UTC)(link)
Некоторые даже с аппаратной помощью.

[personal profile] alll 2013-04-18 09:16 pm (UTC)(link)
Не поверю - иначе откуда бы вы взяли такой вкусный выигрыш в размерах в ~50% вместо унылого ~20%. ;)