metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2011-04-18 02:49 pm

А теперь, что-то совершенно новое: Бородатая женщина пишет XML

Для начала взгляните на ссылку: http://www.cacodaemon.org/content/XmlSlavery.xml
Я не смог это запостить в нескольких nopaste, уплющиваются.

Сие является форматом экспорта-импорта некоей странной опердени, предназначенной для отсылки информации в налоговые. Клиенты втайне желают, чтобы я генерировал из своей опердени данные в этом формате. Документации на формат, само собой, нету.

Для начала, оцените наличие структуры внутри имен узлов.
Затем транслитерированный русский язык в именах. Почему тогда уже не настоящий русский? (или xml запрещает, или кодировки не осилили)
Затем то, что в качестве имен полей таблиц используются крайне осмысленные строки типа "rYcX" или "rnc1,rnc2..,rncN". Очень похоже на то, что кто-то имитирует Excel.

В общем, единственное что приходит мне в голову - это написать "Модуль Универсального Экспорта В Форматы, Надиктованные Червем С Луны", задокументировать формат его шаблонов и отдать клиентам - а там пусть кто-нибудь, у кого вид этого xml не вызывает нервного срыва и кошмаров, сделает шаблон под него.

[identity profile] denisioru.livejournal.com 2011-04-18 12:35 pm (UTC)(link)
Кстати ещё более ад - это CommerceML от 1С, там теги русскими буквами названы. <Справочники> и т.д.

[identity profile] metaclass.livejournal.com 2011-04-18 12:36 pm (UTC)(link)
Надеюсь в win1251? :)

[identity profile] denisioru.livejournal.com 2011-04-18 12:39 pm (UTC)(link)
Не помню щас, а 1С под руками нет. Но я был в небольшом ахуе.

[identity profile] aamonster.livejournal.com 2011-04-18 12:42 pm (UTC)(link)
Тю. После Visual Basic на русском языке это уже не пугает.

[identity profile] freiksenet.livejournal.com 2011-04-18 12:50 pm (UTC)(link)
Я сейчас работаю с русской неподдерживаемой тулзой, которая делает морфологический/синтактический анализ текста. Так вот она берет только windows-1251, мощно глючит на всех нестандартных символах и выдаёт морфологическую информацию двухбуквенными кодами типа "аа" "аб" "ав" "аг" и так до "ЯЯ". Что-то типа такого "Анальный 0 8 RLE Aa NAM? +Уе АНАЛЬНЫЙ йаРщ 169777 0".

Русская опердень жива даже в научной сфере!

[identity profile] mikhail k. savkin (from livejournal.com) 2011-04-18 01:38 pm (UTC)(link)
Похоже, что это анкоды.

[identity profile] freiksenet.livejournal.com 2011-04-18 01:43 pm (UTC)(link)
То есть это стандартный способ кодировать морфологию? И кому мы должны быть благодарны за столь читаемый способ?

[identity profile] mikhail k. savkin (from livejournal.com) 2011-04-19 06:33 am (UTC)(link)
Анкод - аношкинский код. Если ничего не путаю, то происходит из проекта Диалинг, сейчас активно используется в проекте АОТ и производных от него. А в то время, когда развился Диалинг, никакого xml и чего-либо ему подобного не было.

[identity profile] freiksenet.livejournal.com 2011-04-19 09:56 am (UTC)(link)
Как хмл связан с тем, что то, что нужно было закодировать читабельно, закодировано зубодробительными двухбуквенным комбинациями? ) То есть мне в принципе ненапряжно в таблице посмотреть, но я не особо врубаюсь в мотивацию именно так представлять эти данные )

[identity profile] sorhed.livejournal.com 2011-04-18 12:53 pm (UTC)(link)
А что, никто не запрещает, при условии явного указания кодировки в <?xml...>

[identity profile] fkng-stupid-lj.livejournal.com 2011-04-18 01:32 pm (UTC)(link)
Почему «ад»? XML, собственно, на это и рассчитан. Парсеру все равно, а человеку удобнее.