metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2012-08-16 12:21 am
Entry tags:

Clojure, last

По мотивам: http://tonsky.livejournal.com/266027.html
Часто ли нужно найти последний элемент последовательности?

Впрочем, я не очень понимаю, причем тут полиморфизм к оптимизации last для векторов - по-моему, другое имя для метода работающего O(1) для конкретной реализации (вектор) вместо O(n) для произвольных последовательностей - это вполне разумная идея.

Рассуждать об производительности алгоритма гораздо проще, зная, что вызов всегда отрабатывает за известное время, а не "в зависимости от того, что за реализацию мы туда передали".
По-моему, очевидно, что не нужно делать обобщенную реализацию, например quicksort, передавая ей абстракцию "последовательность"+"функция получения n-ного элемента", потому что единственный вариант, в котором это работает - мутабельный массив с O(1) для доступа и замены элемента. Соответственно и алгоритмы, использующие last обобщать и надеятся на оптимальную реализацию в некотором роде бессмысленно.

[identity profile] vshabanov.livejournal.com 2012-08-16 11:49 am (UTC)(link)
> Часто ли нужно найти последний элемент последовательности?

Я бы поставил вопрос чуть шире: а нужны ли вообще общие интерфейсы к последовательностям? Зачем last-у работать и со списком и с массивом?

С трудом себе представляю ситуацию, когда вместо списка вдруг потребовался массив или мапка и при этом алгоритм работы не изменился. Т.е. все равно придется перепиливать код и замена last на какой-нить V.last/Map.last не сильно напряжет.

Если же хочется краткости, то уже вылезают проблемы с понятностью кода (везде last, а че делается, с какими структурами данных работаем, непонятно).

В том же самом хаскеле для каждой структуры данных свой отдельный набор ф-ий в отдельном модуле, причем часто с пересекающимися названиями. При этом запросто можно сделать type class с нужными ф-иями и везде писать какой-нить foldl вместо Map.foldl/IntMap.foldl/Text.foldl, но это никому не нужно.

С моей точки зрения всякие обобщенные коллекции/итераторы -- это изврат и переусложнение, возможно вызванное бедностью языков (неудобные/отсутствующие замыкания).

[identity profile] metaclass.livejournal.com 2012-08-16 12:02 pm (UTC)(link)
Именно так, общие интерфейсы не так часто нужны, особенно если речь идет о производительности.

[identity profile] max630.livejournal.com 2012-08-16 12:33 pm (UTC)(link)
> это никому не нужно
конечно не нужно, можно же просто скопипастить модуль, поменять импорт и написать в хаскель-кафе: пакет XXX теперь поддерживает Text. Ищите в XXX.Text и XXX.Text.Lazy

[identity profile] vshabanov.livejournal.com 2012-08-16 01:50 pm (UTC)(link)
Не понял. Какой еще модуль скопипастить? И что значит пакет теперь поддерживает Text?

[identity profile] max630.livejournal.com 2012-08-16 06:35 pm (UTC)(link)
Я хочу сказать, что это работает пока у нас 1 список, который по совместительству строка, 1 Map и 1 Array (для Array впрочем есть класс). А если активно используемых строк - 3 типа, которые требуют явной конвертации, и никакиого общего интерфейса у них нет (если быть точным - есть, но он так далеко в хакадже, что его никто не использует), то любая библиотека работающая сo строками обросла своей копией для каждого из текстов.

При этом различия в реализации этих модулей минимальны, и нет, они не обусловлены тем что там алгоритмы разные.

[identity profile] vshabanov.livejournal.com 2012-08-16 07:39 pm (UTC)(link)
> А если активно используемых строк - 3 типа, которые требуют явной конвертации, и никакиого общего интерфейса у них нет

Общий интерфейс к ним и не нужен, т.к. уж слишком разное у них назначение. С общим интерфейсом/неявными преобразованиями будут проблемы с производительностью и кодировками.

> то любая библиотека работающая сo строками обросла своей копией для каждого из текстов.

А пример можно? Обычно библиотеки либо работают с одним видом строк, либо имеют внутри какой-нить type class и работают со всеми строками одинаково.

[identity profile] max630.livejournal.com 2012-08-16 09:11 pm (UTC)(link)
я это видел в attoparsec

[identity profile] max630.livejournal.com 2012-08-16 09:16 pm (UTC)(link)
собственно, достаточно сравнить исходники Data.Text и Data.Text.Lazy

[identity profile] vshabanov.livejournal.com 2012-08-17 11:44 am (UTC)(link)
Собственно, в этих исходниках можно увидеть кучу RULES, которые врядли будут срабатывать и выдавать такой же эффективный код, если код будет на typeclass-ах.

attoparsec и text -- одни из наиболее скоростных библиотек на хаскеле. Краткость в них принесена в жертву производительности (не думаю, кстати, что можно добиться такой же производительности где бы то ни было с сохранением абстрактных интерфейсов коллекций и итераторов).