metaclass | Безумная кложурная жесть

Делаю генератор отчетов, у которого часть работы - запросы к БД и часть - постобработка. Все это работает в фоновых потоках clojure (внутри future) и паралелльно еще несколько потоков (из ScheduledThreadPool и его вариаций из java.util.concurrent) выполняют всякую вспомогательную работу типа "очистить старые данные", "пересчитать изменения пришедшие в очередь в БД".
future в clojure реализованы в том же thread pool что и функция send-off для агентов. Этот thread pool не имеет ограничений по размеру и изначально предполагался для операций, ожидающих i/o, а не cpu-bound. Пока отчет считается в БД - это нормально, но когда начинается постобработка, при превышении некоторого порога количества потоков - возникают совершенно непропорциональные тормоза, типа 30 отчетов одновременно считается за 2 минуты, 64 отчета считаются 30 минут.
Надо как-то более равномерно распределить работу по времени, чтобы количество нагружающих CPU потоков было ограничено, что ли. И вообще, надо как-то осилить профилирование нагрузки, чтобы знать, чем там кложурь и JVM занимаются.

Flat | Top-Level Comments Only

Похоже на lock contention. Интересно на каком уровне: жаба или глубже в ОС. Это винда или как?

С локами есть куча тонких эффекторов. Коллеги недавно статейку опубликовали по поводу некоторых из них: www.intel.com/content/dam/www/public/us/en/documents/white-papers/xeon-lock-scaling-analysis-paper.pdf

У меня там локов конкретно во время расчета нет - все взаимодействия между потоками производятся по завершению расчетов. И я на 99% уверен, что во внутренностях clojure нету неявных блокировок - это бы полностью противоречило всей идеологии языка.

Сейчас я повторил эксперимент, постепенно наращивая количество запросов - теперь нормально, 4 минуты на 64 отчета. Но были мелкие изменения в условиях эксперимента, надо бы воспроизвести в оригинальных условиях.

Вообще говоря, там очень много разных эффектов - например, первая версия тупила на том, что в пуле коннектов к БД было ограничение на 8 активных коннектов.

Локи в любом случае есть. Хотя бы в memory management в ядре.

В stm есть, Рич сам говорил: не фантазируйте, конечно, локи есть. Главное, что наружу не торчат.

Во всем, что касается shared мемори (stm, атомы, агенты) кложа, конечно, полна локов. Локи вредны не как таковые, а как интерфейс.

VisualVM в помощь, на хабре статья (http://habrahabr.ru/post/61857/) хорошая.

Вот где жестокий реальный мир наносит ответный удар. Чё-то ещё...да есть книжки, которые советовали ребята из Oracle, по перформансу, но может там все не так страшно.

Edited 2013-05-05 20:09 (UTC)

О, отлично, можно будет профилировать до одури :)

хабр, тупеют.

А есть ли англоязычный ресурс типа хабра?
Я правда сомневаюсь, что где-нибудь, кроме русскоязычного интернета, жизнеспособна идея "дрочить на карму" :)

все что в рунете есть - заимствования и копии. дрочить на карму начали в digg еще в 2004

Во-во. Метакласс, по ходу, интернет вчера увидел.

или еще предстоит. завтра на стэковерфлоу наткнется.

я не в курсе про аналогично ненужные ресурсы.

в stackoverflow жизнеспособна же

Edited 2013-05-05 22:21 (UTC)

reddit, hacker news
Оттуда большинство переводимых статей хабровских.

есть такое.

с агентами проще - можно выбирать куда совать.

можно поменять экзекутор - но он затронет весь рантайм.

Да я тут в процессе насмотрелся на java.util.concurrent - там все сделано крайне грамотно, можно использовать напрямую, создать отдельный пул и в нем считать.

мы так и делаем: scheduledthreadpool, timer, очереди

почему весь? send-via же

Ага... в итоге экзекутор для фьючеров ставим глобальный, а для агентов - экплисит. не кошерно как-то.

Когда я читаю про генераторы отчётов на closure, то в ужасе просыпаюсь, а рука в горшке.

мозг в горшке, рука в горшке

Безумная кложурная жесть

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject