metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2013-05-05 10:50 pm

Безумная кложурная жесть

Делаю генератор отчетов, у которого часть работы - запросы к БД и часть - постобработка. Все это работает в фоновых потоках clojure (внутри future) и паралелльно еще несколько потоков (из ScheduledThreadPool и его вариаций из java.util.concurrent) выполняют всякую вспомогательную работу типа "очистить старые данные", "пересчитать изменения пришедшие в очередь в БД".
future в clojure реализованы в том же thread pool что и функция send-off для агентов. Этот thread pool не имеет ограничений по размеру и изначально предполагался для операций, ожидающих i/o, а не cpu-bound. Пока отчет считается в БД - это нормально, но когда начинается постобработка, при превышении некоторого порога количества потоков - возникают совершенно непропорциональные тормоза, типа 30 отчетов одновременно считается за 2 минуты, 64 отчета считаются 30 минут.
Надо как-то более равномерно распределить работу по времени, чтобы количество нагружающих CPU потоков было ограничено, что ли. И вообще, надо как-то осилить профилирование нагрузки, чтобы знать, чем там кложурь и JVM занимаются.

[identity profile] kiryl.livejournal.com 2013-05-05 08:02 pm (UTC)(link)
Похоже на lock contention. Интересно на каком уровне: жаба или глубже в ОС. Это винда или как?

С локами есть куча тонких эффекторов. Коллеги недавно статейку опубликовали по поводу некоторых из них: www.intel.com/content/dam/www/public/us/en/documents/white-papers/xeon-lock-scaling-analysis-paper.pdf

[identity profile] metaclass.livejournal.com 2013-05-05 08:13 pm (UTC)(link)
У меня там локов конкретно во время расчета нет - все взаимодействия между потоками производятся по завершению расчетов. И я на 99% уверен, что во внутренностях clojure нету неявных блокировок - это бы полностью противоречило всей идеологии языка.

Сейчас я повторил эксперимент, постепенно наращивая количество запросов - теперь нормально, 4 минуты на 64 отчета. Но были мелкие изменения в условиях эксперимента, надо бы воспроизвести в оригинальных условиях.

Вообще говоря, там очень много разных эффектов - например, первая версия тупила на том, что в пуле коннектов к БД было ограничение на 8 активных коннектов.

[identity profile] kiryl.livejournal.com 2013-05-05 09:03 pm (UTC)(link)
Локи в любом случае есть. Хотя бы в memory management в ядре.

[identity profile] tonsky.livejournal.com 2013-05-06 10:29 am (UTC)(link)
В stm есть, Рич сам говорил: не фантазируйте, конечно, локи есть. Главное, что наружу не торчат.

[identity profile] prepor.livejournal.com 2013-05-06 02:13 pm (UTC)(link)
Во всем, что касается shared мемори (stm, атомы, агенты) кложа, конечно, полна локов. Локи вредны не как таковые, а как интерфейс.

[identity profile] andymur.livejournal.com 2013-05-05 08:08 pm (UTC)(link)
VisualVM в помощь, на хабре статья (http://habrahabr.ru/post/61857/) хорошая.

Вот где жестокий реальный мир наносит ответный удар. Чё-то ещё...да есть книжки, которые советовали ребята из Oracle, по перформансу, но может там все не так страшно.
Edited 2013-05-05 20:09 (UTC)

[identity profile] metaclass.livejournal.com 2013-05-05 08:16 pm (UTC)(link)
О, отлично, можно будет профилировать до одури :)

[identity profile] theiced.livejournal.com 2013-05-05 08:24 pm (UTC)(link)
хабр, тупеют.

[identity profile] metaclass.livejournal.com 2013-05-05 08:27 pm (UTC)(link)
А есть ли англоязычный ресурс типа хабра?
Я правда сомневаюсь, что где-нибудь, кроме русскоязычного интернета, жизнеспособна идея "дрочить на карму" :)

[identity profile] mehanizator.livejournal.com 2013-05-05 08:49 pm (UTC)(link)
все что в рунете есть - заимствования и копии. дрочить на карму начали в digg еще в 2004

[identity profile] bydl0coder.livejournal.com 2013-05-06 04:00 am (UTC)(link)
Во-во. Метакласс, по ходу, интернет вчера увидел.

[identity profile] prepor.livejournal.com 2013-05-06 02:23 pm (UTC)(link)
или еще предстоит. завтра на стэковерфлоу наткнется.

[identity profile] theiced.livejournal.com 2013-05-05 09:24 pm (UTC)(link)
я не в курсе про аналогично ненужные ресурсы.

[identity profile] golikov konstantine (from livejournal.com) 2013-05-05 10:20 pm (UTC)(link)
в stackoverflow жизнеспособна же
Edited 2013-05-05 22:21 (UTC)

[identity profile] thedeemon.livejournal.com 2013-05-06 04:21 am (UTC)(link)
reddit, hacker news
Оттуда большинство переводимых статей хабровских.

[identity profile] andrew kondratovich (from livejournal.com) 2013-05-05 08:11 pm (UTC)(link)
есть такое.

с агентами проще - можно выбирать куда совать.

можно поменять экзекутор - но он затронет весь рантайм.

[identity profile] metaclass.livejournal.com 2013-05-05 08:15 pm (UTC)(link)
Да я тут в процессе насмотрелся на java.util.concurrent - там все сделано крайне грамотно, можно использовать напрямую, создать отдельный пул и в нем считать.

[identity profile] tonsky.livejournal.com 2013-05-06 10:31 am (UTC)(link)
мы так и делаем: scheduledthreadpool, timer, очереди

[identity profile] tonsky.livejournal.com 2013-05-06 10:37 am (UTC)(link)
почему весь? send-via же

[identity profile] andrew kondratovich (from livejournal.com) 2013-05-06 01:17 pm (UTC)(link)
Ага... в итоге экзекутор для фьючеров ставим глобальный, а для агентов - экплисит. не кошерно как-то.

[identity profile] bydlorus.livejournal.com 2013-05-06 07:27 am (UTC)(link)
Когда я читаю про генераторы отчётов на closure, то в ужасе просыпаюсь, а рука в горшке.

[identity profile] berezovsky.livejournal.com 2013-05-06 03:43 pm (UTC)(link)
мозг в горшке, рука в горшке