metaclass: (Default)
[personal profile] metaclass
Основной критерий выбора технологий программирования: "Чтобы вас можно было заменить на васю, не знающего языка и он мог прочесть код": http://ugenk.livejournal.com/188023.html

Date: 2012-11-29 08:55 am (UTC)
From: [identity profile] ugenk.livejournal.com
awk, sed, bash
python
очень отлично обрабатывают текст

Date: 2012-11-29 09:08 am (UTC)
From: [identity profile] metaclass.livejournal.com
Ты понимаешь, что из этого языком можно считать только питон, а остальное - дичайшего образца рукожопие, которое поддерживаемо даже хуже хаскеля с перлом?

Date: 2012-11-29 09:10 am (UTC)
From: [identity profile] ugenk.livejournal.com
для задачи "обработать текст" оно подходит лучше.

Date: 2012-11-29 09:21 am (UTC)
From: [identity profile] metaclass.livejournal.com
Однострочники да. В целом, не очень гуманно.

Date: 2012-11-29 09:26 am (UTC)
From: [identity profile] enternet.livejournal.com
Обработка текста - это задача писателя.

Date: 2012-11-29 02:58 pm (UTC)
From: [identity profile] avnik.livejournal.com
Берете питон, nltk и обрабатываете

Date: 2012-11-29 03:06 pm (UTC)
From: [identity profile] enternet.livejournal.com
Это как вообще понимать?
У разработчика ПО в принципе не может такой быть такой задачи как обработка текста. Это работа писателя, верстальщика, корректора, редактора и т.д. Коим боком тут разработчик ПО вообще?

Date: 2012-11-29 03:17 pm (UTC)
From: [identity profile] avnik.livejournal.com
индексация (для поиска, каталогизации по тегам, etc)
(де)синонимизация
Детект всякого спама типа "заходите на сайт помойка ком" (дада прямо так, русскими буквами)

Я вот в данный момент пытаюсь накорябать что-то для вычленения в фидах конструкций "ролик оппозиции будет по $(этому урлу) через час" (ну так, в порядке иллюстраций к нлтк)

Date: 2012-11-29 03:27 pm (UTC)
From: [identity profile] enternet.livejournal.com
Так это узкоспециализированный анализ, а не "обработка". "awk, sed, bash" с которых начиналась ветка тут не помощники.

Date: 2012-11-29 03:34 pm (UTC)
From: [identity profile] avnik.livejournal.com
А вот где кончается обработка и начинается анализ? )

Date: 2012-11-29 03:36 pm (UTC)
From: [identity profile] enternet.livejournal.com
Хороший вопрос. Я всегда полагал, что "обработать" - значит приложить к объекту некоторые усилия, которые изменят объект.

Date: 2012-11-29 03:42 pm (UTC)
From: [identity profile] eternal-leave.livejournal.com
Речь идет не про тот текст, который в ворде

Date: 2012-11-29 10:16 am (UTC)
From: [identity profile] http://users.livejournal.com/_slw/
на sed есть тетрис.

Date: 2012-11-29 10:36 am (UTC)
From: [identity profile] metaclass.livejournal.com
Ну, интерпретаторы befunge на брейнфаке тоже наверно бывают :)

Date: 2012-11-29 11:28 am (UTC)
From: [identity profile] nealar.livejournal.com
Был пример у кого-то в комментах, на тему того, что однострочник на awk гораздо понятней, чем на perl. Причём, не факториалы, а из жизненной задачи выскочило, админской. А многострочники лучше вообще на write-only языках не пейсать!

Date: 2012-11-29 09:51 am (UTC)
From: [identity profile] besm6.livejournal.com
awk и sed еще страшнее перла по синтаксису, а их комбинация с шеллом, особенно с bash, страдает как минимум в части обнаружения, не говоря уже об обработке, ошибок. И главное, этот комплекс довольно плохо справляется с частью "сводится к" тексту. Готовый текст - да, можно, но на перле как-то проще.

sed'ом я, кстати, часто пользуюсь там, где он лаконичнее перла. awk забросил, освоив perl. И да, конечно, zsh, а не bash. У баша тараканы.

python же не тянет по параметру "лаконично", и как следствие, "быстро". Хотя да, тоже можно. Рассчитанные на долгую жизнь скрипты такой обработки я бы и писал на нем... если бы не одна засада. Почему-то, не могу понять, почему, все виденные мной программы на питоне, включая мной же и написанные, страдают внезапной ненадежностью на ровном месте. Не то чтобы она совсем не работает, зачастую повторный запуск помогает, но вот этот странный результат... Похоже не на проблемы рантайма, а на проблемы именно программистов. Но настолько тотальные, что приходится эмпирически констатировать проблему языка.

Date: 2012-11-29 10:17 am (UTC)
From: [identity profile] norguhtar.livejournal.com

Почему-то, не могу понять, почему, все виденные мной программы на питоне, включая мной же и написанные, страдают внезапной ненадежностью на ровном месте.

Пробелы и табы? :]

Date: 2012-11-29 12:42 pm (UTC)
From: [identity profile] tzirechnoy.livejournal.com
Скорее исключения -- которые вроде как редки, но обязательны. Адская смесь.

Date: 2012-11-29 01:10 pm (UTC)
From: [identity profile] besm6.livejournal.com
Не исключу, но вряд ли. Своё, во всяком случае, ломалось уже после починки пробелов и табов :)

Date: 2012-11-29 03:02 pm (UTC)
From: [identity profile] avnik.livejournal.com
Не ну бывает.
У меня с рубе вот не складвается, вроде не плохой язык -- а в моих руках -- как петон у айседа.
И питон таки достаточно лаконичен.

Profile

metaclass: (Default)
metaclass

April 2017

S M T W T F S
      1
2345678
9101112 131415
16171819202122
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 7th, 2025 04:50 pm
Powered by Dreamwidth Studios