metaclass: (Default)
metaclass ([personal profile] metaclass) wrote2012-11-29 10:20 am
Entry tags:

"Читать код, не зная языка"

Основной критерий выбора технологий программирования: "Чтобы вас можно было заменить на васю, не знающего языка и он мог прочесть код": http://ugenk.livejournal.com/188023.html

[identity profile] avnik.livejournal.com 2012-11-29 02:58 pm (UTC)(link)
Берете питон, nltk и обрабатываете

[identity profile] enternet.livejournal.com 2012-11-29 03:06 pm (UTC)(link)
Это как вообще понимать?
У разработчика ПО в принципе не может такой быть такой задачи как обработка текста. Это работа писателя, верстальщика, корректора, редактора и т.д. Коим боком тут разработчик ПО вообще?

[identity profile] avnik.livejournal.com 2012-11-29 03:17 pm (UTC)(link)
индексация (для поиска, каталогизации по тегам, etc)
(де)синонимизация
Детект всякого спама типа "заходите на сайт помойка ком" (дада прямо так, русскими буквами)

Я вот в данный момент пытаюсь накорябать что-то для вычленения в фидах конструкций "ролик оппозиции будет по $(этому урлу) через час" (ну так, в порядке иллюстраций к нлтк)

[identity profile] enternet.livejournal.com 2012-11-29 03:27 pm (UTC)(link)
Так это узкоспециализированный анализ, а не "обработка". "awk, sed, bash" с которых начиналась ветка тут не помощники.

[identity profile] avnik.livejournal.com 2012-11-29 03:34 pm (UTC)(link)
А вот где кончается обработка и начинается анализ? )

[identity profile] enternet.livejournal.com 2012-11-29 03:36 pm (UTC)(link)
Хороший вопрос. Я всегда полагал, что "обработать" - значит приложить к объекту некоторые усилия, которые изменят объект.

[identity profile] eternal-leave.livejournal.com 2012-11-29 03:42 pm (UTC)(link)
Речь идет не про тот текст, который в ворде