metaclass: (Default)
[personal profile] metaclass
Основной критерий выбора технологий программирования: "Чтобы вас можно было заменить на васю, не знающего языка и он мог прочесть код": http://ugenk.livejournal.com/188023.html

Date: 2012-11-29 02:58 pm (UTC)
From: [identity profile] avnik.livejournal.com
Берете питон, nltk и обрабатываете

Date: 2012-11-29 03:06 pm (UTC)
From: [identity profile] enternet.livejournal.com
Это как вообще понимать?
У разработчика ПО в принципе не может такой быть такой задачи как обработка текста. Это работа писателя, верстальщика, корректора, редактора и т.д. Коим боком тут разработчик ПО вообще?

Date: 2012-11-29 03:17 pm (UTC)
From: [identity profile] avnik.livejournal.com
индексация (для поиска, каталогизации по тегам, etc)
(де)синонимизация
Детект всякого спама типа "заходите на сайт помойка ком" (дада прямо так, русскими буквами)

Я вот в данный момент пытаюсь накорябать что-то для вычленения в фидах конструкций "ролик оппозиции будет по $(этому урлу) через час" (ну так, в порядке иллюстраций к нлтк)

Date: 2012-11-29 03:27 pm (UTC)
From: [identity profile] enternet.livejournal.com
Так это узкоспециализированный анализ, а не "обработка". "awk, sed, bash" с которых начиналась ветка тут не помощники.

Date: 2012-11-29 03:34 pm (UTC)
From: [identity profile] avnik.livejournal.com
А вот где кончается обработка и начинается анализ? )

Date: 2012-11-29 03:36 pm (UTC)
From: [identity profile] enternet.livejournal.com
Хороший вопрос. Я всегда полагал, что "обработать" - значит приложить к объекту некоторые усилия, которые изменят объект.

Date: 2012-11-29 03:42 pm (UTC)
From: [identity profile] eternal-leave.livejournal.com
Речь идет не про тот текст, который в ворде

Profile

metaclass: (Default)
metaclass

April 2017

S M T W T F S
      1
2345678
9101112 131415
16171819202122
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 31st, 2025 05:29 am
Powered by Dreamwidth Studios