metaclass | C, parse comma-separated line

C, parse comma-separated line

Кошерен ли такой код для разбиения строки, разделенной запятыми на отдельные строки: http://ideone.com/rhNXq ?

PS: strtok не признаю по идеологическим причинам - она меняет анализируемую строку, что меня крайне пугает, хотя в моем конкретном случае это не мешает.

PPS: безотносительно к strtok, в функции было минимум две ошибки - отсутствие проверки на выход за пределы буфера и попадание eol в последнюю строку (девайсина, с которой приходит строка, терминирует ее \r)

Flat | Top-Level Comments Only

man strsep strtok

Про них какие-то неприятные вещи в man написаны, меня идея модифицировать строку ради парсинга крайне пугает.

Есть ещё strcspn() и strspn() и strpbrk()

Edited 2012-04-22 15:18 (UTC)

Как предлагаешь парсить потенциальный гигабайт?

(no subject)

gds.livejournal.com - 2012-04-22 15:14 (UTC) - Expand

(no subject)

gds.livejournal.com - 2012-04-22 15:15 (UTC) - Expand

(no subject)

blacklion.livejournal.com - 2012-04-22 15:15 (UTC) - Expand

(no subject)

avnik.livejournal.com - 2012-04-22 16:07 (UTC) - Expand

(no subject)

abbra - 2012-04-22 16:43 (UTC) - Expand

(no subject)

avnik.livejournal.com - 2012-04-22 17:13 (UTC) - Expand

(no subject)

abbra - 2012-04-22 19:11 (UTC) - Expand

strsep и strtok разруливают ситуацию с экранированием? Нет? Тогда в печку их.

(no subject)

blacklion.livejournal.com - 2012-04-22 16:44 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 16:51 (UTC) - Expand

(no subject)

blacklion.livejournal.com - 2012-04-22 17:24 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-22 19:42 (UTC) - Expand

(no subject)

lionet.livejournal.com - 2012-04-22 17:28 (UTC) - Expand

(no subject)

lionet.livejournal.com - 2012-04-22 16:58 (UTC) - Expand

(no subject)

blacklion.livejournal.com - 2012-04-22 17:24 (UTC) - Expand

(no subject)

lionet.livejournal.com - 2012-04-22 17:27 (UTC) - Expand

use pcre, luck!

luke*

(no subject)

fas-tm.livejournal.com - 2012-04-22 15:56 (UTC) - Expand

Еще блин один...

Some people, when confronted with a problem, think "I know, I'll use regular expressions." Now they have two problems.

Вышеприведенную цитату надо калёны железом на жопах студентов профильных факультетов выжигать.

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-22 19:54 (UTC) - Expand

Ваша идея - говно.

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-22 21:20 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 21:40 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-22 21:51 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 22:00 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-22 22:09 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 22:37 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-22 22:41 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-23 07:42 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-23 08:32 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-23 08:36 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-23 08:43 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-23 08:44 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-23 08:47 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-23 08:49 (UTC) - Expand

(no subject)

http://users.livejournal.com/_slw/ - 2012-04-23 09:01 (UTC) - Expand

(no subject)

berezovsky.livejournal.com - 2012-04-23 18:41 (UTC) - Expand

а split в этой дремучести не определён?

в С нет строк как таковых. есть последовательность символов.

(no subject)

artureg.livejournal.com - 2012-04-22 15:51 (UTC) - Expand

(no subject)

sorhed.livejournal.com - 2012-04-22 16:14 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 18:16 (UTC) - Expand

сплит? ты дурак?

(no subject)

artureg.livejournal.com - 2012-04-22 18:10 (UTC) - Expand

А возвращать он что будет?:)

(no subject)

lionet.livejournal.com - 2012-04-22 16:18 (UTC) - Expand

(no subject)

theiced.livejournal.com - 2012-04-22 16:35 (UTC) - Expand

(no subject)

lionet.livejournal.com - 2012-04-22 16:47 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 21:11 (UTC) - Expand

(no subject)

lionet.livejournal.com - 2012-04-22 21:27 (UTC) - Expand

(no subject)

sorhed.livejournal.com - 2012-04-22 16:18 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 18:11 (UTC) - Expand

Как уже предложили выше (lionet), используйте готовую библиотеку строк. Чем раньше вы начнете ее использовать, тем меньше времени потратите на переписывание потом.

Если вам нужно просто разобрать CSV, то и для разбора оного есть готовые библиотеки с хорошей историей.

В строках можно даже с добрыми намерениями нагородить 'one off' и buffer overruns (как вы показательно его вставили в первой же функции сверху)

Еще стандартный совет из сети - не использовать арифметику указателей без сильной нужды. operator[] and indexes do the same job just fine.

Будет весело, гарантирую.

А где там overrun?

(no subject)

smalgin.livejournal.com - 2012-04-22 16:58 (UTC) - Expand

Холерный вибрион, я ж не проверяю в цикле выход за пределы буфера.

(no subject)

smalgin.livejournal.com - 2012-04-22 17:31 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 17:46 (UTC) - Expand

(no subject)

smalgin.livejournal.com - 2012-04-22 17:58 (UTC) - Expand

1. В коде косяки - работать не будет.
2. В идеале стоило бы разбить код на две функции: поиск символа в строке и разбиение строки по номеру символа.
3. \r в результате за ошибку не считаем. Откуда нам знать, что она тебе не нужна :)

В итоге, ждём исправленную версию.

Проблема в том, что работало. Пока я не стал использовать ее вывод для дальнейшего парсинга, и то при этом в первую очередь сломалось на \r в последней строке.

А зачем разбивать на две строки, по моему так понятнее?

(no subject)

blackyblack.livejournal.com - 2012-04-22 17:52 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 17:58 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 18:17 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 18:22 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 18:23 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 18:31 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 18:33 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 18:41 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 18:43 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 18:52 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 19:29 (UTC) - Expand

(no subject)

berezovsky.livejournal.com - 2012-04-22 19:41 (UTC) - Expand

(no subject)

artureg.livejournal.com - 2012-04-22 19:42 (UTC) - Expand

Интересно даже (я комментарии не читал пока), сколько раз предложили strtok_r?

Ебануться.

(no subject)

metaclass.livejournal.com - 2012-04-22 20:38 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-22 20:40 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 20:45 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-22 20:47 (UTC) - Expand

(no subject)

jdevelop.livejournal.com - 2012-04-23 11:46 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-23 11:52 (UTC) - Expand

(no subject)

jdevelop.livejournal.com - 2012-04-23 11:55 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-23 12:11 (UTC) - Expand

(no subject)

jdevelop.livejournal.com - 2012-04-23 12:14 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-23 12:22 (UTC) - Expand

(no subject)

jdevelop.livejournal.com - 2012-04-23 12:25 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-23 12:31 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-23 12:11 (UTC) - Expand

(no subject)

jdevelop.livejournal.com - 2012-04-23 12:15 (UTC) - Expand

strtok_r здесь излишен

(no subject)

plumqqz.livejournal.com - 2012-04-22 20:42 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 21:13 (UTC) - Expand

(no subject)

plumqqz.livejournal.com - 2012-04-22 21:18 (UTC) - Expand

Код кривой, аффтара - отлучить от C и перевести в программисты PHP.

Не, не, мы уж как нибудь на clojure да F#, с PHP связываться не желаю.

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 20:42 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 20:46 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 21:02 (UTC) - Expand

(no subject)

metaclass.livejournal.com - 2012-04-22 21:12 (UTC) - Expand

(no subject)

slonik-v-domene.livejournal.com - 2012-04-22 21:29 (UTC) - Expand

Вы всё продолжаете себя мучать? Первый и третий пункт рецепта как и в прошлом посте, меняется только второй:

#include <boost/tokenizer.hpp>
#include <iostream>

const std::string str("aaaa,ssdsd asdsd,ffffff");

int main() {
    typedef boost::tokenizer< boost::char_separator<char> > splitter;

    boost::char_separator<char> sep(",");
    splitter spl(str, sep);

    for (splitter::const_iterator it = spl.begin(), end = spl.end(); it != end; ++it) {
        std::cout << *it << "\n";
    }
}

Да, надо будет С++ тоже попробовать, на следующей потусторонней задаче.

(no subject)

berezovsky.livejournal.com - 2012-04-23 06:51 (UTC) - Expand

(no subject)

nicka-startcev.livejournal.com - 2012-04-23 08:54 (UTC) - Expand

Flat | Top-Level Comments Only