функция gettoken - непонятная процедура (K&R)

У меня есть несколько вопросов, поэтому я поставлю числа в комментариях, чтобы было легче найти строку с вопросом.

[1] Как можно присвоить char * p переменной токена, которой на самом деле не существует?

[2] Почему мы не помещаем здесь '\ 0', что делается в каждом другом условии if?

[3] Почему мы копируем () только в строку токена? И мы не делаем этого в случае [] и буквенно-цифровых символов?

[4] Эти команды возврата выглядят странно. ИМО -> во-первых: почему они не выглядят так же, как этот return PARENS, а во-вторых: когда они возвращают tokentype = '(', это символ, так почему функция gettoken объявлена ​​как возвращающая целые числа?

[5] Предполагаемая часть: пусть input будет (abc), затем: (заставляет функцию возвращать tokentype '(' abc enter if condition (isalpha (C)) и последнее) выходит из этого условия, вызывая отмену выборки. Выполняется ли это по основному условию else Тогда? Правильно ли мое прохождение?

#include <stdio.h>
#include <string.h>
#include <ctype.h>
#define MAXTOKEN 100
enum { NAME, PARENS, BRACKETS };
void dcl(void);
void dirdcl(void);
int gettoken(void);
int tokentype; /*type of last token  ALSO [4] !!! */
char token[MAXTOKEN]; /*last token string */
char name[MAXTOKEN]; /*identifier name */
char datatype[MAXTOKEN]; /*data type = char, int, etc. */
char out[1000];

main() /* convert declaration to words */
{
    while (gettoken() != EOF) {    /* 1st token on line */
        strcpy(datatype, token);   /* is the datatype */
        out[0] = '\0';
        dcl();            /* parse rest of line */
        if (tokentype != '\n')
            printf("syntax error\n");
        printf("%s: %s %s\n", name, out, datatype);
    }
    return 0;
}

int gettoken(void) /* return next token */
{
    int c, getch(void);
    void ungetch(int);
    char *p = token;        /* [1] */
    while ((c = getch()) == ' ' || c == '\t')
        ;
    if (c == '(') {
        if ((c = getch()) == ')') {
            strcpy(token, "()");            /* [2][3] */
            return tokentype = PARENS;           /* [4] */
        } else {
            ungetch(c);
            return tokentype = '(';
        }
    } else if (c == '[') {
        for (*p++ = c; (*p++ = getch()) != ']'; )
            ;
        *p = '\0';
        return tokentype = BRACKETS;
    } else if (isalpha(c)) {
        for (*p++ = c; isalnum(c = getch()); ) /* SUPPOSING [5] */
            *p++ = c;
        *p = '\0';
        ungetch(c);
        return tokentype = NAME;
    } else
        return tokentype = c;
}

/* dcl: parse a declarator */
void dcl(void)
{
    int ns;
    for (ns = 0; gettoken() == '*'; ) /* count *'s */
        ns++;
    dirdcl();
    while (ns-- > 0)
        strcat(out, " pointer to");
}

/* dirdcl: parse a direct declarator */
void dirdcl(void)
{
    int type;
    if (tokentype == '(') {
        dcl();
        if (tokentype != ')')
            printf("error: missing )\n");
    } else if (tokentype == NAME) /* variable name */
        strcpy(name, token);
    else
        printf("error: expected name or (dcl)\n");
    while ((type=gettoken()) == PARENS || type == BRACKETS)
        if (type == PARENS)
            strcat(out, " function returning");
        else {
            strcat(out, " array");
            strcat(out, token);
            strcat(out, " of");
        }
}

ЗАРАНЕЕ СПАСИБО!


person Peter Cerba    schedule 16.08.2012    source источник
comment
[1] Указывает на первый элемент token array.   -  person dud3    schedule 31.10.2016


Ответы (1)


1) token существует, но это глобальная переменная, определенная как char token[MAXTOKEN];

2) strcpy() копирует завершающий байт 0 из источника, поэтому нам не нужно делать это вручную

3), которая, по-видимому, является обработкой специального случая для буквальной строки () - некоторые скобки без каких-либо промежуточных значений, в отличие от обработки случая, когда у нас есть ( some stuff )

4) в соответствии с (3) PARENS выглядит как тип токена для пустого набора круглых скобок, а возвращение ( и ) по отдельности, поскольку конкретные tokentypes имеют место, когда у нас есть что-то между ними

5) не уверен, что следую тому, о чем вы спрашиваете, но, поскольку, похоже, нет особого случая для закрывающей круглой скобки, похоже, что она берет последнюю ветвь else, возвращая tokentype = c

person twalberg    schedule 16.08.2012
comment
[1] [2] [3] [5] - Спасибо! Однако у меня все еще есть вопрос о функции [4] gettoken - она ​​возвращает int по объявлению, но в коде это, например. возвращает tokentype = '(' И ЭТО НЕ int. Как насчет этого? - person Peter Cerba; 17.08.2012
comment
C и C ++ будут автоматически преобразовывать char в int с эквивалентным значением в этой и ряде других ситуаций. - person twalberg; 17.08.2012
comment
@twalberg У меня тоже есть быстрый вопрос, какова цель out[0] = '\0'; в функции main()? - person dud3; 02.11.2016
comment
Кажется, он отлично работает и без него, сначала я подумал, может быть, нам нужно инициализировать первый символ out[1000] любым символьным литералом, но тогда почему \0, а не пробел? - person dud3; 02.11.2016
comment
@ dud3 Это устанавливает out как правильную пустую строку с завершающим NULL. - person twalberg; 02.11.2016