Рассчитать изменение цены (за последние 2 минуты) и ценовой диапазон (до 2 минут)

У меня есть кадр данных, как указано ниже:

row_no,last_price,time
01,110.50,10:09
02,111.60,10:09
03,111.50,10:09
04,112.00,10:09
05,112.00,10:10
06,112.60,10:10
07,112.50,10:10
08,113.10,10:10
09,114.30,10:11
10,114.50,10:11
11,115.70,10:11
12,116.50,10:12
13,116.30,10:12
14,116.20,10:12
15,116.50,10:13
16,117.80,10:13
17,117.90,10:13
18,117.50,10:14
19,118.70,10:14
20,118.90,10:14
21,118.30,10:14
22,118.50,10:15
23,119.60,10:15
24,119.50,10:15
25,119.80,10:15

Столбец Row_No добавлен для понимания.

Пример для последней строки = 25: значения должны быть рассчитаны, как показано ниже:

  1. Необходимо рассчитать «Price_Change_in_last_2mins» в новом столбце, т.е. (строка 25 last_price - строка 15 last_price) * 100/ (строка 15 last_price)
  2. Необходимо рассчитать «Price_Range_before_2mins» (период 2 минуты) в новом столбце, т.е. (максимальное значение last_price от строки 05 до строки 14) - (минимальное значение last_price от строки 05 до строки 14) * 100/ (минимальное значение last_price из строки 05 до строки 14)

Я хочу, чтобы результат выглядел так:

row_no,last_price,time,Price_Change_in_last_2mins,Price_Range_before_2mins
01,110.50,10:09,NaN,NaN
02,111.60,10:09,NaN,NaN
03,111.50,10:09,NaN,NaN
04,112.00,10:09,NaN,NaN
05,112.00,10:10,NaN,NaN
06,112.60,10:10,NaN,NaN
07,112.50,10:10,NaN,NaN
08,113.10,10:10,NaN,NaN
09,114.30,10:11,NaN,NaN
10,114.50,10:11,NaN,NaN
11,115.70,10:11,NaN,NaN
12,116.50,10:12,NaN,NaN
13,116.30,10:12,NaN,NaN
14,116.20,10:12,NaN,NaN
15,116.50,10:13,NaN,NaN
16,117.80,10:13,NaN,NaN
17,117.90,10:13,,NaN,NaN
18,117.50,10:14,0.85,4.49
19,118.70,10:14,1.88,4.49
20,118.90,10:14,2.06,4.49
21,118.30,10:14,1.55,4.49
22,118.50,10:15,1.72,3.86
23,119.60,10:15,2.66,3.86
24,119.50,10:15,2.57,3.86
25,119.80,10:15,2.83,3.86

person Pravat    schedule 23.11.2018    source источник
comment
Вы пробовали решить их самостоятельно? Можете ли вы поделиться с нами некоторыми попытками ее решения?   -  person yatu    schedule 23.11.2018
comment
Я думаю, это поможет вам stackoverflow.com/questions/12376863/ используйте a.apply (команда)   -  person Jony Kim    schedule 23.11.2018
comment
Сэр, я новичок в python и не могу обрабатывать данные с расчетом разницы во времени.   -  person Pravat    schedule 23.11.2018
comment
Я понимаю, что вы имеете ввиду. Возможно, вы захотите указать, что пример строк 15 и 25, который вы предоставляете, является расчетом для строки 25...   -  person yatu    schedule 23.11.2018
comment
@Pravat, как получить 0,03 в строке 24?   -  person yatu    schedule 23.11.2018
comment
Сэр, это рассчитывается как (строка 24 last_price - строка 15 last_price)*100/(строка 15 last_price) = 0,0258 (округлить до 2 цифр)   -  person Pravat    schedule 23.11.2018
comment
Если не ошибаюсь, это (119,50-116,50)*100/116,5 = 2,575.   -  person yatu    schedule 23.11.2018
comment
Похоже, вы забываете умножить на 100 в некоторых случаях   -  person yatu    schedule 23.11.2018
comment
Виноват. Опечатка. Я исправил значения.   -  person Pravat    schedule 23.11.2018
comment
@Pravat, а про Price_Range_before_2mins? Не будет ли это для строки 25 (119,80-116,50)*100/116,5=2,83? Поскольку 116,5 является минимальным значением этого 2-минутного интервала?   -  person yatu    schedule 23.11.2018


Ответы (1)


Вот как это сделать:

def last_2mins(x, df):
    from_time = x.name - datetime.timedelta(minutes=2)
    slice_2min = df.loc[from_time:x.name,:]
    first = slice_2min.iloc[0].last_price
    return (x.last_price - first)*100/first

def before_2mins(x, df):
    from_time = x.name - datetime.timedelta(minutes=2)
    slice_2min = df.loc[from_time:x.name,:]
    max_val = slice_2min.last_price.max()
    min_val = slice_2min.last_price.min()
    return (max_val - min_val)*100/min_val

df = df.set_index(df.time).drop(['time'], axis = 1)
indices = df.loc[df.index.max() - datetime.timedelta(minutes=1):].index.unique()

df_ = df.reset_index()
df_.loc[df_.time.isin(indices), 'last_2mins  '] = \
        df.loc[indices].apply(lambda x: last_2mins(x, df), axis = 1).values
df_.loc[df_.time.isin(indices), 'before_2mins'] = \
        df.loc[indices].apply(lambda x: before_2mins(x, df), axis = 1).values

        time               last_price  last_2mins  before_2mins
0  2018-11-23 10:09:00       110.5         NaN           NaN
1  2018-11-23 10:09:00       111.6         NaN           NaN
2  2018-11-23 10:09:00       111.5         NaN           NaN
3  2018-11-23 10:09:00       112.0         NaN           NaN
4  2018-11-23 10:10:00       112.0         NaN           NaN
5  2018-11-23 10:10:00       112.6         NaN           NaN
6  2018-11-23 10:10:00       112.5         NaN           NaN
7  2018-11-23 10:10:00       113.1         NaN           NaN
8  2018-11-23 10:11:00       114.3         NaN           NaN
9  2018-11-23 10:11:00       114.5         NaN           NaN
10 2018-11-23 10:11:00       115.7         NaN           NaN
11 2018-11-23 10:12:00       116.5         NaN           NaN
12 2018-11-23 10:12:00       116.3         NaN           NaN
13 2018-11-23 10:12:00       116.2         NaN           NaN
14 2018-11-23 10:13:00       116.5         NaN           NaN
15 2018-11-23 10:13:00       117.8         NaN           NaN
16 2018-11-23 10:13:00       117.9         NaN           NaN
17 2018-11-23 10:14:00       117.5    0.858369      2.323580
18 2018-11-23 10:14:00       118.7    1.888412      2.323580
19 2018-11-23 10:14:00       118.9    2.060086      2.323580
20 2018-11-23 10:14:00       118.3    1.545064      2.323580
21 2018-11-23 10:15:00       118.5    1.716738      2.832618
22 2018-11-23 10:15:00       119.6    2.660944      2.832618
23 2018-11-23 10:15:00       119.5    2.575107      2.832618
24 2018-11-23 10:15:00       119.8    2.832618      2.832618

Я посвящу некоторое время позже, чтобы добавить комментарии. Дайте мне знать, если вы уверены в своем содержании в Price_Range_before_2mins. А пока надеюсь, что это поможет.

person yatu    schedule 23.11.2018
comment
Спасибо за код. Да, мне нужен процентный диапазон цены до 2 минут в течение 2 минут в соответствии с вопросом, т.е. (максимальное значение last_price от строки 05 до строки 14) - (минимальное значение last_price от строки 05 до строки 14) * 100/ (минимальное значение last_price от строки 05 до строки 14) - person Pravat; 23.11.2018
comment
Только что понял, что изменилось имя переменной, которое не обновлялось. Отредактирую позже - person yatu; 23.11.2018
comment
Сэр, в last_2mins функция сначала получает ошибку - Not Defined - person Pravat; 23.11.2018
comment
Да, это то, о чем я упоминал, исправлю, как только смогу использовать свой ноутбук. - person yatu; 23.11.2018
comment
Хорошо, @Pravat теперь должен быть в порядке. Посмотрите, можете ли вы настроить функцию before_2minsесли она не делает то, что вы хотите, так как я не совсем понял, о чем вы просили - person yatu; 23.11.2018
comment
Пожалуйста, @Pravat отметьте это как правильное, чтобы я знал, что это помогло вам. - person yatu; 23.11.2018