ClickHouse array - найти самую длинную цепочку повторяющихся чисел в массиве

В Clickhouse у меня есть столбец с массивом элементов Int16. Я ищу способ найти самую длинную цепочку повторения числа 1. Например, в массиве [0,1,1,1,5,1,1,1,1,1,2] самая длинная цепочка повторения 1 это 5 элементов. Есть ли способ сделать это с помощью существующих функций?


person nebotopo    schedule 22.10.2019    source источник
comment
Возможный дубликат выше неверен. Ссылка предназначена для вхождений в Javascript. OP задает вопрос в Clickhouse.   -  person Ioannis Barakos    schedule 22.10.2019


Ответы (1)


Попробуйте этот запрос:

SELECT
    /* The source number. */
    data.1 AS number,
    /* The source array. */
    data.2 AS array,
    /* Number the values ​​in each chain. */
    arrayCumSumNonNegative((x, index) -> x = number ? 1 : -index, array, arrayEnumerate(array)) AS partiallySumArray,
    arrayReduce('max', partiallySumArray) AS result
FROM
(
    /* test data set */
    SELECT arrayJoin([
      /**/
      (1, []), 
      (1, [0, 2, 2, 2, 5]), 
      (1, [0, 1, 1, 1, 5, 1, 1, 1, 1, 1,2]), 
      (1, [1, 1, 1, 2, 3, 4, 5, 1, 1]), 
      (1, [-5, 100, 1, 1, 0, 1, 1, 1]),
      (1, [1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0]),
      /**/
      (5, []), 
      (5, [0, 2, 2, 2, 55]),       
      (5, [5, 5, 10, 300, 5, 77, 5])
      ]) AS data
)
FORMAT Vertical

/* Result:

Row 1:
──────
number:            1
array:             []
partiallySumArray: []
result:            0

Row 2:
──────
number:            1
array:             [0,2,2,2,5]
partiallySumArray: [0,0,0,0,0]
result:            0

Row 3:
──────
number:            1
array:             [0,1,1,1,5,1,1,1,1,1,2]
partiallySumArray: [0,1,2,3,0,1,2,3,4,5,0]
result:            5

Row 4:
──────
number:            1
array:             [1,1,1,2,3,4,5,1,1]
partiallySumArray: [1,2,3,0,0,0,0,1,2]
result:            3

Row 5:
──────
number:            1
array:             [-5,100,1,1,0,1,1,1]
partiallySumArray: [0,0,1,2,0,1,2,3]
result:            3

Row 6:
──────
number:            1
array:             [1,1,0,1,1,1,1,1,1,0,0]
partiallySumArray: [1,2,0,1,2,3,4,5,6,0,0]
result:            6

Row 7:
──────
number:            5
array:             []
partiallySumArray: []
result:            0

Row 8:
──────
number:            5
array:             [0,2,2,2,55]
partiallySumArray: [0,0,0,0,0]
result:            0

Row 9:
───────
number:            5
array:             [5,5,10,300,5,77,5]
partiallySumArray: [1,2,0,0,1,0,1]
result:            2
*/
person vladimir    schedule 22.10.2019
comment
Рад помочь вам;) - person vladimir; 22.10.2019