Вопросы по теме 'window-functions'

SQL Server: разница между PARTITION BY и GROUP BY
Я использую GROUP BY для всех типов агрегированных запросов на протяжении многих лет. Недавно я перепроектировал некоторый код, который использует PARTITION BY для выполнения агрегирования. При чтении всей документации, которую я могу найти о...
679816 просмотров

Упорядочивайте целые группы результатов по наивысшему значению в каждой группе
Например, допустим, что у меня есть таблица в PostgreSQL (выше 9.0), заполненная данными: row_id percent isrc 1 100 123iee43 2 100 1234wr32 3 98 123iee43 4 99 1234wr32 5...
952 просмотров

Диапазон SQL между прошедшей датой и неограниченным предшествующим
Структура таблицы следующая country_id | ID | date | same_week_count Меня интересует номер недели, поэтому я извлекаю его из окончательного вывода. Я хотел бы подсчитать, сколько раз идентификатор появлялся до этой недели в каждой стране,...
2033 просмотров
schedule 29.09.2021

Группировать по концу периода вместо даты начала
Я хочу агрегировать данные по дате окончания набора данных с некоторым начальным периодом, а не началом. Например, я хочу запросить таблицу и вернуть количество совпадающих результатов за 30 дней до даты окончания даты, указанной в результатах....
371 просмотров

Рейтинг MYSQL на основе нескольких столбцов
Я пытаюсь создать запрос в mysql для присвоения номеров строк на основе нескольких столбцов. Ниже приведен формат, в котором мне нужны желаемые результаты. CN PN GroupName WeekTimeReported rank desired_rank X ProjX A...
930 просмотров
schedule 14.10.2021

Функция Apache Spark Window с вложенным столбцом
Я не уверен, что это ошибка (или просто неправильный синтаксис). Я искал вокруг и не видел, чтобы это упоминалось в другом месте, поэтому я спрашиваю здесь, прежде чем подавать отчет об ошибке. Я пытаюсь использовать функцию окна, разделенную на...
1121 просмотров

Доступ к текущему значению строки с помощью функции задержки
Я хочу вычислить разницу между предыдущим и текущим столбцом и сделать его новым столбцом с именем increase . Для этого я использую lag оконную функцию . Значение первого столбца не определено, поскольку предыдущего столбца не существует. Я...
1579 просмотров
schedule 19.11.2021

SQL Server - как мне вставить функцию RANK в строки, которые уже отсортированы в ранжированном порядке?
Так что, по-видимому, у меня все в порядке, по словам моего профессора, за исключением одного столбца, который показывает ранг столбцов, показанных в приведенном ниже коде. Я думаю, что, по сути, он просто должен показать номера строк слева в своем...
476 просмотров

Функция окна PySpark: несколько условий в порядке от rangeBetween / rowsBetween
Можно ли создать функцию Window, которая может иметь несколько условий в orderBy для rangeBetween или rowsBetween . Предположим, у меня есть фрейм данных, как показано ниже. user_id timestamp date event 0040b5f0...
2150 просмотров

Возвращает только самое низкое значение после RANK ()
Я создал определенные «кейсы», используя: RANK() OVER(ORDER BY name, A, B, some_value) as case_id Теперь мне нужно создать ранги внутри каждого case_id, где name может появляться только один раз, а самый низкий ранг должен быть присвоен...
41 просмотров
schedule 13.10.2021

Redshift: найти предыдущие строки, которые удовлетворяют условию для создания последовательности
Я уже неделю пытаюсь найти решение следующей загадки Redshift (думаю, я стал одержим ею): В Redshift есть таблица событий («event_user_item»), в которой пользователи запускают события для определенных элементов, вводя код элемента, который...
213 просмотров
schedule 09.11.2021

Как сгруппировать временные метки в острова (на основе произвольного разрыва)?
Рассмотрим этот список дат как timestamptz : Я сгруппировал даты вручную, используя цвета: каждая группа отделяется от следующей промежутком не менее 2 минут. Я пытаюсь измерить, сколько изучил данный пользователь, глядя на то, когда они...
315 просмотров

Элегантный подход к получению первого значения из каждой группы без использования внешнего запроса
Я пытаюсь получить первое значение из каждой группы моих данных. Однако мне не нравится использовать предложение внешнего запроса / with. Не могли бы вы сообщить мне, как я могу написать это элегантно, не используя внешний запрос? Я использовал...
68 просмотров

PostgreSQL: группировка и фильтрация таблицы с условием отсутствия
В PostgreSQL у меня есть таблица, которая абстрактно выглядит так: ╔═══╦═══╦═══╦═══╗ ║ A ║ B ║ C ║ D ║ ╠═══╬═══╬═══╬═══╣ ║ x ║ 0 ║ y ║ 0 ║ ║ x ║ 0 ║ x ║ 1 ║ ║ x ║ 1 ║ y ║ 0 ║ ║ x ║ 1 ║ z ║ 1 ║ ║ y ║ 0 ║ z ║ 0 ║ ║ y ║ 0 ║ x ║ 0 ║ ║ y ║ 1 ║ y ║ 0 ║...
50 просмотров

PySpark: раздвижные окна для выборочных строк
У меня есть кадр данных, содержащий следующие 3 столбца: 1. ID 2. метка времени 3. IP_Address Данные охватывают период с 2019–07 –01 по 20.09.2019. Я пытаюсь агрегировать количество IP_address за последние 60 дней , разделенных по идентификатору...
254 просмотров

Подсчет нулевых значений между датами
Я пытаюсь вычислить количество нулевых значений между датами. Моя таблица выглядит так: transaction_date transaction_sale 10/1/2018 NULL 11/1/2018 33 12/1/2018 NULL 1/1/2019 NULL 2/1/2019...
414 просмотров

Redshift - Оконная функция значений за последний час
У меня есть таблица со столбцами, похожими на: event_id , store_id , event_datetime . Для каждого события я пытаюсь выяснить, сколько событий произошло в том же магазине за предыдущий час. Я знаю, что могу выполнить такой запрос: SELECT...
305 просмотров

Проблемы с получением номера остановки с ROW_NUMBER () OVER - DB2
Я пытаюсь сообщить о деятельности. У меня есть таблица, в которой указан «номер остановки», но этот номер не имеет ничего общего с фактической остановкой, на которой происходило действие (остановка 1 прибытие / отправление, остановка 2 прибытия /...
27 просмотров
schedule 26.10.2021

SQL Server 2012 - вычисление времени нахождения в состоянии на основе изменения состояния
Я пытаюсь вычислить, как долго машина находилась в определенном состоянии, а затем суммировать по часам. Состояние записывается только при изменении, поэтому мы можем предположить, что оно было в том же состоянии, пока не было изменено. Я пытался...
64 просмотров

Как я могу частично GROUP BY столбцы, выбирая значения на основе условия для других?
Есть ли способ сгруппировать данные по неделям, гарантируя, что для некоторых столбцов я получу значение, при котором RN = 1? У меня есть сотни столбцов в моих данных, и только некоторые должны быть там, где RN = 1; те, в названии которых есть MTD....
16 просмотров
schedule 26.10.2021