Вопросы по теме 'window-functions'
SQL Server: разница между PARTITION BY и GROUP BY
Я использую GROUP BY для всех типов агрегированных запросов на протяжении многих лет. Недавно я перепроектировал некоторый код, который использует PARTITION BY для выполнения агрегирования. При чтении всей документации, которую я могу найти о...
679816 просмотров
schedule
18.11.2021
Упорядочивайте целые группы результатов по наивысшему значению в каждой группе
Например, допустим, что у меня есть таблица в PostgreSQL (выше 9.0), заполненная данными:
row_id percent isrc
1 100 123iee43
2 100 1234wr32
3 98 123iee43
4 99 1234wr32
5...
952 просмотров
schedule
09.10.2021
Диапазон SQL между прошедшей датой и неограниченным предшествующим
Структура таблицы следующая
country_id | ID | date | same_week_count
Меня интересует номер недели, поэтому я извлекаю его из окончательного вывода.
Я хотел бы подсчитать, сколько раз идентификатор появлялся до этой недели в каждой стране,...
2033 просмотров
schedule
29.09.2021
Группировать по концу периода вместо даты начала
Я хочу агрегировать данные по дате окончания набора данных с некоторым начальным периодом, а не началом. Например, я хочу запросить таблицу и вернуть количество совпадающих результатов за 30 дней до даты окончания даты, указанной в результатах....
371 просмотров
schedule
13.11.2021
Рейтинг MYSQL на основе нескольких столбцов
Я пытаюсь создать запрос в mysql для присвоения номеров строк на основе нескольких столбцов. Ниже приведен формат, в котором мне нужны желаемые результаты.
CN PN GroupName WeekTimeReported rank desired_rank
X ProjX A...
930 просмотров
schedule
14.10.2021
Функция Apache Spark Window с вложенным столбцом
Я не уверен, что это ошибка (или просто неправильный синтаксис). Я искал вокруг и не видел, чтобы это упоминалось в другом месте, поэтому я спрашиваю здесь, прежде чем подавать отчет об ошибке.
Я пытаюсь использовать функцию окна, разделенную на...
1121 просмотров
schedule
05.10.2021
Доступ к текущему значению строки с помощью функции задержки
Я хочу вычислить разницу между предыдущим и текущим столбцом и сделать его новым столбцом с именем increase . Для этого я использую lag оконную функцию . Значение первого столбца не определено, поскольку предыдущего столбца не существует. Я...
1579 просмотров
schedule
19.11.2021
SQL Server - как мне вставить функцию RANK в строки, которые уже отсортированы в ранжированном порядке?
Так что, по-видимому, у меня все в порядке, по словам моего профессора, за исключением одного столбца, который показывает ранг столбцов, показанных в приведенном ниже коде. Я думаю, что, по сути, он просто должен показать номера строк слева в своем...
476 просмотров
schedule
21.09.2021
Функция окна PySpark: несколько условий в порядке от rangeBetween / rowsBetween
Можно ли создать функцию Window, которая может иметь несколько условий в orderBy для rangeBetween или rowsBetween . Предположим, у меня есть фрейм данных, как показано ниже.
user_id timestamp date event
0040b5f0...
2150 просмотров
schedule
15.10.2021
Возвращает только самое низкое значение после RANK ()
Я создал определенные «кейсы», используя:
RANK() OVER(ORDER BY name, A, B, some_value) as case_id
Теперь мне нужно создать ранги внутри каждого case_id, где name может появляться только один раз, а самый низкий ранг должен быть присвоен...
41 просмотров
schedule
13.10.2021
Redshift: найти предыдущие строки, которые удовлетворяют условию для создания последовательности
Я уже неделю пытаюсь найти решение следующей загадки Redshift (думаю, я стал одержим ею):
В Redshift есть таблица событий («event_user_item»), в которой пользователи запускают события для определенных элементов, вводя код элемента, который...
213 просмотров
schedule
09.11.2021
Как сгруппировать временные метки в острова (на основе произвольного разрыва)?
Рассмотрим этот список дат как timestamptz :
Я сгруппировал даты вручную, используя цвета: каждая группа отделяется от следующей промежутком не менее 2 минут.
Я пытаюсь измерить, сколько изучил данный пользователь, глядя на то, когда они...
315 просмотров
schedule
04.11.2021
Элегантный подход к получению первого значения из каждой группы без использования внешнего запроса
Я пытаюсь получить первое значение из каждой группы моих данных. Однако мне не нравится использовать предложение внешнего запроса / with. Не могли бы вы сообщить мне, как я могу написать это элегантно, не используя внешний запрос?
Я использовал...
68 просмотров
schedule
02.12.2021
PostgreSQL: группировка и фильтрация таблицы с условием отсутствия
В PostgreSQL у меня есть таблица, которая абстрактно выглядит так:
╔═══╦═══╦═══╦═══╗
║ A ║ B ║ C ║ D ║
╠═══╬═══╬═══╬═══╣
║ x ║ 0 ║ y ║ 0 ║
║ x ║ 0 ║ x ║ 1 ║
║ x ║ 1 ║ y ║ 0 ║
║ x ║ 1 ║ z ║ 1 ║
║ y ║ 0 ║ z ║ 0 ║
║ y ║ 0 ║ x ║ 0 ║
║ y ║ 1 ║ y ║ 0 ║...
50 просмотров
schedule
15.09.2021
PySpark: раздвижные окна для выборочных строк
У меня есть кадр данных, содержащий следующие 3 столбца: 1. ID 2. метка времени 3. IP_Address
Данные охватывают период с 2019–07 –01 по 20.09.2019. Я пытаюсь агрегировать количество IP_address за последние 60 дней , разделенных по идентификатору...
254 просмотров
schedule
06.12.2021
Подсчет нулевых значений между датами
Я пытаюсь вычислить количество нулевых значений между датами.
Моя таблица выглядит так:
transaction_date transaction_sale
10/1/2018 NULL
11/1/2018 33
12/1/2018 NULL
1/1/2019 NULL
2/1/2019...
414 просмотров
schedule
19.10.2021
Redshift - Оконная функция значений за последний час
У меня есть таблица со столбцами, похожими на: event_id , store_id , event_datetime .
Для каждого события я пытаюсь выяснить, сколько событий произошло в том же магазине за предыдущий час. Я знаю, что могу выполнить такой запрос:
SELECT...
305 просмотров
schedule
10.10.2021
Проблемы с получением номера остановки с ROW_NUMBER () OVER - DB2
Я пытаюсь сообщить о деятельности. У меня есть таблица, в которой указан «номер остановки», но этот номер не имеет ничего общего с фактической остановкой, на которой происходило действие (остановка 1 прибытие / отправление, остановка 2 прибытия /...
27 просмотров
schedule
26.10.2021
SQL Server 2012 - вычисление времени нахождения в состоянии на основе изменения состояния
Я пытаюсь вычислить, как долго машина находилась в определенном состоянии, а затем суммировать по часам. Состояние записывается только при изменении, поэтому мы можем предположить, что оно было в том же состоянии, пока не было изменено.
Я пытался...
64 просмотров
schedule
16.09.2021
Как я могу частично GROUP BY столбцы, выбирая значения на основе условия для других?
Есть ли способ сгруппировать данные по неделям, гарантируя, что для некоторых столбцов я получу значение, при котором RN = 1? У меня есть сотни столбцов в моих данных, и только некоторые должны быть там, где RN = 1; те, в названии которых есть MTD....
16 просмотров
schedule
26.10.2021