SQL-запрос для объединения значений столбцов из нескольких строк в Oracle

Можно ли построить SQL для объединения значений столбцов из нескольких строк?

Ниже приведен пример:

Таблица А

PID
A
B
C

Таблица B

PID   SEQ    Desc

A     1      Have
A     2      a nice
A     3      day.
B     1      Nice Work.
C     1      Yes
C     2      we can 
C     3      do 
C     4      this work!

Вывод SQL должен быть -

PID   Desc
A     Have a nice day.
B     Nice Work.
C     Yes we can do this work!

Итак, в основном столбец Desc для выходной таблицы представляет собой объединение значений SEQ из таблицы B?

Любая помощь с SQL?


person jagamot    schedule 13.01.2011    source источник
comment
См., Например: halisway.blogspot.com/2006/08/   -  person Andomar    schedule 14.01.2011
comment
Ознакомьтесь с этим решением. Вам будет полезно.   -  person Jineesh Uvantavida    schedule 06.07.2017


Ответы (10)


Есть несколько способов в зависимости от того, какая у вас версия - см. документацию Oracle по агрегированию строк. техники. Очень часто используется LISTAGG:

SELECT pid, LISTAGG(Desc, ' ') WITHIN GROUP (ORDER BY seq) AS description
FROM B GROUP BY pid;

Затем присоединяйтесь к A, чтобы выбрать pids, который вам нужен.

Примечание. По умолчанию LISTAGG правильно работает только с VARCHAR2 столбцами.

person Lou Franco    schedule 13.01.2011
comment
использование wm_concat () для Oracle 10g объединяет текст в порядке возрастания порядкового номера, разделенного запятыми, можем ли мы сделать разделение по убыванию чем-то еще? - person jagamot; 08.03.2011

Также есть функция XMLAGG, которая работает в версиях до 11.2. Поскольку WM_CONCAT недокументирован и не поддерживается Oracle, рекомендуется не использовать его в производственной системе.

С XMLAGG вы можете делать следующее:

SELECT XMLAGG(XMLELEMENT(E,ename||',')).EXTRACT('//text()') "Result" 
FROM employee_names

Что это значит

  • поместите значения столбца ename (объединенного запятой) из таблицы employee_names в элемент xml (с тегом E)
  • извлеките текст этого
  • агрегировать xml (объединить его)
  • получившийся столбец назовем "Результат"
person Peter    schedule 31.05.2013
comment
XMLAGG работает с Oracle 12.2. Более того, XLMAGG позволяет объединять очень длинные строки, которые LISTAGG не может из-за их конечной длины. - person Marco; 01.09.2019

С предложением модели SQL:

SQL> select pid
  2       , ltrim(sentence) sentence
  3    from ( select pid
  4                , seq
  5                , sentence
  6             from b
  7            model
  8                  partition by (pid)
  9                  dimension by (seq)
 10                  measures (descr,cast(null as varchar2(100)) as sentence)
 11                  ( sentence[any] order by seq desc
 12                    = descr[cv()] || ' ' || sentence[cv()+1]
 13                  )
 14         )
 15   where seq = 1
 16  /

P SENTENCE
- ---------------------------------------------------------------------------
A Have a nice day
B Nice Work.
C Yes we can do this work!

3 rows selected.

Я писал об этом здесь. И если вы перейдете по ссылке на OTN-поток, вы найдете еще кое-что, в том числе сравнение производительности.

person Rob van Wijk    schedule 14.01.2011

Аналитическая функция LISTAGG была представлена ​​в Oracle 11g Release 2, что упрощает агрегирование строк. Если вы используете 11g Release 2, вам следует использовать эту функцию для агрегирования строк. Пожалуйста, обратитесь к URL-адресу ниже для получения дополнительной информации о конкатенации строк.

http://www.oracle-base.com/articles/misc/StringAggregationTechniques.php

Конкатенация строк

person Ashish J    schedule 01.03.2012

Как следует из большинства ответов, очевидным вариантом является LISTAGG. Однако один неприятный аспект с LISTAGG заключается в том, что если общая длина объединенной строки превышает 4000 символов (ограничение для VARCHAR2 в SQL), возникает следующая ошибка, с которой трудно справиться в версиях Oracle до 12.1

ORA-01489: результат конкатенации строк слишком длинный

Новой функцией, добавленной в 12cR2, является пункт ON OVERFLOW в LISTAGG. Запрос, включающий это предложение, будет выглядеть так:

SELECT pid, LISTAGG(Desc, ' ' on overflow truncate) WITHIN GROUP (ORDER BY seq) AS desc
FROM B GROUP BY pid;

Вышеупомянутое ограничит вывод до 4000 символов, но не вызовет ошибку ORA-01489.

Вот некоторые из дополнительных параметров предложения ON OVERFLOW:

  • ON OVERFLOW TRUNCATE 'Contd..': в конце строки будет отображаться 'Contd..' (по умолчанию ...)
  • ON OVERFLOW TRUNCATE '': это отобразит 4000 символов без какой-либо завершающей строки.
  • ON OVERFLOW TRUNCATE WITH COUNT: это отобразит общее количество символов в конце после завершающих символов. Например: - '...(5512)'
  • ON OVERFLOW ERROR: если вы ожидаете, что LISTAGG завершится с ошибкой ORA-01489 (в любом случае это значение по умолчанию).
person Kaushik Nayak    schedule 05.02.2018

Тем, кто должен решить эту проблему с помощью Oracle 9i (или более ранней версии), вам, вероятно, потребуется использовать SYS_CONNECT_BY_PATH, поскольку LISTAGG недоступен.

Чтобы ответить на OP, следующий запрос отобразит PID из таблицы A и объединит все столбцы DESC из таблицы B:

SELECT pid, SUBSTR (MAX (SYS_CONNECT_BY_PATH (description, ', ')), 3) all_descriptions
FROM (
       SELECT ROW_NUMBER () OVER (PARTITION BY pid ORDER BY pid, seq) rnum, pid, description
       FROM (
              SELECT a.pid, seq, description
              FROM table_a a, table_b b
              WHERE a.pid = b.pid(+)
             )
      )
START WITH rnum = 1
CONNECT BY PRIOR rnum = rnum - 1 AND PRIOR pid = pid
GROUP BY pid
ORDER BY pid;

Также могут быть случаи, когда все ключи и значения содержатся в одной таблице. Следующий запрос можно использовать там, где нет таблицы A, а существует только таблица B:

SELECT pid, SUBSTR (MAX (SYS_CONNECT_BY_PATH (description, ', ')), 3) all_descriptions
FROM (
       SELECT ROW_NUMBER () OVER (PARTITION BY pid ORDER BY pid, seq) rnum, pid, description
       FROM (
              SELECT pid, seq, description
              FROM table_b
             )
      )
START WITH rnum = 1
CONNECT BY PRIOR rnum = rnum - 1 AND PRIOR pid = pid
GROUP BY pid
ORDER BY pid;

Все значения могут быть переупорядочены по желанию. Отдельные конкатенированные описания могут быть переупорядочены в предложении PARTITION BY, а список PID может быть переупорядочен в последнем предложении ORDER BY.


В качестве альтернативы: могут быть случаи, когда вы хотите объединить все значения из всей таблицы в одну строку.

Ключевой идеей здесь является использование искусственного значения для объединяемой группы описаний.

В следующем запросе используется постоянная строка '1', но подойдет любое значение:

SELECT SUBSTR (MAX (SYS_CONNECT_BY_PATH (description, ', ')), 3) all_descriptions
FROM (
       SELECT ROW_NUMBER () OVER (PARTITION BY unique_id ORDER BY pid, seq) rnum, description
       FROM (
              SELECT '1' unique_id, b.pid, b.seq, b.description
              FROM table_b b
             )
      )
START WITH rnum = 1
CONNECT BY PRIOR rnum = rnum - 1;

Порядок отдельных конкатенированных описаний можно изменить в предложении PARTITION BY.

В нескольких других ответах на этой странице также упоминается эта чрезвычайно полезная ссылка: https://oracle-base.com/articles/misc/string-aggregation-techniques

person JonathanDavidArndt    schedule 01.02.2017

  1. LISTAGG обеспечивает лучшую производительность, если сортировка является обязательной (00: 00: 05.85)

    SELECT pid, LISTAGG(Desc, ' ') WITHIN GROUP (ORDER BY seq) AS description FROM B GROUP BY pid;

  2. COLLECT обеспечивает лучшую производительность, если сортировка не требуется (00: 00: 02.90):

    SELECT pid, TO_STRING(CAST(COLLECT(Desc) AS varchar2_ntt)) AS Vals FROM B GROUP BY pid;

  3. COLLECT с упорядочиванием немного медленнее (00: 00: 07.08):

    SELECT pid, TO_STRING(CAST(COLLECT(Desc ORDER BY Desc) AS varchar2_ntt)) AS Vals FROM B GROUP BY pid;

Все остальные методы были медленнее.

person Misho    schedule 12.02.2015
comment
Было бы полезно уточнить ваш ответ. - person Jon Surrell; 12.02.2015
comment
Джон, я не хотел повторять из статьи, но вкратце вот результаты: 1. LISTAGG обеспечивает лучшую производительность, если сортировка является обязательной (00: 00: 05.85) 2. COLLECT обеспечивает лучшую производительность, если сортировка не выполняется необходимо (00: 00: 02.90): SELECT pid, TO_STRING (CAST (COLLECT (Desc) AS varchar2_ntt)) AS Vals FROM B GROUP BY pid; 3. COLLECT с упорядочиванием немного медленнее (00: 00: 07.08): SELECT pid, TO_STRING (CAST (COLLECT (Desc ORDER BY Desc) AS varchar2_ntt)) AS Vals FROM B GROUP BY pid; Все остальные методы были медленнее. - person Misho; 19.05.2015
comment
Вы можете просто отредактировать свой ответ, включив в него релевантную информацию. - person Jon Surrell; 19.05.2015
comment
Я слишком поздно редактировал и поэтому добавил его снова. Извините, я новичок здесь и только начинаю понимать это. - person Misho; 19.05.2015

Прежде чем запускать запрос на выборку, запустите это:

SET SERVEROUT ON SIZE 6000

SELECT XMLAGG(XMLELEMENT(E,SUPLR_SUPLR_ID||',')).EXTRACT('//text()') "SUPPLIER" 
FROM SUPPLIERS;
person user2865810    schedule 10.10.2013

Попробуйте этот код:

 SELECT XMLAGG(XMLELEMENT(E,fieldname||',')).EXTRACT('//text()') "FieldNames"
    FROM FIELD_MASTER
    WHERE FIELD_ID > 10 AND FIELD_AREA != 'NEBRASKA';
person Krishnakumar MD Amain Infotech    schedule 19.11.2014

В выбранном месте, где вы хотите выполнить конкатенацию, вызовите функцию SQL.

Например:

select PID, dbo.MyConcat(PID)
   from TableA;

Затем для функции SQL:

Function MyConcat(@PID varchar(10))
returns varchar(1000)
as
begin

declare @x varchar(1000);

select @x = isnull(@x +',', @x, @x +',') + Desc
  from TableB
    where PID = @PID;

return @x;

end

Синтаксис заголовка функции может быть неправильным, но принцип работает.

person user5473005    schedule 21.10.2015
comment
Это недопустимо для Oracle - person a_horse_with_no_name; 11.11.2016