XSLT: создание целочисленных идентификаторов и ссылка на них со строковыми ключами на входе

Мне нужно генерировать целочисленные идентификаторы для продуктов, а затем ссылаться на связанные продукты по этим целочисленным идентификаторам в выходных данных. На входе у меня есть строковые ключи, представляющие эту связь. Спасибо за помощь.

Вход:

<root>
  <products>
    <product>
      <!-- a unique string key of this node between the other product nodes -->
      <stringKey>AppleRef</stringKey>
      <Name>Apple</Name>
      <relatedProducts>
        <!-- a reference to product/StringKey of Orange -->
        <relatedProductStringKey>OrangeRef</relatedProductStringKey>
        <!-- other related products may follow -->
      </relatedProducts>
    </product>
    <product>
      <stringKey>OrangeRef</stringKey>
      <Name>Orange</Name>
      <relatedProducts>
        <relatedProductStringKey>AppleRef</relatedProductStringKey>
      </relatedProducts>
    </product>
  </products>
</root>

Ожидаемый результат:

<root>
  <products>
    <P>
      <ProductInfo>
        <!-- a unique integer ID of this node between the other ProductsInfo nodes -->
        <ProductID>0</ProductID>
        <ProductRef>AppleRef</ProductRef>
        <ProductName>Apple</ProductName>
      </ProductInfo>
      <R>
        <ProductRelatedInfo>

          <!-- a unique integer ID of this node between the other ProductRelatedInfo nodes -->
          <RelatedID>0</RelatedID>

          <!-- a reference to ProductInfo/ProductID of Orange -->
          <RelatedProductID>1</RelatedProductID>

        </ProductRelatedInfo>
        <!-- other related products may follow -->

      </R>
    </P>
    <P>
      <ProductInfo>
        <ProductID>1</ProductID>
        <ProductRef>OrangeRef</ProductRef>
        <ProductName>Orange</ProductName>
      </ProductInfo>
      <R>
        <ProductRelatedInfo>
          <RelatedID>1</RelatedID>
          <RelatedProductID>0</RelatedProductID>
        </ProductRelatedInfo>
      </R>
    </P>
  </products>
</root>

person Andrej Adamenko    schedule 12.09.2014    source источник
comment
Почему необходимо заменить уникальную строку уникальной числовой строкой (т.е. целым числом)?   -  person michael.hor257k    schedule 12.09.2014
comment
@ michael.hor257k, потому что выходной формат требуется внешнему приложению. Мне нужно преобразовать каталог товаров, экспортированных из одного приложения, в формат для импорта данных в другое приложение.   -  person Andrej Adamenko    schedule 12.09.2014


Ответы (2)


Это легко сделать с помощью ключа. Например, следующая таблица стилей:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:strip-space elements="*"/>

<xsl:key name="product" match="product" use="stringKey" />

<!-- identity transform -->
<xsl:template match="@*|node()">
    <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
</xsl:template>

<xsl:template match="stringKey">
    <ProductID><xsl:value-of select="count(../preceding-sibling::product)"/></ProductID>
    <ProductRef><xsl:value-of select="."/></ProductRef>
</xsl:template>

<xsl:template match="relatedProductStringKey">
    <RelatedProductID><xsl:value-of select="count(key('product', .)/preceding-sibling::product)"/></RelatedProductID>
</xsl:template>

</xsl:stylesheet>

при применении к вашему вводу вернет:

<?xml version="1.0" encoding="UTF-8"?>
<root>
   <products>
      <product>
         <ProductID>0</ProductID>
         <ProductRef>AppleRef</ProductRef>
         <Name>Apple</Name>
         <relatedProducts>
            <RelatedProductID>1</RelatedProductID>
         </relatedProducts>
      </product>
      <product>
         <ProductID>1</ProductID>
         <ProductRef>OrangeRef</ProductRef>
         <Name>Orange</Name>
         <relatedProducts>
            <RelatedProductID>0</RelatedProductID>
         </relatedProducts>
      </product>
   </products>
</root>

Если вы предпочитаете бессмысленный, хотя и не обязательно числовой идентификатор, вы можете предпочесть более простой:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:strip-space elements="*"/>

<xsl:key name="product" match="product" use="stringKey" />

<!-- identity transform -->
<xsl:template match="@*|node()">
    <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
    </xsl:copy>
</xsl:template>

<xsl:template match="stringKey">
    <ProductID><xsl:value-of select="generate-id(..)"/></ProductID>
    <ProductRef><xsl:value-of select="."/></ProductRef>
</xsl:template>

<xsl:template match="relatedProductStringKey">
    <RelatedProductID><xsl:value-of select="generate-id(key('product', .))"/></RelatedProductID>
</xsl:template>

</xsl:stylesheet>

Точный результат зависит от процессора, например Saxon может вернуть:

<?xml version="1.0" encoding="UTF-8"?>
<root>
   <products>
      <product>
         <ProductID>d0e3</ProductID>
         <ProductRef>AppleRef</ProductRef>
         <Name>Apple</Name>
         <relatedProducts>
            <RelatedProductID>d0e11</RelatedProductID>
         </relatedProducts>
      </product>
      <product>
         <ProductID>d0e11</ProductID>
         <ProductRef>OrangeRef</ProductRef>
         <Name>Orange</Name>
         <relatedProducts>
            <RelatedProductID>d0e3</RelatedProductID>
         </relatedProducts>
      </product>
   </products>
</root>

в то время как libxslt выдаст что-то вроде:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <products>
    <product>
      <ProductID>idp116928</ProductID>
      <ProductRef>AppleRef</ProductRef>
      <Name>Apple</Name>
      <relatedProducts>
        <RelatedProductID>idp1506944</RelatedProductID>
      </relatedProducts>
    </product>
    <product>
      <ProductID>idp1506944</ProductID>
      <ProductRef>OrangeRef</ProductRef>
      <Name>Orange</Name>
      <relatedProducts>
        <RelatedProductID>idp116928</RelatedProductID>
      </relatedProducts>
    </product>
  </products>

person michael.hor257k    schedule 12.09.2014

Чтобы получить целочисленные идентификаторы в XSLT, вы можете использовать положение узлов в документе, которое вы можете получить, подсчитав его предыдущие узлы.

Следующая таблица стилей даст желаемый результат:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">

    <xsl:output indent="yes"/>

    <xsl:template match="node() | @*">
        <xsl:copy>
            <xsl:apply-templates select="node() | @*"/>
        </xsl:copy>
    </xsl:template>

    <!-- match product node -->
    <xsl:template match="product">
        <P>
            <ProductInfo>
                <ProductID>
                    <!-- count preceding-sibling products -->
                    <xsl:value-of select="count(preceding-sibling::product)"/>
                </ProductID>
                <ProductRef>
                    <xsl:value-of select="stringKey"/>
                </ProductRef>
                <ProductName>
                    <xsl:value-of select="Name"/>
                </ProductName>
            </ProductInfo>
            <xsl:apply-templates select="relatedProducts"/>
        </P>
    </xsl:template>

    <xsl:template match="relatedProducts">
        <R>
            <xsl:for-each select="relatedProductStringKey">
                <!-- apply on product that has a matching stringkey -->
                <xsl:apply-templates select="/root/products/product[stringKey=current()]" mode="related">
                    <!-- 
                        RelatedID will be unique within each relatedProducts node, 
                        if you want this to be unique across the document use preceding:: instead 
                    -->
                    <xsl:with-param name="RelatedID" select="count(preceding-sibling::relatedProductStringKey)"/>
                </xsl:apply-templates>
            </xsl:for-each>
        </R>
    </xsl:template>

    <!-- match product node for related products -->
    <xsl:template match="product" mode="related">
        <xsl:param name="RelatedID"/>
        <ProductRelatedInfo>

            <!-- a unique integer ID of this node between the other ProductRelatedInfo nodes -->
            <RelatedID>
                <xsl:value-of select="$RelatedID"/>
            </RelatedID>

            <!-- a reference to ProductInfo/ProductID of Orange -->
            <RelatedProductID>
                <!-- count preceding-sibling products again -->
                <xsl:value-of select="count(preceding-sibling::product)"/>
            </RelatedProductID>

        </ProductRelatedInfo>
    </xsl:template>

</xsl:stylesheet>
person Tobias Klevenz    schedule 12.09.2014
comment
+1. Спасибо за помощь, @Tobias. Я применил решение michael.hor257k, потому что оно выглядело для меня более читаемым. Я новичок в XSLT, поэтому могу ошибаться. Я думаю, что ваше решение полезно для справки, я могу применить его позже для этой или подобной проблемы. Если вы или кто-то другой знает какие-либо преимущества этого решения по сравнению с тем, которое я выбрал, сообщите мне об этом. - person Andrej Adamenko; 12.09.2014