使用pythin解析pom.xml文件在较旧的python版本中不起作用

问题描述

让我从一个明显的事实开始,即我不是python开发人员-我主要用其他语言编写代码,因此,如果对此问题有“明显的”答案,请原谅。

我编写了一个非常简单的PomParser类,该类应该用作ElementTree的包装,并将从pom.xml文件中返回一些值作为字符串。下面的代码在Python 3.8中可以正常工作,但在Python> = 3 &&

import xml.etree.ElementTree as ET
import sys
from pathlib import Path


class PomParser:
    data = """<project xmlns="http://maven.apache.org/POM/4.0.0"
              xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
              xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
      <groupId>org.example</groupId>
      <scm><connection>scm:git:git://github.com</connection></scm>
    </project>
    """

    tree = None

    namespaces = {'': 'http://maven.apache.org/POM/4.0.0'}

    def __init__(self):
        self.tree = ET.fromstring(self.data)

    def getTree(self):
        return self.tree

    def getGroupId(self):
        return self.findTextByXpath("./groupId")

    def findTextByXpath(self,xpath: str):
        element = self.findByXpath(xpath)
        return element.text if element is not None else None

    def findByXpath(self,xpath: str):
        return self.tree.find(xpath,self.namespaces)

parser = PomParser()
print("Python: ",sys.version)
print("Without defining namespace: ",parser.findTextByXpath("./groupId"))
print("Explicitly defining namespace: ",parser.getTree().findtext("./{http://maven.apache.org/POM/4.0.0}groupId"))

如果通过使用Python 3.8的rept.it(example,运行此代码,它将打印:

Python:  3.8.3 (default,May 14 2020,20:11:43) 
[GCC 7.5.0]
Without defining namespace:  org.example
Explicitly defining namespace:  org.example

但是,如果您在https://www.onlinegdb.com/online_python_compiler中运行相同的代码(似乎正在使用Python 3.4),它将打印:

Python:  3.4.3 (default,Nov 12 2018,22:25:49)                                                                                                                                                                                                   
[GCC 4.8.4]                                                                                                                                                                                                                                       
Without defining namespace:  None                                                                                                                                                                                                                 
Explicitly defining namespace:  org.example   

我之所以使用onlinegdb仅仅是因为它重现了我在Netlify中使用相同代码的问题,最新版本是Python 3.7(实际上是我要添加支持的目标版本)

我想知道我在这里想念什么吗? 我真的需要在xpath过滤器内显式定义名称空间吗? 如果是这种情况,那么什么也不做就能够将namespaces定义为参数的目的是什么?

解决方法

这与Python 3.8中的更改有关。在该版本中,名称空间映射中可以使用空字符串作为前缀。在早期版本中不起作用。

如果您更改

namespaces = {'': 'http://maven.apache.org/POM/4.0.0'}

namespaces = {'p': 'http://maven.apache.org/POM/4.0.0'}

并更改

./groupId

./p:groupId

它应可在所有版本的Python 3中使用。