Как в цикле xlif(xml) найти конкретные идентификаторы, которые существуют
У меня есть файл xliff в следующем формате, который находится в s3
<xliff
xmlns="urn:oasis:names:tc:xliff:document:2.0" srcLang="" version="2.0">
<file original="page_4" >
<group id="chapter0">
<unit id="chapter00__title">
<segment>
<source>chapter 01</source>
</segment>
</unit>
<unit id="chapter0__introduction">
<segment>
<source />
</segment>
</unit>
<unit id="chapter0__text">
<segment>
<source>hello</source>
</segment>
</unit>
<unit id="uexercise0__answers[0].correct">
<segment>
<source>111</source>
</segment>
</unit>
Я получаю доступ к нему через
s3_object = s3.get_object(fileLink)
read_file = s3_object['Body'].read()
Я хочу перебирать идентификаторы и проверять, все ли требуемые идентификаторы доступны на xliff
У меня есть нижеприведенный цикл с идентификаторами, которые необходимы, этот цикл возвращает идентификаторы, которые мне нужно проверить на xlif файле
for x in listIds:
for attribute, value in x.idattributes:
print(attribute) # ex: attribute = chapter00__title
Мне нужно просмотреть мой xliff файл и проверить, все ли атрибуты доступны, если он обнаружит отсутствующий или новый атрибут, то бросить ошибку
пожалуйста, посоветуйте, как это сделать