Python работи с XML файлове и модула ntTree, RTFM Linux, DevOps и системна администрация

В стандартната библиотека Python има две реализации на този модул - xml.etree.ElementTree и xml.etree.cElementTree .

xml.etree.ElementTree - изпълнение API да работя с XML файлове на чист Python, и xml.etree.cElementTree е същото, но в ° С, и осигурява значително увеличение на производителността при обработка на големи файлове.

Можете да ги импортирате по този начин:

IN Python версия 3.3 и по-нова, няма нужда от такъв опит/освен, защото тълкувателят ще търси независимо cElementTree при импортиране на ElementTree (и в Python 2.6 и 2.7 cElementTree се внася без проблем).

Анализиране на XML файл

Например, нека вземем един прост XML-файл със съдържание като това:

В резултат на това трябва да получим списък с наличните методи за обекта дърво:

В случай на грешка в синтаксиса XML - ще се появи грешка, посочваща точното местоположение:

Тогава файлът си струва да се провери XML-валидатор, например - тук >>> .

За да получите основния елемент, се използва методът getroot ():

Всеки елемент съдържа няколко параметъра:

  • tag - низ, представляващ типа данни, които елементът представлява;
  • attrib - атрибутите на елемента, които се съхраняват в речника Python;
  • text - текстовата стойност на елемента;
  • дъщерни елементи.