Home
Über mich
Veröffentlichungen

XML XML-Schema XPath XSL-T XSL-FO XQuery XProc SVG

XML / XML-Datenstrukturen / XML: Schwach strukturierte Dokumente

XML: Schwach strukturierte Dokumente

XML: Schwach strukturierte Dokumente

➪ Schwach strukturierte XML-Dokumente sind zwar wohlgeformt, weisen in der Regel aber nur eine sehr geringe interne Struktur auf.

Siehe auch unparsed-text.


<?xml version="1.0" encoding="iso-8859-1"?>
<root>Die enorme Gestaltungsflexibilität 
zwingt zu systematischer Strukturierung, 
damit die XML-Dokumente systematisch 
ausgewertet werden können.</root>

Abgesehen vom XML-Prolog und dem "<root>"-Element, ist das vorstehende XML-Dokument zwar wohlgeformt, aber im Übrigen unstrukturiert. Das wird auch nicht besser, wenn einige Tausend Sätze hinzukommen, die ebenfalls keine strukturierenden Elemente beinhalten. Es bleibt unserer Fantasie oder unserer Bereitschaft zur Spekulation überlassen, hier eine klare Struktur erraten zu wollen, die sich systematisch auswerten ließe. Gerade der völlige Mangel an systematischer Strukturierung zeigt, wie eingeschränkt die anschließende Auswertbarkeit ist.

Eine schwache Strukturierung kann beispielsweise entstehen, wenn einzelne Textteile hervorgehoben werden, etwa durch "... damit die <hervorheben>XML</hervorheben>-Dokumente systematisch ...". Dann haben Sie es mit einer gemischten Abfolge aus Textinhalt und Formatierungsanweisungen zu tun, deren Abfolge kaum vorhersehbar ist und die eine hohe Flexibilität bei der Programmierung erfordert.

Das wiederum lässt vermuten, dass Sie in diesem Umfeld mit der Anwendung von xsl:for-each Mühe haben könnten. Sinnvoller scheint die Arbeit mit xsl:template match bzw. xsl:apply-templates, die eine Aufsplittung der Programmierlogik in mehrere Templates mit sich bringt.

Solange der Überblick über die ggf. sehr zahlreichen (Hunderte, Tausende) Templates gewährleistet ist (optimal durch eine effiziente Koordination der Teamarbeit), sind keine Probleme für die flexible Anpassung der Programmlogik zu erwarten. Eine weniger qualitätsbewusste Teamarbeit birgt jedoch Gefahren der Unübersichtlichkeit und hoher Wartungskosten.

Noch deutlicher wird die Problematik schwacher Strukturierungen, wenn die Dokumente nicht im XML-Sinn wohlgeformt sind. Beispiel:


'ABC'; 18; 38; 57;
[{"name":"Kolos","vorname":"Karl"},
{"name":"Lustlos","vorname":"Ludwig"},
{"name":"Muehelos","vorname":"Martin"},
{"name":"Leinenlos","vorname":"Liane"}];
63; 76; 
<Leute>
<Mensch>Lotte Rielos</Mensch>
<Mensch>Konrad Kraftlos</Mensch>
</Leute>;
95

Mithilfe von unparsed-text, tokenize und sum lässt sich das aber auch lösen. Das Beispiel hierfür finden Sie in => unter der Überschrift Auswertung nicht XML-wohlgeformter Textdateien.

wg / 3. April 2020



Fragen? Anmerkungen? Tipps?

Bitte nehmen Sie Kontakt zu mir auf.






Vielen Dank für Ihr Interesse an meiner Arbeit.



V.i.S.d.P.: Wilfried Grupe * Klus 6 * 37643 Negenborn

☎ 0151. 750 360 61 * eMail: info10@wilfried-grupe.de

www.wilfried-grupe.de/XML_Strukturalternativen1.html