Le entità di XML e HTML

English version

Come tutti dovrebbero sapere, alcuni caratteri devono essere sostituiti con delle entità, se si desidera usarli come testo in un documento XML o (X)HTML. Ad esempio, siccome i tag sono circondati dai caratteri < e >, non si può scriverli così come sono e aspettarsi di vederli apparire nella finestra del browser insieme al resto del testo.

Per inserire i caratteri che hanno un significato speciale, di solito si usano le entità. XML ha cinque entità predefinite, che sono presenti anche in HTML:

& &amp;
< &lt;
> &gt;
” &quot;
‘ &apos;

Per ottenere un risultato corretto, i caratteri & devono essere sostituiti prima degli altri.

Questi caratteri sono gli unici che potrebbero confondere il client e invalidare un documento. Nei parametri si può perfino lasciare < e >. Negli altri contesti, è possibile usare ” e ‘.

Si può tranquillamente evitare di sostituire gli altri caratteri “strani” utilizzando il set di caratteri UTF-8.

Nei documenti XML, è anche possibile evitare di utilizzare le entità predefinite, purché i caratteri corrispondenti appaiano solo nelle sezioni CDATA. La sintassi di CDATA è:

<![CDATA[ bla bla bla ]]>

Le sezioni CDATA non possono contenere la sequenza di caratteri ]]> e non vi è modo di aggirare questa restrizione.

Divertitevi!