Le entità di XML e HTML

English version

Come tutti dovrebbero sapere, alcuni caratteri devono essere sostituiti con delle entità, se si desidera usarli come testo in un documento XML o (X)HTML. Ad esempio, siccome i tag sono circondati dai caratteri < e >, non si può scriverli così come sono e aspettarsi di vederli apparire nella finestra del browser insieme al resto del testo.

Per inserire i caratteri che hanno un significato speciale, di solito si usano le entità. XML ha cinque entità predefinite, che sono presenti anche in HTML:

& &amp;
< &lt;
> &gt;
” &quot;
‘ &apos;

Per ottenere un risultato corretto, i caratteri & devono essere sostituiti prima degli altri.

Questi caratteri sono gli unici che potrebbero confondere il client e invalidare un documento. Nei parametri si può perfino lasciare < e >. Negli altri contesti, è possibile usare ” e ‘.

Si può tranquillamente evitare di sostituire gli altri caratteri “strani” utilizzando il set di caratteri UTF-8.

Nei documenti XML, è anche possibile evitare di utilizzare le entità predefinite, purché i caratteri corrispondenti appaiano solo nelle sezioni CDATA. La sintassi di CDATA è:

<![CDATA[ bla bla bla ]]>

Le sezioni CDATA non possono contenere la sequenza di caratteri ]]> e non vi è modo di aggirare questa restrizione.

Divertitevi!

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...