Gilt XML

6. ágúst 2002

Xml er tiltölulega einfalt og hentugt skráarsnið. Ég veit að sá sem hefur þurft að skrifa þáttara fyrir flóknari skrársnið svo sem eitthvað úr smiðjum Microsoft (sérstaklega þegar nokkrar útgáfur eru komnar inn í myndina) er algerlega sammála mér í því. Jafnvel tiltölulega einfalt skráarsnið eins og RTF (Rich Text Files/Format) getur verið ágætis höfuðverkur.

Samt eru menn að klúðra einföldum xml-skjölum eins og rss og opml - og brjóta grundvallarreglur svo sem að nota html-tákn (e. entities). Xml þekkir bara & < > (auk &#XXXX;) og önnur þarf að skilgreina í DTD. Einnig kemur fyrir að sértákn eins og ísl. stafir séu notaðir án þess að skilgreina rétt encoding.

Skv. stöðlunum þá má xml-þáttari að stöðva vinnslu þegar hann kemur að villu (og flestir gera það). Margar þessara villa gera menn því þeir hafa alist upp með html þar sem allt er leyft og vafra sem reyna að ráða fram úr villunum.

Ég er bara fúll því ég var svo lengi að fatta afhverju opml-þáttarinn sem ég var að skrifa (notar MSDOM) virkaði ekki rétt :( . Ég var að prófa hann á skjali sem höfundur opml staðalsins sér um (gerði ráð fyrir að það væri gilt). Í skalinu er ü (þ.e. ü) - í línunni á undan er annað tákn (ö) en það hefur verið meðhöndlað rétt og breytt í ö. Það fyndna er að óþarfi var að eiga nokkuð við þessi tákn því encoding-ið er ISO-8859-1 sem dekkar þau bæði.

ps. Ef einhver veit um góðar ísl. orð eða orðasambönd fyrir eftirfarandi þá má hann endilega setja þau í athugasemd hér fyrir neðan.

well formed, valid (gilt?), validate, processing instruction, entity, attribute (eigindi?), param[eter] (í xslt), transformer og transform (sbr. xslt) …Lokað er fyrir ummæli.