Transcription
De transcriptie met daarin de eigenlijke tekst van de editie wordt gecodeerd in een <text>-element in het XML/TEI-bestand. Daarbij wordt rekening gehouden met de structuur van de tekst, de drager van de tekst, benodigde annotaties en alle andere bijzonderheden.
Wat het transcriberen van de manuscripten betreft, is het doel om zo dicht mogelijk bij de oorspronkelijke tekst te blijven. We richten ons op de productie van diplomatische uitgaven. Onder diplomatische uitgave wordt hier een editie verstaan waaraan slechts één bron ten grondslag ligt en waarin de tekst en alle verdere grafische informatie weergegeven worden in overeenstemming met die bron. Daarbij wordt niet gestreefd naar een typografische imitatie van de bron, maar naar een functionele weergave van de tekst. De transcripties willen, zoals gezegd, tekstueel een exacte weergave bieden van het geschrevene. ‘Trouw aan de tekst’ staat voorop, wat impliceert dat afwijkingen van de gangbare spelling en grammatica worden overgenomen, wijzigingen die tijdens het schrijven werden aangebracht — direct of later — worden gedocumenteerd, en ook de fysieke structuur van de bron waar relevant wordt weergeven.
Structuur van de tekst
Een tekst is doorgaans geen 'vlak' geheel, maar bestaat gewoonlijk uit verschillende lagen met een eigen hiërarchie. Die worden ook weergegeven in het XML-bestand. De tekst wordt gecodeerd in het <text>-element, dat verplicht een <body>-element bevat. De structuur van een eenvoudige tekst zou er als volgt uitzien:
<text> <body> <p>...</p> </body> </text>
Andere lagen van de tekst kunnen worden gecodeerd met behulp van de volgende elementen (eventueel aangevuld met attribuut @type om ze nader te specificeren):
- <p> Paragraaf
- <ab> Anonymous block (een willekeurige eenheid tekst, maar zonder de semantische baggage van een paragraaf)
- <div> Secties (bijv. hoofdstukken, rubrieken of andere soorten secties)
- <head> Hoofdstuktitels, opschriften etc.
- <group> Om verschillende teksten in de transcriptie aan te duiden
Weergave van de bron
Om alle karakteristieken van de tekst en zijn drager in de digitale editie weer te kunnen geven, gebruiken we een aantal standaard XML-elementen:
- <add> Addition;
It is a <add>complete</add> text.
- <damage> Damage or text loss;
<damage extent="whole leaf" agent="rubbing"> ... </damage>
- <del> Deletion;
It is <del type=strikethrough>not</del> a complete text.
- <hi> Highlight (if you need to highlight something and then specify how it appears in the source);
<hi rend="underline">This text is underlined</hi>
- <restore> Used to mark an earlier deletion that is undone;
<restore seq="2"><del seq="1">cocktail</del></restore> <del seq="2"><add seq="1">drink</add></del>
- <space> Empty lines, using dim="vertical" and the unit and quantity attributes to indicate the number of lines;
<space dim="vertical" unit="lines" quantity="2"/>
- <unclear> Uncertain reading of the text, for example due to damage;
A single <unclear>word</unclear> is hard to read.
- @rend This is one of the global attributes in TEI, so it is allowed with a lot of elements. It indicates how the element in question was rendered or presented in the source. The allowed values are defined in the schema;
- @place Indicates the location of (e.g.) an addition (above, below, margin, etc) or the closer;
- @type Used to classify or sort elements.
Verschillende bronnen kennen verschillende soorten bijzonderheden, en de XML-elementen die dit soort eigenschappen van de tekst vastleggen, zullen per project dan ook in meer of mindere mate variëren.