Difference between revisions of "Transcription (Mondrian)"

From XML
Jump to: navigation, search
Line 1: Line 1:
De brieven van Mondriaan  werden niet geschreven met het oogmerk van publicatie. Evenmin vertoont hij als briefschrijver bijzondere literaire aspiraties. Hoewel de toon over het algemeen persoonlijk is, was de functie van zijn correspondentie vooral het bespreken en uitwisselen van ideeën en ervaringen, het bespreken van en onderhandelen over praktische en financiële kwesties, het maken van afspraken voor ontmoetingen en reizen, het voorbereiden van publicaties, enzovoort. De toon verschilt al naar gelang Mondriaan meer of minder vertrouwd was met de geadresseerde; natuurlijkerwijs konden hierin ook veranderingen optreden.
+
* '''<add>''' Addition
 +
* '''&lt;del>''' Deletion
 +
* '''&lt;hi>''' Highlight (if you need to highlight something and then specify how it appears in the source)
 +
* '''<retrace>''' A letter or word retraced to clarify the intended word or letter
 +
* '''<restore>''' Used to mark an earlier deletion that is undone
 +
* '''@rend''' This is one of the global attributes in TEI, so it is allowed with a lot of elements. It indicates how the element in question was rendered or presented in the source. The allowed values are defined in the schema.
 +
* '''@place''' Indicates the location of (e.g.) an addition (above, below, margin, etc) or the closer.
  
Corresponderen per brief was in Mondriaans jaren een zeer alledaagse, noodzakelijke bezigheid. Aan de verzorging van brieven, zowel in termen van gebruikt materiaal (soort en kwaliteit van het briefpapier) als in termen van handschrift, taalgebruik en spelling, werd niet meer moeite besteed dan nodig was om de geadresseerde respectvol tegemoet te treden. Mondriaan had geen voorgedrukt briefpapier. Hij gebruikte over de jaren een veelheid aan verschillende typen papier, van afgescheurde stroken houthoudend blocnotepapier tot relatief duur gevergeerd schrijfpapier. Zijn handschrift is redelijk tot goed leesbaar en zeker binnen de context is vrijwel altijd achterhaalbaar wat de bedoeling is - wat overigens niet betekent dat er niet regelmatig enige welwillendheid van de lezer/editeur wordt gevraagd. Mondriaan schreef doorgaans met vloeiende inkt, hetzij met een kroontjespen, hetzij met een vulpen. Het lijkt erop dat hij zijn brieven niet eerst in klad ontwierp, zodat het veelvuldig voorkomt dat hij zich herneemt, letters of woorden doorstreept en al dan niet vervangt, of letters of woorden door elkaar schrijft. Dit draagt bij aan het persoonlijke karakter en leidt zelden tot een erg onverzorgd uiterlijk van de brief.
 
 
Met dit al komen in Mondriaans brieven allerlei kleinere taal- en spelfouten voor. In de Nederlandse brieven gaat dat niet verder dan menselijke vergissingen of incidentele onachtzaamheden. In de Franstalige en Engelstalige brieven ligt dat anders. Dit waren aangeleerde talen die hij niet perfect beheerste. Zeker in het Frans zal hij zich in het gesprek gaandeweg goed gered hebben maar op papier zijn verkeerde vervoegingen, foutief accentgebruik, on-Franse zinsbouw en dergelijke veelvoorkomend. Dit geldt in nog sterkere mate voor het Engels, dat Mondriaan pas op hoge leeftijd intensief ging gebruiken en dat in geschrifte tot het laatst gekenmerkt bleef door stevige bruskeringen van taal en spelling.
 
  
Deze kenmerken en constaringen hebben ertoe geleid dat Mondriaans brieven in deze editie in twee versies gepresenteerd worden.  De eerste is een diplomatische transcriptie die de geschreven tekst nauwgezet volgt, en de grafische kenmerken van de tekst en eventuele wijzigingen tijdens het schrijfproces documenteert; zie hiervoor [[Transcription (Mondrian)#Richtlijn voor de transcriptie van manuscripten|Richtlijn voor de transcriptie van manuscripten]].
+
==The stages of changes==
 +
To encode different stages of changes, we use @seq
 +
i.e. Mondrian deleted a word and then added a new one.
 +
@seq assigns a sequence number related to the order in which the encoded features carrying this attribute are believed to have occurred.
 +
<pre>
 +
<del seq="1">yellow</del >
 +
<add seq="2" place="above">red</add>
 +
</pre>
  
Daarnaast is biedt de editie een geredigeerde tekst (of leestekst) waarin onvolkomenheden zijn geëmendeerd die storend kunnen zijn bij het lezen of verwarring kunnen veroorzaken over de betekenis. We hebben gemeend deze ‘verbeterde’, doorlopende tekstversie te moeten aanbieden omdat we als editeurs de verplichting voelen Mondriaans teksten toegankelijk te maken; het is onderdeel van het tekstueel ontsluiten van de bronnen die in deze editie centraal staan. Bovendien gaan we ervan uit dat uit een wetenschappelijke editie geciteerd moet kunnen worden en het is ongewenst als daarmee verwarrende teksteigenaardigheden getransponeerd worden naar een ander lezerspubliek, dat mogelijk niet vertrouwd is met Mondriaans manier van schrijven; het zou bovendien de indruk kunnen wekken dat foutief geciteerd wordt.
+
You can also use seq=0 for immediate deletions (deletions while writing or Sofortkorrektur).  
  
==Richtlijn voor de transcriptie van manuscripten==
+
If a single act of  modification requires multiple elements, these elements have the same seq attribute:
De transcripties willen, zoals gezegd, tekstueel een exacte weergave bieden van het geschrevene  en daarbij recht doen aan de grafische kenmerken op het manuscript. ‘Trouw aan de tekst’ staat voorop, wat impliceert dat afwijkingen van de gangbare spelling en grammatica worden overgenomen en ook wijzigingen die tijdens het schrijven werden aangebracht — direct of later — worden gedocumenteerd. Deze ‘oerversie’ van de tekst noemen we kortweg ‘de (diplomatische) transcriptie’.
+
Bij het in drukletters op een scherm presenteren van een oorspronkelijk met de hand geschreven tekst loopt men tegen beperkingen aan, zeker als men ook de grafische toedracht (doorhalingen, verplaatsingen etc.) inzichtelijk wil maken, en zelfs als daarbij gebruikgemaakt wordt van inventieve digitale technieken. Zo is het niet altijd mogelijk de oorspronkelijke positie en oriëntatie van tekstelementen in de transcriptie te imiteren, bijvoorbeeld wanneer tekst tussen de regels is toegevoegd, of dwars of ondersteboven in de marge is geschreven. Zoveel mogelijk grafische informatie zal door middel van tags in de xml gecodeerd worden en zichtbaar gemaakt worden op scherm; doordat ook facsimiles beschikbaar worden gesteld, kan de lezer/gebruiker grafische bijzonderheden zelf bestuderen en desgewenst de transcriptie controleren. De beschikbaarheid van facsimiles is ook de reden waarom de gedetailleerdheid van de weergave van handschriftkenmerken beperkt is gehouden. Té verfijnde details kunnen hun doel gemakkelijk voorbijschieten terwijl het facsimile in een oogopslag de grafische toedracht kan verduidelijken voor wie daarin geïnteresseerd is. Vanzelfsprekend nemen de editeurs hun verantwoordelijkheid wanneer relevante informatie niet aan het facsimile is af te lezen, en lichten zij dergelijke situaties toe.
+
Het was niet Mondriaans gewoonte zijn brieven uitvoerig te redigeren. Wel zijn er verschrijvingen en directe correcties (‘Sofortkorrekturen’). Andere eventuele wijzigingen in de tekst werden naar alle waarschijnlijkheid ook tijdens of vrij direct na de eerste schrijfgang aangebracht. Het is maar zelden mogelijk te bepalen hoe kleine wijzigingen van enkele letters of van één of enkele woorden zich in de (schrijf)tijd tot elkaar verhielden. Het veranderingsproces geeft maar hoogst zelden bijzonder inzicht in Mondriaans denkproces of gedachtenontwikkeling; een scrupuleuze analyse van de tekstgenese van de brieven voegt niets toe aan ons begrip van de tekst. Voor de brieven is daarom geen verfijnd variantenapparaat ontwikkeld. Varianten en correcties worden in de xml gemarkeerd en zijn zichtbaar in de transcriptiemodus. Fasering is alleen aangebracht als aangenomen mag worden of vaststaat dat wijziging na voltooiing van de brief gebeurde, of als een wijziging samenhangt met andere wijzigingen ter plaatse en de volgorde relevant is om de aanpassingen te kunnen begrijpen. Dit laatste is soms mogelijk op grafische, inhoudelijke of taalkundige gronden, of op een combinatie hiervan.
+
  
===Diacritisch systeem===
+
<pre>Ik <del seq="1">heb</del><add seq="1">lees</add> het boek<del seq="1" gelezen</del>.</pre>
Het diacritisch systeem voor de transcriptie van de tekst wordt bepaald door de regels van xml/TEI. Een uitvoerige beschrijving van elementen, attributen, namespaces etc. is beschikbaar in ‘Encoding Mondrian’. Hieronder volgt een overzicht van de handschriftelijke kenmerken die zijn gecodeerd, met de belangrijkste markup.
+
* Sofortkorrektur: <del rend=“overwritten”>
+
* Omzetting: d.m.v. <transpose> met gebruik van xml-id in beide elementen; id kunnen we zelf bepalen; mag niet met cijfer beginnen; target aangeven d.m.v. # naar elkaars locatie verwijzen; id moet binnen het document uniek zijn.
+
* Doorhaling d.m.v. doorstreping: <del type=“strikeover”>
+
* Doorhaling d.m.v. overschrijving: <del> indien direct; anders @seq gebruiken.
+
* Toe- of invoeging: <add>;  seq alleen gebruiken als de wijziging plaatsvond na voltooiing van het woord/de woorden (dus altijd 1 of meer, nooit 0).
+
* Invoegingen m.b.v. verwijzingstekens: om de plaats in de lopende brieftekst aan te geven waar elders geschreven toevoegingen bedoeld zijn, gebruikte Mondriaan vaak verwijzingstekens, min of meer zoals gebruikelijk in kopij voor de zetter. De tekens lopen uiteen van kruisjes of plusjes tot haken en omcirkelde punten. Zulke invoegingen worden in de transcriptie genoteerd op de plaats waarop ze op het manuscript voorkomen; via de tag <metamark> wordt verwezen naar de plaats waar het fragment bedoeld is (en dus in de leestekst moet worden ingevoegd).
+
* <seq> gebruiken voor alle wijzigingen en correcties die niet direct zijn aangebracht en/of seq+0 hebben. Dit om staten van tekst als geheel te kunnen presenteren.
+
* Kastlijntje: dit wordt gebruikt als interpunctie in lopende zinnen en als ‘lang’ liggend streepje genoteerd (zie lijst bijzondere tekens hieronder). Bij cijfers, in adressen e.d. wordt een liggend streepje als koppelteken getranscribeerd (minus-teken).
+
* Blokletters: typen in normaal font met <hi rend=”blockletter”>. Dit maakt mogelijk dat verschil tussen kapitalen en kleinere letters zichtbaar blijft. (In feite is doorgaans sprake van zgn. block capitals (Wikipedia.)
+
* Bijzondere tekens:
+
** '''ampersand &''' > &amp;#0233;
+
** '''oppervlakteteken □''' > &amp;#9633;
+
** '''kastlijntje —''' > &amp;#2014;
+
** '''half ½''' > &amp;#189;
+
** '''haak⎾''' > &amp;#9150;
+
** '''stip in cirkel ☉''' > &amp;#9737;
+
De laatste twee behoren tot de verwijzingstekens die Mondriaan voor invoegingen gebruikte.
+
* Onleesbare tekst — of dat nu is door beschadiging van het papier of door doorhaling of vlekken — wordt gemarkeerd met <gap>, aangevuld met aantal letters en reden (bijvoorbeeld “illegible”).
+
* Onzekere lezingen worden gemarkeerd met <unclear> binnen een <choice>; het eerstgenoemde alternatief zal in de leestekst zichtbaar worden.
+
In de meeste gevallen beperkt de onzekerheid zich tot één of enkele letters die niet volledig of niet duidelijk zijn geschreven. Voorbeelden: het dwarsstreepje door de t ontbreekt of de punt op de i; de e is niet ‘open’; opeenvolgende n’s wordt slordig geschreven met een niet corresponderend aantal halen van de pen. In plaats van bij deze veelvoorkomende gevallen telkens ‘supplied’ te gebruiken, gaan wij zoveel mogelijk uit van wat Mondriaan redelijkerwijs bedoeld moet hebben; het puriteins documenteren van door de auteur klaarblijkelijk onbelangrijk gevonden gemakzucht of desinteresse leidt tot (inhoudelijk) betekenisloze ballast in de codering.  Vanzelfsprekend worden onzekerheden wel gecodeerd wanneer de betekenis van het geschreven zou veranderen door een keuze van de editeurs. In die gevallen wordt altijd ‘supplied’ en/of ‘choice’ toegevoegd.
+
* Verduidelijking van letters, waarbij de tekst dus niet veranderd is, wordt gemarkeerd met <retrace>.
+
* Onvolledig gerealiseerde letters worden als gerealiseerd beschouwd wanneer vaststaat wat de intentie van de schrijver was, met toevoeging van <supplied>. Wanneer niet zeker is welke letter werd beoogd, wordt een onleesbare letter genoteerd met toevoeging van <gap>.
+
* Leestekens:
+
** aanhalingstekens: enkel of dubbel zoals in het manuscript. In de transcriptie worden alle aanhalingstekens ‘hoog’, ook wanneer ze op de regel geschreven zijn.
+
** apostrofs: soms zijn letters aan elkaar geschreven (cant) en is apostrof vervolgens direct boven het woord gezet. Dit wordt getranscribeerd zoals klaarblijkelijk geïntendeerd (can’t). Wanneer echter zeker is dat de apostrof in een latere schrijffase pas is toegevoegd (bijvoorbeeld op basis van afwijkend schrijfmateriaal), wordt de apostrof gemarkeerd als toevoeging (<add>).
+
** punten: in Mondriaans brieven is de punt vaak enigszins langgerekt, als een streepje. Dit wordt getranscribeerd als gewone punt, op basis van redelijkheid (Mondriaan gebruikte immers ook het liggend streepje).
+
** accent circonflexe: wanneer dit gebruikt wordt als samentrekkingsteken (weder/weer, mede/mee) en Mondriaan plaatst het teken tussen beide letters, wordt het in de transcriptie op de tweede letter overgenomen (omdat die deel uitmaakt van de samentrekking, de eerste letter niet). Dus: weêr, meê, moê, etc. Waar Mondriaan het accent duidelijk op de eerste letter plaatst, wordt dat overeenkomstig getranscribeerd.
+
** accenten op hoofdletters in het Frans (in gedrukte teksten): worden overgenomen, ondanks het feit dat accenten op hoofdletters in het Frans (tegenwoordig) vaak worden weggelaten. Dus desvoorkomend É, Á, Ô etc.
+
* Majuskel/minuskel: bij Mondriaan is het onderscheid niet altijd duidelijk; in de Engelse brieven bijvoorbeeld You/you. Tegelijkertijd komt het regelmatig voor dat hij duidelijk zondigt tegen de conventie zodat er niet altijd van uitgegaan kan worden dat hij de juiste vorm beoogde. Hiervoor zijn twee mogelijkheden in de transcriptie: wanneer de editeurs op handschriftelijke gronden vermoeden dat de juiste vorm bedoeld was, geven ze Mondriaan het voordeel van de twijfel. Wanneer de kwestie werkelijk open blijft, wordt gemarkeerd met <unclear> en <choice>. De juiste vorm wordt dan als eerste gegeven; deze zal in de leestekst zichtbaar worden.
+
* Onderstreping: <hi rend=”underline”>; er kan ook voor meerder onderstreping gekozen worden (underline 2 etc.). We onderscheiden niet de verschillende wijzen waarop onderstreept is (doorlopende lijn, losse korte streepjes, stippellijn, golvende lijn).
+
* Afbreking van woorden aan regeleinde: <c type="wbh">-</c><lb/> Het resterende deel van het afgebroken woord wordt hieraan direct toegevoegd; de volgende regel in de transcriptie begint niet met <lb/> omdat die line break al in de afbrekingscodering is verwerkt. In voorkomende gevallen kan het koppelteken vervangen worden door een ander afbrekingsteken, bijvoorbeeld dubbele komma’s (,,).
+
  
===Structurele kenmerken===
+
On the del element, we can use the rend attribute to indicate it has been overwritten, either by an add or in a Sofortkorrektur:
* Bladschikking van adressering op de enveloppe, adreszijde van briefkaarten e.d. wordt niet overgenomen; wel schrijfwijze (blokletters, onderstrepingen e.d.). Als bijvoorbeeld een onderstreping voor de hele regel bedoeld is, wordt het ‘hi’-element in <addressLine> opgenomen.
+
* Tekstelementen die bijvoorbeeld gecentreerd zijn of tegen de rechtermarge geschreven, worden dienovereenkomstig gecodeerd. Dit komt met name voor in de aanhef en de afsluiting.
+
* Regelverdeling: de regels worden overeenkomstig het manuscript afgebroken.
+
* Witregels worden gecodeerd met <space>, met @s ‘dim’ (meestal “vertical”), ‘unit’ (meestal “lines”) en aantal (‘n=’).
+
* Begin van pagina’s: pagebreak <pb/> aanbrengen.  Daarin opnemen de attributes die blad en paginanummer aangeven.
+
* Nieuwe regels: alle regels beginnen met <lb/> tenzij het schema het niet accepteert.
+
* Inspringen: van alinea’s springt meestal alleen eerste regel in. Dit wordt in het linebreak-element van eerste regel van de alinea  aangeven met @rend=”indent” (In de interface wordt vastgelegd dat niet de hele alinea inspringt. (Wanneer in bron wel meerdere regels als geheel inspringen, wordt ‘block’ gebruikt.)
+
* Regeleinde: </lb> wordt in omzetting naar de doorlopende leestekst door de interface genegeerd. Hetzelfde geldt voor alle spaties en tabs. Harde returns worden echter wel omgezet in ‘whitespace’, dus in die gevallen moet aansluiting goed worden gecodeerd.
+
* Alinea’s: het begin wordt gemarkeerd met &lt;p>, het einde met &lt;/p>. Wanneer niet duidelijk is of een nieuwe regel het begin is van een nieuwe alinea (meestal: als de voorgaande regel tot de bladrand loopt) wordt op inhoudelijke gronden beslist of al dan niet van een nieuwe alinea sprake is.
+
* Enveloppe: zie [[Transcription: structure (Mondrian)#&lt;div type=”postalData”>|&lt;div type=”postalData”>]].
+
  
===Formele kenmerken===
+
<pre><del rend="overwritten">wel</del><add>niet</add></pre>
Behalve markup die grafische en structurele kenmerken van het handschrift weergeeft, is er ook markup voor formele aspecten van de brief. Hiermee zijn de elementen in de tekst bedoeld die voortkomen uit conventie van het briefgenre: datering, aanhef (‘opener’), slotformule (‘closer’), handtekening, postscriptum en dergelijke.
+
* opener: hierbinnen valt alle ‘aanlooptekst’ vanaf begin tot en met de ‘salute’.
+
* closer: het deel  vanaf de eerste indicatie dat auteur gaat afsluiten (dat kan dus vóór de ‘salute’ zijn) tot en met ondertekening; alles wat groet, hoogachting e.d. is, is deel van de <salute>; wat betrekking heeft op de ondertekenaar (uw dw. dr, je toegenegen, yours, uw geheel onderworpen, je willige slaaf, etc.) is deel van de <signed>.
+
In de transcriptie worden formele aspecten behandeld (gecodeerd) als normale tekst en worden ze op de plaats gelaten waar ze geschreven werden. In de leestekst treedt echter een typografische uniformering op die mede gebaseerd is op de bedoelde formele kenmerken.
+
  
====Richtlijn voor emendatie====
+
A text fragment that has been modified is tagged as <seg> (segment), for the purpose of being able to display the multiple states of the text. It is up to the editor to choose meaningful segments. In the above example the sentence might be tagged as <seg>:
Ontbrekende leestekens als die verwarrend zijn door verkeerd gebruik of door ontbreken. Met name afhalingstekens (waar houdt aanhaling/citaat/etc. op) en punten aan zinseinde. Deze laatste wordt echter meestal niet aangevuld wanneer op een andere manier het zinseinde gemarkeerd is, bijvoorbeeld door een kastlijntje.
+
 
Spelling: veel fouten, vaak onveranderd. Combinatie van woordbeeld en klank: ‘happely’ laten staan maar ‘quit’ geëmendeerd tot ‘quite’; ‘appeltrie’ en ‘his enquiring were’ laten staan. Is enigszins arbitrair, niet altijd in scherp afgebakende categorieën in te delen. Engelse hertaling zal t.z.t. finale lezing bieden.
+
<pre><seg>Ik <del seq="1" >heb</del><add seq="1" >lees</add het
 +
boek<del seq="1" gelezen</del>.</seg></pre>
 +
 
 +
 
 +
If an earlier deletion is restored we can encode this using <restore>. An example ('cocktail' replaced by 'drink', which is then deleted while 'cocktail' is being restored):
 +
 
 +
<pre><restore seq="2"><del seq="1">cocktail</del></restore>
 +
<del seq="2"><add seq="1">drink</add></del></pre>
 +
 
 +
 
 +
 
 +
A Sofortkorrectur is not embedded in a seg-element, because there is no need to show the different states of the text. If it is desirable to show the scope of an immediate correction by overwriting, we use add (with seq="0"):
 +
 
 +
<pre><del seq="0">F</del><add seq="0">V</add>ics</pre>
 +
 
 +
We don't use @seq on retrace.  
 +
 
 +
When a text  continues in the margin, that does not by itself make the margin text an addition (<add>). An addition is something added at a later stage. When Mondrian adds a sign to indicate where the text continues, we encode this sign as a metamark.
 +
 
 +
==Rend details==
 +
If you need multiple values (like underlined and superscript) just enter them separated by a space: <hi rend="underline super">.
 +
 
 +
If a paragraph is indented, use rend="indent" on its first line (<lb>).  
 +
 
 +
We use rend="blockletters" for block capitals.
 +
 
 +
There is technically no difference between using a rend-attribute on an existing element and using a hi-element with that rend-attribute within that existing element. So 
 +
 
 +
<pre><addrLine rend="underline">New York City</addrLine></pre>
 +
 
 +
and
 +
 
 +
<pre><addrLine><hi rend="underline">New York City</hi></addrLine></pre>
 +
 
 +
are completely equivalent.
 +
 
 +
==Transpositions==
 +
 
 +
Two (or more) pieces of text that have switched position are encoded using the md:transpose element. The transposed texts are written in their original order. The target attribute indicates where the text fragment is moved. Example:
 +
 
 +
<pre><md:transpose seq="1" xml:id="i1" target="#i2">development</md:transpose> <md:transpose seq="1" xml:id="i2" target="#i1">art</md:transpose></pre>
 +
 
 +
==Incorrect text==
 +
An incorrect text can be encoded in <sic>. The corresponding correction is incoded into <corr>. Both elements goes into <choice>, as in the example:
 +
 
 +
<pre><choice><sic type="grammar">Happely</sic><corr>Happily</corr></choice></pre>
 +
 
 +
==Unclear, illegible text==
 +
If text is hard to read, either because it has been deleted or for another reason (bad handwriting), it is encoded as <unclear>. If for instance if the word “removed’ has been deleted, but we’re not sure about the last three letters, we encode:
 +
 
 +
<pre><del>remo<unclear>ved</unclear></del></pre>
 +
 +
When two readings are possible, we can use <choice > to group them. If the last letter in “free” could also be read as “i”, we encode that as:
 +
 
 +
<pre>Fre<choice><unclear>e</unclear><unclear>i</unclear></choice></pre>
 +
 +
But an <unclear> can also occur by itself:
 +
 
 +
<pre>A single <unclear>word</unclear> is hard to read.</pre>
 +
 
 +
If text is completely illegible and cannot be transcribed at all the <gap> element is used. The size of the gap can be indicated using the unit and quantity attributes.  
 +
 
 +
<pre>A single <gap quantity="1" unit="word"/> is illegible.</pre>
 +
 
 +
==Empty lines==
 +
Encode using the <space> element, using dim="vertical" and the unit and quantity attributes to indicate the number of lines. For example:
 +
 
 +
<pre><space dim="vertical" unit="lines" quantity="2"/></pre>
 +
 
 +
==Hyphenation and other dashes==
 +
<c type="wbh">-</c> is used to encode a hyphen that divide a word at the end of the line (and only if Mondrian uses it, not where he should have used it). Other kinds of hyphen are not encoded.
 +
 
 +
If Mondrian writes:
 +
<pre>
 +
    normal-
 +
ly
 +
</pre>
 +
we encode (Don’t introduce whitespace!):
 +
<pre>normal<c type="wbh">-</c><lb/>ly</pre>
 +
 
 +
         
 +
If Mondrian writes:
 +
<pre>
 +
    Normal
 +
Ly
 +
</pre>
 +
we encode:
 +
<pre>normal<lb/>ly</pre>
 +
 
 +
If Mondrian writes:
 +
<pre>
 +
    well-
 +
known brands
 +
</pre>
 +
we encode:
 +
<pre>well-<lb/>known brands</pre>
 +
 
 +
 
 +
The mdash corresponds to unicode code point x2014. In [[Manual oXygen|Oxygen]], it can be entered through the Symbol button (if needed, add the Symbol toolbar), or use the Edit menu, option Insert from Character Map.
 +
 
 +
==Notes in the text==
 +
Notes unrelated to the contents of the letter, possibly in another hand, we encode as <ab> (anonymous block).  ‘Anonymous’ here refers not to the author being unknown, but to this being a block of text not identified as a paragraph, a list or another block-level element. We use the hand attribute to point to the probable writer and describe the hands in the document hands.xml.
 +
 
 +
For instance (this is an example of an changed address provided by an anonymous person):
 +
<pre>
 +
<div type="envelope" xml:id="PD">
 +
  <!-- envelope recto -->
 +
  <pb n="envelope-r" xml:id="env-r" facs="#zone-env-r"/>
 +
  <div type="postalData">
 +
      <md:postmark>Paris XIV … </md:postmark>
 +
      <address type="receiver">
 +
        …
 +
      </address>
 +
  </div>
 +
  <ab hand="hands.xml#anon">James Abbott // 20xx Newbold Eve // Bronx</ab>
 +
 +
</div>   
 +
</pre>
 +
See [[Transcription: annotations (Mondrian)|annotations]] for notes as used to annotate the text.
 +
 
 +
==Postscripts==
 +
A postscript is not necessarily indicated by P.S. A postscript is any text added as an afterthought after a letter has been signed. A postscript contains at least one or more paragraphs:
 +
<pre>
 +
<postscript>
 +
<p>Say hello to your mother.<p>
 +
</postscript>
 +
</pre>
 +
A letter can have multiple postscripts. Postscripts can be numbered (using the n-attribute) to indicated a logical sequence. 
 +
 
 +
==Envelopes==
 +
Encode as div type=envelope. See SampleLetterWithEnvelope.xml. The addresses are encoded as divs with type="postalData". The address of the receiver goes on the front (recto) side of the envelope. Code the addresses as <address> with <addrline>s. Give the <address> a type-attribute (receiver, sender).
 +
<addrline>-elements are preceded by <lb>-elements if they begin on a new line.
 +
Short descriptive phrases (‘sent by’, ‘sender’, ‘To’) before the address go into <label>-elements.
 +
 
 +
An example of an address:
 +
<pre>
 +
<address type="receiver">
 +
    <lb/><addrLine rend="underline2">M<hi rend="super underline">r</hi>
 +
        Harry Holtzman</addrLine>
 +
    <lb/><addrLine>231 East 60<hi rend="super">th</hi> Street</addrLine>
 +
    <lb/><addrLine rend="underline">New York City</addrLine>
 +
</address>
 +
</pre>
  
 
==See also==
 
==See also==
 
* [[Transcription: structure (Mondrian)]]
 
* [[Transcription: structure (Mondrian)]]
* [[Transcription: representation of the source (Mondrian)]]
 
 
* [[Transcription: annotations (Mondrian)]]
 
* [[Transcription: annotations (Mondrian)]]
* [[XML Mondrian Guidelines]]
+
* [[Transcription (Mondrian)]]
  
 
[[Category:XML Mondrian]]
 
[[Category:XML Mondrian]]

Revision as of 14:22, 26 April 2017

  • <add> Addition
  • <del> Deletion
  • <hi> Highlight (if you need to highlight something and then specify how it appears in the source)
  • <retrace> A letter or word retraced to clarify the intended word or letter
  • <restore> Used to mark an earlier deletion that is undone
  • @rend This is one of the global attributes in TEI, so it is allowed with a lot of elements. It indicates how the element in question was rendered or presented in the source. The allowed values are defined in the schema.
  • @place Indicates the location of (e.g.) an addition (above, below, margin, etc) or the closer.


The stages of changes

To encode different stages of changes, we use @seq i.e. Mondrian deleted a word and then added a new one. @seq assigns a sequence number related to the order in which the encoded features carrying this attribute are believed to have occurred.

<del seq="1">yellow</del >
<add seq="2" place="above">red</add>

You can also use seq=0 for immediate deletions (deletions while writing or Sofortkorrektur).

If a single act of modification requires multiple elements, these elements have the same seq attribute:

Ik <del seq="1">heb</del><add seq="1">lees</add> het boek<del seq="1" gelezen</del>.

On the del element, we can use the rend attribute to indicate it has been overwritten, either by an add or in a Sofortkorrektur:

<del rend="overwritten">wel</del><add>niet</add>

A text fragment that has been modified is tagged as <seg> (segment), for the purpose of being able to display the multiple states of the text. It is up to the editor to choose meaningful segments. In the above example the sentence might be tagged as <seg>:

<seg>Ik <del seq="1" >heb</del><add seq="1" >lees</add het 
boek<del seq="1" gelezen</del>.</seg>


If an earlier deletion is restored we can encode this using <restore>. An example ('cocktail' replaced by 'drink', which is then deleted while 'cocktail' is being restored):

<restore seq="2"><del seq="1">cocktail</del></restore>
<del seq="2"><add seq="1">drink</add></del>


A Sofortkorrectur is not embedded in a seg-element, because there is no need to show the different states of the text. If it is desirable to show the scope of an immediate correction by overwriting, we use add (with seq="0"):

<del seq="0">F</del><add seq="0">V</add>ics

We don't use @seq on retrace.

When a text continues in the margin, that does not by itself make the margin text an addition (<add>). An addition is something added at a later stage. When Mondrian adds a sign to indicate where the text continues, we encode this sign as a metamark.

Rend details

If you need multiple values (like underlined and superscript) just enter them separated by a space: <hi rend="underline super">.

If a paragraph is indented, use rend="indent" on its first line (<lb>).

We use rend="blockletters" for block capitals.

There is technically no difference between using a rend-attribute on an existing element and using a hi-element with that rend-attribute within that existing element. So

<addrLine rend="underline">New York City</addrLine>

and

<addrLine><hi rend="underline">New York City</hi></addrLine>

are completely equivalent.

Transpositions

Two (or more) pieces of text that have switched position are encoded using the md:transpose element. The transposed texts are written in their original order. The target attribute indicates where the text fragment is moved. Example:

<md:transpose seq="1" xml:id="i1" target="#i2">development</md:transpose> <md:transpose seq="1" xml:id="i2" target="#i1">art</md:transpose>

Incorrect text

An incorrect text can be encoded in <sic>. The corresponding correction is incoded into <corr>. Both elements goes into <choice>, as in the example:

<choice><sic type="grammar">Happely</sic><corr>Happily</corr></choice>

Unclear, illegible text

If text is hard to read, either because it has been deleted or for another reason (bad handwriting), it is encoded as <unclear>. If for instance if the word “removed’ has been deleted, but we’re not sure about the last three letters, we encode:

<del>remo<unclear>ved</unclear></del>

When two readings are possible, we can use <choice > to group them. If the last letter in “free” could also be read as “i”, we encode that as:

Fre<choice><unclear>e</unclear><unclear>i</unclear></choice>

But an <unclear> can also occur by itself:

A single <unclear>word</unclear> is hard to read.

If text is completely illegible and cannot be transcribed at all the <gap> element is used. The size of the gap can be indicated using the unit and quantity attributes.

A single <gap quantity="1" unit="word"/> is illegible.

Empty lines

Encode using the <space> element, using dim="vertical" and the unit and quantity attributes to indicate the number of lines. For example:

<space dim="vertical" unit="lines" quantity="2"/>

Hyphenation and other dashes

<c type="wbh">-</c> is used to encode a hyphen that divide a word at the end of the line (and only if Mondrian uses it, not where he should have used it). Other kinds of hyphen are not encoded.

If Mondrian writes:

    normal-
ly

we encode (Don’t introduce whitespace!):

normal<c type="wbh">-</c><lb/>ly


If Mondrian writes:

    Normal
Ly

we encode:

normal<lb/>ly

If Mondrian writes:

     well-
known brands

we encode:

well-<lb/>known brands


The mdash corresponds to unicode code point x2014. In Oxygen, it can be entered through the Symbol button (if needed, add the Symbol toolbar), or use the Edit menu, option Insert from Character Map.

Notes in the text

Notes unrelated to the contents of the letter, possibly in another hand, we encode as <ab> (anonymous block). ‘Anonymous’ here refers not to the author being unknown, but to this being a block of text not identified as a paragraph, a list or another block-level element. We use the hand attribute to point to the probable writer and describe the hands in the document hands.xml.

For instance (this is an example of an changed address provided by an anonymous person):

<div type="envelope" xml:id="PD">
   <!-- envelope recto -->
   <pb n="envelope-r" xml:id="env-r" facs="#zone-env-r"/> 
   <div type="postalData">
      <md:postmark>Paris XIV … </md:postmark>
       <address type="receiver">
         …
       </address>
   </div>	
   <ab hand="hands.xml#anon">James Abbott // 20xx Newbold Eve // Bronx</ab>
…
</div>    

See annotations for notes as used to annotate the text.

Postscripts

A postscript is not necessarily indicated by P.S. A postscript is any text added as an afterthought after a letter has been signed. A postscript contains at least one or more paragraphs:

<postscript>
<p>Say hello to your mother.<p>
</postscript>

A letter can have multiple postscripts. Postscripts can be numbered (using the n-attribute) to indicated a logical sequence.

Envelopes

Encode as div type=envelope. See SampleLetterWithEnvelope.xml. The addresses are encoded as divs with type="postalData". The address of the receiver goes on the front (recto) side of the envelope. Code the addresses as <address> with <addrline>s. Give the <address> a type-attribute (receiver, sender). <addrline>-elements are preceded by <lb>-elements if they begin on a new line. Short descriptive phrases (‘sent by’, ‘sender’, ‘To’) before the address go into <label>-elements.

An example of an address:

<address type="receiver">
    <lb/><addrLine rend="underline2">M<hi rend="super underline">r</hi>
        Harry Holtzman</addrLine>
    <lb/><addrLine>231 East 60<hi rend="super">th</hi> Street</addrLine>
    <lb/><addrLine rend="underline">New York City</addrLine>
</address>

See also