Difference between revisions of "Transcription (Mondrian)"

From XML
Jump to: navigation, search
(Physical structure)
 
(6 intermediate revisions by 2 users not shown)
Line 1: Line 1:
De brieven van Mondriaan  werden niet geschreven met het oogmerk van publicatie. Evenmin vertoont hij als briefschrijver bijzondere literaire aspiraties. Hoewel de toon over het algemeen persoonlijk is, was de functie van zijn correspondentie vooral het bespreken en uitwisselen van ideeën en ervaringen, het bespreken van en onderhandelen over praktische en financiële kwesties, het maken van afspraken voor ontmoetingen en reizen, het voorbereiden van publicaties, enzovoort. De toon verschilt al naar gelang Mondriaan meer of minder vertrouwd was met de geadresseerde; natuurlijkerwijs konden hierin ook veranderingen optreden.
+
==Physical structure==
 +
We encode a page break before each page. The page break is represented by a pb-element. The page
 +
break element carries a f-attribute (refers to the folio, or sheet), a n-attribute (page number)
 +
and a facs-attribute (reference to the corresponding <surface> or <zone> element under <facsimile>).  
  
Corresponderen per brief was in Mondriaans jaren een zeer alledaagse, noodzakelijke bezigheid. Aan de verzorging van brieven, zowel in termen van gebruikt materiaal (soort en kwaliteit van het briefpapier) als in termen van handschrift, taalgebruik en spelling, werd niet meer moeite besteed dan nodig was om de geadresseerde respectvol tegemoet te treden. Mondriaan had geen voorgedrukt briefpapier. Hij gebruikte over de jaren een veelheid aan verschillende typen papier, van afgescheurde stroken houthoudend blocnotepapier tot relatief duur gevergeerd schrijfpapier. Zijn handschrift is redelijk tot goed leesbaar en zeker binnen de context is vrijwel altijd achterhaalbaar wat de bedoeling is - wat overigens niet betekent dat er niet regelmatig enige welwillendheid van de lezer/editeur wordt gevraagd. Mondriaan schreef doorgaans met vloeiende inkt, hetzij met een kroontjespen, hetzij met een vulpen. Het lijkt erop dat hij zijn brieven niet eerst in klad ontwierp, zodat het veelvuldig voorkomt dat hij zich herneemt, letters of woorden doorstreept en al dan niet vervangt, of letters of woorden door elkaar schrijft. Dit draagt bij aan het persoonlijke karakter en leidt zelden tot een erg onverzorgd uiterlijk van de brief.
+
Example:
+
<pre><pb f="1r" n="1" facs="#z1r-1"/></pre>
Met dit al komen in Mondriaans brieven allerlei kleinere taal- en spelfouten voor. In de Nederlandse brieven gaat dat niet verder dan menselijke vergissingen of incidentele onachtzaamheden. In de Franstalige en Engelstalige brieven ligt dat anders. Dit waren aangeleerde talen die hij niet perfect beheerste. Zeker in het Frans zal hij zich in het gesprek gaandeweg goed gered hebben maar op papier zijn verkeerde vervoegingen, foutief accentgebruik, on-Franse zinsbouw en dergelijke veelvoorkomend. Dit geldt in nog sterkere mate voor het Engels, dat Mondriaan pas op hoge leeftijd intensief ging gebruiken en dat in geschrifte tot het laatst gekenmerkt bleef door stevige bruskeringen van taal en spelling.
+
  
Deze kenmerken en constaringen hebben ertoe geleid dat Mondriaans brieven in deze editie in twee versies gepresenteerd worden. De eerste is een diplomatische transcriptie die de geschreven tekst nauwgezet volgt, en de grafische kenmerken van de tekst en eventuele wijzigingen tijdens het schrijfproces documenteert; zie hiervoor [[Transcription (Mondrian)#Richtlijn voor de transcriptie van manuscripten|Richtlijn voor de transcriptie van manuscripten]].
+
Paragraphs of text that belong at a certain position in the letter, even though they are written on
 +
another page, are placed in their logical, not physical, position. In that case, we repeat the
 +
pb-element of the physical page to indicate the writing is continued on this earlier page.
 +
(We still need to discuss how this will be shown to the user.)
  
Daarnaast is biedt de editie een geredigeerde tekst (of leestekst) waarin onvolkomenheden zijn geëmendeerd die storend kunnen zijn bij het lezen of verwarring kunnen veroorzaken over de betekenis. We hebben gemeend deze ‘verbeterde’, doorlopende tekstversie te moeten aanbieden omdat we als editeurs de verplichting voelen Mondriaans teksten toegankelijk te maken; het is onderdeel van het tekstueel ontsluiten van de bronnen die in deze editie centraal staan. Bovendien gaan we ervan uit dat uit een wetenschappelijke editie geciteerd moet kunnen worden en het is ongewenst als daarmee verwarrende teksteigenaardigheden getransponeerd worden naar een ander lezerspubliek, dat mogelijk niet vertrouwd is met Mondriaans manier van schrijven; het zou bovendien de indruk kunnen wekken dat foutief geciteerd wordt.
+
For example:
 +
Suppose Mondrian writes a two page-letter (one sheet) and after finishing the letter adds ‘BTW, say hello to your wife’ on page 1.  
 +
We represent that as follows (simplified):
  
==Richtlijn voor de transcriptie van manuscripten==
+
In the facsimile element:
De transcripties willen, zoals gezegd, tekstueel een exacte weergave bieden van het geschrevene  en daarbij recht doen aan de grafische kenmerken op het manuscript. ‘Trouw aan de tekst’ staat voorop, wat impliceert dat afwijkingen van de gangbare spelling en grammatica worden overgenomen en ook wijzigingen die tijdens het schrijven werden aangebracht — direct of later — worden gedocumenteerd. Deze ‘oerversie’ van de tekst noemen we kortweg ‘de (diplomatische) transcriptie’.  
+
<pre><facsimile>
Bij het in drukletters op een scherm presenteren van een oorspronkelijk met de hand geschreven tekst loopt men tegen beperkingen aan, zeker als men ook de grafische toedracht (doorhalingen, verplaatsingen etc.) inzichtelijk wil maken, en zelfs als daarbij gebruikgemaakt wordt van inventieve digitale technieken. Zo is het niet altijd mogelijk de oorspronkelijke positie en oriëntatie van tekstelementen in de transcriptie te imiteren, bijvoorbeeld wanneer tekst tussen de regels is toegevoegd, of dwars of ondersteboven in de marge is geschreven. Zoveel mogelijk grafische informatie zal door middel van tags in de xml gecodeerd worden en zichtbaar gemaakt worden op scherm; doordat ook facsimiles beschikbaar worden gesteld, kan de lezer/gebruiker grafische bijzonderheden zelf bestuderen en desgewenst de transcriptie controleren.  De beschikbaarheid van facsimiles is ook de reden waarom de gedetailleerdheid van de weergave van handschriftkenmerken beperkt is gehouden. Té verfijnde details kunnen hun doel gemakkelijk voorbijschieten terwijl het facsimile in een oogopslag de grafische toedracht kan verduidelijken voor wie daarin geïnteresseerd is. Vanzelfsprekend nemen de editeurs hun verantwoordelijkheid wanneer relevante informatie niet aan het facsimile is af te lezen, en lichten zij dergelijke situaties toe.
+
<surface n="1" xml:id="s1r">...</surface>
Het was niet Mondriaans gewoonte zijn brieven uitvoerig te redigeren. Wel zijn er verschrijvingen en directe correcties (‘Sofortkorrekturen’). Andere eventuele wijzigingen in de tekst werden naar alle waarschijnlijkheid ook tijdens of vrij direct na de eerste schrijfgang aangebracht. Het is maar zelden mogelijk te bepalen hoe kleine wijzigingen van enkele letters of van één of enkele woorden zich in de (schrijf)tijd tot elkaar verhielden. Het veranderingsproces geeft maar hoogst zelden bijzonder inzicht in Mondriaans denkproces of gedachtenontwikkeling; een scrupuleuze analyse van de tekstgenese van de brieven voegt niets toe aan ons begrip van de tekst. Voor de brieven is daarom geen verfijnd variantenapparaat ontwikkeld. Varianten en correcties worden in de xml gemarkeerd en zijn zichtbaar in de transcriptiemodus. Fasering is alleen aangebracht als aangenomen mag worden of vaststaat dat wijziging na voltooiing van de brief gebeurde, of als een wijziging samenhangt met andere wijzigingen ter plaatse en de volgorde relevant is om de aanpassingen te kunnen begrijpen. Dit laatste is soms mogelijk op grafische, inhoudelijke of taalkundige gronden, of op een combinatie hiervan.
+
<surface n="2" xml:id="s1v">...</surface>
 +
</facsimile></pre>
  
===Diacritisch systeem===
+
In the text:
Het diacritisch systeem voor de transcriptie van de tekst wordt bepaald door de regels van xml/TEI. Een uitvoerige beschrijving van elementen, attributen, namespaces etc. is beschikbaar in ‘Encoding Mondrian’. Hieronder volgt een overzicht van de handschriftelijke kenmerken die zijn gecodeerd, met de belangrijkste markup.
+
<pre><pb f="1r" n="1" facs="#s1r"/>  
* Sofortkorrektur: <del rend=“overwritten”>
+
(text of page 1)
* Omzetting: d.m.v. <transpose> met gebruik van xml-id in beide elementen; id kunnen we zelf bepalen; mag niet met cijfer beginnen; target aangeven d.m.v. # naar elkaars locatie verwijzen; id moet binnen het document uniek zijn.
+
* Doorhaling d.m.v. doorstreping: <del type=“strikeover”>
+
* Doorhaling d.m.v. overschrijving: <del> indien direct; anders @seq gebruiken.
+
* Toe- of invoeging: <add>;  seq alleen gebruiken als de wijziging plaatsvond na voltooiing van het woord/de woorden (dus altijd 1 of meer, nooit 0).
+
* Invoegingen m.b.v. verwijzingstekens: om de plaats in de lopende brieftekst aan te geven waar elders geschreven toevoegingen bedoeld zijn, gebruikte Mondriaan vaak verwijzingstekens, min of meer zoals gebruikelijk in kopij voor de zetter. De tekens lopen uiteen van kruisjes of plusjes tot haken en omcirkelde punten. Zulke invoegingen worden in de transcriptie genoteerd op de plaats waarop ze op het manuscript voorkomen; via de tag <metamark> wordt verwezen naar de plaats waar het fragment bedoeld is (en dus in de leestekst moet worden ingevoegd).
+
* <seq> gebruiken voor alle wijzigingen en correcties die niet direct zijn aangebracht en/of seq+0 hebben. Dit om staten van tekst als geheel te kunnen presenteren.
+
* Kastlijntje: dit wordt gebruikt als interpunctie in lopende zinnen en als ‘lang’ liggend streepje genoteerd (zie lijst bijzondere tekens hieronder). Bij cijfers, in adressen e.d. wordt een liggend streepje als koppelteken getranscribeerd (minus-teken).
+
* Blokletters: typen in normaal font met <hi rend=”blockletter”>. Dit maakt mogelijk dat verschil tussen kapitalen en kleinere letters zichtbaar blijft. (In feite is doorgaans sprake van zgn. block capitals (Wikipedia.)
+
* Bijzondere tekens:
+
** '''ampersand &''' > &amp;#0233;
+
** '''oppervlakteteken □''' > &amp;#9633;
+
** '''kastlijntje —''' > &amp;#2014;
+
** '''half ½''' > &amp;#189;
+
** '''haak⎾''' > &amp;#9150;
+
** '''stip in cirkel ☉''' > &amp;#9737;
+
De laatste twee behoren tot de verwijzingstekens die Mondriaan voor invoegingen gebruikte.
+
* Onleesbare tekst — of dat nu is door beschadiging van het papier of door doorhaling of vlekken — wordt gemarkeerd met <gap>, aangevuld met aantal letters en reden (bijvoorbeeld “illegible”).
+
* Onzekere lezingen worden gemarkeerd met <unclear> binnen een <choice>; het eerstgenoemde alternatief zal in de leestekst zichtbaar worden.
+
In de meeste gevallen beperkt de onzekerheid zich tot één of enkele letters die niet volledig of niet duidelijk zijn geschreven. Voorbeelden: het dwarsstreepje door de t ontbreekt of de punt op de i; de e is niet ‘open’; opeenvolgende n’s wordt slordig geschreven met een niet corresponderend aantal halen van de pen. In plaats van bij deze veelvoorkomende gevallen telkens ‘supplied’ te gebruiken, gaan wij zoveel mogelijk uit van wat Mondriaan redelijkerwijs bedoeld moet hebben; het puriteins documenteren van door de auteur klaarblijkelijk onbelangrijk gevonden gemakzucht of desinteresse leidt tot (inhoudelijk) betekenisloze ballast in de codering.  Vanzelfsprekend worden onzekerheden wel gecodeerd wanneer de betekenis van het geschreven zou veranderen door een keuze van de editeurs. In die gevallen wordt altijd ‘supplied’ en/of ‘choice’ toegevoegd.
+
* Verduidelijking van letters, waarbij de tekst dus niet veranderd is, wordt gemarkeerd met <retrace>.
+
* Onvolledig gerealiseerde letters worden als gerealiseerd beschouwd wanneer vaststaat wat de intentie van de schrijver was, met toevoeging van <supplied>. Wanneer niet zeker is welke letter werd beoogd, wordt een onleesbare letter genoteerd met toevoeging van <gap>.
+
* Leestekens:
+
** aanhalingstekens: enkel of dubbel zoals in het manuscript. In de transcriptie worden alle aanhalingstekens ‘hoog’, ook wanneer ze op de regel geschreven zijn.
+
** apostrofs: soms zijn letters aan elkaar geschreven (cant) en is apostrof vervolgens direct boven het woord gezet. Dit wordt getranscribeerd zoals klaarblijkelijk geïntendeerd (can’t). Wanneer echter zeker is dat de apostrof in een latere schrijffase pas is toegevoegd (bijvoorbeeld op basis van afwijkend schrijfmateriaal), wordt de apostrof gemarkeerd als toevoeging (<add>).
+
** punten: in Mondriaans brieven is de punt vaak enigszins langgerekt, als een streepje. Dit wordt getranscribeerd als gewone punt, op basis van redelijkheid (Mondriaan gebruikte immers ook het liggend streepje).
+
** accent circonflexe: wanneer dit gebruikt wordt als samentrekkingsteken (weder/weer, mede/mee) en Mondriaan plaatst het teken tussen beide letters, wordt het in de transcriptie op de tweede letter overgenomen (omdat die deel uitmaakt van de samentrekking, de eerste letter niet). Dus: weêr, meê, moê, etc. Waar Mondriaan het accent duidelijk op de eerste letter plaatst, wordt dat overeenkomstig getranscribeerd.
+
** accenten op hoofdletters in het Frans (in gedrukte teksten): worden overgenomen, ondanks het feit dat accenten op hoofdletters in het Frans (tegenwoordig) vaak worden weggelaten. Dus desvoorkomend É, Á, Ô etc.
+
* Majuskel/minuskel: bij Mondriaan is het onderscheid niet altijd duidelijk; in de Engelse brieven bijvoorbeeld You/you. Tegelijkertijd komt het regelmatig voor dat hij duidelijk zondigt tegen de conventie zodat er niet altijd van uitgegaan kan worden dat hij de juiste vorm beoogde. Hiervoor zijn twee mogelijkheden in de transcriptie: wanneer de editeurs op handschriftelijke gronden vermoeden dat de juiste vorm bedoeld was, geven ze Mondriaan het voordeel van de twijfel. Wanneer de kwestie werkelijk open blijft, wordt gemarkeerd met <unclear> en <choice>. De juiste vorm wordt dan als eerste gegeven; deze zal in de leestekst zichtbaar worden.
+
* Onderstreping: <hi rend=”underline”>; er kan ook voor meerder onderstreping gekozen worden (underline 2 etc.). We onderscheiden niet de verschillende wijzen waarop onderstreept is (doorlopende lijn, losse korte streepjes, stippellijn, golvende lijn).
+
* Afbreking van woorden aan regeleinde: <c type="wbh">-</c><lb/> Het resterende deel van het afgebroken woord wordt hieraan direct toegevoegd; de volgende regel in de transcriptie begint niet met <lb/> omdat die line break al in de afbrekingscodering is verwerkt. In voorkomende gevallen kan het koppelteken vervangen worden door een ander afbrekingsteken, bijvoorbeeld dubbele komma’s (,,).
+
  
===Structurele kenmerken===
+
<pb f="1v" n="2" facs="#s1v"/>  
* Bladschikking van adressering op de enveloppe, adreszijde van briefkaarten e.d. wordt niet overgenomen; wel schrijfwijze (blokletters, onderstrepingen e.d.). Als bijvoorbeeld een onderstreping voor de hele regel bedoeld is, wordt het ‘hi’-element in <addressLine> opgenomen.
+
(text of page 2)
* Tekstelementen die bijvoorbeeld gecentreerd zijn of tegen de rechtermarge geschreven, worden dienovereenkomstig gecodeerd. Dit komt met name voor in de aanhef en de afsluiting.
+
* Regelverdeling: de regels worden overeenkomstig het manuscript afgebroken.
+
* Witregels worden gecodeerd met <space>, met @s ‘dim’ (meestal “vertical”), ‘unit’ (meestal “lines”) en aantal (‘n=’).
+
* Begin van pagina’s: pagebreak <pb/> aanbrengen.  Daarin opnemen de attributes die blad en paginanummer aangeven.
+
* Nieuwe regels: alle regels beginnen met <lb/> tenzij het schema het niet accepteert.
+
* Inspringen: van alinea’s springt meestal alleen eerste regel in. Dit wordt in het linebreak-element van eerste regel van de alinea  aangeven met @rend=”indent” (In de interface wordt vastgelegd dat niet de hele alinea inspringt. (Wanneer in bron wel meerdere regels als geheel inspringen, wordt ‘block’ gebruikt.)
+
* Regeleinde: </lb> wordt in omzetting naar de doorlopende leestekst door de interface genegeerd. Hetzelfde geldt voor alle spaties en tabs. Harde returns worden echter wel omgezet in ‘whitespace’, dus in die gevallen moet aansluiting goed worden gecodeerd.
+
* Alinea’s: het begin wordt gemarkeerd met &lt;p>, het einde met &lt;/p>. Wanneer niet duidelijk is of een nieuwe regel het begin is van een nieuwe alinea (meestal: als de voorgaande regel tot de bladrand loopt) wordt op inhoudelijke gronden beslist of al dan niet van een nieuwe alinea sprake is.
+
* Enveloppe: zie [[Transcription: structure (Mondrian)#&lt;div type=”postalData”>|&lt;div type=”postalData”>]].
+
  
===Formele kenmerken===
+
<pb f="1r" n="1" facs="#s1r"/> 
Behalve markup die grafische en structurele kenmerken van het handschrift weergeeft, is er ook markup voor formele aspecten van de brief. Hiermee zijn de elementen in de tekst bedoeld die voortkomen uit conventie van het briefgenre: datering, aanhef (‘opener’), slotformule (‘closer’), handtekening, postscriptum en dergelijke.
+
<p>BTW, say hello to your wife</p></pre>
* opener: hierbinnen valt alle ‘aanlooptekst’ vanaf begin tot en met de ‘salute’.
+
 
* closer: het deel vanaf de eerste indicatie dat auteur gaat afsluiten (dat kan dus vóór de ‘salute’ zijn) tot en met ondertekening; alles wat groet, hoogachting e.d. is, is deel van de <salute>; wat betrekking heeft op de ondertekenaar (uw dw. dr, je toegenegen, yours, uw geheel onderworpen, je willige slaaf, etc.) is deel van de <signed>.
+
==Writing process and damage==
In de transcriptie worden formele aspecten behandeld (gecodeerd) als normale tekst en worden ze op de plaats gelaten waar ze geschreven werden. In de leestekst treedt echter een typografische uniformering op die mede gebaseerd is op de bedoelde formele kenmerken.
+
To encode different stages of changes, we use @seq
 +
i.e. Mondrian deleted a word and then added a new one.
 +
@seq assigns a sequence number related to the order in which the encoded features carrying this attribute are believed to have occurred.
 +
<pre>
 +
<del seq="1">yellow</del >
 +
<add seq="2" place="above">red</add>
 +
</pre>
 +
 
 +
You can also use seq=0 for immediate deletions (deletions while writing or Sofortkorrektur).
 +
 
 +
If a single act of  modification requires multiple elements, these elements have the same seq attribute:
 +
<pre>Ik <del seq="1">heb</del><add seq="1">lees</add> het boek<del seq="1" gelezen</del>.</pre>
 +
 
 +
On the del element, we can use the rend attribute to indicate it has been overwritten, either by an add or in a Sofortkorrektur:
 +
<pre><del rend="overwritten">wel</del><add>niet</add></pre>
 +
 
 +
A text fragment that has been modified is tagged as <seg> (segment), for the purpose of being able to display the multiple states of the text. It is up to the editor to choose meaningful segments. In the above example the sentence might be tagged as <seg>:
 +
<pre><seg>Ik <del seq="1" >heb</del><add seq="1" >lees</add het
 +
boek<del seq="1" gelezen</del>.</seg></pre>
 +
 
 +
 
 +
If an earlier deletion is restored we can encode this using <restore>. An example ('cocktail' replaced by 'drink', which is then deleted while 'cocktail' is being restored):
 +
<pre><restore seq="2"><del seq="1">cocktail</del></restore>
 +
<del seq="2"><add seq="1">drink</add></del></pre>
 +
 
 +
A Sofortkorrectur is not embedded in a seg-element, because there is no need to show the different states of the text. If it is desirable to show the scope of an immediate correction by overwriting, we use add (with seq="0"):
 +
<pre><del seq="0">F</del><add seq="0">V</add>ics</pre>
 +
 
 +
We don't use @seq on retrace.  
 +
 
 +
When a text continues in the margin, that does not by itself make the margin text an addition (<add>).
 +
 
 +
==Visual characteristics==
 +
If a paragraph is indented, use rend="indent" on its first line (<lb rend="indent">).  
 +
 
 +
We use rend="blockletters" for block capitals.
 +
 
 +
There is technically no difference between using a rend-attribute on an existing element and using a hi-element with that rend-attribute within that existing element. So 
 +
 
 +
<pre><addrLine rend="underline">New York City</addrLine></pre>
 +
 
 +
and
 +
 
 +
<pre><addrLine><hi rend="underline">New York City</hi></addrLine></pre>
 +
 
 +
are completely equivalent.
 +
 
 +
 
 +
 
 +
==Foreign additions in the text==
 +
Foreign additions unrelated to the contents of the letter, probably in another hand, we encode as <ab> (anonymous block).  
 +
‘Anonymous’ here refers not to the author being unknown, but to this being a block of text not identified as a paragraph,  
 +
a list or another block-level element. We use the hand attribute to point to the probable writer and describe the hands
 +
in the document hands.xml.
 +
 
 +
For instance (this is an example of an changed address provided by an anonymous person):
 +
<pre>
 +
<div type="envelope" xml:id="PD">
 +
  <!-- envelope recto -->
 +
  <pb n="envelope-r" xml:id="env-r" facs="#zone-env-r"/>
 +
  <div type="postalData">
 +
      <md:postmark>Paris XIV … </md:postmark>
 +
      <address type="receiver">
 +
        …
 +
      </address>
 +
  </div>
 +
  <ab hand="hands.xml#anon">James Abbott // 20xx Newbold Eve // Bronx</ab>
 +
 +
</div>   
 +
</pre>
 +
See [[Transcription: annotations (Mondrian)|annotations]] for notes as used to annotate the text.
 +
 
 +
 
 +
==Envelopes==
 +
Encode as div type=envelope. See SampleLetterWithEnvelope.xml. The addresses are encoded as divs with type="postalData". The address of the receiver goes on the front (recto) side of the envelope. Code the addresses as <address> with <addrline>s. Give the <address> a type-attribute (receiver, sender).
 +
<addrline>-elements are preceded by <lb>-elements if they begin on a new line.
 +
Short descriptive phrases (‘sent by’, ‘sender’, ‘To’) before the address go into <label>-elements.
 +
 
 +
An example of an address:
 +
<pre>
 +
<address type="receiver">
 +
    <lb/><addrLine rend="underline2">M<hi rend="super underline">r</hi>
 +
        Harry Holtzman</addrLine>
 +
    <lb/><addrLine>231 East 60<hi rend="super">th</hi> Street</addrLine>
 +
    <lb/><addrLine rend="underline">New York City</addrLine>
 +
</address>
 +
</pre>
  
 
==See also==
 
==See also==
 
* [[Transcription: structure (Mondrian)]]
 
* [[Transcription: structure (Mondrian)]]
* [[Transcription: representation of the source (Mondrian)]]
 
 
* [[Transcription: annotations (Mondrian)]]
 
* [[Transcription: annotations (Mondrian)]]
* [[XML Mondrian Guidelines]]
+
* [[Transcription (Mondrian)]]
  
 
[[Category:XML Mondrian]]
 
[[Category:XML Mondrian]]

Latest revision as of 15:12, 26 April 2017

Physical structure

We encode a page break before each page. The page break is represented by a pb-element. The page break element carries a f-attribute (refers to the folio, or sheet), a n-attribute (page number) and a facs-attribute (reference to the corresponding <surface> or <zone> element under <facsimile>).

Example:

<pb f="1r" n="1" facs="#z1r-1"/>

Paragraphs of text that belong at a certain position in the letter, even though they are written on another page, are placed in their logical, not physical, position. In that case, we repeat the pb-element of the physical page to indicate the writing is continued on this earlier page. (We still need to discuss how this will be shown to the user.)

For example: Suppose Mondrian writes a two page-letter (one sheet) and after finishing the letter adds ‘BTW, say hello to your wife’ on page 1. We represent that as follows (simplified):

In the facsimile element:

<facsimile>
 <surface n="1" xml:id="s1r">...</surface>
 <surface n="2" xml:id="s1v">...</surface>
</facsimile>

In the text:

<pb f="1r" n="1" facs="#s1r"/>   
(text of page 1)

<pb f="1v" n="2" facs="#s1v"/>   
(text of page 2)

<pb f="1r" n="1" facs="#s1r"/>   
<p>BTW, say hello to your wife</p>

Writing process and damage

To encode different stages of changes, we use @seq i.e. Mondrian deleted a word and then added a new one. @seq assigns a sequence number related to the order in which the encoded features carrying this attribute are believed to have occurred.

<del seq="1">yellow</del >
<add seq="2" place="above">red</add>

You can also use seq=0 for immediate deletions (deletions while writing or Sofortkorrektur).

If a single act of modification requires multiple elements, these elements have the same seq attribute:

Ik <del seq="1">heb</del><add seq="1">lees</add> het boek<del seq="1" gelezen</del>.

On the del element, we can use the rend attribute to indicate it has been overwritten, either by an add or in a Sofortkorrektur:

<del rend="overwritten">wel</del><add>niet</add>

A text fragment that has been modified is tagged as <seg> (segment), for the purpose of being able to display the multiple states of the text. It is up to the editor to choose meaningful segments. In the above example the sentence might be tagged as <seg>:

<seg>Ik <del seq="1" >heb</del><add seq="1" >lees</add het 
boek<del seq="1" gelezen</del>.</seg>


If an earlier deletion is restored we can encode this using <restore>. An example ('cocktail' replaced by 'drink', which is then deleted while 'cocktail' is being restored):

<restore seq="2"><del seq="1">cocktail</del></restore>
<del seq="2"><add seq="1">drink</add></del>

A Sofortkorrectur is not embedded in a seg-element, because there is no need to show the different states of the text. If it is desirable to show the scope of an immediate correction by overwriting, we use add (with seq="0"):

<del seq="0">F</del><add seq="0">V</add>ics

We don't use @seq on retrace.

When a text continues in the margin, that does not by itself make the margin text an addition (<add>).

Visual characteristics

If a paragraph is indented, use rend="indent" on its first line (<lb rend="indent">).

We use rend="blockletters" for block capitals.

There is technically no difference between using a rend-attribute on an existing element and using a hi-element with that rend-attribute within that existing element. So

<addrLine rend="underline">New York City</addrLine>

and

<addrLine><hi rend="underline">New York City</hi></addrLine>

are completely equivalent.


Foreign additions in the text

Foreign additions unrelated to the contents of the letter, probably in another hand, we encode as <ab> (anonymous block). ‘Anonymous’ here refers not to the author being unknown, but to this being a block of text not identified as a paragraph, a list or another block-level element. We use the hand attribute to point to the probable writer and describe the hands in the document hands.xml.

For instance (this is an example of an changed address provided by an anonymous person):

<div type="envelope" xml:id="PD">
   <!-- envelope recto -->
   <pb n="envelope-r" xml:id="env-r" facs="#zone-env-r"/> 
   <div type="postalData">
      <md:postmark>Paris XIV … </md:postmark>
       <address type="receiver">
         …
       </address>
   </div>	
   <ab hand="hands.xml#anon">James Abbott // 20xx Newbold Eve // Bronx</ab>
…
</div>    

See annotations for notes as used to annotate the text.


Envelopes

Encode as div type=envelope. See SampleLetterWithEnvelope.xml. The addresses are encoded as divs with type="postalData". The address of the receiver goes on the front (recto) side of the envelope. Code the addresses as <address> with <addrline>s. Give the <address> a type-attribute (receiver, sender). <addrline>-elements are preceded by <lb>-elements if they begin on a new line. Short descriptive phrases (‘sent by’, ‘sender’, ‘To’) before the address go into <label>-elements.

An example of an address:

<address type="receiver">
    <lb/><addrLine rend="underline2">M<hi rend="super underline">r</hi>
        Harry Holtzman</addrLine>
    <lb/><addrLine>231 East 60<hi rend="super">th</hi> Street</addrLine>
    <lb/><addrLine rend="underline">New York City</addrLine>
</address>

See also