Difference between revisions of "TEI Header (Mondrian)"

From XML
Jump to: navigation, search
 
(One intermediate revision by the same user not shown)
Line 1: Line 1:
De <teiHeader> bevat de metadata van de brief. In grote lijnen ziet deze er als volgt uit:
+
== The teiHeader ==
 +
The <teiHeader> contains the letter's or manuscript's metadata. In an earlier stage of the
 +
project we used encoding guidelines for the header derived from the [https://ctb.kantl.be/project/dalf/dalfdoc/index.html DALF project].
 +
We switched to a more modern encoding that uses the <correspDesc> element.
 +
The elements of the teiHeader that we use are the:
 +
* fileDesc
 +
* profileDesc
 +
* revisionDesc
 +
 
 +
This looks as follows:
 
<pre>
 
<pre>
 
<teiHeader>
 
<teiHeader>
<fileDesc>
+
  <fileDesc>
  <titleStmt></titleStmt>
+
    ...
   <publicationStmt></publicationStmt>
+
   </fileDesc>
   <sourceDesc>
+
   <profileDesc>
  <md:letDesc>
+
     ...
     <md:letIdentifier>
+
  </profileDesc>
    <idno type="pilot"></idno>
+
  <revisionDesc>
    <idno type="letterId"> </idno>
+
     ...
    <idno type="whereabouts"> </idno>
+
   </revisionDesc>
    <idno type="def"></idno>
+
     </md:letIdentifier>
+
    <md:letHeading>
+
    <author></author>
+
    <md:addressee></md:addressee>
+
    <md:placeLet attested="yes">Parijs</md:placeLet>
+
    <md:dateLet></md:dateLet>
+
    </md:letHeading>
+
    <md:letPhysDesc>
+
    <md:type></md:type>
+
    <md:decoration>
+
      <md:decoList>
+
      <md:decoItem>
+
        <md:letDecoDesc></md:letDecoDesc>
+
      </md:decoItem>
+
      </md:decoList>
+
    </md:decoration>
+
    </md:letPhysDesc>
+
    <md:letContents></md:letContents>
+
    <md:envOcc occ=""/>
+
  </md:letDesc>
+
   </sourceDesc>
+
</fileDesc>
+
 
<teiHeader>
 
<teiHeader>
 
</pre>
 
</pre>
  
==Richtlijnen voor de metadata==
+
== The fileDesc ==
* Editeurstekst is (in elk geval voorafgaand aan publicatie) in het Nederlands.
+
A typical fileDersc will contain a fileStmt, a publicationStmt and sourceDesc. The sourceDesc
* Voor author van de brief wordt de voorkeursnaam uit RKD Artists gebruikt.
+
will contain a msDesc (manuscript description) that contains an msIdentifier detailing the location of the manuscript
* adressee: overnemen uit briefhoofd (niet van enveloppe). If a letter has multiple addressees, we have as many <addressee> elements.  
+
as well as alternate identifiers. The msDesc will also contain a physDesc (physical description) that identifies the type of
* In titleStmt: volgorde van beschrijving is
+
the manuscript (brief or briefkaart) and describe decoration, if any.  
‘[Documenttype (zie hierna)] aan [naam]. [Plaats], [dag van de week] [datum voluit].’
+
 
Bijvoorbeeld: Briefkaart aan Harry Holtzman. Parijs, donderdag 14 maart 1935.
+
It may look like this:
Of: Postblad aan Harry en Eileen Holtzman. New York, ongedateerd.
+
Wanneer het poststempel de datum heeft bepaald, wordt na de volledige datum toegevoegd: (poststempel). Bijv. ‘donderdag 14 maart 1935 (poststempel)’.
+
Brieven etc. aan Mondriaan: Telegram van Theo van Doesburg aan Mondriaan,[etc.].
+
NB: Geadresseerde(n) in titel is/zijn degenen(n) die in de aanhef van de brief genoemd worden (kan dus afwijken van geadresseerde(n) op enveloppe).
+
Bijvoorbeeld:
+
 
<pre>
 
<pre>
<titleStmt>
+
<fileDesc>
   <title>Briefkaart aan Harry Holtzman. Parijs, donderdag 14
+
   <titleStmt>
    maart 1935</title>
+
    <title>Briefkaart aan <ref target="bio.xml#MondriaanCarel">Carel</ref> en <ref target="bio.xml#MondriaanLouis">Louis Mondriaan</ref>. Hengelo, maandag 22 oktober 1906 (poststempel).</title>
  <editor>Wietse Coppes</editor>
+
    <editor xml:id="wc">Wietse Coppes</editor>
  <editor>Leo Jansen</editor>
+
    <editor xml:id="lj">Leo Jansen</editor>
  <sponsor>Mondrian Edition Project</sponsor>
+
    <sponsor>Mondriaan Editieproject</sponsor>
</titleStmt>
+
  </titleStmt>
 +
  <publicationStmt>
 +
    <p>(to be provided later)</p>
 +
  </publicationStmt>
 +
  <sourceDesc>
 +
    <msDesc>
 +
      <msIdentifier>
 +
        <country>Nederland</country>
 +
        <settlement>Den Haag</settlement>
 +
        <institution>RKD</institution>
 +
        <idno>150.558</idno>
 +
        <altIdentifier><idno type="letterId">19061022_MOND_C+L_0012</idno></altIdentifier>
 +
        <altIdentifier><idno type="def"/></altIdentifier>
 +
      </msIdentifier>
 +
      <physDesc>
 +
        <objectDesc form="briefkaart"/>
 +
        <decoDesc>
 +
          <decoNote/>
 +
        </decoDesc>
 +
      </physDesc>
 +
    </msDesc>
 +
  </sourceDesc>
 +
</fileDesc>
 
</pre>
 
</pre>
* idno’s:
+
 
** <idno type="pilot">P072</idno>
+
== The profileDesc ==  
** <idno type="letterId">19401104_HOLT</idno>
+
The profileDesc describes the 'correspondence actions'. For example:
** <idno type="whereabouts">NL-HaRKD.0740.109</idno>
+
 
** <idno type="def"></idno>
+
“pilot” is het nummer in de pilot, met drie cijfers; hoofdletter P. Dit pilotnummer is in de bestandsnaam gecombineerd met het volgende:
+
“letterId” bestaat uit: jjjjmmdd_ABCD (datum brief en eerste vier letters achternaam geadresseerde). Hiermee krijgt elke brief een unieke naam (bij gelijke datum én geadresseerde: uitbreiden als in bestandsnaam; id. brieven aan Mondriaan).
+
“whereabouts” bevat verblijfplaats. Indien mogelijk – bij archieven – ISIL-nummer opnemen; dit bevat ook een code (afkorting) van de bewaarplaats.
+
“def” is het later in te vullen definitieve nummer in de editie; nu niets invullen.
+
* <md:postmark> als laatste van de enveloppegegevens.
+
* Postzegels (stamps): we nemen geen informatie over het eigenlijke zegel over. Gegevens van stempels die geen verzendingsgegevens bevatten (bijv. ‘Utilisez le télégramme à 3 Frs 50 ou 4 Frs pour quinze mots’) worden niet overgenomen.
+
* Poststempels: ze zijn meestal rond maar worden soms aangevuld met een tweede (niet altijd rond) stempel (bijv. 19411026_P080_HOLT). Daarom worden de presentatie van de gegevens die aan het poststempel of de poststempels worden ontleend, als volgt gestandaardiseerd.
+
** Volgorde van de gegevens (postkantoor niet altijd vermeld), gescheiden door slash tussen spaties: Plaats / Postkantoor / datum / tijd.  Paris / Av. d’Orléans / 8 sept 38 / 18h30; in gevallen waar, meestal door een cijfer, een postagentschap o.i.d. wordt aangeduid, wordt dit achter de plaatsnaam gezet, bijv. Parijs 43.
+
** Lettertypen in stempels (kapitalen, superscript etc.) worden niet overgenomen, tenzij het romeinse cijfers zijn. Hoofdletters worden gebruikt zoals in normale tekst (plaatsnamen, maandaanduiding in Engels etc.). Ook bijzondere tekens die als opvulling of versiering bedoeld zijn (asterisken etc.) worden niet overgenomen; zie echter ook hierna, bij tijd-/minutenaanduiding.
+
** De vorm waarin bijvoorbeeld tijd of datum genoteerd is, wordt wel overgenomen: 5th, 7:30pm, Apr 26 etc.; punten worden overgenomen; afkortingen worden gehandhaafd, niet opgelost; superscript wordt op de regel gezet en zonodig door punt gescheiden (730 wordt 7.30; 5th wordt 5th); voor am/pm géén spatie. De minutenaanduiding voor 00 bij hele uren wordt weggelaten als die bestaat uit een streepje, asterisk etc. (20- of 20* wordt 20, 20.00 blijft 20.00).
+
** Gegevens van stempels die geen verzendingsgegevens bevatten (bijv. ‘Utilisez le télégramme à 3 Frs 50 ou 4 Frs pour quinze mots’) worden niet overgenomen.
+
** Stempels zijn vaak gedeeltelijk slecht of niet leesbaar; als de stempels van andere enveloppen of (prent)briefkaarten bekend zijn, mag het ontbrekende worden aangevuld (dit geldt uiteraard niet voor de datum-/tijdgegevens).
+
* Voorgedrukte tekst op briefkaarten voor adressering, naam e.d. worden niet overgenomen.
+
* Prentbriefkaarten: nader in te vullen; evt. tekst bij foto’s moet worden vertaald en dus overgenomen.
+
* Wanneer in andere hand het adres op de enveloppe is veranderd voor doorzending, wordt dat na het oorspronkelijke adres als ‘anonymous block’ met hands=anoniem getagd. Indien meerdere, dan in veronderstelde volgorde.
+
* In metadata worden personen, adressen en data niet apart als zodanig getagd als die functies al blijkt uit xml-schema zelf. Bijv. <addrLine>, <postmark> e.d. Dergelijke tagging alleen binnen <body>.
+
* Alles m.b.t. facsimile-gegevens, zones e.d.: invullen
+
*<dateLet>: als jjjj-mm-dd. The text of dateLet is what you want to appear in the edition. Attributes indicate the precise date using the when attribute and possible notBefore and notAfter (in this case, the when attribute is what will be used for sorting).
+
** Single date:
+
<pre><md:dateLet attested="yes" when="1935-03-13">March 13, 1935</md:dateLet></pre>
+
** Date range:
+
<pre><md:dateLet attested="no" when="1935-03-13" notAfter="1935-03-14"
+
  notBefore="1935-03-13">March 13 or March 14, 1935</md:dateLet></pre>
+
*<publicationStmt>: <authority>Coppes/Jansen</authority>
+
* We vullen language in; dit is behalve een gewoonte ook van belang voor de zoekmachine.
+
* Informatie over de decoratie ziet er bijvoorbeeld zo uit:
+
 
<pre>
 
<pre>
<decoration>
+
<profileDesc>
<decoList>
+
  <correspDesc>
  <decoItem id="fig1">
+
    <correspAction type="sent">
  <decoDesc>
+
      <name key="56854">Piet Mondriaan</name>
    <p>small black/white drawing of a tree</p>
+
      <date when="1906-10-22">maandag 22 oktober 1906</date>
  </decoDesc>
+
      <placeName>Hengelo</placeName>
  </decoItem>
+
    </correspAction>
  <decoItem id="fig2">
+
    <correspAction type="received">
  <decoDesc>
+
      <name key="...">Carel Mondriaan</name>
    <p>small color drawing of suggested page layout, containing some text</p>
+
      <name key="...">Louis Mondriaan</name>
  </decoDesc>
+
    </correspAction>
  </decoItem>
+
  </correspDesc>
</decoList>
+
</profileDesc>
</decoration>
+
 
</pre>
 
</pre>
* Attention! Elements <author> and <addressee> are required to have a @key, which points to a resource about the person mentioned (in this case, the RKDartists inventory); <author> and <addressee> can also have @attested and @accepted; <placeLet> and <dateLet> can just have @attested. We vullen attested/accepted in. (Attested: expliciet gedocumenteerd; accepted: inductief)
+
 
 +
====About the dating====
 +
 
 +
The text of <date>  in <correspAction type="sent"> is what you want to appear in the edition. The @when attribute indicates the precise
 +
date; if necessary use @notBefore and/or @notAfter to indicate a range (in this case, the @when attribute is what will be used for sorting).
 +
In the attributes, the dates are entered as yyyy-mm-dd. 
 +
* Single date:
 +
<pre><date when="1935-03-13">March 13, 1935</date></pre>
 +
* Date range:
 +
<pre><date when="1935-03-13" notAfter="1935-03-14"
 +
  notBefore="1935-03-13">March 13 or March 14, 1935</date></pre>
 +
 
 +
 
 +
== The revisionDesc ==
 +
The revisionDesc is used to track the progress of the editorial work on the specific letter or manuscript.
 +
 
 +
 
 +
 
 +
====Some remarks====
 +
 
 +
The md:type attribute contains the type of document and has one of the values: letter, postcard, telegram (or manuscript, article?)
 +
 
 +
The elements <author> and <addressee> are required to have a @key, which points to a resource about the person mentioned (in this case, the RKDartists inventory)
 +
 
 +
<author> and <addressee> can also have @attested and @accepted; <placeLet> and <dateLet> can just have @attested. We vullen attested/accepted in. (Attested: expliciet gedocumenteerd; accepted: inductief)
 +
 
 +
More information on how these elements are used is available in [[Creating Mondrian: further guidelines]]
 +
 
 +
<s>In <letContents>, informations can be organized in one or more paragraphs <p>, keywords <keywords> or as notes <note>.</s> We probably won't use this.
 +
 
 +
<envOcc> is a required element, with a required @occ, to encode the presence of an envelope.
 +
 
 +
 
  
 
==See also==
 
==See also==

Latest revision as of 17:44, 22 January 2020

The teiHeader

The <teiHeader> contains the letter's or manuscript's metadata. In an earlier stage of the project we used encoding guidelines for the header derived from the DALF project. We switched to a more modern encoding that uses the <correspDesc> element. The elements of the teiHeader that we use are the:

  • fileDesc
  • profileDesc
  • revisionDesc

This looks as follows:

<teiHeader>
  <fileDesc>
    ...
  </fileDesc>
  <profileDesc>
    ...
  </profileDesc>
  <revisionDesc>
    ...
  </revisionDesc>
<teiHeader>

The fileDesc

A typical fileDersc will contain a fileStmt, a publicationStmt and sourceDesc. The sourceDesc will contain a msDesc (manuscript description) that contains an msIdentifier detailing the location of the manuscript as well as alternate identifiers. The msDesc will also contain a physDesc (physical description) that identifies the type of the manuscript (brief or briefkaart) and describe decoration, if any.

It may look like this:

<fileDesc>
  <titleStmt>
    <title>Briefkaart aan <ref target="bio.xml#MondriaanCarel">Carel</ref> en <ref target="bio.xml#MondriaanLouis">Louis Mondriaan</ref>. Hengelo, maandag 22 oktober 1906 (poststempel).</title>
    <editor xml:id="wc">Wietse Coppes</editor>
    <editor xml:id="lj">Leo Jansen</editor>
    <sponsor>Mondriaan Editieproject</sponsor>
  </titleStmt>
  <publicationStmt>
    <p>(to be provided later)</p>
  </publicationStmt>
  <sourceDesc>
    <msDesc>
      <msIdentifier>
        <country>Nederland</country>
        <settlement>Den Haag</settlement>
        <institution>RKD</institution>
        <idno>150.558</idno>
        <altIdentifier><idno type="letterId">19061022_MOND_C+L_0012</idno></altIdentifier>
        <altIdentifier><idno type="def"/></altIdentifier>
      </msIdentifier>
      <physDesc>
        <objectDesc form="briefkaart"/>
        <decoDesc>
          <decoNote/>
        </decoDesc>
      </physDesc>
    </msDesc>
  </sourceDesc>
</fileDesc>

The profileDesc

The profileDesc describes the 'correspondence actions'. For example:

<profileDesc>
  <correspDesc>
    <correspAction type="sent">
      <name key="56854">Piet Mondriaan</name>
      <date when="1906-10-22">maandag 22 oktober 1906</date>
      <placeName>Hengelo</placeName>
    </correspAction>
    <correspAction type="received">
      <name key="...">Carel Mondriaan</name>
      <name key="...">Louis Mondriaan</name>
    </correspAction>
  </correspDesc>
</profileDesc>

About the dating

The text of <date> in <correspAction type="sent"> is what you want to appear in the edition. The @when attribute indicates the precise date; if necessary use @notBefore and/or @notAfter to indicate a range (in this case, the @when attribute is what will be used for sorting). In the attributes, the dates are entered as yyyy-mm-dd.

  • Single date:
<date when="1935-03-13">March 13, 1935</date>
  • Date range:
<date when="1935-03-13" notAfter="1935-03-14"
   notBefore="1935-03-13">March 13 or March 14, 1935</date>


The revisionDesc

The revisionDesc is used to track the progress of the editorial work on the specific letter or manuscript.


Some remarks

The md:type attribute contains the type of document and has one of the values: letter, postcard, telegram (or manuscript, article?)

The elements <author> and <addressee> are required to have a @key, which points to a resource about the person mentioned (in this case, the RKDartists inventory)

<author> and <addressee> can also have @attested and @accepted; <placeLet> and <dateLet> can just have @attested. We vullen attested/accepted in. (Attested: expliciet gedocumenteerd; accepted: inductief)

More information on how these elements are used is available in Creating Mondrian: further guidelines

In <letContents>, informations can be organized in one or more paragraphs

, keywords <keywords> or as notes <note>.</s> We probably won't use this. <envOcc> is a required element, with a required @occ, to encode the presence of an envelope.

See also