Your browser doesn't support the features required by impress.mod.js, so you are presented with a simplified version of this presentation.

For the best experience please use the latest Chrome, Safari or Firefox browser.

2017-09-27 | ITUG 2017 workshop

Von TEI XML zu MSWord

TUSTEP-Modul #*export

Data: https://github.com/kollatzthomas/20170927_TEI2RTF
Slides: https://kollatzthomas.github.io/20170927_TEI2RTF/
Thomas Kollatz | @kol_t | Twitter KollatzThomas | CC-BY 4.0
Akademie der Wissenschaften und Literatur / Digital Academy | Mainz

Aufbau des Workshops

  1. #*import
  2. TUSTEP und XML: Editor
  3. #*export
    1. TUSTEP-Datei
    2. TEI-Datei
  4. TUSTEP und XML: TUSCRIPT

01

#*import

#*import

Das Standardmakro #*import ist Teil des modularen TUSTEP Programmpakets
Mit #*import wird eine Office-Datei in ein vereinfachtes XML-Format konvertiert.

Nützliche Kommandos

Aufruf
#info,import Anzeige der Spezifikationen des Standardmakros #*import
#zebe,import Anzeige der kompletten Beschreibung des Standardmakros #*import

Syntax

#*import,
quelle, Name der Quelldatei RTF | Word 2003 XML-Dokument
ziel, Name der Zieldatei TUSTEP Datei
modus, Modus keine Angaben nötig
loeschen, + | - löschen | nicht löschen der Zieldateien
ignorieren, - | + Ignorierbare Tags und Attribute ausgeben | nicht ausgeben
Beispiel: #*import,beispiel.rtf,beispiel.tf,,lo=+,ig=-

Import einer RTF-Datei

Quelldatei: beispiel.rtf | Zieldatei: beispiel.tf

Lösung

Gib Kommando  >#an,beispiel.rtf
Gib Kommando  >#da,beispiel.tf
Gib Kommando  >#*import,beispiel.rtf,beispiel.tf,,lo=+,ig=-
Gib Kommando  >#e,beispiel.tf

02

TUSTEP und XML: Editor

Editoranweisungen für Tags

Tags überprüfen
tpv Tagprüfung vorwärts
tpr Tagprüfung rückwärts
Tags anzeigen
tl Tagliste mit Häufigkeit
tlh Tagliste mit Hierarchie "von oben" sortiert
tli Tagliste mit Hierarchie "von unten" sortiert (invers)
tz Tagzeige
alt-g SELECT_TAGS
Tags autovervollständigen
alt-aAnfangstag einfügen
alt-eEndetag einfügen
Weitere Anweisungen
alt-t
alt-v
alt-r

03

#*export

#*export

Das Standardmakro #*export ist Teil des modularen TUSTEP Programmpakets
Mit #*export kann im Prinzip jede XML-Datei und jedes XML-Format strukturiert in gängige Office Programme überführt werden

Nützliche Kommandos

Aufruf
#info,export Anzeige der Spezifikationen des Standardmakros #*export
#zebe,export Anzeige der kompletten Beschreibung des Standardmakros #*export

Syntax

#*export,
quelle, Name der Quelldatei TUSTEP-Datei
ziel, Name der Zieldatei RTF-Datei
modus, Modus keine Angaben nötig
loeschen, + | - löschen | nicht löschen der Zieldateien
Definitionen, dateiname | - Name der Datei mit (Format)-Definitionen | Keine Definitionen in separater Datei
Optionen, - | Blank keine Definitionen | Alle Blanks exportieren
Anzeigen, - | + Nicht anzeigen | Anzeigen (bspw. in MS Word
#*export,beispiel.tf,beispiel_neu.rtf,,lo=+,de=-,op=-,an=+

Export einer RTF-Datei

Quelldatei: beispiel.tf, wobei die Definitionen in dieser Datei enthalten sind de=- | Zieldatei: beispiel_neu.rtf

Gib Kommando  >#da,beispiel_neu.rtf,FDF-ap
Gib Kommando  >#*export,beispiel.tf,beispiel_neu.rtf,,lo=+

Export einer RTF-Datei

Aufbau einer Export-Quelldatei

<document source="beispiel.rtf" time="2017-09-27 01:24:37">
    <head>
        <dstyle font="Times" size="11" align="left" hyphenation="on" 
            tab="35" line-break="expand"/>
        <pstyle name="p" font="Calibri"/>
        <pstyle name="Überschrift-1" no-break="title" before="12" 
            navigation="1" font="Calibri Light" size="16" fgc="2F5496"/>
        <cstyle name="persName" font="Helvetica" size="9" fgc="000000"/>
        <cstyle name="placeName" font="Helvetica" size="9" fgc="000000"/>
    </head>
    <body>
        <!-- Textteil -->
    </body>
<document>
                    
                
Wie Tags interpretiert und formatiert werden sollen, steht entweder in der <head> Sektion der zu exportierenden TUSTEP-XML-Datei oder in einer eigenen Datei mit entsprechenden Definitionen.

Übung

Beim Export der Datei beispiel.tf sollen Personennamen in roter Farbe und Ortsangaben in blauer Farbe ausgebeben werden. Datumsangaben sollen grün formatiert werden.

Quelldatei: beispiel.tf | Zieldatei: beispiel_neu.rtf

Lösung

Definitionen

Datei: beispiel.sty

<cstyle name="persName" font="Helvetica" size="9" fgc="red"/>
<cstyle name="placeName" font="Helvetica" size="9" fgc="blue"/>
<cstyle name="datum" fgc="green"/>

<datum>27.09.2017</datum> 

Kommando

#*export,beispiel.tf,beispiel_neu.rtf,,lo=+,de=beispiel.sty

Export einer RTF-Datei

Definitionen stehen in eigener Datei

beispiel.tf – Export-Quelldatei ohne <head>-Sektion:

<document source="beispiel.rtf" time="2017-09-27 01:24:37">
    <body>
        <!-- Textteil -->
    </body>
<document>

beispiel.sty – Datei mit Definitionen:

<dstyle font="Times" size="11" align="left" hyphenation="on" tab="35" line-break="expand"/>
<pstyle name="p" font="Calibri"/>
<pstyle name="‹berschrift-1" no-break="title" before="12" navigation="1" font="Calibri Light" size="16" fgc="2F5496"/>
<cstyle name="persName" font="Helvetica" size="9" fgc="red"/>
<cstyle name="placeName" font="Helvetica" size="9" fgc="blue"/>
<cstyle name="datum" fgc="green"/>
<!-- document und body-Tag definieren -->
<alias alias="document" tag="dummy"/>
<alias alias="body" tag="dummy"/>

Kommando

#*export,beispiel.tf,beispiel_neu.rtf,,lo=+,ig=-

04

TUSTEP und XML: TUSCRIPT

Transformation von TEI nach RTF

TEI TUSTEP RTF
  • tei.xml
    XML Datei
  • tustep.tf
    TUSTEP-XML-Datei
  • style.tf
    TUSTEP-XML-Datei mit STYLE Definitionen
  • #*export
    TUSTEP Standardmakro
  • ergebnis.rtf
    RTF-Datei
#*export,tustep.tf,ergebnis.rtf,de=style.tf

Transformation von TEI nach RTF

Die folgende Beispieldatei wurde dankenswerterweise von Marjam Mahmoodzada (Digitale Akademie Mainz) zur Verfügung gestellt.

Es handelt sich um eine Postkarte, die Jacoba van Heemskerck am 27. Juli 1914 an Herwerth Walden geschrieben hat. Alle Briefe, Tagebücher und Telegramme dieser Edition sind in TEI XML P5 ausgezeichnet.

Marjam Mahmoodzada: Eine digitale Edition. Briefe von Jacoba van Heemskerck und Franz Marc an Herwarth Walden (1914-1915), Mainz 2017 (Masterarbeit). http://www.students.uni-mainz.de/mmahmood/html/

TEI XML

Elemente einer TEI XML-Datei

  • Metadaten TeiHeader
  • Anrede opener
  • Briefkorpus
  • Fussnoten note
  • closer closer
  • Register
    • Personen persName
    • Orte placeName
    • Werke term
Transformation semantischer Auszeichnung in Typographie. Die Semantik der XML-Datei kann in der Form von Formatvorlagen in die RTF-Datei übertragen werden.

Transformation TEI XML zu TUSTEP mit TUSCRIPT

Beispielskripte skripte

F A Z I T

#*import | #*export

Die Standardmakros #*import und #*export sind Teil des modularen TUSTEP Programmpakets
Mit #*export kann im Prinzip jede XML-Datei und jedes XML-Format strukturiert in gängige Office Programme überführt werden

F I N I S

Danke

Literatur

Beispieldateien mit freundlicher Genehmigung von Marjam Mahmoodzada aus:

Dokumentation

Download