‹Kopfzeile›
‹Datum/Uhrzeit›
Klicken Sie, um die Formate des Vorlagentextes zu bearbeiten
Zweite Ebene
Dritte Ebene
Vierte Ebene
Fünfte Ebene
‹Fußzeile›
‹Nr.›
Diese Technische Dokumentation soll
Leuten, die HTML-Seiten für LinksRhein erstellen wollen, den Einstieg
erleichtern. Der Schwerpunkt liegt auf der Erklärung des HTML-Codes zu einem
Beispieldokument (ein Leserbrief im Rahmen des Hungerstreiks von Flüchtlingen
im letzten Jahr). Es empfiehlt sich ein HTML-Einführungsbuch zur Vertiefung zu
lesen. Darüber hinaus wird das Übertragen des Dokuments auf den WebServer
sowie der Zusammenhang zwischen der Inhaltserschließung mit der
Suchfunktionalität beschrieben.
Die Grafik zeigt, wie die
LinksRhein-Seiten produziert werden. Die elektronischen Texte werden in einem
HTML-Editor in HTML umgesetzt und inhaltlich erschlossen. Anschließend
übertragen wir sie mit einen FTP-Programm auf den WebServer der Firma
Seeseiten. Unsere Suchmaschine grast diesen Server (genauer: nur die von uns
produzierten Seiten) täglich ab und erstellt einen Index. Mit einem WebBrowser
(z.B. Netscape Navigator oder Microsoft Internet Explorer) kann auf die Seiten
weltweit zugegriffen werden.
Texte nehmen wir am liebsten in
elektronischer Form (z.B. als Mail oder Word-Datei) entgegen. Ansonsten müssen
wir sie erst einscannen und mit einer Texterkennungssoftware (OCR) behandeln,
was recht aufwändig ist. Sind Bilder enthalten, müssen diese in der Regel mit
Bildbearbeitungssoftware nachbearbeitet werden. Wichtig ist dabei, dass wegen
der Übertragungszeiten im Internet Bilder nicht größer als etwa 100 kByte sein
sollten, weshalb sie vorher möglichst gut komprimiert werden sollten. Mit
einem 56k-Modem braucht so eine Datei immer noch gut 5 Sekunden, bis sie
übertragen ist. In der Regel muss eine Datei, die für das Web aufbereitet
wird, völlig neu layoutet werden.
Wir führen zu jedem Dokument in
LinksRhein ein umfangreiche Inhaltserschließung durch. Das Bild zeigt, am
Beispiel eines Leserinnenbriefs welche. Titel, Autorin, Erstellungsdatum,
URL(d.i. die Internetadresse) sind nur die vordergründigsten Angaben. Nicht
sichtbar ist z.B. die Kurzbeschreibung jedes Dokuments, die später in der
Trefferliste der Suchmaschine angezeigt wird. Auch die Zuordnung zu dem
jeweiligen Kontext (hier: die Pressedoku der Karawane-Seite) in Form von Links
und Navigationsbuttons ist eine Form der Inhaltserschließung.
Jedes HTML-Dokument besitzt einen
Kopfteil (Header) und einen Körper (Body), die mit den entsprechenden
HTML-Tags gekennzeichnet sind. Im Header von LinksRhein-Dokumenten sind der
Titel, der Verweis auf das Stylesheet sowie die Dublin Core-Metadaten
untergebracht. Im Body befinden sich das LinksRhein-Logo, Quellenangabe, obere
und untere Navigationsleiste sowie der eigentliche Text. Diese Elemente findet
ihr auch in der folgenden Darstellung des HTML-Codes unseres Beispieldokuments
wieder.
Am Beispiel eines Leserbriefs soll der
HTML-Code von LinksRhein-Seiten erklärt werden. Auf der linken Seite befinden
sich die Veranschaulichungen / Erklärungen des etwas länglichen Codes, der auf
der rechten Seite abgebildet ist.
Stylesheets sind Dateien, die
einheitliche Layoutbeschreibungen für zahlreiche HTML-Seiten enthalten. Für
unterschiedliche Ausgabegeräte (Drucker=print/ Monitor=screen) können im HTML-
Header durch den Verweis auf unterschiedliche Stylesheets unterschiedliche
Layout-Vorgaben definiert werden. Die Layout-Definitionen befinden sich hier
in den Dateien lr_print.css und lr_screen.css. Wird eine
Textzeile mit dem Style von Titel versehen, ist die Darstellung fett (bold),
30 pixel hoch (font-size: 30pt) und hat einen Abstand zur nächsten Zeile von
ebenfalls 30 pt. Für die Autorin wird ein kursives, fettes Schriftbild, mit
einer Ausrechtung an den rechten Rand definiert.
Dublin Core ist ein internationaler
Metadaten Standard für die Beschreibung von Dokumenten im World Wide Web. Es
umfasst im Kern 15 Felder wie Titel, Beschreibung, Schlagwort, Datum etc.) In
HTML werden Dublin Core Metadaten mit dem Meta-Tag (<meta name=„“
content=„“>) ausgezeichnet. Die Suchmaschine von LinksRhein indexiert
sowohl den Volltext als auch jedes Feld dieser Metadaten und ermöglicht später
die Suche in diesen Feldern. Gänsefüsschen (wie hier bei DC.Description)
müssen mit " gekennzeichnet werden. Mehrere DC.Creator oder
DC.Subject-Angaben kommen untereinander in separate Zeilen. Der Name der
Autorin muss in der Reihenfolge
Nachname, Vorname angegeben werden. Das Datum entspricht dem
Veröffentlichungsdatum der elektronischen Version und ist mit der Notation
Jahr-Monat-Tag einzugeben. Als Textart (DC.Type) gibt es bei uns eigentlich
nur text.article für Zeitungsartikel und text.pamphlet für
Flugis etc. und text.info für
Hier ist die obere Navigationsleiste und
ihr HTML-Code abgebildet. Auf der linken Seite befinden sich Links zu den
übergeordneten Verzeichnissen, auf der rechten Seite gibt es zwei
Navigationspfeile und ein Button um auf das Suchformular zu wechseln.
Ein LinksRhein Dokument, wie z.B. der
Leserbrief, besteht aus 2 Tabellen, von denen die obere 2 Zeilen mit je 2
Spalten besitzt und die untere nur aus einer Zeile besteht. Die 1. Tabelle hat
in der 1. Zeile das Logo und die Quellenangabe und in der 2. Zeile die
Navigationsleiste. Nach dem Text folgt die 2. Tabelle. Sie besteht nur aus
einer Navigationsleiste (links wieder die übergeordneten Verzeichnisse, rechts
zwei Navigationsbuttons und ein Button um zum Anfang des Dokuments
zurückzukommen.
Die Tabellenstruktur wird wie oben
dargestellt nach HTML umgesetzt. Die HTML-Tags lauten
<table></table> für eine Tabelle, <tr></tr> für eine
Zeile und <td></td>für eine Spalte. Es sind also 2 Tabellen, von
denen die obere aus 2 Zeilen mit je 2 Spalten und die untere aus 1 Zeile mit
ebenfalls 2 Spalten besteht.
Im Suchformular können sowohl
Volltextsuchen als auch Suchen in bestimmten Feldern (Titel, AutorIn,
Schlagwort und Beschreibung), die den bei der Inhaltserschließung vergebenen
Dublin Core Metadaten (DC.Title, DC.Creator, DC.Subject und DC.Description)
entsprechen, durchgeführt werden. Wir betreiben eine eigene Open-Source
Suchmaschine („Harvest“), die die Dublin Core-Metadaten richtig
behandelt.Täglich (von 5 Uhr bis 6 Uhr) wird das gesamte Angebot von
LinksRhein gesammelt und indexiert. Die Suche wird durch JavaScript-Funktionen
in der Suchseite gestartet.
Die Schlagwort-Navigation verwendet
ebenfalls die Suchmaschine, jedoch mit voreingestellten Anfragen. Sobald der
Button angeclickt wird („onClick“) wird die JavaScript Funktion openStr()
aufgerufen, die als Parameter den Suchbegriff „Festung Europa“ an die Harvest Suchmaschine übergibt. Auch hier
können wie beim Suchformular bestimmte Felder (eben die Dublin-Core Metadaten)
durchsucht werden. Das Hinzufügen neuer Buttons ist einfach: es brauchen
jeweils nur die Beschriftung des Buttons und der Suchbegriff ausgetauscht
werden.
Der Grund, warum wir den kostenlosen
Phase5 HTML-Editor empfehlen können ist, dass er sauberen Code erzeugt (d.h.
nicht in den Sourcecode Dinge reinschreibt,
die wir nicht drinstehen haben wollen), seine Unterstützung von Stylesheets,
dann die Tatsache, dass er selbst einen Browser integriert hat und zu guter
Letzt sogar per FTP Dateien übertragen kann.
Das Übertragen der Dateien vom Rechner zu
Hause auf den Seeseiten-Server geschieht mit einem FTP-Programm (FTP=File
Transfer Protokoll). Also: Ins Internet einwählen, und die FTP-Verbindung
aufbauen. Einloggen geht mit Hostadresse: www.seeseiten.de, username:
linksrhein, password: geheim. Der Rest ist irgendwie selbsterklärend und
funktioniert wie normale Dateimanager, nur dass das rechte Fenster nicht für
den eigenen Rechner steht, sondern die Verzeichnisstruktur des
Seeseitenservers enthält.