Notfall & Hausarztmedizin (Hausarztmedizin) 2004; 30(10): B 496
DOI: 10.1055/s-2004-860913
Medizin & Internet

© Georg Thieme Verlag KG Stuttgart · New York

Webmaster-Info - SiSiSi zur Silbentrennung

Weitere Informationen

Publikationsverlauf

Publikationsdatum:
17. Dezember 2004 (online)

 
Inhaltsübersicht

Rainer H. Bubenzer, Hamburg

SiSiSi ist ein Verfahren zur automatischen Silbentrennung deutscher Wörter nach alter oder neuer Rechtschreibung. Eine solche Trennhilfe ist auch im World-Wide-Web von großer Bedeutung, um die Lesefreundlichkeit von Texten und die ästhetische Akzeptanz einer Webseite zu erhöhen - auch und nicht zuletzt gerade auf medizinischen Websites mit ihrem oft ärmlichen Design. SiSiSi ist sicher und sinnentsprechend, da falsche oder sinnentstellende Trennstellen erkannt und vermieden werden. Im Unterschied zu anderen Trennverfahren wird eine ausführliche Wortbildungsgrammatik in Verbindung mit einem kompakten Verzeichnis kleinster relevanter Wortbestandteile (Atome) verwendet. Wörter, die SiSiSi auf dieser Basis nicht analysieren kann (z.B. Eigennamen), werden aus Sicherheitsgründen nicht getrennt.

Zoom Image

Die Kaiserin Elisabeth - besser als Sissi bekannt - mag Namensgeberin der einmaligen Software SiSiSi (Sichere sinnentsprechende Silbentrennung für die deutsche Sprache) sein, zumal die Entwickler an der Technischen Universität Wien zu finden sind. SiSiSi ist ein Verfahren zur automatischen Silbentrennung deutscher Wörter nach alter oder neuer Rechtschreibung, das an dem Institut für Computergraphik und Algorithmen der TU Wien entwickelt wurde. Das Verfahren kann zum Silbenzählen und - zumindest eingeschränkt - zur Rechtschreibprüfung eingesetzt werden. Zudem wurde durch die Einführung von Wortfamilien eine zukünftige Verwendung zur sinnentsprechenden Suche vorbereitet. Derzeit ist eine systematische Behandlung von Fremdwörtern in Arbeit, durch welche die Treffsicherheit des Verfahrens weiter verbessert werden soll. Die aktuelle Version von SiSiSi gibt es in Form eines Windows- oder JAVA-Programmes, das sowohl einzelne Wörter als auch ganze Textdokumente mit Trennstellen versehen kann. Eine Beschreibung dieses Programms ist online verfügbar (www.ads.tuwien.ac.at/research/SiSiSi/vortrenner.html). Zusätzlich liegt eine Anleitung zum Erzeugen eines schönen Schriftbildes mit Hilfe des SiSiSi-Vortrenners als PDF-Datei vor (www.ads.tuwien.ac.at/research/SiSiSi/Si3Anleitung.hyph.pdf).

SiSiSi gibt es derzeit als Windows- oder JAVA-Anwendung. Die Windows-Anwendung kann Dateien im ASCII- (DOS- und ANSI-Zeichensatz), im RTF- und Latex-Format einlesen und verarbeiten. Die JAVA-Version beherrscht ASCII- und HTML-Dateien. Eine spezielle Version bearbeitet im Kommandozeilen-Modus auch große Textbestände automatisch. Bei Unklarheiten (Wachs-tube - Wach-Stube) können die Benutzer in den Trennprozess eingreifen, zum Beispiel neue Wort-Atome definieren. Das Programm selbst (Vortrenner oder Silbenzähler) kann per eMail (eMail: sisisi@ads.tuwien.ac.at) bestellt werden. Die Einzelplatzlizenz (Windows oder Java) kostet derzeit für private Anwendung 20 Euro, für den kommerziellen Einsatz 200 Euro. Dies schließt kostenlose Updates von Programm beziehungsweise Atomtabelle per E-Mail innerhalb eines Jahres ab Kaufdatum ein. Weitere Infos zu dem Programm und den sprachwissenschaftlichen Hintergründen gibt es auf der Website der Arbeitsgruppe www.ads.tuwien.ac.at/research/SiSiSi/.

#

SiSiSi fürs Internet

Der Hintergrund für Worttrennhilfen (engl. "Hyphenator") ist für Setzer von Büchern oder Zeitungen der gleiche wie bei Webdesignern: Beim Setzen von Text sollten beim Randausgleich - besonders bei Blocksatz - möglichst wenig hässliche Lücken in den Zeilen entstehen. Für Webdesigner kommt ein weiteres Problem hinzu: Jeder Websurfer benutzt eine andere Breite seines Browserfensters - mal schmaler, mal breiter. Eine einmalige Silbentrennung wie zum Beispiel beim Satz schmaler Zeitungsspalten ist nicht möglich, da es keine festen Breiten gibt. Da bislang kein einziger Browser eine eigenständige Silbentrennung durchführt (zum Glück - würde vermutlich furchtbar aussehen!), ist die Vortrennung von Texten die beste Alternative. Keines der derzeit angebotenen HTML-Editoren und HTML-Pakete bietet jedoch eine solche automatische Vortrennung, und schon gar nicht an die besonderen Verhältnisse der deutschen Sprache angepasst (mit z. B. den häufigen und komplexen Wortzusammensetzungen). Eine Möglichkeit: Vortrennung von Hand (...) oder die Verwendung von SiSiSi. In beiden Fällen wird an allen gewünschten Stellen das speziell kodierte Textzeichen für den weichen Bindestrich ("soft hyphen" - ­) eingefügt. Dieses wird nur sichtbar, wenn bei der Textanzeige ein Zeilenende erreicht wird, ansonsten bleibt es unsichtbar, zumindest bei neueren Browsern. Angesichts des erheblichen visuell-ästhetischen Zugewinns ist auch der Zuwachs bei der Dateigröße zu verschmerzen. Weitere Infos zum Thema im Web, zum Beispiel vom finnischen Mathematikers J. Korpela: "Soft hyphen (SHY) - a hard problem?" (www.cs.tut.fi/~jkorpela/shy.html).

#

Tipp

Sie können SiSiSi auch online testen: www.ads.tuwien.ac.at/research/SiSiSi/hyphDemo.

 
Zoom Image