SGML ist als ISO-Norm 8779 festgeschrieben und wird immer häufiger von großen Konzernen und Institutionen zum internationalen, standardisierten Dokumentenaustausch benutzt. HTML ist zur Sprache für Dokumente des World Wide Web (WWW) im Internet geworden.
Damit ein HTML-Dokument ansprechend präsentiert wird, stellen die modernen Anzeigeprogramme (WWW-Browser) umfangreiche Konfigurationsmöglichkeiten bereit. Beispielsweise stehen dem Anwender zur Konfiguration alle installierten Schriftarten zur Verfügung.
HTML-Dateien enthalten neben Text sogenannte "Tags". Die Tags bestehen aus spitzen Klammern < und >. Innerhalb der spitzen Klammern werden HTML-Befehle notiert. WWW-Browser interpretieren die Tags und erzeugen daraus die korrekte Abbildung der Dokumentstruktur.
Ein in HTML geschriebenes Dokument kann außer Text auch Grafiken sowie multimediale Elemente (Sound, Video usw.) enthalten. Solche Elemente werden als Referenz auf eine entsprechende Grafik- oder Multimedia-Datei notiert. Die Präsentations-Software muß entsprechende Software-Module besitzen oder aufrufen, mit deren Hilfe solche Dateien dargestellt werden können.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Der Grund dafür: Internet und HTML kommen aus der Unix-Welt. Ein echter Unix-Hacker braucht nichts anderes als seinen vi-Editor, der ist zeilenorientiert, kryptisch und sagenhaft schnell. Damit schreibt der Unix-Hacker Raumfahrt-Programme ebenso wie belichtungsfähige Druckdokumente (das ist kein Scherz!).
Doch inzwischen haben die Branchenriesen wie Microsoft und Co. die märchenhaften Wachstumsraten im WWW wahrgenommen. Jetzt wird investiert und geklotzt, um Software für das WWW bereitzustellen, die dem Niveau und dem Anspruch moderner Anwendungen entspricht.
Jedes bessere Textverarbeitungs- und DTP-System wird künftig das Erstellen von HTML-Dateien unterstützen oder automatisieren. WordPerfect wird bereits mit HTML-Filter ausgeliefert, FrameMaker folgt auf dem Fuß. In spätestens ein bis zwei Jahren werden Sie dieses Dokument hier mit Nostalgiegefühlen lesen, denn niemand wird es dann noch nötig haben, sich mit den Niederungen der HTML-Tags abzugeben.
Bis dahin aber sollte sich jeder, der EDV-mäßig auf der Höhe der Zeit sein muß oder will, näher mit HTML und seinen Sprachelementen beschäftigen.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Populär wurde das HTML-Format (und das WWW überhaupt) jedoch erst durch den ersten WWW-Browser mit graphischer, moderner Oberfläche: den Browser Mosaic. Die Programmierer von Mosaic erfanden auch neue Features, die sie in ihren WWW-Browser implementierten, ohne daß diese Features von der geltenden HTML-Norm abgesegnet waren. Da sich Mosaic rasend schnell verbreitete, wuchs auch die Anzahl von WWW-Seiten mit Mosaic-eigenen Sprachelementen. In der offiziellen Sprach-Version 2.0 wurden dann einige der Mosaic-Features aufgenommen, andere nicht. So kam es zu den sog. "obsoleten" Sprachelementen. Das sind Sprachelemente, die in der Realität verwendet werden, aber nicht zum Sprachstandard gehören.
Der Mastermind des Mosaic-Entwicklerteams, Marc Andreessen, stieg schließlich aus dem Mosaic-Projekt aus, weil er die Chance witterte, sich im entstehenden WWW-Markt binnen kürzester Zeit in den Computer-Olymp neben Bill Gates und Steve Jobs zu hieven. Marc Andreessen gründete die Firma Netscape.
Die Normung der Sprachversion 3.0 von HTML läßt weiter auf sich warten. Durch die unabhängigen Bestrebungen von Netscape und Microsoft und das lange Warten auf den neuen Standard wird am Ende fraglich sein, welchen Einfluß dieser Standard, so er denn kommt, auf die weitere Sprachentwicklung von HTML überhaupt noch hat.
Als Beitrag zum Machtkampf zwischen Netscape und Microsoft wird in diesem Dokument ein dritter, bislang nur in Fachkreisen bekannter WWW-Browser erwähnt, der echtes HTML 3 (laut den Vorschlägen des W3-Konsortiums) interpretiert und isg. mehr HTML versteht als Netscape und Internet Explorer zusammen: der UDI WWW-Browser von Bernd Richter. Das Programm ist noch in Entwicklung und in Performance und Stabilität nicht vergleichbar mit den Profis, aber angesichts der millionenschweren Konkurrenz doch ein echtes Software-Wunder, das sich hoffentlich eine ernsthafte Marktposition erkämpfen wird. Ohne Sponsor wird das jedoch kaum möglich sein.
Puristen kristisieren daran, daß durch die Gestaltungsfreiheit der Charakter der Dokumentbeschreibungssprache verloren gehe. Wenn man z.B. mitten im Text Wörter so formatiert, daß der Anwender sie nicht von Überschriften unterscheiden kann, werde die ganze Idee der Strukturierung nach Überschriftenebenen und Textabsatzformaten hinfällig. Außerdem, so die Puristen, werde mit der großen Gestaltungsfreiheit die Kommerzialisierung des WWW vorangetrieben, so daß am Ende statt Information nur noch bunte Werbeplakate im Web dominieren.
Der geplante Sprachstandard 3.0 sieht aber auch wichtige Neuerungen für den technisch-wissenschaftlichen Bedarf vor. Tabellen, von einigen Browsern bereits unterstützt, werden dazugehören, ebenso wie die Notation technisch/mathematischer Formeln, Fußnoten oder Aufmerksamkeitssymbole im Text. Dazu kommt die wichtige Neuerung der Style-Sheets. Ferner sind Erweiterungen für den Dateikopf einer HTML-Datei in Sicht. Dadurch wird es dann z.B. möglich sein, sog. "guided tours" anzubieten, d.h. Dateien, die in Reihe geschaltet sind und sequentiell gelesen werden können. Das Ganze wird dann ähnlich funktionieren wie bei den "Browse-Buttons" in der Windows-Hilfe.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Zweifellos ist sie das, und ihre Bedeutung zieht sie heute vor allem aus dieser Tatsache. Aber HTML-Dateien liegen schon längst nicht mehr nur auf den WWW-Servern des Internet herum. Jeder, der einen WWW-Browser hat, legt HTML-Dateien auf dem eigenen Rechner ab. Viele Anwender, die einen zeitabhängigen Internet-Zugang haben, speichern interessante HTML-Seiten gleich lokal ab und lesen sie hinterher offline. Auch in Mailboxen liegen HTML-Dateien zum Download bereit, meistens Dateien mit Verweisen zu interessanten Stellen im WWW. Auch auf einschlägigen CD-ROMs werden künftig immer mehr HTML-Dateien zu finden sein.
In wenigen Jahren wird es wohl kaum einen Personal Computer und keine Workstation mehr geben, auf der nicht ein WWW-Browser oder ein vergleichbares HTML-Präsentationswerkzeug installiert sein wird. HTML wird zum zweitkleinsten gemeinsamen Nenner jenseits des ASCII-Zeichensatzes werden. Firmenpräsentationen, Handbücher, Fachliteratur, ganze Dokumentarchive werden online, auf CDs oder anderen Datenträgern in HTML-Form zur Verfügung stehen. HTML ist in den 90er Jahren das, was die CompactDisc (CD) in den 80ern war: ein Selbstläufer, der ganz zwanglos zum Maß aller Dinge wird. HTML wird den Sprung vom bloßen Dateiformat zur Universalsprache schaffen.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Um diesem Umstand gerecht zu werden, brauchen wir etwas, das die Querverweise zum Prinzip erhebt. Wir haben es auch schon gefunden und "Hypertext" genannt.
Hypertext ist Text mit Zeigern auf anderen Text. Viel mehr steckt zunächst wirklich nicht dahinter. Das ist nichts anderes, als wenn Sie in einer Bibliothek anfangen, in einem Buch über ein interessantes Thema zu lesen. Sie erfahren einiges, aber längst nicht alles, was Sie wissen wollten. Nun enthält das Buch Angaben zu weiterführender Literatur, und Sie quälen sich damit ab, diese Literatur aufzutreiben. Sie geben Fernleihen auf und warten wochenlang auf das begehrte Schriftstück.
Bei Hypertext ist der Verweis auf die weiterführende Literatur mit der Maus anklickbar, und wenn Sie draufklicken, sind Sie sofort in dem gewünschten Dokument. Das ist, salopp gesagt, der einzige, allerdings entscheidende Unterschied zu herkömmlichen Textmedien. Alles ist verfügbar im Augenblick des spontanen Interesses. Hypertext hat also etwas mit den gebratenen Tauben zu tun, die einem im Paradies in den Mund fliegen.
Seit Mitte der 60er Jahre beschäftigt das "Phänomen Hypertext" die Geister. Das Problem war immer nur, wo man all die viele Information speichern soll, die in so einem paradiesischen Hypertext auf Knopfdruck zur Verfügung stehen soll. Die Antwort: auf irgendeinem x-beliebigen Rechner, wenn er denn in der Lage ist, als Internet-Server zu fungieren.
Es hat erstaunlich lange gedauert, bis man auf diese Antwort kam. Aber jetzt ist sie da, in Form des World Wide Web. Und HTML ist sozusagen die technische Grundlage für das Prinzip der gebratenen Querverweis-Tauben.
In diesem Dokument haben Sie Gelegenheit, sich näher damit zu beschäftigen.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW