HTML-Dateien selbst erstellen


HTML - Hypertext Markup Language

 HTML als Dokumentbeschreibungssprache
 Wieviel Sie über HTML wissen sollten
 Diskussionen um HTML 3.0
 Vom Dateiformat zur Universalsprache
 HTML und die wichtigste Erkenntnis unserer Zeit


HTML als Dokumentbeschreibungssprache

HTML bedeutet HyperText Markup Language. Es handelt sich dabei um einen Ableger von SGML (Structured Generalized Markup Language) mit spezieller Ausrichtung auf Hypertext-Funktionen.

SGML ist als ISO-Norm 8779 festgeschrieben und wird immer häufiger von großen Konzernen und Institutionen zum internationalen, standardisierten Dokumentenaustausch benutzt. HTML ist zur Sprache für Dokumente des World Wide Web (WWW) im Internet geworden.

Aufgabe von Dokumentbeschreibungssprachen

HTML ist eine sogenannte Dokumentbeschreibungssprache. Eine Dokumentbeschreibungssprache hat die Aufgabe, die logischen Strukturen eines Dokuments zu beschreiben. Dazu gehören Kapitel, Unterkapitel, Absätze, Querverweise zu anderen Dokumenten usw. Daneben hält HTML in der künftigen Version 3.0 etliche Sprachelemente zur Formatierung von Text und zum Darstellen von Tabellen u.ä. bereit.

Damit ein HTML-Dokument ansprechend präsentiert wird, stellen die modernen Anzeigeprogramme (WWW-Browser) umfangreiche Konfigurationsmöglichkeiten bereit. Beispielsweise stehen dem Anwender zur Konfiguration alle installierten Schriftarten zur Verfügung.

Hypertext und Hypermedia als ASCII-Text

HTML-Dateien bestehen aus reinem ASCII-Text und können mit jedem ASCII-Editor gelesen und bearbeitet werden. Dadurch bleiben HTML-Dateien plattformunabhängig, d.h. dasselbe Dokument kann auf Sun-Workstations, auf Apple Macintoshs, auf Ataris oder IBM-PCs präsentiert werden. Plattformabhängig ist nur die Präsentations-Software.

HTML-Dateien enthalten neben Text sogenannte "Tags". Die Tags bestehen aus spitzen Klammern < und >. Innerhalb der spitzen Klammern werden HTML-Befehle notiert. WWW-Browser interpretieren die Tags und erzeugen daraus die korrekte Abbildung der Dokumentstruktur.

Ein in HTML geschriebenes Dokument kann außer Text auch Grafiken sowie multimediale Elemente (Sound, Video usw.) enthalten. Solche Elemente werden als Referenz auf eine entsprechende Grafik- oder Multimedia-Datei notiert. Die Präsentations-Software muß entsprechende Software-Module besitzen oder aufrufen, mit deren Hilfe solche Dateien dargestellt werden können.


 HTML-Dateien selbst erstellen
 HTML - die Sprache des WWW


Wieviel Sie über HTML wissen sollten

Zur Zeit: leider noch sehr viel (deshalb auch dieses Dokument hier). In Zukunft: mit Sicherheit so gut wie nichts mehr.

Der Grund dafür: Internet und HTML kommen aus der Unix-Welt. Ein echter Unix-Hacker braucht nichts anderes als seinen vi-Editor, der ist zeilenorientiert, kryptisch und sagenhaft schnell. Damit schreibt der Unix-Hacker Raumfahrt-Programme ebenso wie belichtungsfähige Druckdokumente (das ist kein Scherz!).

Doch inzwischen haben die Branchenriesen wie Microsoft und Co. die märchenhaften Wachstumsraten im WWW wahrgenommen. Jetzt wird investiert und geklotzt, um Software für das WWW bereitzustellen, die dem Niveau und dem Anspruch moderner Anwendungen entspricht.

Jedes bessere Textverarbeitungs- und DTP-System wird künftig das Erstellen von HTML-Dateien unterstützen oder automatisieren. WordPerfect wird bereits mit HTML-Filter ausgeliefert, FrameMaker folgt auf dem Fuß. In spätestens ein bis zwei Jahren werden Sie dieses Dokument hier mit Nostalgiegefühlen lesen, denn niemand wird es dann noch nötig haben, sich mit den Niederungen der HTML-Tags abzugeben.

Bis dahin aber sollte sich jeder, der EDV-mäßig auf der Höhe der Zeit sein muß oder will, näher mit HTML und seinen Sprachelementen beschäftigen.


 HTML-Dateien selbst erstellen
 HTML - die Sprache des WWW


Diskussionen um HTML 3.0

Bei HTML treffen mittlerweile drei Welten aufeinander: die geordnete Welt der internationalen Normierungsgremien, die chaotische Welt der kreativen Genies im Internet, und die profitorientierte Welt der großen Software-Firmen.

Mosaic oder der Weg von HTML 1.0 zu HTML 2.0

Angefangen hat es mit dem ersten genormten, sehr einfachen 1.0-Standard des HTML-Formats. Hinter der Normung von HTML stand und steht auch heute noch das W3-Konsortium, das aus der World Wide Web Initiative rund um den britischen Vordenker Tim Berners Lee hervorging. Das W3-Konsortium hat seinen Sitz in Genf, der "Geburtsstätte des World Wide Web". Auf dem  Server des W3-Konsortiums - finden Sie auch jetzt noch wichtige Informationen über Vergangenheit, Gegenwart und Zukunft des WWW.

Populär wurde das HTML-Format (und das WWW überhaupt) jedoch erst durch den ersten WWW-Browser mit graphischer, moderner Oberfläche: den Browser Mosaic. Die Programmierer von Mosaic erfanden auch neue Features, die sie in ihren WWW-Browser implementierten, ohne daß diese Features von der geltenden HTML-Norm abgesegnet waren. Da sich Mosaic rasend schnell verbreitete, wuchs auch die Anzahl von WWW-Seiten mit Mosaic-eigenen Sprachelementen. In der offiziellen Sprach-Version 2.0 wurden dann einige der Mosaic-Features aufgenommen, andere nicht. So kam es zu den sog. "obsoleten" Sprachelementen. Das sind Sprachelemente, die in der Realität verwendet werden, aber nicht zum Sprachstandard gehören.

Der Mastermind des Mosaic-Entwicklerteams, Marc Andreessen, stieg schließlich aus dem Mosaic-Projekt aus, weil er die Chance witterte, sich im entstehenden WWW-Markt binnen kürzester Zeit in den Computer-Olymp neben Bill Gates und Steve Jobs zu hieven. Marc Andreessen gründete die Firma Netscape.

Netscape und Microsoft oder der Weg von HTML 2.0 zu HTML 3.0

Inzwischen hat der WWW-Browser Netscape folgerichtig die Rolle des Avantgardisten übernommen. Ab der Programmversion 1.1 bietet Netscape etliche Features an, die nicht zum gegenwärtig gültigen HTML-Standard 2.0 gehören. Doch obwohl Netscape derzeit von mehr als 70% aller WWW-Besucher verwendet wird, hat sich Microsoft zu einem Feldzug gegen diese Vorherrschaft entschlossen und seinen Internet Explorer hochgerüstet. Beide Flaggschiffe, Netscape Navigator und MS Internet Explorer, liegen derzeit in der Version 2.0 vor. Und beide tun sich durch HTML-Spachelemente hervor, die in keiner HTML-3- Spezifikation vorkommen, und die nur der eigene Browser versteht. Dadurch kommt zwar jede Menge frischer Wind ins Web, doch die Entwicklung ist zugleich auch sehr bedenklich, da die software-unabhängige Normung der HTML-Sprache in dem Machtkampf dieser Giganten unterzugehen droht.

Die Normung der Sprachversion 3.0 von HTML läßt weiter auf sich warten. Durch die unabhängigen Bestrebungen von Netscape und Microsoft und das lange Warten auf den neuen Standard wird am Ende fraglich sein, welchen Einfluß dieser Standard, so er denn kommt, auf die weitere Sprachentwicklung von HTML überhaupt noch hat.

Als Beitrag zum Machtkampf zwischen Netscape und Microsoft wird in diesem Dokument ein dritter, bislang nur in Fachkreisen bekannter WWW-Browser erwähnt, der echtes HTML 3 (laut den Vorschlägen des W3-Konsortiums) interpretiert und isg. mehr HTML versteht als Netscape und Internet Explorer zusammen: der UDI WWW-Browser von Bernd Richter. Das Programm ist noch in Entwicklung und in Performance und Stabilität nicht vergleichbar mit den Profis, aber angesichts der millionenschweren Konkurrenz doch ein echtes Software-Wunder, das sich hoffentlich eine ernsthafte Marktposition erkämpfen wird. Ohne Sponsor wird das jedoch kaum möglich sein.

Technokraten contra Designer

Netscape und der Internet Explorer kommen vor allem den Wünschen von Werbegrafikern und Designern kommerzieller WWW-Seiten entgegen. Solche Leute wollen verständlicherweise die totale Gestaltungsfreiheit bei Textformatierung und farblicher Gestaltung.

Puristen kristisieren daran, daß durch die Gestaltungsfreiheit der Charakter der Dokumentbeschreibungssprache verloren gehe. Wenn man z.B. mitten im Text Wörter so formatiert, daß der Anwender sie nicht von Überschriften unterscheiden kann, werde die ganze Idee der Strukturierung nach Überschriftenebenen und Textabsatzformaten hinfällig. Außerdem, so die Puristen, werde mit der großen Gestaltungsfreiheit die Kommerzialisierung des WWW vorangetrieben, so daß am Ende statt Information nur noch bunte Werbeplakate im Web dominieren.

Der geplante Sprachstandard 3.0 sieht aber auch wichtige Neuerungen für den technisch-wissenschaftlichen Bedarf vor. Tabellen, von einigen Browsern bereits unterstützt, werden dazugehören, ebenso wie die Notation technisch/mathematischer Formeln, Fußnoten oder Aufmerksamkeitssymbole im Text. Dazu kommt die wichtige Neuerung der Style-Sheets. Ferner sind Erweiterungen für den Dateikopf einer HTML-Datei in Sicht. Dadurch wird es dann z.B. möglich sein, sog. "guided tours" anzubieten, d.h. Dateien, die in Reihe geschaltet sind und sequentiell gelesen werden können. Das Ganze wird dann ähnlich funktionieren wie bei den "Browse-Buttons" in der Windows-Hilfe.

WWW-Software im HTML-3.0-Zeitalter

Zukünftige WWW-Browser werden hohen Anforderungen genügen müssen, um die neuen Features der HTML-Version 3.0 korrekt umzusetzen. Parallel dazu werden die jetzt üblichen HTML-Editoren durch Konverter-Tools abgelöst werden, die zur künftigen Ausstattung kommerzieller Textverarbeitungsprogramme gehören werden. Auch kombinierte Editier-Präsentier-Pakete wie Netscape 2.0 Gold könnten sich durchsetzen.


 HTML-Dateien selbst erstellen
 HTML - die Sprache des WWW


Vom Dateiformat zur Universalsprache

Dank WWW ist HTML, die kleine, hypertext-orientierte Schwester von SGML, in aller Munde. In jeder Fachzeitschrift ist zu lesen, daß HTML die Sprache des WWW sei.

Zweifellos ist sie das, und ihre Bedeutung zieht sie heute vor allem aus dieser Tatsache. Aber HTML-Dateien liegen schon längst nicht mehr nur auf den WWW-Servern des Internet herum. Jeder, der einen WWW-Browser hat, legt HTML-Dateien auf dem eigenen Rechner ab. Viele Anwender, die einen zeitabhängigen Internet-Zugang haben, speichern interessante HTML-Seiten gleich lokal ab und lesen sie hinterher offline. Auch in Mailboxen liegen HTML-Dateien zum Download bereit, meistens Dateien mit Verweisen zu interessanten Stellen im WWW. Auch auf einschlägigen CD-ROMs werden künftig immer mehr HTML-Dateien zu finden sein.

In wenigen Jahren wird es wohl kaum einen Personal Computer und keine Workstation mehr geben, auf der nicht ein WWW-Browser oder ein vergleichbares HTML-Präsentationswerkzeug installiert sein wird. HTML wird zum zweitkleinsten gemeinsamen Nenner jenseits des ASCII-Zeichensatzes werden. Firmenpräsentationen, Handbücher, Fachliteratur, ganze Dokumentarchive werden online, auf CDs oder anderen Datenträgern in HTML-Form zur Verfügung stehen. HTML ist in den 90er Jahren das, was die CompactDisc (CD) in den 80ern war: ein Selbstläufer, der ganz zwanglos zum Maß aller Dinge wird. HTML wird den Sprung vom bloßen Dateiformat zur Universalsprache schaffen.


 HTML-Dateien selbst erstellen
 HTML - die Sprache des WWW


HTML und die wichtigste Erkenntnis unserer Zeit

Die wichtigste Erkenntnis unserer Zeit lautet (frei nach Murphy): es gibt kein endgültiges Wissen, im entscheidenden Moment gibt es immer nur Querverweise.

Um diesem Umstand gerecht zu werden, brauchen wir etwas, das die Querverweise zum Prinzip erhebt. Wir haben es auch schon gefunden und "Hypertext" genannt.

Hypertext ist Text mit Zeigern auf anderen Text. Viel mehr steckt zunächst wirklich nicht dahinter. Das ist nichts anderes, als wenn Sie in einer Bibliothek anfangen, in einem Buch über ein interessantes Thema zu lesen. Sie erfahren einiges, aber längst nicht alles, was Sie wissen wollten. Nun enthält das Buch Angaben zu weiterführender Literatur, und Sie quälen sich damit ab, diese Literatur aufzutreiben. Sie geben Fernleihen auf und warten wochenlang auf das begehrte Schriftstück.

Bei Hypertext ist der Verweis auf die weiterführende Literatur mit der Maus anklickbar, und wenn Sie draufklicken, sind Sie sofort in dem gewünschten Dokument. Das ist, salopp gesagt, der einzige, allerdings entscheidende Unterschied zu herkömmlichen Textmedien. Alles ist verfügbar im Augenblick des spontanen Interesses. Hypertext hat also etwas mit den gebratenen Tauben zu tun, die einem im Paradies in den Mund fliegen.

Seit Mitte der 60er Jahre beschäftigt das "Phänomen Hypertext" die Geister. Das Problem war immer nur, wo man all die viele Information speichern soll, die in so einem paradiesischen Hypertext auf Knopfdruck zur Verfügung stehen soll. Die Antwort: auf irgendeinem x-beliebigen Rechner, wenn er denn in der Lage ist, als Internet-Server zu fungieren.

Es hat erstaunlich lange gedauert, bis man auf diese Antwort kam. Aber jetzt ist sie da, in Form des World Wide Web. Und HTML ist sozusagen die technische Grundlage für das Prinzip der gebratenen Querverweis-Tauben.

In diesem Dokument haben Sie Gelegenheit, sich näher damit zu beschäftigen.


 HTML-Dateien selbst erstellen
 HTML - die Sprache des WWW