Textantrieb

Manuskript

Software

Quellcode als Text

Quellcode ist Text. Dieser Satz trifft schon zu, wenn man ihn mit dem landläufigen Begriff des Textes als einer Zeichenfolge auslegt. Denn der Quellcode einer Softwareeinheit besteht in einer Sammlung von Dateien, die Ausdrücke in verschiedenen Programmier-, Skript- und Auszeichnungssprachen enthalten. Diese Ausdrücke werden durch andere, davon unabhängige Softwareeinheiten verarbeitet, die zum Teil anhand der Quelldateien ausführbare Dateien erstellen (kompilieren) und zum Teil durch die Quelldateien gesteuerte Prozesse durchführen (interpretieren). Der Satz „Quellcode ist Text” entspricht also im oberflächlichen Sinne dem aktuellen Stand der Technik. Doch dieser Satz erhält einen grundsätzlichen Sinn, wenn man den Text als „geparste Zeichenfolge” begreift, d. h. nicht als Darstellung, sondern als Struktur. Erst der algebraische Textbegriff vermag es, hinter den in verschiedenen Dateien in verschiedenen Sprachen enthaltenen Texten den einen Text auszumachen, den die gesamte Softwareeinheit definiert. Wenn man durch Syntaxanalyse den Quellcode auf einen Ausdruck zurückführt, und zwar so, dass alle Bestandteile des Quellcodes, egal in welcher Sprache oder Notation sie vorliegen, in ein und demselben algebraischen Ausdruck enthalten sind, so steht man vor dem konkreten, einzigen Text, der der Quellcode ist.

Diese Erkenntnis birgt ein großes Potential, denn sie befreit uns von der Tyrannei der einzelnen Sprachen und Notationen und durchbricht deren Vereinzelung. Das eingesetzte Auszeichnungssystem ist für das Programmieren nicht wesentlich, sondern Mittel zum Zweck, nämlich zum Aufbau eines bestimmten Textes. Genauso wie man in einer Datenbank die Daten strukturiert in Tabellen speichert, damit man sie auf verschiedener Weise auswerten kann, so sollten die Programmiersysteme den Quellcode als erfassten Text speichern, um es gezielt abfragen und in verschiedenen Formaten ausdrücken zu können.