Obwohl das menschliche Genom gleich zweimal entziffert worden ist und der Text unserer Erbinformation inzwischen mehr oder weniger komplett in den einschlägigen Datenbanken steht, ist immer noch ungewiss, über wie viele Gene Sie und ich denn nun verfügen. Die Sequenzierer haben zu ihrem Erstaunen nur 30000 gezählt. Andere Wissenschaftler behaupten jedoch, dass bei der Interpretation der schier endlosen Buchstabenfolge, aus der das teuflisch verworrene Konstruktionshandbuch des Menschen besteht, möglicherweise die Hälfte der Gene übersehen wurde.

In welchem Abschnitt der fadenförmigen Erbsubstanz DNA die Bauanleitung für ein Protein steckt und in welchem nicht, weiß nur eine: die RNA-Polymerase II. Dieses Enzym ist es nämlich, das den DNA-Faden abliest und dort, wo es ein aktiviertes Gen findet, eine Blaupause davon in Form einer so genannten Boten-RNA anfertigt; dieser Vorgang heißt Tran-skription ("Umschreiben"). Die Nummer II rührt daher, dass es auch Polymerasen gibt, die Abschnitte der Erbsubstanz kopieren, in denen kein Protein verschlüsselt ist (sondern beispielsweise RNAs, die Bausteine der zellulären Eiweißfabriken bilden).

Ähnlich wie viele andere Schlüsselprozesse der Zelle wird die Transkription von einer hochgradig komplexen Nanomaschine ausgeführt. Die Polymerase II alleine besteht bereits aus einem Dutzend Proteinmolekülen, die man nach abnehmender Größe als Untereinheiten A bis L bezeichnet. Damit ein Gen abgelesen werden kann, müssen sich aber noch rund 60 Helferproteine an die DNA selbst oder an die Polymerase anlagern – dazu gehören insbesondere vielerlei Transkriptionsfaktoren, welche die Aktivität des Enzyms steuern. An dieser Komplexität scheiterten lange Zeit alle Versuche einer Strukturbestimmung. Erst vor einem Jahr konnten Wissenschaftler die räumliche Gestalt der Hefe-Polymera