Der Datenwissenschaftler

Die Arbeit mit Big Data bedeutet nicht, den ganzen Tag lang auf den Computerbildschirm zu starren», meint Markus Bundschus, der Leiter von Scientific and Business Information Services in Penzberg. Wie viele andere bei Roche verbringt Bundschus den Grossteil seiner Zeit beim Brainstorming mit Teams aus diversen Geschäftsbereichen. So erfährt er, wie riesige Berge von Gesundheitsdaten zu verwalten und zu analysieren sind, damit sie das Leben von Patienten verbessern.

Penzberg, nahe München in einer grünen Ecke Mittelbayerns gelegen, beherbergt über 5000 Mitarbeitende von Diagnostics und Pharma. Ein Gebäudeflügel mit einer Reihe von Pharma-Büros und einer zweiten Reihe von Diagnostics-Büros trägt den Spitznamen PHC (Personalized Healthcare). Er zeigt die Kooperationsmöglichkeiten auf, die Penzberg den beiden Divisionen bietet.

Wir müssen beurteilen, ob Daten für Roche von Bedeutung sind.
Markus Bundschus

Markus Bundschus hatte nie eine Karriere rund um Daten und Computer vorgeschwebt – eigentlich wollte er Molekularbiologie studieren. Doch dann begann er sich für ein neues Bioinformatik-Programm zu interessieren, das die Technische Universität München gemeinsam mit der Ludwig-Maximilians-Universität lancierte, als gerade die Sequenzierung des menschlichen Genoms stattfand.

«Die Universitätsprofessoren fragten sich: Oh – wer soll denn diese Datenfülle analysieren? Wie gewinnen wir aus so vielen Informationen neue Erkenntnisse?», erinnert sich Bundschus. Er studierte schliesslich Molekularbiologie, Computerwissenschaften, Mathematik und Statistik, lauter unerlässliche Voraussetzungen für die Interpretation von Daten.

Bundschus schloss sein Studium mit der Promotion ab und begann in München und Malvern, einem Vorort von Philadelphia, für Siemens zu arbeiten. Er nahm an Projekten zur Prognose neuer Krebsgene mithilfe künstlicher Intelligenz teil. Die dabei gesammelten Erfahrungen passen perfekt zu seiner Tätigkeit für Roche, die er vor vier Jahren begann. Bei Roche übernahm Bundschus erstmals eine Leitungsfunktion.

Bundschus findet es manchmal schwierig zu erklären, worin seine tägliche Arbeit besteht. «Ich verweise meistens auf die Wertschöpfungskette, wobei wir zunächst einmal Kontakte herstellen», erläutert er. «Wir sehen uns interessante und relevante Datenbanken, Fachzeitschriften und sonstige interne und externe Datenquellen an. Dann müssen wir beurteilen, ob diese für Mitarbeitende bei Roche von Bedeutung sind. Das ist der erste Teil des Jobs.»

Bundschus fügt hinzu: «Der zweite Teil erfordert das Herausfiltern der benötigten Informationen, so dass sie für Roche relevant werden. Uns interessieren etwa Datenquellen wie Publikationen über interessante onkologische Genomforschungsprojekte. In einem dritten Teil analysieren wir die Daten: Diese müssen ‹handlungsrelevant› gemacht werden, damit man bei Roche etwas mit ihnen anfangen kann.»

Obwohl viele Werkzeuge und Programme zur Verfügung stehen, ist es eine Sisyphusarbeit, technisch immer auf der Höhe der Zeit zu bleiben – von der ständigen Flut neuer Daten ganz zu schweigen. Täglich werden über 300 neue Life-Science-Patente beantragt, und Datenbanken wie PubMed veröffentlichen rund 2400 neue Artikel. Auch die Zugangstechnologien ändern sich ständig. Für Bundschus ist die Notwendigkeit, technologisch auf dem Laufenden zu bleiben, «der schwierigste und zugleich spannendste Aspekt» seiner Arbeit.

Eine weitere Herausforderung ist die Aufbereitung der Daten und Analysen für die «internen Kunden», also etwa die Forscher und Produktentwickler bei Roche. Regelmässige Gespräche spielen für das Team, das ja die richtigen Daten und Analysen vorlegen möchte, daher eine entscheidende Rolle.

«Wir arbeiten eng zusammen, weil wir durch diese Brainstorming-Sitzungen einfach besser verstehen, was die Leute brauchen», erklärt Bundschus. «Die Sitzungen sind wirklich wichtig, aber trotzdem – und ich glaube, das empfinden viele so – werden sie mir oft zu viel.»

Potenziellen Datenwissenschaftlern gibt Bundschus einige Tipps: Nehmen Sie sich Zeit zu überlegen, welche Art von Daten Forscher benötigen. Seien Sie offen für neue Werkzeuge und für die Arbeit mit internationalen Teams wie den Kollegen von pRED Informatics.

«Bewahren Sie Ihre Neugierde!», sagt er. «Interessieren Sie sich für Molekularbiologie. Lernen Sie das Geschäft kennen. Wenn Sie nicht wissen, was Ihr Unternehmen braucht und was Sie dazu beitragen können, bleibt Ihre Arbeit ein Computerspiel, das niemand braucht.»

Die PubMed-Datenbank umfasst heute über 24 Millionen Artikel, und diese Zahl steigt weiter rapide an. Das Team von Markus Bundschus, dem Leiter von Scientific and Business Information Services in Penzberg, stellt sich der Herausforderung, für Roche relevante Informationen aus ständig wachsenden Datenbergen herauszufiltern und zu analysieren.

Tags: Menschen