We're sorry but this page doesn't work properly without JavaScript enabled. Please enable it to continue.
Feedback

Von arXiv zu bioRxiv – Preprint-Dynamik in den Biowissenschaften

00:00

Formal Metadata

Title
Von arXiv zu bioRxiv – Preprint-Dynamik in den Biowissenschaften
Title of Series
Number of Parts
23
Author
License
CC Attribution 4.0 International:
You are free to use, adapt and copy, distribute and transmit the work or content in adapted or unchanged form for any legal purpose as long as the work is attributed to the author in the manner specified by the author or licensor.
Identifiers
Publisher
Release Date
Language

Content Metadata

Subject Area
Genre
Abstract
Scientific progress depends on efficient mechanisms to select, quality control and efficiently share rigorous and reproducible research. The editorial and peer review process at scientific journals continues to play an important role in quality assurance by selection for the reliability, reproducibility and integrity of the experimental data, as well as the interest of the claims made. However, this process often takes months or even years due to extensive revision cycle and serial submission to different journals. Furthermore, many valuable research findings, including confirmatory, descriptive, negative or refuting data, are never published in journals and therefore not shared. In a rapidly developing research field such as the biosciences, the delay and selectivity are major impediments to the overall efficacy of research progress. Sharing research findings through preprint platforms such as bioRxiv offers a mechanism that is complementary and synergistic with journal publishing. While preprint posting has been fully established in the physical sciences for a quarter of a century, it remains terra nova for the biosciences, the medical sciences and chemical sciences. I will discuss cultural and institutional obstacles in implementing for this delayed adoption, impediments to a broad adoption and how these can be overcome. Open Science is about efficient access to all meaningful research outputs; it encompasses “big data” just as much as bench science. I will touch on mechanisms of open science communication beyond preprints and mention cultural and institutional obstacles in implementing an Open Science future that renders scientific research more efficient and effective.
Computer animationPanel painting
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Diagram
Diagram
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Computer animation
Transcript: German(auto-generated)
Ich werde gleich anschließen an den Physiker-Archiv-Talk jetzt und versuchen zu zeigen, was in Biowissenschaften passiert, praktisch als Emulation von den Physikern nur 25 Jahre später. Wie schon gesagt, bin ich zuständig für fünf Journale bei EMBO, das ist eine Partnerorganisation
von CERN. Das passt also ganz gut, wir sitzen in Heidelberg, nur weil das zur Konferenz passt. Drei von den Journalen sind Open Access und zwei von denen versuchen, Open Access zu gehen, aber darauf gehen wir jetzt nicht ein, wenn Sie Fragen dazu haben, können wir die gerne besprechen.
In den Biowissenschaften, und mein Vortrag wird viel weniger technisch sein, das würde eher um die Dynamik im ganzen System gehen, in den Biowissenschaften. Also es gibt Open Sharing schon seit geraumer Zeit in Biowissenschaften, das fing alles bei uns an mit der Genome Science. Das Human Genome wurde um 2000, um die Jahrtausendwende publiziert und es war ganz klar, also das
wurde von vorneherein praktisch direkt ins Internet eingegeben und das hat dazu beigetragen, dass die linke Person, Craig Venter, durch seine revolutionäre Methode von der Shotgun Assembly das Genome viel, viel schneller assemblen konnte als
die Base-by-Base-Sequenzierung des normalen Genome-Projekts, was wiederum Feedback auf das normale Genome-Projekt gehabt hat und das ungefähr fünf bis sechs Jahre schneller gemacht hat und viel billiger gemacht hat. Also da gab es einen sehr positiven Feedback-Cycle, der von sehr vielen in der Community auch so gesehen wurde und seitdem ist praktisch die Genome-Wissenschaft sehr,
sehr Open Science eingestellt, weil das einfach sehr viel besser funktioniert. Seitdem ist Biologie förmlich explodiert, wir haben inzwischen um die 30.000 Biowissenschaftsjournalen in den Biowissenschaften mit ungefähr drei Millionen Papers pro Jahr. Das wächst immer noch ungefähr vier bis fünf
Prozent, erflacht aber langsam ab zum Glück, also es wird ja ziemlich krass inzwischen, die Volumen, aber wir haben natürlich viel, viel mehr an Datenvolumen, die generiert werden. Viel davon ist in, haben wir einen Pointer, das macht
aber das ist nur ein Bruchteil, das meiste ist in Structured Databases und ich wollte nur kurz zeigen, dass das hier ist eine ganze Reihe von Databases, viele davon sind auch in Europa stationiert, aber vieles ist auch in total unstrukturierter Form. Das ist im Ende ein Riesenproblem, weil viel davon gar nicht zugänglich ist
und gar nicht so benutzbar ist. Wir versuchen sehr hart auch Struktur in diese Sachen reinzubringen, damit die mehr benutzbar werden. Aber eine Situation, die sich seit graumer Zeit abgemalt hat, dass gewisse Datensätze nicht im normalen Journal unterkommen und bis jetzt ist es halt
enorm wichtig, in normalen Journals zu publizieren, weil das das einzige Medium ist, was eine Karriere praktisch aufbauen kann. Der ganze Rest dieser Pyramide ist praktisch irrelevant für die Karriere in den Biowissenschaften, was ein Riesenproblem ist, aber besonders Confirmatory Data und Negativdaten, aber
auch Daten, die nicht mit Papers, die schon publiziert sind, übereinstimmen, aber auch diskriptive Datensätze und so kommen meistens in Journals sehr sehr schwer unter und daher hatten wir, wir sind auf Preprints gestoßen als ein interessantes Medium, um diese Art von Daten auch in einer Journalartigen
Plattform unterzubringen und in Biowissenschaften wären wir nie auf Preprints gekommen, wenn das nicht schon seit 25 Jahren existiert hätte. Wir haben schon Herrn Ginsberg gesehen, der das aufgebaut hat. Der Graph wurde schon gezeigt. Ich wollte nur darauf hinweisen, dass ganz links oben, das gelbe, die biologischen Wissenschaften sind auf dem Archive
Server. Das bedeutet sehr sehr klein und sehr sehr langsam wachsend. Also es gab eigentlich keine Evidenz, dass die Biowissenschaften schnell umspringen würden und ein Preprint Format auch verwenden würden. Auf der anderen Seite, und viele Biowissenschaften waren sehr skeptisch am Anfang, dass als es anfing und sagten, Biowissenschaften sind viel, der
Konkurrenzkampf ist viel dynamischer. Es gibt das Konzept von Scooping, wo andere auf die Projekte aufspringen und dadurch man den Vorsprung verliert praktisch. Aber es stellt sich eben auch raus, und das ist eine Umfrage, die jetzt gerade raus kam, dass in Wirklichkeit, wenn man die Fächer vergleicht, die Biologen, die sind ganz oben hier, in Wirklichkeit
eigentlich im Prinzip sehr bereit sind, offen zu sein. Wenn man die ganzen Farben bis auf das dunke Violett anschaut, das sind alles Pre-Publication Formen von Data Sharing. Und die Biologen sind eigentlich von allen Fächern die offensten, was recht interessant ist. Und es ist also
in Wirklichkeit doch eine Kultur da Sachen vorzuscheren. Und das führte dazu, dass Cold Spring Harbor Labs als einer der ersten in Biowissenschaften das Experiment gewagt hat, eben praktisch mit Archives mit Paul Gitzbach zusammenzuarbeiten und Bioarchives zu launchen. Wirklich als Experiment am Anfang. Und was Bioarchives ist,
ist, dass es eben keine Journal Articles annimmt, dass es auch eigentlich auf Primary Research fokussiert ist. Es wird nur eingeteilt in drei Kategorien und dann noch ein paar Metadata Kategorien für Subject Specific Information, neue Confirmatory oder
Contradictory Results. Der Autor hat natürlich Copyright und CC Licenses werden draufgesetzt. Die Sachen sind stabil und Sightable, formell Sightable. Es gibt nur ein volunteer-based Screening-Prozess. Es gibt ungefähr 1000 Mitglieder auf diesem Komitee. Und es ist eigentlich sehr unstrukturierter
Screening im Moment. Das wird sich bald ändern. Die Sachen werden meistens binnen 24 Stunden bis 48 Stunden gepostet, also enorm viel schneller als die drei bis drei Monate bis ein Jahr, die Journal Publishing braucht. Es gibt Versioning und das ist einer der Punkte, die noch ausgebaut werden müssen,
dass das Versioning zu den Journals noch ausgebaut wird. Es gibt natürlich Commenting, nicht natürlich, weil auf dem Archive kein Commenting existiert. Es gibt Commenting, was nur sporadisch benutzt wird. Im Moment, das meiste Commenting findet auf Social Media Basis statt und noch viel mehr auf
Peer-to-Peer Basis statt. Also das heißt durch klassische E-Mail. Wir versuchen zu experimentieren jetzt, dass wir Referee-Comments auf die Preprint setzen. Davon spreche ich gleich noch. Es gibt links, systematische Links zu den Journal Versionen des Preprints und man kann Download-Metrics auch erhalten. Das Ganze wird finanziert und das ist auch wichtig durch jetzt durch ein
Grant seit diesem Jahr von der Chan Zuckerberg Initiatives, aber auch durch Journal Contributions. Das wird nicht durch die Institutions finanziert im Moment. Interessanterweise das Wachstum in Preprints, man muss dazu sagen, dass es in Order of Magnitude eine ganze Größenordnung kleiner als in den Physical Sciences wächst, eben auch
exponentiell. Das ist seit 2014 existiert Bio-Archives und Sie sehen, dass das eine wunderbare exponentielle Kurve ist. Die Orangenfarbenen Bars sind die Papers mit Revisions und die Dunkelroten bleiben als erst, als first Post da. Es gibt inzwischen 32.000 Posts mit
187.000 Autoren von 12.000 Institutionen. Viele der Papers werden, die meisten werden publiziert nach meistens ein paar Monaten in normalen Journals, inzwischen in mehr als 400 Journals und davon auch einigen recht bekannten Journals. Wenn man sich anschaut, welche Fächer das am schnellsten
aufgenommen haben, war überraschend, weil es am Anfang war, wie zu erwarten, Bioinformatics und Genome Sciences ganz stark vertreten. Das hat sich aber jetzt sehr schnell verändert. Jetzt sind die Neurosciences ganz oben und das war eine sehr große Überraschung. Es hätte wirklich keiner erwartet. Neurosciences sind eins der größten bio wissenschaftlichen Gebiete natürlich, aber
trotzdem war es überraschend, dass der Kulturwandel da so schnell passierte. Auf der anderen Seite links oben sehen Sie, dass Clinical Trials ganz, ganz klein sind und bis jetzt hat Bioarchives wollte auch oder hat eine Policy bei Clinical Trials eher Nein zu sagen, weil das kritischste, da kommen wir noch darauf zu sprechen, wenn ich noch Zeit habe.
Der Access zu den Preprints insgesamt jetzt, die Downloads sind auch aufgegangen. Wieder schöne exponentielle Kurve, wenn man sich das anschaut. Blau ist Abstracts und rot ist PDFs. Und es gibt auch mehr und mehr Storys, wo ganz klar praktisch erwiesen ist,
dass Preprints wirklich auch sehr breit gesehen werden. Das ist vielleicht das berühmteste Beispiel, wo zwei Preprints im Januar und April diesen Jahres ein Stock Market Verlust bei einer Firma von 500 Millionen verursacht haben, weil das Kast diese Genom Schere, die beidem bekannte Genom Schere eine Immunantwort bei Menschen hervorruft als Preprint,
non peer reviewed Preprint. Also das ist, hat Einfluss, das ist ganz klar. Und da gibt es viele andere Beispiele für jetzt ein paar Sachen zu der Journal Interaction. Es gibt gute Interlinks zwischen Preprints und Journals und Journals zurück zu Preprints. Und seit ein paar Monaten gibt es den MECA-Standard, das ist
ein Standardisierungsversuch, der uns erlaubt, zwischen Plattforms, es gibt eine ganze Reihe von Submission und Publication Plattforms, zwischen Publishing Plattforms, Papers hin und her zu schieben. Und ich glaube, das würde einen sehr starken Einfluss haben, dass diese Verbindung viel effizienter läuft. Es gibt also Direct Posting zu Preprints
durch Autoren, aber die meisten Biowissenschaften gehen über Journals in den Preprint rein. Bei unseren Journals zum Beispiel, ich zeige Ihnen, wie das ausschaut, gibt es einen Two-Click-Prozess und man hat das Preprint gleichzeitig beim Journal und beim Preprint, beim Bioarchives eingereicht. Das gibt es inzwischen bei 12
Publishern und 34 Journals. Es gibt auch ein Authoring System, was schon Teil dieser Struktur ist. Bei uns haben wir jetzt inzwischen 350 Co-Submission Papers auf Bioarchives gepostet. Wir haben das jetzt seit dem Februar ungefähr. PLoS wird später dieses Jahr alle seine Submissions direkt
auf Preprints, auf Bioarchives posten. Das sind sehr, sehr viele. Das heißt, diese exponentielle Kurve wird einen kleinen Kind kriegen, weil alle PLoS One Papers auch gleichzeitig auf Bioarchives gehen. Jetzt wollte ich noch kurz zeigen, wie das bei uns aussieht. Diese Two-Click-Prozess, wir haben in sehr klarer Sprache in Rot und
Bold gesagt, dass dieser Click zu einem Preprint-Posting führen wird. Und das müssen wir sagen. Und wir haben da noch eine zweite Warnung da stehen, dass es jetzt wirklich auf das Preprint geht. Weil wir eine ganze Reihe von Autoren haben, die schockiert sind, wenn das Paper dann beim Journal abgelehnt wird, dass sie beim Preprint nicht abgelehnt
werden, sondern da weiter natürlich sitzen. Das ist der ganze Punkt, auf dem Preprint zu gehen. Wie Sie hier unten sehen, dieser Autor vor einigen Wochen meinte, dass Preprint ein ein Predatory, eine Predatory Trap ist, die von AMBO unterstützt wird. Obwohl er natürlich willens diese zwei Klicks gemacht hat und das gepostet hat.
Also es bedeutet, es ist noch Bedarf in den Bio-Wissenschaften zu kommunizieren, warum Preprints existieren. Und die Paranoia ist wirklich enorm hoch in den Bio-Wissenschaften. Wir haben einige Policies bei uns, die versuchen, das zu dampen ein bisschen. Also wir haben ganz klare Policies, die sagen Preprint Posting das
Not Precruited Subsequent Journal Submission und das andere Preprints nicht Einfluss haben auf die Submission bei unserem Journal. Das heißt, es gibt kein Scooping. Wir haben bei uns, was wir Scooping Protection nennen, das ist ein bisschen krass formuliert, aber es ist wirklich so, dass Leute sehr viel Angst haben, dass andere ihre Intellectual Property wegnehmen, dass von dem Day of
Preprint Posting egal ist, was sonst wo publiziert wird, dass wir nicht das, das gegen unser Paper bei uns nehmen. Dann wir hoffen, dass andere Journal das auch akzeptieren, damit das Playing Field wieder ein bisschen equilibriert wird. Wir haben jetzt inzwischen formelle Preprint Citation seit einigen Monaten, seit zwei, drei Monaten.
Das heißt, ein Preprint kann ganz normal in unseren Journals publiziert zitiert werden. Man sieht da unten, wie das aussieht, aber es wird mit einem Tag Preprint zitiert. Und das glaube ich sehr wichtig, damit man sehen kann, was peer reviewed ist und was nicht peer reviewed ist, weil bei uns peer review wirklich einen großen Unterschied macht. Wir haben jetzt bei uns seit zehn Jahren ungefähr publizieren wir alle
Referee Reports mit unseren Papers. Inzwischen ist das ein Community, wird das ein Community Standard. Vor einigen Wochen ist dieser Call rausgegangen, der versucht, alle Journals in diese Richtung zu konvertieren. Das heißt, dass alle Journals mit Referee Reports publiziert werden. Und wir werden sehen, dass wir diese Referee Reports auf den Preprint Versionen dieser Papers auch mit aufbringen.
Das heißt, dass die Preprints an Value gewinnen. Warum machen wir Preprints? Und dann höre ich auch gleich auf. Ich glaube, die Zeit fliegt weg. Okay. Warum ist das besonders wichtig, in der Biologie Preprints zu machen? Weil bei uns der Funding Cycle meistens um die drei Jahre ist und die meisten Forschungsprojekte, besonders die interessanteren Forschungsprojekte, die wirklich neue Sachen
entdecken wollen, mehr als drei Jahre brauchen. Das heißt, viele Studenten fallen in dieses Loch nach drei Jahren und müssen ihr Projekt komme, was wolle, fertig machen. Und das ist wo meistens Sachen mit Reproducibility Issues und Research Integrity Issues also wirklich ethische Probleme dann auch auftreten, weil dieser Druck, das wird häufig Publisher
oder Parish Druck genannt, enorm hoch wird, das Paper auf alle Kosten raus zu kommen, bringen. Und wir hoffen und wir haben auch eine Declaration, San Francisco Declaration for Research Assessment, die versucht, das ein bisschen aufzuarbeiten, dieses Problem, weil das auch sehr stark mit Journal Metrics zusammenhängt. Aber darauf werde ich jetzt nicht eingehen.
Aber wir hoffen, dass Preprints ein bisschen dieses Lochstoff, dass man die Sachen schon vorher rausbringen kann, damit man die sich darauf verlassen kann, dass die Sachen schon visible sind und verwendet werden können und dann mit dem Paper lieber abwarten kann, bis alles wirklich auch reproduzierbar ist. Und wir hoffen, dass das den Druck ein bisschen aus dem System nimmt. Aber wichtig noch zu erwähnen,
ist, dass Preprints doch wie Papers sind. Die sind stabile Records und da können natürlich auch misleading sein. Ich habe dieses eine Beispiel von 500 Millionen Stockmarket Verlust gebracht. Wenn diese Preprints natürlich Fake News werden oder einfach schlechte Wissenschaft, ist das ein wirkliches Problem. Und es gibt natürlich auch jetzt, wo wir in die medizinische Forschung gehen,
sehr viele ethische Probleme. Das heißt, die Reproduzierbarkeit, Quality Control, Data Integration Issues mit Open Science und die Discoverability dieser Preprints sind noch Baustellen praktisch. Und wir haben eine Idee, mit PLOS auch, dass wir versuchen, die Quality Checks, die Journals machen, das heißt nicht
Peer-Reason Quality Checks auf die Preprints gleichzeitig anzuwenden. Und wie ich erwähnt habe, macht PLOS das. Jetzt noch ein Slide wegen SPIN. Das ist eine wichtige Issue in den Bio-Wissenschaften, dass bei uns sehr viele Leute gegen Preprints noch sind, weil sie meinen, dass Leute ihre Claims praktisch schon
voraussetzen können durch schlechte Forschung, dass sie kleine Futsalarbeiten schon publizieren, damit die anderen nicht auf das gleiche Gebiet gehen. Ich kann nur sagen, dass die Community zusammenhalten muss und praktisch selbst kontrollieren muss, was in Physik sehr gut passiert. Biologie ist zehnmal größer.
Die Frage ist, ob das bei uns geht. Aber zum Abschluss noch zu erwähnen, das ist meiner Meinung nach viel gefährlicher ist, dass wir Predatory Journals haben und sehr viele schlechte Journals haben, die durch Open Access eher noch stimuliert werden, natürlich als traurigen Side-Effect, die claimen, peer-reviewed zu sein,
die aber praktisch bei Preprints haben wir ein sauberes System, weil das ganz klar sagt, this science has not been peer-reviewed, wait for the high quality Journal to get the validation. Und es gibt wird ein Medical Archives später dieses Jahr geben, was stärker Qualitätskontrolle
mit sich ziehen wird bei klinischen Studien ist es einfach enorm wichtig. Und die war ein ganz neues Qualitätssicherungssystem jetzt aus bei Cold Spring aber und das kommt im Dezember wahrscheinlich. Danke.