Merken

Combining linear Support Vector Machines by constraining them to use the same set of features improves consistency in biomarker discovery for blood infections

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
wollte den Titel kommen erklärt kurz was die mich ganz ehrlich Optimierung ist das sind das vorliegt auch schon auf dem 1. Treffen letztes Jahr hatte er dann aber als Einstieg noch eine ganz gute Wiederholung Carsons Rex der diese ist in Aufstellen von linearen Programm oder gemischt ganzzahliger im Jahre Probleme das ist und erst mal nen Jahres vor Problemen wir wollen wir haben optimales Optimierungsproblem zum Beispiel wollen wir x 1 +plus x 2 minimieren das könnte Fehler sein also mehr praktisch Fehler die Summe der Fehler und wir können aber dann Zwangsbedingungen einführen und so den Suchraum eingrenzen und das ist eben das elegant an dieser ganzen Geschichte die für uns gerade in der Biologie enorme Vorteile hat ja also wo man diese zahlen müssen nicht
negativ sein dann hat man eben hier diesen einen Quadranten wo die Lösungen praktisch verkommen können wenn man keine Zwangsbedingungen hat und ja immer dann praktisch diesen Jungs Optik Problem dann als Formen aufstellt sieht man dass das so lineare Funktionen Sendungen sucht dann eben praktisch lineare Funktion geben an möglichst weit links unten ist und wir solche Nullpunkt als Lösung aber eben schon gesagt wir können Zwangsbedingungen einführen das kann einfach noch vor Informationen sein um den Suchraum einzuschränken und wenn man die dann in der Reihe nach dann einführt wird der Suchraum kleiner und die Lösung natürlich entsprechend anders also dass wir jetzt zum Beispiel in dem Fall hier unten dann die Lösung hätte für das Problem und das ist ein reines ihn ja das Problem wir können aber auch in in ganz ganzzahlige Zwangsbedingungen einführen und das hab ich mal einfach hier angedeutet dass man dadurch dann auch den Suchraum fragmentieren kann also ihres normalen Zwangsbedingungen sich dann sag ich's 1 muss -minus einer binären Variable mal aus der großen Zahl im Saal des kleiner gleich 1 zu 1 oder 1 -minus dieser der wenn er in den Mehr war ja von großen Zahl größer gleich 2 wenn man das so implementiert kriegt nur praktischen Suchraum Voliere sowas ausgeschnitten ist das heißt es jetzt in 2 Teile zerfallen es ist es kein konvexes Problem mehr aber dies Sorge die wir benutzen können auch diese Probleme eben sehr elegant lösen und das kann man dann
auch weiterführen und kommt dann eigentlich auch zu nichtlinearen also haben eigentlich in den Jahren zur wurde aber dann auch nichtlineare Probleme lösen kann gut
ja und wir benutzen den eben
und jetzt komme zu dem Titel das war schon vorher an besprochen wie diese super Maschinen funktionieren dank des einem der da das sind dann mit entwickelt hat einen Support weckte Maschinen wir haben die implementiert in die zerlege Optimierung und machen dass er mit den Jahren zur legte Maschinen und so Probleme sind oft auch kann auch stammen Regression lösen und die Antwort Maschinen denken denn wir reichen da aus wie gesagt nicht jene geht kommt müssen noch durch Zwangsbedingungen dann rein wenn man den Gletscher Variablen eingeführt ok was ist das Problem ja
wir sind ja am Uniklinikum in Jena und arbeiten auf sehr Aufsetzens Daten also will Daten zu schwerer skeptisch wird letztes oder septischen Schock das ist ausgehend von Infektionen im Blut die dann aber es überhand nimmt und eine starke Immunantwort erzeugt dann kommt es dann eben zur der Pathologie des man nicht offen starken Blutdruckabfall hat und er das dann das tut so klug sind und was dann gerade in den Kapillaren dann fatale Folgen hat weil dadurch die Organe versagen und ist dann eben oft zum Tod führt uns 1. Mann überlebt hat man in sehr schlechte die Prognose danach noch vernünftig leben zu können wenn man oft in Depressionen fehlt oder postdramatischen des postdramatischen sind im Zentrum hat gut also man muss er selbst es frühzeitig
bekämpfen das wird normalerweise mit Antibiotika gemacht selbst es ist meistens durch Bakterien kommt meistens aufgrund der Bakterieninfektion als und zusätzlich müssen natürlich auch gucken dass man die Organe ersetzt wieder ausgefallen sind dann muss Adrenalin zu geben wenn die Nebennierenrinde nicht mehr funktioniert wenn der Puls Blutdruck abfällt und musste Transmission geben auch bei Blutdruckabfall aber er gerade diese Antibiotika müssen eben frühzeitig und bricht nicht gegeben werden und bei älteren Patienten oder Patienten die immunsupprimierte ganz eben auch sein dass es ist die selten setzt es auslöst das heißt unsere Fragestellungen war dann können wir um und der bakterielle Follower Pilz induzierten selbst es unterscheiden und normalerweise was gemacht wird ist das praktisch Blutkulturen gezüchtet werden das Problem ist das dauert sehr lange gibt über Nacht und oft weckt dann auch gar nix es gibt aber Ansätze die dann praktisch molekulare Daten genommen haben also typischerweise den Expressions Daten indem man im Blut extrahiert die Ehren aus dem Blut und kann zu jedem gehen die Expression messen also kriegt dann so 20 Tausend Datenpunkte für jedes Kind einzeln wenn wenn in starken im Blut benötigt wird geht die Expression hoch leider gibt es mehrere Studien zu wir haben gesehen dass die alle sehr inkonsistente Resultate haben wenn es darum geht in eine kleine definierte Biomarke Liste zu finden die eben das eine vom anderen unterscheiden kann also hier auch Bakterien und Pilzen durch Induktion sagen dass ist Induktion dass ihnen der Antwort angemessen die Blutzellen und nicht im Bild der wo gut ja also das ist
praktischen Weiterführung von den Top vorher wir sind aber wir wir arbeiten mit linearen kürzt ja also wir haben Müller schon gesagt hat es geht darum hier in also zu separieren wir haben wieder hier diese 2 verschiedenen Farben mit 10 mal schwarz und nicht gefüllt sozusagen das muss unterschieden werden ja das Feld abspielt induziertes wer bakteriell induziert die und diese Klauseln passierten Maschinen Verfahren können eben generalisieren indem sie die matschigen so groß wie möglich aufblasen in den dann keine Datenpunkte sein dürfen das ist gezeigt worden dass das eben dann generalisiert dass man da irgendwie werden stringenter wird gut wir nutzen den gleichen Ansatz für machen das aber auch auf Intel 1 normiert mit denen er Gemisch ganzzahligen Optimierung und wir sagen ok wir wollen einfach nur 30 Feature haben das wegen der feste könnten noch 50 Feature oder 15 1 das ist man mit 30 gemacht haben und was wir jetzt allerdings mit dem Einsatz machen können man das ja noch das praktisch mit dem Nachforschungen Standards auch geht ich hab da nix Literatur gefunden wir können nach 2 des Vereins Nando kombinieren das heißt also wir haben 2 ist vor uns die praktisch das gleiche Kriterium haben die müssen beide ihre Martin optimieren wir summieren dann beides Matschenz als Optimierungskriterien und die die die haben aber die Zwangsbedingungen dass sie die gleichen Feature benützen müssen ach so ja das hab ich
auch noch vergessen dass war ich im Detail ist unsinnig unbedingt wissen also und praktisch diese Kost Pantschen einzuführen also Missklassifikation zuzulassen damit überhaupt Lesung kriegt dürfen nämlich doch ein paar hier drin sein arbeiten wieder wir wieder mit diesem Blick und das heißt es gibt Sample die also jedes 10. hat seine Beine über variable ob eben benutzt werden soll oder nicht und 10 Prozent dürfen auch 0 haben und diese 10 Prozent haben muss dass dann nämlich erfüllt sein dieses Kriterium gut aber ich war dabei zu
erklären dass für die kombinieren haben also 2 SVR nach optimieren praktisch die Summe der Markt stehen und wir führen die zusammen das die praktisch die gleichen viel zu benützen müssen das heißt es sind eingeschränkt das ist ein bisschen Zeit auf das wir hier an einen skizzierte Manekin 1 gegen 2 den 3 den 4 hat ist die Marktstände umstellen müssen größer die Summe als einzigen 1 gegen 2 und wir müssen dann die gleichen das können aber auch wieder als gegen 3 sein also dann suchen sie sich eben die besten gegenseitig aus aber dann kann dem seines thematischen bisschen kleiner wird gut aber wir haben dadurch eben erzogen dass die gleichen Merkmale benutzt werden und unser Ziel ist es möglichst konsistente Merkmals Selektion zu finden wir haben 5
verschiedene Datensätze die wirklich sehr verschieden sind aus Literatur und auch eigene Daten das ist ein anders als in das Bild von der Welt werden von von ich war im oder nuklearen wäre schön wir 14 bist ist es der Blut er dann Vollblut da nur Monozyten dendritische Zellen was bei den wollen zu gemeinsam ist dass man einerseits eben die Kirche Induktion hat das des Immunsystems und anderseits in die bakterielle dass es also mit grün-rot gegen gestellt aber auch so dass es nicht einheitlich ist ja und so ist auch im wirklichen Leben nur weiß ich nicht ob es wirklich Candida albicans ist was setzten nichts werden diese selbst ist der Mann durch entgegnete dass jetzt vor sagten Ochsen Aspergillus ist und die sind eben auch verschiedene Bakterien LPs ist ein Extrakt von Viren Bakterien Oberflächen gut ja dann haben
wir als nachweist dass dies gut funktioniert natürlich bei Maschinen Methoden Genauigkeit Sensitivität Spezifität geht das ist nichts Besonderes aber abends bei einem diesen Verweis auf zu wollen ja das praktisch mir immer wieder ähnliche Merkmale da finden und und dass man eben so dass wir zum Beispiel jetzt einzelne Maschinen haben also wenig kombiniert sind dann vergleichen wir geben es ist der eine Datensatz wie es ja im Winter eben in Teil des da der Daten kriegen da uns befiehlt Show und guten Überlauf an mit einem anderen Datensatz ja und dann wäre das für manche zum Dogma macht über dem Mittelwert nehmen muss frei macht Welt Ziele den Mittelwert 1 und er genau so machen wir das auch mit den Paaren das wir zum Beispiel Text mit sehr einfach kombinieren und nicht missen Klasse hat und das namentlich
so des das es ist nicht überlappt also ein paar also immer 1 Datensatz kabelten mit C kombiniert es gibt dann Packstück kombinierte Support Vector Maschine die wird aber nicht verglichen mit CSS ist erlaubt aber mit etwas anderem damit die 1. möglich dann aber wirklich komplett andere Daten haben mit denen dann der über lapidar berechnet wird gut ja das hat eigentlich her ganz gut
vom funktioniert also 43 Prozent Verbesserungen diese dieser per paarweisen Überlappungen die sind sehr niedrig haben da noch viele Methoden da kann ich gleich drauf also wir kommen hier praktisch von einst im Durchschnitt auf 1 1 Komma 5 also wie gesagt 40 Prozent mehr als 50 Prozent und das was
auch gut ist das praktisch die Performance dieser Maschinen lernen Methoden nicht einsehen werde gesagt ist und vielleicht auch die Absicht abstimmen müssen mit ihren Features und kann sein dass die klassifiziere schlechter werden dass dabei nicht der Fall dann ich sehr gute Performance da sah und interessant also können sehr gut unterscheiden nur die Merkmale sind eben immer ist er dort gehen und das damals ein bisschen besser hingekriegt gut und dann kommen
noch ein paar Filtermethoden wirklich einheitliche Signatur zu haben ja wir haben dann ist Gene selektiert zunächst mal die mindestens 40 Prozent von jedem reinen jedes Datensatzes ehe Easy das Paar Daten von Datensätzen eben selektiert wurde also 40 von 100 sozusagen am auf 72 kennen und dann haben wir noch gekuckt welche Gene wirklich in allen Datensätzen entweder hochgeregelt in Filz induzierter Immunantwort oder runter geregelt sind und damals noch 14
und er das diese diese Gene die auch eigentlich biologisch den machen also dass dem ob die Nase die wirklich praktisch versucht einen in dem Immunsystem entgegenzuwirken vereinen ja die die so neben dem starken Effekt durch durch die durch die durch das Platzen der roten Blutkörperchen aber auch die andern machen sind wir haben das im
Netzverbund angekuckt dessen meistens Target von SP 1 ist ein zentraler Regulator und auch von diesem SR 1 gut dann haben wir uns noch in weiteren
Datensatz angekuckt der überhaupt nicht in diesem Land Verfahren beteiligt war also noch in weiteren Austritt Radtour aus aus dieser Expressions Datenbank und haben dann diese 14 Biomarke im genommen geguckt wie gut sind wir Damen nur einfacher Regression gemacht und da ,komma eigentlich so auf 7 8 2 10 Genauigkeit also das scheint er ganz gut zu funktionieren diese nicht mehr bei den 98 Prozent aber immer noch ziemlich gut genau
ja also ich bin schon am Ende angelangt ich glaube ich werde auf und mit der Zeit nicht wir haben also mit dieser Gemisch ganzzahligen Optimierung in klassifikations Methode jetzt entwickelt bei der man eben 2 Classic Cartoon miteinander kombinieren kann die dann entweder so wie wir es gemacht haben eben die gleichen Features benutzen muss oder man kanns auch dass die kleinen Zehntel oder dass Sie vielleicht auch die Martin das Minimum wurde also praktisch Test ist matschen eben nicht die Summe soll da kann sie aber anderes waren überlegen man kann dem kombinieren wir haben es einfach mal gesagt wir müssen die gleichen Features nehmen die gleichen Merkmale ja Hammer eben das angewandt für den Fall den wir in brauchen für die dass wir praktisch Spiels gegen bakterielle induzierte jetzt es er verglichen haben muss dazu sagen die Daten die wir benutzt haben es sind jetzt nicht direkt Patientendaten es ist so dass praktisch Blut von Gesunden tun wollen genommen wird und dann werden die Werte werden die in der das infiziert und besichtigen mit Ort an sehr schwierig an wirklich nichts induzierte selbst ist also im Blut von Pilzen dazu dass jetzt ist zu kommen dann ja also wir haben es Paare verwendet wir haben auch schon 11 praktisch sag mal so viele Support weckte Maschinen kombiniert das geht auch aber natürlich ist man dann irgendwann eingeschränkt also das heißt du musst dann wieder mit 10 15 quietschende aber Merkmalen gearbeitet wenn man dann 4 nennt geht es aber mit 1500 aber es wird eben dann langsamer
gut ja das habe ich ja das habe ich gerade gesagt und schwarzer dir ja schon gesagt also wie gesagt im Grunde ist es nie das Problem das wir angehen aber dadurch dass man eben diese gerade wenn man viele denn der Variablen einführt kann man daraus auch einen wichtigen Jahres Probleme machen damit Methode ist in dem
Konferenz der Buchveröffentlichungen auf unsere Webseiten geht findet man das wenn man dabei Sarai Weltall kuckt für 2016 artikelschen und ich dann den Leuten die
auf der Folie sind und den ja den Geldgebern und dem los zu werden
Summe
Fehlermeldung
Große Vereinheitlichung
Optimierungsproblem
Extrempunkt
Lineare Optimierung
Optimierung
Optimierung
Computeranimation
Binärcode
Reihe
Nebenbedingung
Konvexer Körper
Optimierung
Zahl
Variable
Computeranimation
Lösung <Mathematik>
Bildschirmmaske
Variable
Addition
Information
Lineare Funktion
Lineare Optimierung
Teilmenge
Nebenbedingung
Globale Optimierung
Mixed Reality
Optimierung
Widerspruchsfreiheit
Variable
Computeranimation
Variable
Ganze Zahl
Nichtlineares System
Lineare Regression
Addition
Optimierung
Lineare Optimierung
Tropfen
Folge <Mathematik>
Kapillardruck
Fortsetzung <Mathematik>
Organic Computing
Widerspruchsfreiheit
Computeranimation
Endogene Variable
Regulärer Ausdruck
Prognose
Zellularer Automat
Gasdruck
Streaming <Kommunikationstechnik>
Term
Nebenbedingung
Stichprobe
Ganzzahlige Optimierung
Extrempunkt
Objektklasse
Computeranimation
Funktion <Mathematik>
Parametersystem
Lineare Optimierung
Intel
Standardabweichung
Stichprobe
Implementierung
Support-Vektor-Maschine
Summe
Datensatz
Datentyp
COM
Zellularer Automat
Stichprobe
Globale Optimierung
Computeranimation
Datensatz
Objektklasse
Mittelwert
VECTOR <Programm>
Sensitivitätsanalyse
Paarvergleich
Computeranimation
Mittelwert
Sensitivitätsanalyse
Abstimmung <Frequenz>
Empfindlichkeit
Durchschnitt <Mengenlehre>
Mini-Disc
Computeranimation
Soundverarbeitung
Datensatz
Elektronische Unterschrift
Widerspruchsfreiheit
Computeranimation
EASY <Programm>
Mittelwert
Font
Datensatz
Elektronische Unterschrift
Lineare Regression
Sensitivitätsanalyse
Anwendungsspezifischer Prozessor
Datenbank
Empfindlichkeit
Oval
Arithmetischer Ausdruck
Regulator <Mathematik>
Computeranimation
Binärdaten
Ganzzahlige Optimierung
Globale Optimierung
Mixed Reality
Optimierung
Widerspruchsfreiheit
Variable
Computeranimation
Summe
Variable
Tupel
Ganze Zahl
Zellularer Automat
Minimum
Lineare Optimierung
Uniforme Struktur
Gruppenkeim
Einheit <Mathematik>
Verschlingung
Datennetz
Sollkonzept
Web-Seite
Diskrete Untergruppe
Computeranimation
Vorlesung/Konferenz

Metadaten

Formale Metadaten

Titel Combining linear Support Vector Machines by constraining them to use the same set of features improves consistency in biomarker discovery for blood infections
Serientitel The Leibniz "Mathematical Modeling and Simulation" (MMS) Days 2017
Autor König, Rainer
Mitwirkende Leibniz Institute for Natural Product Research and Infection Biology - Hans Knöll Institute (HKI)
Weierstraß-Institut für Angewandte Analysis und Stochastik (WIAS)
Lizenz CC-Namensnennung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
DOI 10.5446/30617
Herausgeber Technische Informationsbibliothek Hannover (TIB)
Erscheinungsjahr 2017
Sprache Deutsch
Produktionsjahr 2017
Produktionsort Hannover

Inhaltliche Metadaten

Fachgebiet Informatik
Abstract Blood infection is highly prevalent in critical ill patients and can lead to sepsis and often death. It can be caused by bacteria or fungi and for appropriate treatment it is mandatory to identify the type of infection early. To find discriminating biomarkers, in situ high throughput gene expression profiling of immune cells after fungal or bacterial infection have been performed. However, these studies showed very heterogeneous results. To find a generic gene signature with discriminative power across all datasets, we implemented linear SVMs basing on Mixed Integer Linear Programming. We combined classifiers constraining them to use the same set of features. Learning with one pair of datasets and applying to the rest of the datasets showed 43?mprovement in consistency of the selected features (genes) while non-decreased classification performance (accuracy: 0.96). The final biomarkers comprised of 19 genes mostly involved in ERK-MAPK signalling being central in immune response.

Ähnliche Filme

Loading...