Merken

Long-Term Accessibility of Software through Web Archives

Zitierlink des Filmsegments
Embed Code

Automatisierte Medienanalyse

Beta
Erkannte Entitäten
Sprachtranskript
guten Morgen Herr meinen Vortrag wird es noch mal wissen ,komma Community wie unspezifisch wahrscheinlich weil ich will mit über 10
Nationen noch Formulierungen noch irgendwelche mathematischen die Polizeistatistiken aber man sieht ja schon und ich kommen von verschiedenen Partnern Schwimmkurse verschiedene Projekte Spinnereien mein Name ist in Deutschland nicht von es eigentlich arbeiten hier aber stellvertretend für das für die sozusagen im Projekt entschieden hatte und das Projekt Alexandria steht auch noch mit rein weil das sozusagen der Datenlieferant für die Analysen ist die wir gemacht haben auch meine auch Projekte mich ansonsten arbeiten und
so bezahlt Hintergrundgeschichte warum wir das überhaupt gemacht haben und wie das hier rein passt also das alle städtischen Kontext von FED Mathematik aber das ist also ein Projekt auch von der DFG um einen Fachinformationsdienst für die Mathematik aufzubauen und die haben ja 1 Unterprojekt davon dass wir gut zusammenarbeiten und das ist das Projekt Mehr ihren Text wird also nicht speziell nur um 1 ob wir wir haben sondern dass wir den Fokus auf Software gelegt wurde konnten die kann man Software eigentlich in der mathematischen Literatur umgehen und da haben wir uns halt die Frage stellt wie kann man so viel über zitieren die ganze Welt erfahren Sie und das ist ja schon in vorherigen Proxy müssen gekommen wenn ich 40 Tiere hat sich daher im Prinzip gar nichts von mir nicht in die zitiert das auch an ,komma nach langer Zeit ist dann muss man diese wie lange Zeit so greifbar machen haben schon das Problem mit den Versionen gehört speziell Wolf haben vor gestern das heißt wie man muss auch die Versionierung bewahren wenn er Version nicht mehr aktuell ist muss man trotzdem noch Informationen über diese Lösung bekommen können im Idealfall sogar die Version selbst weil eventuellen Experimenten nachvollziehen können oder noch wiederholen könne und dann stellt sich die Frage welchen Funktion brauch ich überhaupt und so genau wie möglich auf eine bestimmte Version oder für bestimmte Software vorweisen zu können und darüber hinaus wenn ich so genaue Informationen möglich hat um einen Punkt auf eine weisen die es auf vielleicht ergibt welche Information ob ich dann über diese Software um zu verstehen was die Software damals getan hat oder was es dort auch heute noch tut wird sich aber kein Zugriff auf und dieses ganz Experiment was in den Publikationen geschrieben nachvollziehen zu können und da gibt es bestimmt Stellen dass natürlich über eine ästhetische implizit ziemlich grob darum will ich eigentlich und Software-Produkte differenzieren Wolfram hatte das Kind in einem Land das seinen Namen oder möchte ich bestimmte ganz genau das Artefakt wenn wir hier verweise das wären die Versionen wie zum Beispiel das ist also in der also so eine Hierarchie sozusagen abgebildet mit Excel ich hätte da das Produkt an sich ich aber auch Excel 2007 schon Version ist gleichzeitig einen Container für viele unter Versionen und dann kann sozusagen jedes hält Schillerpark fix wieder eine kleine meiner Änderungen ganz hinten an der Stelle mit sich bringen die eventuell scheint es tatsächlich dann ist noch hier die die Frage wie kann ich in bestimmten Zustand eines auch überhaupt identifizieren das ist nicht immer so schön wie mit der Versionsnummer wie oben im Beispiel sondern gerade Open-Source-Software wird diese Version vielleicht nicht immer mit gepflegt wird eigene Software entwickelt hat man vergibt man häufig gar keine Version trotzdem ist dieser Begriff irgendwo online wird Update wird das Ganze auf einer Plattform geht hat macht hat man ganz der diese diese Stars die ziemlich genau ein Comic beschreiben das hat man aber bei proprietärer Software zum Beispiel gar nicht also da gibt es überall Türen das und dann wieder einmal die schlechte Verfügbarkeit wieder häufig also Software zu begreiflich auf einem Beine ließ zu die auf die kann ich vielleicht gar nicht mehr zugreifen weil es ein von proprietärer Software geht die von einem Unternehmen entwickelt wird was uns hoffentlich ausgibt an und zwar keine Lizenz erwerben kann oder einfach keine Zeit hat und eventuell gibt es dieses Unternehmen auch gar nicht mehr dass die Entwickler gar nicht mehr und ich kann auch die so gar nicht mehr zugreifen will die eine Sache ist wo greift überhaupt dieser dazu ob ich auch heruntergeladen Hansjürgen kauft das müsste der Dienste für das Archivieren zuständig ist er genauso tun also das sind so die kleinen das miteinander zu tun hat und am Ende zum Schluss
gekommen dass es obgleich wir eigentlich nicht komplett möglich ist das kann man sich allein daran klarmachen dass jemand hat eine Publikation eines Software verwendet er hat die Suppe selbst nicht mehr so eine das Unternehmen dass dieser entwickelt hat gibt es nicht mehr und ich kann es auch gar wenig nicht mehr an in dem Fall ist es aber unmöglich ist mit solche wir dass wir so der der drastische vor es gibt aber natürlich auch abgeschwächt fehlen zum Beispiel ist es schon ziemlich stark natürlich einzeln Version zu archivieren wenn Version nicht archiviert hat kann das genau die Version sein die in eine begehrt und benutzt wird weiterhin mit eine liege zwischen also hab ich überhaupt Lizenz um 1 Uhr archivieren darf ich dieses Wort Weltbibliothek bereithalten und wenn ich sie bereit darf ich sie wieder aus dem ohne dass die Kunden Lizenz erwerben können hier um die Fragen können Sie eine Lizenz erwerben also da jetzt auch
viele Fragen und es kann natürlich sagen wenn es auch gleich die wir sowieso nicht komplett möglich ist wieso sollte es aber probieren wieso erweitern nicht einfach unsere Metadaten dahin gehend dass sie so aussagekräftig sind dass ich es auch wenn sich da nicht auch dann kommen man auch zu ganz viele Möglichkeiten die man da in diesem Metadatenstruktur Datenstrukturen reinstecken kann nur anderen bisher schon was gezeigt und eine Liste mit was kann ich für 52 70 Meter Seite und man braucht natürlich an Metadaten etwa Publikationen des kann man sich auch relativ einfach klar machen eine Publikation ist heute schon allein durch den Titel eindeutig zu identifizieren ist nicht übermäßig geht dann geht über den Autor und da hinzukommen noch der Verlag und schon hat man eine Publikation probiert und fest über eine publiziert ich kann man diesen Stand so und da steht alles drin was wir Publikation gehört das auch es nicht ist dynamisch und so entwickelt sich eigentlich die ganz weiter und es gibt nicht den einen Autor der ein Autor wirklich für immer oder sowas wie LG und Mozilla oder größere Open-Source-Organisation dahinter stehen es gibt aber hunderte oder teilweise Tausende betont die Kontributoren ändern sich das kann auch Kontributoren sein wieder Ausscheiden aus dem Projekt und dann stellt sich die Frage welche weil sich da überhaupt das gleiche ist mit Version wenn ich mir so Auflösung Verweise stellt sich in der Frage was bringt das überhaupt was hab ich jetzt auch von ich weiß der hat die Software in der Version 3 Punkt 5 von 7 und wenn ich sie lese ich hab und nichts über diese Lösung weiß weiß ich nicht wo der Unterschied zu 13 5. 600 Punkten um 8 ist und deshalb mehr Metadaten sind niemals allumfassend und allein aus dem Grund den sie niemals ausreichend sein weil es kann immer wieder ein neuer Autor kommen der eine bestimmte Eigenart ist und die ich nicht abgewendet haben wir 110 Lösung gekommen und das ist sind die Archive und die wollen in dem Prozess mit einbeziehen weil wir einfach uns überlegt haben ihren Wert ist im Prinzip alles verfügbar da sind alle mit verfügbar auch nicht unbedingt strukturiert aber heutzutage ist es so dass mit dem er arbeitet und was nicht und Werk ist das weiß man selbst eigentlich auch nicht es sei denn man tritt in Kontakt mit den vor Autoren und hat sich dieser selbst entwickelt aber uns sei nicht und ungehindert ist das es sowieso verloren das heißt an alle Metadaten die im Gebrauch sind auf jeden Fall selbst eines argumentiert wie bekomme ich dir strukturiert aus da kann man sich auch Gedanken machen aber es war wichtig dass sich diese wieder überhaupt abspeichern bzw. alles was in der über die Software da ist sollte ich jetzt nicht an bevor es halt nicht mehr da ist und ja es hat sich gezeigt und Analysen ist eigentlich relativ umfassende Präsentation des Ortes ist und wir Zeit und sogar als Zeuge also ist man kann es wirklich Stellvertreter ansehen weil in vielen Fällen ist tatsächlich so vereinbart verfügbar wenn es sich um Open-Source-Software geht oder ins Haus geholt in Deckung gehen können oder ich aber wenn so viel Informationen dass wenn ich das Instrument an die selbst wiederholen möchte es wenigstens komplett nachvollziehen kann weil ich komplette Beschreibung bis Software finde ich finde tragfähig für Kurzfilme weiß was in welcher Version gefixt wurden so was soll es einen Wert und hinterher kann man immer noch weitgehend und auf dynamische Art Meter an extrahieren und diese Kollektion jemanden Bericht hat mehr zu schreiben mit Metadaten dass der möchte dass ich ganz kurz noch was ist ein der Archiv das ist jetzt
in mehreren Rock schon mal kurz angeklungen wurde gezeigt und speziell diese Bilder hat die auch am 1. Tag schon gesehen das ist wie bei mir geschehen und das ist so das was die meisten mit weiblichen verbinden es gibt da tatsächlich ein ganz viele Organisationen die Berechtigung durchführen Einfuhren ist in den Aquarien die zur anderen mittlerweile viele Nationalbibliothek dass gäbe keine für zum Beispiel zur wirtschaftlichen Lage in die eine wie es hieß das Konsortium was dahinter steht und der am am Ende kommt alles auf die Nase fällt alles keine Dateien zurück beziehungsweise große Dateien werden in Solingen-Burg ,komma wo alles das Wissen gespeichert ist und die Möglichkeit auch zuzugreifen sein diese Werke erschienen und die benutzen
auch fast alle so entwickeln wird von den AG gehörte auch der von der Archive und die Personen die aber sein und sie dann diesen Überblick über archivierte Version können wir diese archivierten Version auf die alte Seite zugreifen das 1. Beispiel 101 und hier sieht man schon so kann es aussehen wenn die Seite relativ allumfassend archiviert wurde am 1. Tag hatten wir das Beispiel wo die 2 Punkte waren und noch ein und alles dazwischen frei das ist so das Gegenbeispiel das Optimum das wir erreichen wollen das kann natürlich nicht alles erreicht werden die hier auswählen welches Datum ich sehen möchte ich hab jetzt mal das
Datum rausgenommen kurz nach dem Berg Obama gewählt wurde und wird sieht man mal was die Times damals über die Wahl berichtet hat der und das sind im Prinzip das der verschieben aber wir sind gerade noch überhaupt in der Forschung wie man besser auch wirklich zugreifen kann und was man über verschiedene weiter machen kann was passiert alles im Kontext von Alexander Projekt das ist am Anfang kurz gezeigt hat und sie hat das speziell
was sich hier präsentiert ist eine gemeinsame Arbeit von er es von der Tür und auch zusammen mit den Zentralblatt speziell den erneuten von ist Alter und der immer und unsere Idee war eben dass man nicht das sind gesagt haben das Wetter und die das wissen in der über eine Software verfügbar ist als Stellvertreter für die Software betrachtet weil das ist ja etwas was sich nicht wehren kann anders als es auf dann haben wir Zeit für eine kleine Analyse und der Frage stellt nämlich wie gut es doch überhaupt präsentierten Internet dient das wirklich als ein Ersatz für versorgt wer welche Informationen kann ich daraus bekommen und auch wenn wir noch nicht aktiv anfangs auf der Webseite zu archivieren was ist denn heute schon da und was kann ich vielleicht weiter Applikationen tatsächlich aus dem wird wieder erfahren und
für die Analyse sind angegangen mit es dämmert dass wir
sozusagen unsere unser Datensatz um Einstiegspunkt in dieser Geschichte zu haben wie viel Zeit in der Herberge geschieden brauchen könnte ,komma konkrete URL und das Problem Welt ist dass die sich auch über die Zeit ändern und das ist das sicher nicht der ideale Einstiegspunkt mittlerweile gibt es auch Mitglieder der Werbebestimmungen tatsächlich suchen können wir entwickeln auch eigene Suchmaschine für das Verschieben der der Standard weg um die Ecke eines der Werke geschehen laufen alle so dass eine komplette URL angeben muss und damit ich es genommen so sieht es im Bad aus und wurde auch schon einmal gezeigt und es im ARD 2 eine Seite pro Software Produkt oder Container und hier sind ein Schreiben darüber lesen Metadaten und wollte ,komma dass er schon ganz gut erklärt oder was davor in einem anderen Frühling vor vor falschen erklärt dass es nach diesem Publikations basierten Ansatz aufgebaut ist dass die es werden gezielt die Publikation zuerst durch das Geld nach Sorte der und darauf basierend werden diese Container indes Markt zu einer so aufgebaut und deshalb hat man ganz schön zu ihrer Software alle Publikationen aus denen die Software bekannt wurde in Innenminister bekannt wurde er und das war sozusagen aus Ausgangspunkt das haben wir einmal komplett in's gespeichert ein Datensatz von über 12 Tausend kurz und sind dann ausgehend von denen wir an den Datensatz hier ich erstmal die URL ist das hier gesehen ist immer die URL angegeben weiterhin die Top 100 Publikationen also man kann man kann hier noch weiter schalten Sie das alles Suppe Singular 40 Seiten in die Top 100 genommen und dazu haben wir von Interlaken hat aus der Welt der Maschinen die Metadaten zu den archivierten Webseiten Kräuter zu diesen 12 Tausend Produkte und zwar einmal zu dem Zeitpunkt der Top Publikation eines werden können die Publikationen nach den meisten Konferenzen zu Themen wie viel nicht wie ursprünglich Konzerte häufig wurde der Titel differenziert werden nicht so konfrontiert und dann zum anderen haben wir noch die die letzten also die die spätesten archivierte Version der Webseite dazu jeweils die Metadaten heruntergeladen und dann ihren 5. Datensatz 1 4 1 5.
Datensatz immer noch mit einbezogen haben der stammt aus dem Alexandria Kontext und deshalb gab es wenn auch nur für deutsche bei den wir nicht das gesamte Web verfügbar ist es nicht immer gesagt dass alle Seiten die Sie daraus ob es immer gegenüber vom Deutschen wird unter die liegen und ehrlich Deutsch-Wagram komplett verfügbar über 18 Jahre hier lokal das wurde uns von Interlaken zu fügen gestellt und innerhalb dieses Werks konnten deshalb haben Mehr Analysen machen eine davon ist es diese hier wo wir uns einfach immer mal die die Top Publikation sozusagen und haben aus den Top 100 angeguckt haben Fall aus den Top 100 gekuckt wann gibt es die meisten Publikationen zu einer Software in welchem Jahr und das ist in dieser in diesem Material und dann wenn es die zweitmeisten gibt mit dem man das die meisten kopiert und dann ja das ist ja nur und dann ein Jahr danach 2 Jahre danach beziehungsweise ein Jahr vor 2 Jahren vor und in den gleichen Jahren haben wir die Links aus dem deutschen Werke die in die Webseite hinein zeigen also die zu der Webseite legen uns der einen aufsummiert und das in Korrelation gesetzt zu den zu den Referenzen auf dieser und was man die ganze sieht ist das tatsächlich in Links zu Software Webseiten die Software an sich ziemlich gut funktionierende vielleicht einen weißen also ziemlich gut repräsentieren als in dem Jahr in dem viele Publikationen auf eine Software eine verwenden in dem Jahr Württemberg auch häufig auf diese Software gelingt war schon mal ganz anders .punkt war um zu sagen ja das ist tatsächlich eine Art Ersatz für die
eigene Software und dann haben wir uns die die Homepages sagte mir die Kräuter von den Software-Produkten haben alle Links auf der auf der Webseite analysiert das man hauptsächlich die Links die wir von der Navigation sind also man sich so eine Homepage verweist auf der Vorstellung Navigationsleiste die Zeit eigentlich alle weiteren Unterseiten und die Arme nach einfachen Mustern in diesen Buells analysiert und probiert etwas zu klassifizieren um nicht zu sagen das zeigt irgendwo auf geht hab oder das zeigt auf eine URL die eine Dokumentation oder Menge beschreibt und habe danach das in diese 5 Kategorien einsortiert mich Dokumentation Publikationen Artefakte Code und Updates um einfach zu sehen was ist eigentlich von einer Software verfügbar und ist wichtig dass man das unterscheidet den Sourcecode zum Beispiel bedeutet ja nicht dass die Software an sich Open-Source ist das kann einfach nur sagen dass die Software nur eine Open-Source bewältigen verwendet in den meisten Fällen ist ihnen selbst auch Open Source aber auch nicht immer jedenfalls ist das nur eine Link Analyse der Mann guckt verweist die Software irgendwie auf Toastbrot und er ist super interessante Ergebnisse rausgekommen ich jemanden mit so kleinen Sprechblasen andere zeigt hat zum Beispiel ist ganz interessant dieser 4. bei den Kunden jeder 3. Wagen links ist dass das sind die Artefakte und das heißt so wie viele der Software-Produkte liberalisiert haben gibt es tatsächlich Downloads in irgendeiner der Form das kann ja Sourcecode seinen selbst kompilieren muss oder es können beide wie sein und hier sieht man wieder dass es eigentlich immer so an 3. Stelle während er hier bei den häufig zitierten am Sorte Produkt noch einmal hoch schießen immer noch besser die drüben in den normalisiert werden das heißt es auch die sehr häufig auf uns hierfür bietet tatsächlich auch dort an kann man umgekehrt sagen wenn man es aber wenig nicht zum Download anbieten würde mich wirklich freuen sich vielleicht ist das tatsächlich so das muss allerdings auch noch mal genauer analysiert werden außerdem eine rausgefunden dass ungefähr 60 Prozent der Software versichert Dokumentation verweist was sehr wertvolle eigentlich ist denn in den wenigsten Fällen möchte man wahrscheinlich nicht und mehr möglich nochmal nochmal Nachlaufenlassen also die Software wirklich sich beschaffen und so wie es in der Publikation geschrieben ist nochmal durchführen in meisten Fällen möchte eigentlich nur Hintergrundwissen zu der Publikation haben und die Software besser verstehen und das ist schon ziemlich gut das wir 60 Prozent aus diesen Seiten Dokumentation ausgehen können dass in den meisten Fällen bei zeitlich er außerdem gibt es nur zu 30 Prozent Phosphor das ist aber gar nicht so schlecht da wird man sich überlegt dass wir Gesamt 1. Akt betrachtet habe und dass ich über 12 Tausend Produkte waren und viele davon auch profitieren das heißt wenn man ja nicht nur auf die Open-Source-Software beschränkt und dann 30 Prozent davon tatsächlich auch so ist nicht so schlecht da er ja dann haben wir noch
eine 2. Analyse das Ganze mit den internen mit den Metadaten aus Interlaken in Verbindung gesetzt und geguckt was ist denn tatsächlich archiviert und mit zum Beispiel genommen also 2013 zeigt an die Anzahl der Software die in 2013 die meisten Publikationen hatte die auf dieses auch beweisen dass man sagen und dann haben wir geguckt wie viele von denen einige auch in der Kirche nicht unbedingt in dem gleichen Jahr aber allgemein wie viele von denen werden schon archiviert werden also vom in den A-Kader irgendwie in Kreuz mit in Betracht gezogen und da und da sieht man jetzt hier in diesem Programm chsh rötlichen das ungefähr da sich die Hälfte ist die schon mit einbezogen wird das nicht so schlecht wird ist weil die sich natürlich größtenteils auf die großen Seiten und fokussieren und ist es echt also derzeit nicht unbedingt einen großen Webseiten an besucht werden und dass es schade daran ist ist genau diese Route anzeigen dass nämlich die Seite die theoretisch archiviert werden sollte es aber nicht dürfen weil es in Rauballs Textil auf den Servern gibt die das explizit verbietet das heißt in dem Fall habe eigentlich keine Chance die Zeichen archivieren wunderte natürlich könnte aber die Webseitenbetreiber wollen das tatsächlich nicht was schade ist und die muss man vielleicht ein bisschen Arbeit leisten und mit denen um das ganze bekannter zu machen um klarzumachen dass die das doch ausdrücklich erlauben sollten viele machen das weil sie bestimmte Seiten nicht von Suchmaschinen Kreuth haben möchten allerdings könnte man wiederum ausschließen dass dass sogar richtig erlaubt werden was auch wiederum viele nicht wissen also da muss dessen Aufklärung sich entlassen werden und man das dann aber auch wieder abzieht hat man ja noch ungefähr 40 Prozent der Webseiten die tatsächlich heutzutage schon im Webarchiv das Internat als verfügbar sind und dann haben wir geguckt wie viele von denen sind tatsächlich in diesem Jahr verfügbar ist die Top Publikationen gehabt und haben dann herausgefunden dass das noch mal etwas mehr als die Hälfte ist nicht so dass ich damals schon klar dass das zu den Topp Publikationen von zu knapp 30 Prozent jeder Software kann ich von damals egal wann die waren sieht der das Blatt ungefähr stabil ansehen wie sah dieses auch bei als aus beziehungsweise die weil sie im Internet dargestellt repräsentiert durch Dokumentation und so weiter und dann haben wir noch das ist der dunkelblau bei den mal geguckt wie viel hat sich von diesem derzeit über verändert von damals als die Truppe wieder zu einer bis heute und da sieht man ja dass er aus den Seiten die damals verfügbar waren nicht das hellblaue fast alle also es ist wirklich ein Verlust sondern die Software derzeit nicht archiviert und dann geht es wissen verloren weil die Dokumentation dann einfach weiterentwickelt und die alten Dokumentation so häufig dann einfach nicht mehr da weiterhin einmal nachgeguckt werden in dem Jahr 0 im in die Top Publikationen war weniger Zeit in dem er nicht archiviert wurde wann ist denn dann archiviert und des ganzen Landes ist da diese diese Form zu sehen ist das heißt es ist relativ dicht danach dann doch archivieren sehen in dem Jahr als dann in den meisten Fällen doch ein Jahr danach oder maximal 2 aber das muss natürlich noch verbessert werden also zu
den erstmals sich gezeigt das Werk stellt Software ziemlich gut schon da mit einem was in Nürnberg über ein zuvor Software verfügbar ist das man keine wirklich sozusagen Stellvertreter betrachten und mit ja das ziemlich gut zu sehen war eine sehr große Anzahl der Software Webseiten bietet tatsächlich Dokumentationen und teilweise auch Artefakte also die jetzt nicht zu archivieren wirklich einfach schade weil sie morgen vielleicht nicht mehr da sind oder verändert sind und ihr Mann der heute seine Publikationen fragte der Version die heute runtergeladen hat wäre nicht mehr nachzuvollziehen einfach ja dann was er gesagt hat ungefähr 50 Prozent sind tatsächlich im Internet-Archiv verfügbar wir arbeiten gerade an Methoden um das aktiv zu verbessern und diese Methoden wurden auch speziell auf den mathematischen Sockelbereich entscheiden erst und ja weitere Details zu der Analyse sind hier in der als Zusätze die GdL veröffentlicht und war da tatsächlich unter den 10 Top hält also das ist anscheinend auch in der Geschichte lag Community Interesse an diesem da und obwohl das eine der ist die am meisten so Richtung Webarchive forscht zeigt sich doch dass eigentlich viel noch nicht klar ist was man alles machen kann viele Forscher in die Richtung wie kann ich das auch ,komma zugreifen wie kann ich das vielleicht analysieren aber das so zu verwenden als Ersatz für irgendwas anderes was in der echten Welt nicht archivieren kann es vielleicht auch ganze 1 und unsere umso mehr wird für den
weiteren Verlauf des Projektes ist eigentlich so wir haben einen Prototypen schon entwickelt der aus ausersehen hat die Publikationen auf die Software Webseiten im Internet Archive verweist die zu der Zeit schon gar Mann er gesehen wie viele es sind und da haben wir den Prototyp entwickelt der so aussieht wie und in den Ländern die in denen und kleine eigens einen die darstellen ob es eine archivierte Version gibt oder nicht und dann auf diese eigens klickt kommt man auf so Portal was richtig darstellt umstritten ist ob nicht sagte Version handelt in einer Publikation und wenn sie dazu die der 2. zudem Publikationsdaten schade ist natürlich des Publikationsdaten ist nicht immer das Datum oder sogar in den seltensten Fällen das Datum der Software die in den Täter tatsächlich benutzt wurde weil das der 1. Jahr später rauskommt oder eine alte Version benutzt werden weiß es einfach nicht es allerdings das genaueste was wir wissen zu dem Zeitpunkt wenn nichts genaues in der gegeben ist und dass war das Beste was wir derzeit tun können und wir arbeiten wie gesagt haben dass noch zu verbessern und die Arbeit sie da nicht so aus dass wir wir haben ein Konzept entwickelt mit dem Beitrag heißt es das heißt wir wollen eine kleine Bereiche geschaffen die speziell zugeschnitten sind auf ein bestimmtes Produkt eine bestimmte Sammlung von Webseiten und Sommerkollektion von Webseiten kann man zum Beispiel das dafür beschreiben das heißt das wären alle Webseiten die sich um eine Software drehen die auf verschiedene Arten und Weisen gesammelt werden könnten das können sowohl die Suppe Autoren machen also die Autoren von Helfern als auffällige im Prinzip ist das eine große Sammlung sein wollen nicht auf eine dieser Gruppen beschränken weil dann hat das Problem ist dass der Autor nicht tut kann ich mir als der Autor dieses auch wenig vernünftig davonziehen so muss ich auch die Möglichkeit haben seine Kollektion verstehen und das Ganze eigentlich so laufen dass man die Möglichkeit hat so für und niemand zu archivieren das heißt ich möchte jetzt immer wieder zu nutzen dann müsste ich auch die Möglichkeit haben jetzt diesen Stand in der archivieren zu können und das würde dann langsam dazu führen dass immer mehr Software zu dem Zeitpunkt tatsächlich verfügbar ist und man kann natürlich weitergehen und das als diese Länder welches zu betrachten die Volkskammer und dann folgt hatte die mit eindeutigen eigentlich und versehen auf denen wiederum verweisen kann sein Geld etwas das heißt wir dann nicht nur eine Zuordnung über das wieder zu uns Datum sondern hatten tatsächlich eine Zuordnung zu einer bestimmten Version wird die Lösung nicht bezeichnen kann aber zu einem Stand der in der angeschrieben und hinterher kann man natürlich noch weiter gehen und gucken was kann man aus diesen Bereichen wiederum heraus und wie kann ich diese Beispiele meinen kann ich vielleicht die ganze Versionshistorie Auswandererschiff wieder extrahieren kann ich Autoren finden kann ich sozusagen Anfragen an so richtig stellen und sagen ich habe diese Komponente einer Software benutzt welche Autoren haben eine Software mitgearbeitet und den Augen sprechen könne zu geben das sind alles nur Ideen an denen gearbeitet wird aber das grundlegende wir müssen dass man diese richtig aufbauen und dann kann man sehen was man damit macht und dann arbeiten wir Zeit und ich
auf den Seiten finden wir mehr Informationen und auf meiner Webseite die Publikation auch dann vielen Dank
Software
Forschungszentrum Rossendorf
Mathematisierung
Term
Computeranimation
Systemidentifikation
Proxy Server
Punkt
Verfügbarkeit
Information
Systemplattform
Computeranimation
Quellcode
Open Source
Umwandlungsenthalpie
Software
Internetdienst
Biprodukt
Softwareentwickler
Zugriff
Hardware
Binärdaten
Web Services
Mathematik
Mathematisierung
Programmierumgebung
Fokalpunkt
Software
Version <Informatik>
Information
Hill-Differentialgleichung
Versionsverwaltung
EXCEL
Datei
Punkt
Maßerweiterung
Computeranimation
W3C-Standard
Metadaten
Spezialrechner
Netscape
Software
Meter
Skript <Programm>
Datenstruktur
Meta-Tag
Elektronische Publikation
Dynamik
Mathematisierung
Bericht <Informatik>
Gasströmung
Dateiformat
Videokonferenz
Software
Datenstruktur
Version <Informatik>
ARCHIVE <Programm>
Spider <Programm>
Versionsverwaltung
Data Mining
Gegenbeispiel
Konvexe Hülle
Version <Informatik>
Optimum
ARCHIVE <Programm>
Computeranimation
Web Services
Internet
Forschungszentrum Rossendorf
Mathematisierung
Web Site
Web-Seite
Information
Analysis
Computeranimation
Software
Software
Anwendungssoftware
URL
Korrelationsfunktion
Internetworking
Korrelation
Mathematisierung
Web-Seite
Biprodukt
Web-Seite
Kontextbezogenes System
Analysis
Computeranimation
W3C-Standard
Metadaten
Datensatz
Software
WEB
Software
Suchmaschine
Version <Informatik>
URL
Ecke
URL
Programm
Web-Seite
Programmcode
Computeranimation
Homepage
Homepage
Metadaten
Software
Suchmaschine
Router
URL
Internet
Kategorie <Mathematik>
Konvexe Hülle
Open Source
Update
Biprodukt
Binder <Informatik>
Software
Menge
Verschlingung
Einheit <Mathematik>
Server
Downloading
URL
Internet
Web Site
Web-Seite
Computeranimation
Homepage
Richtung
Quellcode
Software
Software
Komponente <Software>
Physikalische Theorie
Version <Informatik>
ARCHIVE <Programm>
Versionsverwaltung
Data Mining
Prototyping
Prototyping
Mathematisierung
Web-Seite
Computeranimation

Metadaten

Formale Metadaten

Titel Long-Term Accessibility of Software through Web Archives
Serientitel The Leibniz "Mathematical Modeling and Simulation" (MMS) Days 2017
Autor Holzmann, Helge
Mitwirkende Leibniz University of Hannover, L3S Research Center
Weierstraß-Institut für Angewandte Analysis und Stochastik (WIAS)
Lizenz CC-Namensnennung - keine kommerzielle Nutzung - keine Bearbeitung 3.0 Deutschland:
Sie dürfen das Werk bzw. den Inhalt in unveränderter Form zu jedem legalen und nicht-kommerziellen Zweck nutzen, vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
DOI 10.5446/21904
Herausgeber Technische Informationsbibliothek (TIB)
Erscheinungsjahr 2017
Sprache Deutsch
Produktionsjahr 2017
Produktionsort Hannover

Inhaltliche Metadaten

Fachgebiet Informatik
Abstract Software is widely used and referenced in research and scientific publications. Hence, just like the results published in an article, associated software should be preserved and made long-term accessibly as well. Due to the nature of software and its dynamic aspects, this is rather challenging though. Very commonly, only related materials, such as a software's documentation, parts of its source code or change logs, are freely available. However, these can be very valuable to comprehend or reproduce experiments described in literature. We found that a big portion of this data is provided on the Web. Around 60% of the software webpages we analyzed link to documentation, while another 50% even contain some artifacts of the actual software [1, 2]. Web Archives are a way to preserve this information and allow for long-term accessibility, even if the software and corresponding information change. Although many of those websites are already archived, our study shows that the evolution of a software is not always well captured. Therefore, we are working towards a pro-active approach to archive software on the Web in the future as part of the scientific process. [1] Holzmann, H., Runnwerth, M., Sperber, W.: Linking Mathematical Software in Web Archives. 5th International Congress on Mathematical Software, ICMS 2016. Berlin, Germany (2016). [2] Holzmann, H., Sperber, W., Runnwerth, M.:?Archiving Software Surrogates on the Web for Future Reference.20th International Conference on Theory and Practice of Digital Libraries, TPDL 2016, Hannover, Germany(2016).

Ähnliche Filme

Loading...