More Than Pixels - Unlock your image data with Vision-Language Models

Swiss Python Summit Association

Kolbe, Johannes

Formale Metadaten

Titel

Serientitel

Swiss Python Summit 2024 (SPS24)

Anzahl der Teile

Autor

Kolbe, Johannes

Mitwirkende

N. N. (Moderation)

Lizenz

CC-Namensnennung 4.0 International:
Sie dürfen das Werk bzw. den Inhalt zu jedem legalen Zweck nutzen, verändern und in unveränderter oder veränderter Form vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.

Identifikatoren

10.5446/69794 (DOI)

Herausgeber

Swiss Python Summit Association

Erscheinungsjahr

2024

Sprache

Englisch

Inhaltliche Metadaten

Fachgebiet

Informatik

Genre

Konferenz/Talk

Abstract

Join us on two Vision-Language Adventures! We'll uncover the information hidden inside big image collections with Vision-Language Models (VLMs) showing us the way. Who knows which forgotten gems await us? In the first part, we'll use CLIP and FAISS to go on a treasure hunt in your photo collection. You'll learn how to filter through millions of images in a breeze, using natural language. Bye-bye endless scrolling, hour-long tagging, and frustrated folder searching