Wer über 15 Jahre in der Film- und Fotoproduktion arbeitet, sammelt Bilder. Viele Bilder. In meinem Fall: 115.528 Aufnahmen, verteilt über verschiedene Projekte, Clients, Formate und Ordnerstrukturen, die über die Jahre gewachsen sind wie sie eben wachsen – ohne System, ohne Plan, einfach organisch.

Das Problem war nicht die Menge. Das Problem war der Zugriff. Wenn ich ein Foto für ein bestimmtes Sujet brauchte – sagen wir, einen Dreh in Innenräumen mit bestimmter Lichtstimmung – blieb mir nur eins: suchen. Manuell, durch Ordner, durch Dateinamen, die oft nichts über den Inhalt aussagen.

Das war nicht mehr skalierbar.

Was entstanden ist

Ich habe ein automatisches Tagging-System aufgebaut. Ein Vision-Modell analysiert jedes Bild lokal – auf meinem Ubuntu-Server mit RTX 3060 Ti – und generiert Tags zu Motiv, Stimmung, Technik, Farbraum und erkennbaren Objekten. Die Ergebnisse landen in einer SQLite-Datenbank.

Zwei Watchdog-Prozesse laufen 24/7. Sobald ein neues Foto im Verzeichnis landet, wird es automatisch nachgetaggt. Das System wächst mit.

Stand heute: 80.681 Fotos sind getaggt. Das entspricht 69,8% der Bibliothek.

Was ich dabei gelernt habe

Das Wichtigste zuerst: Qualität ist wichtiger als Vollständigkeit.

Ein Vision-Modell liefert für jeden Tag einen Confidence-Wert – also eine Einschätzung, wie sicher es sich ist. Früh im Prozess hatte ich alles übernommen, was das Modell vorschlug. Das Ergebnis war eine Datenbank voller Tags, von denen ein guter Teil zu unspezifisch war um nützlich zu sein, und ein kleiner Teil schlicht falsch.

Meine Empfehlung: Confidence-Schwellenwerte setzen und konsequent einhalten. Lieber 70% der Bibliothek sauber getaggt als 100% mit Rauschen. Tags, die unter dem Schwellenwert liegen, werden geflaggt – sie landen in einer Prüf-Queue, nicht direkt in der Datenbank.

Was noch offen ist

30,2% der Bibliothek fehlen noch. Das sind etwa 34.847 Fotos.

Die Gründe sind unterschiedlich: ältere RAW-Formate, die das Modell noch nicht verarbeiten kann, Dateien in Ordnern, die der Watchdog noch nicht erfasst hat, und ein kleiner Teil an Bildern, bei denen das Modell konsistent niedrige Confidence-Werte liefert und manuelles Nacharbeiten nötig wird.

Der Rest kommt. Die Maschine läuft durch.

Für wen das relevant ist

Wer Archive verwaltet – ob aus der Filmproduktion, der Fotografie oder dem Eventbereich – steht früher oder später vor demselben Problem. Klassische Ordnerstrukturen helfen beim Ablegen. Sie helfen nicht beim Finden.

Ein KI-gestütztes Tagging-System löst das, aber es braucht Zeit, einen Durchlauf durch den gesamten Bestand, und eine klare Qualitätsstrategie. Der Aufwand lohnt sich: eine durchsuchbare Bilddatenbank, die tatsächlich auf Inhalte reagiert, ist ein anderes Werkzeug als ein Ordnerbaum.

Liebe Grüße, Sascha Manke

80.000 Fotos, eine KI und die Grenzen der Automatisierung

Was entstanden ist

Was ich dabei gelernt habe

Was noch offen ist

Für wen das relevant ist

Schreibe einen Kommentar Antwort abbrechen