Masters of the Universe – Projektupdate Session 3

Kein Release, kein Showcase. Nur ein ehrlicher Stand nach drei Sessions.

Das Fundament

238 Episoden – He-Man und She-Ra, DE und EN – bilden die Basis. Darauf läuft jetzt eine mehrstufige Pipeline.

Was die Pipeline tut

Video rein, Einzelframes raus. Filmation hat in den 80ern dasselbe Bildmaterial dutzende Male verwendet. Die KI erkennt das und trennt: einzigartige Frames bleiben, Duplikate fliegen raus. Klassifiziert nach Charakter, Hintergrund, Effekt, Prop.

Audio läuft parallel. Demucs trennt Sprache, Musik und Soundeffekte. Whisper transkribiert die Sprachspur mit Zeitstempel. Die besten Sprachproben pro Charakter landen in einer Referenz-Datenbank – Grundlage für spätere TTS-Synthese.

Der Baukasten im Überblick

Klassifizierte Frame-Bibliothek. Audio-Stems (Sprache / Musik / SFX). Voice-Referenz-DB pro Charakter und Sprache. Charakter-Referenz-DB mit diversen Shot-Typen. 4K-Upscaling via RealESRGAN auf der RTX 4080.

Was noch offen ist

She-Ra EN noch unvollständig. TTS-Integration steht an. Und der End-to-End-Zusammenbau – das ist der letzte fehlende Schritt.

Kein Datum. Update kommt wenn es was zu sehen gibt.

Schreibe einen Kommentar