Stack
Das Problem, Material zu finden
Wenn du ein Video schneidest, ist es eine Plackerei, den richtigen B-Roll-Clip zu finden: Du tippst Keywords in YouTube, scrubbst durch Ergebnisse, verfeinerst und wiederholst. B-Rolls Finder war mein Versuch, das durch ein Gespräch zu ersetzen. Du beschreibst Stimmung und Inhalt, den du willst, und es geht los und findet Kandidaten.
Chat als Interface, die API als Motor
Unter der Haube ist es die YouTube Data API, die sucht, aber das Interface ist eine Chatbox. Das LLM verwandelt eine lose menschliche Anfrage wie "ruhige Luftaufnahmen einer Stadt im Morgengrauen" in präzise Queries, führt sie aus und präsentiert die Ergebnisse im Gespräch, damit du in klarer Sprache verfeinern kannst.
- Du beschreibst in Worten, was du willst; das Modell verwandelt das in echte Suchanfragen.
- Ergebnisse kommen als kurze, überschaubare Shortlist zurück statt als endloses Scrollen.
- Du verfeinerst per Antwort, so wie du einem menschlichen Assistenten sagen würdest "mehr wie das zweite".
Die Lektion über gute Interfaces
Die API war der einfache Teil; der Gewinn war das Interface. Dieselben Daten, dieselbe YouTube-Suche, fühlten sich völlig anders an, wenn sie in ein Gespräch gewickelt waren statt in eine Suchbox. Es erinnerte mich daran, dass viel vom Wert in KI-Produkten gerade keine neue Fähigkeit ist, sondern ein besseres Interface zu Fähigkeit, die schon existiert. Ich stiess auch auf die praktischen Realitäten der Arbeit mit einer Drittanbieter-API: Quotas, Rate Limits und die Notwendigkeit zu cachen, alles, worüber ich abstrakt gelesen hatte und erst wirklich verstand, als es mich biss. Die API eines anderen zu respektieren ist Teil davon, ein guter Mitbürger zu sein, und Teil davon, nicht abgeschnitten zu werden.
Gelernte Lektionen
- Ein gesprächsbasiertes Interface kann ein Tool verwandeln, ohne die zugrunde liegenden Daten überhaupt zu ändern.
- Viel KI-Produktwert ist ein besseres Interface zu bestehender Fähigkeit, nicht brandneue Fähigkeit.
- Drittanbieter-APIs haben Quotas und Rate Limits. Cache Ergebnisse und respektiere sie, oder du wirst abgeschnitten.
- Lass das Modell lose menschliche Absicht in präzise Queries übersetzen. Diese Übersetzung ist das eigentliche Feature.
