B-Rolls Finder: YouTube per Gespräch durchsuchen

Das Problem, Material zu finden

Wenn du ein Video schneidest, ist es eine Plackerei, den richtigen B-Roll-Clip zu finden: Du tippst Keywords in YouTube, scrubbst durch Ergebnisse, verfeinerst und wiederholst. B-Rolls Finder war mein Versuch, das durch ein Gespräch zu ersetzen. Du beschreibst Stimmung und Inhalt, den du willst, und es geht los und findet Kandidaten.

Chat als Interface, die API als Motor

Unter der Haube ist es die YouTube Data API, die sucht, aber das Interface ist eine Chatbox. Das LLM verwandelt eine lose menschliche Anfrage wie "ruhige Luftaufnahmen einer Stadt im Morgengrauen" in präzise Queries, führt sie aus und präsentiert die Ergebnisse im Gespräch, damit du in klarer Sprache verfeinern kannst.

Du beschreibst in Worten, was du willst; das Modell verwandelt das in echte Suchanfragen.
Ergebnisse kommen als kurze, überschaubare Shortlist zurück statt als endloses Scrollen.
Du verfeinerst per Antwort, so wie du einem menschlichen Assistenten sagen würdest "mehr wie das zweite".

Die Lektion über gute Interfaces

Die API war der einfache Teil; der Gewinn war das Interface. Dieselben Daten, dieselbe YouTube-Suche, fühlten sich völlig anders an, wenn sie in ein Gespräch gewickelt waren statt in eine Suchbox. Es erinnerte mich daran, dass viel vom Wert in KI-Produkten gerade keine neue Fähigkeit ist, sondern ein besseres Interface zu Fähigkeit, die schon existiert. Ich stiess auch auf die praktischen Realitäten der Arbeit mit einer Drittanbieter-API: Quotas, Rate Limits und die Notwendigkeit zu cachen, alles, worüber ich abstrakt gelesen hatte und erst wirklich verstand, als es mich biss. Die API eines anderen zu respektieren ist Teil davon, ein guter Mitbürger zu sein, und Teil davon, nicht abgeschnitten zu werden.

Gelernte Lektionen

Ein gesprächsbasiertes Interface kann ein Tool verwandeln, ohne die zugrunde liegenden Daten überhaupt zu ändern.
Viel KI-Produktwert ist ein besseres Interface zu bestehender Fähigkeit, nicht brandneue Fähigkeit.
Drittanbieter-APIs haben Quotas und Rate Limits. Cache Ergebnisse und respektiere sie, oder du wirst abgeschnitten.
Lass das Modell lose menschliche Absicht in präzise Queries übersetzen. Diese Übersetzung ist das eigentliche Feature.

Weiterlernen

Lektion

Eigene KI-Tools mit APIs bauen

Eigene KI-Tools auf Modell-APIs bauen, inklusive Bild-zu-strukturierten-Daten-Workflows, statt SaaS zu kaufen

Öffnen Lektion

Browser-Automation und Scraping: Playwright, Browser Use und der .har-Trick

Das Web zuverlässig mit Playwright automatisieren und scrapen, inklusive Non-Headless-Trick mit manuellem Login und dem .har-Trick

Öffnen Lektion

Mit Agents reden: Prompt Engineering, das wirklich funktioniert

Einen Coding Agent so briefen, dass er beim ersten Mal grossartige Arbeit liefert - mit Axiomen, Framing, Pushback und Spec Sheets

Öffnen Grundlage

Was ist eine API? Ein Leitfaden in klarer Sprache

Eine API ist eine Art, wie zwei Programme miteinander reden. Lerne, was eine API ist, wie sie funktioniert und warum sie für das Bauen mit KI zählt.

Öffnen Grundlage

JSON, YAML und Markdown erklärt

JSON, YAML und Markdown sind drei Klartext-Formate, denen du ständig begegnest. Lerne, wofür jedes da ist und wie du sie auf einen Blick liest.

Öffnen Grundlage

Was sind Tokens in KI?

Tokens sind die Textstücke, in denen KI-Modelle lesen und abgerechnet werden. Lerne, was ein Token ist, warum es für die Kosten zählt und wie es sich von einem Security-Token unterscheidet.

Öffnen

B-Rolls Finder: YouTube per Gespräch durchsuchen

Stack

Das Problem, Material zu finden

Chat als Interface, die API als Motor

Die Lektion über gute Interfaces

Gelernte Lektionen

Bereit, KI als Workflow zu nutzen?

Stack

Das Problem, Material zu finden

Chat als Interface, die API als Motor

Die Lektion über gute Interfaces

Gelernte Lektionen

Weiterlernen

Bereit, KI als Workflow zu nutzen?

Einmal pro Woche bessere KI Workflows.