CTA - Eine Initiative der Österreich Werbung
smartv2909_A_comic_style_of_two_teenage_girls_taking_selfies__48a9e224-a8fc-4f36-a76d-9db594607478_2.png©Roman Egger

artikel

22. Okt. 2024

Tag 3 der AI Challenge: Bildbeschreibungen mit KI

Künstliche Intelligenz

Digitalisierung

In unserer dritten Challenge geht es darum Bilder mittels KI beschreiben zu lassen. Ja, ihr lest richtig - wir wollen keine Bilder generieren, sondern Bilder beschreiben lassen. Wofür sollte dies gut sein? Beispielsweise wenn ihr für eure Website die Bilder mit Alt-Texten beschriften wollt, damit sie barrierefrei sind und ihr so dem Barrierefreiheitsstärkungsgesetz entsprecht. Ihr könnt aber auch Bilder als Ausgangspunkt für euer Marketing nutzten - und darum geht es heute.

Worum geht´s in der heutigen Challenge: deine Kreativität ist gefragt!

 

Sprachmodelle wie ChatGPT, Claude oder Gemini sind multimodale Modelle. Das bedeutet, sie verstehen nicht nur Text sondern auch andere Medientypen, darunter auch Bilder. Sie wurden auf riesigen Datenmengen dieser unterschiedlichen Medienformen trainiert und können daher ein "semantisches Verhältnis" zwischen beispielsweise Bildern und Texten herstellen. Wir können uns dies zu nutzen machen, etwa wenn wir ergänzend zu unserem Prompt ein Bild hochladen. Ihr habt ein Problem mit einer Excel-Funktion und kommt nicht auf den Fehler? Dann beschreibt doch den Fehler, ergänzt dies aber auch mit einem Screenshot. Nun macht das GPT genau worum es heute geht. Es "versteht" das Bild und wird versuchen, gemeinsam mit eurer Fehlerbeschreibung, eine Lösung für euer Problem zu finden.

 

Wenn ihr ein Foto hochlädt und als Prompt schreibt "beschreibe mir dieses Bild" oder "was kann man auf diesem Bild sehen?" werdet ihr eine mehr oder weniger ausführliche Antwort bekommen. Probiert dies doch aus und variiert mit dem Prompt. Zum Beispiel dass der Text länger oder kürzer sein soll, worauf bei der Interpretation besonders zu achten ist, fragt zu welcher Tages- oder Jahreszeit das Bild wohl aufgenommen wurde, wie alt Personen auf dem Foto sein dürften, welche Emotionen die Personen haben etc. Ja, ein Bild sagt mehr als tausend Worte - nur, dass wir uns diese Worte nun von einem GPT ausgeben lassen können. Spielt euch damit ein wenig, bevor ihr die eigentliche Challenge startet.

 

Deine 5-Minuten-Aufgabe für heute: Originalität trifft auf AI – Das kreative Bildbeschreibungsduell

Du hast ein oder mehrere Fotos von deiner Destination und deine Mission lautet, eine KI zu verwenden, um dieses Bild in einem ganz besonderen Stil zu beschreiben. Doch es reicht nicht, einfach nur irgendeine Beschreibung zu erstellen – es geht darum, die KI in einen ganz bestimmten Kontext zu versetzen - denn du sollst das Bild als Ausgangslage für Storytelling nutzen. Nun ist deine Kreativität gefragt, denn dieses Mal darfst du dich beim Storytelling so richtig austoben. Wie ist das gemeint? Hier ein Beispiel:

 

  1. Wähle ein oder mehrere Bilder: Zum Beispiel ein Bild der Getreidegasse in Salzburg.
  2. Formuliere die Aufforderung: Du entscheidest, in welchem Stil oder für welches Medium die Beschreibung sein soll. Hier ein paar Ideen:
  • Comicbuch: „Beschreibe die Getreidegasse, als wäre sie der Schauplatz eines Superhelden-Comics. Wer sind die Helden, wer die Bösewichte?“
  • BRAVO-Zeitschrift im Dialog: „Verfasse einen witzigen Dialog zwischen zwei Teenagern, die durch die Getreidegasse laufen und versuchen, den besten Selfie-Spot zu finden.“ (Für diese Idee wären wohl mehrere Bilder gut geeignet)
  • Reiseblog für Haustiere: „Beschreibe die Gasse aus der Sicht eines Hundes, der mit seinem Herrchen auf Abenteuer ist.“

 

Deine Aufgabe besteht also drin, auf kreative Art und Weise zu überlegen in welchem Kontext, aus welcher Perspektive und wie deine Story entstehen soll. Dann nutzt du die Bildbeschreibungsfunktion vom Sprachmodell deiner Wahl und veränderst den Prompt so, dass die Beschreibung des Bildes im gewünschten Kontext passiert.

Gewinnspiel Alert

Heute haben wir etwas ganz Besonderes für dich! Bei der heutigen Challenge gibt es nicht nur eine spannende Aufgabe, sondern auch die Chance, etwas zu gewinnen: 3 Kursplätze für das exklusive Webinar „Präsentation & KI“ mit Roman Egger. 🎉

Wir verlosen die Plätze in unserer Whatsapp Austauschgruppe und unter allen Kommentaren auf LinkedIn.

Um die Jury zu überzeugen, solltest du folgende Infos mitliefern

  1. Das verwendete Bild/die Bilder
  2. Der von dir verwendete Prompt
  3. Die vom GPT erstellte Beschreibung/Story

Dies könnten Bewertungskriterien für die Challenge sein

  • Originalität der Aufforderung: Wie kreativ ist die Art und Weise, wie du das GPT gebeten hast, das Bild zu beschreiben?
  • Unterhaltungswert der Beschreibung: Bringt die Beschreibung zum Lachen, Staunen oder regt sie zum Nachdenken an?
  • Passgenauigkeit zum Bild: Wie gut passt die originelle Beschreibung zum eigentlichen Bild?

 

Ich bin schon sehr auf eure kreativen Ideen gespannt - und wer weiß, vielleicht kann man ja schon bald eine neue, unkonventionelle Art des Storytellings auf eurer Website lesen! Viel Spaß dabei...

Weiterlesen?

Einfach registrieren

Jetzt kostenfrei registrieren, um diesen und weitere spannende Inhalte zu lesen.

Das Passwort muss aus mindestens 8 Zeichen bestehen, einem Großbuchstaben, einem Kleinbuchstaben, einer Zahl und einem Sonderzeichen.

Du hast schon einen Account?

Anmelden

Mit der Registrierung stimme ich zu, dass ich die Nutzungsbedingungen und die Datenschutzrichtilinien gelesen und akzeptiert habe.

Ähnliches

Das könnte dir auch gefallen

Achtung: Ungespeicherte Änderungen

Bitte sichere deinen Beitrag als Entwurf, da ungespeicherte Änderungen nicht wiederhergestellt werden können, wenn du die Seite verlässt.