8 min read

KI Bilder kostenlos erstellen: So gut ist das neue Google Bard Gemini Pro

Mit Gemini Pro in Google Bard kannst du jetzt kostenlos KI Bilder erstellen. Erfahre, wie es geht und wie sich das kostenlose Tool im Vergleich zu Dall-E 3, Midjourney V6 und Adobe Firefly 2 schlägt.
KI Bilder erstellen kostenlos

KI Bilder erstellen wird künftig einfach dazugehören. Umso schöner, wenn das auch kostenlos geht. Nachdem wir es mittlerweile gewohnt sind, für Midjourney V6, Dall-E 3 (in ChatGPT Plus) oder auch Adobe Firefly 2* (für Bilder ohne Wasserzeichen) zu bezahlen, bietet Google seit dem 1. Februar 2024 nun eine wirklich kostenlose Möglichkeit an, ordentliche KI Bilder zu erstellen, und zwar in

  • ziemlich guter Qualität,
  • in einer schönen Benutzeroberfläche,
  • und ohne kompliziertes Prompten.

Google Bard macht's möglich, und zwar dank der Google Bilder KI Gemini Pro. In diesem Artikel zeige ich dir, wie alles funktioniert, was du wissen musst, und wie sich die Bilder im Vergleich zu Midjourney V6, Adobe Firefly 2 und Dall-E 3 schlagen (inkl. Beispiele).

So kannst du Google Bard Gemini Pro nutzen

Gemini Pro ist bereits in vielen Ländern in Google Bard verfügbar. Um damit kostenlose KI Bilder zu erstellen, gehe einfach auf bard.google.com. Dafür benötigst du lediglich einen Google Account.

💡
Falls du einen Google Workspace Account nutzt, muss Google Bard erst für User aktiviert werden. Hier findest du eine Anleitung.

In Deutschland mit VPN nutzbar

Obwohl in der Google Mitteilung steht, dass die KI in "fast alle Ländern" verfügbar gemacht wurde, ist Deutschland leider nicht dabei. Wenn du hier versuchst ein KI-Bild zu erstellen, sieht das derzeit so aus:

Google Bard Fehler bei Bilderstellung aus Deutschland
Meldung, wenn du Bilder in Google Bard aus Deutschland erstellen möchtest

Wenn du deine Internetverbindung allerdings mit einem VPN Tool über ein Land wie die USA leitest, kannst du die Funktion nutzen. Ich selbst nutze NordVPN*. Weitere Angebote findest du in meinem VPN Vergleich. Es gibt auch ein tolles VPN Angebot im Rahmen des Setapp-Deals für Mac User.

VPN Vergleich: Die besten Anbieter im Überblick
In diesem VPN Vergleich findest du die besten kostenlosen und kostenpflichtigen VPN Anbieter im Vergleich, inkl. unserer Empfehlungen.

Steht die VPN-Verbindung, kannst du in Google Bard mit einem einfachen englischen Prompt ein erstes KI-Bild erstellen. Starte z.B. mit create an image oder tippe einfach ein, was du dir vorstellst.

KI Bilder erstellen mit Google Bard Gemini Pro
Bilder erstellen funktioniert, wenn die VPN Verbindung steht.

Für einen ersten Wurf und einen Prompt aus 10 Wörtern ist das schon gar nicht so schlecht. Die KI Bilder könnten definitiv mit einem Foto verwechselbar sein.

Was du bei Google Bard KI Bildern beachten musst

Google Bard Gemini Pro kann aktuell noch nicht ganz mit Midjourney oder Adobe Firefly mithalten (Beispiele dazu weiter unten), ist aber dafür komplett kostenlos und kann aktuell unbegrenzt genutzt werden. Hier kannst du also wirklich kostenlos unbegrenzte KI Bilder erstellen, und das sogar recht schnell. Es gibt aber ein paar Dinge, die du über die KI Bilderstellung mit Google Bard wissen solltest.


Lust auf mehr Artikel wie diesen? Erhalte kostenlos wöchentliche Updates:


1. Google Bard Gemini Pro Bilder haben ein unsichtbares Wasserzeichen

Google Bard nutzt die Technologie SynthID, um damit unsichtbare Wasserzeichen zu erzeugen und in jedes Bild einzubauen. Diese Technologie ist nicht ganz neu, aber ein echter Sicherheitsgewinn. Digimarc nutzt z.B. unsichtbare Wasserzeichen schon seit den Anfängen von Photoshop. Neue Tech-Unternehmen wie steg.ai haben das ganze seitdem erweitert und verbessert.

Unsichtbare Wasserzeichen werden erzeugt, indem eine Software die Pixel des Bildes so verändert, dass sie für Menschen nicht sichtbar sind. Die Anpassungen folgen einem Muster, das selbst bei Manipulation des Bildes weiterhin vorhanden bleiben sollen. Die Muster werden nämlich nicht in den Metadaten des Bildes gespeichert, sondern sind in den Pixeln des Bildes selbst eingebettet.

Die Technologie ist besonders dann hilfreich, wenn es um den Schutz von Urheberrechten / Bildrechten geht, oder darum, KI-Fakes / Deepfakes aufzudecken. So oder so kann damit aus Google-Sicht jederzeit der Weg zum Ursprung (dem Ersteller, also Google Bard Gemini Pro) zurückverfolgt werden.

Wie wichtig solch eine Technologie in Zukunft sein wird, zeigt mein Experiment mit Midjourney:

Face Swap / Deepswap: So nutzt du dein eigenes Gesicht in KI Bildern
Lerne, wie du mit Midjourney KI Bilder erstellst und mit deinem eigenen Gesicht bestückst.

Damit ist Gemini Pro der erste "große" kostenlose KI Bildgenerator, der eine solche Technologie nutzt. Google kann damit künftig kostenlose KI Bilder nicht nur erkennen, sondern ggf. auch im Algorithmus berücksichtigen. Ob und wie sich das auf SEO-Bemühungen auswirkt, bleibt abzuwarten. Und ob Bilder in Suchergebnissen damit künftig automatisch als KI-generiert markiert werden, bleibt ebenfalls abzuwarten.

Aber: Google könnte zumindest Fake-News (Bilder) schnell entlarven.

2. Google Bard ist streng und priorisiert Sicherheit

Ein weiterer Nachteil (oder auch Vorteil) ist, dass Google Bard ethische Regeln recht streng befolgt und den Schutz der Privatsphären deutlich strenger berücksichtigt, als das z. B. bei Midjourney oder auch Dall-E der Fall ist.

Dall-E weigert sich z. B. anstößige Bilder zu erstellen, hat aber kein Problem damit, Bilder von bekannten Personen aus dem öffentlichen Leben zu erstellen.

Midjourney geht hier sogar noch einen Schritt weiter. Hier lassen sich Personen z. B. auch in Comics oder andere Stile überführen.

Google hingegen nimmt nicht nur Personen in Schutz, sondern versucht alles zu unterbinden, was in moralisch fragwürdigem Kontext genutzt werden könnte.

Ich habe Bard z. B. gefragt, ein Bild von einem Police Officer zu erstellen, der einer Menge von demonstrierenden Menschen gegenübersteht. Google weigert sich hier ein Bild zu erstellen, weil es um die Darstellung von Gewalt oder Konflikten zwischen Menschen gehen könnte.

Ki Bilder erstellen kostenlos mit Google Bard , aber mit Einschränkungen
Klare Absage von Google Bard

Auch, wenn sich der ein oder andere hier in seiner Kreativität eingeschränkt fühlen mag, für mich persönlich fühlt sich das nach einer sinnvollen Regel an, die der Welt in der aktuellen Lage nur guttun kann. Die Regeln hat Google übrigens in ihren Design Principles festgehalten und werden nicht nur bei Bildern angewandt.

3. Google Bard ist schnell und erzeugt nur 2 Bilder

Im Vergleich zu vielen anderen KI-Bildgeneratoren erzeugt Google Bard beim ersten Wurf immer nur

  • zwei Bilder (manchmal sogar nur eins),
  • im quadratischen Format,
  • und Thumbnail Größe.

Öffnet man das Thumbnail und klickt auf Download Original (Klick oben rechts auf das Download Icon), wird ein Bild im .jpeg Format mit ca. 600 KB Größe und in den Dimensionen 1536 x 1536 px heruntergeladen. Ich habe auch versucht, über verschiedene Prompt-Änderungen das Output Format zu ändern (z.B. in 3:2), hatte aber bisher keinen Erfolg.

Für die Anwendung im Web reicht das aus. Wer mehr vorhat (Print), kommt hier an seine Grenzen.

💡
Tipp: 600 KB ist immer noch recht viel. Ich empfehle, vor der Nutzung auf deinem Blog Bilder zu komprimieren.

Wie gut sind KI Bilder von Google Bard im Vergleich zu anderen?

Um das zu testen, habe ich die kostenlose Bilder-KI von Google mit verschiedenen Prompts und Bilderszenarien (Food, Mensch, Landschaft) gegen die stärksten Mitbewerber antreten lassen:

  • Dall-E 3
  • Midjourney V6
  • Adobe Firefly 2

Mein Ziel war es, fotorealistische Bilder zu erzeugen. Darüber ist hier vor kurzem bereits eine umfangreiche Anleitung für Midjourney erschienen.

Fotorealistische KI Bilder erstellen (Midjourney Vorlagen)
Lerne, wie du mit Midjourney V6 fotorealistische KI Bilder erstellen kannst und wie du einfache, wirksame Prompts erstellst.

Erwähnenswert ist, dass außer Google Bard alle Angebote kostenpflichtig sind. Bei Adobe Firefly* kannst du jedoch bis zu 25 Bilder im Monat kostenlos erstellen, wenn du mit einem Wasserzeichen einverstanden bist. Danach geht es bei Firefly ab 5,49 € / Monat los und ist damit das günstigste kostenpflichtige Angebot im Vergleich (Midjourney kostet mindesten 10 USD / Monat).

Prompt 1: Food

In diesem Beispiel nutze ich einen möglichst beschreibenden Prompt, von dem ich weiß, dass er in Midjourney V6 gute Bilder erzeugt.

👉
Prompt: Food Photography of a creamy tomato soup. The tomato soup comes with a swirl of fresh joghurt sitting in the middle of the bowl, topped with crispy fried tofu bites and a sprinkle of basil, a bowl of fresh tomatos on the left, basil herbs on the right. High angle shot inspired by editorial food photography.

Hier sind die Ergebnisse im Vergleich von oben links nach unten rechts:

  • 1. Google Bard
  • 2. Dall-E 3
  • 3. Adobe Firefly 2
  • 4. Midjourney V6

Was auffällt:

  • Dall-E 3 sieht am unnatürlichsten aus, Firefly am natürlichsten
  • Midjourney kann mit räumlicher Angabe zu Platzierung am besten umgehen
  • Bard und Midjourney nutzen Licht-Schimmer, um Natürlichkeit zu erzeugen
  • Midjourney hat Brot hinzugepackt, obwohl es so nicht im Prompt stand

Prompt 2: Mensch

👉
Prompt: A portrait of a 25-year-old woman with short, blonde hair and a jumpsuit, standing at a pier in a harbour, golden hour, soft color.

Hier sind die Ergebnisse im Vergleich von oben links nach unten rechts:

  • 1. Google Bard
  • 2. Dall-E 3
  • 3. Adobe Firefly 2
  • 4. Midjourney V6

Was auffällt:

  • Adobe Firefly bedient sich offenbar einer Vorlage aus der eigenen Stockfoto-Datenbank (generell ein Vorteil von Firefly, da es Lizenz-rechtlich sicher ist)
  • Alle haben die Stimmung verstanden, Midjourney überzeugt aber am besten
  • Dall-E 3 erzeugt erneut als einzige KI ein Bild, was unnatürlich aussieht

Prompt 3: Landschaft

👉
Prompt: A bird's eye view medium shot of a snowy Canadian woodland landscape, blanketed in fresh, pristine snow, the trees standing silent and majestic, under the clear blue sky of a crisp winter morning, shot with a DJI Mavic Air 2, wide angle, vibrant colors with cool blue and white tones

Hier sind die Ergebnisse im Vergleich von oben links nach unten rechts:

  • 1. Google Bard
  • 2. Dall-E 3
  • 3. Adobe Firefly 2
  • 4. Midjourney V6

Was auffällt:

  • Alle haben den Drone-Shot Style gut verstanden
  • Dall-E 3 sieht erneut unnatürlich aus
  • Firefly und Bard tun sich bei Details schwer

Mein Fazit zu Google Bard Gemini Pro

Die neue kostenlose Bilder-KI von Google überzeugt bereits zum Start! Die Bildqualität mag noch nicht überall mithalten können und vor allem noch hinter Midjourney V6 liegen - das Rennen ist aber knapp und noch lange nicht entschieden.

Einen großen Vorteil bei Google sehe ich im Fokus auf Ethik und Sicherheit. Da das Internet ja bekanntlich für Fake-News genutzt wird, sind die Funktionen von Gemini Pro ein Schritt in die richtige Richtung.

Wer KI Bilder auch kommerziell "sicher" und garantiert ohne Urheberrechtsverletzungen erstellen möchte, dem empfehle ich eher Adobe Firefly*.

Wenn du Hilfe bei der Erstellung von Prompts benötigst, nutze z. B. diesen Custom GPT von Ben Korbach.


Komm in unsere Community von Solopreneuren, um weitere Erkenntnisse über Tools und Techniken zu diskutieren, die dein Business nach vorne bringen.

>
<!--kg-card-end: html-->

    </div>

    <div class=