Googles Gemini-Updates und Sora-Konkurrent

PLUS: Googles KI-Agenten und KI-Such-Updates

GuMo! Hier ist dein Daily Pausenbrot. Wir lesen alles im Internet, damit du es nicht tun musst.

Heute in der Brotdose 🥪

  • Googles Gemini-Updates und Sora-Konkurrent

  • Googles KI-Agenten und KI-Such-Updates

  • Nutze die Hervorhebungsfunktion von ChatGPT für Kontext

Lesedauer: 3 Minuten

NEUESTE ENTWICKLUNGEN

Google
Googles Gemini-Updates und Sora-Konkurrent

Google hat gerade seine I/O Entwicklerkonferenz gestartet und eine Vielzahl von Updates für sein KI-Ökosystem angekündigt – darunter Verbesserungen der Flaggschiff-Gemini-Modellfamilie und ein neues Videogenerierungsmodell, das OpenAIs Sora Konkurrenz machen soll.

Gemini-Modell-Updates:

  • Die neuen Updates für 1.5 Pro umfassen eine massive Erweiterung des Kontextfensters auf 2 Millionen Tokens und eine verbesserte Leistung in den Bereichen Code, Logik und Bildverständnis.

  • Gemini 1.5 Pro kann den langen Kontext auch nutzen, um eine Vielzahl von Medientypen zu analysieren, darunter Dokumente, Videos, Audio und Codebasen.

  • Google kündigte Gemini 1.5 Flash an, ein neues Modell, das auf Geschwindigkeit und Effizienz optimiert ist und ein Kontextfenster von 1 Million Tokens hat.

  • Gemma 2, die nächste Generation von Googles Open-Source-Modellen, wird in den kommenden Wochen zusammen mit einem neuen Vision-Language-Modell namens PaliGemma auf den Markt kommen.

  • Abonnenten von Gemini Advanced können bald benutzerdefinierte Personas namens ‚Gems‘ aus einer einfachen Textbeschreibung erstellen, ähnlich wie ChatGPT GPTs.

Updates für Video- und Bildmodelle:

  • Google hat ein neues Videomodell namens Veo vorgestellt, das in der Lage ist, über 60-sekündige Videos in 1080p-Auflösung aus Text-, Bild- und Videovorlagen zu generieren.

  • Das neue Imagen 3 Text-zu-Bild-Modell wurde ebenfalls enthüllt, mit besserer Detailtreue, Textgenerierung und natürlichem Sprachverständnis als sein Vorgänger.

  • Das VideoFX Text-zu-Video-Tool bietet eine szenenweise Erstellung von Storyboards und die Möglichkeit, Musik zu den generierten Videos hinzuzufügen.

  • VideoFX wird in einer „privaten Vorschau“ in den USA für ausgewählte Creator gestartet, während ImageFX (mit Imagen 3) über eine Warteliste verfügbar ist.

Das bereits branchenführende Kontextfenster von Gemini wird um das Doppelte erweitert, was endlose neue Möglichkeiten bietet, KI mit einer enormen Menge an Informationen zu nutzen. Darüber hinaus hat Sora offiziell Konkurrenz mit dem beeindruckenden Veo-Demo – aber welches wird zuerst für die Öffentlichkeit zugänglich sein?

Googles Ankündigungen waren zu umfangreich für einen einzigen Abschnitt – scrolle weiter für mehr Updates von der I/O.

Anmelden und weiterlesen

Dieser Beitrag ist kostenlos, aber du musst dich bei Daily Pausenbrot anmelden, um weiterlesen zu können

I consent to receive newsletters via email. Terms of Use and Privacy Policy.

Already a subscriber?Sign In.Not now