- Daily Pausenbrot
- Posts
- Google verwandelt Notizen in KI-generierte Podcast-Diskussionen
Google verwandelt Notizen in KI-generierte Podcast-Diskussionen
PLUS: Adobe präsentiert KI-Video-Modell Firefly mit revolutionären Funktionen
🥪 Heute in der Brotdose
GuMo! Hier ist dein Daily Pausenbrot. Unsere KI-News sind wie eine gute Netflix-Serie – du kannst nicht aufhören, weiterzuschauen.
Heute erwartet dich:
Google verwandelt Notizen in KI-generierte Podcast-Diskussionen
Adobe präsentiert KI-Video-Modell Firefly mit revolutionären Funktionen
Wie man KI-Kamera-Winkel in Videos steuert
Mistral veröffentlicht multimodales Modell Pixtral 12B
Lesedauer: 3 Minuten
🍞 Neueste Entwicklungen
Google Labs
Google verwandelt Notizen in KI-generierte Podcast-Diskussionen
Kurzgefasst: Google startet Audio Overviews in NotebookLM, das Dokumente in KI-generierte Audio-Diskussionen umwandelt.
Die Details: Audio Overviews nutzt KI, um aus hochgeladenen Quellen wie Notizen, PDFs und Google Docs vertiefte Gespräche zwischen zwei virtuellen Hosts zu erstellen. Das Tool verarbeitet verschiedene Quellentypen mit Gemini 1.5 und kann bis zu 50 Quellen mit jeweils 500.000 Wörtern verarbeiten. Nutzer können die Funktion über den Notebook-Leitfaden in NotebookLM aktivieren. Die KI-Hosts fassen Inhalte zusammen und verbinden Themen über verschiedene Materialien hinweg.
Warum es wichtig ist: Diese Funktion kann besonders für auditive Lerner bahnbrechend sein. Sie eignet sich hervorragend für die Verarbeitung wissenschaftlicher Arbeiten, E-Books, Lehrbücher und Präsentationen, indem sie komplexe Inhalte in leicht verdauliche Audio-Diskussionen umwandelt.
Adobe
Adobe präsentiert KI-Video-Modell Firefly mit revolutionären Funktionen
Kurzgefasst: Adobe zeigt Vorschau auf Firefly KI-Video-Modell mit Tools zum Erweitern und Erstellen von Videos.
Die Details: Adobe's neues Firefly KI-Video-Modell bietet drei Hauptfunktionen: Text-zu-Video, Bild-zu-Video und Generative Extend. Text-zu-Video erstellt Clips aus Textvorgaben mit Optionen für Kamerasteuerung. Bild-zu-Video verwandelt Standbilder in Live-Action-Clips. Generative Extend, in der Premiere Pro Beta verfügbar, kann Filmmaterial erweitern oder verlängern. Das Modell soll noch vor Jahresende veröffentlicht werden und verspricht, die Videobearbeitung zu revolutionieren.
Warum es wichtig ist: Adobe's Ansatz konzentriert sich auf die Verbesserung der Videobearbeitung selbst, im Gegensatz zu OpenAIs Fokus auf Videogenerierung. Dies ermöglicht Nutzern, Kamerawinkel zu ändern, Szenen zu verlängern und B-Roll-Material sofort mit KI zu generieren, was die Videoproduktion deutlich vereinfacht und beschleunigt.
KI-Workflow
Wie man KI-Kamera-Winkel in Videos steuert
Kurzgefasst: Luma Labs' neue „Camera Motion“-Funktion ermöglicht es dir, professionelle Kamerabewegungen in deine KI-generierten Videos einzufügen – ganz einfach über Textbefehle.
Anleitung:
Melde dich bei Luma Labs an und öffne die Hauptoberfläche.
Richte deine Szene ein, indem du ein Bild hochlädst oder es im Textfeld beschreibst.
Gib „Kamera“ in dein Prompt ein, um das „Camera Motion“-Dropdown-Menü freizuschalten.
Wähle aus Optionen wie Bewegen, Schwenken, Heranzoomen, Herauszoomen oder Orbit, um dynamische Bewegungen in deine Szene zu bringen.
Generiere dein Video und wiederhole den Vorgang, bis das Ergebnis perfekt ist.
Tipp: Füge Start- und End-Keyframes hinzu, um noch mehr Kontrolle über deine Kamerabewegungen zu haben.
Mistral
Mistral veröffentlicht multimodales Modell Pixtral 12B
Kurzgefasst: Das französische KI-Startup Mistral hat Pixtral 12B veröffentlicht, sein erstes multimodales Modell, das sowohl Bilder als auch Text verarbeiten kann. Es steht unter der Apache 2.0-Lizenz frei zum Download bereit.
Die Details: Pixtral 12B ist ein 12-Milliarden-Parameter-Modell mit einer Größe von etwa 24 GB, basierend auf Mistrals Textmodell Nemo 12B. Es ist das erste multimodale Modell des Unternehmens und kann sowohl Bilder als auch Text verarbeiten und Fragen dazu beantworten. Das Modell ist auf GitHub und Hugging Face verfügbar, mit freier Nutzung und der Möglichkeit zur Feinabstimmung. In Kürze wird Pixtral 12B auch auf den Plattformen von Mistral, Le Chat und Le Plateforme, verfügbar sein.
Warum es wichtig ist: Mistral entwickelt sich schnell zu Europas „Antwort“ auf OpenAI. Mit einem schlanken Team führender Forscher und einer kürzlich erfolgten Finanzierungsrunde über 645 Millionen Dollar drängt das Unternehmen aggressiv in die KI-Spitze mit leistungsstarken, offenen Modellen.
🔥 Beliebte KI-Tools
🤖 Retell: Eine API, die Entwicklern hilft, menschenähnliche Sprachagenten zu erstellen.
📝 Heyday: Ein KI-Copilot, der deine Dokumente, Notizen und Gespräche in Zitate, teilbare Inhalte und eine durchsuchbare Datenbank umwandelt.
🔴 Symbl: Eine Plattform, die dir hilft, Live-Anrufe zu streamen, Konversationsanalysen durchzuführen (Fragen, Themen, Stimmung) und kontextbezogene Antworten zu generieren.
🔖 Recast: Verwandele deine Leseliste mit KI in leicht verdauliche Audiozusammenfassungen.*
📈 Glida: Steigere dein Web-Engagement mit einem KI-Vertriebsassistenten.
* Kennzeichnet ein beworbenes Tool, falls vorhanden.
🍬 News zum Naschen
Meta baut KI-Supercomputer mit 100.000+ Nvidia H100-Chips für Llama 4-Training.
Kanada plant KI-Integration ins Militär bis 2030 zur Unterstützung, nicht Ersetzung von Personal.
Oracle enthüllt 50+ KI-Agenten für Geschäftsprozessautomatisierung in verschiedenen Bereichen.
Berichten zufolge befindet sich OpenAI in Gesprächen, um 6,5 Milliarden US-Dollar (zusätzlich zu einer weiteren Kreditlinie von 5 Milliarden US-Dollar mit Banken) bei einer Bewertung von 150 Milliarden US-Dollar zu beschaffen, was deutlich höher ist als die vorherige Bewertung von 86 Milliarden US-Dollar.