- Daily Pausenbrot
- Posts
- KI-Roboter Figure 02 arbeitet autonom in BMW-Fabrik
KI-Roboter Figure 02 arbeitet autonom in BMW-Fabrik
PLUS: ByteDance startet Jimeng AI als Konkurrenz zu OpenAI Sora
🥪 Heute in der Brotdose
GuMo! Hier ist dein Daily Pausenbrot. Stell dir vor, die KI-Updates sind wie eine Schatzkarte – folge uns, und entdecke die verborgenen Juwelen.
Heute erwartet dich:
KI-Roboter Figure 02 arbeitet autonom in BMW-Fabrik
ByteDance startet Jimeng AI als Konkurrenz zu OpenAI Sora
Visualisiere deinen Chat-Verlauf mit Claude
Neue KI kann gleichzeitig zuhören und sprechen
Lesedauer: 3 Minuten
🍞 Neueste Entwicklungen
Figure AI
KI-Roboter Figure 02 arbeitet autonom in BMW-Fabrik
Kurzgefasst: Figure AI stellt KI-gesteuerten humanoiden Roboter Figure 02 vor, der in komplexen Umgebungen wie BMW-Fabriken autonom arbeiten kann.
Die Details: Figure 02 nutzt OpenAIs KI-Modelle für Speech-to-Speech-Reasoning und kann vollständige Gespräche führen. Ein Vision Language Model ermöglicht schnelle, logische Entscheidungen basierend auf visuellen Eingaben. Sechs RGB-Kameras geben dem 1,68 m großen, 60 kg schweren Roboter ein 360-Grad-Sichtfeld. Mit einer Hebekapazität von 20 kg und einer Laufzeit von 20 Stunden dank eines 2,25 kWh Akkupacks ist Figure 02 für den Einsatz in Industrieumgebungen optimiert.
Warum es wichtig ist: Der Wettlauf um humanoide Roboter intensiviert sich. Figure CEO Brett Adcock bezeichnet Figure 02 als "fortschrittlichsten humanoiden Roboter auf dem Planeten", was eine direkte Herausforderung an Tesla Optimus darstellt. Die Partnerschaft mit OpenAI verleiht Figure einen potenziellen Wettbewerbsvorteil in diesem zukunftsweisenden Markt.
ByteDance
ByteDance startet Jimeng AI als Konkurrenz zu OpenAI Sora
Kurzgefasst: TikTok-Entwickler ByteDance führt Jimeng AI ein, eine Text-zu-Video-KI-App für chinesische Nutzer, die mit OpenAIs Sora konkurriert.
Die Details: Jimeng AI ist im Apple App Store und für Android in China verfügbar. Das Abonnement kostet 79 Yuan (11 $) monatlich oder 659 Yuan (92 $) jährlich und ermöglicht die Erstellung von etwa 2.050 Bildern oder 168 KI-Videos pro Monat. Im Gegensatz zu OpenAIs noch nicht veröffentlichtem Sora ist Jimeng AI bereits für Nutzer in China zugänglich. ByteDances Eintritt in den Markt folgt ähnlichen Starts anderer chinesischer Technologieunternehmen wie Kuaishous Kling AI.
Warum es wichtig ist: Der Wettbewerb in der KI-Videogenerierung in China beschleunigt sich, während die Welt auf Soras öffentliche Veröffentlichung wartet. Mit der Unterstützung durch TikTok verfügt Jimeng AI über umfangreiche Trainingsdaten und finanzielle Ressourcen, um mit globalen KI-Giganten zu konkurrieren.
KI-Workflow
Visualisiere deinen Chat-Verlauf mit Claude
Kurzgefasst: Die neue Artifacts-Funktion von Claude ermöglicht es dir, visuelle Zeitachsen von Gesprächen zu erstellen, sodass du komplexe Projekte zusammenfassen und verfolgen kannst, wenn Gespräche zu lang werden.
Anleitung:
Besuche Claude AI und erstelle ein Konto, falls du noch keins hast.
Führe ein detailliertes Gespräch mit Claude über dein Projekt oder Thema.
Wenn du bereit bist, gib Claude den folgenden Befehl: "Erstelle eine Mermaid-Zeitachsenübersicht dieses Chats. Gib mindestens drei Sätze zur Erklärung jedes wichtigen Diskussionspunkts an. Überspringe Fehler und beginne beim ersten Chat, wobei du dich auf die wichtigsten Teile konzentrierst. Füge den Chat-Inhalt, die ergriffenen Maßnahmen und den Zweck jedes Abschnitts ein. Stelle sicher, dass dies visuell in der Code-Vorschau angezeigt wird."
Überprüfe deine erstellte Zeitachse und nutze sie, um den Fortschritt deines Projekts zusammenzufassen, zu teilen oder zu analysieren!
KI-Forschung
Neue KI kann gleichzeitig zuhören und sprechen
Kurzgefasst: KI-Forscher haben ein neues Sprachmodell entwickelt, das simultan zuhören und sprechen kann – ein großer Fortschritt für interaktive, sprachbasierte Echtzeit-KI-Gespräche.
Die Details: Das neue Modell, genannt Listening-While-Speaking Language Model (LSLM), ermöglicht Full-Duplex-Modellierung in interaktiven Sprachmodellen. LSLM verwendet einen tokenbasierten, nur-Decoder-TTS für die Spracherzeugung und einen Streaming-Self-Supervised-Learning-Encoder für Echtzeit-Audioeingaben. Das System kann in Echtzeit das Gesprächsverhalten erkennen und auf Unterbrechungen reagieren, eine entscheidende Eigenschaft natürlicher Gespräche. In Experimenten zeigte das Modell Robustheit gegenüber Lärm und Sensibilität für unterschiedliche Anweisungen.
Warum es wichtig ist: Während OpenAIs jüngster fortschrittlicher Sprachmodus für ChatGPT uns realistischen KI-Gesprächen näher bringt, geht LSLM noch einen Schritt weiter, indem es der KI ermöglicht, eingehende Sprache während des Sprechens zu verarbeiten. Dies könnte die Interaktionen zwischen Mensch und KI revolutionieren und Gespräche mit Maschinen wirklich natürlich und reaktionsschnell machen.
🔥 Beliebte KI-Tools
🧠 Saga: Saga AI ist ein kreativer Assistent, der dir mühelos dabei hilft, Inhalte zu verfassen, Ideen zu brainstormen, Grammatikfehler zu korrigieren und in über 20 Sprachen zu übersetzen.
🧑🏻💻 DryMerge: Beschreibe deinen Arbeitsablauf in einfachem Englisch und lasse DryMerge es in Sekundenschnelle automatisieren.
🕺🏻 RenderNet: Erstelle KI-Charaktere mit vollständiger Kontrolle und Konsistenz.
🎯 Mentor: Entfessele dein volles Potenzial mit intelligentem, KI-gesteuertem Zielmanagement.
💻 Jack AI: Jacks KI-gesteuerte Marketing-Tools helfen dir, hochwertige Marketinginhalte zu schreiben und zu bearbeiten.
* Kennzeichnet ein beworbenes Tool, falls vorhanden.
🍬 News zum Naschen
OpenAI führt Structured Outputs für API ein: Entwickler können KI-Ausgaben an JSON-Schemata anpassen.
Japanische Wissenschaftler entwickeln vereinfachtes EUV-Lithografie-Tool für günstigere Chip-Produktion.
Sonova führt Sphere Infinio ein: Erstes Hörgerät mit Echtzeit-KI zur Verbesserung der Sprachklarheit.
Reddit testet KI-generierte Zusammenfassungen für Suchergebnisse zur Verbesserung der Content-Entdeckung.