• Daily Pausenbrot
  • Posts
  • Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung

Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung

PLUS: OpenAI und Anthropic kooperieren mit US-Regierung bei KI-Tests

🥪 Heute in der Brotdose

GuMo! Hier ist dein Daily Pausenbrot. Heute sind die KI-News so erfrischend wie ein Sprung in einen kühlen See an einem heißen Sommertag.

Heute erwartet dich:

  • Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung

  • OpenAI und Anthropic kooperieren mit US-Regierung bei KI-Tests

  • Füge dich selbst zu Bildern mit einem benutzerdefinierten LoRA hinzu

  • KI-Startup erreicht 100 Millionen Token Kontext

Lesedauer: 3 Minuten

🍞 Neueste Entwicklungen

Alibaba
Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung

Kurzgefasst: Alibaba stellt Qwen2-VL vor, ein KI-Modell für Bild-Sprach-Verarbeitung, das GPT-4 in mehreren Benchmarks übertrifft.

Die Details: Qwen2-VL kann Bilder verschiedener Auflösungen und Videos bis zu 20 Minuten Länge verarbeiten. Es zeichnet sich besonders bei komplexen Aufgaben wie Problemlösung auf College-Niveau und Dokumentenanalyse aus. Das Modell unterstützt mehrsprachiges Textverständnis in Bildern für viele Sprachen, einschließlich europäischer Sprachen, Japanisch, Koreanisch, Arabisch und Vietnamesisch. Qwen2-VL ist auf Hugging Face zum Ausprobieren verfügbar.

Warum es wichtig ist: Qwen2-VL etabliert sich als starker Konkurrent im Bereich fortschrittlicher KI-Modelle, besonders aus China. Seine Fähigkeiten in der Verarbeitung verschiedener visueller Eingaben und mehrsprachiger Anfragen könnten zu fortschrittlicheren, global zugänglichen KI-Anwendungen führen.

OpenAI & Anthropic
OpenAI und Anthropic kooperieren mit US-Regierung bei KI-Tests

Kurzgefasst: OpenAI und Anthropic unterzeichnen Abkommen mit US-Behörde für KI-Sicherheitstests vor öffentlicher Veröffentlichung.

Die Details: Das U.S. Artificial Intelligence Safety Institute erhält Zugang zu neuen KI-Modellen von OpenAI und Anthropic vor und nach deren Veröffentlichung. Diese Zusammenarbeit zielt auf KI-Regulierung und Sicherheit ab, wobei die US-Regierung die Fähigkeiten und Risiken der Modelle bewertet. Das Institut wird den Unternehmen Feedback zu Sicherheitsverbesserungen geben. Die Vereinbarungen kommen zu einer Zeit verstärkter regulatorischer Kontrolle von KI-Unternehmen.

Warum es wichtig ist: Diese Kooperation könnte die globale Entwicklung, Prüfung und Implementierung von KI neu gestalten. Sie hat potenziell weitreichende Auswirkungen auf Innovation, Sicherheit und den internationalen Wettbewerb im KI-Bereich, sowohl positiv als auch negativ.

KI-Workflow
Füge dich selbst zu Bildern mit einem benutzerdefinierten LoRA hinzu

Kurzgefasst: Mit dem Flux LoRA-Trainingstool von Fal AI kannst du ein personalisiertes KI-Bildgenerierungsmodell erstellen, das dich in beliebigen Szenarien oder Stilen darstellt – basierend auf nur wenigen Selfies.

Die Details:

  • Besuche die Flux LoRA-Trainingsseite von Fal AI und erstelle ein Konto (benötigt etwa 10 $ an Credits).

  • Lade 6-12 hochwertige Bilder von dir mit klaren Hintergründen hoch.

  • Setze die Trainingsschritte auf 1000 und füge ein einzigartiges Triggerwort hinzu (z.B. "DeinName").

  • Starte den Trainingsprozess, der etwa 20 Minuten dauert.

  • Erstelle dann Bilder mit Eingaben wie „Porträt von [DeinName] als Superheld“ und experimentiere damit!

Magic
KI-Startup erreicht 100 Millionen Token Kontext

Kurzgefasst: Das Unternehmen Magic hat mit LTM-2-mini ein Modell entwickelt, das 100 Millionen Tokens verarbeiten kann. Dies entspricht etwa 10 Millionen Codezeilen oder 750 Romanen. Gleichzeitig arbeitet Magic mit Google Cloud zusammen, um fortschrittliche KI-Supercomputer zu bauen.

Die Details: LTM-2-mini kann während der Inferenz 100 Millionen Tokens verarbeiten und verstehen, was 50-mal mehr ist als bei aktuellen Modellen. Der innovative Algorithmus des Modells verarbeitet lange Datensequenzen 1000-mal effizienter als die derzeit leistungsstärksten KI-Modelle. Magic arbeitet außerdem mit Google Cloud zusammen, um Supercomputer zu bauen, die von Nvidias neuesten und fortschrittlichsten GPUs angetrieben werden. Das Unternehmen hat insgesamt über 450 Millionen US-Dollar an Finanzmitteln erhalten, darunter 320 Millionen US-Dollar in einer kürzlich abgeschlossenen Finanzierungsrunde.

Warum es wichtig ist: Dieser Durchbruch in der Kontextlänge ermöglicht es KI-Agenten, dichte und komplexe Codebasen, umfangreiche Datenbanken und jahrelange Gesprächsverläufe in einer einzigen Inferenz zu verarbeiten und zu verstehen. Dies ist ein bedeutender Schritt in Richtung der Entwicklung von KI-Assistenten mit nahezu perfektem Erinnerungsvermögen und Gedächtnis.

🔥 Beliebte KI-Tools

🧠 Bravo LEO AI: Der intelligente AI-Assistent, direkt in deinem Browser integriert. Erhalte Antworten, fasse Seiten zusammen und erstelle Inhalte mühelos.

🏋️ Zing Coach: Erreiche deine Fitnessziele mit personalisierten Workouts, professionellem Coaching und sofortigem Feedback.

🔊 Video to Sound Effects Generator: Erzeuge mühelos individuelle KI-Soundeffekte für deine Videos mit diesem leistungsstarken Tool.

📈 Casual: Verbinde dich mit Datenquellen, erstelle Modelle und teile Dashboards mühelos. Steigere deine Produktivität mit einem optimierten Finanzplanungsprozess durch integrierte Dashboards.

🔄 Relay.app: Relay.app ermöglicht es dir, Aufgaben mühelos zu automatisieren und bietet dabei den zusätzlichen Vorteil der AI-Integration.

🍬 News zum Naschen

Meta verzeichnet starkes Wachstum bei Llama KI-Modellen: Downloads nähern sich 350 Millionen, Nutzung seit Januar verzehnfacht.

Nous Research veröffentlicht Hermes Function Calling V1 Datensatz zum Training von KI-Modellen in Funktionsaufrufen und strukturierten Ausgaben.

Nvidia und Apple erwägen Beteiligung an OpenAIs Finanzierungsrunde mit Microsoft, potenzielle Bewertung über 100 Milliarden Dollar.

Playground startet KI-gesteuertes Grafikdesign-Tool für kostenlose Erstellung von Logos, Social-Media- und T-Shirt-Designs.

😋 Alles aufgegessen?