- Daily Pausenbrot
- Posts
- Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung
Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung
PLUS: OpenAI und Anthropic kooperieren mit US-Regierung bei KI-Tests
🥪 Heute in der Brotdose
GuMo! Hier ist dein Daily Pausenbrot. Heute sind die KI-News so erfrischend wie ein Sprung in einen kühlen See an einem heißen Sommertag.
Heute erwartet dich:
Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung
OpenAI und Anthropic kooperieren mit US-Regierung bei KI-Tests
Füge dich selbst zu Bildern mit einem benutzerdefinierten LoRA hinzu
KI-Startup erreicht 100 Millionen Token Kontext
Lesedauer: 3 Minuten
🍞 Neueste Entwicklungen
Alibaba
Chinas Qwen2-VL übertrifft GPT-4 in Bild-Sprach-Verarbeitung
Kurzgefasst: Alibaba stellt Qwen2-VL vor, ein KI-Modell für Bild-Sprach-Verarbeitung, das GPT-4 in mehreren Benchmarks übertrifft.
Die Details: Qwen2-VL kann Bilder verschiedener Auflösungen und Videos bis zu 20 Minuten Länge verarbeiten. Es zeichnet sich besonders bei komplexen Aufgaben wie Problemlösung auf College-Niveau und Dokumentenanalyse aus. Das Modell unterstützt mehrsprachiges Textverständnis in Bildern für viele Sprachen, einschließlich europäischer Sprachen, Japanisch, Koreanisch, Arabisch und Vietnamesisch. Qwen2-VL ist auf Hugging Face zum Ausprobieren verfügbar.
Warum es wichtig ist: Qwen2-VL etabliert sich als starker Konkurrent im Bereich fortschrittlicher KI-Modelle, besonders aus China. Seine Fähigkeiten in der Verarbeitung verschiedener visueller Eingaben und mehrsprachiger Anfragen könnten zu fortschrittlicheren, global zugänglichen KI-Anwendungen führen.
OpenAI & Anthropic
OpenAI und Anthropic kooperieren mit US-Regierung bei KI-Tests
Kurzgefasst: OpenAI und Anthropic unterzeichnen Abkommen mit US-Behörde für KI-Sicherheitstests vor öffentlicher Veröffentlichung.
Die Details: Das U.S. Artificial Intelligence Safety Institute erhält Zugang zu neuen KI-Modellen von OpenAI und Anthropic vor und nach deren Veröffentlichung. Diese Zusammenarbeit zielt auf KI-Regulierung und Sicherheit ab, wobei die US-Regierung die Fähigkeiten und Risiken der Modelle bewertet. Das Institut wird den Unternehmen Feedback zu Sicherheitsverbesserungen geben. Die Vereinbarungen kommen zu einer Zeit verstärkter regulatorischer Kontrolle von KI-Unternehmen.
Warum es wichtig ist: Diese Kooperation könnte die globale Entwicklung, Prüfung und Implementierung von KI neu gestalten. Sie hat potenziell weitreichende Auswirkungen auf Innovation, Sicherheit und den internationalen Wettbewerb im KI-Bereich, sowohl positiv als auch negativ.
KI-Workflow
Füge dich selbst zu Bildern mit einem benutzerdefinierten LoRA hinzu
Kurzgefasst: Mit dem Flux LoRA-Trainingstool von Fal AI kannst du ein personalisiertes KI-Bildgenerierungsmodell erstellen, das dich in beliebigen Szenarien oder Stilen darstellt – basierend auf nur wenigen Selfies.
Die Details:
Besuche die Flux LoRA-Trainingsseite von Fal AI und erstelle ein Konto (benötigt etwa 10 $ an Credits).
Lade 6-12 hochwertige Bilder von dir mit klaren Hintergründen hoch.
Setze die Trainingsschritte auf 1000 und füge ein einzigartiges Triggerwort hinzu (z.B. "DeinName").
Starte den Trainingsprozess, der etwa 20 Minuten dauert.
Erstelle dann Bilder mit Eingaben wie „Porträt von [DeinName] als Superheld“ und experimentiere damit!
Magic
KI-Startup erreicht 100 Millionen Token Kontext
Kurzgefasst: Das Unternehmen Magic hat mit LTM-2-mini ein Modell entwickelt, das 100 Millionen Tokens verarbeiten kann. Dies entspricht etwa 10 Millionen Codezeilen oder 750 Romanen. Gleichzeitig arbeitet Magic mit Google Cloud zusammen, um fortschrittliche KI-Supercomputer zu bauen.
Die Details: LTM-2-mini kann während der Inferenz 100 Millionen Tokens verarbeiten und verstehen, was 50-mal mehr ist als bei aktuellen Modellen. Der innovative Algorithmus des Modells verarbeitet lange Datensequenzen 1000-mal effizienter als die derzeit leistungsstärksten KI-Modelle. Magic arbeitet außerdem mit Google Cloud zusammen, um Supercomputer zu bauen, die von Nvidias neuesten und fortschrittlichsten GPUs angetrieben werden. Das Unternehmen hat insgesamt über 450 Millionen US-Dollar an Finanzmitteln erhalten, darunter 320 Millionen US-Dollar in einer kürzlich abgeschlossenen Finanzierungsrunde.
Warum es wichtig ist: Dieser Durchbruch in der Kontextlänge ermöglicht es KI-Agenten, dichte und komplexe Codebasen, umfangreiche Datenbanken und jahrelange Gesprächsverläufe in einer einzigen Inferenz zu verarbeiten und zu verstehen. Dies ist ein bedeutender Schritt in Richtung der Entwicklung von KI-Assistenten mit nahezu perfektem Erinnerungsvermögen und Gedächtnis.
🔥 Beliebte KI-Tools
🧠 Bravo LEO AI: Der intelligente AI-Assistent, direkt in deinem Browser integriert. Erhalte Antworten, fasse Seiten zusammen und erstelle Inhalte mühelos.
🏋️ Zing Coach: Erreiche deine Fitnessziele mit personalisierten Workouts, professionellem Coaching und sofortigem Feedback.
🔊 Video to Sound Effects Generator: Erzeuge mühelos individuelle KI-Soundeffekte für deine Videos mit diesem leistungsstarken Tool.
📈 Casual: Verbinde dich mit Datenquellen, erstelle Modelle und teile Dashboards mühelos. Steigere deine Produktivität mit einem optimierten Finanzplanungsprozess durch integrierte Dashboards.
🔄 Relay.app: Relay.app ermöglicht es dir, Aufgaben mühelos zu automatisieren und bietet dabei den zusätzlichen Vorteil der AI-Integration.
🍬 News zum Naschen
Meta verzeichnet starkes Wachstum bei Llama KI-Modellen: Downloads nähern sich 350 Millionen, Nutzung seit Januar verzehnfacht.
Nous Research veröffentlicht Hermes Function Calling V1 Datensatz zum Training von KI-Modellen in Funktionsaufrufen und strukturierten Ausgaben.
Nvidia und Apple erwägen Beteiligung an OpenAIs Finanzierungsrunde mit Microsoft, potenzielle Bewertung über 100 Milliarden Dollar.
Playground startet KI-gesteuertes Grafikdesign-Tool für kostenlose Erstellung von Logos, Social-Media- und T-Shirt-Designs.