Meta veröffentlicht Llama 3

PLUS: Microsoft's VASA-1 erweckt Bilder zum Leben

GuMo! Hier ist dein Daily Pausenbrot. Die neuesten KI-News, die am besten mit einer Tasse Kaffee genossen werden kann.

Heute in der Brotdose 🥪

  • Meta veröffentlicht Llama 3

  • Microsoft’s VASA-1 erweckt Bilder zum Leben

  • Personalisiere die neueste GPT-4 Turbo Version

  • GPT-4 nähert sich fachärztlichen Analysen

Lesedauer: 3 Minuten

NEUESTE ENTWICKLUNGEN

Meta
Meta veröffentlicht Llama 3

Meta hat die nächste Generation seines Open-Source-LLM vorgestellt: Llama 3. Das Modell ist in zwei Versionen mit 8 Milliarden bzw. 70 Milliarden Parametern erhältlich und übertrifft ähnliche Open-Source-Modelle bei verschiedenen Evaluierungsbenchmarks.

Metas Tests zeigen, dass Llama 3 8B und 70B besser abschneiden als vergleichbare Modelle wie Googles Gemma und Mistral 7B sowie Anthropics Claude 3 Sonnet.

Die Modelle wurden mit einem riesigen Dataset trainiert, das siebenmal größer ist als das seines Vorgängers Llama 2 und 15 Billionen Token sowie viermal mehr Code enthält. Die größte Version mit über 400 Milliarden Parametern soll in den kommenden Monaten veröffentlicht werden und wird voraussichtlich mit OpenAIs GPT-4 konkurrieren.

Llama 3 ist in verschiedene Meta-Plattformen integriert, darunter Facebook, Instagram, WhatsApp und Messenger, und ist über einen neuen Meta AI-Assistenten zugänglich. Mit beeindruckenden Benchmarks und einem riesigen Modell, das bald veröffentlicht werden soll, setzt Meta seinen Plan um, KI-gesteuerte Funktionen nahtlos in seine Produkte zu integrieren und so Milliarden von Menschen Zugang zu KI-Funktionen zu bieten.

Microsoft
Microsoft’s VASA-1 erweckt Bilder zum Leben

Microsoft hat sein neuestes KI-Modell namens VASA-1 vorgestellt, das beeindruckende, lebensechte Videos von sprechenden Köpfen auf der Grundlage eines einzigen Standbilds und einer Audiodatei generieren kann.

VASA-1 benötigt nur ein Foto und eine Sprachaufnahme, um ein realistisches Video der sprechenden Person zu erstellen, wobei Mundbewegungen und emotionale Animationen synchronisiert werden. Das Modell kann nuancierte Ausdrücke, natürliche Kopfbewegungen und sogar realistische Gesangsaufführungen darstellen, was über einfaches Lippen-Synchronisieren hinausgeht.

Benutzer können mit Schiebereglern Aspekte des generierten Videos anpassen, wie z. B. Blickrichtung, Kopfabstand und emotionale Tonalität. VASA-1 stellt einen großen Fortschritt in der KI-Generierung dar und hat potenzielle Anwendungen in Bereichen wie virtuellen Avataren, Gaming und Computeranimation. .

KI-Workflow
Personalisiere die neueste GPT-4 Turbo Version

In diesem Tutorial lernst du, wie du auf die neueste Version von GPT-4 Turbo, ein deutlich verbessertes Modell, zugreifen und deine Erfahrungen personalisieren kannst.

Anleitung:

  • Geh zu OpenAIs Playground und log dich ein. Du brauchst ein ChatGPT Plus-Abo.

  • Klick links auf "Chat".

  • Klick auf das Dropdown-Menü "Modelle", drücke dann auf "Weitere Modelle anzeigen" und wähle "gpt-4-turbo-2024-04-09".

  • Gib einen Prompt ein, wo "Benutzer" steht, und experimentiere mit den verschiedenen Parametern wie Systemeingabe, Temperatur oder maximale Länge, um deine Ausgaben zu personalisieren.

KI-Forschung
GPT-4 nähert sich fachärztlichen Analysen

Eine aktuelle Studie der Universität Cambridge hat ergeben, dass das GPT-4-Modell von OpenAI bei der Analyse von Augenbeschwerden und der Vorschläge von Behandlungen fast auf dem Niveau von Fachärzten arbeitet.

In der Studie wurden GPT-4, GPT-3.5, PaLM 2, LLaMA und Fachärzte sowie Assistenzärzte in der Ausbildung anhand von 87 Multiple-Choice-Fragen getestet.

GPT-4 erreichte mit 60 von 87 Punkten ein höheres Ergebnis als der Durchschnitt der Assistenzärzte (59,7) und Jungärzte (37), lag aber leicht unter dem Durchschnitt der Fachärzte von 66,4. Obwohl die Studie erst kürzlich veröffentlicht wurde, fanden die Tests bereits Mitte 2023 statt, was darauf hindeutet, dass die heutigen LLM-Fähigkeiten die in der Studie verwendeten Modelle wahrscheinlich bereits übertreffen.

Diese Ergebnisse unterstreichen das Potenzial von LLM im Gesundheitswesen, insbesondere in Gebieten mit begrenztem Zugang zu Spezialisten, und deuten darauf hin, dass die medizinische Versorgung durch weitere Fortschritte in diesem Bereich noch zugänglicher werden könnte.

BELIEBTE KI-TOOLS

Guidde: Guidde ist die generative KI-Plattform für Unternehmen, die dem Team hilft, Video-Dokumentationen 11-mal schneller zu erstellen.*

Synthflow: Erstelle problemlos KI-Sprachassistenten, um ausgehende Anrufe zu tätigen, eingehende Anrufe zu beantworten und Termine rund um die Uhr zu planen - ohne Programmierung erforderlich!

Exemplary AI: Erstelle im Handumdrehen kurze Clips, Audiogramme, Zusammenfassungen, Inhalte, Transkripte, Untertitel und mehr.*

reclaimai: Die intelligenteste Kalender-App, die die Zeit aller optimiert für eine bessere Produktivität, Zusammenarbeit und Work-Life-Balance.

Eightify: Extrahiere wichtige Erkenntnisse aus YouTube-Videos

* Kennzeichnet ein beworbenes Tool, falls vorhanden.

PAUSENSNACKS

Mentee Robotics hat den humanoiden Roboter "Menteebot" vorgestellt, der in der Lage ist, komplexe Aufgaben auszuführen und über natürliche Sprachbefehle zu lernen.

Google kündigte eine Umstrukturierung zur Verbesserung der KI-Produktentwicklung an und bildete ein neues Team für "Plattform und Geräte", indem es seine Research- und DeepMind-Teams zusammenführte.

Nothing Earbuds brachte zwei neue Kopfhörermodelle auf den Markt und führte die ChatGPT-Integration ein, die es Benutzern ermöglicht, über eine einfache Geste mit der KI zu interagieren.

Pausenquiz

Real oder KI? 🔍

ALLES AUFGEGESSEN?

Wenn du spezifisches Feedback oder etwas Interessantes zu teilen hast, lass es uns gerne wissen, indem du einfach auf diese E-Mail antwortest.