Apples Depth Pro erstellt 3D-Daten aus Bildern

Apple hat ein neues KI-Modell namens Depth Pro entwickelt, das die 3D-Wahrnehmung von Maschinen revolutionieren könnte. Das berichtet Michael Nuñez für VentureBeat. Depth Pro kann aus einzelnen 2D-Bildern in Sekundenbruchteilen detaillierte 3D-Tiefenkarten erstellen, ohne auf herkömmliche Kameradaten angewiesen zu sein. Das System übertrifft bisherige Modelle in Geschwindigkeit und Genauigkeit. Es kann sowohl relative als auch …

Weiterlesen …

Black Forest Labs veröffentlicht Flux 1.1 Pro

Black Forest Labs hat ein neues, schnelleres Text-zu-Bild-Modell namens Flux 1.1 Pro veröffentlicht. Das berichtet Carl Franzen bei VentureBeat. Das Modell übertrifft laut einem unabhängigen Benchmark andere KI-Bildgeneratoren in Bezug auf visuelle Qualität und Geschwindigkeit. Es erzeugt Bilder sechsmal schneller als sein Vorgänger, bei verbesserter Bildqualität und Genauigkeit. Flux 1.1 Pro ist nicht direkt über …

Weiterlesen …

DeepMinds SCoRE soll KI-Modelle verlässlicher machen

DeepMind hat eine neue Technik namens SCoRe entwickelt, die die Selbstkorrektur-Fähigkeiten von großen Sprachmodellen (LLMs) deutlich verbessert. Das berichtet Ben Dickson in einem Artikel für VentureBeat. SCoRe nutzt dabei selbst generierte Daten und ermöglicht es LLMs, ihr internes Wissen zu nutzen, um Fehler zu erkennen und zu korrigieren. In Tests übertraf SCoRe andere Selbstkorrektur-Methoden deutlich. …

Weiterlesen …

Nvidia überrascht mit leistungsstarken, offenen KI-Modellen

Nvidia hat ein leistungsstarkes Open-Source-KI-Modell veröffentlicht, das augenscheinlich mit proprietären Systemen führender Unternehmen wie OpenAI und Google konkurrieren kann. Das als NVLM 1.0 bezeichnete Modell zeigt herausragende Leistungen bei Bild- und Sprachaufgaben und verbessert zudem die reinen Textfähigkeiten. Michael Nuñez berichtet darüber für VentureBeat. Das Hauptmodell NVLM-D-72B mit 72 Milliarden Parametern kann komplexe visuelle und …

Weiterlesen …

Mostly AI hilft Unternehmen mit KI-Training ohne Datenschutzbedenken

Mostly AI hat eine neue Funktion zur Erzeugung synthetischer Texte vorgestellt. Das Tool ermöglicht es Unternehmen, vertrauliche Daten wie E-Mails und Gespräche für KI-Training zu nutzen – ohne Datenschutzbedenken. Wie Shubham Sharma berichtet, generiert die Plattform dazu eine Version der firmeneigenen Informationen, die frei von persönlich identifizierbaren Daten ist. Unternehmen können damit zuverlässige KI-Modelle trainieren …

Weiterlesen …

OpenAIs DevDay fokussiert sich auf Optimierungen

OpenAI hat auf seiner Entwicklerkonferenz DevDay 2024 mehrere neue Funktionen vorgestellt, die KI-Anwendungen zugänglicher und erschwinglicher machen sollen. Im Mittelpunkt stehen die Realtime API für Echtzeit-Sprachanwendungen, Vision Fine-Tuning zur Verbesserung visueller KI-Fähigkeiten, Model Distillation zur Optimierung kleinerer Modelle und Prompt Caching für Kosteneinsparungen. Diese Neuerungen zielen darauf ab, Entwicklern leistungsfähigere und kostengünstigere Werkzeuge an die …

Weiterlesen …

Together AI zeigt neue Plattform für private KI

Die Firma Together AI hat eine neue Plattform für KI-Anwendungen in privaten Cloud-Umgebungen vorgestellt. Das System verspricht schnellere Inferenz und niedrigere Kosten für Unternehmen. Wie CEO Vipul Prakash gegenüber VentureBeat erklärte, kann die Plattform die Leistung von KI-Inferenz um das Zwei- bis Dreifache steigern und den Hardwarebedarf halbieren. Ein Schlüsselmerkmal ist demnach die flexible Orchestrierung …

Weiterlesen …

Molmo soll KI-Agenten verbessern

Ein neues Open-Source-KI-Modell namens Molmo könnte die Entwicklung von KI-Agenten vorantreiben. Das vom Allen Institute for AI (Ai2) entwickelte Modell kann Bilder interpretieren und über eine Chat-Schnittstelle kommunizieren. Laut Will Knight von Wired ermöglicht dies KI-Agenten, Aufgaben wie Websurfen oder Dokumentenerstellung auszuführen. In einigen Benchmarks übertrifft es führende proprietäre Modelle wie GPT-4o von OpenAI, Claude …

Weiterlesen …

Scramble will eine Grammarly-Alternative werden

Das KI-Tool Scramble integriert sich als Extension im Chrome-Browser. Nach der Installation markiert man den fraglichen Text, wählt im Kontextmenü „Scramble“ aus und bekommt Vorschläge für Verbesserungen. Laut der offiziellen GitHub-Seite des Projekts will es eine flexiblere und die Privatsphäre schützende Alternative zu Grammarly sein. Vor allem das Argument der Privatsphäre greift zum jetzigen Stand …

Weiterlesen …

EzAudio erzeugt hochwertige Soundeffekte

Forscher der Johns Hopkins University und des Tencent AI Lab haben ein neues Text-zu-Audio-Modell namens EzAudio entwickelt. Wie Michael Nuñez in VentureBeat berichtet, kann EzAudio hochwertige Soundeffekte aus Textbeschreibungen erzeugen. Das Modell nutzt eine innovative Methode zur Verarbeitung von Audiodaten und eine neue Architektur namens EzAudio-DiT. In Tests übertraf EzAudio bestehende Open-Source-Modelle in Qualität und …

Weiterlesen …

×