OpenAIs DevDay fokussiert sich auf Optimierungen

OpenAI hat auf seiner Entwicklerkonferenz DevDay 2024 mehrere neue Funktionen vorgestellt, die KI-Anwendungen zugänglicher und erschwinglicher machen sollen. Im Mittelpunkt stehen die Realtime API für Echtzeit-Sprachanwendungen, Vision Fine-Tuning zur Verbesserung visueller KI-Fähigkeiten, Model Distillation zur Optimierung kleinerer Modelle und Prompt Caching für Kosteneinsparungen. Diese Neuerungen zielen darauf ab, Entwicklern leistungsfähigere und kostengünstigere Werkzeuge an die …

Weiterlesen …

Together AI zeigt neue Plattform für private KI

Die Firma Together AI hat eine neue Plattform für KI-Anwendungen in privaten Cloud-Umgebungen vorgestellt. Das System verspricht schnellere Inferenz und niedrigere Kosten für Unternehmen. Wie CEO Vipul Prakash gegenüber VentureBeat erklärte, kann die Plattform die Leistung von KI-Inferenz um das Zwei- bis Dreifache steigern und den Hardwarebedarf halbieren. Ein Schlüsselmerkmal ist demnach die flexible Orchestrierung …

Weiterlesen …

Molmo soll KI-Agenten verbessern

Ein neues Open-Source-KI-Modell namens Molmo könnte die Entwicklung von KI-Agenten vorantreiben. Das vom Allen Institute for AI (Ai2) entwickelte Modell kann Bilder interpretieren und über eine Chat-Schnittstelle kommunizieren. Laut Will Knight von Wired ermöglicht dies KI-Agenten, Aufgaben wie Websurfen oder Dokumentenerstellung auszuführen. In einigen Benchmarks übertrifft es führende proprietäre Modelle wie GPT-4o von OpenAI, Claude …

Weiterlesen …

Scramble will eine Grammarly-Alternative werden

Das KI-Tool Scramble integriert sich als Extension im Chrome-Browser. Nach der Installation markiert man den fraglichen Text, wählt im Kontextmenü „Scramble“ aus und bekommt Vorschläge für Verbesserungen. Laut der offiziellen GitHub-Seite des Projekts will es eine flexiblere und die Privatsphäre schützende Alternative zu Grammarly sein. Vor allem das Argument der Privatsphäre greift zum jetzigen Stand …

Weiterlesen …

EzAudio erzeugt hochwertige Soundeffekte

Forscher der Johns Hopkins University und des Tencent AI Lab haben ein neues Text-zu-Audio-Modell namens EzAudio entwickelt. Wie Michael Nuñez in VentureBeat berichtet, kann EzAudio hochwertige Soundeffekte aus Textbeschreibungen erzeugen. Das Modell nutzt eine innovative Methode zur Verarbeitung von Audiodaten und eine neue Architektur namens EzAudio-DiT. In Tests übertraf EzAudio bestehende Open-Source-Modelle in Qualität und …

Weiterlesen …

Model Routing soll KI-Systeme effizienter machen

Unternehmen setzen zunehmend auf Model Routing, um die Effizienz ihrer KI-Systeme zu steigern. Wie Sean Michael Kerner für VentureBeat berichtet, ermöglicht diese Technologie die dynamische Auswahl des am besten geeigneten KI-Modells für jede Anfrage. Das Start-up Martian hat einen Large Language Model (LLM) Router entwickelt, der das Interesse großer Technologieunternehmen weckt. Accenture hat kürzlich in …

Weiterlesen …

Auch Luma nun mit API für Video-KI

Luma AI hat eine API für sein KI-Videomodell Dream Machine veröffentlicht, nur Stunden nach einem ähnlichen Schritt des Konkurrenten Runway. Wie Carl Franzen bei VentureBeat berichtet, ermöglicht die API Entwicklern, Dream Machine in eigene Anwendungen zu integrieren. Das Modell kann Videos aus Text oder Bildern generieren und bietet Funktionen wie Kamerabewegungssteuerung. Die API ist sofort …

Weiterlesen …

Runways Video-KI jetzt mit API-Zugang

Runway macht sein schnelles Videogenerierungsmodell Gen-3 Alpha Turbo per API verfügbar. Dies ermöglicht Unternehmen, das KI-Modell in ihre eigenen Anwendungen zu integrieren. Wie Shubham Sharma berichtet, ist Runway damit eines der ersten Unternehmen, das Entwicklern Zugang zu einem proprietären KI-Videogenerierungsmodell gewährt. Die API wird schrittweise eingeführt und ist zunächst nur für ausgewählte Partner zugänglich. Sie …

Weiterlesen …

Microsoft Windows Agent Arena vorgestellt

Microsoft hat eine neue Plattform namens Windows Agent Arena (WAA) vorgestellt, um KI-Assistenten in realistischen Windows-Umgebungen zu testen. Das berichtet Michael Nuñez auf VentureBeat. WAA bietet über 150 verschiedene Aufgaben in gängigen Windows-Anwendungen und ermöglicht eine parallele Auswertung in der Azure-Cloud. Microsoft präsentierte auch einen neuen KI-Agenten namens Navi, der in Tests eine Erfolgsquote von …

Weiterlesen …

Workspaces für Claude helfen beim KI-Management

Anthropic führt mit „Workspaces“ eine neue Funktion für die Verwaltung von KI-Systemen in Unternehmen ein. Das Startup ermöglicht damit die Erstellung und Steuerung mehrerer isolierter Umgebungen für Claude-KI-Implementierungen, wie Michael Nuñez bei VentureBeat berichtet. Unternehmen können nun Ausgaben- und Nutzungslimits festlegen, API-Schlüssel gruppieren und den Zugriff über Benutzerrollen kontrollieren. Die Funktion adressiert wichtige Herausforderungen bei …

Weiterlesen …