OpenAI entwickelt KI-Assistenten für automatisierte Aufgaben

OpenAI plant für Januar 2024 die Einführung eines neuen KI-Assistenten mit dem Codenamen „Operator“. Das Tool soll verschiedene Computeraufgaben wie Programmierung und Reisebuchungen selbstständig ausführen können. Nach Angaben von Bloomberg-Journalisten wird die Software sowohl als Forschungsvorschau als auch über eine Entwickler-Schnittstelle verfügbar sein. Der browserbasierte Assistent reiht sich in einen branchenweit erkennbaren Trend ein, bei …

Weiterlesen …

KI-Agenten revolutionieren RAG-Systeme für Datenverarbeitung

Eine neue Generation von Retrieval-Augmented Generation (RAG) Systemen nutzt künstliche Intelligenz-Agenten für verbesserte Datenverwaltung. Diese Entwicklung wurde in einer VentureBeat-Analyse von Shubham Sharma vorgestellt. Die KI-Agenten können im Gegensatz zu herkömmlichen RAG-Systemen auf mehrere Datenquellen gleichzeitig zugreifen. Sie validieren Informationen selbstständig und treffen eigenständige Entscheidungen bei der Datenabfrage. Experten des Unternehmens Weaviate bestätigen, dass diese …

Weiterlesen …

Box erweitert Plattform mit KI-Studio und App-Entwicklungstool

Box präsentiert zwei neue Technologien für Unternehmenskunden: Das Box AI Studio ermöglicht die Erstellung angepasster KI-Agenten mit spezifischen Geschäftsanweisungen. Die zweite Neuerung, Box Apps, ist eine No-Code-Plattform zur Entwicklung von Unternehmensanwendungen. Beide Funktionen basieren auf der bestehenden Box-Infrastruktur und nutzen Partnerschaften mit führenden KI-Unternehmen wie Anthropic, Google und OpenAI, berichtet VentureBeat. Geschäftsführer Aaron Levie bezeichnet …

Weiterlesen …

KI-Startup Mistral AI stellt mehrsprachige Moderations-API vor

Das französische KI-Startup Mistral AI hat eine neue Moderations-API vorgestellt, die potenziell schädliche Inhalte in neun Kategorien und elf Sprachen erkennen kann. Die API basiert auf Mistrals optimiertem Ministral-8B-Modell und bietet Analysemöglichkeiten für Rohtext und konversationelle Inhalte, berichtet Michael Nuñez für VentureBeat. Mit diesem Schritt positioniert sich Mistral als Konkurrent zu OpenAI und anderen führenden …

Weiterlesen …

Microsoft stellt Magentic-One vor, ein Open-Source-Framework zur Verwaltung von Multi-Agenten-KI-Systemen

Microsoft hat mit Magentic-One eine neue Open-Source-Infrastruktur veröffentlicht. Das System ermöglicht es einem einzigen KI-Modell, mehrere Hilfsagenten zu steuern, die zusammenarbeiten, um komplexe, mehrstufige Aufgaben in verschiedenen Szenarien zu erledigen. Magentic-One basiert auf einem Orchestrator-Agenten, der vier weitere Agenten leitet: Websurfer, FileSurfer, Coder und ComputerTerminal. Laut Microsoft-Forschern ist Magentic-One ein generalistisches Agentensystem, das die lang …

Weiterlesen …

Patronus AI stellt API vor, die KI-Halluzinationen in Echtzeit verhindert

Das Startup Patronus AI aus San Francisco hat eine Self-Serve-API eingeführt, die KI-Fehler wie Halluzinationen und unerwünschte Antworten in Echtzeit erkennt und verhindert. Laut CEO Anand Kannappan in einem Interview mit VentureBeat bietet die Plattform mehrere Innovationen, darunter „Judge Evaluators“, mit denen Unternehmen benutzerdefinierte Regeln in einfachem Englisch erstellen können, und Lynx, ein Halluzinationserkennungsmodell, das …

Weiterlesen …

Google integriert Echtzeit-Suche in Gemini AI Plattform

Google hat für seine Gemini AI Plattform die Funktion „Grounding with Google Search“ eingeführt. Sie ermöglicht es Entwicklern, ihre KI-Anwendungen mit aktuellen Informationen aus der Google-Suche anzureichern. Der Dienst wurde nur wenige Stunden vor OpenAIs verbraucherorientierter ChatGPT-Suche gestartet, wie Michael Nuñez von VentureBeat berichtet. Googles Angebot richtet sich an Entwickler und kostet 35 US-Dollar pro …

Weiterlesen …

OpenAI erweitert Realtime-API um neue Stimmen und senkt Preise für Entwickler

OpenAI hat seine Realtime-API, die sich derzeit in der Beta-Phase befindet, um fünf neue ausdrucksstarke Stimmen für Speech-to-Speech-Anwendungen erweitert. Durch die Einführung von Prompt-Caching wurden die Kosten für Entwickler gesenkt. Laut der von VentureBeat zitierten API-Dokumentation von OpenAI ermöglicht die native Speech-to-Speech-Funktion eine geringe Latenz und nuancierte Ausgaben. Das Unternehmen präsentierte drei der neuen Stimmen …

Weiterlesen …

Open-Source-Toolkit Amphion unterstützt Forschung zu Audio-, Musik- und Sprachgenerierung

Das quelloffene Toolkit Amphion dient der Unterstützung von Forschung und Entwicklung im Bereich der Audio-, Musik- und Sprachgenerierung. Laut Projekt-Website bietet es einzigartige Visualisierungen klassischer Modelle und Architekturen, um Nachwuchsforscher*innen und Ingenieur*innen das Verständnis zu erleichtern. Amphion unterstützt verschiedene Generierungsaufgaben wie Text-to-Speech (TTS), Gesangsstimmensynthese (SVS), Stimmkonvertierung (VC), Gesangsstimmenkonvertierung (SVC), Text-to-Audio (TTA) und Text-to-Music (TTM). Zudem …

Weiterlesen …

Cerebras Inference erzielt Durchbruch bei der Leistung von Llama 3.1-70B

Cerebras hat ein bedeutendes Update für seine Cerebras Inference-Plattform vorgestellt, die nun das Sprachmodell Llama 3.1-70B mit beeindruckenden 2.100 Token pro Sekunde ausführt – eine dreifache Leistungssteigerung im Vergleich zur vorherigen Version. Laut James Wang vom offiziellen Cerebras-Blog ist diese Leistung 16-mal schneller als die schnellste GPU-Lösung und 8-mal schneller als GPUs, die das wesentlich …

Weiterlesen …