KI-Startup Mistral AI stellt mehrsprachige Moderations-API vor

Das französische KI-Startup Mistral AI hat eine neue Moderations-API vorgestellt, die potenziell schädliche Inhalte in neun Kategorien und elf Sprachen erkennen kann. Die API basiert auf Mistrals optimiertem Ministral-8B-Modell und bietet Analysemöglichkeiten für Rohtext und konversationelle Inhalte, berichtet Michael Nuñez für VentureBeat. Mit diesem Schritt positioniert sich Mistral als Konkurrent zu OpenAI und anderen führenden …

Weiterlesen …

Microsoft stellt Magentic-One vor, ein Open-Source-Framework zur Verwaltung von Multi-Agenten-KI-Systemen

Microsoft hat mit Magentic-One eine neue Open-Source-Infrastruktur veröffentlicht. Das System ermöglicht es einem einzigen KI-Modell, mehrere Hilfsagenten zu steuern, die zusammenarbeiten, um komplexe, mehrstufige Aufgaben in verschiedenen Szenarien zu erledigen. Magentic-One basiert auf einem Orchestrator-Agenten, der vier weitere Agenten leitet: Websurfer, FileSurfer, Coder und ComputerTerminal. Laut Microsoft-Forschern ist Magentic-One ein generalistisches Agentensystem, das die lang …

Weiterlesen …

Patronus AI stellt API vor, die KI-Halluzinationen in Echtzeit verhindert

Das Startup Patronus AI aus San Francisco hat eine Self-Serve-API eingeführt, die KI-Fehler wie Halluzinationen und unerwünschte Antworten in Echtzeit erkennt und verhindert. Laut CEO Anand Kannappan in einem Interview mit VentureBeat bietet die Plattform mehrere Innovationen, darunter „Judge Evaluators“, mit denen Unternehmen benutzerdefinierte Regeln in einfachem Englisch erstellen können, und Lynx, ein Halluzinationserkennungsmodell, das …

Weiterlesen …

Google integriert Echtzeit-Suche in Gemini AI Plattform

Google hat für seine Gemini AI Plattform die Funktion „Grounding with Google Search“ eingeführt. Sie ermöglicht es Entwicklern, ihre KI-Anwendungen mit aktuellen Informationen aus der Google-Suche anzureichern. Der Dienst wurde nur wenige Stunden vor OpenAIs verbraucherorientierter ChatGPT-Suche gestartet, wie Michael Nuñez von VentureBeat berichtet. Googles Angebot richtet sich an Entwickler und kostet 35 US-Dollar pro …

Weiterlesen …

OpenAI erweitert Realtime-API um neue Stimmen und senkt Preise für Entwickler

OpenAI hat seine Realtime-API, die sich derzeit in der Beta-Phase befindet, um fünf neue ausdrucksstarke Stimmen für Speech-to-Speech-Anwendungen erweitert. Durch die Einführung von Prompt-Caching wurden die Kosten für Entwickler gesenkt. Laut der von VentureBeat zitierten API-Dokumentation von OpenAI ermöglicht die native Speech-to-Speech-Funktion eine geringe Latenz und nuancierte Ausgaben. Das Unternehmen präsentierte drei der neuen Stimmen …

Weiterlesen …

Open-Source-Toolkit Amphion unterstützt Forschung zu Audio-, Musik- und Sprachgenerierung

Das quelloffene Toolkit Amphion dient der Unterstützung von Forschung und Entwicklung im Bereich der Audio-, Musik- und Sprachgenerierung. Laut Projekt-Website bietet es einzigartige Visualisierungen klassischer Modelle und Architekturen, um Nachwuchsforscher*innen und Ingenieur*innen das Verständnis zu erleichtern. Amphion unterstützt verschiedene Generierungsaufgaben wie Text-to-Speech (TTS), Gesangsstimmensynthese (SVS), Stimmkonvertierung (VC), Gesangsstimmenkonvertierung (SVC), Text-to-Audio (TTA) und Text-to-Music (TTM). Zudem …

Weiterlesen …

Cerebras Inference erzielt Durchbruch bei der Leistung von Llama 3.1-70B

Cerebras hat ein bedeutendes Update für seine Cerebras Inference-Plattform vorgestellt, die nun das Sprachmodell Llama 3.1-70B mit beeindruckenden 2.100 Token pro Sekunde ausführt – eine dreifache Leistungssteigerung im Vergleich zur vorherigen Version. Laut James Wang vom offiziellen Cerebras-Blog ist diese Leistung 16-mal schneller als die schnellste GPU-Lösung und 8-mal schneller als GPUs, die das wesentlich …

Weiterlesen …

Hugging Face hilft Unternehmen mit KI-Entwicklung

Das New Yorker KI-Start-up Hugging Face bringt gemeinsam mit Amazon und Google eine neue Open-Source-Software auf den Markt, die die Kosten für die Entwicklung von Chatbots und anderen KI-Systemen senken soll. Das berichtet Stephen Nellis für Reuters. Das Angebot mit dem Namen „HUGS“ (Hugging Face for Generative AI Services) automatisiert die Implementierung von KI-Modellen und …

Weiterlesen …

Cohere’s Embed 3 sucht nun auch nach Bildern

Das KI-Unternehmen Cohere hat sein Embedding-Modell Embed 3 um multimodale Funktionen erweitert, sodass nun auch Bilder in RAG-basierte Unternehmenssuchen einbezogen werden können. Das berichtet Emilia David für VentureBeat. Die neue Version kann Embeddings sowohl für Bilder als auch für Texte erstellen, wobei beide Formate in einer einheitlichen Datenbank gespeichert werden. Nach Angaben von Cohere ermöglicht …

Weiterlesen …

„Computer Use“: Anthropics Claude kann jetzt deinen PC steuern

Anthropic hat eine aktualisierte Version seines KI-Modells Claude 3.5 Sonnet vorgestellt. Laut Unternehmensangaben kann das Modell nun Desktop-Anwendungen steuern und PC-Aufgaben ausführen. Dafür nutzt es eine neue „Computer Use“-API, die sich in der öffentlichen Beta-Phase befindet. Anthropic betont, dass die Technologie noch fehlerbehaftet sei und empfiehlt Entwicklern, zunächst nur risikoarme Aufgaben damit zu testen. Neben …

Weiterlesen …