Microsoft erweitert Phi-Sprachmodellfamilie mit neuen Reasoning-Fähigkeiten

Microsoft hat drei neue kleine Sprachmodelle (SLMs) vorgestellt, die sich auf komplexe Reasoning-Aufgaben konzentrieren: Phi-4-reasoning, Phi-4-reasoning-plus und Phi-4-mini-reasoning. Diese Modelle sind für angesichts ihrer kompakten Größe erstaunlich leistungsfähig, besonders bei mathematischem Reasoning und mehrstufiger Problemlösung. Das Flaggschiff Phi-4-reasoning-plus, ein Modell mit 14 Milliarden Parametern, zeigt eine Leistung, die offenbar mit viel größeren KI-Systemen mithalten kann. …

Weiterlesen …

Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Writer Palmyra X5: kostengünstig mit großem Kontextfenster

Das KI-Unternehmen Writer hat mit Palmyra X5 ein neues Sprachmodell veröffentlicht, das mit einem Kontextfenster von einer Million Tokens arbeitet und autonome KI-Agenten in Unternehmen vorantreiben soll. Michael Nuñez berichtet in VentureBeat, dass das Modell eine ähnliche Leistung wie GPT-4.1 bietet, jedoch zu 75% geringeren Kosten. Die Preisgestaltung liegt bei 0,60 Dollar pro Million Eingabe-Tokens …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Wechsel zwischen KI-Modellen komplizierter als man denken könnte

Der Wechsel zwischen verschiedenen großen Sprachmodellen (LLMs) stellt Unternehmen vor unerwartete Herausforderungen. Laut eines Berichts von Lavanya Gupta führt die Annahme, man könne einfach den API-Schlüssel austauschen, häufig zu Problemen bei Ausgabequalität, Kosten und Leistung. Die Unterschiede zwischen Modellen wie GPT-4o, Claude und Gemini sind erheblich. Ein Beispiel: Die Tokenisierungsstrategien variieren zwischen den Anbietern und …

Weiterlesen …

Coheres neues Embed 4-Modell verarbeitet 200-seitige Dokumente

Cohere hat ein verbessertes multimodales Embedding-Modell namens Embed 4 vorgestellt. Das Modell verfügt über ein Kontextfenster von 128.000 Token und kann Dokumente mit bis zu 200 Seiten verarbeiten. Wie Emilia David von VentureBeat berichtet, stärkt Embed 4 die Fähigkeiten im Bereich Retrieval Augmented Generation (RAG) für Unternehmen. Das Modell unterstützt unstrukturierte Daten in mehr als …

Weiterlesen …

Claude erhält Zugriff auf Google Workspace

Anthropic hat eine neue Integration für seinen KI-Chatbot Claude eingeführt, die Zugriff auf Gmail, Google Kalender und Google Docs ermöglicht. Die Funktion wird zunächst als Beta-Version für Abonnenten der Premium-Pläne Max, Team, Enterprise und Pro freigeschaltet, wie Maxwell Zeff berichtet. Bei der Nutzung von Workspace-Inhalten zeigt Claude Quellenangaben direkt im Text an. Anthropic betont, dass …

Weiterlesen …

Open Deep Search ist eine frei verfügbare Alternative

Ein Forschungsteam aus Mitgliedern von Sentient, der University of Washington, Princeton University und UC Berkeley hat mit Open Deep Search (ODS) ein neues Open-Source-Framework vorgestellt. Es soll eine Alternative zu proprietären KI-Suchlösungen bieten. Das von Salaheddin Alzubi geleitete Team entwickelte zwei Hauptkomponenten: das Open Search Tool und den Open Reasoning Agent. Das Suchwerkzeug verarbeitet Webinhalte …

Weiterlesen …

ChatGPT kann nun auf unternehmensinterne Datenquellen zugreifen

OpenAI hat eine neue Funktion eingeführt, die es ChatGPT-Team-Nutzern ermöglicht, interne Wissensdatenbanken direkt mit der Plattform zu verbinden. Wie Emilia David von VentureBeat berichtet, befindet sich diese lang erwartete Funktion derzeit in der Beta-Phase. Administratoren können zunächst Google Drive mit ChatGPT verbinden, wobei laut OpenAI-Produktmanager Nate Gonzales weitere Datenquellen folgen werden. Das System führt semantische …

Weiterlesen …

OpenAI veröffentlicht Entwicklertools für KI-Agenten

OpenAI hat eine neue Reihe von Tools veröffentlicht, mit der Entwickler KI-Agenten ähnlich den firmeneigenen Diensten Deep Research und Operator erstellen können. Die neuen Angebote umfassen die Responses API und das Open-Source Agents SDK. Damit lassen sich KI-Anwendungen erstellen, die im Web suchen, Dateien analysieren und sogar Computeroberflächen steuern können. Responses API Die Responses API …

Weiterlesen …