Writer Palmyra X5: kostengünstig mit großem Kontextfenster

Das KI-Unternehmen Writer hat mit Palmyra X5 ein neues Sprachmodell veröffentlicht, das mit einem Kontextfenster von einer Million Tokens arbeitet und autonome KI-Agenten in Unternehmen vorantreiben soll. Michael Nuñez berichtet in VentureBeat, dass das Modell eine ähnliche Leistung wie GPT-4.1 bietet, jedoch zu 75% geringeren Kosten. Die Preisgestaltung liegt bei 0,60 Dollar pro Million Eingabe-Tokens …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Wechsel zwischen KI-Modellen komplizierter als man denken könnte

Der Wechsel zwischen verschiedenen großen Sprachmodellen (LLMs) stellt Unternehmen vor unerwartete Herausforderungen. Laut eines Berichts von Lavanya Gupta führt die Annahme, man könne einfach den API-Schlüssel austauschen, häufig zu Problemen bei Ausgabequalität, Kosten und Leistung. Die Unterschiede zwischen Modellen wie GPT-4o, Claude und Gemini sind erheblich. Ein Beispiel: Die Tokenisierungsstrategien variieren zwischen den Anbietern und …

Weiterlesen …

Coheres neues Embed 4-Modell verarbeitet 200-seitige Dokumente

Cohere hat ein verbessertes multimodales Embedding-Modell namens Embed 4 vorgestellt. Das Modell verfügt über ein Kontextfenster von 128.000 Token und kann Dokumente mit bis zu 200 Seiten verarbeiten. Wie Emilia David von VentureBeat berichtet, stärkt Embed 4 die Fähigkeiten im Bereich Retrieval Augmented Generation (RAG) für Unternehmen. Das Modell unterstützt unstrukturierte Daten in mehr als …

Weiterlesen …

Claude erhält Zugriff auf Google Workspace

Anthropic hat eine neue Integration für seinen KI-Chatbot Claude eingeführt, die Zugriff auf Gmail, Google Kalender und Google Docs ermöglicht. Die Funktion wird zunächst als Beta-Version für Abonnenten der Premium-Pläne Max, Team, Enterprise und Pro freigeschaltet, wie Maxwell Zeff berichtet. Bei der Nutzung von Workspace-Inhalten zeigt Claude Quellenangaben direkt im Text an. Anthropic betont, dass …

Weiterlesen …

Open Deep Search ist eine frei verfügbare Alternative

Ein Forschungsteam aus Mitgliedern von Sentient, der University of Washington, Princeton University und UC Berkeley hat mit Open Deep Search (ODS) ein neues Open-Source-Framework vorgestellt. Es soll eine Alternative zu proprietären KI-Suchlösungen bieten. Das von Salaheddin Alzubi geleitete Team entwickelte zwei Hauptkomponenten: das Open Search Tool und den Open Reasoning Agent. Das Suchwerkzeug verarbeitet Webinhalte …

Weiterlesen …

ChatGPT kann nun auf unternehmensinterne Datenquellen zugreifen

OpenAI hat eine neue Funktion eingeführt, die es ChatGPT-Team-Nutzern ermöglicht, interne Wissensdatenbanken direkt mit der Plattform zu verbinden. Wie Emilia David von VentureBeat berichtet, befindet sich diese lang erwartete Funktion derzeit in der Beta-Phase. Administratoren können zunächst Google Drive mit ChatGPT verbinden, wobei laut OpenAI-Produktmanager Nate Gonzales weitere Datenquellen folgen werden. Das System führt semantische …

Weiterlesen …

OpenAI veröffentlicht Entwicklertools für KI-Agenten

OpenAI hat eine neue Reihe von Tools veröffentlicht, mit der Entwickler KI-Agenten ähnlich den firmeneigenen Diensten Deep Research und Operator erstellen können. Die neuen Angebote umfassen die Responses API und das Open-Source Agents SDK. Damit lassen sich KI-Anwendungen erstellen, die im Web suchen, Dateien analysieren und sogar Computeroberflächen steuern können. Responses API Die Responses API …

Weiterlesen …

Neue KI-Techniken versprechen Kosteneinsparungen und verbesserte Leistung für Unternehmen

Aktuelle Forschungsergebnisse haben zwei vielversprechende Ansätze aufgedeckt, die die Kosten für den Betrieb großer Sprachmodelle (LLMs) drastisch reduzieren und gleichzeitig ihre Leistung bei komplexen Denkaufgaben verbessern könnten. Diese Innovationen kommen zu einem kritischen Zeitpunkt, da Unternehmen zunehmend KI-Lösungen einsetzen, aber mit Rechenkosten kämpfen. Chain of draft: Weniger ist mehr Forscher bei Zoom Communications haben eine …

Weiterlesen …

Anthropic startet KI-Plattform für abteilungsübergreifende Zusammenarbeit

Anthropic hat ein umfassendes Update seiner Entwicklerplattform veröffentlicht, das KI-Funktionen für nicht-technische Teams zugänglich macht. Wie Michael Nuñez für VentureBeat berichtet, ermöglicht die überarbeitete Anthropic Console Teammitgliedern verschiedener Abteilungen die gemeinsame Arbeit an KI-Prompts. Die Plattform unterstützt jetzt das Claude 3.7 Sonnet Modell mit neuen „Extended Thinking Controls“, die tieferes Denkvermögen bei gleichzeitiger Kostenkontrolle ermöglichen. …

Weiterlesen …

×