KI-Startup Deep Cogito zeigt seine ersten Open-Source-Sprachmodelle

Das KI-Startup Deep Cogito aus San Francisco hat seine ersten Sprachmodelle namens Cogito v1 veröffentlicht. Diese Open-Source-Modelle basieren auf Metas Llama 3.2 und verfügen über hybride Fähigkeiten zur Selbstreflexion, wie Carl Franzen von VentureBeat berichtet. Die Modelle sind in fünf verschiedenen Größen von 3 bis 70 Milliarden Parametern verfügbar und können über Hugging Face, Ollama …

Weiterlesen …

Nvidias neues Sprachmodell hat zuschaltbares Reasoning

Nvidia hat ein neues Sprachmodell namens Llama-3.1-Nemotron-Ultra-253B veröffentlicht, das trotz seiner geringeren Größe den Konkurrenten DeepSeek R1 in mehreren Benchmarks übertrifft. Wie VentureBeat-Autor Carl Franzen berichtet, wurde das vollständig quelloffene Modell auf Hugging Face bereitgestellt. Eine Besonderheit ist der Wechsel zwischen „Reasoning On“ und „Reasoning Off“-Modi, wodurch die Leistung bei komplexen Aufgaben deutlich steigt, beim …

Weiterlesen …

Anthropic führt „Max“-Tarif für mehr Claude-Nutzung ein

Anthropic hat eine neue Abonnementstufe namens „Max“ für seinen KI-Assistenten Claude eingeführt, die bis zu 20-mal höhere Nutzungslimits als der Pro-Plan bietet. Der neue Plan richtet sich an Nutzer, die intensiv mit Claude zusammenarbeiten und erweiterten Zugriff für anspruchsvolle Projekte benötigen. Das Max-Abonnement ist in zwei Preisstufen erhältlich: 100 Dollar monatlich für die fünffache Nutzung …

Weiterlesen …

Plattform Krea vereint KI-Werkzeuge für visuelle Kreativschaffende

Krea ist eine Plattform für visuelle Kreativschaffende, die verschiedene generative KI-Modelle in einer Oberfläche integriert. Wie Ingrid Lunden in TechCrunch berichtet, hat das in San Francisco ansässige Startup insgesamt 83 Millionen Dollar eingesammelt, darunter eine kürzliche Series-B-Finanzierung in Höhe von 47 Millionen Dollar unter Führung von Bain Capital Ventures. Die Plattform ermöglicht es Designern, ihre …

Weiterlesen …

Google erweitert AI Mode mit Bilderkennung

Google hat seinen KI-gestützten Suchdienst AI Mode um Bilderkennung erweitert. Nutzer können jetzt Fotos hochladen oder aufnehmen, die das System analysieren kann, um relevante Suchergebnisse zu liefern. Laut Ryan Whitwam von Ars Technica nutzt die Funktion eine angepasste Version des Gemini-Sprachmodells, das mit Google Lens zusammenarbeitet, um Objekte in Bildern zu identifizieren. Diese „Fan-out-Technik“ ermöglicht …

Weiterlesen …

Google macht Gemini 2.5 Pro zu günstigen Preisen allgemein verfügbar

Google hat bekannt gegeben, dass sein Gemini 2.5 Pro-Modell jetzt als öffentliche Vorschau über die Gemini API in Google AI Studio verfügbar ist, wobei die Einführung in Vertex AI in Kürze erwartet wird. Laut Google ist dieses Modell ihr bisher „intelligentestes“ und wurde mit 1,24 $ pro Million Input-Tokens und 10 $ pro Million Output-Tokens …

Weiterlesen …

Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr …

Weiterlesen …

Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann. Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere …

Weiterlesen …

OpenAI kündigt Vollversion von o3 an und verschiebt GPT-5

OpenAI hat seine Entscheidung rückgängig gemacht, die Vollversion des o3-Reasoning-Modells nicht zu veröffentlichen. CEO Sam Altman gab auf X (ehemals Twitter) bekannt, dass sowohl o3 als auch der Nachfolger o4-mini in „ein paar Wochen“ erscheinen werden. Kyle Wiggers berichtet für TechCrunch, dass diese Änderung mit dem kommenden GPT-5 zusammenhängt, das Reasoning-Fähigkeiten integrieren wird. Altman erklärte, …

Weiterlesen …

Microsoft erweitert Copilot Vision auf Windows und Mobilgeräte

Microsoft führt seine Copilot Vision-Funktion auf Windows und mobilen Plattformen ein und erweitert damit die Fähigkeiten des KI-Assistenten über Webbrowser hinaus. Die bisher auf Edge-Webseiten beschränkte Copilot Vision kann jetzt Echtzeit-Videos von Mobilkameras analysieren und mit Inhalten in Windows-Anwendungen interagieren. Die erweiterten Sehfähigkeiten lassen Copilot praktische Hilfestellungen bieten, etwa Tipps zur Pflanzenpflege oder Wohnungseinrichtung durch …

Weiterlesen …