OpenAI o3 und o4-mini bringen neue Fähigkeiten zu Reasoning-KI

OpenAI hat zwei neue KI-Modelle, o3 und o4-mini, veröffentlicht, die erweiterte Reasoning-Fähigkeiten bieten und neue Funktionen wie das „Denken mit Bildern“ einführen. Diese Modelle sind die neueste Entwicklung in der o-Serie des Unternehmens und erscheinen nur wenige Tage nach der Veröffentlichung von GPT-4.1. Die markanteste Eigenschaft der Modelle ist ihre Fähigkeit, Bilder nicht nur zu …

Weiterlesen …

OpenAI stellt Zugang zu GPT-4.5 über API bis Mitte Juli ein

OpenAI wird seinen bisher größten KI-Modell GPT-4.5 bis zum 14. Juli aus seiner API entfernen. Wie Kyle Wiggers von TechCrunch berichtet, müssen Entwickler auf andere Modelle umsteigen, wobei GPT-4.1 als bevorzugter Ersatz empfohlen wird. Ein OpenAI-Sprecher erklärte, dass GPT-4.1 „ähnliche oder bessere Leistung als GPT-4.5 in wichtigen Bereichen zu deutlich niedrigeren Kosten“ biete. Das erst …

Weiterlesen …

Coheres neues Embed 4-Modell verarbeitet 200-seitige Dokumente

Cohere hat ein verbessertes multimodales Embedding-Modell namens Embed 4 vorgestellt. Das Modell verfügt über ein Kontextfenster von 128.000 Token und kann Dokumente mit bis zu 200 Seiten verarbeiten. Wie Emilia David von VentureBeat berichtet, stärkt Embed 4 die Fähigkeiten im Bereich Retrieval Augmented Generation (RAG) für Unternehmen. Das Modell unterstützt unstrukturierte Daten in mehr als …

Weiterlesen …

Claude erhält Zugriff auf Google Workspace

Anthropic hat eine neue Integration für seinen KI-Chatbot Claude eingeführt, die Zugriff auf Gmail, Google Kalender und Google Docs ermöglicht. Die Funktion wird zunächst als Beta-Version für Abonnenten der Premium-Pläne Max, Team, Enterprise und Pro freigeschaltet, wie Maxwell Zeff berichtet. Bei der Nutzung von Workspace-Inhalten zeigt Claude Quellenangaben direkt im Text an. Anthropic betont, dass …

Weiterlesen …

Google Veo 2 jetzt verfügbar für Gemini Advanced-Nutzer

Google hat Veo 2, sein Text-zu-Video-KI-Modell, für Gemini Advanced-Abonnenten weltweit freigegeben. Ab dem 15. April 2025 können Nutzer durch Eingabe von Text-Prompts in der Gemini-App achtsekündige Videos in 720p-Auflösung erzeugen. Die Funktion, die laut Google „kinorealistisch“ mit verbessertem Verständnis für Physik und menschliche Bewegung arbeitet, ist über ein Dropdown-Menü in der Gemini-Oberfläche verfügbar. Videos werden …

Weiterlesen …

OpenAI GPT-4.1: besser für Code, niedrigere Preise

OpenAI hat eine neue Familie von KI-Modellen namens GPT-4.1 veröffentlicht, die bessere Programmierfähigkeiten, präzisere Befolgung von Anweisungen und erweiterte Kontextfenster bietet – bei gleichzeitiger Preissenkung. Die neue Produktreihe umfasst drei Modelle: GPT-4.1, GPT-4.1 mini und GPT-4.1 nano, die alle sofort über die OpenAI-API, jedoch noch nicht in ChatGPT verfügbar sind. Verbesserte Fähigkeiten mit Fokus auf …

Weiterlesen …

Canva stellt Visual Suite 2.0 mit KI und Tabellenfunktionen vor

Canva hat auf seiner Veranstaltung „Canva Create 2025“ sein bisher größtes Produktupdate, Visual Suite 2.0, angekündigt. Die neue Suite führt mehrere KI-gestützte Funktionen ein, die darauf abzielen, die Lücke zwischen Produktivität und Kreativität zu schließen. Ein zentrales Element des Updates ist Canva Sheets, ein neues Tabellenkalkulationstool mit KI-Funktionen wie Magic Insights und Magic Formulas zur …

Weiterlesen …

OpenAI erweitert ChatGPT mit verbesserter Gedächtnisfunktion

OpenAI führt eine verbesserte Gedächtnisfunktion für ChatGPT ein, durch die der Chatbot nun auch auf frühere Gespräche übergreifend verweisen kann. Das Update soll ChatGPTs Antworten persönlicher und relevanter gestalten, indem es auf andere Diskussionen zurückgreift, ohne dass Nutzer Informationen wiederholen müssen. Die neue Funktion wird zunächst nur für ChatGPT Plus- und Pro-Abonnenten verfügbar sein, während …

Weiterlesen …

Adobe bringt KI-Agenten für Photoshop

Adobe stattet Photoshop mit einem KI-Agenten aus, der über ein neues Action Panel zugänglich sein wird. Das Unternehmen kündigte in einem Blogbeitrag an, dass dieser erste kreative Agent für Photoshop Bilder analysieren und kontextbezogene Bearbeitungen vorschlagen kann, die mit einem Klick ausgeführt werden. Nutzer können über 1.000 Aktionen per natürlichsprachlicher Befehle steuern. Die Funktion soll …

Weiterlesen …

Google stellt effizienten KI-Assistenten Gemini 2.5 Flash vor

Google hat mit Gemini 2.5 Flash ein neues KI-Modell vorgestellt, das auf Effizienz ausgerichtet ist. Wie Kyle Wiggers von TechCrunch berichtet, wird das Modell bald auf Googles KI-Entwicklungsplattform Vertex AI verfügbar sein. Gemini 2.5 Flash bietet „dynamisches und kontrollierbares“ Computing, sodass Entwickler die Verarbeitungszeit je nach Komplexität der Anfragen anpassen können. Als Reasoning-Modell ähnlich wie …

Weiterlesen …