Leitfaden: GPT-4.1 erfordert präzisere Anweisungen als Vorgängermodelle

OpenAI hat einen umfassenden Leitfaden für die Prompt-Erstellung bei der neuen GPT-4.1-Modellfamilie veröffentlicht. Der Leitfaden hebt bedeutende Verbesserungen in den Bereichen Programmierung, Befolgung von Anweisungen und Verarbeitung langer Kontexte im Vergleich zu GPT-4o hervor. Laut der Veröffentlichung müssen Entwickler ihre Prompts möglicherweise anpassen, da GPT-4.1 Anweisungen wörtlicher befolgt als frühere Versionen, die Benutzerabsichten freier interpretierten. …

Weiterlesen …

ByteDance nutzt Daten von einer Milliarde Nutzern für KI-Entwicklung

Der chinesische Internetkonzern ByteDance verwendet Daten seiner beliebten Apps TikTok, Douyin und Toutiao als Grundlage für seine KI-Ambitionen, berichtet Meaghan Tobin von der New York Times. Das Unternehmen sammelt Nutzerdaten von etwa 170 Millionen TikTok-Nutzern in den USA und rund einer Milliarde Nutzern seiner chinesischen Apps. ByteDance investierte im vergangenen Jahr etwa 11 Milliarden Dollar …

Weiterlesen …

Bericht: Google Gemini 2.5 übertrifft Konkurrenz in allen KI-Benchmarks

Google führt das KI-Rennen mit seinem Gemini 2.5 Pro Experimental-Modell an, das derzeit als leistungsstärkstes KI-Modell in zahlreichen Benchmarks gilt. Laut Alberto Romero in seinem Newsletter The Algorithmic Bridge dominiert Google inzwischen auf allen KI-Gebieten. Das Modell belegt Spitzenplätze bei LMArena, GPQA Diamond und Humanity’s Last Exam und übertrifft damit die Angebote von OpenAI und …

Weiterlesen …

OpenAI o3 und o4-mini bringen neue Fähigkeiten zu Reasoning-KI

OpenAI hat zwei neue KI-Modelle, o3 und o4-mini, veröffentlicht, die erweiterte Reasoning-Fähigkeiten bieten und neue Funktionen wie das „Denken mit Bildern“ einführen. Diese Modelle sind die neueste Entwicklung in der o-Serie des Unternehmens und erscheinen nur wenige Tage nach der Veröffentlichung von GPT-4.1. Die markanteste Eigenschaft der Modelle ist ihre Fähigkeit, Bilder nicht nur zu …

Weiterlesen …

ChatGPT überholt Instagram und TikTok als meistgeladene App weltweit

ChatGPT hat im März Instagram und TikTok überholt und wurde zur weltweit meistgeladenen App außerhalb von Spielen. Laut Daten von Appfigures, über die Sarah Perez von TechCrunch berichtet, stiegen die Downloads um 28% gegenüber Februar auf 46 Millionen. Dies markiert den erfolgreichsten Monat für die KI-App und ihre erste Platzierung an der Spitze der globalen …

Weiterlesen …

Google verlinkt sich nun selbst in KI-Übersichten

Google hat offiziell eine Funktion eingeführt, die Links innerhalb von KI-Übersichten zu Googles eigenen Suchergebnissen hinzufügt. Barry Schwartz von Search Engine Land berichtet, dass diese Aktualisierung Nutzern helfen soll, Themen einfacher zu erkunden. Ein Google-Sprecher erklärte, dass die Links erscheinen, wenn die Systeme dies als nützlich erachten. Tests hätten gezeigt, dass Nutzer nach dem Anzeigen …

Weiterlesen …

OpenAI stellt Zugang zu GPT-4.5 über API bis Mitte Juli ein

OpenAI wird seinen bisher größten KI-Modell GPT-4.5 bis zum 14. Juli aus seiner API entfernen. Wie Kyle Wiggers von TechCrunch berichtet, müssen Entwickler auf andere Modelle umsteigen, wobei GPT-4.1 als bevorzugter Ersatz empfohlen wird. Ein OpenAI-Sprecher erklärte, dass GPT-4.1 „ähnliche oder bessere Leistung als GPT-4.5 in wichtigen Bereichen zu deutlich niedrigeren Kosten“ biete. Das erst …

Weiterlesen …

Coheres neues Embed 4-Modell verarbeitet 200-seitige Dokumente

Cohere hat ein verbessertes multimodales Embedding-Modell namens Embed 4 vorgestellt. Das Modell verfügt über ein Kontextfenster von 128.000 Token und kann Dokumente mit bis zu 200 Seiten verarbeiten. Wie Emilia David von VentureBeat berichtet, stärkt Embed 4 die Fähigkeiten im Bereich Retrieval Augmented Generation (RAG) für Unternehmen. Das Modell unterstützt unstrukturierte Daten in mehr als …

Weiterlesen …

Claude erhält Zugriff auf Google Workspace

Anthropic hat eine neue Integration für seinen KI-Chatbot Claude eingeführt, die Zugriff auf Gmail, Google Kalender und Google Docs ermöglicht. Die Funktion wird zunächst als Beta-Version für Abonnenten der Premium-Pläne Max, Team, Enterprise und Pro freigeschaltet, wie Maxwell Zeff berichtet. Bei der Nutzung von Workspace-Inhalten zeigt Claude Quellenangaben direkt im Text an. Anthropic betont, dass …

Weiterlesen …

Google Veo 2 jetzt verfügbar für Gemini Advanced-Nutzer

Google hat Veo 2, sein Text-zu-Video-KI-Modell, für Gemini Advanced-Abonnenten weltweit freigegeben. Ab dem 15. April 2025 können Nutzer durch Eingabe von Text-Prompts in der Gemini-App achtsekündige Videos in 720p-Auflösung erzeugen. Die Funktion, die laut Google „kinorealistisch“ mit verbessertem Verständnis für Physik und menschliche Bewegung arbeitet, ist über ein Dropdown-Menü in der Gemini-Oberfläche verfügbar. Videos werden …

Weiterlesen …