ByteDance stellt UI-TARS vor: KI-System steuert Computer selbstständig

ByteDance präsentiert mit UI-TARS ein neues KI-System, das Computer und mobile Geräte automatisch bedienen kann. Wie aus einer Forschungsarbeit auf Arxiv hervorgeht, übertrifft das System bestehende KI-Modelle wie GPT-4o und Claude in verschiedenen Leistungstests, berichtet VentureBeat. UI-TARS wurde mit 50 Milliarden Tokens trainiert und ist in Versionen mit 7 und 72 Milliarden Parametern verfügbar. Das …

Weiterlesen …

Googles Gemini 2.0 Flash Thinking jetzt kostenlos testen

Google hat ein neues KI-Modell namens Gemini 2.0 Flash Thinking veröffentlicht, das bis zu eine Million Texttoken verarbeiten kann. Wie Michael Nuñez von VentureBeat berichtet, ist das Modell kostenlos im Google AI Studio unter der experimentellen Bezeichnung „Exp-01-21“ verfügbar. Das System erreichte bei mathematischen und wissenschaftlichen Tests beachtliche Ergebnisse: 73,3% beim American Invitational Mathematics Examination …

Weiterlesen …

Gerüchteküche: OpenAI wird KI-Assistenten zur Browserkontrolle vorstellen

OpenAI steht kurz vor der Veröffentlichung eines neuen KI-Tools namens Operator. Wie Thomas Maxwell für Gizmodo berichtet, soll die Software noch diese Woche erscheinen. Das System kann im Webbrowser der Nutzer bestimmte Aufgaben ausführen. Es navigiert selbstständig durch Websites und kann beispielsweise Flüge suchen oder E-Mails vorbereiten. Die finale Bestätigung von Transaktionen bleibt beim Nutzer. …

Weiterlesen …

Perplexity stellt neue KI-Suche-API mit zwei Preismodellen vor

Perplexity hat einen neuen API-Dienst namens Sonar eingeführt, über den Entwickler KI-gestützte Suchfunktionen in ihre Anwendungen integrieren können. Wie Maxwell Zeff berichtet, bietet der Service zwei Preisstufen an: Sonar für schnelle, kostengünstige Suchen und Sonar Pro für detailliertere Antworten bei komplexen Fragen. Der Dienst zeichnet sich durch seine Echtzeit-Internetverbindung aus, die aktuelle Informationen mit Quellenangaben …

Weiterlesen …

Tencent Hunyuan3D 2.0 erstellt 3D-Modelle in Sekunden

Tencent hat ein neues KI-System namens Hunyuan3D 2.0 entwickelt, das innerhalb von Sekunden 3D-Modelle aus Einzelbildern oder Textbeschreibungen erstellt. Die Technologie, über die Michael Nuñez berichtet, automatisiert einen Prozess, der Künstler üblicherweise Tage oder Wochen kostet. Das System nutzt zwei Hauptkomponenten für Form und Oberflächendetails und erreicht laut Tencent bessere Ergebnisse als bisherige Lösungen. Die …

Weiterlesen …

Google Gemini Assistant erweitert Funktionen mit Multi-App-Unterstützung

Google hat bedeutende Aktualisierungen für seinen KI-Assistenten Gemini angekündigt, zeitgleich mit der Vorstellung des Samsung Galaxy S25. Die wichtigste Neuerung ermöglicht es Gemini, Aufgaben über mehrere Anwendungen hinweg in einer einzigen Interaktion auszuführen. Zudem wird Gemini der standardmäßige Assistent auf Samsungs neuen Flagship-Smartphones und ersetzt damit Bixby. Die erweiterte Gemini Live-Funktion unterstützt nun die Integration …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

Runways neuer KI-Bildgenerator ist auf den Filmlook spezialisiert

Das KI-Technologieunternehmen Runway hat einen neuen Bildgenerator namens Frames eingeführt. Wie Carl Franzen berichtet, richtet sich das Tool speziell an professionelle Kreativschaffende. Das System ist ab sofort über Runway-Abos verfügbar, die bei 95 Dollar pro Monat beginnen. Frames bietet 19 voreingestellte Bildstile und ermöglicht die Erstellung cinematischer Bilder mit präziser Stilkontrolle. Laut CEO Cristóbal Valenzuela …

Weiterlesen …

Luma AI zeigt neuen KI-Videogenerator Ray2

Luma AI hat ein neues KI-Videomodell namens Ray2 eingeführt, das verbesserte Bewegungsqualität und Physik-Simulation bietet. Wie Carl Franzen berichtet, wurde das neue Modell mit zehnfacher Rechenleistung im Vergleich zum Vorgänger trainiert. Laut Unternehmens-CEO Amit Jain ermöglicht Ray2 schnellere und natürlichere Bewegungsabläufe in generierten Videos. Das Modell ist über die „Dream Machine“-Plattform und mobile Apps für …

Weiterlesen …

Black Forest Labs stellt Finetune-API für KI-Bildgenerator vor

Black Forest Labs hat eine neue API-Technologie eingeführt, die es ermöglicht, KI-Bildgenerierungsmodelle mit nur fünf Trainingsbildern anzupassen. Wie Carl Franzen berichtet, erlaubt die FLUX Pro Finetuning API Nutzern, personalisierte Versionen der FLUX Pro und Ultra Modelle zu erstellen. Das System unterstützt verschiedene Modi für Charaktere, Produkte und Stilrichtungen. Die Ausgabeauflösung erreicht bis zu vier Megapixel. …

Weiterlesen …