Perplexity stellt neue KI-Suche-API mit zwei Preismodellen vor

Perplexity hat einen neuen API-Dienst namens Sonar eingeführt, über den Entwickler KI-gestützte Suchfunktionen in ihre Anwendungen integrieren können. Wie Maxwell Zeff berichtet, bietet der Service zwei Preisstufen an: Sonar für schnelle, kostengünstige Suchen und Sonar Pro für detailliertere Antworten bei komplexen Fragen. Der Dienst zeichnet sich durch seine Echtzeit-Internetverbindung aus, die aktuelle Informationen mit Quellenangaben …

Weiterlesen …

Tencent Hunyuan3D 2.0 erstellt 3D-Modelle in Sekunden

Tencent hat ein neues KI-System namens Hunyuan3D 2.0 entwickelt, das innerhalb von Sekunden 3D-Modelle aus Einzelbildern oder Textbeschreibungen erstellt. Die Technologie, über die Michael Nuñez berichtet, automatisiert einen Prozess, der Künstler üblicherweise Tage oder Wochen kostet. Das System nutzt zwei Hauptkomponenten für Form und Oberflächendetails und erreicht laut Tencent bessere Ergebnisse als bisherige Lösungen. Die …

Weiterlesen …

Google Gemini Assistant erweitert Funktionen mit Multi-App-Unterstützung

Google hat bedeutende Aktualisierungen für seinen KI-Assistenten Gemini angekündigt, zeitgleich mit der Vorstellung des Samsung Galaxy S25. Die wichtigste Neuerung ermöglicht es Gemini, Aufgaben über mehrere Anwendungen hinweg in einer einzigen Interaktion auszuführen. Zudem wird Gemini der standardmäßige Assistent auf Samsungs neuen Flagship-Smartphones und ersetzt damit Bixby. Die erweiterte Gemini Live-Funktion unterstützt nun die Integration …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

Runways neuer KI-Bildgenerator ist auf den Filmlook spezialisiert

Das KI-Technologieunternehmen Runway hat einen neuen Bildgenerator namens Frames eingeführt. Wie Carl Franzen berichtet, richtet sich das Tool speziell an professionelle Kreativschaffende. Das System ist ab sofort über Runway-Abos verfügbar, die bei 95 Dollar pro Monat beginnen. Frames bietet 19 voreingestellte Bildstile und ermöglicht die Erstellung cinematischer Bilder mit präziser Stilkontrolle. Laut CEO Cristóbal Valenzuela …

Weiterlesen …

Luma AI zeigt neuen KI-Videogenerator Ray2

Luma AI hat ein neues KI-Videomodell namens Ray2 eingeführt, das verbesserte Bewegungsqualität und Physik-Simulation bietet. Wie Carl Franzen berichtet, wurde das neue Modell mit zehnfacher Rechenleistung im Vergleich zum Vorgänger trainiert. Laut Unternehmens-CEO Amit Jain ermöglicht Ray2 schnellere und natürlichere Bewegungsabläufe in generierten Videos. Das Modell ist über die „Dream Machine“-Plattform und mobile Apps für …

Weiterlesen …

Black Forest Labs stellt Finetune-API für KI-Bildgenerator vor

Black Forest Labs hat eine neue API-Technologie eingeführt, die es ermöglicht, KI-Bildgenerierungsmodelle mit nur fünf Trainingsbildern anzupassen. Wie Carl Franzen berichtet, erlaubt die FLUX Pro Finetuning API Nutzern, personalisierte Versionen der FLUX Pro und Ultra Modelle zu erstellen. Das System unterstützt verschiedene Modi für Charaktere, Produkte und Stilrichtungen. Die Ausgabeauflösung erreicht bis zu vier Megapixel. …

Weiterlesen …

MiniMax stellt Modell mit Rekord-Kontextfenster vor

Das Unternehmen MiniMax aus Singapur hat ein neues Open-Source-Sprachmodell vorgestellt, das bis zu 4 Millionen Token verarbeiten kann. Wie Carl Franzen in VentureBeat berichtet, übertrifft dies die bisherige Höchstmarke um das Doppelte. Das MiniMax-01 genannte Modell nutzt eine neuartige „Lightning Attention“-Architektur und ein System mit 32 Experten-Modulen. Die API-Nutzung kostet 0,2 Dollar pro Million Eingabe-Token, …

Weiterlesen …

ChatGPT kann nun regelmäßige Aufgaben umsetzen

OpenAI hat eine neue Beta-Funktion namens Tasks eingeführt, die es ChatGPT Plus-, Team- und Pro-Abonnenten ermöglicht, zukünftige Aktionen und Erinnerungen zu planen. Die Funktion, die im Januar 2024 eingeführt wurde, ermöglicht Nutzern das Einrichten von einmaligen und wiederkehrenden Aufgaben über den KI-Chatbot, wobei Benachrichtigungen über Web, Desktop und mobile Plattformen zugestellt werden. Zur Nutzung der …

Weiterlesen …

LlamaV-o1 macht seine Denkprozesse nachvollziehbar

Wissenschaftler der Mohamed bin Zayed University of Artificial Intelligence haben ein neues KI-Modell entwickelt, das seine Schlussfolgerungen transparent macht. Wie Michael Nuñez in VentureBeat berichtet, vereint LlamaV-o1 die Analyse von Bildern und Text mit einer schrittweisen Erklärung seiner Denkprozesse. Das Modell überzeugt bei komplexen Aufgaben wie der Interpretation von Finanzdiagrammen und medizinischen Bildern. Es erreichte …

Weiterlesen …

×