Sky bringt KI-gestützte Automatisierung auf den Mac

Eine kommende Mac-Anwendung namens Sky verspricht, Desktop-Automatisierung durch eine Kombination aus KI und natürlicher Sprachverarbeitung zu revolutionieren. Die App wurde von den Entwicklern von Apples Shortcuts-App erstellt und ermöglicht es Nutzern, ihren Mac zu steuern und komplexe Aufgaben durch einfache Spracheingaben auszuführen. Federico Viticci von MacStories berichtet, dass Sky verstehen kann, welche Programme auf dem …

Weiterlesen …

Hume stellt EVI 3 vor mit individueller Stimmerstellung

Das New Yorker Startup Hume hat EVI 3 vorgestellt, ein KI-Modell für Gespräche, das Nutzern die Erstellung eigener synthetischer Stimmen über Spracheingabe ermöglicht. Die Technologie zielt auf Anwendungen vom Kundensupport bis zur virtuellen Begleitung ab, berichtet Carl Franzen für VentureBeat. Nutzer können Persönlichkeitsmerkmale, Stimmqualitäten und emotionale Töne festlegen. So entstehen Stimmen von warmherzigen Begleitern bis …

Weiterlesen …

Mystic Moose stellt MovieFlo.AI für nutzergenierte Filme vor

Das Bostoner Unternehmen Mystic Moose hat MovieFlo.AI vorgestellt, eine KI-Plattform zur Erstellung von Animationsfilmen und Videos aus Geschichtsideen. Das Tool richtet sich an Anime-Ersteller, Filmemacher und Content-Ersteller ohne traditionelle Produktionsressourcen. Dean Takahashi berichtet über die Markteinführung für VentureBeat. Die Plattform bietet einen integrierten Arbeitsablauf von der Drehbuchentwicklung bis zur finalen Videoproduktion. Nutzer können Charaktere generieren, …

Weiterlesen …

DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. …

Weiterlesen …

Startup Akool stellt KI-Tool für Live-Videos vor

Das kalifornische Unternehmen Akool hat Live Camera vorgestellt, ein KI-System für fotorealistische Avatare und Sprachübersetzungen in Videoanrufen. Die Technologie ermöglicht es Nutzern, als digitale Avatare zu erscheinen und dabei natürliche Mimik und Gestik beizubehalten, berichtet Dean Takahashi für GamesBeat. „Wir möchten erreichen, dass man den Avatar nicht von einer echten Person unterscheiden kann“, sagte CEO …

Weiterlesen …

Anthropic führt Sprachmodus für Claude-App ein

Anthropic hat einen Sprachmodus für seinen Claude-Chatbot auf mobilen Geräten gestartet. Die Funktion ermöglicht gesprochene Unterhaltungen mit Claude auf Englisch. Der Rollout soll über die nächsten Wochen erfolgen. Der Sprachmodus läuft auf Anthropics Claude Sonnet 4 Modell und bietet fünf Stimm-Optionen namens „Buttery, Airy, Mellow, Glassy und Rounded.“ Nutzer können während Gesprächen zwischen Text und …

Weiterlesen …

Google stellt schnelle Text-KI mit Diffusion-Technologie vor

Google präsentierte auf seiner I/O-Entwicklerkonferenz Gemini Diffusion und markiert damit einen wichtigen Wandel in der Texterzeugung von KI-Modellen. Das experimentelle Modell nutzt Diffusion-Technologie anstelle des traditionellen Transformer-Ansatzes, der ChatGPT und ähnliche Systeme antreibt. Der Hauptvorteil ist die Geschwindigkeit. Gemini Diffusion erzeugt Text mit 857 bis 2.000 Token pro Sekunde und damit vier- bis fünfmal schneller …

Weiterlesen …

Weitere Details zu OpenAIs kommendem Gadget

Wie berichtet: OpenAI hat Jony Ives Designfirma io für 6,5 Milliarden Dollar übernommen, um neue KI-Hardware zu entwickeln. Laut Berichten des Wall Street Journal und anderen Quellen arbeiten CEO Sam Altman und der ehemalige Apple-Designer Ive an einer „Gerätefamilie“, die einen neuen Ansatz für KI-Interaktion darstellen soll. In einem Mitarbeitertreffen bezeichnete Altman das Projekt als …

Weiterlesen …

Anthropic Claude 4: rekordverdächtige Programmierfähigkeiten und Langzeitleistung

Anthropic hat seine neuesten KI-Modelle, Claude Opus 4 und Claude Sonnet 4, veröffentlicht, die neue Maßstäbe für Programmierfähigkeiten und anhaltende Leistung bei komplexen Aufgaben setzen. Die Claude 4-Familie ist ein bedeutender Fortschritt bei KI-Fähigkeiten, wobei Opus 4 die Fähigkeit demonstriert, bis zu sieben Stunden kontinuierlich an komplexen Programmieraufgaben zu arbeiten, ohne den Fokus zu verlieren. …

Weiterlesen …

Google zeigt neue Video- und Bild-KI Veo 3 und Imagen 4

Google hat sein Angebot im Bereich generativer KI-Tools aktualisiert und erweitert: Neu sind Veo 3, Imagen 4 und das Filmwerkzeug Flow. Veo 3, das neueste Videogenerierungsmodell des Unternehmens, integriert Audiofunktionen wie Dialoge zwischen Charakteren und Umgebungsgeräusche wie Verkehrslärm oder Vogelgesang. Diese Funktion unterscheidet es von Wettbewerbern wie OpenAIs Sora. Laut Eli Collins, VP bei Google …

Weiterlesen …