Microsoft bietet OpenAIs Sora-Videogenerator kostenlos an

Microsoft bietet OpenAIs KI-Videogenerator Sora kostenlos an: über seine Bing Video Creator-Funktion auf Mobilgeräten. Das Tool erstellt fünf Sekunden lange Videos aus Textbeschreibungen, ohne teure ChatGPT-Abonnements zu benötigen, die bis zu 200 Dollar monatlich kosten, berichtet Carl Franzen. Nutzer können die Funktion über die Bing-App auf iOS- und Android-Geräten weltweit nutzen, außer in China und …

Weiterlesen …

Google veröffentlicht App für lokale AI-Modelle auf Android

Google hat eine experimentelle Android-App namens AI Edge Gallery veröffentlicht, mit der Nutzer KI-Modelle direkt auf ihren Smartphones ohne Internetverbindung ausführen können. Die App ist über GitHub verfügbar und kommt später auch für iOS-Geräte. Nutzer können AI-Modelle von der Hugging Face-Plattform herunterladen und ausführen, um Aufgaben wie Bildanalyse, Textgenerierung und Programmier-Unterstützung zu erledigen. Die gesamte …

Weiterlesen …

Flux-Kontext kann Bilder erzeugen und per Textbefehl bearbeiten

Black Forest Labs hat FLUX.1 Kontext veröffentlicht, eine neue Familie von KI-Modellen, die Bilder sowohl generieren als auch bearbeiten können. Das deutsche Startup kündigte am Donnerstag die Technologie an, die sowohl Text-Prompts als auch Referenzbilder als Input akzeptiert. Das Unternehmen bietet zwei Hauptversionen des Modells an. FLUX.1 Kontext [pro] ermöglicht es Nutzern, Bilder zu generieren …

Weiterlesen …

Sky bringt KI-gestützte Automatisierung auf den Mac

Eine kommende Mac-Anwendung namens Sky verspricht, Desktop-Automatisierung durch eine Kombination aus KI und natürlicher Sprachverarbeitung zu revolutionieren. Die App wurde von den Entwicklern von Apples Shortcuts-App erstellt und ermöglicht es Nutzern, ihren Mac zu steuern und komplexe Aufgaben durch einfache Spracheingaben auszuführen. Federico Viticci von MacStories berichtet, dass Sky verstehen kann, welche Programme auf dem …

Weiterlesen …

Hume stellt EVI 3 vor mit individueller Stimmerstellung

Das New Yorker Startup Hume hat EVI 3 vorgestellt, ein KI-Modell für Gespräche, das Nutzern die Erstellung eigener synthetischer Stimmen über Spracheingabe ermöglicht. Die Technologie zielt auf Anwendungen vom Kundensupport bis zur virtuellen Begleitung ab, berichtet Carl Franzen für VentureBeat. Nutzer können Persönlichkeitsmerkmale, Stimmqualitäten und emotionale Töne festlegen. So entstehen Stimmen von warmherzigen Begleitern bis …

Weiterlesen …

Mystic Moose stellt MovieFlo.AI für nutzergenierte Filme vor

Das Bostoner Unternehmen Mystic Moose hat MovieFlo.AI vorgestellt, eine KI-Plattform zur Erstellung von Animationsfilmen und Videos aus Geschichtsideen. Das Tool richtet sich an Anime-Ersteller, Filmemacher und Content-Ersteller ohne traditionelle Produktionsressourcen. Dean Takahashi berichtet über die Markteinführung für VentureBeat. Die Plattform bietet einen integrierten Arbeitsablauf von der Drehbuchentwicklung bis zur finalen Videoproduktion. Nutzer können Charaktere generieren, …

Weiterlesen …

DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. …

Weiterlesen …

Startup Akool stellt KI-Tool für Live-Videos vor

Das kalifornische Unternehmen Akool hat Live Camera vorgestellt, ein KI-System für fotorealistische Avatare und Sprachübersetzungen in Videoanrufen. Die Technologie ermöglicht es Nutzern, als digitale Avatare zu erscheinen und dabei natürliche Mimik und Gestik beizubehalten, berichtet Dean Takahashi für GamesBeat. „Wir möchten erreichen, dass man den Avatar nicht von einer echten Person unterscheiden kann“, sagte CEO …

Weiterlesen …

Anthropic führt Sprachmodus für Claude-App ein

Anthropic hat einen Sprachmodus für seinen Claude-Chatbot auf mobilen Geräten gestartet. Die Funktion ermöglicht gesprochene Unterhaltungen mit Claude auf Englisch. Der Rollout soll über die nächsten Wochen erfolgen. Der Sprachmodus läuft auf Anthropics Claude Sonnet 4 Modell und bietet fünf Stimm-Optionen namens „Buttery, Airy, Mellow, Glassy und Rounded.“ Nutzer können während Gesprächen zwischen Text und …

Weiterlesen …

Google stellt schnelle Text-KI mit Diffusion-Technologie vor

Google präsentierte auf seiner I/O-Entwicklerkonferenz Gemini Diffusion und markiert damit einen wichtigen Wandel in der Texterzeugung von KI-Modellen. Das experimentelle Modell nutzt Diffusion-Technologie anstelle des traditionellen Transformer-Ansatzes, der ChatGPT und ähnliche Systeme antreibt. Der Hauptvorteil ist die Geschwindigkeit. Gemini Diffusion erzeugt Text mit 857 bis 2.000 Token pro Sekunde und damit vier- bis fünfmal schneller …

Weiterlesen …