ElevenLabs startet KI-gestütztes Podcast-Produktionssystem

Das Technologie-Startup ElevenLabs hat ein neues KI-System zur Podcast-Erstellung vorgestellt. Wie Ashley Carman für Bloomberg berichtet, ermöglicht die Software die Umwandlung von Textdokumenten in Podcasts mit künstlichen Stimmen. Das System unterstützt 32 Sprachen und bietet Zugriff auf tausende KI-generierte Stimmen. Benutzer können Transkripte bearbeiten und Audiodateien in hoher Qualität exportieren. Das in New York ansässige …

Weiterlesen …

X (ehemals Twitter) führt KI-Bildgenerator Aurora ein

Der Social-Media-Dienst X (ehemals Twitter) hat einen neuen KI-Bildgenerator namens Aurora eingeführt. Wie Tech-Journalist Kyle Wiggers für TechCrunch berichtet, wurde das Tool am Samstag freigeschaltet, war jedoch kurzzeitig für einige Nutzer nicht verfügbar. Aurora ist in den Grok-Assistenten integriert und kann fotorealistische Bilder erstellen. Das System erlaubt die Generierung von Bildern öffentlicher Personen und urheberrechtlich …

Weiterlesen …

KI-Vergleichstest zeigt geringen Vorsprung von o1 Pro

Ein ausführlicher Vergleich zweier KI-Sprachmodelle zeigt überraschende Ergebnisse im Preis-Leistungs-Verhältnis. Reddit-Nutzer Kakachia777 testete die Systeme o1 Pro und Claude Sonnet 3.5 über acht Stunden in verschiedenen Anwendungsbereichen. Der zehnfache Preisunterschied spiegelt sich dabei nicht in der Leistung wider. Die Testergebnisse zeigen, dass o1 Pro für 200 Dollar pro Monat zwar bei wissenschaftlichen Aufgaben und Bildanalyse …

Weiterlesen …

Metas KI-Modell mit GPT-4-Leistung läuft auf High-End Notebooks

Meta hat mit Llama 3.3 70B ein neues KI-Sprachmodell vorgestellt, das auf leistungsstarken Notebooks läuft und dabei eine Leistung auf GPT-4-Niveau erreicht. Das berichtet Simon Willison. Er testete das Modell erfolgreich auf einem MacBook Pro M2 mit 64 GB RAM und benötigt etwa 42 GB Speicherplatz für die Installation. In unabhängigen Tests durch LiveBench erreichte …

Weiterlesen …

OpenAI veröffentlicht KI-Videogenerator Sora für zahlende Abonnenten

OpenAI hat seinen KI-gestützten Videogenerator Sora veröffentlicht, der nun für ChatGPT Plus- und Pro-Abonnenten über eine eigene Website verfügbar ist. Die Ankündigung erfolgte im Rahmen der „12 Days of OpenAI“-Serie, wobei eine verbesserte Version namens Sora Turbo vorgestellt wurde, die im Vergleich zum im Februar 2024 präsentierten Modell eine höhere Geschwindigkeit bietet. Die Technologie ermöglicht …

Weiterlesen …

OpenAI veröffentlicht o1 und startet „ChatGPT Pro“-Abonnement

OpenAI hat die vollständige Version seines o1-Reasoning-Modells offiziell eingeführt und beendet damit die Vorschauphase. Das Modell, intern als ‚Strawberry‘ bekannt, bietet verbesserte Fähigkeiten in den Bereichen Programmierung, Mathematik und Bildanalyse. Das Unternehmen gibt an, dass die Fehlerrate bei komplexen Problemen im Vergleich zur Vorschauversion um 34% reduziert wurde. Das Technologieunternehmen führt eine neue Abonnementstufe namens …

Weiterlesen …

Amazon stellt neue KI-Modellfamilie Nova für Text-, Bild- und Videogenerierung vor

Amazon Web Services hat Nova vorgestellt, eine neue Familie von künstlichen Intelligenzmodellen für die Generierung von Text, Bildern und Videos. Die Ankündigung erfolgte durch CEO Andy Jassy auf der AWS re:Invent Konferenz im Dezember 2024. Die Nova-Familie umfasst vier textgenerierende Modelle: Micro, Lite, Pro und Premier. Micro, Lite und Pro sind sofort für AWS-Kunden verfügbar, …

Weiterlesen …

Googles neue KI löst Bedenken aus

Google hat ein neues KI-Modell namens PaLiGemma 2 vorgestellt, das laut Unternehmensangaben menschliche Emotionen in Bildern erkennen kann, wie Kyle Wiggers für TechCrunch berichtet. Das System muss speziell trainiert werden, um Emotionen zu erkennen, was bei Experten für KI-Ethik erhebliche Bedenken auslöst. Wissenschaftler kritisieren, dass die Technologie auf umstrittenen psychologischen Theorien basiert. Die Emotionserkennung könnte …

Weiterlesen …

Google DeepMind Genie 2 generiert interaktive 3D-Umgebungen

DeepMind hat Genie 2 vorgestellt, ein künstliches Intelligenz-Modell, das aus einzelnen Bildern und Textbeschreibungen spielbare 3D-Umgebungen erschaffen kann. Es stellt eine Weiterentwicklung gegenüber seinem Vorgänger Genie 1 dar, der auf 2D-Welten beschränkt war. Laut DeepMind kann Genie 2 interaktive Umgebungen generieren, die auf Tastatur- und Mauseingaben reagieren und es Benutzern oder KI-Agenten ermöglichen, Charaktere innerhalb …

Weiterlesen …

Google stellt KI-Videogenerator Veo für Geschäftskunden vor

Google hat sein neues KI-Modell Veo zur Videogenerierung über die Vertex AI-Plattform verfügbar gemacht. Das Modell kann hochauflösende 1080p-Videos aus Text- oder Bildvorgaben in verschiedenen visuellen Stilen erstellen, wobei die Clips länger als eine Minute sein können. Die Technologie verfügt laut Google über eingebaute Schutzmechanismen gegen schädliche Inhalte und Urheberrechtsverletzungen. Alle von Veo produzierten Inhalte …

Weiterlesen …