OpenAI rollt Advanced Voice Mode aus

OpenAI führt den Advanced Voice Mode (AVM) für zahlende ChatGPT-Nutzer ein. Die Funktion wird zunächst für Plus- und Team-Abonnenten in den USA verfügbar sein, gefolgt von Enterprise- und Edu-Kunden in der kommenden Woche. AVM präsentiert sich mit einer neuen Benutzeroberfläche, die durch eine blaue animierte Kugel dargestellt wird. Neben dem überarbeiteten Design bietet OpenAI fünf …

Weiterlesen …

Cloudflare will Websites vor KI-Bots schützen

Cloudflare führt neue Werkzeuge ein, um Websites vor KI-Bots zu schützen und deren Scraping zu kontrollieren. Das Unternehmen bietet allen Kunden, auch den 33 Millionen kostenlosen Nutzern, eine Überwachung und selektive Blockierung von KI-Daten-Scraping-Bots an. CEO Matthew Prince erklärt, dass diese Maßnahmen den Websitebetreibern mehr Kontrolle darüber geben sollen, wie und wann KI-Bots ihre Inhalte …

Weiterlesen …

Molmo soll KI-Agenten verbessern

Ein neues Open-Source-KI-Modell namens Molmo könnte die Entwicklung von KI-Agenten vorantreiben. Das vom Allen Institute for AI (Ai2) entwickelte Modell kann Bilder interpretieren und über eine Chat-Schnittstelle kommunizieren. Laut Will Knight von Wired ermöglicht dies KI-Agenten, Aufgaben wie Websurfen oder Dokumentenerstellung auszuführen. In einigen Benchmarks übertrifft es führende proprietäre Modelle wie GPT-4o von OpenAI, Claude …

Weiterlesen …

Umfangreiche Updates für Google Gemini

Google hat heute umfangreiche Aktualisierungen für seine KI-Plattform Gemini angekündigt. Die Modelle Gemini-1.5-Pro-002 und Gemini-1.5-Flash-002 wurden verbessert und bieten nun eine höhere Qualität bei mathematischen Aufgaben, Langzeitkontexten und visuellen Anwendungen. Gleichzeitig senkt Google die Preise für Gemini 1.5 Pro um mehr als 50% und erhöht die Limits deutlich. Eine wesentliche Neuerung ist die Integration der …

Weiterlesen …

Duolingo bietet Videoanrufe mit einem KI-Charakter

Duolingo führt neue KI-gestützte Funktionen ein, um das Sprachenlernen zu verbessern. Das Unternehmen präsentierte auf seiner jährlichen Duocon 2024-Konferenz die Features „Video Call“ und „Adventures“. Wie CEO Luis von Ahn erklärt, sollen diese Innovationen immersive Lernmöglichkeiten schaffen. „Video Call“ ermöglicht Duolingo Max-Abonnenten realistische Gespräche mit dem KI-Charakter Lily. „Adventures“ wiederum ist ein Erkundungsspiel, das Lernende …

Weiterlesen …

Rep.ai erstellt „digitale Zwillinge“ von Verkaufsberatern

Das KI-Startup Rep.ai hat 7,5 Millionen US-Dollar Finanzierung erhalten, um seine „digitale Zwillings“-Technologie für Verkaufsberatern zu starten. Das berichtet Michael Nuñez für VentureBeat. Die Firma, früher als ServiceBell bekannt, entwickelt KI-gesteuerte Avatare, die Websitebesucher in Echtzeit-Video- und Audiogesprächen betreuen sollen. Rep.ai kombiniert dafür visuelle und stimmliche Nachbildung mit natürlicher Sprachverarbeitung, die zudem auf Marketingmaterialien des …

Weiterlesen …

NotePin transkribiert Gespräche auf Knopfdruck

Ein neues KI-gestütztes Aufnahmegerät namens NotePin von Plaud.AI erleichtert das Erstellen von Gesprächsnotizen. Brian Heater schreibt für TechCrunch über seine Erfahrungen. Demnach benötigt das 169 Dollar teure Gerät nur wenig Platz im Gepäck und zeichnet Gespräche per Knopfdruck auf. Die Aufnahmen werden in Echtzeit aufs Smartphone übertragen und lassen sich dort mit ChatGPT transkribieren und …

Weiterlesen …

Amazons neuer Videogenerator im Betatest für Werbetreibende

Amazon hat einen KI-gestützten Videogenerator vorgestellt – allerdings nur für Werbetreibende. Das berichtet Kyle Wiggers für TechCrunch. Das Tool kann aus einem einzelnen Produktbild kurze Werbeclips erstellen und befindet sich derzeit in der Beta-Phase für ausgewählte US-Werbetreibende. Die generierten Videos sind sechs bis neun Sekunden lang und haben eine Auflösung von 720p. Nutzer erhalten vier …

Weiterlesen …

Scramble will eine Grammarly-Alternative werden

Das KI-Tool Scramble integriert sich als Extension im Chrome-Browser. Nach der Installation markiert man den fraglichen Text, wählt im Kontextmenü „Scramble“ aus und bekommt Vorschläge für Verbesserungen. Laut der offiziellen GitHub-Seite des Projekts will es eine flexiblere und die Privatsphäre schützende Alternative zu Grammarly sein. Vor allem das Argument der Privatsphäre greift zum jetzigen Stand …

Weiterlesen …

WonderWorld erstellt interaktive 3D-Szenen

Mit WonderWorld lassen sich interaktive 3D-Szenen aus einem einzigen Bild generieren. Es ist das Ergebnis einer Forschungsarbeit der Stanford University und des MIT. WonderWorld ermöglicht es Nutzern demnach, Szeneninhalte und -layouts in Echtzeit festzulegen und die erstellten 3D-Welten mit geringer Latenz zu erkunden. Kernstück ist eine neue Darstellungsform namens „Fast LAyered Gaussian Surfels“ (FLAGS), die …

Weiterlesen …