Google erweitert Gemini um Canvas und Audio Overview Funktionen

Google hat zwei neue Funktionen für seine KI-Plattform Gemini eingeführt, die deren Fähigkeiten als kollaboratives Werkzeug für die Inhaltserstellung und Informationsverarbeitung erweitern. Die am 18. März angekündigten Ergänzungen umfassen Canvas, einen interaktiven Arbeitsbereich für die Bearbeitung von Dokumenten und Code, sowie Audio Overview, das Dokumente in Podcast-ähnliche Diskussionen umwandelt.

Canvas: Ein kollaborativer Arbeitsbereich

Canvas bietet Nutzern einen speziellen Bereich innerhalb von Gemini, in dem sie schriftliche Inhalte und Code erstellen, verfeinern und teilen können. Die über die Eingabezeile in der Gemini-App verfügbare Funktion ermöglicht die Echtzeit-Bearbeitung von Dokumenten mit KI-Unterstützung. Nutzer können Textabschnitte markieren und Gemini bitten, spezifische Anpassungen an Tonfall, Länge oder Formatierung vorzunehmen.

Für Entwickler vereinfacht Canvas den Programmierprozess durch:

  • Generierung und Echtzeit-Vorschau von HTML/React-Code und Web-App-Prototypen
  • Interaktive Bearbeitung von Code mit sofortigem visuellen Feedback
  • Erstellung funktionierender Prototypen für Anwendungen, Spiele und Simulationen

Die Funktion ist als einheitliche Umgebung für Programmieraufgaben konzipiert und beseitigt die Notwendigkeit, zwischen mehreren Anwendungen zu wechseln. Fertiggestellte Projekte können mit einem Klick nach Google Docs exportiert werden, um die Zusammenarbeit fortzusetzen.

Audio Overview: Dokumente als Gespräche

Audio Overview, ursprünglich eine beliebte Funktion in Googles NotebookLM, wurde nun in Gemini integriert. Das Tool wandelt Dokumente, Präsentationen und Forschungsberichte in ansprechende, Podcast-ähnliche Diskussionen zwischen zwei KI-Moderatoren um.

Wenn Nutzer Dateien in Gemini hochladen, können sie die Audio Overview-Option wählen, um eine Audio-Diskussion zu erzeugen, die:

  • Die wichtigsten Punkte des Materials zusammenfasst
  • Die Informationen in einem Gesprächsformat präsentiert
  • Verbindungen zwischen verschiedenen Themen herstellt

Diese Funktion ist besonders nützlich, um komplexe Informationen beim Multitasking zu erfassen. Die generierten Audio-Diskussionen können heruntergeladen oder über die Gemini-App geteilt werden.

Verfügbarkeit und Einführung

Canvas wird weltweit für alle Gemini- und Gemini Advanced-Abonnenten in allen Sprachen eingeführt, in denen die App verfügbar ist. Audio Overview ist zunächst nur auf Englisch verfügbar, weitere Sprachen sind für zukünftige Veröffentlichungen geplant.

Diese Ergänzungen stehen für Googles Bemühungen, Gemini von einem einfachen Chatbot in eine umfassende Produktivitätssuite zu verwandeln, ähnlich den jüngsten Schritten von Wettbewerbern wie OpenAI mit ihrem eigenen Canvas-Tool und Anthropic mit Artifacts. Die neuen Funktionen sollen Gemini zu einem „noch effektiveren Mitarbeiter“ machen, so Dave Citron, Senior Director of Product Management für die Gemini-App.

Mehr zum Thema:

Bleib up-to-date: