Google erweitert Gemini um Canvas und Audio Overview Funktionen

Google hat zwei neue Funktionen für seine KI-Plattform Gemini eingeführt, die deren Fähigkeiten als kollaboratives Werkzeug für die Inhaltserstellung und Informationsverarbeitung erweitern. Die am 18. März angekündigten Ergänzungen umfassen Canvas, einen interaktiven Arbeitsbereich für die Bearbeitung von Dokumenten und Code, sowie Audio Overview, das Dokumente in Podcast-ähnliche Diskussionen umwandelt. Canvas: Ein kollaborativer Arbeitsbereich Canvas bietet …

Weiterlesen …

Baidu stellt neue KI-Modelle ERNIE 4.5 und X1 zu niedrigeren Kosten vor

Der chinesische Internetkonzern Baidu hat zwei neue KI-Modelle veröffentlicht: ERNIE 4.5 für multimodale Sprachverarbeitung und ERNIE X1 für komplexes Reasoning. Laut Carl Franzen bei VentureBeat übertreffen die Modelle Konkurrenten wie DeepSeek und OpenAI bei verschiedenen Benchmark-Tests. Die Preisgestaltung ist besonders bemerkenswert: ERNIE 4.5 kostet 99% weniger als OpenAIs GPT-4.5. Zu den Einschränkungen zählen ein kleines …

Weiterlesen …

Mistral AI veröffentlicht kleines, leistungsstarkes Open-Source-Modell

Mistral AI hat ein neues Open-Source-KI-Modell namens Mistral Small 3.1 veröffentlicht, das mit nur 24 Milliarden Parametern arbeitet. Laut eines Artikels von Michael Nuñez übertrifft das Modell größere Konkurrenzprodukte wie GPT-4o Mini. Das französische Startup gibt an, dass ihr Modell Text und Bilder verarbeiten kann, mehrsprachig ist und ein Kontextfenster von 128.000 Token bietet. Mistral …

Weiterlesen …

Moonvalleys KI-Videomodell wurde ausschließlich mit lizenzierten Daten trainiert

Moonvalley hat mit Marey ein neues KI-Videomodell eingeführt, das nur mit legal erworbenen und lizenzierten Inhalten trainiert wurde. Wie Carl Franzen von VentureBeat berichtet, adressiert dieser Ansatz die Urheberrechtsprobleme vieler konkurrierender KI-Videomodelle, die auf gescrapten Webinhalten basieren. Moonvalley-CEO Naeem Talukdar erklärte: „Leute sagten, es sei technisch nicht möglich, ein modernes KI-Videomodell ohne gescrapte Daten zu …

Weiterlesen …

Google ersetzt Assistant mit Gemini auf Mobilgeräten

Google hat angekündigt, seinen Google Assistant auf den meisten mobilen Geräten bis Ende 2025 durch Gemini zu ersetzen. Dieser Übergang, der für Millionen von Nutzern bereits begonnen hat, stellt laut Google einen „Plattformwechsel“ dar, der durch generative KI-Technologie vorangetrieben wird. Was sich ändert Google Assistant, den das Unternehmen 2016 mit Funktionen zur Verarbeitung natürlicher Sprache …

Weiterlesen …

Snapchat führt KI-gesteuerte Videoeffekte für Premium-Nutzer ein

Snapchat hat seine ersten KI-basierten Lenses für Video veröffentlicht, die von einem hauseigenen generativen Modell angetrieben werden. Wie Aisha Malik von TechCrunch berichtet, stehen diese neuen Funktionen ausschließlich Snapchat+-Abonnenten zur Verfügung, die monatlich 15,99 Dollar zahlen. Die Erstveröffentlichung umfasst drei Varianten: „Waschbär“, „Fuchs“ und „Frühlingsblumen“, wobei wöchentlich weitere folgen sollen. Nutzer können auf diese Effekte …

Weiterlesen …

Google führt personalisierte Gemini-Antworten auf Basis der Suchhistorie ein

Google hat eine neue experimentelle Funktion für seinen KI-Assistenten Gemini eingeführt, die Antworten auf Basis der Suchhistorie und anderer Google-Dienste personalisiert. Dave Citron, Senior Director of Product Management für die Gemini-App, erklärt, dass diese Funktion Gemini zu einem „persönlichen KI-Assistenten“ machen soll, der individuelle Nutzer versteht, anstatt nur allgemeine Fragen zu beantworten. Die Funktion wird …

Weiterlesen …

Google stellt Deep-Research-Funktion allen Nutzern zur Verfügung

Google hat seine Deep-Research-Funktion für alle Gemini-Nutzer kostenlos in über 45 Sprachen zugänglich gemacht. Wie Igor Bonifacic berichtet, war zuvor ein Gemini-Advanced-Abonnement erforderlich. Das Tool erstellt umfassende Berichte zu komplexen Themen. Die Funktion läuft jetzt auf dem neuen Gemini 2.0 Flash Thinking Experimental Modell, das Probleme in Zwischenschritte zerlegt und dadurch bessere Rechercheergebnisse liefert. Google …

Weiterlesen …

Google führt native Bilderzeugung in Gemini 2.0 Flash ein

Google hat einen in Gemini 2.0 Flash integrierten KI-Bildgenerator bekannt gegeben, die jetzt für Entwickler über Google AI Studio und die Gemini API verfügbar sind. Google ist damit das erste große US-Technologieunternehmen, das eine solche multimodale Bilderzeugung direkt in einem Modell für Endverbraucher integriert hat. Im Gegensatz zu früheren Ansätzen, bei denen Sprachmodelle mit separaten …

Weiterlesen …

Googles Gemma 3 läuft auf einer einzelnen GPU oder TPU

Google hat Gemma 3 angekündigt, seine neueste Sammlung von Open-Source-KI-Modellen. Sie wurden mit der gleichen Technologie entwickelt, die auch die Gemini 2.0-Modelle antreibt. Gemma 3 ist speziell dafür konzipiert, effizient auf einer einzelnen GPU oder TPU zu laufen, was es für Entwickler mit begrenzten Hardware-Ressourcen zugänglich macht. Die neue Modellfamilie kommt in vier Größen: 1B, …

Weiterlesen …