Cohere stellt Aya Vision vor, ein mehrsprachiges Bildverarbeitungsmodell

Die Forschungsabteilung von Cohere hat Aya Vision eingeführt, ein Bildverarbeitungsmodell mit offenen Gewichten, das 23 Sprachen unterstützt. Laut VentureBeat-Bericht von Carl Franzen gibt es das Modell in Versionen mit 8 und 32 Milliarden Parametern. Es kann Bilder analysieren, Text generieren und visuelle Inhalte übersetzen. Aya Vision übertrifft größere Modelle wie Llama 90B bei geringerem Ressourcenbedarf. …

Weiterlesen …

Google Gemini erhält neue Interaktionen für Videos und Bildschirminhalte

Google erweitert seinen KI-Assistenten Gemini mit neuen Interaktionsmöglichkeiten für Videos und Bildschirminhalte. Wie Ivan Mehta von TechCrunch berichtet, ermöglicht die „Screenshare“-Funktion Nutzern, ihren Smartphone-Bildschirm mit Gemini zu teilen und dazu Fragen zu stellen. So können beispielsweise Einkaufende Empfehlungen erhalten, welche Kleidungsstücke zu ausgewählten Artikeln passen würden. Zudem wird es möglich sein, Gemini während der Videoaufnahme …

Weiterlesen …

Microsoft bringt Copilot-App für Mac mit neuen Funktionen

Microsoft hat eine native Copilot-App für macOS-Nutzer in den USA, Großbritannien und Kanada veröffentlicht. Tom Warren von The Verge berichtet, dass die App Zugang zum webbasierten KI-Assistenten von Microsoft bietet. Nutzer können damit Bilder und Texte generieren oder Bilder hochladen. Die Mac-Version verfügt über einen Dunkelmodus und lässt sich mit Command + Space aktivieren, ähnlich …

Weiterlesen …

Sesame zeigt KI-Assistenten mit natürlicher Gesprächspräsenz

Sesame, ein Startup unter der Leitung des Oculus-Mitbegründers Brendan Iribe, hat einen neuen KI-Sprachassistenten namens Maya vorgestellt, der darauf abzielt, „das Uncanny Valley der Konversationssprache“ zu überwinden. Laut eines kürzlich erschienenen Artikels des Technologiejournalisten Sean Hollister bietet Maya natürlichere und ansprechendere Gespräche im Vergleich zu bestehenden Sprachassistenten wie Amazon’s Alexa oder Google’s Gemini. Das Unternehmen …

Weiterlesen …

Microsoft macht Voice und Think Deeper für alle Copilot-Nutzer verfügbar

Microsoft bietet ab sofort unbegrenzten Zugang zu den Funktionen Voice und Think Deeper kostenlos für alle Copilot-Nutzer an. Das Copilot-Team stellte diese erweiterten Fähigkeiten vor, um den KI-Assistenten weiterzuentwickeln. Voice ermöglicht ausgedehnte Sprachgespräche mit der KI. Think Deeper, das auf OpenAIs o1-Modell basiert, bewältigt komplexe Denkaufgaben. Bisher stießen Nutzer bei diesen Funktionen auf Nutzungsbeschränkungen. Das …

Weiterlesen …

Amazon stellt Alexa+ mit erweiterten KI-Fähigkeiten vor

Amazon hat Alexa+ vorgestellt, ein bedeutendes Upgrade seines Sprachassistenten mit fortschrittlicher KI. Diese überarbeitete Version zeigte das Unternehmen bei einer Pressekonferenz in New York City und ist die umfassendste Überarbeitung der Plattform seit ihrer Einführung vor über einem Jahrzehnt. Alexa+ verwendet einen von Amazon als „modellagnostisch“ beschriebenen Ansatz mit einem ausgeklügelten Routing-System, das für jede …

Weiterlesen …

OpenAI stellt GPT-4.5-Modell vor

OpenAI hat offiziell GPT-4.5 eingeführt, sein neuestes und größtes KI-Sprachmodell. Das intern zuvor als „Orion“ bekannte Modell wird als Forschungsvorschau veröffentlicht und verspricht verbesserte Gesprächsfähigkeiten, reduzierte Halluzinationsraten und eine verbesserte emotionale Intelligenz im Vergleich zu früheren Modellen. Während OpenAI GPT-4.5 als „größtes und bestes Modell für Chat“ positioniert, räumt das Unternehmen ein, dass es kein …

Weiterlesen …

Claude 3.7 Sonnet hat stufenlose Reasoning-Funktion integriert

Anthropic hat mit Claude 3.7 Sonnet ein neues KI-Modell vorgestellt, das als erstes hybrides Reasoning-Modell sowohl schnelle Antworten als auch ausführliche Analysen ermöglicht. Benutzer können zwischen sofortigen Antworten und gründlicherer Verarbeitung wählen, wobei API-Nutzer die Reasoning-Phase bis zu 128.000 Token präzise steuern können. Zentrale Eigenschaften und Fähigkeiten Das neue Modell behält Anthropics bestehende Preisstruktur von …

Weiterlesen …

Französischer KI-Chatbot Le Chat erreicht eine Million Downloads

Der KI-Chatbot Le Chat des französischen Unternehmens Mistral verzeichnet eine Million Downloads innerhalb von 14 Tagen nach der Markteinführung. Dies berichtet Romain Dillet für TechCrunch. Die Anwendung stieg schnell zur meistgeladenen kostenlosen App im französischen iOS App Store auf. Staatspräsident Emmanuel Macron sprach sich öffentlich für Le Chat aus. Die App tritt in einen Markt …

Weiterlesen …

Fiverr führt KI-System zur Automatisierung von Freelancer-Arbeit ein

Die Gig-Economy-Plattform Fiverr startet ein neues System, mit dem Freelancer KI auf Basis ihrer bisherigen Arbeiten trainieren können, berichtet TechCrunch. Das „Personal AI Creation Model“ ermöglicht es demnach freiberuflichen Kreativen, ihre Dienste wie Grafikdesign oder Sprachaufnahmen teilweise zu automatisieren. Der Dienst kostet 25 Dollar pro Monat und steht zunächst ausgewählten Nutzern zur Verfügung. Wie Firmenchef …

Weiterlesen …

×