„Computer Use“: Anthropics Claude kann jetzt deinen PC steuern

Anthropic hat eine aktualisierte Version seines KI-Modells Claude 3.5 Sonnet vorgestellt. Laut Unternehmensangaben kann das Modell nun Desktop-Anwendungen steuern und PC-Aufgaben ausführen. Dafür nutzt es eine neue „Computer Use“-API, die sich in der öffentlichen Beta-Phase befindet. Anthropic betont, dass die Technologie noch fehlerbehaftet sei und empfiehlt Entwicklern, zunächst nur risikoarme Aufgaben damit zu testen. Neben …

Weiterlesen …

Stable Diffusion 3.5 ist die neueste Version der Open-Source-Bild-KI

Stability AI hat seine neueste Familie von Bildgenerierungsmodellen vorgestellt: Stable Diffusion 3.5. Laut Unternehmensangaben umfasst sie drei Varianten – Large, Large Turbo und Medium – die sich durch verbesserte Anpassungsfähigkeit und Vielseitigkeit auszeichnen sollen. Die Large-Variante mit 8 Milliarden Parametern ist ab sofort verfügbar, während das Medium-Modell am 29. Oktober veröffentlicht werden soll. Das Unternehmen …

Weiterlesen …

CrewAI Enterprise ist eine neue Plattform für KI-Agenten

Das Startup CrewAI bringt mit „CrewAI Enterprise“ eine neue Plattform auf den Markt, mit der Unternehmen KI-Agenten-Teams erstellen und einsetzen können. Wie Gründer João Moura gegenüber VentureBeat erklärte, vereinfacht das System den Aufbau und die Implementierung von Multi-Agenten-Systemen deutlich. Die Plattform basiert auf dem beliebten Open-Source-Framework von CrewAI und erlaubt Nutzern, KI-Agenten mit verschiedenen Sprachmodellen …

Weiterlesen …

Genmo Mochi 1 ist eine neue Open-Source-Video-KI

Genmo hat Mochi 1 veröffentlicht, ein Open-Source-KI-Modell, das aus Textbefehlen qualitativ hochwertige Videos generiert. Du kannst es auf dieser Seite kostenlos ausprobieren. Laut VentureBeat kann Genmo mit führenden proprietären Modellen wie Gen-3 Alpha von Runway und Dream Machine von Luma AI mithalten. Mochi 1 ist unter der Apache 2.0-Lizenz verfügbar und bietet den Nutzern im …

Weiterlesen …

Qualcomms Snapdragon 8 Elite bringt KI aufs Smartphone

Qualcomm hat den Snapdragon 8 Elite vorgestellt, der laut Unternehmen die schnellste mobile CPU der Welt ist. Der Chipsatz verfügt über Qualcomms Oryon-CPU der zweiten Generation und soll eine neue Ära der On-Device-KI einläuten. Wie Dean Takahashi für VentureBeat berichtet, ermöglicht der Prozessor komplexe multimodale KI-Anwendungen direkt auf dem Smartphone, wobei der Datenschutz im Vordergrund …

Weiterlesen …

ComfyUI V1: KI-Bilder direkt auf dem eigenen Rechner generieren

Die KI-Bildgenerierungssoftware ComfyUI ist in der Version 1.0 erschienen und bietet nun eine Desktop-Version für Windows, macOS und Linux. Zum Hintergrund: ComfyUI ermöglicht es dir, komplexe Bildgenerierungspipelines direkt auf dem eigenen Rechner umzusetzen. Im Gegensatz zu Cloud-basierten Lösungen bietet die Software volle Kontrolle über den Prozess und die eigenen Daten. Die brandneue Desktop-Version befindet sich …

Weiterlesen …

Microsoft zeigt KI-Agenten für Unternehmen

Microsoft präsentiert neue autonome KI-Agenten für seine Geschäftsanwendungen Dynamics 365. Laut eines Berichts von Todd Bishop auf GeekWire sollen diese Agenten Aufgaben selbstständig erledigen und Geschäftsprozesse überwachen. Die Ankündigung erfolgte auf Microsofts „AI Tour“ in London. Microsoft betont, dass die Agenten wie neue Apps für eine KI-gesteuerte Welt funktionieren und im Auftrag einer Person, eines …

Weiterlesen …

IBM veröffentlicht Granite 3.0 Modelle für Unternehmen

IBM erweitert sein KI-Angebot für Unternehmen mit der Einführung der Granite 3.0 Large Language Models (LLMs), berichtet Sean Michael Kerner für VentureBeat. Die neuen Modelle sind als Open Source unter der Apache 2.0 Lizenz verfügbar und sollen verschiedene Anwendungsfälle wie Kundenservice, IT-Automatisierung und Cybersicherheit unterstützen. IBM betont die hohe Leistung der Modelle, die laut eigenen …

Weiterlesen …

Spirit LM ist Metas erstes frei verfügbares multimodales Modell

Mit Spirit LM hat Meta sein erstes frei verfügbares multimodales Sprachmodell auf den Markt gebracht, das Text- und Spracheingabe und -ausgabe integriert und sich damit als Konkurrent zu Modellen wie OpenAIs GPT-4o positioniert. Spirit LM wurde von Metas Fundamental AI Research (FAIR) Team entwickelt und zielt darauf ab, die KI-Spracherfahrung zu verbessern, indem es die …

Weiterlesen …

Neue KI-Modelle von H2O.ai sind auf Dokumente spezialisiert

H2O.ai hat zwei neue Vision-Language-Modelle vorgestellt, H2OVL Mississippi-2B und H2OVL Mississippi-0.8B, die auf die Verbesserung der Dokumentenanalyse und der optischen Zeichenerkennung (OCR) ausgerichtet sind. Trotz ihrer geringen Größe zeigen diese Modelle eine konkurrenzfähige Leistung im Vergleich zu größeren Modellen großer Technologieunternehmen, wobei das Modell 0.8B bei der OCRBench-Texterkennungsaufgabe hervorragend abschnitt. CEO Sri Ambati betonte, dass …

Weiterlesen …