IBM veröffentlicht Granite 3.0 Modelle für Unternehmen

IBM erweitert sein KI-Angebot für Unternehmen mit der Einführung der Granite 3.0 Large Language Models (LLMs), berichtet Sean Michael Kerner für VentureBeat. Die neuen Modelle sind als Open Source unter der Apache 2.0 Lizenz verfügbar und sollen verschiedene Anwendungsfälle wie Kundenservice, IT-Automatisierung und Cybersicherheit unterstützen. IBM betont die hohe Leistung der Modelle, die laut eigenen …

Weiterlesen …

Spirit LM ist Metas erstes frei verfügbares multimodales Modell

Mit Spirit LM hat Meta sein erstes frei verfügbares multimodales Sprachmodell auf den Markt gebracht, das Text- und Spracheingabe und -ausgabe integriert und sich damit als Konkurrent zu Modellen wie OpenAIs GPT-4o positioniert. Spirit LM wurde von Metas Fundamental AI Research (FAIR) Team entwickelt und zielt darauf ab, die KI-Spracherfahrung zu verbessern, indem es die …

Weiterlesen …

Neue KI-Modelle von H2O.ai sind auf Dokumente spezialisiert

H2O.ai hat zwei neue Vision-Language-Modelle vorgestellt, H2OVL Mississippi-2B und H2OVL Mississippi-0.8B, die auf die Verbesserung der Dokumentenanalyse und der optischen Zeichenerkennung (OCR) ausgerichtet sind. Trotz ihrer geringen Größe zeigen diese Modelle eine konkurrenzfähige Leistung im Vergleich zu größeren Modellen großer Technologieunternehmen, wobei das Modell 0.8B bei der OCRBench-Texterkennungsaufgabe hervorragend abschnitt. CEO Sri Ambati betonte, dass …

Weiterlesen …

Perplexity sucht jetzt auch in internen Dokumenten

Perplexity hat eine interne Wissenssuche eingeführt, die es Pro- und Enterprise Pro-Nutzern ermöglicht, sowohl ihre internen Dateien als auch das Internet über eine einzige Plattform zu durchsuchen. Die Nutzer können wichtige Dateien in verschiedenen Formaten wie Excel, Word und PDF hochladen, die bei Enterprise Pro auf 500 begrenzt sind, berichtet VentureBeat. Ziel ist es, den …

Weiterlesen …

ChatGPT erhält Windows-Anwendung

OpenAI hat eine Windows-Desktop-Anwendung für ChatGPT herausgebracht, um die Integration in den täglichen Arbeitsablauf und die Produktivität zu verbessern. Diese Version folgt einer ähnlichen Anwendung für macOS und ist derzeit für ausgewählte Abonnenten verfügbar, berichtet VentureBeat. Die App ermöglicht den Nutzern einen einfachen Zugang zu ChatGPT über eine Tastenkombination und soll die Nutzererfahrung ohne Webbrowser …

Weiterlesen …

NotebookLM verbessert Audiofunktion und ergänzt Business-Angebot

Google hat seinen KI-Notiz- und Recherche-Assistenten NotebookLM aktualisiert und seine Audio-Zusammenfassungsfunktion verbessert. Durch das Update können die Nutzer die Audiozusammenfassungen über ein spezielles Steuerelement anpassen, um sich auf bestimmte Inhaltsbereiche zu konzentrieren. Raiza Martin, Produktmanagerin von NotebookLM, betonte, dass diese Anpassung dazu beiträgt, Ungenauigkeiten oder „Halluzinationen“ der KI zu reduzieren. Laut TechCrunch folgt das Update …

Weiterlesen …

Differential Transformer soll die Leistung von Text-KIs verbessern

Microsoft und die Tsinghua Universität haben eine neue KI-Architektur namens „Differential Transformer“ entwickelt, die die Leistung von großen Sprachmodellen verbessert. Wie Furu Wei von Microsoft Research gegenüber VentureBeat erklärte, verstärkt die neue Methode die Aufmerksamkeit auf relevante Kontexte und filtert Störgeräusche heraus. Dies soll Probleme wie das „Lost-in-the-Middle“-Phänomen und Halluzinationen bei langen Texten reduzieren. In …

Weiterlesen …

Sana ist ein kleiner und extrem schneller KI-Bildgenerator

Ein neues Text-zu-Bild-Framework namens Sana kann hochauflösende Bilder bis zu 4096 x 4096 Pixeln effizient und schnell generieren. Das System nutzt einen tiefen Kompressions-Autoencoder, lineare Aufmerksamkeit und einen Decoder-basierten Textencoder, um die Leistung zu optimieren. Sana-0.6B kann laut den Entwicklern mit modernsten großen Diffusionsmodellen konkurrieren, ist dabei aber 20-mal kleiner und über 100-mal schneller. Besonders …

Weiterlesen …

Nvidia veröffentlicht leistungsstarkes und offenes KI-Modell

Nvidia hat ein neues KI-Modell, Llama-3.1-Nemotron-70B-Instruct, vorgestellt, das bestehende Modelle von OpenAI und anderen Anbietern übertrifft und einen fortgesetzten Wandel in der KI-Strategie des Unternehmens zeigt. Das Modell, das auf Hugging Face verfügbar ist, erzielte beeindruckende Benchmark-Ergebnisse und positioniert Nvidia als wettbewerbsfähigen Akteur im Bereich Sprachverständnis und -generierung. Diese Entwicklung zeigt Nvidias Wandel von einem …

Weiterlesen …

Pika 1.5: KI-Videos mit witzigen Effekten

Pika 1.5 ist die neueste Version eines KI-gestützten Videobearbeitungstools, entwickelt vom Startup Pika Labs aus Palo Alto, Kalifornien. Diese Plattform ermöglicht es Nutzern, statische Bilder in dynamische Videos umzuwandeln und dabei eine Reihe spezieller Effekte, sogenannte „Pikaffects“, anzuwenden. Zu den jüngsten Ergänzungen gehören Effekte wie „crumble“ (zerbröckeln), „dissolve“ (auflösen), „deflate“ (zusammenfallen) und „ta-da“ (verschwinden lassen). …

Weiterlesen …