ARIA ist offen und multimodal

ARIA ist ein offenes, multimodales Mixture-of-Experts-Modell, das entwickelt wurde, um verschiedene Formen von Informationen für ein umfassendes Verständnis zu integrieren, und das bestehende proprietäre Modelle bei mehreren Aufgaben übertrifft. Mit insgesamt 24,9 Milliarden Parametern aktiviert es 3,9 Milliarden bzw. 3,5 Milliarden Parameter für visuelle bzw. Text-Token. Das Modell wird auf einem umfangreichen Datensatz trainiert, der …

Weiterlesen …

Meta zeigt Hardware für KI-Training

Meta präsentierte auf dem OCP Global Summit 2024 neue offene KI-Hardware. Dazu gehören eine KI-Plattform namens „Catalina“, innovative Rack-Designs und verbesserte Netzwerkstrukturen. Laut Dan Rabinovitsj und Omar Baldonado in Metas Blog „Engineering at Meta“ will das Unternehmen damit die Zusammenarbeit und Innovation in der Branche fördern. Meta skaliert seine KI-Cluster massiv, um große Sprachmodelle wie …

Weiterlesen …

OpenAI Swarm als Framework für KI-Agenten

OpenAI hat „Swarm“ vorgestellt, ein experimentelles Framework für Netzwerke von KI-Agenten. Laut VentureBeat ermöglicht Swarm Entwicklern, miteinander kommunizierende KI-Netzwerke zu erstellen, die Aufgaben autonom lösen. Das Framework soll verschiedene Geschäftsbereiche automatisieren, von der Marktanalyse bis zum Kundensupport. Es wirft aber auch ethische Fragen auf, etwa zu Sicherheit, Voreingenommenheit und Arbeitsplatzverlust. OpenAI-Forscher Shyamal Anadkat betont, dass …

Weiterlesen …

Adobe zeigt zahlreiche neue KI-Funktionen

Adobe hat zahlreiche neue KI-Funktionen vorgestellt, unter anderem für Videoproduktion, Bildbearbeitung, Vektorgrafik und Marketingteams. Auf seiner alljährlichen MAX-Konferenz präsentierte das Unternehmen etwa das Firefly Video Model. Laut Adobe kann dieses KI-System Videos aus Textbeschreibungen oder Bildern erzeugen. Zudem lassen sich damit bestehende Videoclips verlängern. Adobe betont zugleich die kommerzielle Sicherheit des Firefly Video Models. Das …

Weiterlesen …

DeepMind’s Michelangelo testet logisches Denken in langen Kontextfenstern

DeepMind hat den Michelangelo-Benchmark vorgestellt, um die Fähigkeiten von Large Language Models (LLMs) mit langen Kontextfenstern zu testen, berichtet Ben Dickson für VentureBeat. LLMs können zwar mit großen Kontextfenstern umgehen, aber Untersuchungen zeigen, dass sie Schwierigkeiten haben, Schlussfolgerungen über komplexe Datenstrukturen zu ziehen. Aktuelle Benchmarks konzentrieren sich oft auf Suchaufgaben, die die Fähigkeiten zu logischem …

Weiterlesen …

AMD zeigt weitere KI-Chips

AMD erweitert sein KI-Portfolio mit neuen Chips für Ryzen-, Instinct- und Epyc-Produkte. Laut AMD-CEO Lisa Su sollen die neuen Prozessoren eine neue Ära des KI-Computings einläuten – vom Privatanwender bis zum Rechenzentrum. Der Fokus liege dabei auf offenen und zugänglichen Technologien, so Su bei einer Veranstaltung in San Francisco. Das berichtet Dean Takahashi für VentureBeat. …

Weiterlesen …

Intel zeigt „Arrow Lake“-Chips

Intel setzt mit seinen neuen Desktop-Chips „Arrow Lake“ auf KI und neue Architektur. Laut eines Berichts von Gavin Bonshor auf „The Register“ integriert Intel erstmals eine KI-fokussierte NPU in seine Desktop-Prozessoren. Die Chips nutzen ein Kachel-Design und werden von TSMC gefertigt, während Intel selbst die einzelnen Komponenten zusammenfügt. Die neuen Prozessoren mit den Codenamen „Lion …

Weiterlesen …

Pyramid Flow ist eine frei verfügbare Video-KI

Ein neues, quelloffenes KI-Modell namens Pyramid Flow generiert hochwertige Videoclips von bis zu zehn Sekunden Länge. Entwickelt wurde es von Forschern der Peking University, der Beijing University of Posts and Telecommunications und Kuaishou Technology, wie Carl Franzen berichtet. Pyramid Flow nutzt eine neue Technik, bei der ein KI-Modell Videos in mehreren Schritten erstellt, die meisten …

Weiterlesen …

Welche ist die beste Version von ChatGPT?

Ein Reddit-Post mit dem Titel „Which is the best version of chatgpt4“ hat eine Diskussion über die verschiedenen Versionen von ChatGPT ausgelöst. Der Poster fragte nach der „genauesten“ Version, was zu verschiedenen Antworten führte. Die Benutzer heben die Stärken der verschiedenen Modelle hervor: „4o“ wird als das beste Modell für Recherche, Bildgestaltung und kreatives Schreiben …

Weiterlesen …

Palmyra X 004 ist der David der KI-Modelle

Writer stellt sein neues KI-Sprachmodell Palmyra X 004 vor, das besonders im Bereich der Funktionsaufrufe und Workflow-Ausführung für Unternehmen glänzen soll. Michael Nuñez berichtet bei VentureBeat, dass das Modell im „Tool Calling Leaderboard“ von Berkeley mit 78,76 % die Konkurrenz von OpenAI, Anthropic, Google und Meta um fast 20 % übertrifft. Palmyra X 004 benötigt …

Weiterlesen …