Scale AI veröffentlicht KI-Ranglisten

Scale AI veröffentlicht erstmals Ranglisten für große Sprachmodelle (LLMs), die deren Leistung in spezifischen Anwendungsbereichen wie generative KI-Programmierung, Anweisungsbefolgung, Mathematik und Mehrsprachigkeit bewerten. OpenAIs GPT-Modelle belegen in drei der vier Bereiche den ersten Platz, während Anthropics Claude 3 Opus in der vierten Kategorie die Spitzenposition einnimmt.

Fünf Chatbots im Vergleich

Die Journalisten Dalvin Brown, Kara Dapena und Joanna Stern testeten ChatGPT, Claude, Copilot, Gemini und Perplexity in Bezug auf alltägliche Fähigkeiten. Jeder Chatbot wurde mit Fragen konfrontiert, die Redakteure und Kolumnisten des Wall Street Journal formuliert hatten. Die Antworten wurden von einer unabhängigen Jury nach Kriterien wie Genauigkeit, Nützlichkeit und Gesamtqualität bewertet. Die Kategorie „Gesundheit“ …

Weiterlesen …

Rangliste der sichersten LLMs

Enkrypt hat eine Rangliste der sichersten großen Sprachmodelle (LLMs) veröffentlicht, die Unternehmen helfen soll, die am besten geeigneten Modelle auszuwählen. GPT-4-Turbo von OpenAI führt die Liste mit dem niedrigsten Risiko-Score an, während Modelle wie Saul Instruct-V1 und Phi3-Mini-4K am Ende der Liste stehen.

Musik und Ton per KI generieren – drei Beispiele

KIs können nicht nur Texte, Bilder und Videos generieren, sondern auch Ton und Musik. Die Fortschritte bei der Qualität der Ergebnisse sind dabei erstaunlich.  Schauen wir uns drei prominente Beispiele an: Udio Udio ist vor einer Woche im Rahmen einer Public Beta gestartet und hat bereits für viel Wirbel gesorgt. Auf der Website finden sich zahlreiche …

Weiterlesen …

×