SCR, Author at ✦ Smart Content Report

KI-Modelle können sich durch Debatte der Wahrheit annähern

5. Februar 20258. November 2024

Zwei aktuelle Studien liefern erste empirische Belege dafür, dass Debatten zwischen KI-Modellen einem menschlichen oder maschinellen Richter helfen können, die Wahrheit zu erkennen, berichtet Nash Weerasekera für Quanta Magazine. Bei diesem Ansatz präsentieren zwei Expertenmodelle Argumente zu einer Frage, woraufhin ein weniger informierter Richter entscheidet, welche Seite Recht hat. In Experimenten von Anthropic und Google …

Drei Visionäre ebneten Weg für Durchbruch des Deep Learning

5. Februar 20258. November 2024

Trotz Skepsis von Kollegen trugen Geoffrey Hinton, Jensen Huang und Fei-Fei Li maßgeblich zur Revolution des Deep Learning bei, schreibt Timothy B. Lee. Hinton forschte jahrzehntelang an neuronalen Netzen und entwickelte den Backpropagation-Algorithmus für deren effizientes Training. Huang, CEO von Nvidia, erkannte das Potenzial von GPUs für Nicht-Grafik-Anwendungen und startete 2006 die CUDA-Plattform, die ein …

ByteDances X-Portrait 2 verwandelt Fotos in realistische Videos

16. Februar 20268. November 2024

Das chinesische Unternehmen ByteDance, bekannt für die App TikTok, hat sein KI-System X-Portrait 2 vorgestellt. Es kann Standbilder in überzeugende Videoperformances umwandeln. Das System nutzt TikToks riesige Datenbank an nutzergenerierten Videos zum Training und erfasst Gesichtsausdrücke und Bewegungen mit beispielloser Realitätstreue, berichtet Michael Nuñez. Die Ergebnisse sind so lebensnah, dass sie die Grenze zwischen authentischen …

Nous Research veröffentlicht mit Nous Chat seinen ersten nutzerorientierten KI-Chatbot

5. Februar 20258. November 2024

Die KI-Forschungsgruppe Nous Research hat mit Nous Chat einen nutzerorientierten Chatbot auf den Markt gebracht, berichtet Carl Franzen für VentureBeat. Dieser bietet Zugriff auf das große Sprachmodell Hermes 3-70B. Der Chatbot verfügt über eine vertraute Benutzeroberfläche, wie man sie von ChatGPT kennt. Obwohl Nous Chat Schutzmechanismen gegen sensible Themen hat, wurde er bereits von KI-Enthusiasten …

KI-Startup Mistral AI stellt mehrsprachige Moderations-API vor

5. Februar 20258. November 2024

Das französische KI-Startup Mistral AI hat eine neue Moderations-API vorgestellt, die potenziell schädliche Inhalte in neun Kategorien und elf Sprachen erkennen kann. Die API basiert auf Mistrals optimiertem Ministral-8B-Modell und bietet Analysemöglichkeiten für Rohtext und konversationelle Inhalte, berichtet Michael Nuñez für VentureBeat. Mit diesem Schritt positioniert sich Mistral als Konkurrent zu OpenAI und anderen führenden …

Microsoft stellt Magentic-One vor, ein Open-Source-Framework zur Verwaltung von Multi-Agenten-KI-Systemen

5. Februar 20258. November 2024

Microsoft hat mit Magentic-One eine neue Open-Source-Infrastruktur veröffentlicht. Das System ermöglicht es einem einzigen KI-Modell, mehrere Hilfsagenten zu steuern, die zusammenarbeiten, um komplexe, mehrstufige Aufgaben in verschiedenen Szenarien zu erledigen. Magentic-One basiert auf einem Orchestrator-Agenten, der vier weitere Agenten leitet: Websurfer, FileSurfer, Coder und ComputerTerminal. Laut Microsoft-Forschern ist Magentic-One ein generalistisches Agentensystem, das die lang …

OmniGen: Erstes einheitliches Modell für Bildgenerierung

5. Februar 20258. November 2024

Forscher haben OmniGen vorgestellt, das erste Diffusionsmodell, das verschiedene Bildgenerierungsaufgaben in einem einzigen Framework vereinen kann. Im Gegensatz zu bestehenden Modellen wie Stable Diffusion benötigt OmniGen keine zusätzlichen Module, um unterschiedliche Steuerbedingungen zu verarbeiten, so die Autoren Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan et al. Das Modell kann Text-zu-Bild-Generierung, Bildbearbeitung, subjektgesteuerte Generierung, visuell-bedingte …

Hugging Face veröffentlicht effiziente KI-Sprachmodelle für Mobilgeräte

5. Februar 20258. November 2024

Hugging Face hat mit SmolLM2 eine neue Familie kompakter Sprachmodelle vorgestellt, die speziell für den Einsatz auf Smartphones und Edge-Geräten mit begrenzter Rechenleistung und Speicherkapazität entwickelt wurden. Die unter der Apache 2.0-Lizenz veröffentlichten Modelle sind in drei Größen bis zu 1,7 Milliarden Parametern erhältlich. Trotz ihrer kompakten Größe erzielen sie beeindruckende Ergebnisse bei wichtigen Benchmarks …

Runway zeigt 3D-Kamerasteuerung für KI-Videomodell Gen-3 Alpha Turbo

5. Februar 20258. November 2024

Das New Yorker KI-Startup Runway hat erweiterte Kamerasteuerungen für sein Videogenerierungsmodell Gen-3 Alpha Turbo eingeführt. Laut eines Artikels von Carl Franzen ermöglichen diese neuen Funktionen Benutzern, in KI-generierte Szenen hinein- und herauszuzoomen und dabei Charakterformen und Umgebungen zu erhalten. Dadurch entsteht eine realistische 3D-Welt. Die Kamerasteuerungen bieten im Vergleich zu früheren KI-Videogeneratoren, einschließlich Runways eigenen …

Patronus AI stellt API vor, die KI-Halluzinationen in Echtzeit verhindert

5. Februar 20258. November 2024

Das Startup Patronus AI aus San Francisco hat eine Self-Serve-API eingeführt, die KI-Fehler wie Halluzinationen und unerwünschte Antworten in Echtzeit erkennt und verhindert. Laut CEO Anand Kannappan in einem Interview mit VentureBeat bietet die Plattform mehrere Innovationen, darunter „Judge Evaluators“, mit denen Unternehmen benutzerdefinierte Regeln in einfachem Englisch erstellen können, und Lynx, ein Halluzinationserkennungsmodell, das …