Google Gemma 4 ist die stärkste Open-Source-KI des Unternehmens

Google hat Gemma 4 vorgestellt, eine neue Familie von Open-Weight-KI-Modellen. Das Unternehmen bezeichnet sie als die bislang fähigsten Modelle dieser Reihe. Sie basieren auf derselben Forschung und Technologie wie Googles proprietäres Gemini-3-System und werden unter einer Apache-2.0-Open-Source-Lizenz veröffentlicht. Diese Lizenz erlaubt es Entwicklern, die Modelle für kommerzielle Zwecke frei zu nutzen und zu verändern. Die …

Weiterlesen …

Mistral veröffentlicht Open-Weight-Sprachmodell Voxtral TTS

Das französische KI-Unternehmen Mistral hat Voxtral TTS veröffentlicht, ein Open-Weight-Text-to-Speech-Modell für den Unternehmenseinsatz. Mögliche Anwendungsgebiete sind Kundendienst, Vertrieb und Echtzeit-Übersetzung. Anders als Konkurrenten wie ElevenLabs, Deepgram und OpenAI stellt Mistral die vollständigen Modellgewichte zur Verfügung. Unternehmen können das Modell auf ihrer eigenen Infrastruktur betreiben und müssen keine Daten an Dritte übermitteln. Das Modell basiert auf …

Weiterlesen …

Mistral Small 4 vereint Reasoning, Bildverarbeitung und Coding

Mistral AI hat das neue Sprachmodell Mistral Small 4 veröffentlicht. Es vereint Reasoning, multimodale Verarbeitung und Programmierfähigkeiten in einem einzigen System. Das Unternehmen erklärt, dass Nutzer deshalb nicht mehr zwischen verschiedenen spezialisierten Modellen wechseln müssen. Das Modell basiert auf einer sogenannten Mixture-of-Experts-Architektur mit 128 Spezialisten. Pro verarbeitetem Textabschnitt sind jeweils vier davon aktiv. Diese Methode …

Weiterlesen …

Denken nur wenn nötig: Microsofts neue KI weiß, wann sie sich die Mühe sparen kann

Microsoft hat das KI-Modell Phi-4-reasoning-vision-15B veröffentlicht. Es verarbeitet sowohl Bilder als auch Text und kann komplexe Mathematik- und Wissenschaftsaufgaben lösen. Michael Nuñez berichtet für VentureBeat, dass das Modell mit 15 Milliarden Parametern deutlich größere Systeme in vielen Bereichen einholt oder übertrifft. Der Rechenaufwand und der Bedarf an Trainingsdaten sind dabei deutlich geringer. Das Modell ist …

Weiterlesen …

Alibaba veröffentlicht neue Qwen3.5-Modelle für Laptops und Smartphones

Alibabas Forschungsteam hat zwei neue Serien von Open-Source-KI-Modellen veröffentlicht, die auf Consumer-Hardware laufen, vom Desktop-PC bis zum Smartphone. Die Modelle umfassen eine Spanne von 0,8 bis 122 Milliarden Parametern und sind kostenlos unter der Apache-2.0-Lizenz auf Hugging Face und ModelScope verfügbar. Die größere Qwen3.5-Medium-Serie enthält vier Modelle. Das Hauptmodell, Qwen3.5-35B-A3B, nutzt ein Verfahren namens Mixture-of-Experts. …

Weiterlesen …

MiniMax veröffentlicht KI-Modell M2.5 zu einem Bruchteil der Konkurrenzpreise

Das chinesische KI-Unternehmen MiniMax hat M2.5 veröffentlicht, ein neues großes Sprachmodell, das laut Unternehmensangaben mit Spitzenmodellen von Anthropic und Google mithalten soll — zu deutlich niedrigeren Kosten. MiniMax bietet zwei Versionen über seine API an. M2.5-Lightning verarbeitet 100 Token pro Sekunde und kostet 0,30 Dollar pro Million Eingabe-Token und 2,40 Dollar pro Million Ausgabe-Token. Das …

Weiterlesen …

Alibaba veröffentlicht Qwen3.5, ein multimodales KI-Modell mit 397 Milliarden Parametern

Alibaba hat Qwen3.5 vorgestellt, ein neues KI-Modell, das als multimodaler Agent Text, Bilder und Videos verarbeiten kann. Das QwenTeam kündigt diese Entwicklung auf der Webseite des Unternehmens an. Das Modell enthält 397 Milliarden Parameter. Pro Aufgabe aktiviert es jedoch nur 17 Milliarden davon. Das Team betont, dieser Ansatz optimiere Geschwindigkeit und Kosten. Die Architektur kombiniert …

Weiterlesen …

Mistral veröffentlicht Voxtral Transcribe 2: Transkription direkt auf dem Handy

Mistral AI hat Voxtral Transcribe 2 veröffentlicht, eine Familie von Speech-to-Text-Modellen für Batch-Verarbeitung und Echtzeit-Transkription. Das Unternehmen positioniert die Technologie als präziser und deutlich günstiger als konkurrierende Services und ermöglicht gleichzeitig lokale Verarbeitung für sensible Daten. Die Veröffentlichung umfasst zwei Modelle. Voxtral Mini Transcribe V2 verarbeitet voraufgezeichnete Audiodateien für $0.003 pro Minute, was laut Mistral …

Weiterlesen …

OpemClaw: Dieser KI-Assistent kann sich selbst verbessern und steuert dein digitales Leben

Ein quelloffener KI-Assistent namens OpenClaw zeigt, wie künftige digitale Helfer funktionieren könnten. Das System war bis vor Kurzem als Clawdbot und Moltbot bekannt und arbeitet vollständig auf dem eigenen Computer und bietet umfassende Anpassungsmöglichkeiten. Federico Viticci schreibt bei MacStories, dass das Projekt die Nutzung leistungsstarker Sprachmodelle über vertraute Messenger-Apps wie Telegram oder iMessage ermöglicht. Der …

Weiterlesen …

Black Forest Labs: Neue Modelle erzeugen Bilder in weniger als einer Sekunde

Black Forest Labs hat eine neue Serie von KI-Bildgeneratoren namens FLUX.2 [klein] vorgestellt. Diese Modellfamilie setzt auf hohe Geschwindigkeit und geringe Hardwareanforderungen. Das Unternehmen gibt an, dass die Modelle die Erzeugung und Bearbeitung von Bildern in einer einzigen Architektur vereinen. Laut der Ankündigung erstellen die Systeme Bilder auf moderner Hardware in weniger als einer Sekunde. …

Weiterlesen …