Google führt native Bilderzeugung in Gemini 2.0 Flash ein

Google hat einen in Gemini 2.0 Flash integrierten KI-Bildgenerator bekannt gegeben, die jetzt für Entwickler über Google AI Studio und die Gemini API verfügbar sind. Google ist damit das erste große US-Technologieunternehmen, das eine solche multimodale Bilderzeugung direkt in einem Modell für Endverbraucher integriert hat. Im Gegensatz zu früheren Ansätzen, bei denen Sprachmodelle mit separaten …

Weiterlesen …

Googles Gemma 3 läuft auf einer einzelnen GPU oder TPU

Google hat Gemma 3 angekündigt, seine neueste Sammlung von Open-Source-KI-Modellen. Sie wurden mit der gleichen Technologie entwickelt, die auch die Gemini 2.0-Modelle antreibt. Gemma 3 ist speziell dafür konzipiert, effizient auf einer einzelnen GPU oder TPU zu laufen, was es für Entwickler mit begrenzten Hardware-Ressourcen zugänglich macht. Die neue Modellfamilie kommt in vier Größen: 1B, …

Weiterlesen …

OpenAI arbeiten an KI-Modell mit verbesserten kreativen Schreibfähigkeiten

OpenAI-CEO Sam Altman hat auf X (ehemals Twitter) bekannt gegeben, dass das Unternehmen ein neues KI-Modell mit verbesserten kreativen Schreibfähigkeiten trainiert hat. Altman teilte eine Textprobe zum Thema KI und Trauer im metafiktionalen Stil. Er zeigte sich beeindruckt von der Qualität des KI-generierten Textes. Laut seines Beitrags hat das Modell „die Stimmung von Metafiction sehr …

Weiterlesen …

Studie deckt Probleme bei KI-Suchmaschinen auf

Eine umfangreiche Untersuchung des Tow Center for Digital Journalism hat ergeben, dass KI-Suchtools häufig falsche Informationen liefern, Quellen nicht korrekt zitieren und oft URLs erfinden. Laut des in der Columbia Journalism Review veröffentlichten Berichts testeten die Forscher acht generative Suchmaschinen und stellten fest, dass diese bei mehr als 60 Prozent der Anfragen falsche Antworten lieferten. …

Weiterlesen …

Statistik zeigt beliebteste KI-Modelle für Text, Bild, Video

Die KI-Plattform Poe hat einen Trendbericht für das Frühjahr 2025 veröffentlicht, der bedeutende Veränderungen in den Nutzerpräferenzen bei KI-Modellen aufzeigt. Bei der Texterstellung dominieren OpenAI und Anthropic mit zusammen rund 85% der Nachrichten, wobei seit der Einführung von Claude 3.5 Sonnet im Juni 2024 beide Anbieter bei Poe-Abonnenten nahezu gleichauf liegen. Im Bereich der Bildgenerierung …

Weiterlesen …

KI-Stimmklonungsdienste haben mangelhafte Schutzmaßnahmen

Die meisten KI-Dienste zur Stimmklonung bieten unzureichenden Schutz gegen nicht einvernehmliche Stimmimitationen, wie eine Untersuchung von Consumer Reports zeigt. Von sechs führenden öffentlich zugänglichen Tools haben fünf leicht zu umgehende Sicherheitsvorkehrungen. NBC News berichtet, dass vier Dienste (ElevenLabs, Speechify, PlayHT und Lovo) lediglich das Ankreuzen eines Kästchens zur Bestätigung der Autorisierung verlangen. Resemble AI fordert …

Weiterlesen …

Bericht: Microsoft sucht nach Alternativen zur OpenAI-Partnerschaft

Microsoft arbeitet aktiv daran, seine Abhängigkeit von OpenAI zu verringern, wie aus aktuellen Berichten von The Information und anderen Nachrichtenquellen hervorgeht. Obwohl Microsoft seit 2019 über 13 Milliarden Dollar in OpenAI investiert hat, verfolgt das Unternehmen offenbar mehrere Strategien, um eigene KI-Fähigkeiten zu entwickeln und Modelle anderer Anbieter zu testen. Das ist ein Zeichen für …

Weiterlesen …

Signal-Präsidentin warnt vor Datenschutzrisiken bei KI-Agenten

Meredith Whittaker, Präsidentin des Messenger-Dienstes Signal, hat ernsthafte Bedenken bezüglich des Datenschutzes bei selbstständigen KI-Systemen geäußert. Bei einer Podiumsdiskussion auf der SXSW-Konferenz in Austin verglich Whittaker die Nutzung solcher KI-Agenten mit dem „Einlegen des Gehirns in ein Glas“. Wie Sarah Perez für TechCrunch berichtet, benötigen diese Systeme umfassende Berechtigungen, um Alltagsaufgaben zu erledigen. Die KI …

Weiterlesen …

OpenAI veröffentlicht Entwicklertools für KI-Agenten

OpenAI hat eine neue Reihe von Tools veröffentlicht, mit der Entwickler KI-Agenten ähnlich den firmeneigenen Diensten Deep Research und Operator erstellen können. Die neuen Angebote umfassen die Responses API und das Open-Source Agents SDK. Damit lassen sich KI-Anwendungen erstellen, die im Web suchen, Dateien analysieren und sogar Computeroberflächen steuern können. Responses API Die Responses API …

Weiterlesen …

Neue KI-Techniken versprechen Kosteneinsparungen und verbesserte Leistung für Unternehmen

Aktuelle Forschungsergebnisse haben zwei vielversprechende Ansätze aufgedeckt, die die Kosten für den Betrieb großer Sprachmodelle (LLMs) drastisch reduzieren und gleichzeitig ihre Leistung bei komplexen Denkaufgaben verbessern könnten. Diese Innovationen kommen zu einem kritischen Zeitpunkt, da Unternehmen zunehmend KI-Lösungen einsetzen, aber mit Rechenkosten kämpfen. Chain of draft: Weniger ist mehr Forscher bei Zoom Communications haben eine …

Weiterlesen …

×