Skyvern will browserbasierte Aufgaben automatisieren
Die Idee hinter Skyvern: Man gibt der KI einen Auftrag in natürlicher Sprache und sie macht sich selbstständig an die Arbeit. Quelle: Hacker News
Die Idee hinter Skyvern: Man gibt der KI einen Auftrag in natürlicher Sprache und sie macht sich selbstständig an die Arbeit. Quelle: Hacker News
Das Startup Cohere hat den Enterprise-Markt im Auge. Sein Modell Command-R soll mit seiner Flexibilität überzeugen. Dazu gehört ein großes Kontextfenster von 128.000 Token und es kann auf externe Informationen via RAG zugreifen. Quelle: VentureBeat
Das Angebot hatte mit seinen Probevideos für Aufsehen gesorgt, da sie einen erheblichen Qualitätssprung versprechen. Quelle: The Verge
Während kommerzielle KI-Angebote viele Leitplanken und Schranken einbauen, um sie gegen Missbrauch zu sichern, wirbt das offene Modell Liberated-Qwen1.5-72B damit, dass es keine solche Beschränkungen hat. Stattdessen ist es speziell darauf trainiert, strikt den Vorgaben zu folgen. Dadurch lässt es sich weniger leicht austricksen. Zugleich muss man aber selbst festlegen, welche Antworten und Themen erlaubt sind. Quelle: VentureBeat
Inflection hat Inflection-2.5 veröffentlicht, eine aktualisierte Version seines persönlichen KI-Assistenten Pi, die mit führenden Sprachmodellen wie GPT-4 konkurrieren kann. Inflection-2.5 erreicht eine hohe Leistung in einer Reihe von Benchmarks und benötigt dabei nur 40% der Rechenleistung von GPT-4. Die Grundidee von Inflection ist es, den KI-Assistenten Pi persönlicher zu machen. Er soll dabei „hilfreich und …
Anthropic hatte kürzlich mit Claude 3 die neueste Version seines KI-Sprachmodells vorgestellt. Nach dem mittleren Angebot „Sonnet“ und dem größten und teuersten „Opus“ ist nun auch „Haiku“ verfügbar. Es lockt mit niedrigen Preisen und schnellen Antworten. Leider ist Claude weiterhin nicht offiziell in Europa nutzbar.
Bislang sind Bildgeneratoren wie MidJourney nicht gut geeignet, wenn du eine spezifische, fiktive Person in weiteren Bildern verwenden möchtest. Eine solche Konsistenz ist für viele Anwendungen allerdings zwingend notwendig. Man denke hier etwa an Comics oder auch an Marketingmaterialien. Bei Stable Diffusion lässt sich das beispielsweise über „LoRAs“ lösen. Der technische Aufwand ist allerdings nichts für …
Multimodal (aus dem Lateinischen: multi = viel, mehrere und modus = Art und Weise) bezeichnet im Kontext der Künstlichen Intelligenz die Fähigkeit eines KI-Systems, verschiedene Arten von Eingaben oder „Modalitäten“ gleichzeitig zu verarbeiten und zu verstehen. Während frühere KI-Systeme sich meist auf eine einzige Form der Kommunikation beschränkten – etwa Text oder Bilder -, können …
Elon Musk hatte OpenAI mitgegründet und -finanziert. Nun verklagt er das Unternehmen, da es die einstmals versprochene Offenheit nicht umsetze. OpenAI veröffentlichte im Gegenzug alte E-Mails von Elon Musk, in denen er offenbar nichts dagegen hatte.
Google bezahlt Verleger dafür, ein neues KI-Angebot zu nutzen. Laut Google soll es vor allem Journalisten kleinerer Medienangebote bei der Arbeit helfen, heißt es bei AdWeek.