Digital sozialisiert, Denker, Macher und Angel Investor.

Kategorieai

Welche Menschen?

W

KI generiert nicht nur menschenähnlichen Output, sie wird auch mit menschlichen Wertvorstellungen und Charakterzügen trainiert respektive darauf “ausgerichtet”: Artificial intelligence (AI) alignment is the process of encoding human values and goals into AI models to make them as helpful, safe and reliable as possible. Eine Studie des Department of Human Evolutionary Biology der Harvard...

AI at Noon: Swiss AI Initiative und Apertus

A

Im Rahmen der Veranstaltung AI at Noon der OST – Ostschweizer Fachhochschule habe ich eine Übersicht über das Schweizer LLM Apertus und über dessen “Wiege”, die Swiss AI Initiative​, erzählt. Im Kern ging es mir dabei um die Chancen von Open-Source-Modellen, wobei ich zuerst die Grenze zwischen open-weights und closed-weights ziehen und auch den Begriff Open Source AI erklären musste...

KI-Alignment kann nicht hierarchisch erfolgen

K

Ein eindrücklicher Artikel von Audrey Tang mit dem Ziel, den vielfältigen demokratischen Dialog zu erhalten: AI Alignment Cannot Be Top-Down. Ausgangspunkt ist der Umstand, dass KI-Modelle unterschiedliche Wertvorstellungen und Charakter verkörpern. Der technische Schritt, um dies im Erstellungsprozess des Modells umzusetzen, heisst Alignment (oder auch Preference Training). Alignment bedeutet...

Cyberspionage mit Claude Code – oder heisst es Vibe Hacking?

C

Anthropic beschreibt die Nutzung ihres Coding-Assistenten Claude Code als Grundlage für einen erfolgreichen Cyberangriff auf rund 30 Firmen: Disrupting the first reported AI-orchestrated cyber espionage campaign. Den Angreifern (wahrscheinlich die staatliche chinesische Gruppe GTG-1002) gelang es nicht nur die Arbeit von menschlichen Hackers massiv zu skalieren, aber auch die bestehenden...

Be yourself – Die Zeiten des KI-Modus und von Google Overviews

B

Danke Adrienne für den pointierten Beitrag am #SocialMediaGipfel, dazu wie man (mit seinen Inhalten) in Zeiten des KI-Modus und Google Overview (und wie sie alle heissen) relevant bleibt. Ihr zentrales Slide aus Optik des Journalismus war das folgende: Der Inhalt erinnerte mich an den Augenblick als meine interne Kommunikation, die ich zuvor immer selbst gebastelt hatte, (aufgrund der Grösse von...

Unterschiedliche Charakter und Wertvorstellungen von LLMs

U

Unterschiedliche Verhaltensrichtlinien und ethische Grundsätze von LLMs waren ein lang diskutiertes Thema in meinem Slot an der NZZ Academy. Auch wenn es intuitiv klar ist, dass Modelle wie Grok, ChatGPT oder Claude andere “Meinungen” haben, so ist der Prozess dorthin (und auch die Folgen davon) nicht allen bewusst. In dem Zusammenhang bin ich auf ein sehr interessantes, aktuelles Paper...

Ohne Fundament wird es gefährlich ‒ auch bei KI

O

Meine Aufgabe war es, an der NZZ Academy über “the state of AI” zu sprechen. Einerseits habe ich beschlossen, nicht über den “Zustand” zu sprechen, aber über die Themen, welche mich beschäftigen. Andererseits haben mir Bedo Hamza, Walter Schärer und Andreas Göldi geholfen, eine Vorabversion zu verbessern. Also habe ich über die folgenden Themen gesprochen. KI Sicherheit KI...

The Command Line is finally back – thanks to AI

T

In 2008, I talked about how important it is for websites to work correctly in text browsers (Lynx at the time). And guess what? We’ve pretty much landed back there, thanks to AI! Act one The first time I stumbled across the rise of the command line was with the advent of AI agents. When doing their job, they try to work as efficiently as possible and therefore prefer easy to navigate...

Guardrails: I’m afraid I can’t do that

G

With «A practical guide to building agents» OpenAI provides us with an interesting weekend lecture. Let me focus on just one aspect: Guardrails. Their paper shows a fairly simple architecture of agents working together, but their approach to controlling risk is quite sophisticated. While they propose a single agent that validates output (preventing output that could damage the integrity of your...

Swiss AI sovereignty – market opportunity or really complicated?

S

The AI systems we are about to deploy are not only produced in the US or China, but in most cases also using a cloud scenario where the second endpoint is neither in Switzerland nor under our control. Since hosting models locally with tools like Ollama, GPT4All or OpenLLM locally is an quite an easy fix, let’s talk about the elephant in the room: Building and tuning models under your control. To...

Digital sozialisiert, Denker, Macher und Angel Investor.