Bundesgesundheitsminister Lauterbach sieht die Datennutzung im Medizinbereich als alternativlos. KI-Modelle will er dafür "mit synthetischen Daten durchspülen".
Fefe ist ein Horst und stellt sich künstlich doof.
Er weiß 1000% was ein Integration-Test ist und dass man InfoSec-/Pentests am besten mit synthetischen Daten anstatt mit echten durchführt.
Er weiß auch, dass Politiker solche Dinge anschaulich formulieren müssen.
Wieso sind wir da nicht selber draufgekommen!
Ja warum ist eigentlich die deutsche IT so ein Treppenwitz, fefe? Warum bildet das einzige “Flagschiff” SAP hierzulande eine ganz eigene Treppenwitzkategorie?
Wieso macht es Code Blau nicht einfach mal besser und baut eine gute, dezentrale, sichere Patientenakte? Oder Behörden-IT oder Strafzettel-Apps oder flächendeckende authentifizierung mit ePA usw usw? Die Ausschreibungen sind doch öffentlich?
Weil er ein armchair Infrastrukturexperte ist, so eine süffisante Formulierung das Selbstwertgefühl steigert und natürlich alles eine super “Medienkompetenzübung” ist.
In der Praxis sind gatling, dietlibc & co. aber halt doch nicht mehr als Laborexperimente, die nie die “Serienreife” für Produktivbetrieb geschafft haben. Warum wohl…
Die Welt wäre so viel besser wenn niemand mehr FEFE aufmerksamkeit schenken würde. Der Typ labert so oft so reaktionäre kacke. aber hauptsache über irgendwas aufregen weil man selbst mal irgendwas mit IT gemacht hat.
Zu seinen Gunsten: In InfoSec dingen hat er schlicht recht. Aber das Gejammer allein bringt halt auch nichts. Und IT-Politisch kann man es ihm anscheinend nie recht machen.
In Sachen Politik war es in den nuller-Jahren oft ganz amüsant, fefe mit einem ordentlichen Augenzwinkern zu lesen. Aber heute wirkt das was ich noch so mitkriege, als hätte er in seiner Blase schlicht den Knall nicht gehört.
In Zeiten von Tatsachenverdrehungen und zersetzender Propaganda, ist seine “Medienkompetenzübung” schlicht auf ganzer Länge gescheitert.
Ich stimme dir bei allem zu, aber woher kriegt Lauterbach so einen mächtigen Integrationstest für ein Konstrukt (große Sprachmodelle und ähnliche KIs), deren Indeterminismus ja die Herausforderung ist?
Wenn die jetzt erst einmal mit synthetischen Daten ein Model trainieren und dann die generierten Ausgaben testen wollen, dann muss man ja beweisen können, dass man jede Kombination bedacht hat. Es reicht ja nicht, einfach nur die Ausgabequalität zu erhöhen, was ja das ist wofür solche Test für LLMs geschrieben werden.
aber woher kriegt Lauterbach so einen mächtigen Integrationstest
Es reicht, wenn das in Ausschreibungstexten oder Verordnungen steht.
Wenn die jetzt erst einmal mit synthetischen Daten ein Model trainieren
Du stellst dir das zu kompliziert vor. Man trainiert nicht nur ein Modell, man testet ALLES komplett. Also z.B. auch die Datenweitergabe in die USA. Wenn dann jemand am anderen Ende private/geheime synthetische Daten extrahieren kann, ist nichts wichtiges verloren.
Abgesehen davon weiß momentan vermutlich kaum jemand, was konkret geplant ist. Dafür muss man vermutlich noch auf Konkretes warten. Das war ja nur eine Ankündigung bisher.
Ich rede hier über die KI selbst und nicht was mit den Daten vor der Eingabe bzw. nach der Ausgabe geschieht. Und da ist das Testen weder trivial noch lange nicht vollständig gelöst. Es einfach zu fordern hilft da wenig.
Daher muss mMn immer davon ausgegangen, dass solche KI es schafft Daten zu deanonymisieren. Entsprechend muss auch die Verantwortung für und Transparenz über deren Nutzung sowie der gesammelten Eingabedaten strikt reguliert werden, wovon wir ja auch noch weit entfernt sind.
Und ist dieses “Serienprodukt” jetzt gerade mit uns im Raum?
Letzter Release 2018 per CVS. Sicherlich gibt es paar Entscheider die das durchgehen lassen, weil sie den Unterschied zwischen uClibc und kleinem Zeh nicht kennen.
Das cvs ist halt auch so ein thema. Fefe nimmt keine patches an. Wir hatten über 100. unter anderem dynamisches linken eingebaut.
Wenns auf grösse ankommt ist die dietlibc halt unschlagbar. uclibc ist deutlich grösser.
Klar kann man über den kerl viel negatives sagen ist menschlich bestimmt kein teamplayer, aber dietlibc war schon super. Die software hatte 12mb mit firewall, proxy etc.
Man muss nicht unbedingt alles compilen. Ich bin da schon ein paar Jahre raus aber würde fast wetten, uClibc zu verschlanken ist weit weniger Aufwand als dietlibc für den produktiven Einsatz aufzuspritzen.
Kann mich natürlich täuschen. Dass gatling und dietlibc guter code ist (oder mal war) bestreite ich nicht. Aber das allein reicht halt nicht, sonst hätten wir hierzulande nicht die Probleme, auf die Fefe so gerne herab blickt.
Man muss nicht unbedingt alles compilen. Ich bin da schon ein paar Jahre raus aber würde fast wetten, uClibc zu verschlanken ist weit weniger Aufwand als dietlibc für den produktiven Einsatz aufzuspritzen.
glaube ich nicht. die uclibc hat halt einfach viel mehr features. Dafür hat man halt auch viel weniger Aufwand Software damit zu bauen. und heutzutage kommts auf das bisschen Grösse meistens ja nicht mehr so an.
Damals hat sich die Frage aber gar nicht gestellt, weil es noch gar keine uclibc gab.
Kann mich natürlich täuschen. Dass gatling und dietlibc guter code ist (oder mal war) bestreite ich nicht. Aber das allein reicht halt nicht, sonst hätten wir hierzulande nicht die Probleme, auf die Fefe so gerne herab blickt.
das herab blicken ist hier halt das Problem, glaube ich. Hätte der damals (als es eben noch keine Alternativen gab) etwas sozialkompatibler und offener auf der dietlibc Mailingliste kommuniziert und mehr Ideen und patches angenommen, anstatt auf Prinzipien zu beharren im DJB-Style, wäre die dietlibc heute vielleicht auf jedem Plastikrouter á la FritzBox. Wer weiss.
Fefe ist ein Horst und stellt sich künstlich doof.
Er weiß 1000% was ein Integration-Test ist und dass man InfoSec-/Pentests am besten mit synthetischen Daten anstatt mit echten durchführt.
Er weiß auch, dass Politiker solche Dinge anschaulich formulieren müssen.
Ja warum ist eigentlich die deutsche IT so ein Treppenwitz, fefe? Warum bildet das einzige “Flagschiff” SAP hierzulande eine ganz eigene Treppenwitzkategorie?
Wieso macht es Code Blau nicht einfach mal besser und baut eine gute, dezentrale, sichere Patientenakte? Oder Behörden-IT oder Strafzettel-Apps oder flächendeckende authentifizierung mit ePA usw usw? Die Ausschreibungen sind doch öffentlich?
Weil er ein armchair Infrastrukturexperte ist, so eine süffisante Formulierung das Selbstwertgefühl steigert und natürlich alles eine super “Medienkompetenzübung” ist.
In der Praxis sind gatling, dietlibc & co. aber halt doch nicht mehr als Laborexperimente, die nie die “Serienreife” für Produktivbetrieb geschafft haben. Warum wohl…
Die Welt wäre so viel besser wenn niemand mehr FEFE aufmerksamkeit schenken würde. Der Typ labert so oft so reaktionäre kacke. aber hauptsache über irgendwas aufregen weil man selbst mal irgendwas mit IT gemacht hat.
Zu seinen Gunsten: In InfoSec dingen hat er schlicht recht. Aber das Gejammer allein bringt halt auch nichts. Und IT-Politisch kann man es ihm anscheinend nie recht machen.
In Sachen Politik war es in den nuller-Jahren oft ganz amüsant, fefe mit einem ordentlichen Augenzwinkern zu lesen. Aber heute wirkt das was ich noch so mitkriege, als hätte er in seiner Blase schlicht den Knall nicht gehört.
In Zeiten von Tatsachenverdrehungen und zersetzender Propaganda, ist seine “Medienkompetenzübung” schlicht auf ganzer Länge gescheitert.
Ich stimme dir bei allem zu, aber woher kriegt Lauterbach so einen mächtigen Integrationstest für ein Konstrukt (große Sprachmodelle und ähnliche KIs), deren Indeterminismus ja die Herausforderung ist?
Wenn die jetzt erst einmal mit synthetischen Daten ein Model trainieren und dann die generierten Ausgaben testen wollen, dann muss man ja beweisen können, dass man jede Kombination bedacht hat. Es reicht ja nicht, einfach nur die Ausgabequalität zu erhöhen, was ja das ist wofür solche Test für LLMs geschrieben werden.
Es reicht, wenn das in Ausschreibungstexten oder Verordnungen steht.
Du stellst dir das zu kompliziert vor. Man trainiert nicht nur ein Modell, man testet ALLES komplett. Also z.B. auch die Datenweitergabe in die USA. Wenn dann jemand am anderen Ende private/geheime synthetische Daten extrahieren kann, ist nichts wichtiges verloren.
Abgesehen davon weiß momentan vermutlich kaum jemand, was konkret geplant ist. Dafür muss man vermutlich noch auf Konkretes warten. Das war ja nur eine Ankündigung bisher.
Ich rede hier über die KI selbst und nicht was mit den Daten vor der Eingabe bzw. nach der Ausgabe geschieht. Und da ist das Testen weder trivial noch lange nicht vollständig gelöst. Es einfach zu fordern hilft da wenig.
Daher muss mMn immer davon ausgegangen, dass solche KI es schafft Daten zu deanonymisieren. Entsprechend muss auch die Verantwortung für und Transparenz über deren Nutzung sowie der gesammelten Eingabedaten strikt reguliert werden, wovon wir ja auch noch weit entfernt sind.
Das ist aber das einzig relevante. Ein Modell selbst enthält nie wirklich schützenswerte Daten im Sinne des Datenschutz.
Deswegen wird vorher getestet. Aber mit synthetischen Daten.
Da bin ich voll bei dir. Wird auch gemacht soweit das technisch machbar und sinnvoll ist.
Was würdest du vorschlagen, was über die EU Initiative hinaus geht?
Also dietlibc und tinyldap hab ich schon in serienprodukten gesehen
Und ist dieses “Serienprodukt” jetzt gerade mit uns im Raum?
Letzter Release 2018 per CVS. Sicherlich gibt es paar Entscheider die das durchgehen lassen, weil sie den Unterschied zwischen uClibc und kleinem Zeh nicht kennen.
https://www.telco-tech.de/liss-internet-security-appliance/
Das cvs ist halt auch so ein thema. Fefe nimmt keine patches an. Wir hatten über 100. unter anderem dynamisches linken eingebaut. Wenns auf grösse ankommt ist die dietlibc halt unschlagbar. uclibc ist deutlich grösser.
Klar kann man über den kerl viel negatives sagen ist menschlich bestimmt kein teamplayer, aber dietlibc war schon super. Die software hatte 12mb mit firewall, proxy etc.
Das macht bestimmt total spass das zu maintainen.
Man muss nicht unbedingt alles compilen. Ich bin da schon ein paar Jahre raus aber würde fast wetten, uClibc zu verschlanken ist weit weniger Aufwand als dietlibc für den produktiven Einsatz aufzuspritzen.
Kann mich natürlich täuschen. Dass gatling und dietlibc guter code ist (oder mal war) bestreite ich nicht. Aber das allein reicht halt nicht, sonst hätten wir hierzulande nicht die Probleme, auf die Fefe so gerne herab blickt.
glaube ich nicht. die uclibc hat halt einfach viel mehr features. Dafür hat man halt auch viel weniger Aufwand Software damit zu bauen. und heutzutage kommts auf das bisschen Grösse meistens ja nicht mehr so an. Damals hat sich die Frage aber gar nicht gestellt, weil es noch gar keine uclibc gab.
das herab blicken ist hier halt das Problem, glaube ich. Hätte der damals (als es eben noch keine Alternativen gab) etwas sozialkompatibler und offener auf der dietlibc Mailingliste kommuniziert und mehr Ideen und patches angenommen, anstatt auf Prinzipien zu beharren im DJB-Style, wäre die dietlibc heute vielleicht auf jedem Plastikrouter á la FritzBox. Wer weiss.