Nein, es geht jetzt nicht um die NSA-Affäre.
Es geht um dieses Un-Wort für Data-Mining.

Immer wenn ich dieses Wort lese stellen sich mir alle Haare auf (zum Glück scheinen es nur mittelmäßige Journalisten zu verwenden, die für quantitative Nachrichtenseiten mit der bevorzugten Farbe Rot - alle drei - schreiben)

  • Es handelt sich dabei anscheinend um eine deutschtümelnde Wortschöpfung. Ich denke nicht, dass man hier auf eine solche Notfallübersetzung zurückgreifen muss. Es gibt wahrlich bessere Alternativen, man muss nur präziser sein.
  • “Schürfen” mag eine dem Bergbaufachmann oder im Ruhrpott gängiger Begriff für das Abbauen und Gewinnen von Erzen sein. Für viele Deutsche klingt es heute aber einfach nur noch nach etwas “abschaben”. D.h. “Daten abschaben”?
  • Der Duden kennt übrigens … “Data-Mining”. Ein etwaiges “Datenschürfen” nicht.
  • … prominent in der Duden-Erklärung ist das Wort “Auswertung”. Eine bessere naive Übersetzung wäre also wenigstens: Datenbankauswertung. Aber das ist den lieben Journalisten natürlich nicht reißerisch genug: “Deutschland will Weltmeister im Datenschürfen werden!” Aua, aua. Ja, gleich nachdem wir Sahra Wagenknecht im Dschungelcamp nackt gesehen haben, zusammen mit Beendet-alles-Pofalla, und die Politiker das erste Mal ein Großprojekt erfolgreich abgeschlossen haben, ohne den Zeit- und Kostenrahmen zu sprengen.
  • Der gängige Begriff ist übrigens: Wissensentdeckung in Datenbanken. Hakt aber auch etwas - es fehlt das “automatisch” - und ist natürlich so für Schlagzeilen denkbar ungeeignet.
  • Meistens gibt es übrigens auch präzisere Begriffe (und allzu of: richtigere, denn nicht überall wo “data mining” draufgeschrieben wird, ist auch fortgeschrittene Analyse drin):

  • Das massive Sammeln von Daten ist kein Data-Mining, sondern einfach genau das: massives Sammeln von Daten
  • Auch die “Privatsphäre” hat schon ein, zugegebenermaßen schwieriges, eigenes Wort
  • Überwachung” ist besser geeignet, um die NSA zu beschreiben. Denn Analysieren können die ihre gesamten Daten schon lange nicht mehr. Mit ach und krach noch durchsuchen und filtern!
  • Suchen” (übrigens das alte deutsche Wort für “gugeln”) ist auch oft viel passender. Ebenso das Wort “Filtern
  • Elektronische Datenverarbeitung”! Zugegeben, “EDV” klingt alt, aber letztlich wird genau das gemacht… und diese Abkürzung sollten noch die meisten Leser kennen.

Apropos, weil ich eh schon so am Schimpfen bin: mit “Big Data” ist das ganz genauso. Alles ist Big Data. Selst wenn ich mir die Nase schneuze, dann ist das manchmal “Big Data”. Denn ebenso wie “Data Science” ist dieser Begriff eigentlich undefiniert. Insbesondere: was ist es denn nicht? Und selbst wenn es eine gute, weit anerkannte Definition gäbe, würde sich einfach keiner dran halten.

Hier ist meine Definition von Big Data:

Big Data ist der nice try, ein bestehendes Technologieportfolio mit maximalen return of investment (ROI) in Big Bucks zu transformieren, indem man das Buzzword-des-Tages darauf anwendet, und hofft dass die anderen Chief Marketing Officers (CMOs) nicht genau auf die gleiche brilliante Idee gekommen sind.