Automatische Schadensdiagnostik

In der Werkstoff- und Prüftechnik

PD Stefan Bosse

Universität Bremen - FB Mathematik und Informatik / AG 0

Universität Siegen - FB Maschinenbau / LMW

1 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren ::

Daten und Sensoren

Metriken von Daten

Metriken von Aussagen

Sensoren als Datenquellen

Messverfahren und Sensorsysteme

2 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Daten

Daten

  • Daten sind die Grundlage für die Modellbildung und Modelltestung

  • Daten können aus einer Vielzahl von Quellen stammen

    • Experiment
    • Simulation
    • Feldstudie
    • Abgeleitet aus anderen Datensätzen:
      MapAndReduce(D): DD'
3 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Daten

Daten

  • Allgemein kann man Daten und deren Werte unterteilen in:

    • Skalare Werte, wie Temperatur, Alter, usw.
    • Serien von Skalaren Werten, wie Zeitserien
    • Vektorielle Werte wie Bilder
    • Zusammengesetzte Daten, also Datenstrukturen (Records)
  • Daten haben daher eine Dimensionalität 𝕏N, wobei die Wertemenge 𝕏 einer Dimension aus den ganzen ℕ, reelen ℝ, der Zeit 𝕋 oder kategorischen Wertemengen 𝕊 bestehen kann (oder Untermengen davon).

4 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion

Datenreduktion

  • Ziel der Datenanalyse ist die Reduktion von Eingabedaten bezüglich Größe und Dimensionalität:

P(XN):XNYM|Y|<|X|,M<N

  • Materialwissenschaften und Messtechnik:
    • Häufig metrische Eingabevariablen
    • Häufig metrische oder kategorische Ausgabevariablen (inkl. Boolescher Variablen)

isRaining <- function (temp,sunrad,moisture) {
x = TRUE
x[temp < 0] = FALSE
x[temp > 40] = FALSE
x[(sunrad-moisture) > 30] = FALSE
x
}

Beispiel aus der Messtechnik mit einer Datenreduktionsfunktion ℝ3 → 𝔹

5 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion

Datenklassen

Numerische und Metrische Werte
Das sind Werte die abzählbar sind und wo man Relationen (wie kleiner oder größer) sinnvoll definieren kann, also alle reellen und ganzen Zahlen.
  • Beispiele: Temperatur, Länge, Dichte, Porengröße, Dehnung, Kraft, Ort, Zeit
Kategorische Werte
Das sind symbolische Werte für die entweder keine (sinnvolle) Ordnungsrelation existiert oder wo sich wenigstens keine Differenzen bilden lassen.
  • Beispiele: Schadenstyp, charakteristisches Merkmal (Anomalie?)
6 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion

Datenklassen in R

Boolean: TRUE FALSE
Numerisch: 0 1 1.23 1.2e-3 -5 1L
Kategorisch: "A" "klein" "gross"
Klassen: colors <- list("red"=1,"green"=2,"blue"=3)
7 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion

8 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen in R

Datenklassen in R

https://www.javatpoint.com/r-data-types Kerndatentypen in R

9 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen in R

Skalierung der numerischen Werte

Intervallskaliert
Für diese Art von Attributen sind nur Unterschiede (Addition oder Subtraktion) sinnvoll. Beispielsweise wird die in °C oder °F gemessene Temperatur intervallskaliert. Wenn es 20 °C an einem Tag und 10 °C am folgenden Tag ist, ist es sinnvoll, über einen Temperaturabfall von 10 °C zu sprechen, aber es ist nicht sinnvoll zu sagen, dass es doppelt so kalt ist wie am Vortag.
Verhältnisskaliert
Hier kann man sowohl Differenzen als auch Verhältnisse zwischen Werten berechnen. Zum Beispiel kann man für das Alter sagen, dass jemand, der 20 Jahre alt ist, doppelt so alt ist wie jemand, der 10 Jahre alt ist.
10 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen in R

Ordnungsrelationen

Nominal
Die Attributwerte in der Domäne sind ungeordnet und somit nur Gleichheitsvergleiche sinnvoll. Das heißt, wir können nur überprüfen, ob der Wert des Attributs für zwei bestimmte Instanzen gleich ist oder nicht. Zum Beispiel ist Geschlecht ein nominales Attribut.
Ordinal
Die Attributwerte sind geordnet und somit Gleichheitsvergleiche (ist ein Wert gleich einem anderen?) und relationale Vergleiche (ist ein Wert kleiner oder größer als ein anderer?) sind erlaubt, obwohl es möglicherweise nicht möglich ist, die Differenz zwischen den Werten zu quantifizieren!
11 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Datenklassen (longitudinal)

  • Sensor- und Messdatenvariablen (sowohl kategorisch wie auch metrisch) können weiter unterschieden werden in:
Statisch
Die Variable s ist zeitlich nicht veränderlich bzw. ist in einem wesentlichen Zeitintervall t ∈ [t0, t1] als stationär (unveränderlich) anzusehen.
Dynamisch
Zeitlich veränderliche Variable s(t) ist zeitabhängig und bildet eine Datenserie (oder Zeitvektor) s(t)={s0,s1,..st} bei disketer Erfassung, d.h., wir sprechen von longitudinalen Daten.

Ein Sensorsignal ist zeitlich immer diskret, aber die physikalische Variable die der Sensor misst ist zeitlich kontinuierlich (Sampingtheorem beachten)

12 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Strukturierte Daten

http://venus.ifca.unican.es/Rintro/dataStruct.html Strukturierung von Daten in Vektoren, Listen, Matrizen und Arrays (Tensoren)

13 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Strukturierte Daten

  • Vektoren: eindimensionale Arrays, die zum Speichern von Sammlungsdaten desselben Modus verwendet werden

    • Numerische Vektoren (Modus: numerisch)
    • Komplexe Vektoren (Modus: komplex)
    • Logische Vektoren (Modell: logisch)
    • Zeichenvektor oder Textzeichenfolgen (Modus: Zeichen)
  • Matrizen: zweidimensionale Arrays zum Speichern von Datensammlungen desselben Modus. Auf sie wird über zwei ganzzahlige Indizes zugegriffen.

  • Arrays: ähnlich wie Matrizen, aber sie können mehrdimensional sein (mehr als zwei Dimensionen)

14 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Strukturierte Daten

  • Faktoren: Vektoren kategorialer Variablen, die die Komponenten eines anderen Vektors gleicher Größe gruppieren sollen

  • Listen: geordnete Sammlung von Objekten, wobei die Elemente unterschiedlichen Typs sein können

  • Datenrahmen: Verallgemeinerung von Matrizen, in denen verschiedene Spalten unterschiedliche Modusdaten speichern können.

  • Funktionen: Objekte, die vom Benutzer erstellt und für Berechnungen wiederverwendet werden.

15 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Datensätze als Matrizen

  • Ein Menge von Daten kann in Matrizenform als Matrix D dargestellt werden (Analogie zur Tabellenform) [1]:

16 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

  • Der Vektor X ist die Menge aller Variablen (Sensoren) und die Spalten der Matrix D:

X=(x1,x2,..,xd)

  • Jede Zeile xj ist ein Rekord der Variablenmenge {Xi|i=1,d} mit konkreten Werten und geben als d-stelliges Tupel je nach Anwendung und Zielsetzung einzelne Beispiele, Instanzen, Experimente, Entitäten, Objekte, und Eigenschaftsvektoren wieder:

dj=xj=(xj,1,xj,2,..,xj,d)

D <- matrix(0,nrow=10,ncol=3)
colnames(D) <- c("x1","x2","y")
17 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

18 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Datentabellen

emp.data <- data.frame(
emp_id = c (1:5),
emp_name = c("Rick","Dan","Michelle",
"Ryan","Gary"),
salary = c(623.3,515.2,611.0,729.0,843.25),
start_date = as.Date(c("2012-01-01", "2013-09-23",
"2014-11-15", "2014-05-11",
"2015-03-27")),
stringsAsFactors = FALSE
)
19 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)

Datentabellen

print(emp.data)
emp_id emp_name salary start_date
1 1 Rick 623.30 2012-01-01
2 2 Dan 515.20 2013-09-23
3 3 Michelle 611.00 2014-11-15
4 4 Ryan 729.00 2014-05-11
5 5 Gary 843.25 2015-03-27
20 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Eingabe- und Ausgabevariablen

Eingabe- und Ausgabevariablen

  • Die Variablenmenge setzt sich aus Ein- und Ausgabevariablen zusammen

  • Sensoren sind typischerweise Eingabevariablen x

  • Aussagen sind Ausgabevariablen y, also Ergebnisse die sich aus den Eingangsvariablen ableiten lassen können (durch eine Funktion F):

Xxy=(X1,X2,..,Xu,Y1,Y2,..,Yv)X=(X1,X2,..,Xu)Y=(Y1,Y2,..,Yv)dj=(xj,1,xj,2,..,xj,u,yj,1,yj,2,..,yj,v)F(X):XY,

mit u+v=d.

21 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Merkmale und Eigenschaften (Features)

Merkmale und Eigenschaften (Features)

Wir unterscheiden zwei Arten von Merkmalen:

Eingabemerkmale Fti
Das sind Merkmale der Eingabedaten x. Das können z.B. statistische Eigenschaften wie der Mittelwert oder Frequenzen eines Zeitsignals sein. Die Merkmale sollen möglichst die Zielmerkmale verstärken, also eine signfikante (wenn auch noch nicht bekannte) Abhängigkeit Fto(Fti) besitzen
Ziel- und Ausgabemerkamel Fto
Das sind die Ergebnisse der Datenanalyse, z.B. die Antwort auf die Frage Schaden Ja/Nein?, oder eine Schadensposition, eine Überlebenswahrscheinlichkeit. Die Eingabemerkmale sind die starken Variablen für die Modellfunktion M, die wir suchen.
22 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Merkmale und Eigenschaften (Features)

  • Die Merkmalsselektion ist also die Vorstufe und Datenvorverarbeitung, selten werd mit Rohdaten direkt gearbeitet

  • Es muss eine Merkmalsselektionsfunktion MF geben, die automatisch die Merkmale aus den den Daten ableitet:

M(x):xyFtoyMF(x):xFtiMt(Fti):FtiFto

23 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix

Beispiel einer Datenmatrix

  • Botanischer Datensatz mit geometrischen (numerischen) Eigenschaften einer Pflanze und kategorischer Klassifikation:

M. J. Zaki and W. Meira, Data Mining and Machine Learning - Fundamental Concepts and Algorithms,2020

24 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix

  • Messdatensatz

Berechnetes Dehnungs-Spannungsdiagramm

www.precifast.de/elastizitaetsmodul-e-modul

Messdaten aus Dehnversuch
 

Dehnung [mm] Kraft [kN]
0 0
0.1 0.2
0.2 0.7
0.3 1.5
0.4 1.7
0.5 1.9
0.6 2.0
0.7 0.2
0.8 -0.5
25 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix

Prüftechnik und Messung

Quality Magazin, 2017 Dehnungsversuch mit Dehnungs-Kraft Diagramm

26 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix

Attribute

  • Die gemessenen Variablen X1 bis X4 sind metrische Datenvariablen, die Variable X5=y ist eine kategorische Variable!

  • Die gemessenen Variablen X1 bis X4 (also Sensoren) nennt man Attribute, da sie Eigenschaften und beschreibende Variablen der Zielvariablen y sind

27 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren

Sensoren

Welche Sensoren und Messdaten kennt ihr:

28 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren

Sensoren

  • Messtechnik

    • Physikalische Größen wie Temperatur, Dehnung, Spannung, Zeit
    • Fusionierte Umfragevariablen (z.B. Ensemblemittelwerte)
  • Bei der Messung mit Sensoren unterscheidet man:

    • Einmalige bzw. einzelne Messungen (single shot)
    • Wiederholte Messungen der gleichen physikalischen Größe (Mittelwertbildung..)
    • Serien von Messwerten, vor allem zeitaufgelöste Datenserien:
      D = {d1,d2,..,dn}, wobei i.A. Δt(di,di+1)=constant
29 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren

Sensoren

  • Soziotechnische Systeme, Umfragen

    • Umfragevariablen (Antworten auf Fragen) sind Sensoren von einzelnen Menschen
    • Fusionierte Umfragevariablen (z.B. Ensemblemittelwerte) sind Sensoren von Menschengruppen
  • Allgemein verfügbare Daten

    • Soziale Netzwerke und soziale Medien
    • Datenbanken von Behörden usw.
30 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren

Zeitserien

R. Jha and S. V. Barai,Neural Networks and Genetic Algorithms in Struc-tural Health Monitoring, 2016 Zeitaufgelöste Ultraschallsignale (geführte Wellen) in der Schadensdiagnostik

31 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensormodell

Sensormodell

  • Ein Sensor ist ein Messwandler, auch in der Soziologie (Indikator für eine Eigenschaft die nicht direkt messbar ist)

  • Ein Sensor bildet daher eine i.A. physikalische Größe x auf eine andere Größe y ab:

S(x):xy,K:correct(xy)

  • Es gibt i.A. eine Kalibrierungsfunktion K(f,x,y)

  • Beispiele:

    • Druck → Spannung, Strahlung → Strom, usw.
    • Soziale Vernetzung → Numerischer Radiuswert, Wählerstimmen → Politik, d.h., Zuordnung von Zahlen zu Objekten oder Ereignissen nach festgelegten Regeln
32 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensordaten

Sensordaten

  • Sensoren S sind Datenquellen d von physikalischen, soziologischen oder sonstigen natürlichen nicht direkt erfassbaren Größen x

  • Die Datenwerte (numerisch) werden in einem definierbaren Intervall liegen

    • Die Kenntnis des Werteintervalls ist wichtig für spätere Datenverarbeitung, Analyse, und Maschinelles Lernen!
    • Kategorische Werte werden ebenfalls durch eine Menge definiert

S(x):xdd[a,b]{v0,v1,..,vi}

33 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensordaten

Mess- und Sensorische Systeme

Der Ursprung der Daten für Analyse und Maschinelles Lernen!

Ein Sensor kommt selten allein.

34 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messverfahren

Messverfahren

Man unterscheidet zwei verschiedene Messverfahren:

Passives Messverfahren
Die sensorischen Werte sind Ergebnis einer intrinsischen Eigenschaft (Dichte) oder bereits existierender externer Größen (Temperatur). Der Stimulus der Messung ist das Bauteil, der Mensch, die Umwelt.
Aktive Messverfahren
Es gibt einen aktiven Stimulus dessen Antwortsignal durch den Sensor erfasst wird. Beispiel ist das Ultraschallmessverfahren mit geführten Wellen. Das Sensorsignal ist immer abhängig vom Stimulus. In der Soziologie ist der Stimulus z.B. ein Fragenkatalog in einer Umfrage, die Antworten sind die Sensorvariablen.
35 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation

Sensoraggregation

Sensorklassen

Physische Sensoren
Physische Sensoren messen direkt eine Größe mit einem Messinstrument (kann auch die Auswertung einer Frage in einem Fragebogen sein), Smartphone
Virtuelle Sensoren
Verwenden Daten (von physischen und anderen virtuellen Sensoren) um neue sensorische Werte zu berechnen (kein Messinstrument) → Aggregatoren!!
36 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation

Sensoraggregation

Schichtenmodell von Sensorischen Systemen

In sensorischen Systemen werden Sensordaten in verschiedenen Ebenen verarbeitet:

  • Vertikale Ebenen repräsentieren die sensorischen Domainen und die Sensorklassen;

  • Horizontale Ebenen repräsentieren die Datenverarbeitung.

37 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation

Sensoraggregation

Vertikale Ebenen

Perzeption
Hier findet die Akquisition der rohen Sensordaten statt. Die Sensoren sind räumlich verteilt und werden lokal vorverarbeitet.
Aggregation
Einzelne Sensordaten werden zeitlich und räumlich zusammengeführt und gesammelt (Sensorfusion)
Applikation
Die gesammelten Daten werden nutzbar gemacht: Weitere Datenverarbeitung, Aufbereitung, Eigenschaftsselektion, Informationsgewinnung, Visualisierung
38 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation

Sensoraggregation

Horizontale Ebenen

  • Die horizontalen Ebenen durchziehen alle vertikalen Ebenen:
    1. Sicherheit
    2. Datenverarbeitung
    3. Kommunikation
    4. Datenspeicherung
    5. Nachrichtenvermittlung
    6. Management
39 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation

Sensoraggregation

figsenslayers1

Grundlegender Zusammenhang der horizontalen und vertikalen Ebenen in Sensorischen Systemen

40 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation

Sensoraggregation

figsenslayers2

Räumliche Abbildung der vertikalen Ebenen auf Cloud Computing

41 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoren in den Ebenen

Sensoren in den Ebenen

Erfassung
Vorwiegend physische Sensoren
Aggregation
Virtuelle Sensoren, Datenreduktion (Größe und Dimensionalität)
Applikation
Datenanalyse und Modellbildung, Inferenz von Information, Maschinelles Lernen
42 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

  • Die Messgrößen können statisch (zeitlich konstant) oder dynamisch (zeitlich veränderlich) sein. Die Wandlung dieser Messgrößen ergeben dann entsprechend Gleich- und Wechselsignale.

  • Auch eine prinzipiell zeitlich unveränderliche Messgröße (bezogen auf die Messung in einem vorgegeben Zeitinterval τ) erzeugt kein konstantes Signal. Ursache: Rauschen

  • Wiederholt man daher eine Messung N-mal unter gleichen Bedingungen, so wird man eine Reihe von verschiedenen Messwerten {s1,s2,...,sn} erhalten.

  • Es gibt systematische und zufällige Fehler bei der Messung, die sich überlagern.

43 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

Systematische Abweichung (systematischer Fehler)

  • Abweichung wird durch den Sensor verursacht
  • z.B.: falsche Eichung, dauernd vorhandene Störungen wie Reibung
  • lässt sich nur durch sorgfältiges Untersuchen der Fehlerquelle beseitigen

Zufällige Abweichung (zufälliger oder statistischer Fehler)

  • Abweichung wird durch unvermeidbare, regellose Störungen verursacht
  • bei wiederholter Messung weichen Einzelergebnisse voneinander ab
  • Einzelergebnisse schwanken um einen Mittelwert
44 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

J. G. Webster, Measurement, Instrumentation and Sensors Handbook, 1999 figmeaserr1

Offset und Präzision bei der Messung einer Variable X

45 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

Systematische Fehler

  • Eine Messgröße X ist meistens durch störende Messgrößen Y,Z,... usw. überlagert:

K(X,Y,Z) : X×Y×ZS,K(x,y,z)mn=0anxn+mn=0bnyn+mn=0cnzn

So kann z.B. bei einer Messung einer Kraft oder einer Dehnung die umgebende Temperatur T oder Strukturschwingungen Einfluss auf den Sensor und dessen Übertragungsfunktion und somit auf das Messsignal S haben.

46 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

Systematische Fehler

So kann z.B. bei einer Messung von sozialpsychologischen Parametern der Wohnort und die Lebensumgebung Einfluss auf den Sensor und dessen "Übertragungsfunktion" und somit auf das "Messsignal" S haben.

47 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

J. G. Webster, Measurement, Instrumentation and Sensors Handbook, 1999 figinstrmod3

  • Systematische Fehler verfälschen die Kalibrierungsfunktion (z. B. bei Geraden den Offset und Steigung). Sind sie bekannt, können sie kompensiert (rausgerechnet) werden.
  • Systematische Fehler können aber auch während der Signalverarbeitung entstehen, so z.B.
    • Offsetspannungen und zeitlicher Drift von Parametern (Verstärkungsfaktor); durch
    • Rundungsfehler oder Verwendung von Funktionsmodellen außerhalb ihres Spezifikationsbereiches.
48 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

Zufällige Fehler - Streuung

  • Zufällige Fehler beeinflussen die Genauigkeit einer Messung (Rauschen).

  • Rauschen beeinflußt die Berechung von Eingabedaten- und Zieleigenschaften (ML Ausgabe)!

  • Wiederholt man eine Messung einer Größe X die durch reine zufälligen Fehler verfälscht wird, so ist die Häufigkeitsverteilung der Messwerte S={s1,s2,...,sn} um einen Mittelwert ¯S durch eine Gaussverteilung gegeben (dabei muss die Anzahl der Messungen N groß sein).

49 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

J. G. Webster, Measurement, Instrumentation and Sensors Handbook, 1999 figgaussdist

Häufigkeitsverteilung nach Gauss von Messwerten um einen Mittelwert

50 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

  • Der Mittelwert S repräsentiert die Abschätzung des wahren/wirklichen Wertes Σ der Messgröße X (oder S):

¯S = 1N Ni=1si

  • Die Standardabweichung ist ein Maß für die Zuverlässigkeit (Präzision) der einzelnen Messwerte einer Messreihe {s1,s2,...,sn}:

σ =  1N1 Ni=1(si¯S)2 

51 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Eine Vergrößerung der Anzahl N der Messungen (unter gleichen Bedingungen!) führt zu einer Verbesserung des Mittelwertes ¯S (Grenzfall N → ∞), nicht aber zu einer wesentlichen Verkleinerung der Standardabweichung σ, da die Genauigkeit nicht steigt!

52 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

  • Der wirkliche Mittelwert Σ ist nicht bekannt (nur im Grenzfall N → ∞ ist ¯S=Σ) - Es gibt aber ein Vertrauensintervall mit einer Wahrscheinlichkeit P dass dieser darin enthalten ist:

Σ ∈ [¯S-σ,¯S+σ] mit 68.3%

Σ ∈ [¯S-2σ,¯S+2σ] mit 95.4%

Σ ∈ [¯S-3σ,¯S+3σ] mit 99.73%

53 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen

Messfehler und Vertrauen

  • Auch in der Soziologie!

figinstrmodnoise

Rauschquellen bei einer Messung

54 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Beispiele: Statistische Analyse

Beispiele: Statistische Analyse

55 / 56

PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Zusammenfassung

Zusammenfassung

  • Daten können klassifiziert werden in:

    • Kategorische Variablen und Werte
    • Metrische Variablen und Werte
    • Zeitlich statische Variablen
    • Zeitl dynamische Variablen (Zeitserien)
  • Alle Sensorvariablen unterliegen Messfehlern:

    • Rauschen
    • Verzerrung
    • Verschiebung (Bias)
    • Problem der Reproduzierbarkeit und systematische Fehler (Umgebung!)
  • Eine (statistische) Datenanalyse ist häufig erster Schritt im ML Workflow

56 / 56