[1] M. A. Devi, C. P. S. Prakash, R. P. Chinnannavar, V. P. Joshi, R. S. Palada, and R. Dixit, “An Informatic Approach to Predict the Mechanical Properties of Aluminum Alloys using Machine Learning Techniques,” in Proceedings of the International Conference on Smart Electronics and Communication (ICOSEC 2020) IEEE Xplore Part Number: CFP20V90-ART, 2020. PDF

[2] C. Karina, P.-jo Chun, and K. Okubo, “Tensile strength prediction of corroded steel plates by using machine learning approach,” Steel and Composite Structures, vol. 24, no. 5, 2017. PDF

[3] S. Bosse, E. Kalwait, Damage and Material-state Diagnostics with Predictor Functions using Data Series Prediction and Artificial Neural Networks, ECSA 2020 MDPI, 15.11 -30.11.2020, Basel, Switzerland PDF

Daten

Zuerst sich einen Übberlick über die Daten verschaffen ("Anamnese"):
- Wertebereiche (siehe obige Plots)
- Art der Daten und Verlauf
- Sind Gruppen erkennbar? (Klar: es sind Datensätze aus drei verschiedenen Serien)

Eingabe- und Zielvariable

Datenvorverarbeitung

Merkmalsselektion

Datenerweiterung

Datenpartitionierung

Modell

Modell A: Neuronales Modell

Modell B: SVM

Modell C: KNN

Verschiedene Datensätze verwenden (dataXY, dataXYR!!!, und Partitionen) und testen (s.u.)
- Was passiert wenn man dataXY verwendet (Testergebnisse)? Warum solch ein Ergebnis?
- Vergleiche Verwendung von dataXY mit dataXYR beim Test UND Abhängigkeit von ε!

Training

Modell A

Test

Zunächst Training mit allen Dateninstanzen durchführen (Modell A)
Finde heraus ob das Problem mit einem ANN ohne innere Schichten mit einem maximalen Fehler von höchstens 30% lösbar ist
Füge innere Schichten hinzu mit unterschiedlicher Anzahl von Neuronen. Gibt es eine Verbesserung? Achtung: Insgesamt können bis zu 100000 Iterationen erforderlich sein! (Z.B mit der Konfiguration [10,7,3,1])
Was passiert wenn man randomisiert die Dateninstanzen 21721 aufteilt? Wiederhole die Versuche. Erweitere den Test auf Trainingsdaten, Testdaten, und alle Dateninstanzen.
Welche Dateninstanzen (Experimente) fallen besonders auf (also bezüglich der Zielvariable)? Was macht die Lösung dieses Problems so schwierig?
Verändere die Parameter der Merkmalsselektion ([x0,x1] und xdelta). Achtung: Xdelta muss bei Veränderung |a-b| angepasst werden so dass immer 10 Datenpunkte extrahiert werden (prüfe z.B. mittels des Shell this.dataXY[0])
Jetzt das Modell B (SVM) erzeugen und trainieren. Gibt es mit einer SVM brauchbare Ergebnisse? Wenn nicht, woran könnte es liegen? Beachte die Problemklassen für die SVM geeignet sind.
Schließlich ModellC KNN: Verschiedene Datensätze verwenden (dataXY, dataXYR!!!, und Partitionen) und testen (s.u.)
- Was passiert wenn man dataXY verwendet (Testergebnisse)? Warum solch ein Ergebnis?
- Vergleiche Verwendung von dataXY mit dataXYR beim Test UND Abhängigkeit von ε!
- bei verwndung von dataXYR: Welches maximale ε (Rauschen) ist noch möglich wenn der maximale fehler < 20% sein soll?
- Was passiert wenn mit Trainings/Testpartitionen arbeitet (nicht verrauschte Daten)? Mehrfach testen.

Materialeigenschaften und Vorhersage

Überblick und Publikation