RECALL: Übungsfreies kontinuierliches Lernen für die Objektklassifizierung
Markus Knauer, Maximilian Denninger, and Rudolph Triebel
IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 2022
conference paper, paper with supplementaries, code, dataset
Zusammenfassung
Faltungsneuronale Netze zeigen bemerkenswerte Ergebnisse bei der Klassifizierung, haben aber Probleme damit, neue Dinge im Handumdrehen zu lernen. Wir stellen einen neuartigen probenfreien Ansatz vor, bei dem ein tiefes neuronales Netzwerk kontinuierlich neue, ungesehene Objektkategorien lernt, ohne Daten von früheren Sequenzen zu speichern. Unser Ansatz wird RECALL genannt, da das Netzwerk Kategorien abruft, indem es Logits für alte Kategorien berechnet, bevor es neue trainiert. Diese werden dann beim Training verwendet, um eine Änderung der alten Kategorien zu vermeiden. Für jede neue Sequenz wird ein neuer Kopf hinzugefügt, um die neuen Kategorien unterzubringen. Um das Vergessen abzumildern, stellen wir eine Regularisierungsstrategie vor, bei der wir die Klassifizierung durch eine Regression ersetzen. Außerdem schlagen wir für die bekannten Kategorien einen Mahalanobis-Verlust vor, der die Varianzen einbezieht, um die wechselnde Dichte zwischen bekannten und unbekannten Kategorien zu berücksichtigen. Schließlich stellen wir einen neuartigen Datensatz für kontinuierliches Lernen (HOWS-CL-25) vor, der speziell für die Objekterkennung auf einem mobilen Roboter geeignet ist und 150.795 synthetische Bilder von 25 Kategorien von Haushaltsgegenständen enthält. Unser Ansatz RECALL übertrifft den aktuellen Stand der Technik bei CORe50 und iCIFAR-100 und erreicht die beste Leistung bei HOWS-CL-25.

HOWS-CL-25 (Household Objects Within Simulation dataset for Continual Learning) ist ein synthetischer Datensatz, der speziell für die Klassifizierung von Objekten auf mobilen Robotern entwickelt wurde, die in einer sich verändernden Umgebung (z.B. in einem Haushalt) arbeiten, in der es wichtig ist, neue, noch nie gesehene Objekte im Handumdrehen zu lernen. Dieser Datensatz kann auch für andere Lernzwecke verwendet werden, z.B. zur Segmentierung von Objekten oder zur Tiefenschätzung. Oder wo Haushaltsobjekte oder kontinuierliches Lernen von Interesse sind. HOWS enthält 150795 RGB-Bilder mit 25 Kategorien, über 925 Instanzen von Haushaltsgegenständen und entsprechende Normal-, Tiefen- und Segmentierungsbilder. Der Datensatz wurde mit Blenderproc erstellt.
