Regelung kooperativer Manipulatoren mit kinematischen Modellunsicherheiten Sebastian Erhart Sandra Hirche Institut für Informationstechnische Regelung Technische Universität München Barer Straße 21 Telefon +49 89 289 25735 Fax +49 89 289 25724 E-Mail [email protected] Institut für Informationstechnische Regelung Technische Universität München Barer Straße 21 Telefon +49 89 289 25723 Fax +49 89 289 25724 E-Mail [email protected] Schlüsselwörter: Kooperative Manipulatoren, Kraft- und Trajektorienregelung, Modellunsicherheiten Autonome robotische Systeme stellen bereits heute in vielen Branchen wie der Logistik, der industriellen Fertigung, der Agrarwirtschaft, der Medizintechnik oder auch im Baugewerbe eine Schlüsselkomponente für eine effiziente Prozessgestaltung dar. Die Koordination eines heterogenen Teams von Robotern bringt durch die Redundanz und die intrinsische, örtliche Verteilung von Sensorik und Aktuatorik eine gesteigerte Effizienz in der Aufgabenausführung sowie eine höhere Toleranz gegenüber dem Ausfall einzelner Komponenten [1,2]. Zu den klassischen Anwendungsgebieten von Multi-Roboter-Systemen zählt beispielsweise der gemeinsame Transport von Objekten - auch als kooperative Manipulation bezeichnet. Ein Beispielszenario ist in der folgenden Abbildung dargestellt. Abbildung 1: Zwei autonome Manipulatoren kooperieren Kooperative Manipulationsaufgaben stellen eine besondere Herausforderung dar, da durch das mit den Manipulatoren verbundene Objekt eine kinematische Kopplung der stark nichtlinearen Roboterdynamiken erfolgt. Für die erfolgreiche Durchführung einer Manipulationsaufgabe werden zeitgleich zwei Regelziele verfolgt: zum einen soll das Objekt einer gewünschten Trajektorie folgen, die das Objekt von der Ausgangspose in die Zielpose überführt. Zum anderen sollen die kooperierenden Roboter nur die gewünschten Endeffektorkräfte aufbringen die benötigt werden, um das Objekt entlang der gewünschten Trajektorie zu bewegen. Die Verwendung lokaler Sensorik der einzelnen Roboter führt aufgrund der nur partiell verfügbaren Information und Messunsicherheiten zu Unsicherheiten in der Relativkinematik. Hierdurch kommt es zu unerwünscht starken Interaktionskräften und Regelfehlern, die zu einer Beschädigung des Objektes und im schlimmsten Fall zu einer Gefährdung des Umfeldes führen können [3]. Die kinematische Koordination eines Multi-Roboter-Teams in Abwesenheit eines globalen Referenzkoordinatensystems ist damit eine der größten Herausforderungen für die effiziente Implementierung von Manipulationsaufgaben außerhalb dedizierter Laborumgebungen [4]. Der Vortrag gibt zunächst einen Einblick in die systemdynamischen Grundlagen und die Modellierung kooperativer Manipulationsaufgaben und verdeutlicht die zentrale Rolle des kinematischen Modells im Hinblick auf die gewünschte TrajektorienRegelung und eine Begrenzung der entstehenden Interaktionskräfte. Darauf aufbauend werden analytische Bedingungen abgeleitet, unter denen mit Hilfe der verteilten Sensorik eine Identifikation der relevanten kinematischen Parameter möglich ist. Schließlich wird ein adaptives Regelungskonzept präsentiert, das unter den gegebenen Unsicherheiten des kinematischen Modells das Regelziel der kombinierten Trajektorien- und Kraftregelung erreicht. [1] S. Erhart; S. Hirche: Model and analysis of the interaction dynamics in cooperative manipulation tasks. IEEE Transactions on Robotics (T-RO), accepted, 2016. [2] S. Erhart; S. Hirche: Internal force analysis and load distribution for cooperative multi-robot manipulation. IEEE Transactions on Robotics (T-RO) 31 (5), 2015, 1238 – 1243. [3] S. Erhart; S. Hirche: Adaptive Force/Velocity Control for Multi-Robot Cooperative Manipulation under Uncertain Kinematic Parameters. IEEE/RSJ International Conference on Intelligent Robots and Systems, 2013. [4] S. Erhart; D. Sieber; S. Hirche: An impedance-based control architecture for multi-robot cooperative dual-arm mobile manipulation. IEEE/RSJ International Conference on Intelligent Robots and Systems, 2013. Regelung kooperativer Manipulatoren mit kinematischen Modellunsicherheiten Sebastian Erhart Sandra Hirche Lehrstuhl für Informationstechnische Regelung Technische Universität München 50. Regelungstechnisches Kolloquium in Boppard, 18. Februar 2016 www.itr.ei.tum.de Warum kooperative Manipulation? Vorteile/Nutzen � Lastverteilung auf mehrere Manipulatoren � Gesteigerte Manipulations-Fertigkeiten � Erhöhte Ausfallrobustheit � Integration individiueller Manipulator-Fähigkeiten Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 2 Anwendungsbeispiele Industrielle Fertigung Lufttransport Unterwasser-Arbeiten Katastrophenschutz Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 3 Beispiel-Szenario in Laborumgebung Cooperative Mobile Manipulation S. Erhart D. Sieber T. Nierhoff T. Fritzsch S. Hirche Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 4 Vision & Herausforderungen Das Roboter-Team sollte � Modellwissen � Anpassungsvermögen � und Autonomie besitzen. Kooperierende NASA Roboter Vision Autonomes Roboter-Verhalten in unstrukturierten Umgebungen Herausforderungen: � � Dynamische Modellierung Verteiltes Koordinatenwissen � � � � Verteilte, adaptive Regelung Kooperative Aufgabenplanung ... Motivation Modellierung Analyse � � Adaptive Regelung Zusammenfassung 5 Spezifikation der Manipulationsaufgabe � Tracking der gewünschten Objekt-Trajektorie xdo (t) Einstellung der Soll-Endeffektor-Kräfte/Momente hdi (t) xdo hd1 hd2 � � � � � � hd3 Kooperatives Regelziel lim xo (t) → xdo (t) t→∞ Motivation Modellierung Analyse und lim hi (t) → hdi (t) t→∞ Adaptive Regelung Zusammenfassung 6 Beispiel: Verteiltes Koordinatenwissen Individuelle Endeffektor-Sollgrößen 3.5 Greifkinematik {1} {2} {3} 3 {1} 2.5 {2} 2 y/m {3̂} Goal position 1.5 1 0.5 0 {3} -0.5 -1 -1 0 1 x/m 2 3 Gekoppelte Systemtrajektorie 3.5 Daraus resultierend: � Trajektorien-Fehler � Kraft/Momenten-Fehler {1} {2} {3} 3 2.5 y/m 2 Goal position 1.5 1 0.5 0 → Regelziel wird verfehlt -0.5 -1 -1 0 1 2 x/m Motivation 3 Modellierung Analyse Adaptive Regelung Zusammenfassung 7 Offene Problemstellung Kooperative Kraft-/Bewegungs-Folgeregelung lim xo (t) → xdo (t) t→∞ und lim hi (t) → hdi (t) t→∞ ohne globales Referenz-Koordinatensystem → unsichere kinematische Greifparameter r̂i (t = 0) = ri und q̂i (t = 0) = qi . {j} � � rj ri qi qj {o} pi � Ansatz Direkte adaptive Regelung � {i} po � Motivation {w} Modellierung Analyse Adaptive Regelung Zusammenfassung 8 Übersicht Vorsteuerung Objekt- und Manipulatordynamik hd1 hdN ẍdo ẍo ẍd1 ẍdN G+ (r̂, q̂) � r, q � ẍ1 ẍN Greifparameter-Schätzer r̂, q̂ Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 9 Manipulator & Objekt-Dynamik Impedanz-geregeltes Endeffektor-Verhalten [Hogan 1984; Caccavale et al. 2008] d d Mi (ẍi − ẍdi ) + Di (ẋi − ẋdi ) + hK i (xi , xi ) = hi − hi xi ∈ SE(3), ẋi ∈ se(3), hi ∈ se⊤ (3), hK i = Ki δxi , positiv definite Matrizen Mi , Di , Ki ∈ R6×6 Starrkörper-Dynamik hN h1 Mo ẍo + Co ẋo + hg = ho � ho xo ∈ SE(3), ẋo ∈ se(3), ho ∈ se⊤ (3) Coriolis Matrix Co , Gravitations-Kraft hg Annahme Das Objekt ist starr und die Endeffektoren sind starr gekoppelt. Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 10 Kinematische Kopplung h1 h1 hN hN rN r1 � ho Kinetostatik h1 ho = G ... G= hN 03 I3 S(r1 ) I3 ··· ··· I3 S(rN ) Kinematische Zwangsbedingungen Translation: o Rotation: o ri = const. qi = const. ⇓ ⇓ p̈i = p̈o + ω̇o × ri + ωo × (ωo × ri ) ω̇o = ω̇i Wie groß sind die Endeffektor-Kräfte/Momente? Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 11 Gekoppelte Systemdynamik Σ ho ho ẍo Σ ẍ1 h1 h1 .. = .. + .. . . . Mo M1 .. . ẍN MN hΣ N hN d d K d d hΣ i := Mi ẍi − Di [ẋi − ẋi ] − hi (xi , xi ) − hi mit hΣ o := −Co ẋo + hg , unter der Zwangsbedingung −I3 03 . . . −I 3 03 r1 × −I3 . . . rN × −I3 I3 03 03 I3 03 03 . 03 03 . . 03 03 I3 03 03 ω o × ωo × r1 ẍo 03 03×1 ẍ1 . . = . . . . 03 ω o × ωo × rN ẍN I3 03×1 Differential-algebraische Gleichung M ẍ = hΣ (xd , hd ) + h so dass Aẍ = b Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 12 03 I3 Gaußsches Prinzip Prinzip des kleinsten Zwanges [Udwadia and Kalaba 1992] (ẍ − ẍΣ )T M (ẍ − ẍΣ ) minẍ so dass Aẍ = b mit der Beschleunigung des ungekoppelten Systems ẍΣ := M −1 hΣ Explizite Lösung gegeben durch 1 1 h = M 2 (AM − 2 )† (b − AẍΣ ) Gewöhnliche Differentialgleichung 1 [Erhart and Hirche 2016] @ IEEE T-RO 1 M ẍ = hΣ + M 2 (AM − 2 )† (b − AM −1 hΣ ) Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 13 Übersicht Vorsteuerung Objekt- und Manipulatordynamik hd1 hdN ẍdo ẍo ẍd1 ẍdN G+ (r̂, q̂) � r, q � ẍ1 ẍN Greifparameter-Schätzer r̂, q̂ Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 14 Kooperative Kraft/Bewegungs-Koordination Objekt- und Manipulator-Dynamik r M1 , D1 , K1 Vorsteuerung r̂ ẍd1 , hd1 GT hΣ 1 ẍ1 , h1 � Kinematische Koordination MN , DN , KN ẍdN , hdN hΣ N Gekoppelte Dynamik ẍN , hN � Manipulator-Dynamik M̂o ẍdo Mo r̂ hdo � Inv.-Dyn. G+ Lastverteilung hd1 hdN hΣ o ho � ẍo , ho ẍo Objekt-Dynamik Ziel Invertierung des (überaktuierten) Strecken-Modells Lastverteilung Kinematische Koordination ẋd 1 . T d . = G ẋo . ẋd N Motivation Modellierung hd 1 . + d . = G ho . hd N Analyse Adaptive Regelung Zusammenfassung 15 Lastverteilung Bisher keine allgemeine Lösung für G+ � Redundantes Eingangssystem � Allokation von internen Kräften ⇔ hint ∈ Ker(G) Neue generalisierte Inverse [Erhart and Hirche 2015] @ IEEE T-RO ∗ ∗ ∗ ∗ G+ M (mi , Ji ) mit mi , Ji > 0 ist frei von internen Kräften/Momenten Berechnung: 1 1 hint = M 2 (AM − 2 )† (b − Aẍd ) Verallgemeinerung durch Prinzip der virtuellen Arbeit hint ∈ Ker(G) ⇔ (hint )T GT δxo = 0 → Greifparameter auch für Lastverteilung/interne Kräfte wichtig Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 16 Modellbasierte Kraft/Bewegungs-Vorsteuer. Gegeben Mo , G sowie xo (t = 0) und ẋo (t = 0), dann folgt ho (t) ≡ hdo (t) xo (t) ≡ xdo (t) und ohne dabei interne Kräfte/Momente aufzubringen. [Erhart and Hirche 2016] @ IEEE T-RO Objekt- und Manipulator-Dynamik r M1 , D1 , K1 Vorsteuerung r̂ ẍd1 , hd1 GT hΣ 1 ẍ1 , h1 � Kinematische Koordination MN , DN , KN ẍdN , hdN hΣ N Gekoppelte Dynamik ẍN , hN � Manipulator-Dynamik M̂o ẍdo hdo � Inv.-Dyn. Mo r̂ G+ Lastverteilung hd1 hdN ho hΣ o ẍo ẍo , ho � Objekt-Dynamik Was passiert für den Fall, dass G(r̂) = G(r)? Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 17 Übersicht Vorsteuerung Objekt- und Manipulatordynamik hd1 hdN ẍdo ẍo ẍd1 ẍdN G+ (r̂, q̂) � r, q � ẍ1 ẍN Greifparameter-Schätzer r̂, q̂ Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 18 Koordination ohne globale Referenz {N } {1} {N} {o} {i} {1} {w} {i} → Greifparameter r̂i & q̂i mit Unsicherheit behaftet Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 19 Beispiel: Verteiltes Koordinatenwissen Individuelle Endeffektor-Sollgrößen 3.5 Greifkinematik {1} {2} {3} 3 {1} 2.5 {2} y/m 2 {3̂} Goal position 1.5 1 0.5 0 {3} -0.5 -1 -1 0 1 x/m 2 3 Gekoppelte Systemtrajektorie 3.5 {1} {2} {3} 3 2.5 y/m 2 Goal position 1.5 Identifikation der Greifparameter für Regelziel erforderlich 1 0.5 0 -0.5 -1 -1 0 Motivation 1 x/m 2 3 Modellierung Analyse Adaptive Regelung Zusammenfassung 20 Annahmen Parameter-Identifzierbarkeit [Aghili 2013] Die Objekt-Winkelgeschwindigkeit ωo ∈ R3 erfüllt die persistente Erregungsbedingung / span(ωo ). ω̇o ∈ Im Folgenden: Planare Manipulationsaufgabe mit xo ∈ SE(2) Quasi-statische Manipulation ho = Gh ≈ 0. Kinematische Koordination mit ẋd1 := ẋdo j d ẋj = R(ϕ̂1j )[1 ṗdo − ωo s(r̂1j )] ωo ϕ1j ∈ R / r1j ∈ R2 : Relative Orientierung/Translation von {1} und {j} 0 −1 r1j , R(ϕ1j ) ∈ SO(2) s(r1j ) := 1 0 Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 21 Adaptive Kraft/Bewegungs-Vorsteuerung Satz [Erhart 2016] @ Dissertation Adaptive Vorsteuerung erzielt Folgen ẋo (t) → ẋdo (t) und h(t) → hint,d (t) für t → ∞ und initial unsichere Greifparameter r̂(t = 0) = r und ϕ̂(t = 0) ≈ ϕ mit den gradientenbasierten Parameter-Schätzern ˙ ϕ̂,i fi ) ϕ̂˙ = ϕ̂( ˙ i ṗi ). und r̂˙ = r̂(r̂, → Parameterschätzer auf Basis lokal messbarer Größen Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 22 Simulation I Ohne Parameterschätzung Mit Parameterschätzung 3.5 3.5 {1} {2} {3} 3 2.5 2.5 Goal position 1.5 1 1.5 1 0.5 0.5 0 0 -0.5 -0.5 -1 0 1 2 x/m 2.0m -1 3 -1 0 1 2 x/m 3 1.0m / 10s, Sollgeschwindigkeit: ẋd o = π rad 2 Adaptive Reglerverstärkung: Kϕ = 10I2 , Initiale Schätzwerte: ϕ̂13 (t0 ) − ϕ13 = 0.5rad, Motivation Goal position 2 y/m y/m 2 -1 {1} {2} {3} 3 Modellierung r̂13 (t0 ) − r13 = Analyse Kr = 100I4 0.0m −0.13m Adaptive Regelung Zusammenfassung 23 Simulation II Ohne Parameterschätzung Mit Parameterschätzung 0 -10 f1 / N 10 x y o o f1 / N 10 0 0.5 1 1.5 2 2.5 3 -10 f2 / N x y 0 -10 0 0.5 1 1.5 2 2.5 3 1 1.5 2 2.5 3 x y 0 0.5 1 1.5 2 2.5 3 f3 / N 10 x y 0 o f3 / N o 0.5 0 -10 10 -10 0 10 o o f2 / N 10 x y 0 0 0.5 1 1.5 2 2.5 3 x y 0 -10 0 Zeit / s 0.5 1 1.5 2 Zeit / s → Kraftregelfehler (hier fid = 0) verschwindet mit Schätzfehler Kopplung von Parameterschätzung & Regelziel Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 24 2.5 3 Vollständiges Blockschaltbild Gekoppelte Dynamik Vorsteuerung 1 hd 1 N hd N o ẍd o o ẍ 1 ẍd 1 N ẍd N G+ (r̂, q̂) � � Interne Kraft/Moment-Regelung AT (r̂) hint,d o 1 ẍ 1 N ẍ N r, q 1 ẍint 1 N ẍint N Greifparameter Schätzer r̂, q̂ Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 25 Zusammenfassung und Ausblick � � � � � � Dynamische Modellierung inkl. Interaktionskräfte Zentrale Bedeutung der kinematischen Zwangsbedingungen Regelziel für fehlerbehaftete Greifparameter verfehlt Adaptive Regelung bei kinematischer Modellunsicherheit Kombinierte Schätzung von kin. & dyn. Parametern Verteilte Regelungsstrategien Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 26 Multi-Roboter-Forschung am ITR Cooperative Mobile Manipulation S. Erhart D. Sieber T. Nierhoff T. Fritzsch S. Hirche Ausgesuchte Veröffentlichungen: � Internal force analysis and load distribution for cooperative multi-robot manipulation, S. Erhart & S. Hirche, IEEE Transactions on Robotics, 2015. � Model and analysis of the interaction dynamics in cooperative manipulation tasks, S. Erhart & S. Hirche, IEEE Transactions on Robotics, 2016. � Grasp pose estimation in human-robot manipulation tasks using wearable sensors, D. Cehajic, S. Erhart & S. Hirche, International Conference on Robotic Systems, 2015. � Dynamic Load Distribution in Cooperative Manipulation Tasks, A. Zambelli, S. Erhart, L. Zaccarian & S. Hirche, International Conference on Robotic Systems, 2015. � Formation Control with Mismatched Compasses, Z. Meng, B.D O. Anderson, S. Hirche, Automatica, 2016. Motivation Modellierung Analyse Adaptive Regelung Zusammenfassung 27 References I F. Aghili. Adaptive Control of Manipulators Forming Closed Kinematic Chain With Inaccurate Kinematic Model. In: Mechatronics, IEEE/ASME Transactions on 18.5 (2013), pp. 1544–1554. issn: 1083-4435. doi: 10.1109/TMECH.2012.2207964 . F. Caccavale, P. Chiacchio, A. Marino, and L. Villani. Six-DOF Impedance Control of Dual-Arm Cooperative Manipulators. In: Mechatronics, IEEE/ASME Transactions on 13.5 (2008), pp. 576–586. issn: 1083-4435. doi: 10.1109/TMECH.2008.2002816 . S. Erhart and S. Hirche. Internal force analysis and load distribution for cooperative multi-robot manipulation. en. In: IEEE Transactions on Robotics (T-RO) 31.5 (2015), pp. 1238 –1243. doi: 10.1109/TRO.2015.2459412 . S. Erhart and S. Hirche. Modeling and analysis of the interaction dynamics in cooperative manipulation tasks. en. In: IEEE Transactions on Robotics (T-RO), (accepted) (2016). Sebastian Erhart. Cooperative multi-robot manipulation under uncertain kinematic grasp parameters. PhD thesis. Technische Universtiät München, 2016. N. Hogan. Impedance Control: An Approach to Manipulation. In: American Control Conference, 1984. 1984, pp. 304–313. Firdaus E. Udwadia and Robert E. Kalaba. A New Perspective on Constrained Motion. English. In: Proceedings: Mathematical and Physical Sciences 439.1906 (1992), pp. 407–410. issn: 09628444. 28