Reliable Object Pose Estimation

Publikation: AfhandlingPh.d.-afhandling

307 Downloads (Pure)

Abstract

Denne afhandling addresserer pålidelig estimering af objekters position og orientering, kaldt et objekts pose, fra ét eller flere billeder. Det er ikke altid muligt at identificere posen unikt fra et billede, for eksempel hvis objektet er symmetrisk, eller hvis der er noget, der dækker for objektet i billedet. Istedet for at estimere én mulig pose, fokuserer vi på at estimere usikkerheden som en distribution for at muliggøre pålidelighed i robotapplikationer, der gør brug af pose-estimering.

Først kigger vi på pose-estimering af objekter på en lineær vibrations-feeder, hvor den relevante pose-usikkerhed kan beskrives som en distribution over et diskret sæt af rotationer. Kvantificering af usikkerhed er interessant i denne applikation, fordi et forkert pose-estimat kan lede til produktionsstop, samt beskadigede varer og udstyr, og vi viser, at vores usikkerhedsestimater faciliterer et pålideligt system.

En gængs tilgang til pose-estimering er at etablere korrespondancer mellem punkter i billedet og punkter på objektet. Normalt antages det, at korrespondanceusikkerheden er meget begrænset, men den antagelse falder fra hinanden ved ambiguiteter som dem der kommer ved symmetriske objekter. Vi præsenterer SurfEmb, som modelerer uparametriserede korrespondancedistributioner, og vi viser, hvordan de kan bruges til at forbedre pose-estimering. Metoden var øverst på pose-estimerings-benchmarken, BOP, i næsten et år.

Pose-estimering fra et enkelt billede har problemer med dybdeambiguitet og er følsom overfor hvis noget dækker for objektet i billedet. Vi præsenterer EpiSurfEmb, som optimerer for en pose, der maksimerer korrespondancesandsynligheder på tværs af billeder fra flere vinkler. For at få bedre pose-hypoteser kombinerer vi også 2D-3D korrespondancer fra SurfEmb med epipolar geometri for at opnå 3D-3D korrespondancer. Vores resultater viser, at vi kan reducere fejl med 80-91 %, når der er billeder fra flere vinkler tilgængelige.

Vi præsenterer Ki-Pode, som vender korrespondanceproblemet til at estimere distributioner af projekteringen af prædefinerede punkter på objektet, og vi viser, hvordan de distributioner kan bruges til at estimere en pose-distribution. På grund af mangel på en metode til at normalisere over pose-rummet, viser vi kun distributions-resultater på rotationer, hvor Ki-Pode giver mere pålidelige estimater end andre metoder på YCBV.

Til sidst præsenterer vi SpyroPose, som skalerer uparametriserede distributioner til poserummet. Hovedidéen er at lære distributioner i flere opløsninger, som tillader mere effektiv træning og flere størrelsesordener færre evalueringer ved inferens. Metoden kan både bruges i rotations- og pose-rummet. Vi præsenterer state-of-the-art resultater på estimering af rotationsdistributioner, og på estimering af pose-distributioner viser vi de første kvalitative resultater på virkelige billeder og de første kvantitative resultater overhovedet. Vi viser også at metoden nemt kan udvides til at bruges flere billeder og på den måde begrænse usikkerheder forbundet med at estimere en pose fra et enkelt billede.
OriginalsprogEngelsk
Bevilgende institution
  • Syddansk Universitet
Vejledere/rådgivere
  • Buch, Anders Glent, Hovedvejleder
Udgiver
DOI
StatusUdgivet - 16. okt. 2023

Fingeraftryk

Dyk ned i forskningsemnerne om 'Reliable Object Pose Estimation'. Sammen danner de et unikt fingeraftryk.

Citationsformater