Anzeige
Anzeige
Anzeige

Crowdsourcing für die Bildverarbeitung

Gamer for Vision

Ein wichtiges Thema bei autonomen Fahrzeugen ist das Machine Learning. Hunderttausende von Beispielen aus einem sogenannten Trainingsdatensatz werden einem Algorithmus präsentiert, von denen er selbstständig lernt, wie z.B. ein Fußgänger, eine Ampel oder eine Dampfwalze aussieht. Die Herausforderung besteht darin, den Datensatz möglichst vielfältig zu gestalteten, damit alle Situationen optimal abgedeckt sind. Anschließend validiert man mit einem noch viel größeren Testdatensatz das Ergebnis: wie viele falsche (oder fehlende) Fußgänger liefert das System?
Damit ein autonomes Auto als sicher gilt, muss es – je nach Schätzung der Experten – zwischen 16 und 240Mio. Kilometer unfallfrei gefahren sein. 16Mio. Kilometer im Stadtverkehr bei durchschnittlich 40km/h entsprechen 400.000h Fahrzeit. Für ein Stereosystem, das 30fps aufnimmt, entspricht das 86,4Mrd. Bildern. Selbst wenn man pro Minute nur ein Bild als Trainings- oder Testbild verwendet, müssen auf 48Mio. Bildern Schilder, Fahrbahnmarkierungen, Fußgänger und andere Hindernisse durch Einzeichnen von Konturen annotiert werden. Aktuelle Forschungen im Transfer-Learning zeigen, dass dies teilweise sogar automatisiert werden kann. Sicher ist aber: die zu bewältigende manuelle Arbeit bleibt enorm. Die Herausforderung besteht nicht nur in der Automobilbranche. Vergleichbare Datenmengen fallen auch in der bildgebenden Medizintechnik, der Mixed/Augmented Reality, der Filmindustrie, der Satellitenfernerkundung und nahezu jeder anderen bildverarbeitenden Industrie an.

Amazon als Vorreiter

Peter Cohen hat als einer der Ersten einen Lösungsansatz für das Problem erkannt. Als Mitarbeiter von Amazon entwickelte er zwischen 2003 und 2008 das Produkt Amazon Mechanical Turk (MTurk), eine Webplattform auf der Menschen zu Beginn Doubletten von Produktbeschreibungen suchen sollten. Heute ist MTurk bekannt als eine der ersten sogenannten Crowdsourcing-Webseiten, auf der Arbeitssuchende (die Crowd) und Arbeitgeber (Requester) zusammengebracht werden, um ‚Fließbanddatenarbeit‘ wie z.B. oben beschriebene Annotation zu erledigen. Allerdings funktioniert das Arbeitgeberprinzip hier anders als gewohnt: man stellt Aufgaben auf die Plattform, die von jedem Interessenten gelöst werden können. Diese arbeiten freiwillig und bekommen pro Aufgabe eine kleine Summe Geld. Der Arbeitgeber kann sich aber weder darauf verlassen, dass seine Aufgaben mit guter Qualität bzw. überhaupt gelöst werden. Dafür steht aber ein dynamischer, rund um die Uhr verfügbarer und relativ kostengünstiger Pool an Arbeitern zur Verfügung. In der Bildverarbeitung hat Luis van Ahn ab 2006 die wissenschaftliche Welt mit seinem ESP Game aufgemischt. Ähnlich wie bei MTurk entwickelte er ein Spiel, bei dem Menschen den Inhalt eines Bildes beschreiben sollten. Damit die Korrektheit sichergestellt wurde, mussten in Anlehnung an Experimente zur außersinnlichen Wahrnehmung (engl. ESP) zwei unabhängige Personen auf die gleichen Begriffe kommen, um maximal viele Punkte zu erhalten. Die Idee wurde schnell von Google gekauft – ebenso wie ReCaptcha, eine weitere Idee van Ahns. Heute existieren zahlreiche Firmen, die viele unterschiedliche Varianten des Crowdsourcing anbieten. Eine Übersicht findet man unter www.crowdsourcing.org.

Sechs Jahre Arbeit/Tag durch Gamer

Speziell in der Bildverarbeitung stellt sich heraus, dass sich die meisten Probleme mit Textlabels, Boxen, Konturen oder Korrespondenzen lösen lassen. Kann ein Computer diese noch nicht automatisch erkennen, sorgt seit Kurzem die Pallas Ludens GmbH für Ergebnisse. Die Firma hat sich der Aufgabe verschrieben, automatische Bildverarbeitungsmethoden von der Segmentierung über den optischen Fluss bis hin zur photogrammetrischen 3D-Rekonstruktion überall dort mit menschlicher Intuition anzureichern, wo diese Verfahren bis dato versagen. Kunden wie z.B. Daimler oder Zeiss senden bereits Bildmaterial an die Firma, wo die Daten in automatisch erzeugbare Ergebnisse zerlegt und in durch Menschen intuitiv lösbare Miniaufgaben umgewandelt werden. Die manuellen Ergebnisse fließen so in die Algorithmen ein, dass optimale Ergebnisse garantiert werden können. Die Aufgaben werden allerdings nicht nur in Crowdsourcing-Plattformen verarbeitet. Stattdessen tauchen sie auch in Computerspielen auf, wie z.B. jenen der Firmen Bigpoint und plinga. Spieler, die sich einen besonderen Gegenstand, ein Level-Up oder einfach nur einen Haufen Gold kaufen möchten, müssen ab sofort nicht mehr mit Geld bezahlen – alternativ können sie einige Minuten lang Bilder annotieren. Nach Lösung der Aufgabe kehren die Gamer zurück ins Spiel, wo eine virtuelle Belohnung auf sie wartet. In Zukunft will man nicht nur in Spielen als Zahlungsmittel fungieren – denkbar ist jede Art von digitalem Content von Musik über Filme bis hin zu Zeitschriftenabonnements. So können bereits jetzt schon bis zu sechs Personenjahre an Arbeit pro Tag von Spielern erledigt werden.

Anzeige

Empfehlungen der Redaktion

Das könnte Sie auch interessieren

An einfache autonome Roboter, wie Staubsauger oder Rasenmäher hat man sich inzwischen gewöhnt. Chirurgische Eingriffe durch einen autonomen Roboter erscheinen dagegen noch eher als Science-Fiction. Eine Forschungsgruppe vom Sheikh Zayed Institute for Pediatric Surgical Innovation am Children’s National Health System in Washington DC und Johns Hopkins Universität in Baltimore, haben nun eine Hürde auf dem Weg zum autonomen OP-Roboter genommen. Ihr ‚Smart Tissue Autonomous Robot‘ (Star) ist der erste Roboter, der weiches Gewebe autonom nähen kann – und das auch noch besser als ein Chirurg. ‣ weiterlesen

Anzeige

www.raytrix.de

Anzeige

Auf der Vision in Stuttgart wird vom 8.-10. November eines der Trendthemen Spectral Imaging sein. So präsentieren sich z.B. Allied Vision, Stemmer Imaging und Ximea auf der Weltleitmesse für Bildverarbeitung als Grenzgänger zwischen SWIR und NIR und zeigen dort verschiedene Demos, die … ‣ weiterlesen

www.sps-magazin.de

Anzeige

20mm flache Flächenleuchte mit 820x820mm aktiver Leuchtfläche und einer Blitzleistung von 360W für Auf- und Durchlichtanwendungen. Die Leuchte arbeitet über ein Kantenbeleuchtungssystem mit seitlichen High-Power LED’s, dessen Licht durch den internen Flächenlichtleiter gleichmäßig verteilt wird. ‣ weiterlesen

www.planistar.de

Leuchte Triangulum für Messungen und Prüfungen an Kabeln, Leitungen, Rohren und anderen runden Objekten. Eine Kombination aus 3 Flächenleuchten mit Durchbrüchen und einem rundem Diffusor bilden eine ideale Einheit zum Erfassen von runden Oberflächen. Zwecks der sehr unterschiedlichen Anwendungsmöglichkeiten wird diese immer spezifisch auf die Messaufgabe der Kunden angepasst. ‣ weiterlesen

www.planistar.de

Anzeige

Die AMB – Internationale Ausstellung für Metallbearbeitung – findet vom 13. bis 17. September auf dem Stuttgarter Messegelände statt. Neben den klassischen Fertigungsthemen deckt die Messe auch Querschnittsthemen, wie z. ‣ weiterlesen

www.messestuttgart.de

Anzeige

Die X-Mode-4.0-Dekodierungsalgorithmen bieten ausgereifte Funktionen zum Auffinden, Analysieren und Rekonstruieren von Symbolen ganz ohne Konfigurationsaufwand. Die Algorithmen zum Dekodieren beliebiger Symbole (lineare 1D/2D-Codes oder Direktmarkierungen) wurden unabhängig von deren Zustand mit dem Ziel entwickelt, die Leseleistung bei schlecht lesbaren Codes und schwierigen Trägermaterialien deutlich zu verbessern. ‣ weiterlesen

Anzeige

www.microscan.com

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige