Choosing the right tool

Will deep learning displace all other CV techniques?

It’s remarkable to see the range of applications in which deep neural networks are proving effective – often, significantly more effective than previously known techniques. From speech recognition to ranking web search results to object recognition, each day brings a new product or paper with a new challenge tamed by deep learning.

Artificial neural networks are a subset of machine learning techniques, and deep neural networks are a subset of artificial neural networks. All of these machine learning techniques are used in computer vision - and for other fields. (Bild: Embedded Vision Alliance)

Artificial neural networks are a subset of machine learning techniques, and deep neural networks are a subset of artificial neural networks. All of these machine learning techniques are used in computer vision – and for other fields. (Bild: Embedded Vision Alliance)

Computer vision, of course, is a field with significant deep learning activity. Deep learning is particularly appealing for visual perception because image and video data is massive and rich with information, but is infinitely variable and often ambiguous. Researchers have demonstrated deep neural networks capable of classifying skin lesions as cancerous or benign with accuracy equivalent to that of dermatologists, and other deep networks are capable of reading lips with significantly higher accuracy than human lip readers. More recently, Shunsuke Saito, Lingyu Wei and colleagues have developed a deep-learning-based approach that generates photorealistic 3D models of human faces from a single 2D image. This naturally leads to the question: Will deep learning displace all other techniques for solving visual perception problems? While the power of deep learning is undeniable, I believe that other techniques will continue to be attractive. As in most fields, it’s a question of choosing the right tool for the job. With the current justifiable excitement around deep learning, one important point is that machine learning encompasses a vast range of techniques, of which neural networks are a subset (as shown in the figure). In turn, deep neural networks are a subset of a broader class of neural network techniques. In many cases, simpler machine learning techniques are effective. That’s fortunate, because deep learning has a deep appetite: massive amounts of data and compute power are needed for training deep networks, and substantial compute power is needed for running trained networks. Other machine learning techniques often get by with comparatively minuscule amounts of data and processing power. Well before the start of the current deep learning craze, a few pioneering researchers and companies, such as BrainChip and General Vision, were deploying what we might today call ’shallow learning‘ algorithms and processors to solve real-world problems ranging from fish identification to license-plate recognition. Today, there’s a huge rush to apply deep learning to every visual perception problem. But, particularly when development costs and deployment costs are considered, I think that in many cases, other techniques will prove preferable. The challenge for algorithm, system, and product developers will be how to discern which tasks call for deep learning, which call for other neural network techniques, which are best served by other machine learning approaches, and which are still appropriate for good old-fashioned hand-crafted algorithms. On September 7th there will be a full day course in Hamburg which provides the hands-on knowledge you need to develop deep learning computer vision applications with TensorFlow. For details see https://tensorflow.embedded-vision.com.

Choosing the right tool
Bild: Embedded Vision Alliance


Das könnte Sie auch interessieren

Partnerschaft Matrix Vision und Metrilus

Matrix Vision ist eine Partnerschaft mit dem Unternehmen Metrilus GmbH aus Erlangen eingegangen. Metrilus ist eines der ersten Unternehmen weltweit, das sich auf Komplettlösungen für Echtzeit-3D-Bildverarbeitungsanwendungen spezialisiert hat. In Verbindung mit der 6D-Perception Camera mbBlueSirius von Matrix Vision bietet Metrilus zukünftig Beratung, Entwicklung von Prototypen und Software-Lösungen an.

www.matrix-vision.com

Vervierfachtes geometrisches Auflösungsvermögen

MicroScan ermöglicht das Bildformat einer radiometrische Thermografiekamera mit gekühltem FPAPhotonen-Detektor zu vervierfachen. Für Modelle der High-End-Kameraserie ImageIR bedeutet dies, dass sich Aufnahmen mit bis zu 2.560×2.048 IR-Pixeln erstellen lassen. Hinter der Funktion verbirgt sich ein schnell rotierendes MicroScan-Rad, das in der Kamera integriert ist. Es sorgt dafür, dass pro Radumdrehung vier verschiedene Einzelaufnahmen entstehen, die zueinander jeweils um ein halbes Pixel lateral versetzt sind. Die Einzelaufnahmen werden in Echtzeit zu einem Thermogramm mit vierfachem Bildformat zusammengeführt.

www.InfraTec.de

Wellenfrontsensor für die Optikprüfung

Der Wellenfrontsensor SHSLab dient zur die Prüfung von Optiken, optischen Systemen und Lasersystemen. Das Messprinzip ermöglicht die Erfassung von Wellenfronten durch eine einzelne Messung, so dass er schnell und unempfindlich gegenüber externen Einflüssen ist. Ein Mikrolinsen-Array transformiert die lokalen Propagationsrichtungen der Lichtstrahlen in ein Feld von Fokuspunkten auf einer Kamera. Die Abweichung der Fokuspunkte von ihren Referenzpositionen wird berechnet und schließlich die Wellenfront durch numerische Integration.

www.optocraft.com

Kamera-Kompositgehäuse für Roboteranwendungen

Der Kamerakopf des Bildverarbeitungssystem Robot Inspector for Integrity Analysis (RIITTA) ist eine kompakte Einheit, die alle Einzelkomponenten wie Kamera, Objektiv, blitzbare LED-Beleuchtung und Ansteuerelektronik in einem Spezialgehäude vereint. Das leichte Kompositgehäuse ist IP65-geschützt und bietet Schutz vor Staub und Spritzwasser. Die Eigenschaften der verwendeten Materialien in Verbindung mit dem Design des Gehäuses vermeiden Trägheitsmomente, die vor allem bei Roboteranwendungen eine entscheidende Rolle spielen.

www.asentics.de

Anzeige
Neuer Geschäftsführer bei Omron Electronics

 

Zuvor war Kluger als Managing Director Europe und Vice President Business Development für Adept Technology, später für Omron Adept Technologies tätig. Außerdem ist er als ehrenamtliches Vorstandsmitglied im Fachverband Robotik des VDMA aktiv.

www.industrial.omron.eu

Anzeige
Jahresabschluss und Verä;nderungen bei Stemmer

Am 30. Juni hat der global tätige Bildverarbeiter Stemmer Imaging sein Geschäftsjahr 2016/2017 mit einem Umsatz von 88,7Mil.€ und einem währungsbereinigten Wachstum von 6% abgeschlossen. Der Abschluss stellt auch das Ende einer Ära dar.

www.stemmer-imaging.de

Anzeige