Anzeige

Choosing the right tool

Will deep learning displace all other CV techniques?

It’s remarkable to see the range of applications in which deep neural networks are proving effective – often, significantly more effective than previously known techniques. From speech recognition to ranking web search results to object recognition, each day brings a new product or paper with a new challenge tamed by deep learning.

Artificial neural networks are a subset of machine learning techniques, and deep neural networks are a subset of artificial neural networks. All of these machine learning techniques are used in computer vision - and for other fields. (Bild: Embedded Vision Alliance)

Artificial neural networks are a subset of machine learning techniques, and deep neural networks are a subset of artificial neural networks. All of these machine learning techniques are used in computer vision – and for other fields. (Bild: Embedded Vision Alliance)

Computer vision, of course, is a field with significant deep learning activity. Deep learning is particularly appealing for visual perception because image and video data is massive and rich with information, but is infinitely variable and often ambiguous. Researchers have demonstrated deep neural networks capable of classifying skin lesions as cancerous or benign with accuracy equivalent to that of dermatologists, and other deep networks are capable of reading lips with significantly higher accuracy than human lip readers. More recently, Shunsuke Saito, Lingyu Wei and colleagues have developed a deep-learning-based approach that generates photorealistic 3D models of human faces from a single 2D image. This naturally leads to the question: Will deep learning displace all other techniques for solving visual perception problems? While the power of deep learning is undeniable, I believe that other techniques will continue to be attractive. As in most fields, it’s a question of choosing the right tool for the job. With the current justifiable excitement around deep learning, one important point is that machine learning encompasses a vast range of techniques, of which neural networks are a subset (as shown in the figure). In turn, deep neural networks are a subset of a broader class of neural network techniques. In many cases, simpler machine learning techniques are effective. That’s fortunate, because deep learning has a deep appetite: massive amounts of data and compute power are needed for training deep networks, and substantial compute power is needed for running trained networks. Other machine learning techniques often get by with comparatively minuscule amounts of data and processing power. Well before the start of the current deep learning craze, a few pioneering researchers and companies, such as BrainChip and General Vision, were deploying what we might today call ’shallow learning‘ algorithms and processors to solve real-world problems ranging from fish identification to license-plate recognition. Today, there’s a huge rush to apply deep learning to every visual perception problem. But, particularly when development costs and deployment costs are considered, I think that in many cases, other techniques will prove preferable. The challenge for algorithm, system, and product developers will be how to discern which tasks call for deep learning, which call for other neural network techniques, which are best served by other machine learning approaches, and which are still appropriate for good old-fashioned hand-crafted algorithms. On September 7th there will be a full day course in Hamburg which provides the hands-on knowledge you need to develop deep learning computer vision applications with TensorFlow. For details see https://tensorflow.embedded-vision.com.

Anzeige

Empfehlungen der Redaktion

Das könnte Sie auch interessieren

Die Smart PLC Unit ist eine Industriesteuerung zur Messwertverrechnung für die Laser-Scanner scanControl Smart und Gapcontrol. Die ermittelten Messwerte werden über die Unit verrechnet, angezeigt, protokolliert und können an übergeordnete Steuerungen weitergegeben werden. Dafür stehen analoge und digitale Schnittstellen zur Verfügung. Bis zu acht Laserscanner lassen sich an anschließen. Dies ist bei vielen Anwendungen, wie beispielsweise Konturvermessungen an großen Bauteilen notwendig.

www.micro-epsilon.de

Anzeige

Das Interferometer µPhase basiert auf dem Twyman-Green-Prinzip und vermisst hochpräzise Abweichungen in Planität und Sphärizität, mit einer Genauigkeit bis zu 0.01µm. Die berührungsfreie Messung und Auswertung erfolgt dabei großflächig innerhalb von Sekunden. ‣ weiterlesen

Anzeige

www.trioptics.com

Anzeige

Die Maxshot 3D-Fotogrammetrie-Kamera verbindet eine einfache Bedienung und Genauigkeit mit umfangreichen Größenmessprojekten. Sie kann als einzelnes Messgerät aber auch in Kombination mit Creaforms 3D-Scannern und tragbaren KMMs verwendet werden. Das Gerät ist 40% präziser als der Vorgänger und hat eine volumetrische Genauigkeit von bis zu 0,015mm/m. Eine visuelle Projektion mit Echtzeit-Feedback direkt auf dem Teil, leitet den Nutzer zu der richtigen Position für die Aufnahme.

www.creaform3d.com

Anzeige

Das integrierte Messsystem Duo Vario bietet zwei Messverfahren: das Konfokale und die Fokusvariation, für eine Oberflächenanalyse von Rauheit sowie Konturmessungen. Mit dem konfokalen Verfahren können stark reflektierende Oberflächen rückführbar auf herstellerunabhängige Raunormale gemessen werden. Mit dem neuen Gerät ist dies nun auch mit einem größeren Bildfeld und mit einer höheren lateralen Auflösung möglich. Das Fokusvariationsverfahren ist vor allem für die Messung von Formen und Konturen vorteilhaft. Dabei beträgt der Akzeptanzwinkel über 85°.

www.confovis.com

Anzeige

Die QIPAK 6.1 Software für das Messsystem Quick Image wartet mit einer Stitching-Funktion für einen großen Messbereich auf. Ein oder mehrere Werkstücke lassen sich mit dem System innerhalb von Sekunden wiederholbar messen. Dank der Software bedarf es nur eines einzigen Mausklicks, um das Werkstück im Sichtfeld automatisch zu erkennen und die Messung zu starten. Im Fall von Werkstücken, die größer ausfallen als der Bildbereich, erfasst das System bei der Messtischbewegung mehrere Bilder und fügt die einzelnen Aufnahmen zusammen.

www.mitutoyo.de

Anzeige

Speziell für die Anwendung in der Automobilindustrie wurden die Planflächenprüfsysteme Gageline IPS F100 3D und IPS F200 3D entwickelt, die dank Kamera- und Beleuchtungstechnik, einer adaptiven, dynamischen Maskierung und hoher Auflösung eine 100%-Prüfung von Planflächen in Linientaktzeit sicher durchführen. Mit der Multi-Bilderfassung können nicht nur wahre Defekte und Trockenränder des vorgelagerten Waschprozesses unterschieden werden, sondern es werden auch Angaben zu Höhendaten ermittelt. Der Prüfbereich ist sowohl in Breite und Länge nahezu unbegrenzt

www.jenoptik.de

Anzeige

Lapp ergänzt sein Etherline-Portfolio um die erste torsionsfähige und Profinet-konforme Cat. 7 Hochgeschwindigkeitsleitung der Welt. Die Etherline Torsion Cat 7 erreicht Datenraten nach Cat. 7, also 10GBit/s im Frequenzband bis 600MHz. Sie lässt sich auf einer Länge von 1m um 180° in beide Richtungen tordieren und das mindestens fünf Millionen Mal. Das Kabel kommt ohne Füller aus, die Adern werden nur von einem Trennkreuz aus Polyethylen am Platz gehalten, was die Konfektion erleichtert.

www.lappkabel.de

Anzeige

Der europäische Bildverarbeitungsverband EMVA plant erstmals vom 12. bis 13. Oktober zusammen mit der Messe Stuttgart die Ausrichtung der Embedded Vision Europe (EVE) Conference in Stuttgart. Über die Ziele und Inhalte der Veranstaltung sprach inVISION mit Gabriele Jansen, Mitglied im ehrenamtlichen Vorstand der EMVA und Geschäftsführerin von Vision Ventures. ‣ weiterlesen

Anzeige

www.embedded-vision-emva.org

Anzeige

Für die optische Leiterplatteninspektion (AOI) in 3D mit 24 Bit Farbauflösung nutzt das japanische Unternehmen MEK Marantz Electronics den externen Framegrabber LightBridge. Das Bildverarbeitungsgerät erlaubt die Anbindung des AOI-Inspektionsgerätes über Thunderbolt an den Host-PC unter dem Apple-Betriebssystem Mac OSX. Die speziellen Prüfaufgaben wurden auf dem FPGA von LightBridge mit VisualApplets individuell programmiert, ganz ohne Hardware-Programmierkenntnisse einzusetzen. ‣ weiterlesen

Anzeige

www.silicon-software.de

Anzeige

Der In-Sight Laser-Profiler ist ein einfach zu bedienendes Messsystem zum Prüfen von Werkstückmaßen. Die Bildverarbeitungswerkzeuge, die präzise Objekterkennung und die Easybuilder Schnittstelle machen ihn zu einem hochpräzisen Werkzeug zum Messen von Höhe, Abstand, Position und Winkeln und zum Erkennen von Oberflächendefekten. Das Gerät kombiniert eine einfach zu bedienende Schnittstelle mit dem VC200 Vision Controller, gemeinsam mit der Präzision der 3D-Laser-Displacement Technologie.

www.cognex.de

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige