Klassifizierung von Gemälden

Computer Vision Algorithmen analysieren Kunstwerke

Wenn man ein Gemälde untersucht, kann man in der Regel mehrere Folgerungen daraus ziehen. Zusätzlich zum Verständnis des Bildgegenstandes, ist man wahrscheinlich in der Lage, das Bild z.B. nach Epoche, Stil und Künstler zu klassifizieren. Aber kann auch ein Computeralgorithmus ein Gemälde gut genug verstehen, um diese Klassifizierungsaufgaben wie ein Mensch durchzuführen?

(Bild: ©Wikimedia Commons/Gemeinfrei (links) / ©Francis Bacon (rechts))

Bild 1: Ein Algorithmus ermittelte den Einfluss von Diego Velázquez Papstporträt ‚Innozenz X‘ (links) mit Francis Bacons ‚Study After Velázquez’s Portrait of Pope Innocent X‘ (rechts). (Bild: ©Wikimedia Commons/Gemeinfrei (links) / ©Francis Bacon (rechts))

Am Art and Artificial Intelligence Laboratory der Rutgers University in New Jersey sind verschiedene Forscher mithilfe von Matlab und einer Datenbank mit tausenden Gemälden aus den letzten sechs Jahrhunderten dieser Frage nachgegangen. Außerdem wurden noch zwei weitere Fragen über die Leistungsfähigkeit und Beschränkungen von KI-Algorithmen (Künstliche Intelligenz) erörtert: Können diese Algorithmen ermitteln, welche Gemälde den größten Einfluss auf nachfolgende Künstler hatten und die Kreativität eines Gemäldes messen, indem sie sich nur auf visuelle Merkmale stützen?

Extrahieren visueller Merkmale

Ziel war es, Algorithmen zu entwickeln, die in der Lage sind, große Gruppen von Gemälden nach ihrem Stil (Kubismus, Impressionismus, abstrakter Expressionismus, Barock…), Genre (Landschaftsmalerei, Porträt, Stillleben…) und Künstler zu klassifizieren. Eine Anforderung für diese Klassifizierung war die Fähigkeit, Farbe, Komposition, Textur, Perspektive, Motiv und andere visuelle Merkmale erkennen zu können. Eine zweite Anforderung war die Fähigkeit, die visuellen Merkmale auszuwählen, die die Ähnlichkeiten zwischen den Gemälden am besten verdeutlichten. Mithilfe von Matlab und der Image Processing Toolbox entwickelte man Algorithmen, um die visuellen Merkmale eines Gemäldes zu extrahieren. Der Merkmalextraktionsalgorithmus ist im Bereich Computer Vision gängige Praxis und lässt sich einfach implementieren. Die schwieriger zu bewältigende Aufgabe war es, die besten Techniken für maschinelles Lernen zu finden. Daher wurden Support Vector Machines (SVMs) und andere Klassifizierungsalgorithmen der Statistics and Machine Learning Toolbox getestet, um visuelle Merkmale zu ermitteln, die zur Klassifizierung des Stils nützlich sind. Danach setzte man in Matlab Techniken zum Erlernen von Abstandsmetriken an, um die einzelnen Merkmale zu gewichten und dadurch die Fähigkeit des Algorithmus, Gemälde zu klassifizieren, nochmals zu verbessern. Die Algorithmen konnten die Stile der Gemälde in der Datenbank mit einer Genauigkeit von 60% klassifizieren; bei einer Klassifizierung nach dem Zufallsprinzip wäre man nur auf eine Genauigkeit von 2% gekommen. Obwohl Kunsthistoriker diese Aufgabe mit einer weitaus höheren Genauigkeit als 60% durchführen können, liefert der Algorithmus eine höhere Leistung als eine durchschnittliche, nicht fachkundige Person.

Maschinelles Lernen deckt Kunsteinflüsse auf

Als die Algorithmen die Ähnlichkeiten zwischen Gemäldepaaren zuverlässig ermitteln konnten, stand die nächste Herausforderung an: mit maschinellem Lernen Einflüsse in der Kunst offenbaren. Die Hypothese war, dass visuelle Merkmale, die für die Klassifizierung des Stils (Problemstellung mit überwachtem Lernen) nützlich sind, auch dazu verwendet werden können, die Einflüsse zu bestimmen (Problemstellung mit unüberwachtem Lernen). Wenn Kunsthistoriker Theorien zu den Einflüssen in der Kunst entwickeln, stützen sie sich auf Informationen wie die Arbeitsweise und Reisen der Künstler und ob diese mit Zeitgenossen ausgebildet wurden. Die neuen Algorithmen verwendeten nur visuelle Elemente sowie Kompositionsdaten. Unter der Annahme, dass ein Algorithmus, der Objekte und Symbole des Gemäldes berücksichtigt, effektiver ist als ein Algorithmus, der sich auf Low-Level-Merkmale wie Farbe oder Textur stützt, setzte man Klassifizierungsalgorithmen ein, die auf Google Bildern trainiert wurden, bestimmte Objekte zu erkennen. Die Algorithmen wurden an über 1.700 Gemälden von 66 unterschiedlichen Künstlern aus eine Zeitspanne von 550 Jahren getestet. Der Algorithmus ermittelte auf Anhieb den Einfluss von Diego Velázquez’s Papstporträt ‚Innozenz X‘ auf Francis Bacons ‚Study After Velázquez’s Portrait of Pope Innocent X'(Bild 1). Die Ähnlichkeiten von Komposition und Motiv bei beiden Gemälden sind auch von Laien einfach zu erkennen, aber der Algorithmus hat auch Ergebnisse hervorgebracht, die Kunsthistoriker überraschten. Der Algorithmus erkannte beispielsweise ‚Bazilles Atelier in der Rue Condamine 9‘ des französischen Impressionisten Frédéric Bazille von 1870 als möglichen Einfluss auf Norman Rockwells ‚Shuffleton’s Barbershop‘, das 80 Jahre später entstand (Bild 2). Obwohl sich die beiden Gemälde auf den ersten Blick nicht ähneln, offenbaren sich bei genauerem Hinsehen Gemeinsamkeiten bei Komposition und Motiv, einschließlich der Öfen in der unteren rechten Ecke der beiden Gemälde, der Gruppe von drei Männern in der Mitte und den Sesseln und dreieckigen Flächen in der linken unteren Ecke. In dem entsprechenden Datensatz haben die Algorithmen 60% der 55 Einflüsse, die von Kunsthistorikern erkannt wurden, richtig bestimmt, was vermuten lässt, dass allein eine visuelle Ähnlichkeit ausreichend Informationen bietet, damit Algorithmen (und wahrscheinlich auch Personen) eine Vielzahl an Einflüssen bestimmen können.

Bild 2: Der gleiche Algorithmus fand auch Einflüsse bei Frédéric Bazilles 'Bazilles Atelier in der Rue Condamine 9' (links) mit Norman Rockwells 'Shuffleton's Barbershop' (rechts). Die gelben Kreise zeigen ähnliche Objekte an, die roten Linien die ähnliche Komposition und die blauen Rechtecke markieren ähnliche Strukturelemente. (Bild: ©Wikimedia Commons/gemeinfrei (links) / ©Norman Rockwell(rechts))

Bild 2: Der gleiche Algorithmus fand auch Einflüsse bei Frédéric Bazilles ‚Bazilles Atelier in der Rue Condamine 9‘ (links) mit Norman Rockwells ‚Shuffleton’s Barbershop‘ (rechts). Die gelben Kreise zeigen ähnliche Objekte an, die roten Linien die ähnliche Komposition und die blauen Rechtecke markieren ähnliche Strukturelemente. (Bild: ©Wikimedia Commons/gemeinfrei (links) / ©Norman Rockwell(rechts))

Klassifizierung von Gemälden
(Bild: ©Wikimedia Commons/gemeinfrei (links) / ©Francis Bacon (rechts))


Das könnte Sie auch interessieren

Oberflächen- und Konturmessung in einem Gerät

Das integrierte Messsystem Duo Vario bietet zwei Messverfahren: das Konfokale und die Fokusvariation, für eine Oberflächenanalyse von Rauheit sowie Konturmessungen. Mit dem konfokalen Verfahren können stark reflektierende Oberflächen rückführbar auf herstellerunabhängige Raunormale gemessen werden. Mit dem neuen Gerät ist dies nun auch mit einem größeren Bildfeld und mit einer höheren lateralen Auflösung möglich. Das Fokusvariationsverfahren ist vor allem für die Messung von Formen und Konturen vorteilhaft. Dabei beträgt der Akzeptanzwinkel über 85°.

www.confovis.com

3D-Fotogrammetrie-Kamera mit visueller Projektion

Die Maxshot 3D-Fotogrammetrie-Kamera verbindet eine einfache Bedienung und Genauigkeit mit umfangreichen Größenmessprojekten. Sie kann als einzelnes Messgerät aber auch in Kombination mit Creaforms 3D-Scannern und tragbaren KMMs verwendet werden. Das Gerät ist 40% präziser als der Vorgänger und hat eine volumetrische Genauigkeit von bis zu 0,015mm/m. Eine visuelle Projektion mit Echtzeit-Feedback direkt auf dem Teil, leitet den Nutzer zu der richtigen Position für die Aufnahme.

www.creaform

Reflektivität in voller Bandbreite

Das Interferometer µPhase basiert auf dem Twyman-Green-Prinzip und vermisst hochpräzise Abweichungen in Planität und Sphärizität, mit einer Genauigkeit bis zu 0.01µm. Die berührungsfreie Messung und Auswertung erfolgt dabei großflächig innerhalb von Sekunden.

www.trioptics.com

Anzeige
66. Heidelberger Bildverarbeitungsforum

Das 66. Heidelberger Bildverarbeitungsforum wird am 10. Oktober in Freiburg an der Technischen Fakultät der Albert-Ludwigs-Universität stattfinden. Das diesjährige Schwerpunktthema lautet ‚Mensch-Maschine-Interaktion mit Vision‘ und gibt anhand von verschiedenen Vorträgen einen systematischen Einblick in die Anwendungsfelder, in der Vision-Technologien zur Interaktion mit dem Menschen eingesetzt werden können. Am Ende der Veranstaltung wird es eine große Abschlussdiskussion zur Fazit-Findung geben.

www.bv-forum.de

Anzeige
Yxlon: Neuer Global Director of Electronics Sales

Yxlon International, spezialisiert auf Durchleuchtungs- und CT-Inspektionssysteme, hat Keith Bryant zum neuen Global Director Electronics Sales ernannt. Bryant bringt über 25 Jahre an Erfahrungen im Bereich Technical Sales mit sich, besonders aus dem Bereich X-Ray. Er wird fortan für alle globalen Marktkanäle zuständig sein und dem globalen Salesteam des Unternehmens vorstehen.

www.yxlon.com

Anzeige
Megatrend Embedded Vision

Mit der ersten Embedded Vision Europe (EVE) Konferenz wird Stuttgart vom 12. bis 13. Oktober zur Embedded Vision Hauptstadt Europas. Hauptredner und Aussteller für die Premierenveranstaltung im ICS Stuttgart stehen bereits fest.

www.embedded-Vision-emva.org

Anzeige