L’article “ERA: A new, fast, machine learning-based software to document rock paintings” publié dans Journal of Cultural Heritage

Le programme ERA sous Windows 10

Il s’agit d’un nouveau logiciel pour aider les chercheurs dans l’étude des peintures rupestres. A partir d’images numériques, ERA produit rapidement une documentation de haute qualité, selon une procédure conviviale. Les trois canaux de couleurs RVB de l’image numérique sont d’abord décorrélés puis étirés, une technique bien connue des spécialistes de télédétection depuis plus de trente ans. Contrairement aux approches développées précédemment pour l’art rupestre, plusieurs algorithmes de ‘blanchiment‘ des données sont utilisés à cette étape : analyse en composantes principales (régulière), analyse en composantes en phase zéro, décomposition de Cholesky et analyse en composantes indépendantes. Ces transformations produisent des arrangements différents de l’information portée par la couleur. Les données décorrélées, préalablement étirées et mises à l’échelle pour s’adapter à l’espace RVB, sont ensuite converties en différents espaces colorimétriques (sélectionnés parmi les plus populaires) : XYZ, HLS, HSV, LAB (CIELAB), Luv, CMY(K), YCrCb, et YUV. Les variations de couleurs les plus subtiles sont mieux perçues. Le chercheur peut alors profiter d’algorithmes d’intelligence artificielle pour isoler les figures peintes. Le logiciel, écrit en Python, est fourni sous la forme d’un programme exécutable pour Windows, pour une large diffusion , et sous forme de code open-source, qui peut donc être adapté aux besoins évolutifs de la communauté. Le logiciel est donc téléchargeable gratuitement à cette adresse: https://gitlab.huma-num.fr/fmonna/era-extraction-from-rock-art.

Abstract: The present study proposes a new software program to help researchers identify rock paintings from digital images, rapidly producing high-quality documentation, in a user-friendly way. The three RGB colour channels of the digital image are first decorrelated and then stretched, a well-known technique used by remote-sensing specialists for over thirty years. In contrast with the approaches previously developed specifically for rock art, several data-whitening algorithms are used at this step: (regular) principal component analysis, zero-phase component analysis, Cholesky decomposition, and independent component analysis. These transformations produce different arrangements of the colour information, which nevertheless share some important properties (e.g. the covariance matrix of the new channels equals the identity matrix). The decorrelated data, previously stretched and scaled to fit the RGB space, are then converted into various colour spaces (selected from among the most popular): XYZ, HLS, HSV, LAB (CIELAB), Luv, CMY(K), YCrCb, and YUV. The most subtle colour variations will be better perceived in some of these newly produced, contrasted, false-coloured images. The researcher can then take advantage of supervised machine learning algorithms to isolate painted figures. At this step, binary pixel classification is performed either by logistic regression, support vector machine, or k-nearest neighbours, possibly including confident learning. There is no need for complex tuning at any point during the procedure, which lasts a few minutes at most, while a posteriori cleaning of the produced document is minimal. The software, written in Python, is provided as a stand-alone executable program for Windows, for broader diffusion, and as open-source code, which can therefore be adapted to the evolving needs of the community.

Comments are closed.