CERCLL

CercLL d'Entraide et Réseau Coopératif Autour des Logiciels Libres

Digikam 8.3 s’offre un peu d’intelligence artificielle (Auto-Tags)

Posted by CercLL sur 19 mars 2024

L’application photo de KDE s’offre les Auto-Tags, un nouvel outil pour attribuer automatiquement des tags aux images en utilisant un moteur de réseau neuronal d’apprentissage profond.

bBj6VQb_png

De l’open source (évidemment), mais aussi un travail réalisé dans le cadre du Google Summer of Code. L’objectif : développer un modèle d’apprentissage profond capable de reconnaître différentes catégories d’objets, de scènes et d’événements dans des photos numériques, et de générer des mots-clés correspondants qui peuvent être stockés dans la base de données de Digikam et attribués automatiquement à chaque photo.

C’est quoi digiKam ?

DigiKam est une application de gestion d’images open source intégrée à KDE lancée en 2002 et distribué sous licence GNU GPL. Elle importe et organise les photos par dossiers (albums), mais permet aussi d’apporter des retouches grâce à des greffons (plugins).

DigiKam 8.3 : quoi de neuf ?

La nouvelle version de digiKam, annoncé ce dimanche 3 décembre, apporte plusieurs changements importants :

  • Nouvel outil pour assigner automatiquement des tags aux images en utilisant un moteur de réseau neuronal d’apprentissage profond. Ce travail a été lancé dans le cadre du Google Summer of Code 2023. Le modèle doit être, à terme, capable de reconnaître des objets tels que des animaux, des plantes et des véhicules, des scènes telles que des plages, des montagnes et des villes, etc. Le modèle doit également être capable de traiter des photos prises dans différentes conditions d’éclairage et sous différents angles.
  • Nouvel outil pour appliquer les métadonnées d’une image ou d’un fichier JSON aux images.
  • Ajout de paramètres génériques de proxy réseau pour accéder aux ressources Internet.
    AppImage utilise les frameworks Qt 5.15.12 et KDE 5.115.
  • L’installateur Windows utilise les frameworks Qt 6.6.1 et KDE snapshot 30122023.
  • Mise à jour de Libraw interne vers snapshoot 2024-02-02.
  • Ajout d’une nouvelle page pour personnaliser les paramètres de géolocalisation.
  • Outil de réécriture pour utiliser l’outil CLI de FFmpeg pour encoder des images en vidéo avec bande son et support OSD.
    L’aperçu et le diaporama de la vidéo sont maintenant rendus avec Qt6::Multimedia et Qt5::QtAVPlayer.
  • Le code ancien et non maintenu du framework QtAV utilisé dans le noyau de digiKam a été entièrement supprimé.
  • Qt6::Multimedia et Qt5::QtAVPlayer sont basés et compatibles avec FFMpeg API 5 et plus.

La liste complète des changements se trouve sur cette page. On y compte un peu plus de 250 corrections de bugs, ce n’est pas rien.

La prochaine version de maintenance (8.4) devrait être publiée d’ici la fin du printemps 2024.

Télécharger DigiKam

Vous pouvez télécharger gratuitement DigiKam via cette page pour les systèmes d’exploitation suivants :

  • Linux (des paquets sont proposés pour la plupart des grandes distributions)
  • Windows
  • macOS
  • FreeBSD

Source goodtech.info

Sorry, the comment form is closed at this time.