Projets soutenus par le ministère de la Digitalisation

Afin de favoriser l'implémentation de technologies émergentes au sein de l'Etat et contribuer ainsi à la digitalisation des entités étatiques, le ministère de la Digitalisation a lancé ces dernières années des appels à projets tels que AI4Gov, Data4Gov ou bien NIF4Gov.

Depuis 2024, ces appels à projets ont été regroupés en un seul appel à projets annuel: l'appel Tech-in-GOV.

L'organisme du secteur public dont le projet est retenu par le ministère de la Digitalisation bénéficie de son soutien financier et d'un encadrement assuré par un groupe d'experts multidisciplinaire.

La liste de projets présentée ci-après est non-exhaustive, mais vise à illustrer la diversité des projets soutenus. Elle ne reprend pas les projets lancés via le GovTech Lab du ministère.

 

Projets AI4Gov, Data4Gov et NIF4Gov

Indexation de photos du gouvernement

Le Service information et presse du gouvernement dispose d'une vaste médiathèque de photos politiques de l'Etat luxembourgeois. Le travail d'indexation de ces photos se faisait jusqu'alors manuellement et était fastidieux et chronophage. Le projet IA visait à identifier les personnalités politiques présentes sur les photos par le biais de la reconnaissance faciale ainsi que la génération de métadonnées améliorées pour la médiathèque. La mise en place de cette reconnaissance faciale a permis ainsi de faciliter et d'accélérer la mise à disposition de métadonnées des photos pour une meilleure exploitation des contenus de la médiathèque pour l'ensemble de l'Etat.

Extraction d'objets topographiques

Ce projet concernait l'extraction par l'IA d’objets topographiques à partir d'images aériennes, permettant ainsi la détection de nouveaux bâtiments et routes pour identifier des zones de constructions. Cette extraction a permis de réduire la charge de travail des agents de l'Etat et d'augmenter la qualité et la rapidité de la mise à jour des bases de données de l'Administration du cadastre et de la topographie. En outre, le projet visait à permettre la création de nouvelles données et de services ainsi que la reconnaissance d'objets.

Transcription de textes

Par ce projet, la Bibliothèque nationale de Luxembourg (BnL) visait à l'amélioration de la transcription des textes des articles par l'Optical Character Recognition (OCR), à savoir la reconnaissance de caractères optiques. Cette amélioration figurait comme base nécessaire pour une identification automatique des "entités nommées" (personnes, lieux, organisations et dates). Les entités nommées, détectées par des techniques d'intelligence artificielle, sont la base d'une nouvelle application interactive, permettant l'exploration dynamique des articles, améliorant ainsi l'accès à l'archive des journaux numérisés.

JUANO

Cette application est un outil d’aide à l'anonymisation de décisions de justice en vue de leur publication sur le portail internet de la justice. JUANO est basée sur un moteur d'intelligence artificielle qui reconnait les entités à anonymiser et propose automatiquement des catégories en fonction du texte. Cette application permet de garantir l'homogénéité de l'anonymisation des décisions judiciaires et d'optimiser le processus de leur mise à disposition aux juristes et autres personnes intéressées dans le respect de la protection des données.

Reconnaissance automatique d'écritures manuscrites anciennes

Le projet CLAVIS des Archives nationales de Luxembourg (ANLux) concerne la soumission d'images numérisées de manuscrits des 17e et 18e siècles à Transkribus, une plate-forme de reconnaissance d'écriture assistée par IA, de transcription et de recherche dans des documents historiques. La transcription automatique contribue à rendre ces sources, difficilement exploitables jusqu'à présent, à nouveau lisibles et compréhensibles pour les nouvelles générations de chercheurs. De plus, les ANLux attendent de ce projet des nouvelles possibilités quant à la création automatisée d'inventaires ou d'index de personnes et de lieux.

Procédures de recrutement 

Par ce projet le Centre de gestion du personnel et de l’organisation de l’Etat (CGPO) désire améliorer les procédures de recrutement en utilisant l'intelligence artificielle afin d'assister les agents du CGPO dans le contrôle des conditions de recevabilité des candidatures et les inscriptions à l'épreuve d'aptitude générale pour la Fonction publique luxembourgeoise.

Détection des données aberrantes

Le ministère de l'Intérieur vise à mettre en place un monitoring automatisé à l'aide d'un système de détection des données aberrantes (outlier detection) dans les données financières du secteur communal. 

Labellisation automatique de documents

Par ce projet, le Service central de législation (SCL) a pour objectif de labelliser (catégoriser/classifier) automatiquement des documents sur base de leurs contenus, en vue du couplage d'un chatbot avec le graphe de connaissance de la législation luxembourgeoise.

Statistiques

Ce projet concerne la mise en place d'un programme de la science de données et d'apprentissage automatique pour mettre le Statec en mesure de produire des statistiques sur la base de données de téléphonie mobile.

ADEM Interact

Une plateforme d'intelligence artificielle conversationnelle qui assistera les agents qui reçoivent des messages de demandeurs d'emplois, en formulant des réponses personnalisées. Ce projet devrait s'appliquer aux e-mails et demandes entrant par un nouveau service chatbot intégré au site de l'ADEM.

ADEM Profiling

Ce projet permettra à travers l'analyse des données existantes à l'ADEM de développer un modèle de support pour leurs agents afin d'évaluer quels demandeurs d'emploi ont besoin de quelles mesures et niveaux de soutien pour accéder à l'emploi. Ce diagnostic est possible en prenant en considération les caractéristiques et le profil professionnel du demandeur d'emploi.

Détection d'anomalies

Le projet "Anomaly detection" doit permettre au syndicat communal DEA (Distribution d'eau des Ardennes) d'utiliser l'apprentissage automatique (ML) pour détecter les fuites d'eau dans le réseau et d'identifier des changements au sein d'un ensemble de données avec des différences quotidiennes et saisonnières. Par ce projet, il s'agit d'augmenter les capacités de surveillance du DEA qui est responsable de la production et de la distribution d'eau de 29 communes au Luxembourg.

Aide à la rédaction de jugements

Ce projet concerne un composant d'intelligence artificielle pour assister les juges dans la rédaction de documents juridiques. Il doit analyser en temps réel le contexte du texte en cours de rédaction et suggère automatiquement les textes de loi et décisions de justice pertinents. Ce système permettra de réduire considérablement le temps consacré à la recherche juridique, tout en améliorant la précision et la qualité des références utilisées. En facilitant l'accès immédiat à l'information juridique applicable, il optimisera le travail rédactionnel et renforcera l'efficacité du processus judiciaire.

UrbIA

L'Administration du cadastre et de la topographie est responsable de la gestion des données cadastrales du pays. Ces données sont systématiquement organisées depuis 200 ans, à la fois sous forme graphique (plans cadastraux et cases-croquis) et sous forme de tableaux recensant l'évolution des droits de propriété. Les informations relatives aux droits de propriété ont été consignées manuscritement dans des registres structurés en tableaux, de 1824 à 1972. L'objectif de ce projet est de comparer différentes approches d'interprétation de certains de ces registres pour une commune donnée, d'identifier la méthode la plus adaptée, puis de la mettre en œuvre au sein de l'ACT.

Améliorer les données des offres d’emploi et compétences

Dans le cadre de ses efforts de digitalisation et d’amélioration de son agilité, l’ADEM entend développer ou améliorer des données à forte valeur stratégique. Le présent projet vise à améliorer les données nécessaires au renforcement des capacités de l’organisation à faire correspondre l’offre et la demande d’emploi, et ainsi à faciliter l’insertion professionnelle.

Il prévoit le développement de deux modules dans la chaîne de prétraitement des contenus textuels des offres d’emploi reçues par l’ADEM de la part des employeurs luxembourgeois et des plateformes d’emploi en ligne :

  • Détecteur de doublons: ce module permettra d’éliminer les offres d’emploi en double provenant de différentes sources.
  • Détecteur d’anomalies: ce module identifiera et exclura les phrases du texte de l’annonce qui ne sont pas liées aux compétences ou aux exigences professionnelles (par exemple, la description de l’entreprise).

"Sproocherkennung fir d'Lëtzebuergescht"

Le Zenter fir d'Lëtzebuerger Sprooch (ZLS) a développé le prototype schreifmaschinn.lu, un outil basé sur l'intelligence artificielle de speech to text dans différentes langues, dont le luxembourgeois.  Le projet "Sproocherkennung fir d'Lëtzebuergescht" étend le jeu de données texte et audio hypersynchronisé actuel de 55 heures à 80 heures pour améliorer la performance de schreifmaschinn.lu. L'objectif est de répondre à une double exigence: la diversification des locuteurs et des situations, d'une part, et la rigueur orthographique d'autre part.

Observatoire de l'accessibilité numérique

Le Service information et presse du gouvernement (SIP) a la charge du monitoring de l'accessibilité numérique des sites et applications du secteur public luxembourgeois. L'Observatoire sera un site web accessible, présentant un tableau de bord des principaux indicateurs de l'accessibilité numérique au Luxembourg, ainsi que leur évolution, comme le classement des sites et applications les plus accessibles, avec des labels or, argent et bronze basés sur un score d'accessibilité.

Evaluation des données synthétiques

Ce projet du ministère de la Recherche et de l'Enseignement supérieur consiste à explorer la manière dont il est possible de croiser des données synthétiques et ensuite d’évaluer l'utilité de telles données. La difficulté de ce projet réside dans le fait que deux jeux de données synthétisés séparément ne contiennent pas les mêmes individus et qu'il est donc impossible de les croiser sur base d'un identifiant commun (qui serait lui aussi artificiel). Toutefois, il existe des méthodes statistiques permettant de rapprocher des individus similaires sur de nombreux points et donc de réaliser un croisement sur base de caractéristiques statistiques de ces individus. Les résultats obtenus lors de ce projet ouvrent de nouvelles perspectives d’utilisation de données synthétiques.

NIF#PRESERV

Avec le projet NIF#PRESERV, les Archives nationales du Luxembourg visent à définir une politique de préservation numérique à l'échelle de l'Etat ainsi qu'à proposer une démarche d'implémentation concrète à partir de services associés à cette politique. Le projet répond à la recommandation n°31 du Cadre d'interopérabilité national (NIF) qui préconise la définition d'une politique de préservation numérique à long terme pour le secteur public entier.

REG4Gov

Le projet REG4Gov du Département de la mobilité et des transports du ministère de la Mobilité et des Travaux publics vise à concevoir et à mettre en œuvre une architecture de référence pour les systèmes de registres de base. Le résultat attendu est la définition d'une approche systématique et standardisée dans le développement des systèmes des registres de base conformes aux exigences réglementaires en la matière.

MM-AET

Ce projet concerne la création d'un webservice au format REST API pour le logiciel de gestion interne du ministère de l'Economie pour faciliter l'accès à la banque de données MM-AET (autorisation d'établissement) aux autres administrations dans l’exercice de leurs fonctions.  

Projets Tech-in-GOV

"Iwwersetzungskorpus fir d'Lëtzebuergescht"

Par ce projet, le Zenter fir d'Lëtzebuerger Sprooch (ZLS) propose la création d’un corpus parallèle multilingue. Ce corpus sera centré sur le luxembourgeois en tant que langue source — et donc principale — avec des traductions dans trois langues cibles: l'allemand, le français et l'anglais. Ce corpus parallèle multilingue vise à répondre directement au manque actuel de jeux de données multilingues de haute qualité axés sur le luxembourgeois. Il constituera une ressource précieuse pour soutenir la traduction automatique avancée, l'entraînement de modèles linguistiques d'intelligence artificielle, la recherche en linguistique computationnelle, et d'autres applications technologiques, tant au Luxembourg qu'à l'échelle internationale.

AI Reader

L'objectif de ce projet du Commissariat aux affaires maritimes (CAM) est de développer un outil capable d'extraire automatiquement des données prédéfinies à partir de documents officiels, tels que des visas, au format PDF (texte ou image) ou JPEG, sans intervention humaine.

Dans un premier temps, cet outil vise à améliorer l'efficacité des processus de saisie de données pour le service "Gens de mer". Il s'agit notamment de:

  • réduire le nombre de points de données à fournir par les clients,
  • diminuer les erreurs lors de la saisie initiale,
  • limiter les besoins de vérification et de correction par les agents du CAM,
  • et permettre l'injection automatique des données dans les systèmes concernés.

AI4DI

Le service "Demandes d’informations" de la Commission nationale pour la protection des données (CNPD) reçoit un large éventail de questions via différents canaux de communication, tels que le courriel, le courrier postal et le téléphone.

Avec le temps, le volume des questions et des réponses s’est considérablement accru, rendant les recherches manuelles effectuées par les agents de plus en plus chronophages. Par ce projet, la CNPD souhaite automatiser à la fois la recherche d'informations et la génération d'un projet de réponse initial, en s'appuyant sur la base de données existante.

La solution envisagée consiste à développer un outil informatique reposant sur un modèle de langage de grande taille (Large Language Model - LLM) basé sur l'IA, capable de retrouver efficacement les informations pertinentes et de proposer des réponses adaptées.

Legal and normative text analyser

L'Organisme luxembourgeois d'accréditation et de surveillance (OLAS) souhaite développer un outil ("Legal and normative text analyser") capable d'effectuer les tâches suivantes: 

  • analyser la documentation disponible dans des bases de données reconnues et fiables telles que Legilux, EUR-Lex, ISO, CEN, EA, ILAC, IAF et les fichiers stockés localement; 
  • identifier et collecter les documents ou informations pertinents démontrant la conformité aux exigences applicables à l'accréditation d'activités spécifiques; 
  • analyser le contenu de ces documents ou informations afin d'identifier et d'extraire les exigences applicables nécessaires à l'accréditation des organismes d'évaluation de la conformité; 
  • élaborer des rapports détaillés sur la base des résultats de l'analyse. 

ScreenreaderLB

La solution screenreaderLB du Service information et presse (SIP) vise à répondre au besoin croissant d'accessibilité des contenus en luxembourgeois pour les personnes malvoyantes. Actuellement, l'absence de technologies de synthèse vocale adaptées à cette langue oblige les utilisateurs aveugles ou malvoyants à utiliser des lecteurs d'écran en allemand ou dans d'autres langues. ScreenreaderLB a pour objectif de développer un lecteur d'écran spécialement conçu pour le luxembourgeois, offrant une synthèse vocale fluide et précise, afin de permettre aux utilisateurs malvoyants d'interagir plus facilement avec les contenus numériques en luxembourgeois, tout en améliorant leur expérience de navigation et d'accès à l'information.

eMail4GOV

Le projet eMail4GOV des Archives nationales a pour objectif de développer une solution structurée et pragmatique pour la gestion et l'archivage des e-mails dans l'Administration publique luxembourgeoise. Actuellement, la gestion du cycle de vie des e-mails et leur conservation à long terme demeurent un défi, en raison de l'absence de politiques et de stratégies claires. eMail4GOV vise à étudier les pratiques actuelles et à proposer des recommandations pour une gestion plus efficace des e-mails, en veillant à leur conservation pertinente et durable, tout en facilitant la mise en place d'outils adaptés pour les producteurs d'archives publiques, notamment dans les situations critiques telles que le départ de collaborateurs.

AI for Legacy

Le projet "AI for Legacy" a pour objectif d'explorer l'utilisation des technologies de l'intelligence artificielle pour analyser, commenter et, si nécessaire, refactoriser du code provenant d'outils "legacy" au sein du ministère de l'Economie. L'étude se concentre sur l'évaluation des capacités des outils d'IA modernes pour revitaliser ces systèmes monolithiques, développés sur de longues périodes et devenus de plus en plus complexes et difficiles à maintenir. Le projet cherche à démontrer comment l'IA peut offrir des solutions innovantes pour améliorer la lisibilité, la maintenabilité et la performance de ces applications vieillissantes, tout en prolongeant leur durée de vie de manière efficace et durable.