L’IA est déjà votre nouvelle copine pour vos recherches généalogiques landaises !

Philippe Mora

L’OCR et l’HTR ne vous disent rien ? Pourtant, ils révolutionnent déjà les recherches généalogiques ! Ce texte vous introduira dans ce domaine en pleine éclosion. Je ne parlerai pas de tout ce qui existe, pour cela, vous pourrez consulter les références en fin d’article.

L’IA lit pour vous…

Avec l’OCR, Optical Character Recognition (Reconnaissance Optique de Caractère), nous profitons déjà de la lecture par des IA de quantités de documents : Gallica et les archives départementales utilisent déjà cette technologie qui nous permet notamment de lancer des recherches dans la presse locale ancienne aux AD des Landes. C’est tellement répandu que nous ne sommes même plus étonnés de pouvoir réaliser ce type de recherche pourtant bien pratique !

Mais l’étape suivante, c’est l’expansion de l’HTR : Handwritten Text Recognition, en français Reconnaissance de Textes Manuscrits. Avec l’intitulé, vous avez compris l’intérêt, l’IA peut lire des textes manuels, et même anciens ! Cette lecture permettra de mettre en format texte et de faire des recherches comme l’OCR nous le permet déjà avec les textes imprimés. L’idée serait même que l’IA fasse le lien, reconnaisse des noms, etc. Il existe plusieurs projets déjà lancés à ce niveau, je ne vous en parlerai que d’un ici : Socface. Ce projet va lire tous les recensements de population d’après la Révolution, de tous les départements participants (la grande majorité) et cela permettra de faire une recherche par nom ! Le département des Landes participe à ce projet (voir ici la progression des collectes).

… mais ne réfléchit pas pour vous !

Dans l’instant, quand j’ai lu tout cela, j’ai eu cette drôle de sensation : « mais à quoi bon de continuer à référencer nous-même des quantités d’informations dans les prochaines années, puisque les IA pourront lire, collecter, agencer des arbres en passant à la moulinette toutes ces données ?!« 

Une première réaction logique mais finalement trompeuse, car l’IA pourra très bien faire de nombreuses erreurs et n’aura pas forcément accès à tous les documents que nous, généalogistes, utilisons. On le sait tous, la généalogie les liens créés à partir des actes de baptêmes-mariages-sépultures peuvent être remis en cause avec un seul acte notarié. Il y aura aussi la difficulté pour l’IA de reconnaître un même nom de famille orthographié différemment et sans doute encore beaucoup de choses qui font que l’IA ne remplacera pas le généalogiste tout comme elle ne remplacera pas le chercheur en général, mais l’IA deviendra à coup sûr, une puissante aide à la recherche. Nos recherches généalogiques vont évoluer, s’affiner et s’élargir à la fois. Cela, Patricia Machet l’aborde en tentant d’explorer ce que peuvent apporter les projets collectifs, dans ce nouveau contexte, au niveau des associations. Toutes les actions collectives (dont nos archives partagées ou l’arbre Mayade sur ce site !) méritent d’être vécues pour de nombreuses raisons car la généalogie, c’est parfois tout simplement rencontrer de lointains cousins qui ont des documents retrouvés au grenier… une chose que l’IA n’aura pas de sitôt !

D’autres projets IA :

Lectaurep : présentation sur Youtube (lecture d’archives notariales).

SIMARA : plateforme de transcription d’inventaires manuscrits de 18ème au 20ème siècles.

Deux analyses qui présentent les apports de l’IA en généalogie :

Généalogie 4.0 : la révolution de l’intelligence artificielle ? Des technologies et des hommes

L’intelligence Artificielle et la généalogie : une nouvelle ère pour l’histoire familiale.

Soutenez Généalandogie sur Tipeee, site bien connu pour le financement participatif !

Laisser un commentaire