L'actualité des entreprises chaque matin et gratuitement dans votre boite mail !

L'actualité des entreprises chaque matin et gratuitement dans votre boite mail !

Societe.TechMétiersIntelligence ArtificielleDe centaines de PDFs à Excel : la nouvelle bataille de l’IA...

De centaines de PDFs à Excel : la nouvelle bataille de l’IA documentaire

De centaines de PDFs à Excel : la nouvelle bataille de l’IA documentaire

« Nos clients peuvent enfin faire faire des choses utiles à leur stagiaires, au lieu de recopier tel ou tel type de PDF dans un tableur toute la journée»
Louis Mahl, co-fondateur d’excelrate.ai

Au-delà des projecteurs braqués sur les grands modèles de langage, un marché discret explose : l’intelligent document processing (IDP). En clair : extraire automatiquement des données structurées depuis des PDFs, scans ou mails pour les réinjecter dans Excel ou un ERP. D’après Gartner, le secteur pèsera 2,09 milliards USD dès 2026, soit +13 % de CAGR. Pourtant, à peine un tiers des entreprises concernées ont déjà sauté le pas. Autant dire qu’il reste de la place pour les jeunes pousses… et pour la disruption.

Pourquoi le PDF est le dernier bastion de la saisie manuelle ?

S’il est lu bêtement, le PDF est un fouillis d’informations: le texte est parsemé ça et là, sans que le logiciel ne puisse (facilement) relier les morceaux entre eux. Il ne faut pas oublier que le PDF est avant tout un format d’impression. Pratique pour être lu par des êtres humains, et garantir une impression impeccable sans problèmes de versions de logiciels.

Les IA, elles, bénéficient de:

  1. OCR contextuel : classifie « 10 000 » en nombre, pas en chaîne de caractères.
  2. Vision tabulaire : reconstitue lignes & colonnes même sans bordures.
  3. LLM + NLP : lit les intitulés, devine les unités, aligne les colonnes.

Résultat : des plateformes qui flirtent avec 98-99 % de précision.

Business case : Uber réduit son lead-time de 80 %

En déployant un pipeline GenAI interne, le département finance d’Uber a poussé 35 % de ses factures à 99,5 % d’exactitude sans revue humaine et rentabilisé le projet en cinq semaines (blog interne, mai 2025).

Réglementation : attention à l’Acte européen sur l’IA

La réglementation européenne sur l’IA interdit la prise de risques « inacceptables » le 2 février 2025, et ce sera définitivement effectif en août 2025. Les points clés ? Obligation de transparence et d’audit, journal d’export et métriques d’erreur requis. Les systèmes IDP comme excelrate ou rossum sont en général compatibles avec tous les besoins réglementaires.

Notre verdict

Longtemps cantonnée aux robots RPA et aux OCR « boutons-poussoirs », la saisie PDF vivait sa routine sans histoire. Mais l’IA générative change la donne : coût marginal proche de zéro, précision au-delà du seuil humain, et conformité native vis-à-vis de Bruxelles. Pour une startup tech comme excelrate.ai, c’est l’occasion de se glisser entre les géants du cloud et les département IT débordés. D’autres startups comme Rossum ou Nanonets se spécialisent sur les besoins plus complexes des très grandes entreprises. Pour les DAF, le message est clair : automatiser maintenant ou expliquer demain à son board pourquoi la concurrence a gagné un cycle de closing.


Sources

Louis Parmentier
Louis Parmentier
Diplômé d'HEC Paris et ancien membre de l'incubateur de l'école, j'ai créé plusieurs startups dans le web, les médias et la culture. Passionné par le journalisme, j'ai lancé Societe.Tech en 2015 afin de suivre l'actualité des entreprises et des logiciels SaaS. Je publie des articles ainsi que des interviews sur les entrepreneurs et sur les éditeurs de logiciels.

Newsletter : L'actualité des entreprises chaque matin et gratuitement dans votre boite mail !

Pour aller plus loin

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Newsletter

Les derniers articles