Devin : le guide du coding agent autonome de Cognition AI

Devin est le premier produit du marché à avoir promis un « ingénieur logiciel autonome ». Lancé par Cognition AI en mars 2024, l’outil a déclenché autant d’enthousiasme que de critiques sur la sincérité de sa démonstration initiale. Deux ans plus tard, Devin est un produit commercial vendu à des équipes d’ingénierie, intégré à Slack, GitHub et Jira, et facturé à la consommation. Ce guide vous explique ce qu’il fait vraiment en 2026, comment se positionne son tarif inhabituel, et à qui il convient une fois passée la hype.

Pour situer Devin dans l’ensemble du marché, notre panorama des coding agents pose le décor. Cet article concerne les développeurs avancés et les directions techniques ; pour un public sans bagage de programmation, notre comparatif Lovable, Bolt et Replit couvre les outils visuels.

En bref
Devin est l’agent autonome de Cognition AI, qui prend un ticket en entrée et rend une pull request en sortie.
Pionnier du segment, lancé en mars 2024, et désormais à sa version 2.0 depuis le printemps 2025.
Il s’exécute dans une infrastructure cloud propriétaire, indépendante de votre éditeur, avec un navigateur, un terminal et un éditeur de code intégrés.
Facturation à la consommation par unités appelées ACU, et non par utilisateur : Core pay-as-you-go, Max à 200 $, Team à 500 $/mois, Enterprise sur mesure.
Différencié de Cursor (éditeur IDE) et de Claude Code (terminal) par un fonctionnement délégué pur : vous assignez, il livre.
Pour structurer le recours aux agents codeurs autonomes dans votre équipe : notre formation pour structurer le recours aux agents codeurs autonomes.

Qu’est-ce que Devin ?

Devin est un agent de programmation entièrement autonome, conçu par Cognition AI, société fondée fin 2023 à San Francisco. Quand il a été présenté publiquement en mars 2024 par une vidéo de démonstration virale, l’outil a été décrit comme « le premier ingénieur logiciel IA au monde ». L’angle était maximal et la formulation a marqué les esprits. La presse spécialisée a aussi rapidement examiné l’authenticité de cette démo, et le débat qui s’est ouvert a un peu refroidi l’engouement initial. Deux ans plus tard, l’outil est commercialisé et vendu à des équipes d’ingénierie.

Sur le fond, Devin se distingue des assistants installés dans un éditeur. Vous ne le voyez pas travailler ligne par ligne. Vous lui confiez une tâche en langage naturel, par exemple « corrige ce bug », « ajoute cette fonctionnalité » ou « migre cette dépendance », et il s’en occupe sur sa propre infrastructure. Il prépare un plan, ouvre un environnement de travail, lit votre dépôt, écrit le code, lance les tests et finit par ouvrir une pull request que vous relisez. La sortie est donc une proposition de modification prête à juger, pas un extrait à coller.

Comme le résume une fiche produit récente, la différence avec Cursor est nette. Cursor est de la collaboration dans l’éditeur ; Devin est du travail délégué hors de l’éditeur. Ce sont deux philosophies complémentaires qu’on retrouve souvent dans les mêmes équipes : l’éditeur agentique pour le travail interactif, l’agent autonome pour les tâches que l’on peut confier sans suivre chaque étape.

Comment fonctionne Devin

Le cœur technique de Devin est ce que Cognition appelle une Agent Computer Interface ou ACI. Concrètement, c’est une machine virtuelle isolée, fournie à chaque session, qui contient les outils dont un développeur humain disposerait : un navigateur, un terminal, un éditeur de code et l’accès au dépôt cible. Devin agit à l’intérieur de cette machine, sans toucher à votre poste ni à votre environnement local.

Le canal d’entrée compte : Devin se branche sur les outils que vos équipes utilisent déjà. Vous pouvez lui assigner une tâche depuis un message Slack, une issue Linear, un ticket Jira, une issue GitHub ou directement depuis son interface web. L’idée est de réduire au minimum la friction d’usage, en intégrant l’agent dans le flux de travail existant plutôt que de demander à l’équipe d’ouvrir un nouvel outil.

À la sortie, vous récupérez une pull request normale sur votre dépôt, avec un message de commit, une description du raisonnement suivi, les tests passés et les éventuels avertissements rencontrés. Cette PR se relit comme celle d’un collègue, ce qui rend le cycle d’examen comparable à celui d’un développeur humain.

Une particularité utile : Devin maintient un état de session sur la durée. Si l’agent rencontre un obstacle qu’il ne sait pas résoudre, il peut s’arrêter et demander une information à l’équipe via Slack, plutôt que de bricoler une réponse approximative. Ce comportement, hérité de la pratique d’un développeur junior bien encadré, change la nature de la collaboration : on ne juge pas seulement le résultat final, on peut aussi orienter la trajectoire en cours de route. Cette poignée d’allers-retours, quand elle a lieu, fait souvent la différence entre une PR exploitable et une tentative à jeter.

SWE-bench, mythe et réalité

Un point récurrent dans les discussions sur Devin tient au benchmark SWE-bench, qui mesure la capacité d’un agent à résoudre de vraies issues GitHub. Comme le rappelle un retour d’usage 2026, Devin se positionne dans la catégorie équipes et entreprises plutôt que développeurs individuels, ce qui s’explique par son tarif d’entrée et la nature de ses cas d’usage. Devin a obtenu 13,86 % à son lancement en 2024, un chiffre qui était à l’époque un saut considérable par rapport à ce que les modèles précédents arrivaient à faire. Ce nombre a longtemps servi d’argument marketing et a aussi nourri les critiques sur la maturité réelle de l’outil.

L’histoire de ce chiffre mérite quelques rappels, car elle dit beaucoup sur la maturité du segment. À sa publication, le score a été perçu comme un saut de génération, et il a accompagné toute la communication initiale. La vidéo de démonstration a aussi été examinée à la loupe par la communauté, qui a soulevé des questions sur la fidélité de la mise en scène par rapport à un usage réel. Cognition a depuis publié plusieurs mises à jour techniques et a fait évoluer le produit, et le débat s’est apaisé à mesure que Devin se vendait à de vraies équipes.

Deux choses sont à savoir aujourd’hui. La première : le 13,86 % reflète l’architecture de Devin au moment de son lancement, pas son comportement actuel. Le produit a beaucoup évolué depuis Devin 2.0 au printemps 2025, et les scores plus récents ne sont pas tous publics de la même façon. La deuxième : SWE-bench est un test parmi d’autres, et il évalue plus la capacité du modèle sous-jacent que l’utilité pratique de l’outil dans votre contexte. Les analyses comparatives de 2026 le rappellent : pour décider d’un outil, l’expérience d’usage sur vos propres tickets compte plus que le score sur une suite de tests publique.

Combien coûte Devin

La tarification de Devin est inhabituelle, et c’est volontaire. Là où la plupart des outils du marché vendent par utilisateur, Devin vend du temps d’agent. La mesure de référence est l’ACU, ou Agentic Compute Unit, qui agrège le temps de la machine virtuelle, l’inférence des modèles et la bande passante consommée pendant qu’un agent travaille. Comme l’expliquait une analyse récente, ce modèle reflète mieux la nature du travail d’un agent qu’une licence à l’utilisateur, parce qu’un agent qui tourne cinq heures coûte vraiment plus qu’un agent qui tourne cinq minutes. Le nombre de places dans l’outil est illimité sur tous les plans ; vous payez la consommation, pas l’accès.

Quatre formules cohabitent en 2026. La version Core ouvre l’usage en paiement à la consommation, à partir de 20 $, avec un coût d’environ 2,25 $ par ACU. La version Max, à 200 $ par mois, ouvre l’accès à des fonctionnalités plus avancées et garde un plafond de dix sessions simultanées. La version Team, recommandée par Cognition pour les équipes actives, coûte 500 $ par mois et inclut 250 ACU à un tarif réduit de 2 $ par ACU, avec sessions simultanées illimitées et options d’auto-réapprovisionnement. La version Enterprise, à tarif négocié, ajoute l’authentification unique en SAML ou OIDC et le déploiement en VPC privé pour les organisations qui exigent un cloisonnement réseau.

Le bon réflexe avant de signer pour Team consiste à mesurer une vraie semaine d’usage en Core pay-as-you-go, pour voir combien d’ACU vos tickets typiques consomment. Selon la complexité, un même ticket peut peser entre une fraction d’ACU et plusieurs unités, et la projection à l’année peut varier d’un facteur dix. Pour cadrer ce passage à l’usage régulier, notre check-list avant de mettre un agent en production aide à poser les questions de gouvernance et de budget.

Devin face à OpenHands et à Jules

Le segment des agents autonomes en sandbox cloud compte trois acteurs principaux en 2026 : Devin, OpenHands et Jules. Tous trois prennent un ticket et rendent une pull request, mais leurs philosophies divergent.

Devin est l’option propriétaire mature : produit fini, intégrations soignées, contrats Enterprise, et une feuille de route portée par une société bien capitalisée. C’est aussi l’option la plus coûteuse, et la moins ouverte aux personnalisations profondes. Si votre direction technique cherche un outil prêt à l’usage qu’elle peut acheter et déployer, c’est le candidat le plus avancé du segment.

OpenHands, l’alternative open source, ouvre un autre choix : le code est libre, vous pouvez l’héberger vous-même, et l’écosystème est porté par une communauté importante. C’est l’option que choisissent les organisations qui tiennent à garder la main sur leur infrastructure ou à étendre l’outil avec leurs propres règles.

Jules, plus récent, vient de Google et se distingue par son fonctionnement asynchrone par conception et son intégration profonde dans l’écosystème Google. C’est l’option qui s’inscrit le plus naturellement dans une équipe qui utilise déjà Google Cloud et Gemini.

Pour le match plus large entre les outils dev en général, notre comparatif GitHub Copilot, Cursor et Claude Code couvre les choix les plus adaptés au travail interactif au quotidien.

Devin pour qui ?

Trois profils tirent un avantage particulier de Devin. La direction technique d’une équipe d’au moins dix développeurs y trouve un complément à son équipe : un acteur qui prend en charge les tickets bornés et routiniers que personne ne veut faire mais qu’il faut quand même livrer. Le retour sur investissement se mesure sur les tâches qu’on délègue, pas sur celles qu’on garde pour la valeur humaine ajoutée. Exemple concret : la migration d’une bibliothèque qui touche cinquante fichiers, la mise à niveau régulière des dépendances, ou l’ajout d’un même type de test à plusieurs endroits d’un projet. Ce sont des chantiers que les développeurs senior préfèrent rarement gérer eux-mêmes, et qui s’accumulent dans le backlog sans jamais sortir. Confier ces tickets à un agent et les relire ensuite libère du temps sur les sujets qui demandent vraiment du jugement.

L’équipe de plateforme ou l’équipe d’outillage qui industrialise les usages de l’IA dans une grande organisation s’en sert pour explorer les agents autonomes en production, mesurer ce qui passe et ce qui ne passe pas, et bâtir des règles internes adaptées. Cognition publie régulièrement des cas d’usage clients, dont un cas client Visma rapportant un doublement de productivité sur une migration applicative majeure, à prendre avec les précautions d’usage des études fournisseur.

L’équipe qui évalue le segment des agents IA pour préparer une décision d’achat plus large y trouve une référence du marché, à comparer avec les alternatives open source et avec les options des grands éditeurs cloud. Pour un développeur individuel ou un petit projet, en revanche, le prix d’entrée et la profondeur du produit ne sont pas justifiés : des outils comme Claude Code ou Cursor couvrent ces besoins de façon plus économique.

Forces et limites de Devin

Quatre forces structurent le produit. La première est l’autonomie réelle de bout en bout : Devin gère le cycle complet ticket-à-PR, ce qui se traduit en temps gagné dès que la tâche est bien bornée. La deuxième est l’intégration aux outils de l’équipe (Slack, Jira, Linear, GitHub, GitLab, fournisseurs d’identité), qui évite la friction d’un outil isolé. En pratique, un développeur qui découvre un bug dans Slack peut transformer son message en ticket Devin sans changer de fenêtre, et la PR remonte dans la même conversation. Ce détail d’ergonomie pèse plus lourd que les benchmarks dans l’adoption réelle. La troisième est la maturité contractuelle : SAML/OIDC, déploiement VPC, partenariats cloud, autant d’éléments qui rassurent les services achats des grandes organisations. La quatrième est la trajectoire produit : Cognition est très bien capitalisée, avec une levée de série C de 400 M $ en septembre 2025 à 10,2 Md $ de valorisation et un partenariat Microsoft Azure pour le déploiement cloud, ce qui donne de la visibilité sur la pérennité.

Trois limites méritent attention. D’abord, le coût peut s’envoler si on délègue trop de tâches longues sans suivre la consommation. Le modèle ACU est honnête mais demande un suivi serré, au moins dans les premières semaines. Ensuite, la qualité reste inégale sur les tâches mal bornées ou ambiguës. Plusieurs retours d’usage signalent un taux d’échec non négligeable sur les tickets qui demandent un jugement métier fort, ce qui rappelle l’évidence : l’agent excelle là où le périmètre est clair, beaucoup moins là où il faut décider. Enfin, comme pour tout agent qui écrit du code, la relecture humaine reste indispensable avant la mise en production, en particulier sur la sécurité et les données. L’autonomie de Devin rend cette discipline d’autant plus utile que vous ne voyez pas l’agent travailler en direct.

Se former à l’usage des agents autonomes

Choisir entre Devin, ses alternatives, et son outillage complémentaire ; cadrer la consommation à l’échelle d’une équipe ; définir une politique de relecture des pull requests : ces questions reviennent à chaque déploiement. Notre formation aux agents IA dans une équipe de développement couvre ces sujets : choix d’outils selon le profil, gouvernance des données, cadrage AI Act et RGPD, architecture de déploiement à l’échelle.

La formation existe en inter-entreprises et en intra (3 350 € HT pour un groupe de douze participants au maximum), en présentiel ou à distance, et elle est éligible aux financements des OPCO.

FAQ Devin AI

Devin remplace-t-il un développeur ?

Non. Devin prend en charge des tâches bornées qu’on lui assigne, et il rend un travail à relire. Il ne décide pas d’architecture, ne tranche pas un compromis produit et ne porte pas la responsabilité du code livré. Comme un développeur junior à qui l’on confie des chantiers cadrés, il accélère ce qui est répétitif et laisse les choix structurants aux humains qui l’entourent.

Qu’est-ce qu’un ACU ?

Un ACU, ou Agentic Compute Unit, est la mesure normalisée que Cognition utilise pour facturer la consommation de Devin. Elle agrège le temps de la machine virtuelle, l’inférence des modèles et la bande passante utilisés pendant qu’un agent travaille. Cette mesure permet à Cognition de facturer le travail réellement effectué plutôt qu’un nombre de comptes, ce qui colle mieux à la nature d’un agent qui peut tourner en arrière-plan.

Combien coûte Devin en pratique ?

La version Core démarre à 20 $ en paiement à la consommation, avec environ 2,25 $ par ACU. Max coûte 200 $ par mois avec un plafond de dix sessions simultanées. Team est à 500 $ par mois avec 250 ACU inclus et des sessions simultanées illimitées. Enterprise se contractualise sur mesure, avec SAML, OIDC et déploiement en VPC privé.

Devin et Cursor servent-ils la même chose ?

Non. Cursor est un éditeur de code dans lequel vous travaillez avec l’IA en collaboration directe. Devin est un agent qui travaille à votre place sur sa propre infrastructure, à partir d’un ticket. Beaucoup d’équipes utilisent les deux : Cursor pour le travail interactif dans l’éditeur, Devin pour les tâches qu’on confie en arrière-plan. Les deux ne s’opposent pas, ils se complètent.

Quelle différence avec OpenHands ?

OpenHands est l’alternative open source de ce segment, gratuite à télécharger et hébergeable chez vous, avec une communauté très active. Devin est un produit propriétaire commercial, plus poli côté interface et plus avancé sur les intégrations entreprise, mais bien plus cher. Le choix dépend de votre rapport à l’open source et de votre capacité à maintenir une plateforme en interne.

Mes données sont-elles confidentielles avec Devin ?

La version Enterprise propose un déploiement en VPC privé, ce qui permet d’isoler le trafic réseau. Sur les autres versions, le code que vous confiez à Devin passe par l’infrastructure de Cognition pour être traité. Pour un code particulièrement sensible, lisez les conditions exactes du plan retenu et alignez votre politique d’usage interne sur ces engagements.

Quels langages Devin gère-t-il ?

Devin fonctionne avec les langages que vous trouverez en production sur les principaux dépôts ouverts qui ont servi à entraîner son modèle : Python, JavaScript, TypeScript, Java, Go, Ruby, Rust et la longue traîne. La qualité varie selon le langage et la profondeur de l’écosystème, comme pour tous les agents de ce type. Sur des langages très spécialisés ou des piles techniques internes, la mise en route demande davantage d’itérations.

Devin a inauguré une catégorie qui n’existait pas en 2024 et qui est devenue, en deux ans, un segment à part entière du marché des outils de programmation. Sa promesse initiale a été nuancée par l’usage réel, mais le produit a tenu suffisamment pour devenir une référence et ouvrir la voie à des alternatives crédibles. Reste une question pratique : la valeur dépend autant de l’outil que de la discipline avec laquelle on le pilote, et c’est cette discipline qui sépare une équipe qui en tire un vrai bénéfice d’une équipe qui dépense sans gain mesurable. Pour décider si cette catégorie a sa place dans votre organisation, notre parcours Agents IA pour cadrer leur usage en production en aborde les enjeux concrets.