Voici ce que j’ai appris en testant le nouvel outil d’IA générative de Photoshop

Adobe a intégré des capacités d’IA génératives dans son logiciel phare d’édition d’images, en publiant mardi une version bêta de Photoshop qui élargit considérablement ce que les artistes et les éditeurs de photos peuvent faire. Cette décision promet de libérer un nouveau torrent de créativité, même si elle nous donne à tous une nouvelle raison de faire une pause et de nous demander si cette photo sensationnelle, effrayante ou inspirante que vous voyez sur Internet est réellement réelle.

Dans mes tests, détaillés ci-dessous, j’ai trouvé l’outil impressionnant mais imparfait. L’ajouter directement à Photoshop est un gros problème, permettant aux créateurs d’expérimenter dans l’outil logiciel qu’ils utilisent probablement déjà sans excursions vers Midjourney, Stable Diffusion de Stability AI ou d’autres outils d’IA génératifs extérieurs.

Avec la famille de technologies d’IA générative Firefly d’Adobe arrivant dans Photoshop, vous pourrez laisser l’IA remplir une partie sélectionnée de l’image avec ce qu’elle juge le plus approprié – par exemple, remplacer les fissures de la route par une chaussée lisse. Vous pouvez également spécifier les images que vous souhaitez avec une invite de texte, par exemple en ajoutant une double ligne jaune à la route.

Firefly dans Photoshop peut également agrandir une image, en ajoutant de nouveaux décors au-delà du cadre en fonction de ce qui est déjà dans le cadre ou de ce que vous suggérez avec du texte. Vous voulez plus de ciel et de montagnes dans votre photo de paysage ? Une plus grande foule au concert de rock? Photoshop obligera, sans les difficultés d’aujourd’hui à trouver le matériel source et à le raccorder.

La fonctionnalité, appelée remplissage génératif et prévue pour sortir des tests bêta au cours du second semestre 2023, peut être puissante. Dans la démonstration en direct d’Adobe, l’outil était souvent capable de faire correspondre les tons d’une photo, de se fondre parfaitement dans les images générées par l’IA, de déduire les détails géométriques de la perspective même dans les reflets et d’extrapoler la position du soleil à partir des ombres et de la brume du ciel.

De telles technologies ont émergé au cours de la dernière année alors que Stable Diffusion, Midjourney et Dall-E d’OpenAI ont captivé l’imagination des artistes et des professionnels de la création. Désormais, il est directement intégré au logiciel qu’ils utilisent probablement déjà, ce qui simplifie ce qui peut être un processus d’édition fastidieux.

“Cela place vraiment le pouvoir et le contrôle de l’IA générative entre les mains du créateur”, a déclaré Maria Yap, vice-présidente de l’imagerie numérique d’Adobe. “Vous pouvez vraiment vous amuser. Vous pouvez explorer certaines idées. Vous pouvez créer des idées. Vous pouvez créer sans jamais nécessairement entrer dans les outils profonds du produit, très rapidement.”

Mais vous ne pouvez pas encore vendre quoi que ce soit. Avec la technologie Firefly, y compris ce qui est produit par le remplissage génératif de Photoshop, “vous ne pouvez pas utiliser la sortie à des fins commerciales”, indiquent les règles bêta de l’IA générative d’Adobe.

L’IA Firefly de Photoshop imparfaite mais utile

Lors de mes tests, j’ai fréquemment rencontré des problèmes, dont beaucoup provenaient probablement de la portée limitée de l’imagerie d’entraînement. Lorsque j’ai essayé d’insérer un poisson sur un vélo dans une image, Firefly n’a ajouté que le vélo. Je n’ai pas réussi à faire en sorte que Firefly ajoute un kraken pour sortir de la baie de San Francisco. Un bœuf musqué ressemblait à un hybride panda-orignal.

Le matériel moins fantaisiste présente également des problèmes. Le texte ressemble au script d’une race extraterrestre. Les ombres, l’éclairage, la perspective et la géométrie n’étaient pas toujours au rendez-vous.

Les gens sont durs aussi. En y regardant de plus près, leurs visages étaient déformés de manière étrange. Les humains ajoutés aux prises de vue pourraient être positionnés trop haut dans le cadre ou mélangés de manière peu convaincante.

Pourtant, Firefly est remarquable pour ce qu’il peut accomplir, en particulier avec des photos de paysages. Je pourrais ajouter des montagnes, des océans, des ciels et des collines aux paysages. Une camionnette de livraison blanche dans une scène de nuit était jaunâtre de manière appropriée pour correspondre aux lampadaires à vapeur de sodium de la scène. Si vous n’aimez pas le trio de résultats présenté par Firefly, vous pouvez cliquer sur le bouton “générer” pour obtenir un autre lot.

Compte tenu du rythme des développements de l’IA, je m’attends à ce que Firefly dans Photoshop s’améliore.

Il est difficile et coûteux de recycler de grands modèles d’IA, ce qui nécessite un centre de données rempli de matériel coûteux pour traiter les données, ce qui prend parfois des semaines pour les plus grands modèles. Mais Adobe prévoit des mises à jour relativement fréquentes de Firefly. “Attendre [about] mises à jour mensuelles pour des améliorations générales et se recycler tous les quelques mois selon toute vraisemblance », a tweeté mardi le chef de produit Adobe, Scott Belsky.

Automatisation de la manipulation d’images

Pendant des années, “Photoshop” n’a pas seulement fait référence aux logiciels d’Adobe. Il est également utilisé comme verbe signifiant des manipulations de photos comme l’amincissement de la taille des mannequins ou la dissimulation des échecs de lancement de missiles. Les outils d’IA automatisent non seulement le plaisir et les envolées fantaisistes, mais aussi de fausses images comme une prétendue explosion au Pentagone ou une photo convaincante du pape dans une veste bouffante, pour choisir deux exemples récents.

Avec l’IA, attendez-vous à des techniques d’édition bien plus subtiles que la fumée supplémentaire facilement reconnaissable comme ajoutée numériquement aux photos d’une attaque israélienne contre le Liban en 2006.

C’est le reflet de l’épée à double tranchant qu’est l’IA générative. La technologie est indéniablement utile dans de nombreuses situations, mais brouille également la frontière entre ce qui est vrai et ce qui est simplement plausible.

De son côté, Adobe tente de limiter les problèmes. Il ne permet pas aux invites de créer des images de nombreuses personnalités politiques et vous bloque pour des “problèmes de sécurité” si vous essayez de créer une image de fumée noire devant la Maison Blanche. Et ses directives d’utilisation de l’IA interdisent les images impliquant de la violence, de la pornographie et du “contenu trompeur, frauduleux ou trompeur qui pourrait entraîner des dommages dans le monde réel”, entre autres catégories. “Nous désactivons les comptes qui adoptent un comportement trompeur ou nuisible.”

Firefly est également conçu pour ignorer les invites de style comme celles qui ont provoqué de graves plaintes d’artistes mécontents de voir leur type d’art reproduit par un centre de données. Et il prend en charge la technologie d’identification de contenu de la Content Authenticity Initiative qui peut être utilisée pour étiqueter une image comme ayant été générée par l’IA.

Aujourd’hui, les images d’IA génératives créées avec le site Web Firefly d’Adobe ajoutent des informations d’identification de contenu par défaut ainsi qu’un filigrane visuel. Lorsque la fonctionnalité Photoshop existera en version bêta et sera livrée plus tard cette année, les images incluront automatiquement les informations d’identification du contenu, a déclaré Adobe.

Les personnes essayant de truquer des images peuvent contourner cette technologie. Mais à long terme, cela fera partie de la façon dont nous évaluons tous les images, estime Adobe.

“Les informations d’identification de contenu donnent aux personnes qui veulent faire confiance un moyen de faire confiance. Il s’agit d’une technologie open source qui permet à chacun de joindre des métadonnées à ses images pour montrer qu’il a créé une image, quand et où elle a été créée, et quels changements ont été fait en cours de route », a déclaré Adobe. “Une fois qu’il sera devenu la norme que les nouvelles importantes soient accompagnées d’informations d’identification de contenu, les gens seront alors sceptiques lorsqu’ils verront des images qui n’en ont pas.”

IA générative pour les photos

La famille d’outils d’IA générative Firefly d’Adobe a commencé avec un site Web qui transforme une invite de texte comme “chaise moderne composée de vieux pneus” en une image. Il a ajouté quelques autres options depuis, et les abonnés Creative Cloud pourront également essayer une version allégée de l’interface Photoshop sur le site Firefly.

Lorsque Dall-E d’OpenAI a apporté cette technologie à tous ceux qui s’y sont inscrits en 2022, cela a contribué à faire passer l’intelligence artificielle générative d’une curiosité technologique à une prise de conscience générale. Maintenant, il y a beaucoup d’inquiétude et d’excitation, car même les créateurs d’IA s’inquiètent de ce que la technologie apportera maintenant et dans un avenir plus lointain.

L’IA générative est une forme relativement nouvelle de technologie d’intelligence artificielle. Les modèles d’IA peuvent être formés pour reconnaître des modèles dans de grandes quantités de données – dans ce cas, des images étiquetées provenant de l’activité stock art d’Adobe et d’autres sources sous licence – puis pour créer de nouvelles images basées sur ces données sources.

L’IA générative a fait un bond en avant pour généraliser la sensibilisation avec des modèles de langage utilisés dans des outils tels que le chatbot ChatGPT d’OpenAI, Gmail et Google Docs de Google, et le moteur de recherche Bing de Microsoft. Lorsqu’il s’agit de générer des images, Adobe utilise une technique de génération d’images AI appelée diffusion qui est également derrière Dall-E, Stable Diffusion, Midjourney et Imagen de Google.

Adobe appelle Firefly pour Photoshop une technologie « co-pilote », la positionnant comme une aide à la création, et non comme un substitut pour les humains. Yap reconnaît que certains créateurs craignent d’être remplacés par l’IA. Adobe préfère le voir comme une technologie capable d’amplifier et d’accélérer le processus créatif, en diffusant des outils créatifs à une population plus large.

“Je pense que la démocratisation que nous avons traversée, et avoir plus de créativitéest une chose positive pour nous tous”, a déclaré Yap. “C’est l’avenir de Photoshop.”

Note des éditeurs : Testeur Joe utilise un moteur d’IA pour créer des explications sur les finances personnelles qui sont éditées et vérifiées par nos éditeurs. Pour en savoir plus, voir ce post.

Laisser un commentaire