banner

Nouvelles

Jun 05, 2023

Les générateurs d’images culinaires IA ne peuvent pas remplacer les photographes culinaires

Classé sous :

Avec des anneaux infinis de crevettes et des tours rigides de calamars, les tentatives d'IA en matière de photographie culinaire virent à l'étrangeté

Si vous achetez quelque chose à partir d'un lien Eater, Vox Media peut gagner une commission. Consultez notre politique éthique.

L’autre jour, je me suis retrouvé, comme on a l’habitude de le faire, à perdre 10 minutes à jouer avec un générateur d’images IA. J'avais faim à ce moment-là et j'ai donc finalement commencé à créer des options pour un déjeuner hypothétique : un plateau de charcuterie ombragé, se dressant comme les ruines d'une ville antique avec un coucher de soleil en arrière-plan ; des anneaux de calamars d'apparence rigide, apparemment fabriqués à partir de lucite ou de verre, disposés en une pile astucieusement de travers ; et un cercle de crevettes caricaturales de 12,5, lisses et translucides sous une bannière de texte cursif qui disait simplement « Shimp ». Certaines images ressemblaient à de la nourriture ; aucun d’entre eux ne semblait comestible.

Comme mon expérience du déjeuner l'a montré, pour que l'IA génère une image de qualité, il faut savoir ce que vous faites – en commençant par des invites bien écrites (au-delà du simple « assiette de crevettes »), une étape cruciale que je n'avais pas franchie. Parfois, les résultats sont étonnants, comme les images générées par l'IA que Bon Appétit a récemment commandées à l'artiste Bobby Doherty, qui accompagnaient un article sur la conversation d'un éditeur avec ChatGPT alors qu'il développait des plats pour un hypothétique nouveau restaurant américain. Certaines des idées d'AI pour le menu faisaient rouler les yeux, comme cela peut être le cas dans les nouveaux restaurants américains, mais l'art vivant et surnaturel de Doherty semble toujours assez bon pour être mangé.

Il semblerait cependant que l’image moyenne des aliments générée par l’IA ne soit pas tout à fait là. Dans divers coins de Reddit et de Google Images, des tranches et des feuilles de pizza se chevauchent étrangement ou se mélangent les unes aux autres, les currys scintillent sur les bords, les dindes ont des pattes inhabituelles à des endroits inhabituels et d'autres aliments supposés ne sont pas du tout identifiables. Sur Adobe Stock, les utilisateurs peuvent monétiser les œuvres d'art générées par l'IA, à condition qu'ils disposent des droits nécessaires, et étiqueter leurs téléchargements comme des illustrations. La plupart des natures mortes et des tableaux photoréalistes de la plate-forme sont passables, même si quelques-uns virent au grotesque : un anneau sans fin de crevettes, tout corps et sans tête, ou son impossible cousin avec des têtes à chaque extrémité. Des images comme celles-ci, et même celles qui sont moins absurdes, résident souvent quelque part dans l’étrange vallée – un lieu très controversé qui occupe une place importante dans de nombreuses conversations autour de l’IA.

Pourtant, alors que les entreprises technologiques vantent les applications de l’IA pour le développement de recettes et même pour l’enseignement des techniques de cuisine, les réseaux de neurones artificiels font également leur entrée dans le monde de la photographie culinaire. Certaines agences de photos, dont Shutterstock, se sont associées à des plateformes d'IA sur leurs propres outils de génération d'images. Des startups comme Swipeby et Lunchbox entendent courtiser les restaurants et les livreurs qui ont besoin de visuels pour leurs menus en ligne. Bien sûr, il existe déjà un moyen de créer des visuels – en payant des photographes culinaires pour qu’ils fassent leur travail. Et au-delà de ce bourbier éthique se pose un problème juridique plus immédiat : certains modèles d’IA ont été formés avec des œuvres créatives, souvent sans licence, extraites d’Internet, et peuvent répondre à des demandes d’imitation d’artistes spécifiques. Naturellement, les artistes commencent à porter plainte devant les tribunaux.

Toutes préoccupations morales mises à part, pour le moment du moins, la nourriture semble encore plus délicieuse entre les mains des photographes culinaires, des vidéastes et des stylistes culinaires et d'accessoires. Alors, qu’est-ce qui ne va pas avec l’IA ? Karl F. MacDorman, spécialiste de l'interaction homme-machine et doyen associé à la Luddy School of Informatics, Computing and Engineering de l'Université d'Indiana, affirme qu'il existe de nombreuses théories sur ce qui pourrait amener certaines représentations à susciter des sentiments d'étrangeté ou de malaise à mesure qu'elles se rapprochent. précision totale. « L'étrange vallée est souvent associée à des choses qui sont liminales », explique MacDorman, comme lorsque nous ne savons pas si quelque chose est vivant ou mort, animal ou non-animal, réel ou animé par ordinateur. Cela peut être particulièrement prononcé lorsqu’une image mélange des catégories disparates ou attribue à un sujet des caractéristiques qui appartiennent généralement à des choses très différentes. Il n’est peut-être pas surprenant que l’IA, à ce stade relativement précoce, ait des difficultés avec tout cela.

PARTAGER