Intelligence artificielle et jeu de société

Et tu penses qu’un bon artiste qui utilise l’IA sortira quelque chose qui se place comment par comparaison a « mme Michu IA » ou « un artiste moyen sans IA » ou un « bon artiste sans IA »… je pense que le vrai sujet est là sur le coté qualitatif et quantitatif :slight_smile:

Exemple dans nos jeux : un artiste reconnu qui actuellement ne peut sortir que 10-20 illus pour un jeu parce que ca lui prend un temps fou, qui utiliserais l’IA ne sortirait-il pas dans le temps utilisé pour ces 10-20 illus une centaine de qualité équivalente voir supérieure… et donc pour le même prix un jeu plus joli et immersif, sans piquer le boulot de personne ?

Parce que meme si Mme Michu peut faire des trucs bien avec l’IA, pour avoir vu ce que des gens avec un vrai talent artistique en font c’est quand meme pas pareil :slight_smile: (et faut bien quelqu’un pour lui dire ce qu’on veut à l’IA, elle n’est pas encore interfacée en direct avec le cerveau de l’éditeur de jeu).

À partir du moment où tu décentres la place de l’homme, une révolution copernicienne, tu verras que tout cela n’a absolument aucune importance ni gravité.
Notre planète, nôtre système solaire n’ont rien de central et d’exceptionnel. Notre espèce non plus. Il n’y a pas de « propre de l’homme ». Une machine peut faire de l’art : et alors ?

1 « J'aime »

De manière générale, c’est un argument que je vois revenir beaucoup avec l’IA. Mais le souci de l’IA c’est le manque de précision de ce que tu produis. Pas du tout le manque de possibilités artistiques. Parce qu’on oublie quelque chose de majeur ici. Le prompteur EST un humain. Et donc son prompt peut très bien être très créatif et/ou posséder des styles clivants.

Lorsqu’on parle de midjourney, ou d’IA en général, les gens ont en tête le style « par défaut ». Un peu 3D. Un peu « lisse ». Ou photographique. Genre ce genre de trucs très reconnaissables :

Juste quelques petits exemples de choses bien plus stylisées que ce que produit Midjourney « de base ». Rien qu’en déplacant un peu son point dans le latent space, on obtient des styles très divers.

Le latent space c’est quoi ? Faut, en gros, imaginer un point qui se déplace dans un gros cube (même si de base y’a bien plus de dimensions qu’un cube, mais pour visualiser au delà de la 3D c’est souvent pas facile) et qui va produire un « style graphique » selon là où il est placé. Si le point par « défaut » est placé dans une moyenne des styles que « les gens aiment bien ». C’est loin de figer cette constante.

Ci-dessous des images produites pour explorer un peu les différents styles via midjourney (option sref --random) SANS changement de prompt.

Prompt utilisé ici : « Zeus, in a Mythological style, fantasy art »




Et je ne parle pas d’autres trucs sur lesquels je bosse…





Tout ça pour dire qu’il est à mon sens faux de dire qu’on ne peut produire que « du contenu moyen » ou même, pour reprendre certain autres posts vus coté illustrateur, des trucs nuls/médiocres.
Et que c’est une capacité à acquérir que d’explorer et prompter correctement pour produire des résultats un brin plus surprenants et qualifiables comme « artistique ».

11 « J'aime »

Ton raisonnement se tient. Dans l’état actuel des outils IA pour le moins. Mais qu’en sera-t-il dans 5 ans? Dans 10 ans? Peut-être que Mme Michu pourra faire des pièces de musées car l’outil aura évolué, et nos exigences se seront standardisées (pas eu besoin de l’IA pour voir ce phénomène, suffit de voir le cinéma mainstream).

C’est sûr, ça permettra de sortir plus de jeux moins chers. Pas forcément meilleurs, mais moins chers. Comme ça on pourra en acheter plein, se rendre compte qu’ils sont pas vraiment bons (si on a le temps de les tester), juste un reskin pour certains, et on pourra s’en débarrasser la conscience tranquille car ils n’ont pas coûté cher à l’achat. Je caricature un peu, mais 1000+ sorties annuelles quand même…
Par contre les artistes auront bien la pression pour produire à la chaîne des illus car les éditeurs se seront habitués à 10 fois plus de propositions parmi lesquelles choisir. Souvent à cause d’un brief pas assez spécifique.

C’est sûr que si on part sur ces considérations, même la survie de notre espèce sur cette planète n’a pas vraiment d’importance. Mais si on veut quand même un tant soit peu essayer, ce n’est peut-être pas inutile de se poser des questions sur l’utilisation d’un outil qui a le potentiel de faire beaucoup de dégâts. La bombe H n’est rien à l’échelle de l’univers, mais curieusement on s’en inquiète quand même pas mal.

C’est vrai que tes exemples sont mieux que la moyenne de ce qu’on voit en général. Et le facteur humain du prompteur je suis aussi d’accord. Mais ça reste un prompteur, pas un illustrateur. La maîtrise de la sortie est relative, avec une part de probabilité et d’aléatoire. En ayant pompé et digéré le travail d’autres artistes, pas juste de l’inspiration.

Au passage, question que je me pose réellement, est-il déjà possible de générer un contenu à partir d’un contenu sous un autre format? Je m’explique.
Nombre de compositeurs ont écrit à partir de textes ou tableaux qui les ont inspiré. Une IA peut-elle déjà générer un contenu à partir d’un support qui l’aurait « inspiré »? Ou est-ce trop humain comme fonctionnement ?

Edit : support autre que le prompt je veux dire

3 « J'aime »
  • Alors oui, la maîtrise de la sortie est relative. Mais elle l’est dans pas mal de domaines et expériences artistiques (envoi de peinture, photographie animale dans la nature) avec un nombre de facteurs qui n’est pas réellement maîtrisable du début à la fin. L’art ne se définit donc pas part une présence ou non d’aléatoire. C’est cependant « le gros défaut » d’une IA. Bien qu’une fois qu’un style trouvé, tu peux adapter l’IA pour qu’elle reprenne ce style.

Exemple dans un meme style (tjrs avec le prompt zeusien) de 2 images partageant un même style :


Concernant le pompage et la digestion (et/ou la non inspiration) des artistes. Je ne suis que partiellement d’accord.

Nombre d’artistes ont déja plagié de ouf. Sans trop de soucis, et bien plus qu’une IA. Par exemple, si vous connaissez pas Blek le rat qui est mon exemple préféré, je vous invite à voir ses oeuvres, puis à deviner qui s’en est « inspiré ». Ce qui veut dire que la machine ne fait pas pire que les humains. Pire encore, l’algo n’est pas capable de « copier » (sauf dans de très rares cas d’overtraining, qui s’expliquent du coup, par une mauvaise utilisation de l’outil), donc elle est, de ce coté là meilleure qu’une humain éthiquement parlant.

Il faut bien comprendre que la base d’entraînement ne fait « que » comprendre comment sont représentés des mots clés, et ne gardent en mémoire AUCUNE des oeuvres artistiques. Dans une opération qui est totalement indépendante d’une quelconque génération d’images. Ce qui veut dire que lors de la génération d’une image, AUCUNE illustration artistique n’est utilisée pour en générer une nouvelle.

Pour prendre un autre exemple. Si la base ne faisait que récolter des tailles d’images sur internet pour faire des stats genre « 0.009% des images font 320 pixels par 459 », ca poserait absolument souci à personne. C’est pourtant plus ou moins ce qu’elle fait, de manière un peu plus poussé puisqu’elle associe ça à des mots clés.

Ceci dit, je comprend que le sujet existe, et du coup je laisse les légistes en discuter.

Je dirais que c’est la base d’une IA générative que de former un ensemble cohérent à partir d’une inspiration, quelque soit sa forme.

Pour répondre à ta question, tu peux mettre des images en entrée sur la quasi totalité des modèles pour qu’elles s’inspirent de cette base.

Sur midjourney tu as 3 options :

  • La mettre en base du prompt (similaire aux autres modèles) : L’IA va donc tenter de se caler sur cette image pour toute la composition.
  • La mettre en référence de style (–sref) : Elle va tenter d’en garder ce qui pourrait en définir le style graphique.
  • La mettre en référence de « personnage » (–cref) : Elle va tenter d’essayer de comprendre le personnage lié à l’image que tu as entré pour en garder les même caractéristiques. Même dans des styles différents.

Tu as aussi une option de « blend » qui permet de mélanger des images pour des résultats encore moins controlables mais qui sont très intéressants.

Ceci dit, c’est un peu la base de l’IA générative de comprendre ce qu’elle doit dessiner via un support principal : Le langage. Donc oui aussi de ce coté là, elle s’inspire de ton langage pour générer un ensemble.

Même coté musique (udio par exemple), les IA vont utiliser ton texte comme tout un tas de mots clés pour en définir l’ambiance.

(edit : j’ai vu ton édit trop tard donc le prompt est encore considéré dans ma réponse, mais tu as aussi le coté visuel :p)

3 « J'aime »

Franchement… tu penses qu’elle en a ?

2 « J'aime »

Pas de souci, et merci pour le détail :wink:
Donc à partir du moment où l’IA va essayer d’extraire un prompt d’une image, et donc la comprendre partiellement, ce prompt pourra servir à générer au autre type de contenu, dont de la musique. Si j’ai bien compris.

J’ai pas dit ça ! Je dis juste que si on considère que rien n’a vraiment d’importance à l’échelle de l’univers (comme semble le suggérer DrStef), alors le sujet qui nous occupe n’en a pas non plus :sweat_smile:

Euh non. Sur de l’IA d’illustration, le prompt peut avoir une forme écrite ou imagée.
Sur une IA musicale, c’est principalement du texte.

Mais chaque IA produit un contenu précis et ne peut en dévier (sur le type de contenu produit). Même Copilot, une sorte de chatgpt de microsoft, fait appel à Dall-E 3 lorsqu’il s’agir de créer une image par exemple.

Et il raconte globalement n’importe quoi.

Première erreur majeure de sa part, c’est presque gênant tellement c’est faux. Le mec dit quand même que l’IA ne peut pas trier tes mails et repérer celui important du patron dans les autres. C’est d’une ignorance crasse. Les méthodes de machine learning ont été conçues au départ exactement pour faire ça : trier automatiquement des choses dans des classes prédéfinies. Les modèles génératifs sont plus récents (et beaucoup plus compliqués) et certains sont justement basés sur la capacité des « anciens » modèles à reconnaître des classes (l’apprentissage adversariel des GAN).

Donc complètement idiot puisque basé sur un argument faux.

Punaise que c’est con. C’est presque triste. Le mec est quand supposé être économiste, c’est affligeant. Le fait que les modèles génératifs actuels marchent, c’est justement parce qu’ils sont capables de ne pas se contenter de la moyenne, d’explorer l’espace des données, de s’y promener de façon intelligente (notamment dans les modèles de diffusion).

Toujours aussi con. Le problème de ce genre d’andouilles c’est qu’elles ne prennent pas le temps de s’intéresser au sujet. Il y a des centaines de personnes qui travaillent sur la créativité par AI, des articles entier sur le sujet avec différents points de vue, etc. Et le mec il arrive et il nous fait une Enthoven. Alors qu’il y a des gens sérieux qui bossent le sujet, genre ça pour prendre un exemple parmi d’autres : Humans as Creativity Gatekeepers: Are We Biased Against AI Creativity? | Journal of Business and Psychology

Il y a bien sûr débat (et pour certains, il n’y aucun doute sur le fait que l’IA générative peut être en rupture).

Je suggère à tout le monde de regarder l’excellente vidéo du non moins excellent Monsieur Phi qui démonte l’andouille Enthoven et surtout qui montre bien les mécanismes derrière ces interventions médiatiques (on ne s’intéresse pas au sujet, essentiellement) : https://www.youtube.com/watch?v=dOF9vc5tLJ4

3 « J'aime »

Alors si, cf par exemple How to Detect Data-Copying in Generative Models | UCSD Machine Learning Group

C’est quand même beaucoup plus compliqué que ça. Vu le nombre de paramètres des modèles et certains comportements, c’est un peu rapide d’affirmer que rien n’est copié ou stocké d’une façon compressé dans le réseau. En plus avec les progrès sur les modèles multimodaux, les apprentissages sont croisés entre les différents modes et dans le bousin résultant, on peut très bien avoir un phénomène qui se rapproche d’une mémoire associative (entre un mot clé et une image, grosso modo).

Le problème est à quel moment tes stats permettent de reconstruire les images. Il faut bien voir que jpeg et compagnie, ça fait justement des stats sur les images/son/vidéo qui permettent de reconstruire de façon approximative, mais fidèle, les objets d’origine.

Personne n’est mort :wink:

Sur le sujet juridique, un article pas très innovant mais qui propose un bon résumé est celui-ci : Copyright in generative deep learning | Data & Policy | Cambridge Core

3 « J'aime »

Plus sérieusement, une expérience que j’ai trouvé sympa à faire :

Bon, il n’y a pas que ça, si vous voulez zapper le reste et seulement vous concentrer sur les matchs 2 intros de sujets de philo générés par IA vs 1 d’intro écrite par un prof de philo, c’est autour de 29 min que ça commence.

1 « J'aime »

Oui, c’est la vidéo que je recommande au dessus :slight_smile: Et globalement, je conseille vivement les vidéos de Monsieur Phi sur les LLM, il comprend bien les modèles sous-jacents et donne un super éclairage de son point de vue de philosophe, c’est excellent.

1 « J'aime »

En vrai j’avais préparée ma réponse entre hier soir et ce matin et je répondais à mon image drôle sur le test de Turing, qui à la base n’avait aucune réponse à sa suite…

Et puis j’ai fait autre chose et j’ai validé ce soir en pensant que le sujet n’avait pas bougé, puisque je ne l’avais pas rafraîchit…
Voilà.

Et +1 sur MrPhi (j’aime David Louapre et sa chaîne Science étonnante aussi, entre autres).

1 « J'aime »

Aucun problème, mieux vaut deux citations de M. Phi qu’aucune ! Et tout à fait d’accord sur Science étonnante !

1 « J'aime »

bf40e84996317d9652e1698c777153ada417a8c1_2_668x500

On oublie quand même que les IA font avancer les sciences et notre quotidien puisqu’on sera facilement capable de compter jusqu’à 12 avec nos doigts. :ok_hand: :ok_hand: :ok_hand: :ok_hand: :ok_hand: :ok_hand:

9 « J'aime »

Hello tout le monde.

Je dévie un peu, mais je me dis que vous allez pouvoir m’aider.

J’aimerais prendre la tête d’un pote sur des photos pour en faire des montages style, en roi de France, en personnage de film célèbre, etc.

Étant une énorme quiche en montage photo et en informatique en général, y a t’il une application facile qui pourrait m’aider , d’après vous ? Sachant que j’ai pas précisé, mais je suis pingre, alors si en plus elle est gratuite… :grin:

Je vous remercie par avance pour vos pistes et conseils avisés.

Je ne sais pas si Clipdrop.co Swap fonctionne encore et combien de token gratuit il propose mais peut-être répondra-t-il à ton bonheur ? J’avais collé la tête de mes collègues sur une affiche du SdA pour la déconnade, c’était pas parfait car ça déforme le visage source mais généralement on reconnaissait bien.

1 « J'aime »

Merci.

Je vais commencer par celui là ce soir pour tester alors :+1:

Midjourney avec le cref (ton pote sera redessiné par contre)

1 « J'aime »

Pas grave, je vais tenter. C’est le résultat qui prime plutôt que la technique…