Comment la Chine construit un univers parallèle d’IA générative • TechCrunch

Le gigantesque technologique Le saut que les modèles d’apprentissage automatique ont montré au cours des derniers mois rend tout le monde enthousiasmé par l’avenir de l’IA, mais aussi nerveux par ses conséquences inconfortables. Après que les outils de synthèse texte-image de Stability AI et OpenAI soient devenus le sujet de conversation de la ville, la capacité de ChatGPT à tenir des conversations intelligentes est la nouvelle obsession dans tous les secteurs.

En Chine, où la communauté technologique a toujours suivi de près les progrès en Occident, les entrepreneurs, les chercheurs et les investisseurs cherchent des moyens de faire leur entrée dans l’espace de l’IA générative. Les entreprises technologiques conçoivent des outils basés sur des modèles open source pour attirer les consommateurs et les entreprises. Les individus profitent du contenu généré par l’IA. Les régulateurs ont réagi rapidement pour définir comment la synthèse de texte, d’image et de vidéo doit être utilisée. Pendant ce temps, les sanctions technologiques américaines suscitent des inquiétudes quant à la capacité de la Chine à suivre les progrès de l’IA.

Alors que l’IA générative prend d’assaut le monde vers la fin de 2022, examinons comment cette technologie explosive secoue la Chine.

Saveurs chinoises

Grâce aux plateformes de création d’art viral comme Stable Diffusion et DALL-E 2, l’IA générative est soudainement sur toutes les lèvres. À l’autre bout du monde, les géants chinois de la technologie ont également captivé le public avec leurs produits équivalents, ajoutant une touche en fonction des goûts et du climat politique du pays.

Baidu, qui s’est fait un nom dans les moteurs de recherche et a intensifié ces dernières années son jeu dans la conduite autonome, exploite ERNIE-ViLG, un modèle de 10 milliards de paramètres formé sur un ensemble de données de 145 millions de paires image-texte chinoises. Comment se comporte-t-il face à son homologue américain ? Vous trouverez ci-dessous les résultats de l’invite “enfants mangeant du shumai dans le quartier chinois de New York” donnée à Stable Diffusion, par rapport à la même invite en chinois (纽约唐人街小孩吃烧卖) pour ERNIE-ViLG.

Diffusion stable

ERNIE-ViLG

En tant que personne qui a grandi en mangeant des dim sum en Chine et dans les quartiers chinois, je dirais que les résultats sont à égalité. Ni l’un ni l’autre n’ont obtenu le bon shumai, qui, dans le contexte des dim sum, est un type de boulette succulente, de crevettes et de porc dans un emballage jaune à moitié ouvert. Alors que Stable Diffusion cloue l’atmosphère d’un restaurant dim sum de Chinatown, son shumai est éteint (mais je vois où la machine va). Et même si ERNIE-ViLG génère une type de shumai, c’est une variété plus communément vue dans l’est de la Chine que la version cantonaise.

Le test rapide reflète la difficulté de capturer les nuances culturelles lorsque les ensembles de données utilisés sont intrinsèquement biaisés – en supposant que Stable Diffusion aurait plus de données sur la diaspora chinoise et ERNIE-ViLG est probablement formé sur une plus grande variété d’images shumai qui sont plus rares en dehors de la Chine.

Un autre outil chinois qui a fait du bruit est Different Dimension Me de Tencent, qui peut transformer des photos de personnes en personnages d’anime. Le générateur d’IA présente son propre parti pris. Destiné aux utilisateurs chinois, il a décollé de manière inattendue dans d’autres régions aimant l’anime comme l’Amérique du Sud. Mais les utilisateurs ont rapidement réalisé que la plate-forme n’avait pas réussi à identifier les individus noirs et de grande taille, des groupes qui manquent sensiblement dans les anime japonais, ce qui a conduit à des résultats offensants générés par l’IA.

Outre ERNIE-ViLG, un autre modèle chinois de synthèse texte-image à grande échelle est Taiyi, une idée originale d’IDEA, un laboratoire de recherche dirigé par le célèbre informaticien Harry Shum, qui a cofondé la plus grande branche de recherche de Microsoft en dehors des États-Unis, Microsoft Research Asie. Le modèle d’IA open source est formé sur 20 millions de paires image-texte chinoises filtrées et compte un milliard de paramètres.

Contrairement à Baidu et à d’autres entreprises technologiques à but lucratif, IDEA est l’une des rares institutions soutenues par les gouvernements locaux ces dernières années pour travailler sur des technologies de pointe. Cela signifie que le centre jouit probablement d’une plus grande liberté de recherche sans la pression de conduire le succès commercial. Basée dans le centre technologique de Shenzhen et soutenue par l’une des villes les plus riches de Chine, c’est une entreprise montante qui mérite d’être surveillée.

Règles de l’IA

Les outils d’IA générative de la Chine ne se caractérisent pas seulement par les données nationales dont ils tirent des enseignements ; elles sont également façonnées par les lois locales. Comme l’a souligné MIT Technology Review, le modèle texte-image de Baidu filtre les mots-clés politiquement sensibles. C’est normal, étant donné que la censure est depuis longtemps une pratique universelle sur Internet chinois.

Ce qui est plus important pour l’avenir de ce domaine naissant, c’est le nouvel ensemble de mesures réglementaires ciblant ce que le gouvernement appelle la “technologie de synthèse profonde”, qui désigne “une technologie qui utilise l’apprentissage en profondeur, la réalité virtuelle et d’autres algorithmes de synthèse pour générer du texte, des images, scènes audio, vidéo et virtuelles. “Comme pour d’autres types de services Internet en Chine, des jeux aux médias sociaux, les utilisateurs sont invités à vérifier leur nom avant d’utiliser des applications d’IA génératives. Le fait que les invites puissent être retracées jusqu’à sa véritable identité a inévitablement un impact restrictif sur le comportement de l’utilisateur.

Mais du côté positif, ces règles pourraient conduire à une utilisation plus responsable de l’IA générative, qui est déjà utilisée à mauvais escient ailleurs pour produire du contenu NSFW et sexiste. La réglementation chinoise, par exemple, interdit explicitement aux gens de générer et de diffuser de fausses nouvelles créées par l’IA. Cependant, la manière dont cela sera mis en œuvre incombe aux fournisseurs de services.

“Il est intéressant que la Chine soit à l’avant-garde des tentatives de réglementation [generative AI] en tant que pays », a déclaré Yoav Shoham, fondateur d’AI21 Labs, un rival d’OpenAI basé en Israël, dans une interview. « Il existe diverses entreprises qui imposent des limites à l’IA… Tous les pays que je connais s’efforcent de réglementer l’IA ou de s’assurer que le système juridique ou le système social suit le rythme de la technologie, en particulier pour réglementer la génération automatique. de contenu.

Mais il n’y a pas encore de consensus sur la manière dont ce domaine en évolution rapide devrait être régi. “Je pense que c’est un domaine que nous apprenons tous ensemble”, a admis Shoham. « Cela doit être un effort de collaboration. Il doit impliquer des technologues qui comprennent réellement la technologie et ce qu’elle fait et ce qu’elle ne fait pas, le secteur public, les spécialistes des sciences sociales et les personnes qui sont touchées par la technologie ainsi que le gouvernement, y compris le type de relations commerciales et juridiques aspect du règlement. »

Monétiser l’IA

Alors que les artistes craignent d’être remplacés par une IA puissante, beaucoup en Chine tirent parti des algorithmes d’apprentissage automatique pour gagner de l’argent de multiples façons. Ils ne font pas partie de la foule la plus férue de technologie. Ce sont plutôt des opportunistes ou des mères au foyer à la recherche d’une source de revenus supplémentaire. Ils se rendent compte qu’en améliorant leurs invites, ils peuvent inciter l’IA à créer des emojis créatifs ou de superbes fonds d’écran, qu’ils peuvent publier sur les réseaux sociaux pour générer des revenus publicitaires ou facturer directement les téléchargements. Les personnes vraiment qualifiées vendent également leurs invites à d’autres personnes qui souhaitent se joindre au jeu de l’argent – ou même les former moyennant des frais.

D’autres en Chine utilisent l’IA dans leurs emplois formels comme le reste du monde. Les écrivains de fiction légère, par exemple, peuvent créer à moindre coût des illustrations pour leurs œuvres, un genre plus court que les romans et comportant souvent des illustrations. Un cas d’utilisation intrigant qui peut potentiellement perturber les domaines de la fabrication consiste à utiliser l’IA pour concevoir des T-shirts, des clous à pression et des imprimés pour d’autres biens de consommation. En générant rapidement de grands lots de prototypes, les fabricants économisent sur les coûts de conception et raccourcissent leur cycle de production.

Il est trop tôt pour savoir à quel point l’IA générative se développe différemment en Chine et en Occident. Mais les entrepreneurs ont pris des décisions basées sur leur première observation. Quelques fondateurs m’ont dit que les entreprises et les professionnels sont généralement heureux de payer pour l’IA car ils voient un retour sur investissement direct, de sorte que les startups sont impatientes de se tailler des cas d’utilisation dans l’industrie. Une application intelligente est venue de Surreal, soutenu par Sequoia China (rebaptisé plus tard Movio) et de ZMO.ai, soutenu par Hillhouse, qui a découvert pendant la pandémie que les vendeurs de commerce électronique avaient du mal à trouver des modèles étrangers alors que la Chine gardait ses frontières fermées. La solution? Les deux sociétés ont travaillé sur des algorithmes qui ont généré des mannequins de toutes formes, couleurs et races.

Mais certains entrepreneurs ne croient pas que leur SaaS alimenté par l’IA connaîtra le type de valorisation en flèche et de croissance fulgurante dont bénéficient leurs homologues occidentaux, comme Jasper et Stability AI. Au fil des ans, de nombreuses startups chinoises m’ont dit qu’elles avaient la même préoccupation : les entreprises clientes chinoises sont généralement moins disposées à payer pour le SaaS que celles des économies développées, c’est pourquoi nombre d’entre elles commencent à se développer à l’étranger.

La concurrence dans l’espace SaaS en Chine est également un chien-manger-chien. « Aux États-Unis, vous pouvez faire assez bien en créant des logiciels axés sur les produits, qui ne reposent pas sur des services humains pour acquérir ou conserver des utilisateurs. Mais en Chine, même si vous avez un excellent produit, votre rival pourrait voler votre code source du jour au lendemain et embaucher des dizaines de personnel de support client, qui ne coûte pas si cher, pour vous dépasser », a déclaré un fondateur d’une startup chinoise d’IA générative. , demandant l’anonymat.

Shi Yi, fondateur et PDG de la start-up d’intelligence commerciale FlashCloud, a convenu que les entreprises chinoises privilégient souvent les rendements à court terme par rapport à l’innovation à long terme. “En ce qui concerne le développement des talents, les entreprises technologiques chinoises ont tendance à se concentrer davantage sur la maîtrise des applications et la génération d’argent rapide”, a-t-il déclaré. Un investisseur basé à Shanghai, qui a refusé d’être nommé, s’est dit “un peu déçu que des percées majeures dans l’IA générative se produisent cette année en dehors de la Chine”.

Barrages routiers à venir

Même lorsque les entreprises technologiques chinoises souhaitent investir dans la formation de grands réseaux de neurones, elles peuvent ne pas disposer des meilleurs outils. En septembre, le gouvernement américain a giflé la Chine avec des contrôles à l’exportation sur les puces IA haut de gamme. Alors que de nombreuses startups chinoises d’IA se concentrent sur le front des applications et n’ont pas besoin de semi-conducteurs hautes performances qui gèrent des océans de données, pour ceux qui font de la recherche fondamentale, l’utilisation de puces moins puissantes signifie que l’informatique prendra plus de temps et coûtera plus cher, a déclaré un investisseur en logiciels d’entreprise. dans une grande société chinoise de capital-risque, demandant l’anonymat. La bonne nouvelle est, a-t-il soutenu, que de telles sanctions poussent la Chine à investir dans les technologies de pointe à long terme.

En tant qu’entreprise qui se présente comme un leader dans le domaine de l’IA en Chine, Baidu estime que l’impact de la sanction américaine des puces sur son activité d’IA est “limité” à court et à long terme, a déclaré le vice-président exécutif de l’entreprise et responsable du groupe AI Cloud. , Dou Shen, lors de son appel sur les résultats du troisième trimestre. En effet, “une grande partie” de l’activité cloud d’IA de Baidu “ne repose pas trop sur les puces très avancées”. Et dans les cas où il a besoin de puces haut de gamme, il a “déjà suffisamment stocké, en fait, pour soutenir notre activité à court terme”.

Qu’en est-il du futur? “Quand nous l’examinons à moyen et à long terme, nous avons en fait notre propre puce d’IA développée, ainsi nommée Kunlun”, a déclaré l’exécutif avec confiance. “En utilisant nos puces Kunlun [Inaudible] dans les grands modèles de langage, l’efficacité des tâches de reconnaissance de texte et d’image sur notre plate-forme d’IA a été améliorée de 40 % et le coût total a été réduit de 20 à 30 %.”

Le temps nous dira si Kunlun et d’autres puces d’IA indigènes donneront à la Chine un avantage dans la course à l’IA générative.

Laisser un commentaire