L'évaluation de la fiabilité des modèles GPT révèle des vulnérabilités potentielles et des risques pour la vie privée.

2025-07-13 06:51:33

Création du résumé en cours

Étude sur l'évaluation de la fiabilité des modèles de langage

L'Université de l'Illinois à Urbana-Champaign a lancé une plateforme d'évaluation de la crédibilité des modèles linguistiques à grande échelle (LLMs) en collaboration avec plusieurs universités et instituts de recherche, présentée dans le dernier article "DecodingTrust : évaluation complète de la crédibilité des modèles GPT."

L'équipe de recherche a effectué une évaluation complète de la fiabilité du modèle GPT et a découvert certaines vulnérabilités qui n'avaient pas été auparavant publiées. Par exemple, le modèle GPT est susceptible de produire des sorties toxiques et biaisées, et pourrait divulguer des informations personnelles provenant des données d'entraînement et de l'historique des conversations. Bien que dans les tests standards, GPT-4 soit généralement plus fiable que GPT-3.5, face à des invitations conçues de manière malveillante, GPT-4 est en réalité plus vulnérable aux attaques, probablement parce qu'il suit plus strictement des instructions trompeuses.

L'étude a évalué de manière exhaustive le modèle GPT sous huit angles de crédibilité, y compris la robustesse face aux attaques adversariales sur le texte, l'adaptabilité aux instructions et aux invites système pour différentes tâches, etc. L'évaluation a utilisé divers scénarios, tâches, indicateurs et ensembles de données.

Les résultats montrent que le modèle GPT excelle dans certains domaines, comme le fait de ne pas être trompé par des exemples contrefactuels. Cependant, il existe également des problèmes, comme la susceptibilité à des invites système trompeuses qui peuvent entraîner la création de contenus biaisés, en particulier le GPT-4 qui est plus facilement influencé. Le degré de biais du modèle dépend également du sujet spécifique, avec moins de biais sur certains sujets sensibles.

En ce qui concerne la protection de la vie privée, des recherches ont révélé que le modèle GPT pourrait divulguer des informations sensibles contenues dans les données d'entraînement, telles que les adresses e-mail. GPT-4 est plus robuste que GPT-3.5 en matière de protection des informations d'identification personnelle, mais dans certaines situations, il peut néanmoins divulguer des données privées.

Cette étude fournit une base de référence complète pour évaluer la fiabilité des modèles linguistiques, contribuant à identifier les vulnérabilités potentielles et à favoriser le développement de modèles plus fiables. L'équipe de recherche espère que ce travail encouragera le milieu académique à poursuivre des recherches approfondies sur cette base, et à collaborer pour créer des modèles linguistiques plus puissants et plus fiables.

GPT-2.76%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

20 J'aime

Récompense
20
9
Partager

Commentaire

0/400

StakeTillRetire

· 07-16 06:40

gpt va-t-il disparaître ?

Voir l'originalRépondre0

AirdropHuntress

· 07-13 17:21

Eh, en regardant les données, il y a en effet de nombreux risques de confidentialité exposés.

Voir l'originalRépondre0

MevShadowranger

· 07-13 14:31

La vérité, c'est que si ça ne peut pas courir, ça ne peut pas courir.

Voir l'originalRépondre0

SerLiquidated

· 07-13 07:21

Pas vrai, cela a-t-il quelque chose à voir avec la sécurité nationale ?

Voir l'originalRépondre0

DarkPoolWatcher

· 07-13 07:20

Il y a trop de failles, tout peut être piégé.

Voir l'originalRépondre0

MEV_Whisperer

· 07-13 07:15

Eh, le modèle doit encore être mis à niveau.

Voir l'originalRépondre0

HappyToBeDumped

· 07-13 07:07

Il faut encore mettre à jour le modèle.

Voir l'originalRépondre0

CounterIndicator

· 07-13 07:04

Ce gpt n'est vraiment pas à la hauteur, c'est de l'intelligence artificielle après tout, d'abord recharge.

Voir l'originalRépondre0

MetaverseHermit

· 07-13 06:58

Aucune vie privée est la meilleure vie privée

Voir l'originalRépondre0

Afficher plus

Rubrique
1/3
1BTC & ETH Launchpool Yield Exceeds 3%
24k Popularité
2White House Crypto Report
8k Popularité
3Growth Points Draw Round 12 Opens
4k Popularité
4Fed Holds Rates Decision
6k Popularité
5Alpha Points System Opens
15k Popularité

Épingler