研究人员发现，即使被“删除”之后，诸如ChatGpt输出敏感数据之类

Tristan Greene 6小时前研究人员发现了LLM，例如CHATGPT输出敏感数据，即使已被“删除”

根据科学家的说法，没有普遍的方法可以从预算的大语言模型中删除数据。

2797总看法12总股票收听第0:00新闻加入我们的社交网络

教堂山（Chapel Hill）来自北卡罗来纳大学的三名科学家最近出版了预印刷人工智能（AI）研究，展示了从大语言模型（LLM）（例如OpenAI的Chatgpt和Google的Bard）中删除敏感数据的困难。

根据研究人员的论文，可以从LLMS“删除”信息的任务是可能的，但是验证信息已被删除与实际删除一样困难。

这样做的原因与LLM的设计和培训有关。这些模型在数据库上进行了预估计，然后进行微调以生成相干输出（GPT代表“生成预验证的变压器”）。

一旦训练了模型，其创建者就无法返回数据库并删除特定文件，以禁止该模型输出相关的结果。从本质上讲，在其权重和参数内的某个地方训练了模型的所有信息，而它们是无法定义的，而无需实际生成输出。这是AI的“黑匣子”。

当在大规模数据集中培训的LLMS输出敏感信息，例如个人身份信息，财务记录或其他潜在有害和不必要的输出时，就会出现问题。

相关：微软组成核电团队以支持AI：报告

例如，在一个假设的情况下，LLM接受了敏感的银行信息培训，例如，AI的创建者通常无法找到这些文件并删除它们。取而代之的是，AI开发人员使用护栏，例如硬编码的提示，这些提示会抑制特定行为或从人类反馈中学习的强化。当模型的输出是理想的时，他们会收到将模型调整为该行为的反馈。当产出表现出不必要的行为时，他们会收到旨在限制未来产出中这种行为的反馈。

尽管从模型的权重中被“删除”，但“西班牙”一词仍然可以使用改写的提示来构想。图像来源：Patil等。Al。，2023

但是，正如UNC研究人员指出的那样，这种方法依赖于人类发现模型可能显示出的所有缺陷，即使成功，它仍然不会从模型中“删除”信息。

根据团队的研究论文：

“ RLHF可能更深的缺点是模型仍然可能知道敏感信息。尽管关于哪种模型真正“知道”有很多争论，但对于一个模型来说，能够描述如何制作生物武器，而只是避免回答有关如何做到这一点的问题的问题。”

最终，UNC研究人员得出结论，即使是最先进的模型编辑方法，例如排名式模型编辑“未能从LLM中完全删除事实信息，因为WhiteBox攻击仍然可以将事实提取38％的时间，29％的时间是黑盒攻击。”

团队用来进行研究的模型称为GPT-J。虽然GPT-3.5是Power ChatGpt的基本模型之一，并以1700亿个参数进行了微调，而GPT-J只有60亿个。在较小的型号中，3.5比这样做更困难。

研究人员能够开发新的防御方法来保护LLM免受某些“提取攻击”的影响 – 不良演员的有目的尝试使用促使模型的护栏来绕过模型的护栏，以使其使其输出敏感信息

但是，正如研究人员所写的那样，“删除敏感信息的问题可能是辩护方法总是在追赶新的攻击方法的问题。”

最新资讯：

司法部的青春期目击者在Bankman Fried审判中，FTX资产的聚光灯 Amaka Nwaokocha 13分钟前，司法部的批评目击者在Bankman Fried审判中，FTX资产的聚光灯这一计划还包括他们对Sam Bankman-Fried的言论和行为的理解， ...
比特币的通货膨胀围场理论测试，因为利率上升为市场带来了动荡马塞尔·佩奇曼（Marcel Pechman）3小时前，比特币的通货膨胀围栏理论测试了利率上升，使市场的动荡使美国国债的损失最近超过1.5万亿美元，并且可能 ...
比特币价格预测：一系列基本事件后，BTC上升了2.50％比特币价格预测：在世界上最大的加密货币（BTC）之后，BTC上升了2.50％ ...
比特币减半以将“高效” BTC采矿成本提高到3万美元威廉·苏伯格（William Suberg）6分钟前比特币减半，以将“高效” BTC采矿成本提高到3万美元的比特币矿工可能会看到BTC价格行动的“严重”经济后果，在TH之后，BTC价格行动的持续下降至30,000美元以下 ...
分析师说，比特币的价格达到10月的$ 30K，BTC价格攀升2％分析师说，威廉·苏伯格（William Suberg）11小时前的比特币价格达到了10万美元，因为BTC价格攀升2％BTC价格强度在华尔街交易之前的收益率为27,000美元，比特币公牛队的十字准线。 ...
15个最佳赌场不在gamstop UK 2023上 15最佳赌场不在Gamstop 2023上 - 比较可靠的非Gamstop Casino网站可以是一项很好的服务，但它也限制了限制赌场游戏类型UK玩家可以E的限制 ...
波纹价格预测：XRP攀升1％ – 这是一个新的集会开始吗？波纹价格预测：XRP攀升1％ - 这是一个新的集会开始吗？来源：TradingView The XRP价格已恢复到今天的最重要$ 0.50的高度，其上涨到0.501776美元 ...
这种交易所持有有史以来所有比特币的5％该交易所占Madesource的所有比特币的5％：Adobe / prima91coinbaseholds在其钱包中近100万币（BTC），约占现有BTC Supply的总数的5％。 ...
Rollbit会零吗？随着新电报赌场项目的病毒 – 100倍的潜力，RLB价格下跌40％？ Rollbit会零吗？随着新电报赌场项目的流行风险 - 潜在的100倍？AlphatradeZone / pexelsafter的图像连续三个月，Rollbit Coin（Rollbit Coin）损失40％。 ...
Nic Carter对理论比特币的兼容是由NSA发明的 Martin Young 3分钟前，Nic Carter在理论上的比特币是NSA发明了数十年的“ NSA创建的比特币”理论，再次在社交媒体上进行了巡回演出。 ...
比特币价格预测，因为熊将BTC推迟低于27,000美元的支持 – 倾销机会？比特币的价格预测随着熊的推动BTC低于$ 27,000的支持 - 倾销机会？随着比特币的波动运动的继续，最近的市场活动已经看到了开拓性的加密货币TUM ...
FCA报告重点介绍了银行与加密公司之间的谈判 FCA报告重点介绍了银行与加密公司之间的谈判，但由于Debanking Worriessource：Adobestock / Marythe UK的金融行为管理局（FCA）发起了银行与加密货币之间的会谈 ...
PayPal向Venmo用户推出Pyusd Stablecoin 特纳·赖特（Turner Wright）5小时前PayPal向Venmo用户推出Pyusd Stablecoin付款平台表示，PayPal USD将在宣布其在Venmo上发布后“在未来几周内完全推出” ...
META驳斥了AI培训中版权侵权的主张 33秒前，萨凡纳·富斯（Savannah Fortis）在针对莎拉·西尔弗曼（Sarah Silverman）的诉讼中驳斥了侵犯版权的主张 ...
在具有里程碑意义的裁决中驳回了defi的统一集体诉讼 Tingey伤害律师事务所在地标裁定Defiphoto的UNISWAP集体诉讼对UnisWap的UnisWap诉讼（一项领先的分散交易协议）今天轮到了今天的诉讼。 ...
Polygon联合创始人：$ 1B赌注ZK-Rollups还清 Gareth Jenkinson 9月13日，2023年Polygon联合创始人：$ 1B在ZK-Rollups上还清Polygon的ZK-Rollups估计分配了零知识技术的10亿美元 ...
NVIDIA AI合作伙伴Databricks筹集了5亿美元，以实现$ 43B的估值 Tristan Greene 9月15日，2023年NVIDIA AI合作伙伴Databricks筹集了5亿美元，以实现$ 43B的估值资本One也加入了投资回合，尽管是Rival Cloud Platform SN的最高客户 ...
为什么今天的加密货币市场上升？ Yashu Gola 2023年9月14日，为什么今天的加密货币市场？加密货币市场在过去的24小时内上升，这是对美联储肮脏的期望并放松对FTX的期望。106580总浏览量 ...
3个关键的以太价格指标表明ETH正在为波动率做好准备 Marcel Pechman 9月15日，2023年3关键的以太价格指标表明，ETH正在为波动性网络，期货和用户数据提供准备，这均指向以太段可能绘制新课程。13940 ...
加拿大投资者如何从美股的新牛市中获利？加拿大股票市场提供了大量优秀的上市公司，但加拿大投资者应该知道，金融和能源股票在多伦多证券交易所所占的权重很大。这就意味着，如果投资组合中只有加拿大股票，就很难实现建立一个多元化的投资组合的目标。好在...

原创文章，作者：新鲜事，如若转载，请注明出处：https://www.53moban.com/9470.html

研究人员发现，即使被“删除”之后，诸如ChatGpt输出敏感数据之类

联系我们

400-800-8888

研究人员发现，即使被“删除”之后，诸如ChatGpt输出敏感数据之类

最新资讯：

相关推荐

联系我们

400-800-8888