人类和人工智能通常更喜欢sycophantic聊天机器人回答真相 – 研究

特里斯坦·格林（Tristan Greene）5小时前，人类和人工智能通常更喜欢sycophantic聊天机器人对真相的回答 – 研究

Anthropic AI的团队发现，五种“最先进的”语言模型表现出无粘液性，表明该问题可能无处不在。

1246总看法17总股票收听第0:00新闻加入我们的社交网络

根据人类的一项研究，人工智能（AI）大语模型（LLM）建立在最常见的学习范式上的倾向是告诉人们他们想听到的声音，而不是产生包含真相的输出。

在最早深入研究LLM的心理学的研究之一中，人类的研究人员确定，人类和AI都偏爱所谓的Sycophantic反应，至少在某些时候至少在某些时候。

根据团队的研究论文：

“具体来说，我们证明这些AI助手经常在用户质疑时会错误地承认错误，并提供可预测的有偏见的反馈以及用户犯的模仿错误。这些经验发现的一致性表明，粘糊糊的确可能是RLHF模型的训练方式的一种特性。”

从本质上讲，本文表明，即使是最强大的AI模型也有些渴望。在团队的研究期间，他们一次又一次地能够通过用播种的语言措辞提示来巧妙地影响AI输出。

当表现出对误解的反应时，我们发现人类更喜欢不真实的愚蠢的反应，而对真实的反应是当时不可忽略的一部分。我们在偏好模型中发现了类似的行为，这些模型可以预测人类的判断，并用于培训AI助手。pic.twitter.com/fdfhidmvlh

– 拟人化（@anthropicai）2023年10月23日在上述示例中取自X上的帖子（以前为Twitter），一个领先的提示表明用户（错误地）认为，从太空中查看时，太阳是黄色的。也许由于提示的措辞方式，AI在似乎是一个明显的粘糊糊案例中幻觉了一个不真实的答案。

本图中所示的论文的另一个示例表明，由于模型将正确的答案更改为不正确的，并且以最小的提示将其正确的答案更改为不正确的，因此与AI输出的用户不同意。

sicophantic答案的例子是对人类反馈的响应。资料来源：Sharma等。Al。，2023。

最终，人类团队得出结论，问题可能是由于LLM的培训方式。因为他们使用的数据集充满了准确性的信息（例如，社交媒体和互联网论坛帖子），通常是通过一种称为“从人类反馈中学习的强化学习”（RLHF）的技术。

在RLHF范式中，人类与模型相互作用，以调整其偏好。例如，当拨打机器如何响应提示的提示时，这很有用，这些提示可能会征集潜在的有害输出，例如个人身份信息或危险的错误信息。

不幸的是，正如Anthropic的研究从经验上表明的那样，为了调整用户偏好的目的而构建的人类和AI模型都倾向于偏爱sycophantic答案，而不是真实的答案，至少是“不可忽略的”时间。

目前，似乎没有解决此问题的解毒剂。拟人化表明，这项工作应该激发“培训方法的发展不仅仅是使用独立的，非专家的人类评级。”

最新资讯：

分类帐硬件钱包推出基于云的私钥恢复工具 Helen Partz 9小时前Ledger Hardware Wallet推出基于云的私钥恢复工具Ledger强调，其私钥恢复工具所需的ID检查不像KYC检查 ...
方舟投资卸载Coinbase，GBTC，购买了Robinhood Stocks Cathie Woods ARK投资卸载Coinbase和Grayscale Bitcoin Trust，在Crypto Surgesource中购买Robinhood Stocks：ARK Invest / Instagramcathie Wood-Leed Ark Invests Invest Invest Invest ofloaded ofloaded ofloads ink ofloads int ofloads ink ink ink ofloads。 ...
香港监管机构为更广泛的零售虚拟资产投资提供绿灯，并提供适用的保障措施香港监管机构为更广泛的零售虚拟资产投资提供了绿灯，并提供了适用的保障措施：Pexelshong Kong的金融监管机构证券和期货委员会（SF） ...
亲比特币哈维尔·米利（Javier Milei）踪迹作为阿根廷总统大选杰西·科格兰（Jesse Coghlan）6分钟前，亲比特币哈维尔·米利（Javier Milei）小径，阿根廷的总统大选是在阿根廷总统中吹捧的反建立贾维尔·米利（Javier Milei）的最爱 ...
联邦调查局，肯德尔·詹纳（Kendall Jenner）的证词和揭示的Twitter消息：回顾SBF试验的第二周联邦调查局，肯德尔·詹纳（Kendall Jenner）的证词和透露twitter消息：回顾SBF试用的第三周，萨姆·班克曼（Sam Bankman）的历史性欺诈审判的动感十足的第三周结束了 ...
Binance Academy和区块链中心，以扩大世界最大的加密教育计划 Binance Academy和区块链中心扩展世界上最大的加密教育计划Disclaimer：行业谈话部分具有加密行业参与者的见解，不是编辑的一部分 ...
新加坡奖授予Sygnum银行子公司的主要支付机构许可证 Arijit Sarkar 6分钟前，新加坡颁奖典礼颁发了Sygnum Bank子公司Sygnum Singapore的主要支付机构许可证计划将其受监管的产品扩展到亚洲 - 太平洋（Apac）市场，SUC ...
国际货币基金组织的工作论文提出了国家级评估矩阵的加密风险 Ezra Reguerra 10分钟前，IMF工作文件提出了国家级评估矩阵的加密风险矩阵旨在确定与加密空间和政策相关的潜在风险 ...
比特币的价格突破了27,000美元，飙升了3％ – 3个原因，我们可能看涨10月比特币价格飙升3％-3的原因27,000美元 - 3个原因，我们可能拥有Octobersource / wir_pixsbitcoin（BTC）在恢复20DMA支持后反弹 +3.96％，并且价格a ...
Coinbase的明智加密政策运动击中咖啡罐，以“唤醒”监管机构埃兹拉·雷吉拉（Ezra Reguerra）10小时前的Coinbase运动明智的加密政策击中咖啡罐，以“唤醒”监管机构Coinbase和一群加密企业家去华盛顿特区说服 ...
警方在JPEX案中逮捕了12次逮捕，没收100万美元现金和980万美元的资产警察在JPEXCASECECE中逮捕了12次逮捕，扣押了100万美元的现金和980万美元的资产：PIXABAYON星期二，香港警方宣布逮捕与JPEX CRYP有关的12名嫌疑人 ...
比特币价格稳定，标准普尔500点跌至110天低点马塞尔·佩奇曼（Marcel Pechman）4小时前比特币价格稳定，因为标准普尔500标准普尔（S＆P 500）跌至110天低点，标准普尔500标准普尔（S＆P）跌至110天的低点，因为市场消化了“更高的更高的更高”对股票的意义。会b ...
SDX欢迎第六交换 SDX欢迎第六交易所到折叠式资料来源：Pixabayhypothekarbank Lenzburg是一家著名的地区瑞士银行，资产超过70亿美元，已加入TheSix Digital Exchange（SDX），开始 ...
阿根廷石油公司开始用汽油动力剩饭开采加密货币大卫·阿特利（David Attlee）1分钟前，阿根廷石油公司开始使用剩余的气体剩饭来开采加密货币，tecpetrol希望通过避免气体排放来减少环境的影响，并产生一些Additio ...
SEC反对Celsius计划使用Coinbase作为国际客户的分销代理 SEC反对Celsius计划使用Coinbase作为国际客户的分销代理：Adobe/Canvaon 9月25日，星期一，美国证券交易委员会（SEC）反对 ...
比特币价格有风险？美元索引确认看涨“金十字” 马塞尔·佩奇曼（Marcel Pechman）5分钟前的比特币价格处于风险之中？美元索引证实了对美元对美元对比特币的影响的看涨“金十字”的担忧，可能被投资者夸大了，尤其是在 ...
香港揭示JPEX丑闻后的加密许可证申请人名单香港揭示JPEX Scandalsource之后的加密许可证申请人名单：Pixabay / Andy Leunghong Kong的财务监管机构周一确认，它将发布Cry的清单 ...
随着空调截止日期的结束，仲裁道需要5600万美元无人认领的ARB Helen Partz 8分钟前DOINTUM DAO占用了5600万美元的无人认领的ARB，因为AirDrop截止日期结束了无人认领的索引（ARB）代币的数量，占ARB总供应量的0.69％。28 ...
如何在趋势黑猩猩预售中获得多达4倍的奖金硬币？如何在趋势黑猩猩预售中最多收到4倍奖金硬币？ ...
借贷承诺，系绳违背：尽管较早承诺，但仍借入55亿美元 Tether Renege on Lo借贷承诺：尽管较早的承诺资料来源：Adobestock / Piter2121 Tether，这是受欢迎的USDT StableCoin背后的公司，但仍在借出55亿美元的Stablecoin，这是借贷。 ...

原创文章，作者：小彭山，如若转载，请注明出处：https://www.53moban.com/11715.html

人类和人工智能通常更喜欢sycophantic聊天机器人回答真相 – 研究

联系我们

400-800-8888

人类和人工智能通常更喜欢sycophantic聊天机器人回答真相 – 研究

最新资讯：

相关推荐

联系我们

400-800-8888