什么是“模型崩溃”?专家解释有关即将到来的AI灾难的传言

ABC News8月25日报道,人工智能(AI)的预言家和新闻传播者正在预测生成式AI热潮的终结,并谈论即将发生的灾难性“模型崩溃”。



但这些预测有多现实呢?什么是“模型崩溃”?“模型崩溃”这个概念在2023年被讨论,但最近才广泛流行起来。它指的是一种假设场景,即由于互联网上AI生成数据的增加,未来的AI系统会逐渐变得更笨。


数据的需求  

现代AI系统是通过机器学习构建的。程序员搭建了底层的数学结构,但真正的“智能”来自于训练系统模仿数据中的模式。然而,并不是任何数据都行。当前一代的生成式AI系统需要高质量的数据,而且需要大量的数据。


为了获取这些数据,像OpenAI、谷歌、Meta和英伟达这样的科技巨头不断在互联网上搜寻,收集海量内容来供机器学习使用。但自2022年起,随着广泛可用且有用的生成式AI系统的出现,人们越来越多地上传和分享部分或全部由AI生成的内容。在2023年,研究人员开始思考是否可以仅依赖AI生成的数据进行训练,而不使用人类生成的数据。


实现这一目标有巨大的激励。除了在互联网上广泛传播之外,AI生成的内容比人类数据更便宜,也不涉及大规模收集时的伦理和法律问题。然而,研究人员发现,如果没有高质量的人类数据,依赖AI生成数据进行训练的AI系统会变得越来越笨,因为每个模型都在学习前一个模型的结果。这就像数字版本的近亲繁殖问题。


这种“反刍训练”似乎导致模型行为的质量和多样性下降。这里的“质量”大致指的是帮助性、无害性和诚实性的组合。而“多样性”则指的是响应的变化,以及AI输出中所代表的不同文化和社会视角。简而言之,通过过度使用AI系统,我们可能正在污染那些原本使这些系统有用的数据源。


避免崩溃

难道科技巨头不能过滤掉AI生成的内容吗?其实很难。科技公司已经在花费大量时间和金钱清理和过滤它们收集的数据。一位行业内部人士最近透露,他们有时会丢弃多达90%最初收集的数据,用于训练模型。随着专门移除AI生成内容的需求增加,这些努力可能会变得更加艰巨。但更重要的是,从长远来看,区分AI生成的内容将变得越来越困难,这将使过滤和删除合成数据的努力变得收益递减(经济上的)。最终,目前的研究表明我们无法完全舍弃人类数据。毕竟,AI中的“I”(智能)正是来自这些数据。


我们是否正在走向灾难?

有迹象表明开发者已经不得不更加努力地获取高质量的数据。例如,GPT-4发布时附带的文档中,提到参与数据相关部分的工作人员数量前所未有。我们可能也即将耗尽新的人工数据。有些估计认为,到2026年,人类生成的文本数据池可能会被耗尽。


这可能是为什么OpenAI和其他公司正在加紧与Shutterstock、联合通讯社和新闻集团等行业巨头建立独家合作关系的原因。这些公司拥有的大量专有的人类数据并未公开在互联网上。然而,灾难性的模型崩溃可能被夸大了。到目前为止,大多数研究都集中在合成数据取代人类数据的案例上。而在实际操作中,人类数据和AI数据可能会同时积累,这降低了崩溃的可能性。


最可能的未来场景还包括一个由多样化的生成式AI平台组成的生态系统,这些平台用于创建和发布内容,而不是一个单一的庞大模型。这也增加了对崩溃的抵抗力。这也是为什么监管机构应该通过限制AI行业的垄断来促进健康竞争,并资助公共利益技术开发。


真实的担忧

还有一些更微妙的风险来自过多的AI生成内容。合成内容的泛滥可能不会对AI发展的进程构成生存威胁,但它确实威胁到(人类)互联网的数字公共利益。例如,研究人员发现,在ChatGPT发布一年后,编程网站StackOverflow上的活跃度下降了16%。这表明AI辅助可能已经在某些在线社区中减少了人与人之间的互动。


由AI驱动的内容农场的过度生产也使得寻找不带广告点击诱饵的内容变得更加困难。区分人类生成的内容和AI生成的内容变得越来越不可能。有一种方法可以解决这个问题,即对AI生成的内容进行水印或标记,正如我和许多人最近强调的那样,这也反映在最近澳大利亚政府的临时立法中。


还有另一个风险。随着AI生成内容逐渐同质化,我们可能会失去社会文化多样性,某些群体甚至可能面临文化抹杀的危险。我们迫切需要跨学科的研究来应对AI系统带来的社会和文化挑战。人类互动和人类数据是重要的,我们应该加以保护。为了我们自己,也可能是为了防止未来可能发生的模型崩溃。


新闻来源:ABC News             作者:Aaron J. Snoswell


编辑:Audrey

(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

本文来源:元宇宙头条 文章作者:元宇宙头条
收藏
举报
元宇宙头条
累计发布内容523篇 累计总热度10万+
523篇 10万+
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪

元宇宙头条现已开放专栏入驻,详情请见入驻指南: #

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表元宇宙头条观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

评论 共0条
默认
|
点赞
说点什么吧
相关文章
您需要登录后才可以回帖 立即登录