首页 > 行业资讯 > 资讯动态

探讨大型模型在生成文本时出现不连贯输出的现象

日期：2024-03-20 　作者：小天　来源：www.txunda.com 　人气：581

“幻觉”这个词，如今已经成为了大语种模型领域中人尽皆知的热门词汇。当我们与像 ChatGPT这样的聊天机器人进行交流时，我们经常会发现，它是自动生成的。简单来说，就是人工智能有可能会“胡言乱语”，跟你聊天，回答问题。现在，大型的模型制造商们都在努力，消除幻象的方法也是层出不穷；然而，在医疗诊断、法律咨询等对模型输出要求较高的决策环境中，开发人员往往会采用较为保守的方式，比如限制模型在高风险环境中的自主产生，或在需要时干脆拒绝解答。

虽然已有研究从数据、培训和推理三个方面给出了很多解释，但是对于完全排除幻觉的可能还没有定论。这个关键问题是认识大规模模型性能潜力的关键，然而，由于不能同时满足全部输入条件，单靠经验法很难解决这个问题。由于真实世界比形式世界要复杂得多，所以这个结论也可以应用到更大的真实环境中。在此基础上，本项目还将针对具有实际应用背景的实际问题，设计具有较强鲁棒性的容易产生错觉的场景，并提供相应的实验支持。

最后，在此基础上，研究已有的虚拟场景消除方法的内在机理，以及它们对大规模模型的安全、高效应用所产生的现实影响。错觉是指当一个人处于无外力干扰状态时，他可以感知到某种并不存在的事物。从广义上讲，幻觉是一种与现实不符的或毫无意义的信息，它是一种语言现象。这种现象以虚假的形式表现出来，却让人产生了一种安全与伦理的担忧。从广义上讲，幻景的表现形式有内在幻景和外在幻景两种。内部幻觉是在输出与输入不相符的情况下出现的，例如与提示不符的资讯。

外在幻觉是指在图案的结果无法通过输入的信息来验证。此外，由于用户命令的不同，幻觉还可以分为规约性、语境性和逻辑上的不一致。在数据获取、训练和推理过程中，在数据获取、训练和推理过程中，会出现数据采集、训练、推理等方面的问题，如：数据采集、训练和推理过程中出现的数据获取、固有偏差、表达不准确、解码错误、曝光偏差、参数认知偏差等问题。

如果您需要相关服务，可以找天津天迅达科技有限公司，我们的业务有Web开发、iOS APP、Android APP、微信开发、HTML5开发等，天迅达——您身边的App个性化定制专家！

在对“大模式”错觉的探索中，学者们对“幻象”进行了正式的定义，并把“可算现实”和“电脑可及”这两个“不一致”的概念分别视为“不一致”。这个试验的目标就是要检验一个大型模型能否学会全部可算功能，以便它总能得到与实际功能相符的结果，也就是说，能否彻底排除那些误差。实验证明，不管模型结构、学习算法、线索技术还是训练样本，大型模型在形式世界中都会出现假象。因为真实世界是现实世界的一部分，所以这个结论同样可以应用到更大的现实世界。

另外，经验分析显示，即便是最高级的大型模型，对于一些实际问题，也会出现“错觉”，从而证明了上述结论的正确性。当前，针对大规模场景的消除，通常以增强大规模场景的处理能力为目标，以提高大规模场景下的处理能力为目标，采用训练样本或者基于推理偏向的方式，尽可能地为大场景中的大规模场景提供更多的信息。

比如，通过增加模型的参数、训练样本的数量等手段，提高模型的复杂度；也可以使用基于提取的技术，提示的策略，以及新的译码方式，来降低这种“错觉”。但是，这种方法也存在一定的限制，例如，当大型模型不能完全反映实际情况时，仅仅通过添加参数或数据就会失去作用。

在实践中，大型模型对重要决策的支撑作用受到限制。传统的“大模型”在解决一些问题时容易出现“假象”，表现为“表面上看起来很有道理，但实际并不精确甚至毫无意义”。比如，在医疗诊断、财务风险评估、法律顾问等方面，过分依靠大数据分析的结果，容易造成决策失误。这种“大模式”的“错觉”现象也有可能给社会伦理学带来潜在的冲击。大数据环境下产生的数据可能含有偏见、误导性信息或不正确的信息，可能会误导大众，影响人们的认知和行为。

比如，当产生一个新闻概要或者一个历史事件说明的时候，大的模型会不自觉地散布一些虚假的消息，这就会影响到人们对这些事件的认识和记忆。另外，在进行文学创作或者艺术创作的过程中，“大数据”可以产生独一无二的“虚拟材料”，这既是一种创新性，也是一种对著作权、原创性和真实性的质疑。

以上所有设计图和部分文字均来自网络，如有侵权，请call我删除，感谢~

天津天迅达科技有限公司经过多年来对APP、小程序、以及网站建设的探索，已经帮助每一个客户快速开发出属于自己的APP、小程序、网站，是万千企业之选。

标签：天迅达科技天津APP开发天津网站建设网站建设