刘伟
为什么AI会一本正经地...... 精选
2024-7-28 20:41
阅读:3579

世界卫生组织于 4 月 2 日推出了新的聊天机器人,初衷是建立一个由 GPT-3.5 支持的新虚拟形象——SARAH(智能健康助理)全天候提供关于如何健康饮食、戒烟、减压等多方面的生活建议,支持八种不同语言,服务于全球数百万用户。

但人们很快发现,就像所有聊天机器人一样,SARAH 有时也会给出错误答案。在一个案例中,它列出了旧金山一些不存在诊所的假名称和地址。世界卫生组织在其网站上警告称 SARAH 的信息可能并不总是准确的。

这种事情又发生了,聊天机器人的胡编乱造已经成为了一个再熟悉不过的梗。

泛泛地说,AI一本正经地胡说八道的原因可以归结为:AI的理解能力受到其训练数据和算法的限制,如果问题表达不清晰或者背景信息不足,AI可能会产生错误的推理或输出;AI语言模型本质上是基于统计学习和模式匹配的,它们生成的文本有时候可能是合乎语法但不符合逻辑或现实情况的;目前的AI在处理复杂问题时常常缺乏人类的常识和背景知识。这可能导致它在回答问题或生成内容时出现不合理的结论或胡言乱语;不同的AI模型有其局限性和特点。有些模型可能在某些领域表现良好,而在其他领域可能表现较差或不足以生成有意义的答案;理解自然语言的语义是一个复杂的问题,涉及语境理解、推理能力等多方面因素。AI在处理这些问题时可能会出现误解或者不当的回应。简而言之,AI胡说八道的现象通常是由于其技术和算法的限制,以及在特定语境下理解能力的不足所致。随着技术的进步和模型的改进,这些问题有望得到缓解,但目前还需要人类监督和干预来确保AI输出的准确性和合理性。

实际上,线性函数和激活函数是造成AI一本正经地胡说八道的根本技术原因。线性函数和激活函数是神经网络中常用的两种函数,线性函数表示了输入与输出之间的线性关系,即输出值等于输入值乘以某个常数加上另一个常数;而激活函数则是对输入进行非线性变换,增加网络的表示能力。当神经网络仅使用线性函数时,网络的层数和节点的数量对于网络的表示能力并没有太大的提升,这是因为多个线性函数的组合仍然可以用一个单一的线性函数表示,所以,只使用线性函数的神经网络只能表示线性关系。然而,当线性函数与激活函数相结合时,网络的表示能力就大大增强了。激活函数引入了非线性变换,使得神经网络能够学习并表示更复杂的非线性关系,激活函数可以将输入映射到一个新的空间,使得网络能够学习到非线性的特征和模式。

机器幻觉是指在AI大型语言模型或多模态模型中出现的非预期行为或输出,这些行为通常是由模型内部复杂的神经网络结构和其学习到的模式所导致的。虽然确实可以说机器幻觉是由多个内层神经网络的线性函数和激活函数的复杂组合所产生,但具体来说,这种现象通常由以下几个因素共同作用而产生:非线性激活函数,神经网络中常用的非线性激活函数(如ReLU、sigmoid等)能够引入复杂的非线性变换,使得模型能够学习到更复杂的函数关系,但也可能导致模型输出的非直观性或错误;高维度空间中的映射,大型模型操作的是高维度的数据空间,这使得模型能够学习到复杂的数据分布和模式,但也增加了模型产生奇异或不合理输出的可能性;数据分布不平衡或数据偏见,如果训练数据集中存在偏差或不平衡,模型可能会学习到错误的关联或偏见,导致输出不准确或不合理;训练中的误差累积,在大规模训练过程中,模型可能会在某些数据点上过拟合或产生误差累积,这可能导致模型在某些情况下产生幻觉性质的输出。

因此,从底层技术上讲,机器幻觉的产生是由于复杂神经网络模型在学习和推理过程中的困难和挑战,需要通过进一步的模型改进、更好的数据处理和更精确的调试来解决。

微信图片_20240719084439.jpg

转载本文请联系原作者获取授权,同时请注明本文来自刘伟科学网博客。

链接地址:https://wap.sciencenet.cn/blog-40841-1444163.html?mobile=1

收藏

分享到:

当前推荐数:6
推荐到博客首页
网友评论1 条评论
确定删除指定的回复吗?
确定删除本博文吗?