文章概要:
2. 其显现为,当用户试图提取下一个句子时,会扰乱输出。
3. 斟酌人员认为尝试提示意图并采取措施,但仍使用受版权保护材料。
广州益福废纸回收处理公司8月24日 信息:据资讯,最近,的AI科学家团队在论文中宣布了一项新探讨,内容是试图隐瞒自身是经过大批受版权保护的材料进行训练的。
切磋人员显现,当用户尝试通过提示提取下一句时,会故意扰乱输出,而此前版本不存在这样的行为。
思量人员预测,的开发者实现了一种机制,允许测试提示是否意图提取版权内容。然则尽管采取了这些措施,探索还是呈现会用受版权保护的材料回应某些提示。
事实上,不仅,其他大语言模型如Meta的OPT-1.3B和谷歌的FLAN-T5也被显示会用受版权保护的文本回复提示。
研讨人员分析,这是因为这些大语言模型都是经过训练大批文本数据获得能力的,涵盖书籍、文章和网站中的文字。这些训练数据常日包罗受版权保护的内容,大语言模型大概会无意中复制这些内容。
发表回复