但作为公司和这些工具的开发者,我们仍然需要克服一些问题。
问题是,500 页已经很多了,但还不是整个互联网。因此,他们知识上出现的空白不能仅仅通过把所有东西都塞进我们的短期记忆中来填补。
第二个问题是刘等人做了一组研究。其他一些研究人员发现,如果你在这种短期背景下工作,如果你在提示中输入大量信息,而需要提取的重要信息却埋在中间的某个地方,那么提取这些信息就会相当一致地失去其有效性。
事实上,您只需获取相关信息并将其放在提 手机数据 示的开头并支付下一个最昂贵的模型即可获得更好的性能。所以这对我们来说是一件有趣的事情,因为当我们使用这些模型时,一方面我们知道我们会定期将大量信息放入上下文中。这样我们的谈话就集中起来了。
这就是我们填补这些知识空白的方法。因此,一方面,我们不想搜索所有这些不同的文档并找出正确答案。这正是我们要求 ChatGPT 做的事情。但另一方面,如果我们放入太多不相关的东西,它就很可能会错过我们真正想要处理的东西。
我们该如何处理这些问题?
因此我们可以采取一些措施来解决这个问题。首先,就我们个人而言,我们可以记住,长时间的对话本质上是放入这个上下文窗口中的。因此,如 对于历史奇幻爱好者 果我们正在与他谈论一件事,然后我们实际上想要谈论其他事情,我们基本上可以决定切换到新的聊天,这在这些界面中非常方便。我们能做的另一件事是处理诸如超级提示之类的事情。
所以,这实际上是一些精简的指令块,你经常会发现人们把它们放在交互的顶部。同样,这可能意味着内容会被转移到中间部分,而中间部分的内容经常会被遗漏。所以我们会尽量确保尽可能集中注意力。当然,如果我们也把大块信息也放进去،我们会尽量剔除那些我们认为不太相关的内容.
检索增强生成 (RAG)
解决这类问题的另一种方案更注重技术,也更注重企业层面,但作为一个不断发展的行业,我们肯定都应该关注这一点,那就是所谓的راگ提问،而是拥有一个独立的数据库,其中包含我们想要的重要信息.
所以، 这些可能是我们公司所有不想对外公开的内部文档也可能只是一些我们知道相关但无法直接复制粘贴到上下文中的内容。所以我们有这个 电话号码业务线索 单独的数据库,还有一些称为向量数据库的工具,它们本质上是为与大型语言模型完美兼容而设计的,并且它们的逻辑与大型语言模型非常相似.
这样,他们就可以提取出最相关的文档,并将其自然地添加到上下文中.这样一来,你就不用费力搜索、复制粘贴,剔除那些不太相关的内容了。 这大大简化了流程,让你拥有一个更私密、更贴合语境的工具版本,并开始解决我们在知识缺失方面遇到的一些问题.