本文将详细介绍,如何利用ai的能力,借助cherry stdio,实现一个离线的、纯个人的本地知识库

明确目标

目前主流的agent,如豆包、chatgpt等,基本逻辑:界面中,用户输入问题, loading…., 输出结果。我们要实现的也是这一套,只不过,大模型思考的过程中,所用到的资料,是我们自己的,而不是来自于网络。
这里需要解释一点的是,模型也分成了很多种类。如bge-m3这种,属于嵌入模型,bec-reranker-base_v1,属于重排模型。这俩可以理解为拆分资料库用的。输入原始问题,通过这俩,定位到相关片段。有了相关片段,再通过如QAwen这种推理模型,归纳总结这些片段,然后以人话的形式,输出结果。

具体实现(以cherry studio为例)

下载cherry stdio,绑定硅基流动

具体自行百度,一波配置后,其基础界面如下:

图片描述
创建知识库,投喂语料库

创建知识库,配置各阶段的模型,然后上传你想要大模型解析的原始语料库。我本人又一直在维护一个个人的博客,所以我就直接把我遗忘写过的所有文章扔了进去。具体操作如下所示:
图片描述

搭配推理模型,实现离线版、专为个人服务之agent
图片描述

done