400 128 6709

行业新闻

使用DeepSeek+RAG实现私人知识库

发布时间:2025-04-28点击次数:

在使用包括 chatgpt 在内的 aigc 工具回答 sap 相关问题时,常常会遇到大模型产生不准确或虚构信息的情况,这种现象被称为大模型的幻觉现象。对于 llm 模型来说,它是一种基于上下文的生成模型,其预测依赖于先前的文本序列。由于模型在训练过程中学习了语言的统计规律,有时会在生成文本时添加一些不合逻辑或与实际情况不符的内容。这种现象并非模型故意为之,而是由于模型参数中存储的知识是固定的且有限的,而现实世界的信息却在不断更新。

为了减少或避免大模型的幻觉现象,RAG(Retrieval-Augmented Generation)是一种有效的解决方案。当用户向通过 RAG 增强的大语言模型提问时,系统首先通过检索模块(Retriever)从外部知识库中查找相关文档,然后将检索结果与原始问题共同输入生成模块(Generator)进行答案合成。与模型参数中固化的知识不同,外部知识库的内容可以实时更新,从而让大语言模型提供实时的准确回复。外部知识库通常存储在数据库中,如向量数据库。

本文将通过 DeepSeek、Ollama 和 AnythingLLM 三个工具,手动上传 SAP 文档,来演示如何基于 RAG 架构打造自己的个人 SAP 知识库。

实现工具与操作步骤

1)安装 Ollama 并运行 DeepSeek

Ollama 是一个用于在本地环境运行大语言模型的工具。它允许开发者在本地 GUI 或命令行中加载和运行各种 AI 模型,无需深入理解底层的机器学习框架。Ollama 的设计思路类似于 Docker,通过它管理的 AI 模型类似于 Docker Image,但 Ollama 专门针对 AI 模型进行了优化。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

使用DeepSeek+RAG实现私人知识库

Ollama 安装成功后,使用命令行 ollama run deepseek-r1:1.5b,这个命令会自动下载 DeepSeek 模型到本地并运行。1.5b 表示下载参数个数为 15 亿的 DeepSeek 版本,为了节省时间,笔者选择了这个文件尺寸为 1.1 GB 的最精简的模型。

使用DeepSeek+RAG实现私人知识库

耐心等待下载结束,看到命令行里弹出 think 提示符,输入 who are you? 得到 DeepSeek 的自我介绍回复,说明 Ollama 和自动下载的 DeepSeek R1 已经正常工作了。

2)上传 SAP 文档作为知识库素材

既然是打造私人的 SAP 知识库,我们就需要给 DeepSeek 喂一些外部文档作为知识库的文档素材。在 Bing 搜索引擎里使用 site:sap.com filetype:pdf 随便搜一些 SAP 官方发布的 PDF 来测试。在实际使用场景中,企业级客户可以将自己的私密数据,喂给本地部署的大模型,而不用担心隐私泄漏的问题。

使用DeepSeek+RAG实现私人知识库

这里我从 Bing 的搜索结果下载了一个名为 SAP S4HANA private cloud - implementation guide.pdf 的文件。

使用DeepSeek+RAG实现私人知识库

3)使用 AnythingLLM 建立工作区

下一步,下载 AnythingLLM 并安装。AnythingLLM 是一个开源的 AI 工具,能够方便地将用户提供的各种格式的文档嵌入到自定义 AI 模型中,使其在同用户对象中作为可参考上下文的一部分。这意味着通过 AnythingLLM, AI 模型在回答问题时,可以检索和分析用户提供的文档,将其内容整合作为最终的输出,即本文开头部分介绍的 RAG 工作方式。

使用DeepSeek+RAG实现私人知识库使用DeepSeek+RAG实现私人知识库

AnythingLLM 安装完毕之后,像使用 ABAP Development Tool 一样,新建一个工作区(Workspace):

使用DeepSeek+RAG实现私人知识库

点击「聊天设置」:

使用DeepSeek+RAG实现私人知识库

还记得我们刚才下载的 Ollama 和通过 ollama run 命令下载的 DeepSeek R1 吗?在工作区 LLM 提供者的下拉菜单中,找到通过 Ollama 管理的 DeepSeek R1。

这个设置的意思是,我们接下来可以通过 AnythingLLM 提供的 GUI 窗口,同 DeepSeek 对话,可以同 Ollama 自带的命令行窗口说再见了。

使用DeepSeek+RAG实现私人知识库

4)文档嵌入与向量数据库

接下来通过向量数据库来上传并存储用户提供的文档。点击上传图标,打开上传对话框:

使用DeepSeek+RAG实现私人知识库

点击 Upload 区域,将刚才从 Bing 搜索下载的 SAP S/4HANA private cloud PDF 文档上传:

使用DeepSeek+RAG实现私人知识库

weenCompany闻名企业网站系统5.3.0 中英文 GB2312 weenCompany闻名企业网站系统5.3.0 中英文 GB2312

weenCompany闻名企业网站系统(免费开源)是一个功能强大, 使用简单的中英文企业智能建站系统, 您只需要一些基本的计算机知识就可以利用此系统完成中小型企业网站的建设; 是低成本企业网站架设方案之首选CMS系统, 也适合建设个人网站。weenCompany闻名企业网站系统功能:1. 程序代码简洁严谨, 整个系统程序仅2M左右大小.2. 中英文双语版共用一套网站程序, 双语页面实现自由切换.3

weenCompany闻名企业网站系统5.3.0 中英文 GB2312 0 查看详情 weenCompany闻名企业网站系统5.3.0 中英文 GB2312

待文档上传完毕,点击 S*e and Embed 按钮,将文档内容转换成向量数据并执行嵌入操作。

使用DeepSeek+RAG实现私人知识库

向量数据库是一种用于存储和查询高维向量数据的数据库,其核心功能是提供高效的相似度搜索,使得查询向量能够找到与之最接近的向量。相比传统关系型数据库(如 MySQL、PostgreSQL),向量数据库更适合存储和检索非结构化数据,如文本、图像、音频等。

在 RAG 架构中,向量数据库的作用类似于一个知识库,它存储了大量文本片段的嵌入(Embeddings),当用户输入查询时,模型会将查询转换为向量,并在数据库中检索最相关的向量,进而找到对应的文本内容。这种方式大幅提高了生成式 AI 的可控性和可解释性。

使用DeepSeek+RAG实现私人知识库

文档嵌入(Embedding)是将文本数据转换为向量的过程。这一过程的核心是将文本内容映射到一个高维向量空间中。相似的文本在该空间中的距离较近,而不相关的文本距离较远。

当然在实际企业级应用中,除了小规模的人工手动上传文档外,AnythingLLM 也支持通过 Data Connection 进行批量上传大规模文档,比如批量上传某个 Github Repo 里的文件。这种模型下,AnythingLLM 读取 Github 仓库内容的方式,通过 Access Token 完成。

使用DeepSeek+RAG实现私人知识库

等我们上传的文件出现在工作区右边区域后,说明文档的向量化即嵌入操作已经完成。

使用DeepSeek+RAG实现私人知识库

效果验证

此时,我们回到 AnythingLLM 同 DeepSeek 的对话窗口,提出一个问题:

What is embedded EWM?

使用DeepSeek+RAG实现私人知识库

DeepSeek 给出的回答的确是基于我们刚刚上传的 PDF 文件来完成的。

这一点可以从 DeepSeek 回复的 Citation 即引用区域得到证实,该区域显示本次回答引用了 SAP S4HANA private cloud edition.pdf 这个文件。

使用DeepSeek+RAG实现私人知识库

后记:模型部署

对于企业级用户而言,大模型的私有部署,在数据安全性、响应速度、可定制化、长期成本以及可靠性等多个方面都有着显著优势。而对于个人 AI 学习者来说,可以选择本地部署或者在某个云服务提供商的基础设施(IaaS)上进行私有部署的尝试。

笔者现在使用的笔记本电脑,本地部署满血 DeepSeek 比较吃力。所以,我选择了 PHP 中文网 HAI,这样就不用自己掏钱升级硬件了。

你可以登录腾讯 HAI 控制台,新建一个 Windows Server 实例:

使用DeepSeek+RAG实现私人知识库

使用 Windows 自带的 Remote Desktop Connection 登录到创建好的 HAI 实例上。

使用DeepSeek+RAG实现私人知识库

笔者之前曾发布过文章《使用腾讯 HAI 5 分钟内部署一个私人定制的 DeepSeek》,详细介绍了采用私有部署方式运行 DeepSeek 的步骤,有兴趣的小伙伴可前往了解。

通过本文展示的步骤,即使是一个不了解大语言模型底层实现细节的普通用户,借助 Ollama 和 AnythingLLM 这两个工具,也能轻松完成 DeepSeek 的本地部署,并打造自己的私人知识库。

SAP 在官方社区上也发布了其在 AI 和 RAG 领域很多积极的尝试,笔者后续的文章会继续给大家介绍!

以上就是使用DeepSeek+RAG实现私人知识库的详细内容,更多请关注其它相关文章!


# 官网  # 桂阳营销型网站建设单价  # 无锡营销推广软件  # 深圳网站推广公司多少钱  # 快手刷粉推广网站  # seo站群流量  # 招商网站推广好选择  # 专注营销推广套餐怎么做  # 光山网站推广设计招聘  # 嘉兴网站建设黄页  # 福田电影网站优化平台  # 命令行  # 自己的  # 是一个  # 企业网站  # 上传  # aigc  # 文档  # 建设个人网站  # 企业网站的建设  # 腾讯  # d  # bing  # chatgpt  # ai  # 工具  # access  # 电脑  # windows  # docker  # git  # mysql 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 改变城市交通:智慧城市中的智能交通  人工智能赋能无人驾驶:商业化进程再提速  OpenAI 向所有付费 API 用户开放 GPT-4  泗洪:畅通城市“血管” ,管下机器人来帮忙  鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代  人工智能助力林草行业高质量发展  OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格  官宣!爱康AI未来之夜三大亮点提前剧透!  12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词  静安大宁功能区企业云天励飞亮相2025世界人工智能大会,秀出AI硬实力!  亚马逊确认今年不会举办 re:MARS 机器人和人工智能大会  煤电“三改联动”需多措联动  IBM 与 NASA 携手开源地理空间 AI 模型,促进气候科学研究进步  七大主流AI企业包括OpenAI、谷歌等联合承诺:引入水印技术,并允许第三方审核AI内容  石头扫拖机器人 G20 618 福利来袭:4999 元,超值配件领到手软  苹果CEO库克:持续研究生成式人工智能技术  IBM和NASA合作发布可追踪碳排放的开源AI基础模型  家电行业观察:AI加持下,全屋智能将成为智能家电未来?  当科幻走进现实 脑机接口新技术能为生活带来哪些惊喜?  「模仿学习」只会套话?解释微调+130亿参数Orca:推理能力打平ChatGPT  GPT-4是如何工作的?哈佛教授亲自讲授  B站内测 AI 搜索功能,输入“?”即可体验  李开复:未来几年,人工智能会革了所有人的命,除非你这么做  AI生成会议纪要 百度如流升级推出超级助手、智能编码等功能  Adobe旗下Illustrator引入生成式AI工具Firefly  即将到来:AI婚纱设计软件实际测试,人工智能即将开创婚纱设计新纪元  AI证件照生成器:实际测试中AI软件展现了绝无仅有的强大效能  利好来了,AI再起一波?  OpenAI首席执行官引用《道德经》 呼吁就AI安全问题合作  Meta Connect 2025已确定时间为9月27-28,主题涵盖Quest 3与AI技术  食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心  2025年深圳举办的SUSECON 创新峰会开始接受报名  面向AI大模型,腾讯云首次完整披露自研星脉高性能计算网络  写出优质文章的妙招:利用"稿见AI助手"的实用指南  独家视角:首次展示有人与无人协同打击的7000米高空察打一体无人机  人工智能和神经网络有什么联系与区别?  AI大模型,将为智慧城市带来哪些新变化?  华为云天筹AI求解器荣获世界人工智能大会最高奖  人形机器人打开精密齿轮市场全新空间!受益上市公司梳理  全场景智能车:智能无处不在|芯驰亮相世界人工智能大会  上海发布大模型政策 打造AI“模”都  美图开拍使用教程  Unity发布Sentis和Muse AI工具,助力创作游戏和3D内容  上天下海登极,青岛与昇腾AI握手一起探索星辰大海  看懂AI,找到增长新势能 | 笔记侠AI峰会等你来  沐曦首款AI推理GPU亮相:INT8算力达160TOPS!  联想举办2025创新开放日,展出260余项算力及AI产品技术  百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧  GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能  万兴播爆桌面端上线,支持AI数字人搜索、视频编辑等功能 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司