使用开源大语言模型私有化部署创建数据库专家系统

发布于：2024-10-24 编辑：匿名来源：网络

最近在github上发现了一个不错的项目：该项目使用Vicuna-13b等开源大语言模型创建数据库专家系统。上线一个半月了，已经获得star了。

1 什么是DB-GPT？一个基于开源数据库的GPT实验项目，使用本地化的GPT大模型与您的数据和环境进行交互，而不存在数据泄露的风险，使大模型的能力绝对私密、安全、可访问。控制。

2 DB-GPT 能力目前包括以下能力： SQL 语言能力 SQL 生成 SQL 诊断私有领域问答与数据处理数据库知识问答数据处理插件模型支持自定义插件执行任务，原生支持 Auto-GPT 插件。例如：SQL自动执行、获取查询结果、自动爬取学习知识、知识库、统一向量存储/索引、非结构化数据支持，包括PDF、MarkDown、CSV、WebURL、多模型支持、多种大型语言模型的支持，目前支持 Vicuna (7b ,13b), ChatGLM-6b(int4, int8)TODO: codet5p, codegen23 架构 DB-GPT 的架构如下图所示：下面是各个模块的简单介绍： 3.1 知识库能力知识库作为当前用户在最苛刻的场景下，原生支持知识库的构建和处理。

同时，该项目还提供了多种知识库管理策略。例如：默认内置知识库、定制新知识库、通过插件能力自行抓取和构建知识库等使用场景。

用户只需要整理知识文档，然后利用现有能力构建大型模型所需的知识库能力。 3.2 大模型管理能力在底层大模型接入上，设计了开放的接口，支持多个大模型的对接。

同时，对于准入模式的效果有非常严格的控制和审核机制。与ChatGPT在大模型能力方面相比，准确率需要满足85%以上的能力对齐。

该项目采用更高的标准来筛选模型，希望在用户使用过程中能够省去之前繁琐的测试和评估步骤。 3.3 统一数据向量化存储和索引为了方便知识向量化的管理，内置了多种向量化存储引擎，从基于内存的Chroma到分布式的Milvus。

您可以根据自己的场景需求选择不同的存储引擎。，整个知识向量存储是AI能力增强的基石。

作为人类与大型语言模型交互的中间语言，向量在这个项目中发挥着非常重要的作用。3.4 连接模块为了更方便地与用户的私密环境进行交互，本项目设计了连接模块。

连接模块可支持连接数据库、Excel、知识库等各种环境，实现信息和数据交互。 3.5 Agent和插件 Agent和插件能力是大型模型能否实现自动化的核心。

本项目中原生支持插件模式，大模型可以自动完成目标。同时，为了充分发挥社区优势，本项目使用的插件原生支持Auto-GPT插件生态，即可以直接运行Auto-GPT插件在我们的项目中。

3.6 自动提示生成和优化提示是与大型模型交互过程中非常重要的一部分。在一定程度上，Prompt决定了大模型生成答案的质量和准确性。

在这个项目中，我们将根据用户的输入和使用场景，自动优化相应的提示，让用户更轻松、更高效地使用大语言模型。 3.7 多终端产品界面 TODO：在终端展示上，我们将提供多终端产品界面。

包括PC、手机、命令行、Slack等多种模式。 3.8 依赖相关开源组件 FastChat 提供聊天服务 vicuna-13b 作为基础模型 langchain 工具链 Auto-GPT 通用插件模板 Hugging Face 大模型管理 Chroma 向量存储 Milvus 分布式向量存储 ChatGLM 基础模型 llama-index 基于现有知识库进行情境学习以增强数据库相关知识。

4 安装部署 4.1 硬件要求该项目从效果上来说具有ChatGPT 85%以上的能力，因此对硬件有一定的要求。但总的来说，项目的部署和使用都可以在消费级显卡上完成。

具体部署硬件指令如下：GPU型号、显存大小、性能，RTX24G可以流畅地进行会话推理，RTX24G可以流畅地进行会话推理，不卡顿。有延迟的感觉，但比VV6G好一些。

它可以进行会话推理，但存在明显的滞后。 4.2 购买云服务器并部署本项目，必须先购买GPU资源。

目前腾讯云有 GPU 云服务器 · 限时抢购活动：安装依赖包代码语言：javascript copy yum -y install git yum install git-lfs yum install g++ yum install docker4.4 下载模型代码语言：javascript copy git clone git clone git clone 模型文件需要放在代码路径下：代码语言：javascript copy cd DB-GPTmkdir modelscp all-MiniLM-L6-v2 models/cp vicuna-13b models/4.5 启动MySQL 代码语言：javascript copy docker run --name= mysql -p :-e MYSQL_ROOT_PASSWORD=aa-dit mysql:latest4.6 安装环境及依赖代码语言：javascript copy wget Miniconda3-py_23.3.1-0-Linux-x86_64.shsource /root/.bashrcconda create - n dbgpt_env python= 3.10conda activate dbgpt_envpip install -rrequirements.txt4.7 启动服务器代码语言：javascript copy nohup python Pilot/server/llmserver.py > server.log 2>&1 &4.8 启动客户端代码语言：javascript copy nohup python Pilot /server/webserver.py>logs/client.log 2>&1 &4.9 访问地址能力测试 5.1 一般对话测试常识：逻辑：与GPT3.5相比，差距明显：与GPT4相比，差距更大： 5.2 数据库知识测试对比GPT3.5，差距很明显： 5.3 生成SQL并与DB交互能力测试如上图所示，选择库名称后，用自然语言输入查询要求，可以生成相应的SQL并执行返回结果！但返回结果的速度很慢，有时甚至超过1分钟。我们测试一下组合查询，发现它执行的是表关联查询，这是没有必要的，而且关联查询引用了不存在的字段，这就很奇怪了。

5.4 知识库能力测试【MySQL FAQ】系列-在线环境下是否应该开启查询缓存？我们将老叶关于查询缓存的文章转换成PDF进行上传：生成了向量文件/data/download/DB-GPT/pilot/ data/.vectordb 在文档中提出相关问题，看看答案是否可以使用中的内容文档：总体效果还可以。 6 综上所述，这个开源项目功能全面，集成了大型开源模型、私有知识库能力、数据库SQL生成能力、与DB交互查询能力。

如果这些能力都能达到90分，那么这个项目就非常值得制作。环境，因为它解决了代码泄露的安全问题。

但它有几个问题： 1、速度比较慢，尤其是生成SQL和与DB交互时，有时需要1分钟以上。 2、推理能力较弱，达不到3.5的水平。

3.因为2，有时候生成的SQL并不是用户需要的。但方向是对的。

未来，大型车型将通过这种方式在公司生产环境的某一区域实施。

站长声明

标签：

上一篇：在一篇文章中解决代码中的命名问题

下一篇：Gatsby博客部署到腾讯云教程

绿洲资本已完成首期1.5亿美元融资

投资界7月23日获悉，绿洲资本已完成首期1亿美元融资。本轮融资1.5亿美元，获超额认购。据悉，绿洲资本LP主要来自国内外长期资本，包括龙头工业企业、互联网企业家、境内外上市公司、境外母基金、家族办公室等顶尖机构和产业资本。截至目前，绿洲资本已交付6个项目。其中包

06-18
华虹无锡集成电路研发制造基地一期项目已达产，月产能4万片

近日，上海华虹集团在华虹无锡集成电路研发制造基地隆重举行“”周年活动，庆祝无锡基地一期工程全面达产，提前实现月产4万片的目标。市委书记黄钦出席达产庆典，市长杜小刚、上海华虹集团董事长张素新分别致辞。上海市国资委党委副书记程伟，上海市总工会副主席周琪，上海

06-06
凯奥思完成近亿元A+轮融资，联通创投、动平衡资本出手

投资圈（ID：pedaily）据10月17日消息，南京凯奥思数据科技有限公司（以下简称“凯奥思”）简称“凯奥思”）近期完成近亿元融资。人民币A+轮融资。本轮投资方为联通创投、动平衡资本、南方创投、东大资本和产业方高华科技（39）。凯奥思汇聚工业物联网，以工业企业移动设备

06-18
中国外交部：停止对赴美上市中国企业的无理政治打压！

3月25日，针对美国刚刚通过的《外国公司问责法案》最终修正案，外交部发言人华春莹表示，这是对在美上市的中国企业的无理政治打压，中方对此坚决反对。

06-18
贵一智能获数千万元战略投资，利奥基金联合卫瓴科技投资

投资圈（ID：pedaily）9月11日报道，人工智能初创企业杭州归一智能科技有限公司（以下简称：归一智能科技有限公司）一智智造宣布获得利奥基金、卫瓴科技数千万元战略投资，募集资金将主要用于基于通用大语言模型在营销领域的建设，并助力。通过AI广告和AI智能导购能力，企业

06-17
A股存储新秀来了！百威存储12月30日正式登陆科创板

证券日报深圳被誉为“科技之都、创新之城”，其中南山区是培育科技创新的“摇篮”科技创新企业众多，其中涌现出腾讯、中兴、TCL等高科技企业。 12月30日，南山区将再添一家科创板上市企业。是国产存储芯片“第一梯队”中的国家级专业化“小巨人”百威存储。作为半导体最大

06-06
智能物流解决方案提供商“劢微机器人”获近2亿元B轮融资

投资界（ID：pedaily）12月14日报道，智能物流解决方案提供商“劢微机器人”获近2亿元B轮融资本轮融资由华业天成领投，金丰博润跟投，新天创投继续跟投，成为资本独家投资方。本轮融资将主要用于加强技术研发和营销团队建设，强化产品研发能力，加速全球业务布局。劢微机器

06-17
AI女友很色情而且很赚钱

有人租女友带回家过年，有人在网上花钱请AI女友。 AI女友是大模特的产物。她是一个聊天机器人，每天24小时聊天，随叫随到，可以发短信和说话，还可以发送漂亮的照片。她可以是现实或虚构中的角色扮演，也可以是凭空创造的女性形象。简而言之，她不是一个真实的人。但因为

06-17
2018先进CMOS技术暑期大师班隆重开幕

2018先进CMOS技术夏季大师班于2018年8月13日在中国北京盛大开幕——全球最大的芯片自动化设计解决方案提供商、全球最大的芯片接口IP供应商、信息安全与软件质量新思科技（纳斯达克股票代码：SNPS）全球领军企业IEEE宣布，继去年共同主办第一季度“先进CMOS技术夏季大师班”后

06-06
为了打败中国，美国国防部将投入15亿美元发展AI军事一体化

近年来中美竞争日趋激烈，跨越多个领域。美国国防部长奥斯汀近日表示，中国力争年底前在人工智能领域实现全球主导地位，美国将在未来5年投资15亿美元，加速人工智能军种融合，力争在人工智能领域取得胜利。竞赛。美国国家人工智能安全委员会（NSCAI）13日在华盛顿举行“全

06-08
银河动力“谷神一号”轨道姿态控制动力系统第二次可靠性提升试验圆满成功

近日，银河动力航天公司顺利完成谷神一号轨道姿态控制动力系统“边境”第二次可靠性试验运载火箭性生长试运行期间，点火正常，正时正确，受压分离正常，火焰明亮，试验后结构完整，性能指标和可靠性满足总体技术要求。 “边境”轨道姿态控制动力系统由银河动力航天公司自主研

06-17
收购杜邦相关业务后，SK Siltron将在美国扩大SiC晶圆生产

韩国半导体硅晶圆供应商SSK Siltron计划投资3亿美元在美国密歇根州奥本建厂，并雇用3名员工供应更多 SiC 晶圆。 SKSiltron目前是全球第五大硅片制造商。去年3月收购了杜邦公司的SiC晶圆业务。当时，SKSiltron决定直接使用后者位于密歇根州的工厂。据BusinessKorea报道，SK

06-08