使用开源大语言模型私有化部署创建数据库专家系统

发布于:2024-10-24 编辑:匿名 来源:网络

最近在github上发现了一个不错的项目:该项目使用Vicuna-13b等开源大语言模型创建数据库专家系统。上线一个半月了,已经获得star了。

1 什么是DB-GPT?一个基于开源数据库的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,而不存在数据泄露的风险,使大模型的能力绝对私密、安全、可访问。控制。

2 DB-GPT 能力目前包括以下能力: SQL 语言能力 SQL 生成 SQL 诊断 私有领域问答与数据处理 数据库知识问答数据处理 插件模型 支持自定义插件执行任务,原生支持 Auto-GPT 插件。例如:SQL自动执行、获取查询结果、自动爬取学习知识、知识库、统一向量存储/索引、非结构化数据支持,包括PDF、MarkDown、CSV、WebURL、多模型支持、多种大型语言模型的支持,目前支持 Vicuna (7b ,13b), ChatGLM-6b(int4, int8)TODO: codet5p, codegen23 架构 DB-GPT 的架构如下图所示: 下面是各个模块的简单介绍: 3.1 知识库能力知识库作为当前用户在最苛刻的场景下,原生支持知识库的构建和处理。

同时,该项目还提供了多种知识库管理策略。例如:默认内置知识库、定制新知识库、通过插件能力自行抓取和构建知识库等使用场景。

用户只需要整理知识文档,然后利用现有能力构建大型模型所需的知识库能力。 3.2 大模型管理能力 在底层大模型接入上,设计了开放的接口,支持多个大模型的对接。

同时,对于准入模式的效果有非常严格的控制和审核机制。与ChatGPT在大模型能力方面相比,准确率需要满足85%以上的能力对齐。

该项目采用更高的标准来筛选模型,希望在用户使用过程中能够省去之前繁琐的测试和评估步骤。 3.3 统一数据向量化存储和索引为了方便知识向量化的管理,内置了多种向量化存储引擎,从基于内存的Chroma到分布式的Milvus。

您可以根据自己的场景需求选择不同的存储引擎。 ,整个知识向量存储是AI能力增强的基石。

作为人类与大型语言模型交互的中间语言,向量在这个项目中发挥着非常重要的作用。3.4 连接模块 为了更方便地与用户的私密环境进行交互,本项目设计了连接模块。

连接模块可支持连接数据库、Excel、知识库等各种环境,实现信息和数据交互。 3.5 Agent和插件 Agent和插件能力是大型模型能否实现自动化的核心。

本项目中原生支持插件模式,大模型可以自动完成目标。同时,为了充分发挥社区优势,本项目使用的插件原生支持Auto-GPT插件生态,即可以直接运行Auto-GPT插件在我们的项目中。

3.6 自动提示生成和优化 提示是与大型模型交互过程中非常重要的一部分。在一定程度上,Prompt决定了大模型生成答案的质量和准确性。

在这个项目中,我们将根据用户的输入和使用场景,自动优化相应的提示,让用户更轻松、更高效地使用大语言模型。 3.7 多终端产品界面 TODO:在终端展示上,我们将提供多终端产品界面。

包括PC、手机、命令行、Slack等多种模式。 3.8 依赖相关开源组件 FastChat 提供聊天服务 vicuna-13b 作为基础模型 langchain 工具链 Auto-GPT 通用插件模板 Hugging Face 大模型管理 Chroma 向量存储 Milvus 分布式向量存储 ChatGLM 基础模型 llama-index 基于现有知识库 进行情境学习以增强数据库相关知识。

4 安装部署 4.1 硬件要求 该项目从效果上来说具有ChatGPT 85%以上的能力,因此对硬件有一定的要求。但总的来说,项目的部署和使用都可以在消费级显卡上完成。

具体部署硬件指令如下:GPU型号、显存大小、性能,RTX24G可以流畅地进行会话推理,RTX24G可以流畅地进行会话推理,不卡顿。有延迟的感觉,但比VV6G好一些。

它可以进行会话推理,但存在明显的滞后。 4.2 购买云服务器并部署本项目,必须先购买GPU资源。

目前腾讯云有 GPU 云服务器 · 限时抢购活动: 安装依赖包 代码语言:javascript copy yum -y install git yum install git-lfs yum install g++ yum install docker4.4 下载模型 代码语言:javascript copy git clone git clone git clone 模型文件需要放在代码路径下: 代码语言:javascript copy cd DB-GPTmkdir modelscp all-MiniLM-L6-v2 models/cp vicuna-13b models/4.5 启动MySQL 代码语言:javascript copy docker run --name= mysql -p :-e MYSQL_ROOT_PASSWORD=aa-dit mysql:latest4.6 安装环境及依赖代码语言:javascript copy wget Miniconda3-py_23.3.1-0-Linux-x86_64.shsource /root/.bashrcconda create - n dbgpt_env python= 3.10conda activate dbgpt_envpip install -rrequirements.txt4.7 启动服务器代码语言:javascript copy nohup python Pilot/server/llmserver.py > server.log 2>&1 &4.8 启动客户端代码语言:javascript copy nohup python Pilot /server/webserver.py>logs/client.log 2>&1 &4.9 访问地址能力测试 5.1 一般对话测试常识: 逻辑: 与GPT3.5相比,差距明显: 与GPT4相比,差距更大: 5.2 数据库知识测试对比GPT3.5,差距很明显: 5.3 生成SQL并与DB交互能力测试 如上图所示,选择库名称后,用自然语言输入查询要求,可以生成相应的SQL并执行返回结果!但返回结果的速度很慢,有时甚至超过1分钟。我们测试一下组合查询,发现它执行的是表关联查询,这是没有必要的,而且关联查询引用了不存在的字段,这就很奇怪了。

5.4 知识库能力测试【MySQL FAQ】系列-在线环境下是否应该开启查询缓存?我们将老叶关于查询缓存的文章转换成PDF进行上传:生成了向量文件/data/download/DB-GPT/pilot/ data/.vectordb 在文档中提出相关问题,看看答案是否可以使用中的内容文档:总体效果还可以。 6 综上所述,这个开源项目功能全面,集成了大型开源模型、私有知识库能力、数据库SQL生成能力、与DB交互查询能力。

如果这些能力都能达到90分,那么这个项目就非常值得制作。环境,因为它解决了代码泄露的安全问题。

但它有几个问题: 1、速度比较慢,尤其是生成SQL和与DB交互时,有时需要1分钟以上。 2、推理能力较弱,达不到3.5的水平。

3.因为2,有时候生成的SQL并不是用户需要的。但方向是对的。

未来,大型车型将通过这种方式在公司生产环境的某一区域实施。

使用开源大语言模型私有化部署创建数据库专家系统

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 手摇充电宝、太阳能转换器,这些“变态”的充电宝实用吗?

    手摇充电宝、太阳能转换器,这些“变态”的充电宝实用吗?

    用手机扫描二维码支付,骑自行车,通过微信或电话联系人,打开外卖应用程序并安排您的日常膳食。 无处不在的电力和互联网构成了现代人的全部生活。 触手可及的便利很容易让人意识不到它有多么宝贵,因为在风平浪静的日子里,停电、断网都是一个遥远的话题。 然而,一场大雨打

    06-21

  • 为企业上云提供关键支撑,需要打好“存储和超融合”两个基础

    为企业上云提供关键支撑,需要打好“存储和超融合”两个基础

    云计算的快速发展,让越来越多的中国企业开始探索上云之路。 超融合市场也经历了爆发式增长。 未来很长一段时间,整个市场将基于多云共存,而从私有云到混合云再到公有云,超融合无疑可以提供平滑过渡的解决方案。 超融合架构采用软件定义技术,整合计算、存储、网络等资源,

    06-18

  • webview,用于 C-C++ 的小型跨平台 webview 库,下载webview的源码_GitHub_酷徒使用 WebKit(在 GTK-Cocoa 上)

    webview,用于 C-C++ 的小型跨平台 webview 库,下载webview的源码_GitHub_酷徒使用 WebKit(在 GTK-Cocoa 上)

    GitHub 上的 webview 库是一个紧凑而高效的解决方案,用于在 C/C++ 中创建跨平台图形用户界面 (GUI)。 它利用本机系统 Web 视图,例如适用于 Linux 和 macOS 的 WebKit 以及适用于 Windows 的 Edge WebView2,提供轻量级且资源高效的替代方案。 该库支持双向 JavaScript 绑定

    06-18

  • 奈雪PRO店开始卖咖啡,是要抢星巴克市场吗?

    奈雪PRO店开始卖咖啡,是要抢星巴克市场吗?

    11月25日,奈雪新茶饮店模式“耀茗”在深圳正式亮相,并在南山金地科技园和福田天安数码城开设“双店”。 奈雪PRO也是继奈雪茶馆、奈雪酒屋、奈雪梦工厂之后的第四类商店。 据奈雪茶相关负责人介绍,与以往奈雪店多位于高端商圈不同,奈雪PRO将聚焦一线城市,进军商务办公区和

    06-17

  • 2023年7月融资月报

    2023年7月融资月报

    一、互联网巨头企业投资概况 7月值得关注的互联网巨头投资案例中,投资方包括阿里、美团、腾讯、小米等13家企业,其中阿里、小米投资2家-速度。 7月,阿里领投AR眼镜公司致敬未来天使1万美元,美团投资1亿元人民币入智谱华章公司B2轮,小米集团战略投资元潼科技数千万元,腾

    06-18

  • 红杉种子掌控150亿,正在找你

    红杉种子掌控150亿,正在找你

    这是一个非常引领潮流的场景。 投资界获悉,今日(2月28日),红杉中国种子基金(简称:红杉种子)宣布旗下第三只种子基金(红杉中国种子基金III)已完成募集4.8亿美元(约合人民币30亿元) )并于近期进入投资期。 截至目前,红杉种子已管理资金近亿元,成为国内管理规模最大

    06-17

  • eSignBao获超10亿元D轮投资,电子签名再次迎来行业最大融资!

    eSignBao获超10亿元D轮投资,电子签名再次迎来行业最大融资!

    在不可逆转的全球数字化趋势推动下,电子签名行业迎来新的重大利好。 2019年11月5日,e闪宝正式宣布获得深创投、恒大高科技集团、大辰财智领投,元一投资、泛创资本等机构跟投,合计超过1亿元。 D 系列融资。 本轮融资将继续用于继续加大产品和技术研发投入,聚焦签约和合同,

    06-18

  • 德高化学汽车半导体封装树脂材料项目已开工

    德高化学汽车半导体封装树脂材料项目已开工

    据天津高新区官方微信报道,4月26日,天津德高化学新材料有限公司“汽车半导体封装树脂材料项目”开工海洋科技园创新创业园建设正式启动。 据悉,本次已开工的汽车半导体封装树脂材料新生产线项目将在高新区创新创业园建设汽车半导体封装树脂材料洁净车间。 共建设3条生产线,

    06-06

  • 无锡光子芯谷创新中心正式开工建设

    无锡光子芯谷创新中心正式开工建设

    无锡滨湖发布 近日,无锡光子芯谷创新中心(一期)奠基仪式举行。 滨湖区区委书记孙海东宣布项目正式开工。 市科技局局长赵建平,上海交通大学地方研究院发展办公室主任李健,上海交通大学无锡光子芯片研究院院长、上海市教授金宪民交通大学、区领导高阳,王鲁新、姚旭江、李

    06-06

  • 智翔科技获数千万元A轮融资

    智翔科技获数千万元A轮融资

    投资界7月31日获悉,据36氪报道,深圳市智翔科技有限公司(以下简称“智翔科技”),一家停止IT综合运维产品供应商”)宣布获得数千万元A轮融资,由深圳市投资控股东海投资有限公司领投。 智翔科技于2019年5月注册成立,正式投资2018年开始研发,2018年4月推出第一代IT综合运

    06-18

  • 超过2.5GW!风能和太阳能进入哥伦比亚私人拍卖候选名单

    超过2.5GW!风能和太阳能进入哥伦比亚私人拍卖候选名单

    哥伦比亚地区电力经销商 Air-e 周二表示,22 家国内和国际公司已进入其私人组织的可再生能源拍卖的资格预审阶段。 Air-e表示,来自瑞典、法国、西班牙、挪威、中国、墨西哥和葡萄牙的公司以及哥伦比亚同行提交了出售39个风能和太阳能项目电力的提案,这些项目的总发电量超过

    06-08

  • 八亿空间拟投资16.8亿元建设电子材料基地项目

    八亿空间拟投资16.8亿元建设电子材料基地项目

    7月11日,上市公司八亿空间发布公告,拟利用超募资金投资建设电子材料基地项目。 “浙江上虞电子材料基地项目”。 公告显示,随着信息技术的不断发展和进步,全球对电子材料的需求不断增长。 中国作为全球电子材料行业主要的产业聚集地,一方面拥有巨大的市场需求,另一方面国

    06-06