使用开源大语言模型私有化部署创建数据库专家系统

发布于:2024-10-24 编辑:匿名 来源:网络

最近在github上发现了一个不错的项目:该项目使用Vicuna-13b等开源大语言模型创建数据库专家系统。上线一个半月了,已经获得star了。

1 什么是DB-GPT?一个基于开源数据库的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,而不存在数据泄露的风险,使大模型的能力绝对私密、安全、可访问。控制。

2 DB-GPT 能力目前包括以下能力: SQL 语言能力 SQL 生成 SQL 诊断 私有领域问答与数据处理 数据库知识问答数据处理 插件模型 支持自定义插件执行任务,原生支持 Auto-GPT 插件。例如:SQL自动执行、获取查询结果、自动爬取学习知识、知识库、统一向量存储/索引、非结构化数据支持,包括PDF、MarkDown、CSV、WebURL、多模型支持、多种大型语言模型的支持,目前支持 Vicuna (7b ,13b), ChatGLM-6b(int4, int8)TODO: codet5p, codegen23 架构 DB-GPT 的架构如下图所示: 下面是各个模块的简单介绍: 3.1 知识库能力知识库作为当前用户在最苛刻的场景下,原生支持知识库的构建和处理。

同时,该项目还提供了多种知识库管理策略。例如:默认内置知识库、定制新知识库、通过插件能力自行抓取和构建知识库等使用场景。

用户只需要整理知识文档,然后利用现有能力构建大型模型所需的知识库能力。 3.2 大模型管理能力 在底层大模型接入上,设计了开放的接口,支持多个大模型的对接。

同时,对于准入模式的效果有非常严格的控制和审核机制。与ChatGPT在大模型能力方面相比,准确率需要满足85%以上的能力对齐。

该项目采用更高的标准来筛选模型,希望在用户使用过程中能够省去之前繁琐的测试和评估步骤。 3.3 统一数据向量化存储和索引为了方便知识向量化的管理,内置了多种向量化存储引擎,从基于内存的Chroma到分布式的Milvus。

您可以根据自己的场景需求选择不同的存储引擎。 ,整个知识向量存储是AI能力增强的基石。

作为人类与大型语言模型交互的中间语言,向量在这个项目中发挥着非常重要的作用。3.4 连接模块 为了更方便地与用户的私密环境进行交互,本项目设计了连接模块。

连接模块可支持连接数据库、Excel、知识库等各种环境,实现信息和数据交互。 3.5 Agent和插件 Agent和插件能力是大型模型能否实现自动化的核心。

本项目中原生支持插件模式,大模型可以自动完成目标。同时,为了充分发挥社区优势,本项目使用的插件原生支持Auto-GPT插件生态,即可以直接运行Auto-GPT插件在我们的项目中。

3.6 自动提示生成和优化 提示是与大型模型交互过程中非常重要的一部分。在一定程度上,Prompt决定了大模型生成答案的质量和准确性。

在这个项目中,我们将根据用户的输入和使用场景,自动优化相应的提示,让用户更轻松、更高效地使用大语言模型。 3.7 多终端产品界面 TODO:在终端展示上,我们将提供多终端产品界面。

包括PC、手机、命令行、Slack等多种模式。 3.8 依赖相关开源组件 FastChat 提供聊天服务 vicuna-13b 作为基础模型 langchain 工具链 Auto-GPT 通用插件模板 Hugging Face 大模型管理 Chroma 向量存储 Milvus 分布式向量存储 ChatGLM 基础模型 llama-index 基于现有知识库 进行情境学习以增强数据库相关知识。

4 安装部署 4.1 硬件要求 该项目从效果上来说具有ChatGPT 85%以上的能力,因此对硬件有一定的要求。但总的来说,项目的部署和使用都可以在消费级显卡上完成。

具体部署硬件指令如下:GPU型号、显存大小、性能,RTX24G可以流畅地进行会话推理,RTX24G可以流畅地进行会话推理,不卡顿。有延迟的感觉,但比VV6G好一些。

它可以进行会话推理,但存在明显的滞后。 4.2 购买云服务器并部署本项目,必须先购买GPU资源。

目前腾讯云有 GPU 云服务器 · 限时抢购活动: 安装依赖包 代码语言:javascript copy yum -y install git yum install git-lfs yum install g++ yum install docker4.4 下载模型 代码语言:javascript copy git clone git clone git clone 模型文件需要放在代码路径下: 代码语言:javascript copy cd DB-GPTmkdir modelscp all-MiniLM-L6-v2 models/cp vicuna-13b models/4.5 启动MySQL 代码语言:javascript copy docker run --name= mysql -p :-e MYSQL_ROOT_PASSWORD=aa-dit mysql:latest4.6 安装环境及依赖代码语言:javascript copy wget Miniconda3-py_23.3.1-0-Linux-x86_64.shsource /root/.bashrcconda create - n dbgpt_env python= 3.10conda activate dbgpt_envpip install -rrequirements.txt4.7 启动服务器代码语言:javascript copy nohup python Pilot/server/llmserver.py > server.log 2>&1 &4.8 启动客户端代码语言:javascript copy nohup python Pilot /server/webserver.py>logs/client.log 2>&1 &4.9 访问地址能力测试 5.1 一般对话测试常识: 逻辑: 与GPT3.5相比,差距明显: 与GPT4相比,差距更大: 5.2 数据库知识测试对比GPT3.5,差距很明显: 5.3 生成SQL并与DB交互能力测试 如上图所示,选择库名称后,用自然语言输入查询要求,可以生成相应的SQL并执行返回结果!但返回结果的速度很慢,有时甚至超过1分钟。我们测试一下组合查询,发现它执行的是表关联查询,这是没有必要的,而且关联查询引用了不存在的字段,这就很奇怪了。

5.4 知识库能力测试【MySQL FAQ】系列-在线环境下是否应该开启查询缓存?我们将老叶关于查询缓存的文章转换成PDF进行上传:生成了向量文件/data/download/DB-GPT/pilot/ data/.vectordb 在文档中提出相关问题,看看答案是否可以使用中的内容文档:总体效果还可以。 6 综上所述,这个开源项目功能全面,集成了大型开源模型、私有知识库能力、数据库SQL生成能力、与DB交互查询能力。

如果这些能力都能达到90分,那么这个项目就非常值得制作。环境,因为它解决了代码泄露的安全问题。

但它有几个问题: 1、速度比较慢,尤其是生成SQL和与DB交互时,有时需要1分钟以上。 2、推理能力较弱,达不到3.5的水平。

3.因为2,有时候生成的SQL并不是用户需要的。但方向是对的。

未来,大型车型将通过这种方式在公司生产环境的某一区域实施。

使用开源大语言模型私有化部署创建数据库专家系统

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 绿洲资本已完成首期1.5亿美元融资

    绿洲资本已完成首期1.5亿美元融资

    投资界7月23日获悉,绿洲资本已完成首期1亿美元融资。 本轮融资1.5亿美元,获超额认购。 据悉,绿洲资本LP主要来自国内外长期资本,包括龙头工业企业、互联网企业家、境内外上市公司、境外母基金、家族办公室等顶尖机构和产业资本。 截至目前,绿洲资本已交付6个项目。 其中包

    06-18

  • 华虹无锡集成电路研发制造基地一期项目已达产,月产能4万片

    华虹无锡集成电路研发制造基地一期项目已达产,月产能4万片

    近日,上海华虹集团在华虹无锡集成电路研发制造基地隆重举行“”周年活动,庆祝无锡基地一期工程全面达产,提前实现月产4万片的目标。 市委书记黄钦出席达产庆典,市长杜小刚、上海华虹集团董事长张素新分别致辞。 上海市国资委党委副书记程伟,上海市总工会副主席周琪,上海

    06-06

  • 凯奥思完成近亿元A+轮融资,联通创投、动平衡资本出手

    凯奥思完成近亿元A+轮融资,联通创投、动平衡资本出手

    投资圈(ID:pedaily)据10月17日消息,南京凯奥思数据科技有限公司(以下简称“凯奥思”)简称“凯奥思”)近期完成近亿元融资。 人民币A+轮融资。 本轮投资方为联通创投、动平衡资本、南方创投、东大资本和产业方高华科技(39)。 凯奥思汇聚工业物联网,以工业企业移动设备

    06-18

  • 中国外交部:停止对赴美上市中国企业的无理政治打压!

    中国外交部:停止对赴美上市中国企业的无理政治打压!

    3月25日,针对美国刚刚通过的《外国公司问责法案》最终修正案,外交部发言人华春莹表示,这是对在美上市的中国企业的无理政治打压,中方对此坚决反对。

    06-18

  • 贵一智能获数千万元战略投资,利奥基金联合卫瓴科技投资

    贵一智能获数千万元战略投资,利奥基金联合卫瓴科技投资

    投资圈(ID:pedaily)9月11日报道,人工智能初创企业杭州归一智能科技有限公司(以下简称:归一智能科技有限公司)一智智造宣布获得利奥基金、卫瓴科技数千万元战略投资,募集资金将主要用于基于通用大语言模型在营销领域的建设,并助力。 通过AI广告和AI智能导购能力,企业

    06-17

  • A股存储新秀来了!百威存储12月30日正式登陆科创板

    A股存储新秀来了!百威存储12月30日正式登陆科创板

    证券日报 深圳被誉为“科技之都、创新之城”,其中南山区是培育科技创新的“摇篮”科技创新企业众多,其中涌现出腾讯、中兴、TCL等高科技企业。 12月30日,南山区将再添一家科创板上市企业。 是国产存储芯片“第一梯队”中的国家级专业化“小巨人”百威存储。 作为半导体最大

    06-06

  • 智能物流解决方案提供商“劢微机器人”获近2亿元B轮融资

    智能物流解决方案提供商“劢微机器人”获近2亿元B轮融资

    投资界(ID:pedaily)12月14日报道,智能物流解决方案提供商“劢微机器人”获近2亿元B轮融资本轮融资由华业天成领投,金丰博润跟投,新天创投继续跟投,成为资本独家投资方。 本轮融资将主要用于加强技术研发和营销团队建设,强化产品研发能力,加速全球业务布局。 劢微机器

    06-17

  • AI女友很色情而且很赚钱

    AI女友很色情而且很赚钱

    有人租女友带回家过年,有人在网上花钱请AI女友。 AI女友是大模特的产物。 她是一个聊天机器人,每天24小时聊天,随叫随到,可以发短信和说话,还可以发送漂亮的照片。 她可以是现实或虚构中的角色扮演,也可以是凭空创造的女性形象。 简而言之,她不是一个真实的人。 但因为

    06-17

  • 2018先进CMOS技术暑期大师班隆重开幕

    2018先进CMOS技术暑期大师班隆重开幕

    2018先进CMOS技术夏季大师班于2018年8月13日在中国北京盛大开幕——全球最大的芯片自动化设计解决方案提供商、全球最大的芯片接口IP供应商、信息安全与软件质量新思科技(纳斯达克股票代码:SNPS)全球领军企业IEEE宣布,继去年共同主办第一季度“先进CMOS技术夏季大师班”后

    06-06

  • 为了打败中国,美国国防部将投入15亿美元发展AI军事一体化

    为了打败中国,美国国防部将投入15亿美元发展AI军事一体化

    近年来中美竞争日趋激烈,跨越多个领域。 美国国防部长奥斯汀近日表示,中国力争年底前在人工智能领域实现全球主导地位,美国将在未来5年投资15亿美元,加速人工智能军种融合,力争在人工智能领域取得胜利。 竞赛。 美国国家人工智能安全委员会(NSCAI)13日在华盛顿举行“全

    06-08

  • 银河动力“谷神一号”轨道姿态控制动力系统第二次可靠性提升试验圆满成功

    银河动力“谷神一号”轨道姿态控制动力系统第二次可靠性提升试验圆满成功

    近日,银河动力航天公司顺利完成谷神一号轨道姿态控制动力系统“边境”第二次可靠性试验运载火箭性生长试运行期间,点火正常,正时正确,受压分离正常,火焰明亮,试验后结构完整,性能指标和可靠性满足总体技术要求。 “边境”轨道姿态控制动力系统由银河动力航天公司自主研

    06-17

  • 收购杜邦相关业务后,SK Siltron将在美国扩大SiC晶圆生产

    收购杜邦相关业务后,SK Siltron将在美国扩大SiC晶圆生产

    韩国半导体硅晶圆供应商SSK Siltron计划投资3亿美元在美国密歇根州奥本建厂,并雇用3名员工供应更多 SiC 晶圆。 SKSiltron目前是全球第五大硅片制造商。 去年3月收购了杜邦公司的SiC晶圆业务。 当时,SKSiltron决定直接使用后者位于密歇根州的工厂。 据BusinessKorea报道,SK

    06-08