橙色云资讯 - 工业互联网行业信息门户

10亿级向量检索能力！面向大模型，腾讯云重新定义了AI Native向量数据库

全景物联 2023-07-05

3030 字丨阅读本文需 8 分钟

7月4日，腾讯云正式发布AI 原生（AI Native）向量数据库Tencent Cloud VectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景，是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

向量数据库专门用于存储和查询向量数据，业界称之为大模型的“海马体”。据介绍，腾讯云向量数据库最高支持10亿级向量检索规模，延迟控制在毫秒级，相比传统单机插件式数据库检索规模提升10倍，同时具备百万级每秒查询（QPS）的峰值能力。

大模型正在重塑产业。但想要真正拥抱大模型，仍然面临很多现实问题：如何高效率、低成本地处理数据？模型数据如何动态更新？私有数据如何安全地接入大模型？过往，承担数据组织的是传统关系型数据库。但它更适合用来应对结构化的数据。大模型和神经网络，更多面对的是海量的非结构化数据，比如文本、音频、视频、关系等。它们有一种专门的处理方式：“向量化”：想要按这种”脑回路“组织数据，需要一个专门的数据库——向量数据库。把复杂的非结构化数据通过向量化（embedding），处理统一成多维空间里的坐标值，通过计算向量之间的相似度或距离，快速定位最相关的近似值。

什么是向量数据库？

向量数据库是一种特殊的数据库，它专门用于存储和管理向量数据。向量数据是指由多个数值组成的数据，这些数值通常表示某种特征或属性。例如，一张图片可以表示为一个由像素值组成的向量，一个文本可以表示为一个由单词频率组成的向量。

向量数据库的主要特点是能够高效地存储和查询大规模的向量数据。它通常采用基于向量相似度的查询方式，即根据向量之间的相似度来检索数据。这种查询方式可以用于各种应用场景，例如图像搜索、音乐推荐、文本分类等。向量数据库的实现方式有很多种，其中比较常见的是基于向量索引的方法。这种方法将向量数据映射到一个高维空间中，并在这个空间中构建索引结构，以支持高效的相似度查询。常见的向量索引结构包括KD树、球树、LSH等。

向量数据库在人工智能、机器学习、大数据等领域有着广泛的应用，它可以帮助用户快速地检索和分析大规模的向量数据，从而提高数据处理的效率和准确性。向量数据库与传统数据库的区别主要在以下几个方面：

数据类型：向量数据库专门用于存储和管理向量数据，而传统数据库则可以存储各种类型的数据，例如文本、数字、日期等。存储方式：向量数据库通常采用基于向量索引的存储方式，将向量数据映射到高维空间中，并在这个空间中构建索引结构，以支持高效的相似度查询。而传统数据库则采用关系型模型或其他存储方式。查询方式：向量数据库的查询方式通常是基于向量相似度的查询，即根据向量之间的相似度来检索数据。而传统数据库则采用SQL等查询语言进行查询。应用场景：向量数据库主要应用于人工智能、机器学习、大数据等领域，例如图像搜索、音乐推荐、文本分类等。而传统数据库则广泛应用于各种企业应用、网站应用等。

人工智能和向量数据库是密切相关的。在人工智能领域中，向量数据库通常用于存储和查询各种类型的向量数据，例如图像特征向量、文本向量、音频向量等。通过将这些向量数据存储在向量数据库中，可以方便地进行各种类型的相似度搜索和推荐系统的构建。在推荐系统中，向量数据库也可以用于存储用户和物品的向量表示，并且可以通过相似度搜索来推荐相似的物品给用户。

腾讯云定义AI Native向量数据库

大模型时代的到来，拥抱大模型成为企业的刚需。

向量数据库通过把数据向量化然后进行存储和查询，可以极大地提升效率和降低成本。它能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题，突破大模型在时间和空间上的限制，加速大模型落地行业场景。统计显示，将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现10倍效率的提升，如果将向量数据库作为外部知识库用于模型推理，则可以将成本降低2-4个数量级。

值得关注的是，腾讯云重新定义了AI Native的开发范式，提供了接入层、计算层、存储层的全面AI化解决方案，使用户在使用向量数据库的全生命周期，都能应用到AI能力。具体而言，在接入层，腾讯云向量数据库支持自然语言文本的输入，同时采用“标量+向量”的查询方式，支持全内存索引，最高支持每秒百万的查询量（QPS）；在计算层，AI Native开发范式能实现全量数据AI计算，一站式解决企业在搭建私域知识库时的文本切分（segment）、向量化（embedding）等难题；在存储层，腾讯云向量数据库支持数据智能存储分布，助力企业存储成本降低50%。

企业原先接入一个大模型需要花1个月左右时间，使用腾讯云向量数据库后，3天时间即可完成，极大降低了企业的接入成本。

据了解，腾讯云向量数据库的向量化能力（embedding）曾多次获得权威机构认可，2021年曾登顶MS MARCO榜单、相关成果已发表于NLP顶会ACL。腾讯云数据库副总经理罗云表示，AI Native（AI原生）时代已经到来，“向量数据库+大模型+数据”，三者将产生“飞轮效应”，共同助力企业步入AI Native（AI原生）时代。

腾讯云向量数据库保持优势领先

需求在前，不少新兴向量数据库的面孔也随之出现。对比同业，腾讯云强调，自身的向量数据库在腾讯业务内长期打磨，不仅性能稳定，还具备AI Native特点。

具体来说，Tencent Cloud VectorDB提供了接入层、计算层、存储层的AI化解决方案，使用户使用向量数据库的全过程都能应用到AI能力。罗云进一步介绍，Tencent Cloud VectorDB可以在接入层使用自然语言查询，在计算层的算法和存储层的索引上同样叠加AI能力，不仅让交互更自然，计算结果、效率、成本也能一并得到优化。

腾讯云数据库副总经理罗云表示，不久后向量数据库的比拼会按阶段体现在三个维度上：首先在第一阶段：厂商需要把产品打磨成一个真正的向量数据库，提供向量存储、检索、扩容等功能。这一能力腾讯早已具备。在第二阶段：单QPS的成本成为指标。对此罗云表示，腾讯云的向量数据库基于腾讯集团每日处理千亿次检索的向量引擎（OLAMA），经腾讯内部腾讯视频、QQ浏览器、QQ音乐等多个业务“检验”，持续为各类业务需求调优性能，具备先发优势。在第三阶段：数据库使用的便捷性成为关键点。罗云解释，当前客户使用向量数据库的流程较多，而腾讯可以通过AI的方式，整体打包这类能力，提升易用性。

罗云表示，第三阶段，也就是经AI加持的"易用性"能力是腾讯近期打磨的重点。从效果上，企业原先接入一个大模型需要花1个月左右时间，而现在使用叠加了AI能力的腾讯云向量数据库只需要3天。"AI时代，向量数据库也可以受益于AI。"罗云总结。

效率提升10倍助力用户体验

腾讯云向量数据库基于腾讯集团每日处理千亿次检索的向量引擎（OLAMA），经过腾讯内部海量场景的实践，数据接入AI的效率也比传统方案提升10倍，运行稳定性高达99.99%，目前已经应用在了腾讯视频、QQ浏览器、QQ音乐等30多款国民级产品中。

腾讯云向量数据库能有效助力产品提升运营效率。数据显示，使用腾讯云向量数据库后，QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。以腾讯视频的应用为例，视频库中的图片、音频、标题文本等内容使用腾讯云向量数据库，月均完成的检索和计算量高达200亿次，有效满足了版权保护、原创识别、相似性检索等场景需求。

大模型加速向量数据库进入飞速发展期，据东北证券预测，到 2030 年，全球向量数据库市场规模有望达到 500 亿美元，国内向量数据库市场规模有望超过600亿人民币。向量数据库可以帮助企业更高效、便捷地使用大模型，将数据的价值充分释放，随着大模型的不断发展和普及，AI Native向量数据库将成为企业数据处理的标配。

向量数据库是一种新兴的数据库技术，随着人工智能、机器学习、大数据等领域的快速发展，向量数据库的应用前景非常广阔。以下是向量数据库未来预期的几个方面：

应用领域扩展：目前向量数据库主要应用于图像搜索、音乐推荐、文本分类等领域，未来随着技术的发展，向量数据库的应用领域将会进一步扩展，例如语音识别、自然语言处理、智能推荐等；性能提升：向量数据库的性能是其最大的优势之一，未来随着技术的不断提升，向量数据库的性能将会进一步提升，例如更快的查询速度、更高的并发处理能力等；数据安全：随着数据泄露和隐私泄露事件的不断发生，数据安全成为了一个非常重要的问题。未来向量数据库将会更加注重数据安全，例如加强数据加密、访问控制等方面的技术应用；云化趋势：随着云计算技术的不断发展，向量数据库也将会趋向云化，例如将向量数据库部署在云端，提供云服务等。

文章来源：红星新闻，红都财经，36氪

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：全景物联

0 0

参与评论

登录后参与讨论 0/1000

10亿级向量检索能力！面向大模型，腾讯云重新定义了AI Native向量数据库

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

10亿级向量检索能力！面向大模型，腾讯云重新定义了AI Native向量数据库

参与评论

为你推荐

天玑8000加持！Redmi Note 12系列入网：首次搭载旗舰级芯片

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

半年融资827亿，1.2万字看懂新能源汽车产业图谱

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(3月第三周) | 工信部将开展汽车软件在线升级管理试点；湖南发布智能网联汽车产业“十四五”规划

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

中国智慧城市“药方”如何化解海外城市治理症结？

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

RISC-V只适用于嵌入式芯片？以IoT为立足点，RISC-V正在“征服”整个半导体世界

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

国产CIS开始向2亿像素时代迈进，巨头垄断格局或将被打破

国产屏厂TCL华星要打入苹果供应链：为iPad、MacBook出货LCD

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

Nreal国内首发AR眼镜，消费级AR眼镜潮即将爆发，VR/AR产业链开启“卡位战”

研究人员研发仿生二合一纳米电子传感器，可同时测量细胞电气和机械反应

国家电投与阿里巴巴宣布战略合作，数字化转型这条路上，央企各显神通

新材料七国的竞争版图：热门行业分布大集锦，未来10年的市场机会或许在这

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

SiC迎来“奇点时刻”，盘点近期产能、需求量、交易等行业大事件

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

从工业机器人产业链看智能制造机会

最新总结：冬奥会的100个创业机会

后疫情时代，OTA如何回血

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总