文本、图像、音视频等海量的非结构化数据占数据总量不断上升,预计2025年,将达到八成以上。这些数据由于结构不统一,所以在计算机中通常以向量形式进行特征提取后,再进行存储、计算、应用。为了解决海量数据场景下,向量的存储、计算问题,向量数据库应运而生,其通过数据算法和计算机工程,将向量特征进行分组和索引,以实现高效的相似性搜索。《数据库发展研究报告(2023年)》显示,向量数据库作为12个数据库技术发展趋势之一,其使用场景十分广泛,包括但不限于支撑文本翻译、产品推荐、语义搜索、图像搜索、视频推荐、异常检测、欺诈检测、人脸识别等应用。
近日,在中国信通院首批“可信数据库”向量数据库产品测试中,杭州联汇科技股份有限公司(简称:联汇科技)iBase向量数据库顺利高分通过向量数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性 、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。
《向量数据库技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)和中国信通院数据库应用创新实验室(CAICT DBL),联合超过50家企业专家参与编制的技术标准,联汇科技为核心参编单位之一。其包含基本功能、运维管理、安全性 、兼容性、扩展性、高可用以及工具生态七大能力域共47个测试项,其中分为27个必选项和20个可选项。作为业内首个向量数据库技术标准,可为向量数据库的研发、测试以及选型提供参考。

《向量数据库技术要求》标准框架图
iBase向量数据库产品简介
iBase向量数据库是联汇科技自主研发的向量数据库,实现音视图文多模态数据全量解析,高效存储,跨模态搜索,满足各类客户的多模态数据分析运算和检索的需求。

iBase向量数据库基于智能算法提取需存储内容的特征,使用AI深度学习模型和自监督学习技术,对文本、图片、音频和视频等非结构化数据进行特征提取,有效实现非结构化数据向量化存储,并通过向量化编辑器、向量索引加速技术(ANN)、向量聚类、向量降纬、数据聚类、异常分析等核心技术与算法,确保向量分析的全面性和检索的准确性,实现数据库的高性能检索、高性能分析。
iBase向量数据库拥有向量化引擎、向量检索、向量分析、可配置插件、GUI后台等核心功能,开发者可以最大化的自主发觉潜能。
iBase向量数据库核心功能
01支持丰富模态的向量化引擎
使用AI深度学习模型和自监督学习技术,对非结构化数据进行特征提取,转化为特征向量。包括:多语言文本向量化、图片和视频特征向量化、音频特征向量化、外部集成模型向量化。
02实现高性能向量检索
通过自主研发的向量索引加速技术(ANN),实现对于亿级别向量的秒级检索,有效支持高并发、大数据的向量应用场景。
03实现高性能向量分析
自身支持高效降维算法,在维持数据本身特征的同时,将高维度降成低维度向量,进行快捷的可视化。通过特征向量对数据进行有聚类、降维、识别和异常检测算法,从而对数据做进一步分析。
04灵活可配置且云原生
除了能作为向量数据库以及多模态检索引擎之外,iBase可以将各类先进的人工智能模型作为插件应用到实际开发中,支持各类例如语义分析、三维模型特征、智能推荐等功能,并支持云化部署。
05GUI 管理后台
iBase提供用户友好的搜索引擎管理服务,让开发和运维人员可以轻松管理所有索引,修改索引配置,监控系统状态和异常和调试引擎API。