搜索引擎未来的趋势 (搜索引擎现有的挑战与未来趋势)

不知道大家注意到没有,我们每次使用搜索引擎检索文字类信息时,在搜索框的下方会出现一行小字,显示有多少个网页及其中的内容与我们需要的信息相匹配,令人感叹文字与网页信息海洋之浩瀚。

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

在关键词“hello, world”搜索中,就有相关结果约60,200,000个(6020万个)

文字信息有搜索引擎,那么,时间与空间维度下的“人、车、地、物”,是否需要引擎进行搜索呢?

试想如下一些情景——

  • 如果你是一位刑警,正在追踪一位歹徒的行踪,如何在茫茫人海中锁定他的踪迹?
  • 如果你是一位生态保护者,如何从20年积累的海量环境采样资料中,搜索提取某地、某几年的数据进行对比分析?
  • 如果你是一位制造企业的设备经理,怎样从成千上万的设备中,找出特定时间下那一台具有轻微偏差的设备?
  • 如果你是一位旅行爱好者,要怎么从地图和海量社交媒体信息中,整合出一个最符合你兴趣的直观旅行攻略?

...

是的,茫茫 “时空” 信息海洋,也需要搜索引擎。

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

时空搜索,如同《X战警》中X教授的独特能力:能够感知到全球范围内变种人的所在、以及处于何种状态,快速找到他们。

无论面对的是何种类型的信息,根据人们的需求,在海量数据中快速找到精准对应的信息,并且锚定、掌握这些信息, 是人们在信息世界中的基本需求, 这与人类搜寻回忆的机制非常相似。所以,搜索引擎公司如百度、谷歌等,在信息世界所占的权重和价值也是头部位置,因为他们满足了这种基础“刚需”。

时空数据也一样。 实现时空大数据的快速检索查询、精准定位,是拥有这些数据后,真正将这些数据应用起来、实现价值的基础环节之一。

那么,时空搜索到底怎么用?

从“时空”字面上来看,非常好理解,从 时间和空间 这两个维度入手,对信息进行提取。

但除了“时间+空间”这两个搜索维度之外,时空还暗含有一种近乎无限的维度,那就是 属性,即附着在时空数据上的“标签”信息, 如输出数据的设备编号、人物信息与社会属性等。从这一层面来看,这个维度是能够产生无限延伸的,扩展开来说,有人物的年龄职业、车辆的颜色品牌、手机的型号定价等无数分类与特征。

“时间+空间+属性” 这三者无限维度的时空搜索中,我们能找到哪些有益的应用场景呢?

让我们回到开头的那几个场景中——

场景一

警方已经得到目击报告,逃跑的嫌疑人上了一辆“某A 12XX5”牌照的出租车,但是这个城市车辆如潮,每天产生的数据就有数亿,2-3个月就能积累起上千亿。但歹徒上了车,不知情的出租车司机也会有危险,如何从千亿条轨迹数据中,快速锁定这辆出租车的实时动态?

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

警方通过对“车牌”(数据标签)与“时间”双重维度的复合查询,就能从数百亿条轨迹信息中,毫秒级调取特定出租车的位置与动向,及时通知附近警力,进行追踪抓捕;如果警方并不确定出租车车牌,仅知晓嫌疑人上车的大致范围,也能通过任意框选地图区域,筛查途经出租车,结合视频研判锁定具体车辆。

注:以上展示为数据模拟真实环境,如有雷同,纯属巧合。

场景二

某地生态环保部门的老王,想从当地已经积累了20年的卫星影像、生态环保数据着手,查找其中某几年的数据进行对比,寻找解决当地生态保护问题的关键点。但是高达数百PB的卫星数据、不同设备采集的多类型生态数据,又如何进行综合检索比对呢?

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

通过超擎影像云平台,老王能够查询、调取任意时态下的遥感影像,并对多年份下当地的建筑物、地形变迁进行多时相对比,找到当地生态问题的关键数据依据;并通过“遥感影像、矢量地图、物联网等多源数据”+“图表、照片、视频等组件”的综合应用,追踪当地野生动物分布、水质环境变化,得到更多精准数据,科学制定环保解决方案。

场景三

设备经理小赵,从上星期就发现管辖车间中有一台设备产出效率不稳定,但是这台设备是从何时开始有轻微偏差?如何从上千百台设备中调取这台设备的历史数据?

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

在超擎物联网云平台中,小赵只需输入相应的设备编号,便可从上万台设备中即时调取该设备的历史数据,并通过流数据分析,找出该设备生产效率不规律的关键所在;同样,小赵也能通过设备数据的实时监控预警,锁定故障设备位置,进行维修检测。

场景四

旅行者小A,正在为网红城市重庆10天旅行做攻略,他知道包括近期上映的《少年的你》在内,还有不少电影都是以这座城市为背景拍摄的,他想看到普通地图上所不能看到的信息。那么,如何让小A在地图上一键搜索,找到这座城市中所有经典电影场景的地理位置与故事?

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

搜索百度、各大社交媒体、资讯平台,小A找到了很多关于《少年的你》以及重庆电影拍摄场景的图文视频资讯,但整合成直观的旅行路线非常费力;而直接搜索普通地图,又无法扩展如此丰富的信息。怎样将两者结合呢?小A找到了箩筐APP,它基于超擎独有的矢量非切片地图技术,打造了基于时空整合新闻资讯、社交信息的地图社交平台,让用户小A通过地图的全文查询与语义检索功能,一键搜索,探寻到了普通地图无法呈现的重庆深度故事,并串联成直观的旅行足迹,分享给他的旅行伙伴。

以上四个案例虽然只是时空搜索应用中的沧海一粟,但能够让我们深切地感受到,时空数据虽然庞大而高深,但时空搜索与人们的生活息息相关,它在用户需求与海量数据池之间,建立了一条精准而快捷的路径,帮助人们透过浩瀚的时空挖掘蕴藏在深处的价值。

所以,时空数据引擎有两面:

一面是海纳百川,一面是海底捞针;

一面是吞吐,一面是搜索。

但能对这两点兼容并包并不容易。

超擎在即将全新登场的面向遥感影像、矢量地图与时空动态数据的云平台与数据库中,就利用 超擎独有的核心索引云技术 强化了产品的这两种能力,不仅以最佳实践全面支持以上应用场景中的海量包容与极速检索能力,更能覆盖更广维度的复合属性检索:

超擎影像云平台

超擎新一代影像云平台,支持用户从 百PB级 的影像数据中,依据地名地址、行政区划,以及时间属性进行快速的复合查询,帮助用户实时定位数据;并提供目标监测、地物识别、变化监测、图斑识别等影像智能分析功能,辅助时空数据综合分析。

针对具有专业影像检索要求的行业用户,超擎影像云平台还提供了 基于时间、区域、卫星、产品等多条件、多维度的强大智能检索功能。

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

擎影像云平台支持用户基于时间与空间的维度,快速查询、定位、呈现海量影像中所需区域的时态样貌;并通过 AI影像智能自动检测 功能,快速呈现指定区域内的建筑物、水体等多类型目标物。

注:以上案例展现了通过超擎影像云平台,用户可实时在手机中查询2018年时态下的北京影像,并能任意框选区域,自动检测其中水体区域(黄色部分)。

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

对于同一时间、同一区域的影像,平台支持用户在线对产生的数据源(即卫星类别型号)进行自由筛选,以确保用户可选择最为适合应用场景的数据样式与类型。

超擎地图云平台

在面向广大开发者、行业应用者的全新超擎地图云产品中,用户不仅能根据 “时间”+“空间” 进行复合查询,还能基于更为复杂的多维 “数据标签” 进行交互查询、筛选与分析;在此基础上,平台还提供了空间分析、缓冲区分析、路径规划、属性统计等智能分析功能,辅助时空数据综合分析;提供热力图、聚合图、流体场、迁徙图等进行快速的可视化分析应用。

智能搜索方面,超擎地图云支持按需搜索;框选检索;关键字搜索/周边搜索/多边形搜索;输入联想提示;正/逆地理编码等多种灵活的搜索方式。

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

在查询性能上,经实际测试, 在同等百亿数据环境下,超擎查询时间在10秒以内,传统技术则超过3分钟。

SuperScylla 时空数据库

由超擎自主研发的,面向时空动态数据的下一代分布式NoSQL数据库——SuperScylla, 实时时空动态数据吞吐量为同类产品的4倍,延时时间仅为同类产品的1/4,时空数据写入、查询效率是同类产品的10倍。

而对于时空查询应用的构建,SuperScylla也支持开发者只运用几行代码,即可实现从数亿条时空轨迹中,快速精准返回某条轨迹的能力。

搜索引擎未来之路,搜索引擎现有的挑战与未来趋势

应用样例:查询某段时间内,车牌号为A123456的轨迹(查询字段为vid+tick)

时空搜索是否会让人类进化出像《X战警》中X教授的超凡能力还未可知,但能肯定的是,时空数据检索是对海量信息筛选、抽取、匹配、分析的第一步,也是重要的一步,在彼端,它还连接着时空智能。

如何强化这座桥梁,走好通向未来的另一端,也正是超擎正在努力的方向。

超擎将基于时空索引云技术,继续强化时空引擎的检索能力,以专业的时空服务赋能所有时空数据拥有者,使其能够更加专注与深入自身业务。同时,也让所有用户透过时空看到的,不再是茫茫的数据之海,而是美好的城市村庄、自然与人。