搜索引擎算法的基本原理及局限性 (搜索引擎技术分析)

物联网条件下的终端连接能力极大提升,边缘存储能力、计算能力同步加强,这使得面向“服务”的局部网络生态系统日趋完善。2020年10月5日,英伟达发布最新芯片技术BlueField-2DPU,并将其用于扩展其边缘计算平台NVIDIA EGX Edge AI平台。全球各大行业都可从中获益,包括制造业、医疗保健、零售、物流、农业、电信、公共安全和媒体等,各行业可根据需求快速高效地大规模部署AI服务器。企业数据中心将被分散部署在不同位置,包括办公大楼、工厂、仓库、基站、学校、商店和银行等,而非集中部署在某一个中心地点,因此搜索引擎对于云端依赖性减弱。这将促进计算资源前置,直接助力物联网智能边缘的数据分析、管理与检索,对搜索领域格局产生深远影响。

搜索架构呈现去中心化特征

去中心化趋势不仅体现在技术架构上,在内容的传播方式上也有显现。目前大量自媒体内容,包括抖音、快手短视频等,逐渐出现由个人创作、个人发布、个人收看、个人点评的传播链条。这些内容已然成为互联网新闻资讯、视频传媒、文化学习等媒体的重要组成部分。而其中优质内容的传播,完全不需要中心化的专业传媒机构的支持就可以获得极大的阅读量以及广泛传播。内容的去中心化也代表了用户流量的去中心化,将会给基于“头部流量”的网红经济带来一定的改变,为数字营销领域提供新的发展契机。

从搜静态信息到搜即时服务

PC环境的搜索业务往往是为了获得大量信息来源,然后浏览所有的链接信息,选取最终所需。在物联网搜索场景中,用户更多的是通过随身终端感知周边的服务和基础设施,选择其中所需服务,诸如居家、购物、选餐、找人、找车等。例如在搜索引擎中输入“麦当劳”,PC端推荐的内容侧重于与麦当劳相关的百科知识、企业状态、产品特点等;而在移动终端,用户更大概率上是想搜索到附近的麦当劳门店和打折券进行消费。这种“所见即所得”的即时服务需求代表了物联网场景的典型特色。像百度推出的轻应用、微信打造的小程序等功能形态,都是通过一种更方便的方式满足人们在移动端的即时需求,从满足用户对文字信息的搜索需求升级为对即搜即用的“服务”需求。

基于物联网的“服务”还可表现为制造力。我国的智能制造产业正在经历从数字化到网络化再到智能化的过程[6],物联网和信息物理系统(CPS)最终将并轨连通,形成强大的制造力网络。制造者在物联网空间提交的海量功能与服务成为社会基础设施,个性化创意活动将得到激励和繁荣。人们按照个性化需求提交订单,并由场景中的服务设施即时生产出来。比如要定制一款个性服装,用户仅需提供描述说明即可由边缘计算服务器进行交互式设计,实时渲染3D模型。模型一旦确认,即可提交至服装流水线自动生产并快递给用户。这一变化使得物联网搜索引擎较之前具有全新的即时交付能力。

搜索引擎算法和数据分析,搜索引擎技术分析

从用户主动搜索到被动推送

传统的搜索引擎使用方式以用户主动发起输入搜索为主,而在移动端的信息获取方式日渐转变为用户的被动感知、接受推荐。随着人工智能技术的发展与应用,个性化推荐的精准度日渐提升,加强了用户黏性。这不仅适用于日常信息搜索,也适用于广告内容推送。抖音、快手、拼多多等APP能够异军突起,获得可观的DAU(DailyActiveUser,日活跃用户数量),其中一个重要原因就是其信息获取模式不再单纯地由用户主动发起搜索请求,而更多转变为机器分发,同时通过AI技术进行用户画像分析,实现信息内容的精准投放,大大扩大了用户群体以及用户对新闻资讯、商品广告等信息内容的接受空间。

数字孪生提供搜索新维度

地理信息领域的最新发展正在重构信息的数字空间。基于数字孪生的智慧城市将实现在网络空间对物理空间的现实城市的智能运控与管理,为城市交通、电力监测、公共卫生管理等能力均带来提升与突破。这一论断再次助力数字孪生概念的推广与应用。

数字孪生的一项关键操作是为所有信息打上空间位置标签。事实上,用户在物联网场景中的信息搜索需求具有极强的位置相关性。传统搜索引擎也尝试提供区域化搜索功能,但目前的区域化搜索更多的是通过获取所处经纬度位置信息,对结果进行距离排序。比如在使用百度搜索引擎搜索“停车场”的时候,百度可以根据距离远近将所有“停车场”进行排序。但数字孪生场景中的位置服务并不仅限于现有的定位功能。近几年,室内定位技术得到快速发展,基于Wi-Fi、蓝牙、UWB等无线信号的定位应用日渐成熟,使得位置服务能力从室外环境扩展至室内环境。以前例中的停车场搜索为例,相比之下,物联网搜索引擎可以搜索感知到具体的某一空车位,并通过数字孪生服务实现车位预定、引导和反向寻车等。

数字孪生空间的近场定位能力并不局限于为用户提供定位导航服务,还将为传统的LBS(基于位置的服务)带来新的变化与形态。首先,室内感知定位有助于搜索引擎对场景进行语义理解,进一步推理用户的搜索输入与场景之间的关系,完成精准服务筛选。如在电子城和写字楼这两个场景中搜索“打印”,搜索引擎应返回不同的服务内容,前者是推荐打印机售卖服务,后者更大概率是推荐打印店服务;其次,室内近场感知能力提供了社交属性的新维度,为商场、地铁、展会等近场条件下的社交沟通、信息互动创造了新模式,使得内容创作和传播在去中心化方向上有了更多推动力;在数字营销领域,通过对用户、群体的驻留、动线情况进行统计分析,有助于品牌商家进行流量获取与转化,最终用于提升搜索引擎的推送精准度。