有时会跟朋友聊一聊 AI 的话题,我发现很多人对 AI 都有过度高估或者过度低估的情况。有些问题根本不需要用 AI,有些问题即使用 AI 也解决不了。
所以打算写一个系列,从各个角度来评估一个问题:“要不要用 AI ?AI 能否解决我的问题?”
我的业务适合用 AI 吗?
很多人都想知道 Al 能给业务带来什么好处。但是这个问题很难回答。
我们倒不如针对具体问题来看看 AI 是否能解决它。这样的问题更容易得到明确的答案,也更加实用。
下面问题的YES越多,越适合用 Al:
我遇到的问题表现出来的特征很多吗?
这些特征是否具有很强的不确定性?
这个问题相关因素的数据可以获取吗?
能够获取的数据够全面吗?关键因素的数据可以获取吗?
能获取的数据量大吗?当业务遇到问题时,有反馈数据吗?
反馈数据可以跟其他数据形成闭环吗?
是否不需要解释背后的原因呢?◎ 这个问题允许出错吗?
评估角度:特征?
拿我們日常生活的猫狗来说,我们通常教小孩子区分猫狗时候,通常会按照猫狗的特征去描绘他们的不同点,比如 毛发,体型,声音等等,当我们那这些特征一一比对时,那么我们就能判断他们种类了,因为这特征太强了,或者说太有说服力了。
特征象限图
但是并非所有问题都需要 AI 来解决,AI 的优势是可以处理海量的特征,不但可以处理表面的特征,还能找到背后隐藏的特征。但是很多情况下,没必要用大炮打蚊子。
当我们把特征数量和确定性画一个坐标,就能指导我们什么问题适合用 AI,什么问题不适合用:

特征象限图
特征少+确定性弱:适合人工解决
特征少+确定性强:适合规则解决
特征多+确定性强:适合规则解决
特征多+确定性弱:「可以考虑」 AI 解决
PS:这里其实还有很多其他因素:成本、风险、是否可测量…这里统统不考虑,不然太复杂了。
案例说明
上面的象限太抽象了,下面举一个真实的案例来说明。
游戏行业有一种东西叫「外挂」,简单说外挂就是作弊器,打破了游戏的公平,让自己在游戏里更有优势。
几乎所有知名的游戏都有外挂,因为外挂很赚钱!所以游戏厂商必须要做好跟外挂战斗的准备。打击外挂的方式大部分情况都简单粗暴,但很有效:严惩不贷!一旦发现账号使用外挂,就会封号处理。
所以打击外挂最关键的是:第一时间发现玩家使用外挂。
我有一个朋友负责一款知名的格斗手游,他们也有很多外挂,一开始他们使用了一些固定的规则来发现外挂。效果还不错,但是还是会有漏网之鱼。
于是他们尝试使用 AI 来抓外挂,做了很长时间后,发现效果并不比固定规则好多少。
同样是打击外挂,在一些复杂度高,灵活度高的游戏里(例如吃鸡、CS),规则就不好使了,因为很难总结出来固定的规则。
这个时候 AI 就能大显身手了。CS:GO 和吃鸡都有比较成功的案例了:
应用特征象限:
手机上的格斗游戏,自由度并不高,玩家只能控制移动、攻击、技能、闪避,这4种核心操作。策略性并没有太强,所以大致上符合「花钱+花时间≈实力」的逻辑。
所以只需要把握一个原则:玩家是否做了远超自己实力的事情?
通过观察玩家的战斗力,敌人难度,战斗时间等方式就可以比较有效的判断玩家是否使用了外挂。对于这种人都能与有效判断的问题,不需要使用 AI,反而会把解决方案搞复杂。

手游特征象限图
先让我们来看看吃鸡都有哪些奇葩的外挂:《吃鸡外挂大全,让你一秒识破对方直接举报!》
对于CS:GO、吃鸡这种射击类游戏,场景十分复杂(地图大,有房间,有遮挡物…)
玩家的行为也很复杂(移动、判断敌人位置、找掩护、切换*器武**、瞄准、射击…)
在这种情况下,很难用明确的规则来判断玩家是否使用了外挂。你不能说反应快就算使用了透视外挂,有些人反应就是快;你也不能说爆头多了就用了锁头挂,有些人枪法就是准。
所以想要发现这些外挂,就需要分析大量的数据,从中间找出「不那么明显的特征」,这时候 AI 就有其特殊的价值了。

射击象限图
总结
今天我们从「特征」角度说明了哪些问题适合用 AI,哪些问题不适合用。
如果一句话来概括的话就是:
能够有效归纳出一些规则的问题,都不太需要 AI,而那些很难总结归纳出规则的问题可以考虑使用 AI 来解决。
如果想要评估可以套用下面的特征象限来看看你的问题是否适合使用 AI技术:

特征象限图
底层逻辑:数据驱动
「基于数据」的方法简单说就是:从海量数据中找规律,这些规律是很抽象的,并不能总结成具象的规则。比如:
● 给机器看海量的猫和狗的照片,它就具备了「区分猫和狗」的能力
● 给机器海量的中英文对照文章,它就具备了「中英文翻译」的能力
● 给机器海量的文章,它甚至可以具备「写文章」的能力
基于数据的好处是:只要有足够多的优质数据,那么机器就能学会某些技能,数据越多,能力越强。
但是基于数据的方法也有明显的弊端:机器只能告诉你「是什么」,但是无法告诉你「为什么」。
没有数据,就无从基于数据。所以想要用人工智能,需要考虑业务场景的数据3要素:
1. 数据可获取
2. 数据全面
3. 数据多
他们3个类似金字塔的结构,先有「数据可获取」再谈「数据全面」,有了「数据全面」再谈「数据多」。

数据3要素
案例分析
假如你是游戏公司的老板,想利用人工智能技术提升游戏的收入,从数据角度评估一下是否可行?
电商平台通过推荐算法可以让购物者花更多钱,那么在游戏里结合推荐算法,理论上也可以让玩家花更多的钱。
推荐算法的本质是:挖掘用户需求,将匹配需求的商品推荐给用户。
应用到游戏里则是:挖掘用户的需求和他的消费能力,将匹配需求的道具,以合适的价格推荐给用户。

案例剖析
第一步:数据是否可获取?
游戏算是数字化程度很高的领域了,但即便如此,还是有部分因素并没有数据化。比如:
● 一些游戏玩家都会在微信群里聊天和互动,这部分数据游戏是没有的
● 老婆发现老公在游戏里泡妞,被迫卸载了游戏。这种游戏外发生的事情有时候也会影响到游戏内。
● 玩家的心理活动也是没有数据的(这次活动打折好厉害,但是我要忍住!不然又要吃一星期泡面了~)
够不够用呢?下一步全面性的时候再分析。
「数据可获取」看似是一个很白痴的问题,但是很多行业的数字化程度非常低,这个问题对于他们来说并不简单。
第二步:数据全面性是否够用?
想要判断玩家的需求和消费能力,大致有下面一些影响因素:
1. 用户属性
a. 玩家属性(年龄、性别、地理位置…)
b. 角色属性(等级、装备情况、剩余钻石数量…)
2. 行为数据
a. 游戏行为(买过什么东西、参与过什么玩法、打过什么副本…)
b. 消费行为(活动页面停留时长、买过什么东西、花过多少钱…)
c. 玩家互动(跟谁组过队、跟谁打过架、跟谁参加过活动…)
d. 聊天数据(跟谁、说过什么话、游戏内+游戏外)
e. 心理活动(想要什么、喜欢什么、觉得多收钱值…)
3. 商品属性
a. 商品价格
b. 商品作用
c. 商品特点
d. 购买条件

电商数据
还是参考电商的经验,亚马逊、阿里巴巴都已经验证过:
在缺失「聊天数据」「心理活动数据」「电商平台外数据」的情况下,依然能有效的挖掘出用户需求,刺激消费。
而游戏不但有推荐的权利,还有定价权,可以通过降价进一步的刺激消费。所以全面性角度是 OK 的。
PS:所以在全面性的评估上,不需要理论上 100% 全面,而是达到可用的程度即可,这个事前只能找案例参考。
第三步:数据够不够多?
推荐系统是一种特殊性的情况,他对数据量的要求很有弹性,在数据量少的事情有很多手段来解决冷启动的问题。随着数据量的增多,算法的作用逐步加大。
一个新用户*载下**了淘宝,依然不妨碍推荐,只不过用的越多推荐的越靠谱一些而已。
PS:在评估数据是否足够时,尽量找经验丰富的技术咨询一下。
所以,经过3个数据角度的评估,「通过推荐算法提升游戏收入」的设想应该是可行的。
总结
评估能不能用人工智能技术时,「数据」可以说是最重要的一个维度。
具体评估时,想清楚下面3个问题:
1. 数据可获取吗?
2. 数据全面吗?
3. 数据多吗?
3个问题需要同时满足,才算是「貌似可行」。