如果说大数据是新的石油,那么社交网络的数据则是人人唾手可及,但是却未必知道怎么使用的石油。

我们每人每天都会在社交网络上产生大量的数据,在买东西的时候,在出行搭乘交通工具的时候,在外出吃饭的时候等等。这些数据的收集,能够帮助我们加强对人群的行为理解,并且做出分析和预测。从而解决一些我们关心的社会科学问题。
在十年前,想处理这样大量的数据还需要很强大的计算机科学技术。所以,这样的技术只存在于科幻电影里。在2002年由汤姆·克鲁斯Tom Cruise主演的电影《少数派报告》里面,就展示了社交媒体数据的强大:警方可以通过社交数据的监测和分析,预测出潜在的犯罪行为,从而在犯罪被实施之前,就抓捕嫌疑人,保护未来的受害者。下面是当年电影公开的预告片,可以体验一下。
视频加载中...
(版权所有属于原电影)
但是随着大数据,人工智能,机器学习,语义分析等技术的提升和发展,分析社交网络的数据已经发展到很成熟,是可以用在商业中,分析潜在消费者的需求,观察产业趋势,以及监测和处理危机等等。
所以,接下来,我会用几期来分享一下什么是社交网络分析,以及如何利用它来增长生意。这次我们先来看一下社交网络的相关概念。
什么是社交网络分析?
有一门专门的学科研究社交网络叫做 Computational Social Science。 它结合了计算机科学,统计学和社会科学三个主要的领域,通过收集社交网络上面的人群特征,行为和相互之间的联系,来分析人群的活动和关系。
在社交网络分析中,使用到的主要有大数据,机器学习,语义分析以及模拟等技术。 一般来讲,社交网络具有本地化特征,不同国家和地区的社交网络发展状态很不同,所以一般分析社交媒体,都需要分析人员对社交网络平台有相当程度的熟悉。
什么是网络?
如果把自己作为一个点,把和自己相关的家人,男/女朋友,同事等等人物用线和自己连接起来,就组成了一个以自己为中心的网络。社交网络就是这样有无数的节点,无数条关系线的网络结构。这里,我们看到,一个网络具有三个组成部分: 节点,关系线,属性。

什么是节点?
节点的划分不要局限于上面的例子,节点除了个人,还可以是产品,公司,产业,地区,国家等等。
在网络结构中,距离近的节点一般都具有一定的同质性。比如你和你的家人一定和另一个国家地区的陌生人相比,有着更多共同的喜好。我们在社交网络中,也一般会接触和自己相似的人。这种同质性的存在,可以让我们将社交网络上面的大量节点进行归类和总结。这就是所谓的人以群分。
什么是社交网络的属性?
我们上面提到的节点,一般都是独立唯一的个体。比如世界上一定只有一个你,没有其他人可以共享“你”这个节点。所以独有的唯一的食物,我们在网络中都会放成是节点。
而一些特征,比如喜爱旅行,却是很多人都可以共享的特点。那么这种会重合,可以被多个节点共享的就是网络的属性。知道这个的作用是,我们可以将属性分类,找到同属于这个属性里面的人群,就可以做到人以群分。
什么是关系线?
关系线很好理解,无非就是代表一个网络里面的节点之间有关联。但是要注意的是,在分析社交网络的时候,除了看两个节点之间有没有关系线之外,还要分析关系线的强弱。比如你和家人之间的关系线是强关系线。你和一年见一次的朋友之间就是相对弱的关系线。关系线的强弱会决定一个网络中节点之间的影响程度。例如那个:我们总是容易伤害和自己最亲近的人的一样道理。
那如果是把产品或者事物当成节点,节点之间的关系线就可能代表共同被使用/提及的可能,或者相关顺序。例如,在社交网络中,大家如果提到洗发水,更可能被一起提及的是护发素,而不是自行车。
但是这里可能出现的有趣的例外是,如果通过分析数据,发现本不应该存在强关系的两个事物却出现了强关系线,就是意味着有趣的洞察要出现了。比如那个经典数据分析例子:啤酒和尿布之间存在强关系,找出的洞察是老公们在超市里接受老婆的“指令”买尿布的时候,都会顺便买啤酒。那么超市应该做的就是把啤酒和尿布放在一起卖。
本文就先分享了一些社交网络的基本概念,接下来会分享更多后续进一步的知识。