背景
最近总有人问我一些常用的数据统计和分析方面的计算,原因是对于非统计和计算机专业的人士来说,专业的python、spss和eviews等编程语言和软件的学习和使用成本太高,所以我选了几个常用的需求打包了个小工具,这样我就可以偷懒去了!
需求:
- pearson相关系数计算
- kendall相关系数计算
- spearman相关系数计算
- 在线线性回归拟合
- 基本的求和、求平均、求方差、求标准差等操作
- 文章关键词提取并生成词云图
我简单构建了个网站,可以帮助相关需求者在线使用以上的数据统计与分析
基本统计
使用主要就分三步:打开网站->导入数据->一键分析
下面是详细的教程:
1.打开工具
首先打开网址小锄头数据分析-最简单的个人数据分析与挖掘工具
然后导入你的excel数据,即可生成一个数据预览效果,需要说明的是:
- excel中不要包含多余的数据列
- 格式:第一行为标题(将作为变量名称),其余的都为数据样本,数据样本为数字
- 数据样本中尽可能不要出现非数字字符,否则无法进行和/平均值之类的计算

2.一键数据统计
导入数据以后点击:分析 ,即可进行相关统计,包括:
- 和值
- 平均值
- 最大值
- 最小值
- 方差
- 标准差
- 数据列是否属于正态分布
- person相关系数矩阵
- kendall相关系数矩阵
- spearman相关系数矩阵

在线线性回归
1.导入数据
和前面的步骤一样,先导入数据
线性回归中涉及自变量和因变量,请将音变量放在excel的最后一列,如下图:

2.一键回归
导入数据后点击分析即可进行自动拟合
拟合的结果中包括:
- 回归方程
- 拟合度R-square(确定系数):Coefficient of determination
- 相关变量的关系矩阵

文章关键词提取
复制文章内容,然后点击提取(这里在博客上复制了一篇博客进行提取)

总结
该工具目前包含的功能比较简单,如果你感兴趣或者有其他需求,可以在线提建议