
未来数据科学家实训研修班
招生简章

01机构简介
中国人民大学统计与大数据研究院是中国人民大学为建设“人民满意、世界一流”大学,迎接大数据时代的挑战而成立的教学科研实体。研究院以建设国际一流统计学和数据科学学科为目标,按照“高起点,高水平,入主流”的发展方针,开展学科前沿原创性研究,打造高水平多学科交叉的中外学术交流和人才培养平台,为政府和企业的决策提供高质量的智库服务。研究院下设数理统计、卫生与生物统计、计算统计、金融统计、应用统计、数据科学与人工智能等研究领域。
02招生对象
具备大学本科或相应学力,具有一定的高等数学基础,旨在从事数据科学相关工作,希望接受严谨、规范、系统化的数据科学课程训练的人员。
03课程描述
本课程以培养企业未来的数据科学家为目标,从数据科学的基础理论知识(概率及统计)出发,循序渐进学习常见数据分析工具(R、Python)及机器学习算法的实现与应用,并通过真实数据实战项目,帮助学员透彻理解机器学习背后的原理,提高数据分析背后的统计学直觉,提高实战应用能力,综合提升学员数据科学能力。
本课程利用周末上课,采取理论与实践相结合、课程讲授与自学相结合。提前发放课程大纲,规定必读及参考书目,并通过在线智能学习平台提供其他拓展课程。合理安排课后习题与数据项目实践,部分课程通过团队合作的形式完成,从数据科学出发,适当拓展数据工程及数据分析的知识,以助于学员在工作中更好地了解数据科学应用全流程。
04课程特色
1 、国际化
此次课程设置充分借鉴了国际先进经验,授课教师均有境外留学或工作经验,我们致力于培养国际化的数据科学人才。
2 、系统化
此次课程设置是对数据科学人才所必需的知识进行系统的学习,共五门课程,每门课程约32个课时,课程设置循序渐进,构建数据科学人才所必需的知识体系。
3 、实战化
此次研修班采用理论与实战相结合的方式进行,我们既有理论与案例相结合的知识讲授,又有专门的数据实战课程,利用真实数据和市场案例,培养和训练学员的实战动手能力,实战课程由中国人民大学统计与大数据研究院与著名大数据公司北京腾云天下科技有限公司(TalkingData)携手打造。
05课程收益
1、掌握统计学、数据科学及机器学习理论基础;
2、学会通过概论模型、统计推断进行数据分析与预测;学会选择合适的模型与分析方法,提取核心信息,制定数据化决策;
3、学会通过构建机器学习算法从非结构化数据中提取价值信息;掌握常见的监督学习与非监督学习算法,如聚类分析、深度神经网络等;
4、配备真实数据案例实训,通过数据实战,提升R、Python等主流分析工具的应用能力,掌握数据科学与算法的实践应用,提升数据处理及分析能力;
5、最终成绩合格的学员将获得中国人民大学课程结业证书。
06课程设置
1 、数据科学的概率基础:
常见概论模型介绍与应用
随机变量及其分布、均值、方差
贝叶斯理论
大数定律及其应用
随机过程
2 、数据科学的统计基础
矩估计及极大似然估计
置信区间与假设检验
拟合优度检验及模型选择
线性模型、非线性模型及广义线性模型
聚类分析
3 、社会科学中的数据分析方法
数据采集方法及对比评估
常见数据分析方法
统计学直觉
数据可视化及展示
使用R或python语言进行数据分析
4 、机器学习
常见机器学习问题
线性模型、神经网络、图模型等常见模型分析与应用
机器学习项目实践:训练、检验、调参及特征工程
5 、数据实战
综合利用课程中的数据科学知识,通过R或Python完成真实数据问题,包括但不限于商业场景中的营销、反欺诈等数据问题。
07证书授予及教学安排
【证书授予】
项目完成后,符合结业条件的学员,将由中国人民大学继续教育处统一颁发“中国人民大学未来数据科学家实训研修班”项目结业证书,加盖“中国人民大学继续教育证书专用章”,证书可登陆中国人民大学继续教育处人大培训网站及微信公众号查询(http://peixun.ruc.edu.cn/index.php)。
培训费: 28800/人,(包括证书、听课、课间茶点等费用。学习期间的食宿、交通费用自理)。
授课地点: 北京
名额:本期限招 40人,额满即止。
08报名咨询
联系电话:13161870020 联系人: 王老师
联系电话: 010—62510318 联系人:周老师
邮箱: isbdpx@ruc.edu.cn
网址:http://isbd.ruc.edu.cn/
地址:北京市海淀区中关村大街59号中国人民大学崇德西楼7层
师资介绍:
艾春荣
美国麻省理工学院经济学博士,师从2000年诺贝尔经济学奖获得者丹尼尔·麦克法登教授,美国计量经济学会会员,美国佛罗里达大学惠灵顿工商管理学院经济系终身教授。现任中国人民大学统计与大数据研究院教授、院长。教育部“长江学者”讲座教授。主要研究领域为计量经济学、实证微观经济学、实证金融、实证产业组织经济学等。已在《Econometrica》, 《International Economic Review》, 《Review of Economic and Statistics》, 《Journal of Econometrics》等经济学、金融学国际权威期刊上发表论文四十多篇,并在《经济研究》、《管理世界》等国内权威期刊上发表文章十多篇, 就中国数据保密问题, 如何扩大消费问题, 中国公司债券定价问题、中国卫生服务公平性问题、和中国经济结构变化等问题做出了有益的探索。
朱利平
华东师范大学博士,现任中国人民大学统计与大数据研究院教授、博导、副院长。美国宾州州立大学博士后,教育部新世纪优秀人才计划、中组部万人计划青年拔尖人才计划专家,获国家自然科学基金委“优秀青年基金”资助。 朱利平博士一直从事统计理论以及应用研究。主要从事高维数据分析中的变量选择、降维方法以及半参数回归模型的统计推断等研究工作。在《The Annals of Statistics》、《Journal of the American Statistical Association》、《Journal of the Royal Statistical Society, Series B》以及《Biometrika》等统计学国际权威期刊上发表论文60余篇。
郭绍俊
中国科学院数学与系统科学研究院博士,中国人民大学统计与大数据研究院副教授、博士生导师、院长助理。美国普林斯顿大学博士后,英国伦敦政治经济学院访问学者。主要研究领域为金融计量、统计学习及深度学习、大维统计计算等。曾在《Journal of the American Statistical Association》、《Journal of Royal Statistical Society, Series B》、《Biometrika》、《Journal of Econometrics》等国际统计学、经济学顶级期刊发表论文多篇。
江艇
香港科技大学商学院经济学博士,中国人民大学经济学院副教授,人大国家发展与战略研究院研究员,人大微观数据与实证方法研究中心副主任,美国哥伦比亚大学商学院访问学者。主要研究领域为经济增长与发展、城市经济学、新政治经济学,在Economics Letters、Review of Development Economics、《经济研究》、《管理世界》、《世界经济》等国内外著名学术刊物上发表多篇论文。曾应邀在多所高校讲授“应用微观计量经济学”短期前沿课程,学员反响热烈。
杭汉源
德国斯图加特大学统计学博士,中国人民大学统计与大数据研究院助理教授,博士生导师。曾在比利时鲁汶大学电子工程系从事博士后研究,主要致力于机器学习算法开发及应用。目前研究方向为(1)随机森林,支持向量机等机器学习算法及其在大规模并行计算上的应用;(2)深度学习算法包含基于注意的行人属性分析,架构搜索等网络算法的应用。截至目前,已有多篇高水平论文发表于《Journal of Machine Learning research》, 《Neural Computation》,《Annals of Statistics》等机器学习和统计学国际顶级期刊。
何珂俊
北京大学数学学士,美国纽约州立大学奥尔巴尼分校数学硕士,美国得克萨斯A&M大学统计学博士。现任中国人民大学统计与大数据研究院助理教授、博士生导师。研究方向包括非参数模型降维和高维变量选择,机器学习和统计计算。同时也致力于统计方法在实际问题中的应用,比如统计遗传学、基因和环境交互影响作用和基因变量选择等。已有若干成果发表在国际著名学术期刊上,如《Journal of the American Statistical Association》、《Journal of Time Series Analysis》等 曾教授数据科学的概率论基础、统计计算、贝叶斯统计、随机过程、高级应用统计等数据科学领域核心课程
贺诗源
美国得克萨斯A&M大学统计学博士。中国人民大学统计与大数据研究院任助理教授、博士生导师。研究方向包括统计计算、统计与流行最优化、天文统计学。在过去几年间从事统计咨询,为天文、高能物理、工业工程等院系提供数据处理、统计分析的服务,积累了丰富的大数据处理、分布式计算经验。在人民大学教授统计计算、高等应用统计分析等课程,积累了大量应用统计案例和丰富的教学经验,课程全面涉及大数据预处理、可视化、统计建模计算各个方面。
代文林
中国人民大学助理教授,博士生导师。2014年获得香港浸会大学统计学博士学位,2015至2018年在沙特阿卜杜拉国王科技大学从事博士后研究。主要从事函数行数据分析、非参与半参数方法、空间统计学等领域的统计理论与应用研究,现已发表SCI论文10余篇。主讲《统计模型与推断》、《大样本理论》、《随机过程》、《统计计算》等课程。
李想
美国*耐基卡**梅隆大学博士,TalkingData首席机器学习科学家,负责公司在数据科学方向的研发及相关产品工作。历任IBM T.J. Watson 实验室, Ask.com 等高科技企业技术及相关产品开发工作负责人。超过15年以上人工智能,机器学习,大数据等领域从业经验,拥有5项美国专利,发表有超过20篇论文,是多个人工智能领域期刊及国际会议的审稿人。
张夏天
北京邮电大学硕士,长期从事数据挖掘,机器学习相关领域的研究和应用工作。曾在IBM中国研究院,腾讯数据平台部,华为诺亚方舟实验室任职,2013年加入腾云天下任首席数据科学家,全面负责数据挖掘工作。发表学术论文10篇,申请专利9个。目前全面负责TalkingData移动大数据挖掘工作,包括移动应用推荐系统、移动广告优化、移动应用受众画像、移动设备用户画像、游戏数据挖掘、位置数据挖掘等工作。同时负责大数据机器学习算法的研究和实现工作。
王小辉
现任 TalkingData 智能感知实验室数据科学家,具有丰富的研发及架构经验,善于攻克技术难题。目前主要负责TalkingData移动端基于传感器数据的场景感知应用研究和开发,以及计算机视觉技术在零售行业的解决方案。
