Talking Data

"数据科学精英"课程

  • 为强化并巩固学员的数据科学理论知识,我们引入国内外优质教学资源,回顾数据科学理论基础,构建数据科学知识体系。
  • 此次线上课程内容包括:讲解描述统计、推论统计、统计分布、假设检验、置信区间、线性回归、逻辑回归、层次聚类等统计知识
  • 并训练运用Python进行网页爬虫、数据导入、数据清洗、模型选择和可视化操作
  • 熟悉 numpy, pandas, matplotlib 等库
  • 讲解算法与建模功底,了解决策树、随机森林、SVM、K-means等算法的原理与应用等等。

关于TalkingData

TalkingData 成立于 2011 年,是国内领先的独立第三方移动数据服务平台。TalkingData 一直致力于数据的深耕与数据价值的挖掘,从数据的采集、处理到数据的分析,再到数据的应用与咨询。目前,TalkingData 的平均月活跃用户为 7 亿,为超过 12 万款移动应用,以及 10 万应用开发者提供服务。TalkingData的客户既有腾讯,百度,网易,搜狐,360,Google,Yahoo,Zynga,宝开,聚美,唯品会,滴滴打车等知名互联网企业,又有中国银联,招商银行,兴业银行,中信银行,平安集团,国信证券,海通证券,Orchirly,碧桂园,亨得利,全城热恋等传统行业巨头。

Days
Hours
Minutes
Seconds
cityscape-5

Latest Event -- Info Session

5/20 12:00 AM (PST)

扫二维码获报名

招募群体

2018 年 6 月~2019 年 6 月毕业,国外知名高校、国内 985、211 高校优先

专业包括但不限于计算机科学、数学、统计学、自动化、经济等专业

具备一定的 IT 基础,熟悉了解数据科学算法,擅长将现实问题转化为数据能力,志在投身于大数据行业。

猎聘北美&TalkingData "数据科学精英"计划宣讲会

05/06/2018 美东8:00PM
05/07/2018 北京8:00AM

课程福利

福利一:直接入职 TalkingData

经过线上、线下课程培训及实习演练,综合所有测评及表现,表现优异的前30 名同学将获得直接入职 TalkingData 的机会,年薪¥35万起。

福利二:奖学金机制

顺利完成线上培训,成功获得线下培训机会的优秀学员将获得已交学费的全额退款。

福利三:保面试

所有通过筛选进入线上培训的同学,都将获得TalkingData直接面试机会,通过培训和面试者将获得线下实训。

福利四:高含金量证书

顺利完成课程的同学,将获得腾云大学Data Science 课程结业证书。

福利五:食宿全免

数据科学精英计划优异者在将免去所以培训费用。除此之外,一个月线上培训结束之后,在北京举行的一个月线下培训期间,食宿费用全部由我们承担。

福利六: 北美数据之旅

综合表现优秀者将有机会获得北美数据之旅的游学机会,优秀的学员将跟随高管们在硅谷游玩,近距离交流学习。

福利七:猎聘北美独家名企内推

此项目所有表现优异者,猎聘北美将无偿提供世界名企内推服务,25万猎头只为帮你找到心仪的职位。

INSTRUCTOR

工学硕士,经济学博士。数据挖掘和文本挖掘、复杂网络建模。关注统计和数据挖掘算法及软件应用,统计数据库系统研发等方面。 主要代表性著作:《R语言数据挖掘方法及应用》,《SPSS统计分析方法及应用》、《基于R的统计分析与数据挖掘》等。
薛薇
中国人民大学应用统计中心副主任,中国人民大学统计学院副教授
经济学博士,主要从事经济统计分析、创新经济计量、指数编制与应用、数据可视化等应用统计方向的研究。研究》等核心期刊上发表学术文章三十余篇。曾受邀作为联合国大学荷兰马斯特里赫特分校访问学者,进行为期一年的访问,参与欧盟第七号框架下的项目研究工作。并五次受邀作为法国国家统计局(INSEE)访问学者,参与欧盟-中国项目研究。
吴翌琳
中国人民大学统计学院副教授、中国调查与数据中心研究员,中国人民大学应用统计科学研究中心研究员。

课程大纲

(一)统计(Statistics)-9h

基于2016年北京市空气质量监测数据,提出若干典型分析问题。通过问题驱动,由浅入深、系统全面地介绍了主流统计方法的核心原理,并基于R语言实现了各种应用问题下的分析和建模。涉及数据质量评估、极端值诊断、统计分布、基本描述统计、单个和多个总体的均值检验、线性回归分析、空间统计、聚类分析、因子分析、Logistic回归等众多经典统计方法。

  • 描述性统计和推断性统计(Descriptive Statistics and Inferential Statistics)
  • 正态分布(Normal Distributions)
  • 假设检验(Hypothesis Testing)
  • 参数估计(Parameter estimation)
  • 回归(Regression)
  • 线性回归(Linear Regression)
  • 多变量回归(Multivariable Regression)
  • 逻辑回归(Logistic Regression)

(二)用Python探索数据(Data Wrangling and Exploratory Data Analysis with Python)-6h

通过学习Python编程及其常用库和数据探索的基础知识,学员将正式开启数据科学之旅。在本门课里,学员将掌握用Python这一优雅简洁的编程工具,实现数据获取、数据准备、模型选择与可视化报告的全流程。

(三)算法与建模(Algorithms and Modeling)-10h

使用结构化的和非结构化的数据解决实用的的分类、回归和聚类问题,学员将掌握机器学习最常用的库、算法和建模方法。

  • 有监督学习(Supervised Learning)
  • 决策树(Decision Tree)
  • 集成方法(Ensemble Methods)
  • 随机森林(Random Forest)
  • 朴素贝叶斯(Naive Bayes)
  • 邻近算法(K-Nearest Neighbors)
  • 支持向量机(Support Vector Machines)
  • 神经网络(Neutral Networks)
  • 无监督学习(Unsupervised Learning)
  • K均值(K-means Clustering)
  • EM聚类(EM Clustering)
  • 层次聚类(Hierarchical Clustering)
  • 基于密度的聚类算法(DBSCAN)

(四)数据可视化(Data Visualization)-3h

本次课程主要介绍数据可视化的一般原理、基本流程、设计原则、实现方法等。重点在于针对不同类型的数据,介绍合理适用的可视化图形,全面覆盖数据分析中使用到的基本统计图表以及一些空间数据展示的技能。通过本课程的学习,着重培养学员面对实际数据时,提出问题、将问题数据化、采用可视化方式解决问题的基本能力,尤其是能够构建一个逻辑清晰、内容丰富的可视化作品的能力。

  • 数据可视化基础(Data Visualization Basics)
  • 数据的多元展示(Visualization Methods)
  • 空间数据与图形美化(Spatial Data and Graphic Beautification)

线上培训时间与地点

May 22th-Jun 22th:在腾云校园官网上课。

项目流程

May 20th-May 22th

能力测评

Jun 22th

线上测评及成绩公示
顺利完成线上课程后,进行相应的测评并进行结果公示,通过测评的同学,TalkingData将颁发“腾云大学DS课程结业证书”,并发送面试邀请。

July 9th–August 3rd

线下培训
通过面试的同学将获得线下培训机会。线下培训将在TalkingData北京总部进行,授课期间的住宿与餐费均由TalkingData全部承担。期间,我们将为每位同学配备一名数据科学导师及行业导师,进行理论、业务等全面指导,开放真实数据与业务场景问题,进行数据科学实战演练。

May 22th-Jun 22th

线上课程培训
初次测评通过后,将进行为期一个月的免费线上培训。线上培训课程为数据科学理论知识巩固与强化,TalkingData结合行业实践经验,引入国内外优质教学资源,回顾数据科学理论基础,构建数据科学知识体系。

Jun 22th-Jun 30th

面试测评
顺利通过线上测评的学员,将由TalkingData统一安排面试。

August

Offer发放
在线下实训项目结束后,综合所有测评及表现,排名前25名的同学将获得“数据科学 Certificate Track”认证,并获得直接入职 TalkingData 的机会。