人工智能与数据科学强化课程
从这里,踏上人工智能与数据科学创新之路
从这里,踏上人工智能与数据科学创新之路
针对学员的职业规划,分商业分析和数据科学两个方向教学。前两个月共同上课,夯实基础,后一个月,分班上课,有针对性的准备面试。两个方向课程时间不冲突,您如果学有余力,也可以全方面准备。
由近20位工业界一线的数据科学家和机器学习专家联合授课,师生比高达1:5。100+课时,结合人工智能与数据科学岗位要求,从编程能力、模型理解、项目经验三个角度提升您的综合实力。
课程案例包括用户黏性分析、文本聚类、Spark程序开发、深度学习等多个数据科学领域当前热门问题。
本课程已帮助众多学员拿到科技、金融、咨询等行业数据科学家、机器学习工程师、数据分析、商业分析等岗位offer。
主讲老师:Nathan老师
根据不同的职业路径,您可以选择商业分析或数据科学两个课程。两门课程资源共享,帮助您横向拓宽发展机会,收获理想的offer。
注重加强您的案例分析能力和数理统计知识,夯实SQL和Python基础,帮助您顺利通过商业分析岗位面试。
为您深入讲解分布式系统和深度学习等前沿知识,并通过4+个机器学习项目帮助您拿到数据科学岗位offer。
用户流失是一个常见的商业指标。不同行业都会根据这个指标调整公司策略、留住当前用户。因此,如何高效分析这个指标,将会极大影响公司的策略和发展。
本项目以用户银行数据信息为例,带领学员应用多种监督学习模型(例如逻辑回归,随进森林)对银行用户流失进行预测和分析,并进一步分析影响流失的关键因素,为提高用户留存做出更好的商业决策。通过本项目,您将学到如何使用Pandas做数据探索、数据分析、数据预处理,以及如何通过Sklearn使用机器学习模型。
随着互联网的兴起,用户也越来越愿意表达自己的想法。特别是在网上购物方面,我们可以明显地发现,用户在购物前会参考他人的经验,在购物后也愿意加上自己的评价和购买建议。通过对用户评价的分析,公司可以更好地了解用户的想法和需求,也可以更有针对性地做出商业决策。在本项目中,我们会使用机器学习的方法来分析某知名电商的用户评价数据,从文本中发现一些隐含信息和内在联系,进而在未来使用这些信息来帮助我们解决一些商业问题,如提高转化率。
大数据分析是算法工程师必备的技能,合格的算法工程师需要掌握从数据收集到数据建模的整个流程,最后才能保证从数据中发现可能的规律,并建立机器学习模型。
本项目以旧金山地区犯罪数据为例,带领学员建立从数据采集、清洗、存储、分析的一整套数据分析的工作流。通过对于不同地区犯罪数据,天气数据的分析和建模,建立可能的犯罪事件预测机制。
推荐系统是互联网公司的现金奶牛。无论是Google、Facebook等IT巨头,还是Uber、Airbnb、Pinterest各类初创公司,都需要一套高性能的推荐系统。推荐系统的设计与开发能力是各大顶尖科技公司普遍看重的能力之一。
本项目带领您成为推荐系统设计与开发专家。本项目以Netflix电影数据为训练数据,带领学员掌握主流的推荐系统的算法,并熟练使用Spark Machine learning pipeline建立自己的协同过滤算法,并部署推荐系统到生产型环境。
Kaggle比赛是每一个DS/DA的炼金石,能够在Kaggle比赛中取得好的排名,是自我能力的最佳体现,也是公司判断人才非常重要的标准。在本期课程中,我们以Google Gstore销售预测为范例,带领同学们熟练运用业界常用的LGBM, PyTorch DeepModel来实现自己的算法,帮助同学们熟悉Kaggle比赛中常用的打法,并且在Kaggle比赛中取得好的名次。
随着深度学习技术的飞速发展,越来越多的互联网公司开始在推荐系统中使用深度学习。相对于传统的推荐系统,深度学习可以实现端到端的学习。
本项目以深度学习模型auto-encoder-decoder网络为基础,以imdb电影数据为训练数据,使用tensorflow建立auto-encoder-decoder模型。通过模型提取用户及电影特征,最终实现电影的自动推荐。
时间序列(Time Series)是我们在日常生活和社会工作中十分常见的一种数据,它是通过将一系列时间点上的观测值按等时间间隔测量来获取的数据集合,比如商业活动中,服装公司的年销售量;每日股票的价格波动;气象学中某城市的年降水量,月平均气温;城市污染PM2.5 指数 等等,因此对时间序列的研究广泛存在于各行各业。
本项目以LSTM为基础,以股票数据作为训练数据,带您通过TensorFlow,建立时间序列数据分析的深度学习模型。最终实现个股的伴随时间的未来变化趋势,以及对应的大盘指数的变化预测和分析。
随着计算机技术的提高,我们现在很容易从不相关的数据中挖掘出隐藏的信息。比如十八世纪的时候,股票价格会随着来往的船只而波动,因为来往的商船传递着最新的消息。又有研究发现,公司高管拜访白宫的出入记录可以预测未来该公司股票的走向。这里,我们将遵循相同的思路,分析研究纽约出租车和股市的关系。看似纷繁复杂的纽约交通是否隐藏着有趣的信息呢?
在大作业的实战中,同学们将会运用之前学习过的所有知识来合理探索数据,包括商业问题的数据化,提出合理问题,并对数据进行归纳整理,选择合理统计模型,验证猜想。
2017年,全球零售电子商务营业额达到了2.290万亿美元,约占零售总额的10.1%,预计到2021年将达到4.479万亿美元。2018年是线上线下零售革命——“未来零售”落地生根发芽、蓬勃发展的一年。
在本项目中,同学会通过分析某知名电商网站销量和产品信息,系统化的学习个性化设计,新顾客吸引与鼓励顾客再购物方法,商业推销途径优化,然后建立一个网页产品销量预测模型。
“一图胜千言”。如何利用可视化来理解和沟通数据已经成为现代数据分析不可或缺的能力。 在本项目中, 我们将一起学习可视化的基本原理和最佳实践,用Tableau对其经典数据集Global Superstore Retail Data做探索性数据分析和汇报总结;并使用Matplotlib, Seaborn and Pandas实现Python数据可视化分析。
数据挖掘和数据分析是互联网金融风险控制中最重要的一环。在大数据时代,银行和互联网金融公司在控制金融风险上进行了大量的投入。在过去的几年,大量的小型借贷,P2P公司所面临的金融风险成为了其成长的魔咒。但是国外P2P鼻祖Lending Club、国内的阿里金融都能够做到较好地控制小贷风险。本项目利用LendingClub的实际案例,帮助同学学习互联网金融公司及传统银行怎样通过分析,建模来融合多维,多来源的数据,区分正常用户和欺诈用户,降低贷款风险。
在项目结束后,同学可以独立完成数据的特征挖掘,能够自己动手开发基于机器学习的金融分析模型,能够熟练掌握各种分类算法,并且可以用业界数据解决任何互联网金融或银行的实际问题。
在金融业、电商业以及共享行业等诸多商业领域中,往往伴随着黑产相关的欺诈风险。这些交易涉及直接金钱损失。如何在海量数据中有效的鉴别少量欺诈交易、降低损失而维持较好的客户体验,是各大公司艰巨的挑战。在本项目中,我们将一起分析处理某知名电商交易数据,通过系统的洞察数据中关联/模式,建立完整机器学习解决方案,基于数据给出切实可行的商业建议,最小化企业欺诈损失。
课程由20余位老师实时直播授课,为您提供紧贴工业界,系统的知识讲解和求职指导。
授课团队由Google, Facebook, Airbnb, McKinsey & Company, Linkedin等科技、咨询公司的Senior Data Scientist、Machine Learning Engineer和Business Analyst组成。
还有Apache Spark、Apache Hadoop的代码贡献者和管理者委员会成员亲自授课。
您将学习Python语法、基本的线性数据结构和搜索算法、以及工业界主流的传统机器学习模型,夯实数据科学基础。
上课频率: 1个月,每周5节课,每节课2-3小时
Introduction of Data Science
Fundamentals of Probability
[Coding] Python Basics 1 variable and syntax
[Coding] Python Basics 2 function and class
Linear Regression & Logistic Regression I
[Coding] Python Basics 3 base data structure
[Coding] Python Binary Search
Logistic Regression II & Regularization
[Coding] Python Array Basic Sorting
Model Evaluation
[Coding] Python LinkedList and Recursion I
[Coding] Python LinkedList & Recrusion I cont
Nonlinear Models I
[Coding] Python Practice
Nonlinear Models II & Feature Selection
[Coding] Python Advanced Sorting and Practice
[Coding] Python Review
PCA & Unsupervised Learning
您将进一步学习Python、数据结构和算法知识,锻炼Coding能力,并学习数理统计、概率等相关的重要知识点。
上课频率: 3周,每周5节课,每节课2-3小时
Data Manipulation in Python 1
[Coding] Python Queue and Stack
[Coding] Python Advanced Sorting and Practice
Data Manipulation in Python 2
[Coding] Python Review
[Coding] Python Review
[Coding] Exam 1
Machine Learning Project 1 - Customer Churn Prediction
[Coding] Python Binary Tree
[Coding] Recursion II - recursion on tree
Machine Learning Project 2 - NLP and Topic Modeling
[Coding] Python Practice
Introduction to statistics
[Coding] Python Binary Search Tree
[Coding] Python review
Resume and Interview Preparation I
Resume and Interview Preparation II
A/B testing 1
[Coding] Python Heap
A/B testing 2
A/B testing 3
[Coding] Python Review
A/B testing 4
Inference in regression
[Coding] String I
SQL I
[Coding] Recursion III DFS
[Coding] Recursion III DFS cont
SQL II
本阶段,您将学习经典Online Assessment破题思路,了解如何选择track,并获得深入准备和提升简历。
上课频率: 2 周, 每周5节课,每节课2-3小时
[Coding] Exam 2
SQL III
Stats review
[Coding] Probability, Sampling, Randomization
Resume and interview preparation
Career guide: BA vs DS
Online Assessment - deep dive 1
Online Assessment - deep dive 2
4+案例分析与项目实战,加强您的分析能力和统计知识,夯实SQL和Python基础,提升沟通等软实力,帮助您顺利通过商业分析岗位面试。
上课频率: 1个月,每周4节课,每节课2-3小时
BA track introduction
BA track mock interview
[Coding-for-BA] Queue, Stack
eCommerce deep dive 1: System design
eCommerce deep dive 2: Data driven marketing
eCommerce deep dive 3: Data lab
[Coding-for-BA] HashTable
eCommerce deep dive 4: Data lab
Data visualization In Tableau
Data visualization in Python
[Coding-for-BA] String practice
Case study deep dive 1
Case study deep dive 2
Case study deep dive 3
Anomaly Detection 1
Anomaly Detection 2
Anomaly Detection 3
Supply chain data 1
Supply chain data 2
Review of BA/DA track
即将开课,关注我们获取最新信息
扫描上方二维码
联系来Offer课程顾问