课程时长

16

每周5节课, 每节课2-3小时

下次开课

即将开课

关注我们获取最新信息

建议预修课程

适合所有学生

商业分析与数据科学两大方向,强化培养面试技能!

针对学员的职业规划,分商业分析和数据科学两个方向教学。前两个月共同上课,夯实基础,后一个月,分班上课,有针对性的准备面试。两个方向课程时间不冲突,您如果学有余力,也可以全方面准备。

由近20位工业界一线的数据科学家和机器学习专家联合授课,师生比高达1:5。100+课时,结合人工智能与数据科学岗位要求,从编程能力、模型理解、项目经验三个角度提升您的综合实力。

课程案例包括用户黏性分析、文本聚类、Spark程序开发、深度学习等多个数据科学领域当前热门问题。

本课程已帮助众多学员拿到科技、金融、咨询等行业数据科学家、机器学习工程师、数据分析、商业分析等岗位offer。

AI & Data Engineering Introduction
试听课

课程概述

主讲老师:Nathan老师

一门课程,两条路径

根据不同的职业路径,您可以选择商业分析或数据科学两个课程。两门课程资源共享,帮助您横向拓宽发展机会,收获理想的offer。

Track I

商业分析Track

注重加强您的案例分析能力和数理统计知识,夯实SQL和Python基础,帮助您顺利通过商业分析岗位面试。

Data Analysis
Data Manipulation
Data Visualization
Business Communication
Case Studies
  • 基于商业分析岗位的面试要求,为您定制合适的学习方案。
  • 4+ Data Challenge和Case Study项目,帮您提升简历,拿到面试机会。
  • 课程设置了一系列数据可视化、数据操作及商业软实力课程。
  • 由在IT、金融、能源、咨询等行业有多年商业分析经验的老师授课。

Track II

数据科学Track

为您深入讲解分布式系统和深度学习等前沿知识,并通过4+个机器学习项目帮助您拿到数据科学岗位offer。

Big Data
Deep Learning
Machine Learning
Apache Spark
TensorFlow
  • 课程涵盖数据科学岗位所需的编程、模型、统计、大数据系统、深度学习等重要知识点。
  • 手把手教您完成4+个机器学习前沿项目。
  • 通过模拟面试课程,帮您解密数据科学岗位面试。
  • 由Apache Spark核心开发工程师和数据科学家亲自授课。

10+ 热门Spark、Machine Learning与Business Analysis项目

  • 银行用户流失预测与分析

    用户流失是一个常见的商业指标。不同行业都会根据这个指标调整公司策略、留住当前用户。因此,如何高效分析这个指标,将会极大影响公司的策略和发展。

    本项目以用户银行数据信息为例,带领学员应用多种监督学习模型(例如逻辑回归,随进森林)对银行用户流失进行预测和分析,并进一步分析影响流失的关键因素,为提高用户留存做出更好的商业决策。通过本项目,您将学到如何使用Pandas做数据探索、数据分析、数据预处理,以及如何通过Sklearn使用机器学习模型。

    Pandas
    Customer Churn Prediction and Analysis
    Sklearn
    Machine learning
  • 电商平台用户评价分析与自然语言处理

    随着互联网的兴起,用户也越来越愿意表达自己的想法。特别是在网上购物方面,我们可以明显地发现,用户在购物前会参考他人的经验,在购物后也愿意加上自己的评价和购买建议。通过对用户评价的分析,公司可以更好地了解用户的想法和需求,也可以更有针对性地做出商业决策。在本项目中,我们会使用机器学习的方法来分析某知名电商的用户评价数据,从文本中发现一些隐含信息和内在联系,进而在未来使用这些信息来帮助我们解决一些商业问题,如提高转化率。

    TFIDF
    PCA
    Python
    K-means cluster
    Latent Dirichlet Analysis
  • 旧金山犯罪数据分析和预警

    大数据分析是算法工程师必备的技能,合格的算法工程师需要掌握从数据收集到数据建模的整个流程,最后才能保证从数据中发现可能的规律,并建立机器学习模型。

    本项目以旧金山地区犯罪数据为例,带领学员建立从数据采集、清洗、存储、分析的一整套数据分析的工作流。通过对于不同地区犯罪数据,天气数据的分析和建模,建立可能的犯罪事件预测机制。

    Spark RDD
    Spark SQL
    OLAP
    Regression
    Data Pipeline
  • Movie Lense和Netflix 电影数据分析和推荐系统

    推荐系统是互联网公司的现金奶牛。无论是Google、Facebook等IT巨头,还是Uber、Airbnb、Pinterest各类初创公司,都需要一套高性能的推荐系统。推荐系统的设计与开发能力是各大顶尖科技公司普遍看重的能力之一。

    本项目带领您成为推荐系统设计与开发专家。本项目以Netflix电影数据为训练数据,带领学员掌握主流的推荐系统的算法,并熟练使用Spark Machine learning pipeline建立自己的协同过滤算法,并部署推荐系统到生产型环境。

    Recommendation System
    Collaborative Filtering
    Matrix Factorization
    Spark ALS Model
  • Google Gstore销售预测与市场分析

    Kaggle比赛是每一个DS/DA的炼金石,能够在Kaggle比赛中取得好的排名,是自我能力的最佳体现,也是公司判断人才非常重要的标准。在本期课程中,我们以Google Gstore销售预测为范例,带领同学们熟练运用业界常用的LGBM, PyTorch DeepModel来实现自己的算法,帮助同学们熟悉Kaggle比赛中常用的打法,并且在Kaggle比赛中取得好的名次。

    LGBM
    PyTorch DeepModel
    Kaggle
  • 基于Auto-Encoder-Decoder 的电影推荐

    随着深度学习技术的飞速发展,越来越多的互联网公司开始在推荐系统中使用深度学习。相对于传统的推荐系统,深度学习可以实现端到端的学习。

    本项目以深度学习模型auto-encoder-decoder网络为基础,以imdb电影数据为训练数据,使用tensorflow建立auto-encoder-decoder模型。通过模型提取用户及电影特征,最终实现电影的自动推荐。

    Auto-encoder-decoder
    Recommendation System
    Tensorflow
    Movie Recommendation
    End-to-end Training
  • 基于LSTM深度学习模型的股票大盘指数预测

    时间序列(Time Series)是我们在日常生活和社会工作中十分常见的一种数据,它是通过将一系列时间点上的观测值按等时间间隔测量来获取的数据集合,比如商业活动中,服装公司的年销售量;每日股票的价格波动;气象学中某城市的年降水量,月平均气温;城市污染PM2.5 指数 等等,因此对时间序列的研究广泛存在于各行各业。

    本项目以LSTM为基础,以股票数据作为训练数据,带您通过TensorFlow,建立时间序列数据分析的深度学习模型。最终实现个股的伴随时间的未来变化趋势,以及对应的大盘指数的变化预测和分析。

    Time Series Data
    LSTM
    RNN
    TensorFlow
    Stock Price Prediction
  • 纽约出租车数据与股市走向关系分析

    随着计算机技术的提高,我们现在很容易从不相关的数据中挖掘出隐藏的信息。比如十八世纪的时候,股票价格会随着来往的船只而波动,因为来往的商船传递着最新的消息。又有研究发现,公司高管拜访白宫的出入记录可以预测未来该公司股票的走向。这里,我们将遵循相同的思路,分析研究纽约出租车和股市的关系。看似纷繁复杂的纽约交通是否隐藏着有趣的信息呢?

    在大作业的实战中,同学们将会运用之前学习过的所有知识来合理探索数据,包括商业问题的数据化,提出合理问题,并对数据进行归纳整理,选择合理统计模型,验证猜想。

    Python Dashboard
    Segmentation Analysis
    Statistical Model
    Poisson Regression
  • E-Commerce营销策略优化

    2017年,全球零售电子商务营业额达到了2.290万亿美元,约占零售总额的10.1%,预计到2021年将达到4.479万亿美元。2018年是线上线下零售革命——“未来零售”落地生根发芽、蓬勃发展的一年。

    在本项目中,同学会通过分析某知名电商网站销量和产品信息,系统化的学习个性化设计,新顾客吸引与鼓励顾客再购物方法,商业推销途径优化,然后建立一个网页产品销量预测模型。

    E-commerce
    Business Analysis
    Data Visualization
    Product Insight
  • 数据可视化与Tableau应用举例

    “一图胜千言”。如何利用可视化来理解和沟通数据已经成为现代数据分析不可或缺的能力。 在本项目中, 我们将一起学习可视化的基本原理和最佳实践,用Tableau对其经典数据集Global Superstore Retail Data做探索性数据分析和汇报总结;并使用Matplotlib, Seaborn and Pandas实现Python数据可视化分析。

    Tableau
    Python
    Data Visualization
    Data Analysis
  • Fintech 用户信用评级建模分析与金融风险控制

    数据挖掘和数据分析是互联网金融风险控制中最重要的一环。在大数据时代,银行和互联网金融公司在控制金融风险上进行了大量的投入。在过去的几年,大量的小型借贷,P2P公司所面临的金融风险成为了其成长的魔咒。但是国外P2P鼻祖Lending Club、国内的阿里金融都能够做到较好地控制小贷风险。本项目利用LendingClub的实际案例,帮助同学学习互联网金融公司及传统银行怎样通过分析,建模来融合多维,多来源的数据,区分正常用户和欺诈用户,降低贷款风险。

    在项目结束后,同学可以独立完成数据的特征挖掘,能够自己动手开发基于机器学习的金融分析模型,能够熟练掌握各种分类算法,并且可以用业界数据解决任何互联网金融或银行的实际问题。

    Risk Control
    Credit Risk Model
    Fraud Labeling
    Machine Learning
  • Anomaly Detection数据异常检测与处理

    在金融业、电商业以及共享行业等诸多商业领域中,往往伴随着黑产相关的欺诈风险。这些交易涉及直接金钱损失。如何在海量数据中有效的鉴别少量欺诈交易、降低损失而维持较好的客户体验,是各大公司艰巨的挑战。在本项目中,我们将一起分析处理某知名电商交易数据,通过系统的洞察数据中关联/模式,建立完整机器学习解决方案,基于数据给出切实可行的商业建议,最小化企业欺诈损失。

    Payment Fraud Detection
    Machine Learning
    Pattern Study

工业界资深专家,培养一流数据科学人才

课程由20余位老师实时直播授课,为您提供紧贴工业界,系统的知识讲解和求职指导。

授课团队由Google, Facebook, Airbnb, McKinsey & Company, Linkedin等科技、咨询公司的Senior Data Scientist、Machine Learning Engineer和Business Analyst组成。

还有Apache Spark、Apache Hadoop的代码贡献者和管理者委员会成员亲自授课。

Our team consists of senior data scientist, machine learning engineer, and business analyst from Google, Facebook, McKinsey & Company, Hortonworks, Apache Spark, Apache Hadoop, etc.

读懂人工智能,充实您的求职技能点

20余位Google, McKinsey等科技、咨询公司的资深数据科学家、机器学习工程师和商业分析师实时实时直播授课。教师团队还有Apache Spark、Hadoop的管理者委员会成员。
2018-09-13-Data-Hightlight1

工业界一线专家

直播授课

10+节统计课程全面更新,针对数据科学面试的面试趋势,强化培训case study及实验设计应考技能。
2018-09-13-Data-highlight2

统计模块全面更新

全方位增强实力

基于数据科学岗位的面试要求的,依托来Offer超强算法与编程的教学经验,用30+Python课程,帮助您快速入门,建立算法和编程知识体系,自信应对面试。
2018-09-13-Data-hightlight3

30+ Python课程

夯实编程基础

本课程针对学员的不同职业规划,分商业分析和数据科学两个方向教学,由资深数据科学家和高级商业分析师,针对不同岗位的面试要求,有针对性的帮您提升。
2018-09-13-Data-hightlight4

BA与DS两个方向

分班教学

来自一线科技/咨询公司的老师们,还会为您量身修改简历,并培训同学对简历中各项内容的英文描述能力。同时,他们还会与您进行1V1的模拟面试,帮您抓住面试机会。
2018-09-12-SDE-liangdian3

个性化简历修改

模拟面试

来Offer与硅谷众多一线IT公司人力资源部门及猎头公司均保持良好的合作关系,拥有超过千人、遍布硅谷各大IT公司的强大校友资源,为您提供强有力的内推支持。
2018-09-12-SDE-liangdian5

强大内推网络

助力求职

课程大纲

第1部分

机器学习理论+Python编程基础

您将学习Python语法、基本的线性数据结构和搜索算法、以及工业界主流的传统机器学习模型,夯实数据科学基础。

上课频率: 1个月,每周5节课,每节课2-3小时

  • 第1周

    Introduction of Data Science

    Fundamentals of Probability

    [Coding] Python Basics 1 variable and syntax

  • 第2周

    [Coding] Python Basics 2 function and class

    Linear Regression & Logistic Regression I

    [Coding] Python Basics 3 base data structure

    [Coding] Python Binary Search

    Logistic Regression II & Regularization

  • 第3周

    [Coding] Python Array Basic Sorting

    Model Evaluation

    [Coding] Python LinkedList and Recursion I

    [Coding] Python LinkedList & Recrusion I cont

    Nonlinear Models I

  • 第4周

    [Coding] Python Practice

    Nonlinear Models II & Feature Selection

    [Coding] Python Advanced Sorting and Practice

    [Coding] Python Review

    PCA & Unsupervised Learning

第2部分

概率与统计知识 & Python编程进阶

您将进一步学习Python、数据结构和算法知识,锻炼Coding能力,并学习数理统计、概率等相关的重要知识点。

上课频率: 3周,每周5节课,每节课2-3小时

  • 第5周

    Data Manipulation in Python 1

    [Coding] Python Queue and Stack

    [Coding] Python Advanced Sorting and Practice

    Data Manipulation in Python 2

    [Coding] Python Review

    [Coding] Python Review

    [Coding] Exam 1

  • 第6周

    Machine Learning Project 1 - Customer Churn Prediction

    [Coding] Python Binary Tree

    [Coding] Recursion II - recursion on tree

    Machine Learning Project 2 - NLP and Topic Modeling

    [Coding] Python Practice

  • 第7周

    Introduction to statistics

    [Coding] Python Binary Search Tree

    [Coding] Python review

    Resume and Interview Preparation I

    Resume and Interview Preparation II

    A/B testing 1

    [Coding] Python Heap

    A/B testing 2

  • 第8周

    A/B testing 3

    [Coding] Python Review

    A/B testing 4

    Inference in regression

  • 第9周

    [Coding] String I

    SQL I

    [Coding] Recursion III DFS

    [Coding] Recursion III DFS cont

    SQL II

第3部分

OA经典案例分析与简历辅导

本阶段,您将学习经典Online Assessment破题思路,了解如何选择track,并获得深入准备和提升简历。

上课频率: 2 周, 每周5节课,每节课2-3小时

  • 第10周

    [Coding] Exam 2

    SQL III

    Stats review

    [Coding] Probability, Sampling, Randomization

    Resume and interview preparation

    Career guide: BA vs DS

    Online Assessment - deep dive 1

    Online Assessment - deep dive 2

第4部分

4+案例分析与项目实战,加强您的分析能力和统计知识,夯实SQL和Python基础,提升沟通等软实力,帮助您顺利通过商业分析岗位面试。

上课频率: 1个月,每周4节课,每节课2-3小时

  • 第11周

    BA track introduction

    BA track mock interview

    [Coding-for-BA] Queue, Stack

  • 第12周

    eCommerce deep dive 1: System design

    eCommerce deep dive 2: Data driven marketing

    eCommerce deep dive 3: Data lab

    [Coding-for-BA] HashTable

  • 第13周

    eCommerce deep dive 4: Data lab

    Data visualization In Tableau

    Data visualization in Python

    [Coding-for-BA] String practice

  • 第14周

    Case study deep dive 1

    Case study deep dive 2

    Case study deep dive 3

    Anomaly Detection 1

  • 第15周

    Anomaly Detection 2

    Anomaly Detection 3

    Supply chain data 1

    Supply chain data 2

  • 第16周

    Review of BA/DA track

* 每期课程均有不同程度的修改,实际课纲以上课公布为准

常见问题

即将开课,关注我们获取最新信息

了解详情可扫码添加顾问

  • 班主任责任制,及时追踪进度
  • 5大互动平台,7天24小时答疑
  • 全明星导师,全程实时直播授课
  • 1v1简历修改与内推
  • 10大工业级别项目,提高动手能力
  • 30+ Python课程,突破编程面试
免费试听
QR Code

扫描上方二维码
联系来Offer课程顾问

咨询课程与报名