课程时长

15

每周5节课, 每节课2-3小时

下次开课

即将开课

关注我们获取最新信息

建议预修课程

适合所有学生

商业分析与数据科学两大方向,强化培养面试技能!

2018年7月最新改版,针对学员的职业规划,分商业分析和数据科学两个方向教学。前两个月共同上课,夯实基础,后一个月,分班上课,有针对性的准备面试。两个方向课程时间不冲突,您如果学有余力,也可以全方面准备。

由近20位工业界一线的数据科学家和机器学习专家联合授课,师生比高达1:5。88+课时,结合最新人工智能与数据科学岗位要求,从编程能力、模型理解、项目经验三个角度提升您的综合实力。

课程案例包括用户黏性分析、文本聚类、Spark程序开发、深度学习等多个数据科学领域当前热门问题。

本课程已帮助众多学员拿到科技、金融、咨询等行业数据科学家、机器学习工程师、数据分析、商业分析等岗位offer。

AI & Data Engineering Introduction
试听课

课程概述

主讲老师:Jason老师

一门课程,两条路径

根据不同的职业路径,您可以选择商业分析或数据科学两个课程。两门课程资源共享,帮助您横向拓宽发展机会,收获理想的offer。

Track I

商业分析Track

注重加强您的案例分析能力和数理统计知识,夯实SQL和Python基础,帮助您顺利通过商业分析岗位面试。

Data Analysis
Data Manipulation
Data Visualization
Business Communication
Case Studies
  • 基于商业分析岗位的面试要求,为您定制最合适的学习方案。
  • 4+ Data Challenge和Case Study项目,帮您提升简历,拿到面试机会。
  • 课程设置了一系列数据可视化、数据操作及商业软实力课程。
  • 由在IT、金融、能源、咨询等行业有多年商业分析经验的老师授课。

Track II

数据科学Track

为您深入讲解分布式系统和深度学习等前沿知识,并通过4+个机器学习项目帮助您拿到数据科学岗位offer。

Big Data
Deep Learning
Machine Learning
Apache Spark
TensorFlow
  • 课程涵盖数据科学岗位所需的编程、模型、统计、大数据系统、深度学习等重要知识点。
  • 手把手教您完成4+个机器学习前沿项目。
  • 通过模拟面试课程,帮您解密数据科学岗位面试。
  • 由Apache Spark核心开发工程师和数据科学家亲自授课。

10+ 热门Spark、Machine Learning与Business Analysis项目

  • 电信行业用户流失预测

    用户流失预测是非常经典的大数据应用案例,指的是通过收集和分析用户对产品和服务的使用情况,预测哪些用户可能会停止使用该服务。

    本项目以电信行业的数据为例,带您进行数据清理、特征转换,训练逻辑回归、随机森林、最邻近算法等监督机器学习模型。最终,通过交叉验证、混淆矩阵等方法,评价模型对用户流失预测的效果。

    Supervised Machine Learning
    Spark
    Data Cleaning
    Feature Transformation
    Logistic Regression
    Random Forest
    K-Nearest Neighbors
    K-fold Cross-validation
    Confusion Matrix
  • 自然语言处理与主题建模

    主题建模是一个在自然语言处理中十分常用的方法。它可以帮助我们发现文本中隐藏的主题,对文档进行分类、整理和搜索。

    本项目将带您用Python对未标签的文本进行聚类,您将完成数据预处理、特征提取并训练K均值聚类、LDA等无监督机器学习模型,发掘文本中潜在的语义结构。

    NLP
    TF-IDF
    Unsupervised Machine Learning
    K-Means Clustering
    Latent Dirichelet Allocation
    Principal Component Analysis
  • YouTube用户评价情感分析项目

    使用大数据和机器学习算法去分析和了解用户行为,是数据科学家分析互联网用户行为的必备技能之一。掌握Spark ML 去处理大规模的自然语言数据,更是当下最为热门的一项技能。

    通过本项目,您将学习设计合理的metric来评估ML模型,运用Spark ML、NLP等相关技术对用户评论数据进行清洗,选取数据特征,构建监督模型,对用户评论进行分类,并处理unbalanced data,预测用户评论的语义偏好,学习使用AutoML(目前最火的ML方向)来加速模型调试过程,分析评论隐藏话题信息。

    AutoML
    Pyspark
    Spark ML
    NLP
    Comment Prediction
    Topic Analysis
  • 旧金山犯罪数据分析和预警

    大数据分析是算法工程师必备的技能,合格的算法工程师需要掌握从数据收集到数据建模的整个流程,最后才能保证从数据中发现可能的规律,并建立机器学习模型。

    本项目以旧金山地区犯罪数据为列,带您建立从数据采集,清洗,存储, 分析的一整套数据分析的工作流。通过对于不同地区犯罪数据,天气数据的分析和建模,建立可能的犯罪事件预测机制。

    Spark RDD
    Spark SQL
    OLAP
    Regression
    Data Pipeline
  • Netflix 电影数据分析和推荐系统

    推荐系统是互联网公司的现金奶牛。推荐系统的设计与开发能力更是Google、Facebook等IT巨头,和Uber、Airbnb等独角兽公司普遍看重的能力。

    本项目带领您以Netflix 电影数据为训练数据,带您掌握主流的推荐系统的算法,并熟练使用 Spark Machine learning pipeline 建立自己的过滤算法,并部署推荐系统到生产型环境。

    Recommendation System
    Collaborative Filtering
    Matrix Factorization
    Spark ALS Model
  • 点击率(CTR)预测系统

    在在线广告中,点击率(CTR)是评估广告效果的一个非常重要的指标。CTR点击率预测是对每次广告的点击情况做出判定,广泛用于赞助搜索和实时出价。CTR也是数据科学面试中的常考点。

    本项目以用户的点击日志数据为基础,涉及ETL、OLAP和统计分析、机器学习模型建模和预测这三个主要流程。采用Spark dataframe进行预处理,Spark SQL做大数据分析和统计建模,Spark ML pipeline 建立分类和回归模型。并将介绍XGboost 的原理及调优等。

    CTR prediction
    Kaggle
    Spark ML
    XGBOOST
    ETL
    OLAP
  • 基于Auto-Encoder-Decoder 的电影推荐

    随着深度学习技术的飞速发展,越来越多的互联网公司开始在推荐系统中使用深度学习。相对于传统的推荐系统,深度学习可以实现端到端的学习。

    本项目以深度学习模型auto-encoder-decoder网络为基础,以imdb电影数据为训练数据,使用tensorflow建立auto-encoder-decoder模型。通过模型提取用户及电影特征,最终实现电影的自动推荐。

    Auto-encoder-decoder
    Recommendation System
    Tensorflow
    Movie Recommendation
    End-to-end Training
  • 基于深度学习模型CNN的图像分类

    图像分类是计算机视觉最重要的任务之一,同时也被各大互联公司在其产品中大规模应用。卷积神经网络(CNN)在图像分类大数据集imagenet上取得了非常好的效果。

    本项目以深度学习模型CNN为基础,基于大数据集imagenet的已训练好的模型权重,使用tensorflow + transfer learning技术针对用户自定义数据集进行优化,建立汽车图像分类和相似图像搜索的深度学习模型。

    Image Classification
    CNN
    Tensorflow
    Transfer Learning
    Fine-tune Model
    ImageNet
    Pre-train Model
  • 时间序列数据分析和股票大盘指数预测

    时间序列(Time Series)是通过将一系列时间点上的观测值按等时间间隔测量来获取的数据集合,对时间序列的研究存在于各行各业。

    本项目以深度学习模型LSTM为基础,以股票数据作为训练数据,带您通过 TensorFlow 的LSTM模型,建立时间序列数据分析的深度学习模型。最终实现个股的伴随时间的未来变化趋势,以及对应的大盘指数的变化预测和分析。

    Time Series Data
    LSTM
    RNN
    TensorFlow
    Stock Price Prediction
  • 供应链数据分析与预测

    在零售、制造以及医疗等诸多领域中,对于产品需求的准确预测与企业收入息息相关,因此,对于处在工业4.0转型期中的大企业,如何利用大数据中的有效信息来进行产品需求预测成为一个重要的课题。

    本项目将分析处理某知名传统企业历史销售数据和产品数据,并建立模型来预测新旧产品的未来需求。同时,我们也会对大数据时代下传统企业的供应链诉求和求职机遇有进一步理解。

    Supply Chain
    Product Demand Forecast
    Sales Data
  • 时间序列与全球变暖分析

    全球气候变暖一直以来是人类重要的课题之一。二氧化碳和其他温室气体的含量不断增加。是全球变暖的主要原因之一。据资料显示二氧化碳(CO2)的含量从280ppmv增加到360ppmv,这一增长主要源于人类活动。

    本项目以经典时间序列ARIMA模型为基础,以二氧化碳排放数据作为训练数据。手把手教您如何应用Python statsmodel库,选择合适的时间序列模型,应用模型预测二氧化碳的排放量。

    Time Series
    ARIMA Model
    Python Statsmodel
  • 纽约出租车数据与股市走向关系分析

    随着计算机技术的提高,我们现在很容易从不相关的数据中挖掘出隐藏的信息。我们将尝试分析研究纽约出租车数据和股市涨跌的关系。

    在本项目中,您将会学习如何合理运用可视化工具探索数据,包括python dashboard的制作;如何进行segmentation analysis,提出合理问题,并对数据进行归纳整理;选择合理统计模型,验证猜想。

    Python Dashboard
    Segmentation Analysis
    Statistical Model
    Poisson Regression
  • E-Commerce营销策略优化

    2017年,全球零售电子商务营业额达到了2.290万亿美元,约占零售总额的10.1%。如此庞大的市场,对应着海量数据和复杂的商业背景。

    此项目将帮助您掌握电商当前热点课题,例如个性化设计,新顾客获取与鼓励顾客再购物,和商业推销途径优化。之后您将上手完成一个有关电商最核心的新顾客获取与鼓励顾客再购物的案例分析。

    E-commerce
    Business Analysis
    Data Visualization
    Product Insight

工业界顶级专家,培养一流数据科学人才

课程由20余位老师实时直播授课,为您提供最紧贴工业界,最系统的知识讲解和求职指导。

授课团队由Google, Facebook, Airbnb, McKinsey & Company, Hortonworks等顶级科技、咨询公司的Senior Data Scientist、Machine Learning Engineer和Business Analyst组成。

还有Apache Spark、Apache Hadoop的代码贡献者和管理者委员会成员亲自授课。

Our team consists of senior data scientist, machine learning engineer, and business analyst from Google, Facebook, McKinsey & Company, Hortonworks, Apache Spark, Apache Hadoop, etc.

读懂人工智能,充实您的求职技能点

20余位Google, McKinsey等顶级科技、咨询公司的资深数据科学家、机器学习工程师和商业分析师实时实时直播授课。教师团队还有Apache Spark、Hadoop的管理者委员会成员。
2018-09-13-Data-Hightlight1

工业界顶级专家

直播授课

课程涵盖2大传统的机器学习项目,4+大数据与深度学习项目,4+商业分析项目,帮助同学快速积累实战经验,全面提升简历。
2018-09-13-Data-highlight2

10+热门项目

全面增强实力

基于数据科学岗位的面试要求的,依托来Offer超强算法与编程的教学经验,用30+Python课程,帮助您快速入门,建立算法和编程知识体系,自信应对面试。
2018-09-13-Data-hightlight3

30+ Python课程

夯实编程基础

本课程针对学员的不同职业规划,分商业分析和数据科学两个方向教学,由资深数据科学家和高级商业分享师,针对不同岗位的面试要求,有针对性的帮您提升。
2018-09-13-Data-hightlight4

BA与DS两个方向

分班教学

来自一线科技/咨询公司的老师们,还会为您量身修改简历,并培训同学对简历中各项内容的英文描述能力。同时,他们还会与您进行1V1的模拟面试,帮您抓住面试机会。
2018-09-12-SDE-liangdian3

个性化简历修改

模拟面试

来Offer与硅谷众多一线IT公司人力资源部门及猎头公司均保持良好的合作关系,拥有超过千人、遍布硅谷各大IT公司的强大校友资源,为您提供强有力的内推支持。
2018-09-12-SDE-liangdian5

强大内推网络

助力求职

课程大纲

第 1 阶段

机器学习理论+Python编程基础

您将学习Python语法、基本的线性数据结构和搜索算法、以及工业界主流的传统机器学习模型,夯实数据科学基础。

上课频率: 1个月,每周5节课,每节课2-3小时

  • 第 1 周

    Introduction of Data Science

    Fundamentals of Probability & Linear Regression

    [Coding] Python Basics 1 variable and syntax

  • 第 2 周

    [Coding] Python Basics 2 function and class

    Logistic Regression

    [Coding] Python Basics 3 base data structure

    [Coding] Python Binary Search

    Model Evaluation

  • 第 3 周

    [Coding] Python Array Basic Sorting

    Nonlinear Models

    [Coding] Python LinkedList and Recursion I

    [Coding] Python Practice

    Feature Selection & Dimensional Reduction

  • 第 4 周

    [Coding] Python LinkedList & Recursion I cont

    [Coding] Python Advanced Sorting & Practice

    ML project 1

    ML project 1

    ML project 2

第 2 阶段

Python编程 & 统计巩固

您将进一步学习Python、数据结构和算法知识,锻炼Coding能力,并学习数理统计、概率等相关的重要知识点。

上课频率: 3周,每周5节课,每节课2-3小时

  • 第 5 周

    [Coding] Python Review

    [Coding] Python Queue and Stack

    [Coding] Exam 1

  • 第 6 周

    Introduction to Statistics

    [Coding] Python Binary Tree

    [Coding] Recursion II - recursion on tree

    Hypothesis testing

    A/B testing 1

  • 第 7 周

    [Coding] Python Practice

    [Coding] Python Binary Search Tree

    [Coding] Python Heap

    A/B Testing 2

    Inference in regression

  • 第 8 周

    [Coding] Python Hashtable

    Stats review

    [Coding] String I

    [Coding] Python Review

    [Coding] Recursion III DFS

  • 第 9 周

    SQL I

    [Coding] Exam 2

    SQL II

    SQL III

    [Coding] Recursion III DFS cont

第 3 阶段

OA经典案例分析与简历辅导

本阶段,您将学习经典Online Assessment破题思路,了解如何选择track,并获得深入准备和提升简历。

上课频率: 1 周, 每周5节课,每节课2-3小时

  • 第 10 周

    Resume and interview preparation

    Career guide: BA/DA vs DS/DE

    OA 1

    [Coding] Probability, Sampling, Randomization

    OA 2

第 4 阶段

4+案例分析与项目实战,加强您的分析能力和统计知识,夯实SQL和Python基础,提升沟通等软实力,帮助您顺利通过商业分析岗位面试。

上课频率: 1个月,每周4节课,每节课2-3小时

  • 第 11 周

    BA track introduction (& mock interview) & final project presentation

    Data visualization

    Data visualization in Python and Tableau

    [Coding-for-BA] Queue, Stack

  • 第 12 周

    eCommerce deep dive 1: System design

    eCommerce deep dive 2: Data driven marketing

    eCommerce deep dive 3: Data lab

    [Coding-for-BA] HashTable

  • 第 13 周

    Case study deep dive 1

    Case study deep dive 2

    Case study deep dive 3

    [Coding-for-BA] String practice

  • 第 14 周

    Time related data 1

    Time related data 2

    Time related data 3

    [Coding-for-BA] String practice

  • 第 15 周

    Supply chain data 1

    Supply chain data 2

    Mock interview session 1

    Review of BA/DA track

* 每期课程均有不同程度的修改,实际课纲以上课公布为准

常见问题

即将开课。关注我们获取最新信息

$6,500 USD

  • 班主任责任制,及时追踪进度
  • 5大互动平台,7天24小时答疑
  • 全明星导师,全程实时直播授课
  • 1v1简历修改、模拟面试与内推
  • 10大工业级别项目,提高动手能力
  • 30+ Python课程,突破编程面试
免费试听
QR Code

扫描上方二维码
联系来Offer课程顾问

咨询课程与报名