叶梓
  • 叶梓国内知名上市IT企业的资深技术专家,高级工程师
  • 擅长领域: 人工智能 大数据
  • 讲师报价: 面议
  • 常驻城市:上海市
  • 学员评价: 暂无评价 发表评价
  • 助理电话: 13006597891 QQ:2116768103 微信扫码加我好友
  • 在线咨询

大数据

主讲老师:叶梓
发布时间:2021-05-21 14:49:08
课程详情:

课时一:概念综述

1、 大数据的定义由来和原因

2、 大数据的6V特征

3、 从数据库,数据仓库到大数据

4、 大数据相关技术和处理

 

课时二:Hadoop生态圈、spark生态圈、搜索引擎概述

1、 hadoop:HDFS、Map-Reduce、Hbase、Hive等

2、 spark:scala、spark-SQL、spark-Streaming等

3、 搜索引擎:lucene(solr)、ES

4、 并发的机器学习工具:R-hadoop、spark-MLLIB、 spark-R、pyspark

 

课时三:存储在hbase中的数据

1、 NoSQL(key-value)

2、 Hbase:安装

3、 行键与列簇

4、 如何利用Hbase的特点存储数据

5、 应用程序如何访问Hbase中的数据

6、 数据迁移:sqoop

7、 Hbase的应用场景

 

课时四:Hive:为用SQL的开发者留的活路

1、 Hive:安装(单用户与多用户)

2、 Hive:基本操作

3、 Hive:与典型的关系型数据库的区别

4、 如果“想慢”,你可以这样…(不恰当使用hive的案例介绍)

5、 Hive的应用场景

 

课时五:Spark各组件在卫生领域的应用

1、 Hadoop最大的特点是什么?

2、 Spark概述与安装

3、 Scala:你可以一直“点”下去

4、 RDD:“映射”、“转换”解决一切

5、 spark-SQL

6、 spark-streaming

7、 spark的其他组件

8、 应用场景

 

课时六:机器学习算法介绍—I

1、 综述(人工智能、数据挖掘、机器学习、机器智能、大数据:这些词的确切含义)

2、 监督学习、无监督学习与强化学习

3、 工具:R、Python等

4、 决策树详解(熵、贪心法、连续的和离散的)

5、 神经网络详解(神经元、激励函数、前馈神经网络的BP算法,其他神经网络)

 

课时七:机器学习算法介绍—II

1、 关联规则详解(频繁项集、Apriori、支持度、置信度)

2、 聚类详解(k-means、k-medoid)

3、 常见算法的简述(Naïve-Bayes、k-NN、HMM、SVM等)

 


授课见证
推荐讲师

马成功

Office超级实战派讲师,国内IPO排版第一人

讲师课酬: 面议

常驻城市:北京市

学员评价:

贾倩

注册形象设计师,国家二级企业培训师,国家二级人力资源管理师

讲师课酬: 面议

常驻城市:深圳市

学员评价:

郑惠芳

人力资源专家

讲师课酬: 面议

常驻城市:上海市

学员评价:

晏世乐

资深培训师,职业演说家,专业咨询顾问

讲师课酬: 面议

常驻城市:深圳市

学员评价:

文小林

实战人才培养应用专家

讲师课酬: 面议

常驻城市:深圳市

学员评价: