主办单位: | 泰迪杯数据挖掘挑战赛组委会 |
承办单位: | 广东泰迪智能科技股份有限公司 |
协办单位: | 人民邮电出版社有限公司 |
北京泰迪云智信息技术研究院 |
互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。目前各院校的大数据专业教师匮乏、相关落地动手实战应用能了欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据专业教师队伍,推动各院校建立大数据人才培训体系和评价体系,泰迪科技推出全国高校大数据与人工智能骨干师资研修班,每年在全国范围内滚动开展八期师资课程,截止目前已在全国巡回举办40余场,参训教师近5000人次,2021年第二期全国高校大数据与人工智能师资研修班将开设四大课题方向:“网络爬虫与数据处理、数据挖掘与机器学习实战、金融数据分析实战、深度学习实战”,本次研修班采用线上以云课堂形式举办,现将有关详细安排通知如下:
专题一 网络爬虫与数据处理
一、课程介绍
人工智能时代的来临,随着互联网数据越来越开放,越来越丰富。基于大数据来做的事也越来越多。数据分析服务、互联网金融、数据建模、医疗病例分析、自然语言处理、信息聚类,这些都是大数据的应用场景,而大数据的来源都是利用网络爬虫来实现。
本次培训采用“云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。讲解数据采集常用手段、数据清洗、数据可视化和项目代码实战,梳理技术框架。
二、课程目标级收获
1、通过学习本次课程,可以完整地学习数据获取、清洗、统计、分析、可视化等数据处理周期的主要技术,也可以培养计算思维、数据思维及采用程序设计方法解决计算问题的实战能力。
2、本课程配套有基础知识内容,可使零基础学员快速入门,带领学员迅速掌握python编程,了解网络爬虫的基本概念及相关实现,讲解常见的爬虫套路并利用相关实战帮助学员提高数据采集能力,避免没有数据可分析的尴尬。
3、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
4、全面实战数据分析流程,包括数据采集、数据处理、数据探索、数据可视化等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
5、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。
6、无论是前置学习篇还是案例集训篇,相关代码、源数据、ppt、案例素材全部提供下载,即学即用,教学跟轻松!视频内容支持六个月内免费回看,以便复习和参考。
三、课程大纲
基础篇 (报名成功后即可开始学习) | ||
---|---|---|
时间 | 课程内容 | 学习平台 |
正式培训前 | python编程基础 1 准备工作 2 列表操作 3 程序流程控制语句 4 字符串操作 4.1 字符串及其索引&切片 4.2 字符串的常见方法 4.3 字典的创建及索引 4.4 字典常用操作 4.5 字典推导式 5 python文件读取操作 5.1 python读取文件 5.2 练习3:统计小说中的单词频次 6 函数 6.1 python函数自定义 6.2 练习4:自定义求序列偶数个数的函数 7 面向对象与模块 7.1 python方法与函数对比介绍 7.2 python面向对象示例 7.3 python模块使用 7.4 第三方库的安装与调用 8 注意事项 8.1 python工作路径说明 8.2 模块命令及存放路径的注意事项 8.3 结语 | 泰迪云课堂 |
核心课程篇 | ||
时间 | 课程内容 | 学习平台 |
第一课 python数据处理与可视化 | ||
4月9日 18:30 - 22:00 | 1 python数据分析概述 1.1 认识数据分析 1.2 熟悉python数据分析的工具 1.3 安装anaconda与启动jupyter notebook 1.4 掌握jupyter notebook常用功能 2 numpy数值计算基础 2.1 掌握numpy数组对象 2.2 掌握numpy矩阵与通用函数 2.3 利用numpy进行统计分析 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
4月10日 18:30 - 22:00 | 3 matplotlib数据可视化基础 3.1 了解绘图基础语言与常用参数 3.2 分析特征间的关系 3.3 分析特征内部数据分布于分散状况 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
4月11日 18:30 - 22:00 | 4 pandas统计分析基础 4.1 pandas简介 4.2 读写不同数据源的数据 4.3 数据框与数据框元素 4.4 转换与处理时间序列数据 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第二课 python网络爬虫:概述与静态网页采集 | ||
4月12日 18:30 - 22:00 | 1 python网络爬虫实战介绍 2 网页前端基础 3 简单静态网页爬取(实训:采集泰迪科技威尼斯5139手机版官网标题栏信息) | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第三课 python网络爬虫:动态网页采集与模拟登陆 | ||
4月13日 18:30 - 22:00 | 4 常规动态网页爬取(实训:采集人邮威尼斯5139手机版官网新书资讯) 4.1 常规动态网页爬取概述 4.2 逆向分析爬取动态网页 4.3 使用selenium打开浏览对象 4.4 selenium页面等待 4.5 使用selenium获取图书信息 4.6 小结 5 模拟登录 5.1 模拟登录概述 5.2 查找表单数据入口及提交数据 5.3 验证码人工处理与代理ip 5.4 使用post请求方法登录 5.5 使用浏览器cookies登录 5.6 基于表单登录的cookies登录 5.7 小结 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第四课 python网络爬虫:终端协议分析与scrapy爬虫 | ||
4月14日 18:30 - 22:00 | 6 终端协议分析 6.1 终端协议分析概述 6.2 了解http analyzer工具 6.3 爬取千千音乐pc客户端数据 6.4 小结 7 scrapy爬虫 7.1 了解scrapy爬虫框架 7.2 熟悉scrapy的常用命令 7.3 创建scrapy爬虫项目:爬取网页动态信息 7.4 修改itempipelines脚本 7.5 编写spiders脚本 7.6 修改setting脚本 7.7 定制中间件 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第五课 数据采集与处理实战:《红海行动》b站弹幕采集与分析 | ||
4月15日 18:30 - 22:00 | 1.1 案例背景与挖掘目标 2.1 弹幕数据爬取介绍 2.2 获取视频的cid 2.3 使用request.get方法访问弹幕url 2.4 使用lxml解析器解析页面 2.5 时间戳转换格式 2.6 数据整理与保存 3.1 弹幕正文数据预处理 3.2 词频统计 3.3 绘制整体弹幕数据的词云图 4.1 弹幕数量与日期的关系 4.2 弹幕数量与时刻的关系 4.3 弹幕字数统计分析 5.1 总结 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第六课 数据采集与处理实战:某品牌手机的京东评论数据采集与分析 | ||
4月16日 18:30 - 22:00 | 1.1 案例背景与挖掘目标 2.1 数据采集流程介绍 2.2 逆向分析获取评论数据url 2.3 使用request.get方法访问评论url 2.4 提取数据并保存到本地 3.1 生成好评的词云,并且货期关键字 3.2 生成中评的词云,并且获取关键字 3.3 生成差评的词云,并且获取关键字 3.4 分析购买该商品不同颜色的比例 3.5 分析购买该商品不同配置的比例 3.6 分析该商品的销售数量和评论数量和时间的关系 3.7 分析该商品不同省份购买的比例 3.8 分析该商品不同渠道的销售比例 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第七课 数据采集与处理实战:大数据岗位威尼斯5139手机版的人才招聘信息的分析与挖掘 | ||
4月17日 9:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1.1 背景与目标 2.1 信息爬取介绍 2.2 获取岗位名称数据 2.3 获取目录页的所有字段信息 2.4 获取二级网址的网页链接 2.5 获取二级网址的所有字段信息 2.6 对单一目录页中的所有二级网页信息进行爬取 2.7 将第一个目录页的数据进行保存 2.8 批量爬取及数据保存 3.1 已爬取数据介绍 3.2 根据岗位名筛选招聘信息 3.3 统一岗位名称 3.4 根据工作列筛选数据 3.5 完成工资数据处理 3.6 工作地点字段处理 3.8 行业字段数据处理 3.9 工作描述字段处理 3.10 公司规模字段处理 3.11 数据预处理小结 4.1 热门招聘岗位可视化 4.2 热门行业及公司招聘分析 4.3 热门岗位的工资水平 4.4 可视化综合分析 4.5 岗位技能分析 5 总结 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
自行安排 | 拓展自学 python爬虫助力疫情数据追踪 1 明确项目需求与目标 2 环境准备 3 获取疫情数据(全球、中国各省及各地区数据) 4 疫情数据分析 5 疫情数据可视化 6 完成分析报告 | 泰迪云课堂 |
第八课 在线考试 | ||
4月18日 19:00 - 21:30 | 高级python技术应用工程师职业技术在线考试 | 泰迪云课堂 |
四、证书认证
学员经在线培训并考试合格后,可以获得高级python技术应用工程师职业技术证书。
专题二 数据挖掘与机器学习实战
一、课程介绍
随着大数据时代的到来,对于数据的要求不仅仅是存储和管理,更重要的是需要对大量数据进行分析、加工最后再决策。数据分析与挖掘可以从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值
本次培训采用“云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导”结合的方式,主要讲解了使用python进行数据分析与挖掘的相应理论与代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何何实际结合,做到更好的进行教育教学工作。
二、课程目标及收获
1、本课程全程强调动手实操:内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作,实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、全面时间商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
4、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。
5、无论是前置学习篇还是案例集训篇,相关代码、数据源、ppt、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。
三、课程大纲(线上)
基础篇 (报名成功后即可开始学习) | ||
---|---|---|
时间 | 课程内容 | 学习平台 |
正式培训前 | python编程基础 1 准备工作 2 列表操作 3 程序流程控制语句 4 字符串操作 4.1 字符串及其索引&切片 4.2 字符串的常见方法 4.3 字典的创建及索引 4.4 字典常用操作 4.5 字典推导式 5 python文件读取操作 5.1 python读取文件 5.2 练习3:统计小说中的单词频次 6 函数 6.1 python函数自定义 6.2 练习4:自定义求序列偶数个数的函数 7 面向对象与模块 7.1 python方法与函数对比介绍 7.2 python面向对象示例 7.3 python模块使用 7.4 第三方库的安装与调用 8 注意事项 8.1 python工作路径说明 8.2 模块命令及存放路径的注意事项 8.3 结语 | 泰迪云课堂 |
核心课程篇 | ||
时间 | 课程内容 | 学习平台 |
第一课 | ||
4月10日 18:30 - 22:00 | 1 python数据分析概述 1.1 认识数据分析 1.2 熟悉python数据分析的工具 1.3 安装anaconda与掌握jupyter notebook常用功能 2 numpy数值计算基础 2.1 掌握numpy数组对象 2.2 掌握numpy矩阵与通用函数 2.3 利用numpy进行统计分析 3 pandas统计分析基础 3.1 pandas简介 3.2 读写不同数据源的数据 3.3 数据框与数据框元素 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
4月11日 18:30 - 22:00 | 3.4 转换与处理时间序列数据 3.5 使用分组聚合进行组内计算 3.6 创建透视表与交叉表 4 使用pandas进行数据预处理 4.1 合并数据 4.2 清洗数据 4.3 标准化数据 4.4 转换数据 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第二课 python数据分析实训 | ||
4月12日 18:30 - 22:00 | 1 探索iris鸢尾花数据 1.1 将数据集存成变量iris创建数据框的列名称 1.2 数据框中有缺失值吗? 1.3 将列petal_length的第10到19行设置为缺失值 1.4 将petal_length缺失值全部替换为1.0 1.5 删除列class 1.6 将数据框前三行设置为缺失值 1.7 删除有缺失值的行 1.8 重新设置索引 2 探索chipotle快餐数据 2.1 将数据存入一个名为chipo的数据框内 2.2 查看前10行内容 2.3 数据集中有多少个列(columns)? 2.4 打印出全部的列名称 2.5 数据集的索引是怎样的? 2.6 被下单数最多商品(item)是什么? 2.7 在item_name这一列中,一共有多少种商品被下单? 2.8 一共有多少个商品被下单? 2.9 将item_price转换为浮点数 2.10 在该数据集对应的时期内,收入(revenue)是多少? 2.11 在该数据集对应的时期内,一共有多少订单? 2.12 每一单(order)对应的平均总价是多少? 3 探索apple公司股价数据 3.1 读取"appl_1980_2014.csv"数据并存为一个名叫apple的数据框 3.2 查看每一列的数据类型 3.3 将date这个列转换为datetime类型 3.4 将date设置为索引 3.5 有重复的日期吗? 3.6 将index设置为升序 3.7 找到每个月的最后一个交易日(businessday) 3.8 数据集中最早的日期和最晚的日期相差多少天? 3.9 在数据中一共有多少个月? 3.10 按照时间顺序可视化adj closs值 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第三课 python数据可视化 | ||
4月13日 18:30 - 22:00 | 1 matplotlib数据可视化基础 1.1 掌握绘图基础语法与常用参数 1.2 分析特征间关系 1.3 分析特征内部数据分布与分散情况 2 pyecharts实现交互式绘图 2.1 pyecharts简介与绘图逻辑说明 2.2 pyecharts绘制散点图 2.3 pyecharts绘制线图 2.4 pyecharts绘制饼图 2.5 pyecharts绘制柱状图 2.6 pyecharts图形组合 3 地理图表绘制 3.1 pyecharts地理图表介绍 3.2 pyecharts绘制地理散点图 3.3 pyecharts绘制地理迁徙图 3.4 pyecharts绘制广东区域图 4 小结 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第四课 数据可视化实战案例:全国汽车销量可视化 | ||
4月14日 18:30 - 22:00 | 1 读取数据 2 数据探索 3 汽车销量数据分析 3.1 市场需求 3.2 消费能力 3.3 企业竞争 3.4 热销车型 3.5 销售量随时间的变换情况 3.6 地理图表示不同城市、不同省份的销量情况 4 车企年度销量目标 5 汇总 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第五课 机器学习实战 | ||
4月15日 18:30 - 22:00 | 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量python实现 3.1 线性回归基本形式 3.2 线性回归模型的python实现 3.3 波士顿房价预测的python实现 3.4 逻辑回归介绍 3.5 研究生入学录取预测的python实现 4.1 从女生相亲到决策树 4.2 明天适合打球吗? 4.3 决策树拆分属性选择 4.4 决策树算法家族 4.5 泰坦尼克号生还者预测-数据预处理 4.6 泰坦尼克号生还者预测-模型构建与预测 4.7 决策树可视化 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
4月16日 18:30 - 22:00 | 5.1 聚类分析概述 5.2 相似性度量 5.3 k-means聚类分析算法介绍 5.4 利用k-means算法对鸢尾花进行聚类 5.5 聚类结果的性能度量 5.6 调用sklearn实现聚类分析 6.1 间隔与支持向量 6.2 对偶问题 6.3 核函数 6.4 软间隔与正则化 6.5 支持向量机算法的python实现 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第六课 机器学习实战案例:运营商流失用户的分析与预测 | ||
4月17日 9:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1.1 背景与目标 1.2 数据预处理 1.3 流失用户的特征分析 1.4 模型的建立与求解 1.5 最优模块的选择及预测 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第七课 综合实战:电商智能推荐-优惠券使用预测 | ||
4月18日 9:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1 背景与目标 2 数据说明 2.1 线下训练集数据介绍 2.2 线上训练集数据介绍 2.3 测试数据介绍 2.4 项目流程介绍 3 数据预处理 3.1 构建正样本 3.2 构建负样本 3.3 构建样本标签 4 特征构建 4.1 特征构建介绍 4.2 处理discount_rate列 4.3 特征1-折扣率 4.4 特征2-商户与用户之间的距离 5 模型训练 5.1 建模前数据准备 5.2 初级模型构建 5.3 roc曲线与auc值 5.4 模型性能评估 5.5 训练函数封装 5.6 模型预测 5.7 预测函数封装 6 特征完善 6.1 特征3-优惠券流行度 6.2 特征4-用户在商家中的消费次数 6.3 如何进行特征拼接 6.4 拼接训练集的特征3&4 6.5 拼接测试集的特征3&4 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第八课 在线考试 | ||
4月19日 19:00 - 21:30 | 高级大数据技术应用职业技术在线考试 | 泰迪云课堂 |
四、证书认证
学员经在线培训并考试合格后,可以获得高级大数据技术应用职业技术证书"。
专题三 金融数据分析实战
一、课程介绍
传统投资和量化投资两种投资方式的核心都是由人来决策,量化投资可用计算机技术,通过建模分析、优化参数等手段,从历史金融数据中挖掘出影响投资的指标,使用程序进行自动交易来获得“超额”的收益。虽然量化方法在投资中得到了越来越广泛的运用,量化交易蓝海迅速升温,但高精尖人才扎堆,入门门槛受限于“金融”、“编程”、“建模”这三座大山。对应的,我们要从量化投资的底层基础入手,关键是跟实际应用和市场结合,学了要会用才好。
本次培训采用“云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导”结合的方式,帮助老师全面了解量化投资行业,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。
二、课程特色
1、本课程全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能。
2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、课程最注重实用性,将从量化投资的实际应用出发,贴近市场的实践。不仅仅讲解工具使用,更是培养策略化思维。课程中每一个知识点都会结合项目案例进行讲解,项目提供源码同步运行,理论实战并行,从实战中积累经验,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
4、通过学习,可以取得如下收获:
1)熟悉中国主要金融市场既交易产品的交易机制;
2)熟知国内外期货交易、股市交易的异同点和内在运行机制;
3)掌握经典量化策略细节及其背后交易哲学;
4)掌握金融、编程和建模知识基础,拥有量化交易实盘操作能力;
5)具备独立自主地研发新量化交易策略的能力;
6)掌握量化交易模型设计的基本框架,以及资产组合理论的实际运用;
7)掌握从策略思想>策略编写>策略实现完整量化投资决策过程。
5、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。
6、无论是前置学习篇还是案例集训篇,相关代码、源数据、ppt、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月免费回看,以便复习和参考。
三、课程大纲
基础篇 (报名成功后即可开始学习) | ||
---|---|---|
时间 | 课程内容 | 学习平台 |
正式培训前 | 1 python简介和安装 2 数据类型 3 数据运算符 4 循环和条件语句 5 函数创建与案例实现 6 numpy工具包与案例实现 7 pandas工具包与案例实现 | 泰迪云课堂 |
核心课程篇 | ||
时间 | 课程内容 | 学习平台 |
第一课 金融量化基础与数据提取 | ||
4月18日 18:30 - 22:00 | 1 股票量化基础 2 期货量化基础 3 案例:分析期货品种流动性和波动性 4 基金量化基础 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第二课 金融数据处理与可视化分析 | ||
4月19日 18:30 - 22:00 | 1 金融数据读取和存储 2 金融数据处理 3 金融时间数据转化和处理 4 金融数据可视化 5 案例:沪深300指数数据时间分析 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第三课 量化投资基础 | ||
4月20日 18:30 - 22:00 | 1 量化理论基础 2 量化策略基础 3 策略评论指标构建 4 技术形态指标分析和实践 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第四课 金融统计模型 | ||
4月21日 18:30 - 22:00 | 1 线性回归模型 2 时间序列模型 3 协整模型 4 python实现期权定价 5 python实现最优投资组合管理 6 python分析实现在险价值var | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第五课 经典量化策略实现 | ||
4月22日 18:30 - 22:00 | 1 均线交易策略实现 2 动量交易策略实现 3 均值反转策略实现 4 配对交易策略实现 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第六课 量化交易策略实现和回测 | ||
4月23日 18:30 - 22:00 | 1 策略回测框架介绍 2 策略构建思路 3 案例:使用框架实现biasaverage策略构建 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第七课 股票因子分析 | ||
4月24日 18:30 - 22:00 | 1 因子数据处理 2 单因子有效性检验 3 多因子分析 4 案例:构建简单多因子选股策略 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第八课 综合实战:cta策略构建 | ||
4月25日 9:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1 dual turust策略构建 2 海龟交易策略构建 3 统计套利策略构建 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第九课 综合实战:多因子选股策略构建 | ||
4月26日 9:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1 案例:资产资本定价模型构建选股策略 2 案例:fama三因子模型选股策略构建 3 案例:实现基于支持向量机模型的多因子选股策略 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第十课 在线考试 | ||
4月27日 19:00 - 21:30 | 高级大数据技术应用职业技术在线考试 | 泰迪云课堂 |
四、证书认证
学员经在线培训并考试合格后,可以获得高级大数据技术应用职业技术证书。
专题四 深度学习实战
一、课程介绍
本次培训采用"云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导"结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅。讲解数据分析与挖掘、机器学习与深度学习、人工智能项目实训的模型理论和项目代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的及逆行教育教学工作。
二、课程特色
1、零基础快速入门,带领学员迅速掌握python编程,了解机器学习基本概念及相关实现,使得学员能使用python编写程序并实现深度学习常见任务。视频制作精良,讲师真人出镜,系统梳理深度学习的学习路线,全程强调动手实操,内容以代码落地为主,助力python深度学习快速入门。
2、核心课程内容讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、全面实践深度学习项目实现流程,包括数据处理、数据探索、深度学习模型构建等课程提供知识讲解,注重案例实战,提供在线解答疑难等优质服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
4、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。
5、无论是前置学习篇还是案例集训篇,相关代码、源数据、ppt、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月免费回看,以便复习和参考。
三、课程大纲
基础篇 (报名成功后即可开始学习) | ||
---|---|---|
时间 | 课程内容 | 学习平台 |
正式培训前 | 1 准备工作 2 列表操作 3 程序流程控制语句 4 字符串操作 4.1 字符串及其索引&切片 4.2 字符串的常见方法 4.3 字典的创建及索引 4.4 字典常用操作 4.5 字典推导式 5 python文件读取操作 5.1 python读取文件 5.2 练习3:统计小说中的单词频次 6 函数 6.1 python函数自定义 6.2 练习4:自定义求序列偶数个数的函数 7 面向对象与模块 7.1 python方法与函数对比介绍 7.2 python面向对象示例 7.3 python模块使用 7.4 第三方库的安装与调用 8 注意事项 8.1 python工作路径说明 8.2 模块命令及存放路径的注意事项 8.3 结语 | 泰迪云课堂 |
1 python数据分析概述 1.1 认识数据分析 1.2 熟悉python数据分析的工具 1.3 安装python3的anaconda发行版 1.4 掌握jupyter notebook常用功能 2 numpy数值计算基础 2.1 认识numpy数组对象ndarray 2.2 认识numpy矩阵与通用函数 2.3 利用numpy进行统计分析 3 matplotlib数据可视化基础 3.1 了解绘图基础语言与常用参数 3.2 分析特征间的关系 3.3 分析特征内部数据分布于分散状况 4 pandas统计分析基础 4.1 读写不同数据源的数据 4.2 掌握dataframe的常用操作 4.3 转换与处理时间序列数据 4.4 使用分组聚合进行组内计算 4.5 创建透视表与交叉表 5 使用pandas进行数据预处理 5.1 合并数据 5.2 清洗数据 5.3 标准化数据 5.4 转换数据 | ||
python机器学习实战 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 3 回归分析(regressionanalysis) 3.1 线性回归基本形式 3.2 线性回归模型的python实现 3.3 波士顿房价预测的python实现 3.4 逻辑回归介绍 3.5 研究生入学录取预测的python实现 | ||
核心课程篇 | ||
时间 | 课程内容 | 学习平台 |
第一课 深度学习基础-人工神经网络 | ||
4月19日 18:30 - 22:00 | 1 单个神经元介绍 2 经典网络结构介绍 3 神经网络工作流程演示 4 如何修正网络参数、梯度下降 5 网络工作原理推导 6 网络搭建准备 7 样本从输入层到隐层传输的python实现 8 网络输出的python实现 9 单样本网络训练的python实现 10 全样本网络训练的python实现 11 网络性能评价 12 调用sklearn实现神经网络算法 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第二课 深度学习框架-tensorflow2实战 | ||
4月20日 18:30 - 22:00 | 1任务1:构建一个线性模型 1.1 tensorflow介绍 1.2 tensorflow2常用数据类型和操作 1.3 初始化模型 1.4 构建损失函数 1.5 模型训练及可视化 1.6 使用高阶api -keras 2 任务2:mnist手写数字识别 2.1 数据读取及探索 2.2 交叉熵 2.3 模型构建及训练 2.4 调用保存好的模型对新样本进行预测 3 作业-鸢尾花分类 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第三课 人工智能核心课程-深度神经网络 | ||
4月21日 18:30 - 22:00 | 1.1 深度神经网络-引言 2 卷积神经网络cnn 2.1 浅层神经网络的局限 2.2 卷积操作 2.3 卷积操作的优势 2.4 池化及全连接 2.5 高维输入及多filter卷积 2.6 实现卷积操作 2.7 实现池化操作 3 循环神经网络rnn 3.1 循环神经网络简介 3.2 循环神经网络的常见结构 4 长短时记忆网络lstm 4.1 lstm的三个门 4.2 lstm三个门的计算示例 4.3 利用rnn&lstm实现mnist手写数字识别 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
4月22日 18:30 - 22:00 | 5.1 自然语言处理简介 5.2 开源中文nlp系统介绍 5.3 中文分词介绍 5.4 机械分词法 5.5 机器学习算法分词 5.6 nlp概率图介绍 5.7 jieba分词演示 6.1 文本的one-hot表达 6.2 文本的tf-idf表达 6.3 tf-idf权值策略实现 6.4 模型训练与预测 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第四课 自然语言处理实战-路透社新闻分类 | ||
4月23日 18:30 - 22:00 | 1 项目背景与目标 2 数据探索分析 2.1 读取新闻数据 2.2 了解数据的基本情况 3 词嵌入(word embedding) 3.1 word embedding的基本概念 3.2 word2vec介绍 3.3 cbow词向量训练过程 4 构建模型 4.1 数据padding 4.2 网络结构中的embedding层 4.3 构建rnn网络模型 4.4 模型训练及评估 5 模型优化 5.1 词向量预训练 5.2 模型优化 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第五课 自然语言处理实战-智能应答模型应用 | ||
4月24日 09:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1.1 案例背景 2.1 语料库介绍 2.2 语料库预处理 2.3 整理代码 3.1 模型前准备工作说明 3.2 数据准备 3.3 模型结构说明 3.4 基于注意力的seq2seq模型搭建 3.5 前向传播实现 3.6 反向传播:计算梯度并更新参数 3.7 模型批训练 3.8 模型调用测试 4.1 使用flask进行模型测试与展示 5.1 拓展思考 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第六课 综合实战:搭建一个智能车牌识别系统 | ||
4月25日 09:00 - 12:00 14:00 - 17:00 18:30 - 22:00 | 1.1 案例背景 1.2 项目流程介绍 2.1 数据介绍 2.2 图片数据批量加载 3.1 物体检测概述 3.2 车牌检测模型 3.3 调用模型进行车牌检测并保存文件 4.1 搭建车牌识别网络 4.2 模型批训练并打印训练结果 5.1 调用训练好的模型进行测试 5.2 实时测试照片车牌 6 小结与拓展思考 | 泰迪云课堂 |
操作演练/作业 | 个人pc | |
在线答疑 | 微信群 | |
第七课 在线考试 | ||
4月26日 19:00 - 21:30 | 高级机器学习工程师职业技术在线考试 | 泰迪云课堂 |
四、证书认证
学员经在线培训并考试合格后,可以获得高级机器学习工程师职业技术证书"。
课程主讲师资介绍
张敏 广东泰迪科技高级、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通python、r语言、matlab等多种数据挖掘工具。擅场市场发展情况监控、精确营销封面的数据挖掘工作。有位南方电网、主讲数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年"泰迪杯数据挖掘挑战赛教练员培训"主讲讲师,2018年广东省python与深度学习技术师资培训班主讲讲师,2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《》、《》、《r语言编程基础》等。 | |
蔡景波 点宽量化研究部主管。曾任私募的资管部主管,专注于期货策略,曾构建多套期货套利策略,带领团队将套利策略应用于外盘期货,实盘业绩稳健盈利。目前主要负责股票多因子以及数据挖掘方面等项目,目前已为十多家高校师生提供量化实践教育培训服务。第一届粤港澳金融数学建模竞赛专家组成员,点宽量化学院导师,主导量化新兵训练营、量化提升特训营、python数据分析特训营等线上培训项目。 | |
张新福 点宽高级量化研究员。暨南大学金融专业硕士,擅长利用python进行数据分析与机器学习;熟悉股票市场规律,擅长利用数据分析研究市场并构建较为优质的量化投资策略,同时具备较为扎实的财务基础,擅长构建深度学习模型对上市公司进行研究。曾就职于著名券商及期货公司,从事上市公司研究及相关数据挖掘。 | |
冯嘉尧 点宽高级量化研究员。英国国王学院金融数学硕士、英国雷丁大学数学统计本科一等学位。擅长运用统计学模型进行数据分析,如聚类分析,因子分析,结构性数据建模和广义线性分析。具备c 金融数据建模,机器学习模型和金融统计学等知识,能很好地结合金融和数学知识进行金融市场分析。 | |
杨惠 广东泰迪科技高级,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如ppv商业培训、泰迪大数据师资培训、珠海城职院数据分析培训;2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师;2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络rnn,熟悉常用机器学习算法原理及应用,如神经网络、svm、决策树、贝叶斯等算法;精通r、python、matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如"京东电商产品评论情感分析"项目;"珠江数码大数据营销推荐应用"项目;"电子商务网站智能推荐服务"项目。 |
报名须知与威斯尼斯人0907官方网站的联系方式
报名须知 | |||||
---|---|---|---|---|---|
专题 | 时长 | 开课日期 | 费用(元) | ||
课程安排 | 一 | 网络爬虫与数据处理 | 10天共80课时 | 2021年4月9-18日 | 1980元 |
二 | 数据挖掘与机器学习实战 | 10天共80课时 | 2021年4月10-19日 | 1980元 | |
三 | 金融数据分析实战 | 10天共80课时 | 2021年4月18-27日 | 2480元 | |
四 | 深度学习实战 | 8天共70课时 | 2021年4月19-26日 | 2480元 | |
1 费用:包含报名费、学习费、资料费、证书费等。 2 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,.jpg格式,14-20k大小) 3 本次用广东泰迪智能科技股份有限公司收取费用并开具发票。 4 本期研修班两专题及以上联报者可享受九折优惠。 |
威斯尼斯人0907官方网站的联系方式:
联系人:曾老师 微 信:antonia602501
手 机:13246821827 邮 箱:zengaizhi@tipdm.com
请下载附件:2021年全国高校大数据与人工智能师资研修班邀请函 和 报名回执表