主办单位: | 泰迪杯数据挖掘挑战赛组委会 |
承办单位: | 广东泰迪智能科技股份有限公司 |
协办单位: | 人民邮电出版社有限公司 |
北京泰迪云智信息技术研究院 |
各有关院校
国家十三五规划纲要明确提出“实施国家大数据战略,推进数据资源开放共享”,为我国在大数据领域的未来发展绘制了宏伟的蓝图,开启了我国大数据发展的新时代。教育部《高等学校人工智能创新行动计划》及国务院颁布的《新一代人工智能发展规划》,责成科技司、基教司、职成司、高教司、地方各级教育行政部门大力推动人工智能、大数据等新技术在教育教学中的深入应用,推进信息技术与高等教育教学深度融合。从发布对人工智能、大数据等新技术与教育结合的指导性文件到直接扶持建设相关教学项目,为高校进行教学改革和升级教学手段和方式指明了新的方向。
大数据及人工智能产业的发展对人才提出了新的需求,国内各高校在积极进行学术研究的同时,已经将大数据与人工智能教育纳入培养体系。为帮助高校适时调整课程体系、继续深化教学改革,指导数据智能学科建设和跨学科人才培养,进一步提升教学能力和科研能力,泰迪杯数据挖掘挑战赛组委会将继续推动大数据与人工智能人才培养工程行动计划,2020年第五期“全国高校python数据分析与机器学习实战师资研修班”将以线上云课堂形式举办, 现将有关通知如下:
一、培训目标及特点
1、为参训教师提供大数据教学领域全套工具、服务、平台、数据、案例及在线课程等资源,为在高校开展大数据教育工作、培养大数据人才的教师提供深入培训及交流机会。后续将为学校开展大数据相关课程设计与实践提供完整的威斯尼斯人0907官方网站的解决方案和全方位授课支持。
2、本次培训采用云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导结合的方式,全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。
3、本次培训将系统讲授大数据人工智能课程知识体系、授课方法、实验环境搭建、基础编程、实训实验室建设、高校课程公共服务平台资源使用指南等方面的内容,使学员能够深入了解当下大数据与人工智能技术在世界范围内的最新发展水平,理解大数据与人工智能技术在当代各种相关产品中的应用,并掌握该领域最关键技术的原理,以及技术应用过程,旨在帮助参加培训的教师快速建立对相关课程的整体性认识,为高职院校备课和顺利开课、科研和项目开发工作打下坚实基础。
4、本次培训课程内容以“鱼骨教学法”进行编排设计,所有课程将围绕真实企业项目展开,强调培训的实战性和真实性。让教师亲身接触企业一线工作场景,充分提升教师的实践教学能力。本次学习为每位参训学员提供系统的院校大数据专业建设方案,帮助各高职院校在专业课程体系建设提供全方位、强有力的教学资源支持。
5、本次课程通过讲授、研讨、动手实操、多种灵活有效的教学方式,加强大数据专业师资队伍的建设,提升教师教学创新思维。了解大数据及人工智能岗位目前的就业形势、前景及所需相关技能,了解企业实际需求,并参与一个实际项目的全过程,将培训转化成教学成果,运用到教师自己后续的教学当中去,全部提升教师实践教学能力。
6、了解高校大数据人工智能专业的教材、实验室、实训室建设内容、产品、科研和创新创业最新讯息。本次学习为每位参训学员提供大数据教学实训平台试用帐号、课程建设与程序设计的相关资源,丰富已开设大数据专业院校课程体系。
注:所有学员自备笔记本电脑(windows7或以上操作系统(64位)、4g 内存)、紧跟老师上课过程操作练习,完全学会经典案例开发技术,完全学会使用以上工具软件开发应用。
二、研修对象
各高职院校数据、大数据、人工智能相关学科、计算机、网络通信、自动化、电子工程、数理统计等专业的科研、教学带头人、骨干教师、博士生、硕士生、本科生、大专生;
从事计算机、云计算、大数据、人工智能、互联网等相关领域项目的科研院所的项目负责人、科研人员、工程技术人员等。
三、时间与方式
培训时间:2020年9月19日-28日(培训以线上云课堂形式进行,支持六个月内免费会看)
四、培训内容
python数据分析与机器学习实战班 | 培训时间:2020年9月19日-28日 | |
---|---|---|
第一阶段 前置基础 学员在正式培训前自学完成(学习网站:edu.tipdm.org) | ||
时间 | 课程内容 | 学习平台 |
正式培训前 | 1 准备工作 2 列表操作 3 程序流程控制语句 4 字符串操作 4.1 字符串及其索引&切片 4.2 字符串娥常见方法 4.3 字典的创建及索引 4.4 字典常用操作 4.5 字典推导式 5 python文件读取操作 5.1 python读取文件 5.2 练习:统计小说中的单词频次 6 函数 6.1 python函数自定义 6.2 练习:自定义求序列偶数个数的函数 7 面向对象与模块 7.1 python方法与函数对比介绍 7.2 python面向对象示例 7.3 python模块使用 7.4 第三方库的安装与调用 8 注意事项 8.1 python工作路径说明 8.2 模块命名及存放路径的注意事项 8.3 结语 | 泰迪云课堂 |
第二阶段 正式培训 | 培训时间: | 9月19日 - 28日 |
时间 | 课程内容 | 学习平台 |
第一课 | ||
9月19日 09:00 - 12:00 14:00 - 17:00 19:00 -21:00 9月20日 09:00 - 12:00 | 1 python数据分析概述 1.1 认识数据分析 1.2 熟悉python数据分析的工具 1.3 安装python的anaconda发行版 1.4 掌握jupyter notebook常用功能 2 numpy数值计算基础 2.1 认识numpy数组对象ndarray 2.2 认识numpy矩阵与通用函数 2.3 利用numpy进行统计分析 3 matplotlib数据可视化基础 3.1 了解绘图基础语法与常用参数 3.2 分析特征间的关系 3.3 分析特征内部数据分布与分散状况 4 pandas统计分析基础 4.1 读写不同数据源的数据 4.2 掌握dataframe的常用操作 4.3 转换与处理时间序列数据 4.4 使用分组聚合进行组内计算 4.5 创建透视表与交叉表 5 使用pandas进行数据预处理 5.1 合并数据 5.2 清洗数据 5.3 标准化数据 5.4 转换数据 6. 使用scikit-learn构建模型 6.1 使用sklearn转换器处理数据 6.2 构建并评价聚类模型 6.3 构建并评价分类模型 6.4 构建并评价回归模型 | 泰迪云课堂 |
第一课作业 | 个人pc | |
在线答疑 | 微信群 | |
第二课 python数据分析实训 | ||
9月20日 14:00 - 17:00 19:00 - 21:00 | 1 探索iris鸢尾花数据 1.1 将数据集存成变量iris创建数据框的列名称['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class'] 1.2 数据框中有缺失值吗? 1.3 将列petal_length的第10到19行设置为缺失值 1.4 将petal_length缺失值全部替换为1.0 1.5 删除列class 1.6 将数据框前三行设置为缺失值 1.7 删除有缺失值的行 1.8 重新设置索引 2 探索chipotle快餐数据 2.1 将数据集存入一个名为chipo的数据框内 2.2 查看前10行内容 2.3 数据集中有多少个列(columns)? 2.4 打印出全部的列名称 2.5 数据集的索引是怎样的? 2.6 被下单数最多商品(item)是什么? 2.7 在item_name这一列中,一共有多少种商品被下单? 2.8 一共有多少个商品被下单? 2.9 将item_price转换为浮点数 2.10 在该数据集对应的时期内,收入(revenue)是多少? 2.11 在该数据集对应的时期内,一共有多少订单? 2.12 每一单(order)对应的平均总价是多少? 3 探索apple公司股价数据 3.1 读取"apple_1980_2014.csv"数据并存为一个名叫apple的数据框 3.2 查看每一列的数据类型 3.3 将date这个列转换为datetime类型 3.4 将date设置为索引 3.5 有重复的日期吗? 3.6 将index设置为升序 3.7 找到每个月的最后一个交易日(businessday) 3.8 数据集中最早的日期和最晚的日期相差多少天? 3.9 在数据中一共有多少个月? 3.10 按照时间顺序可视化adj close值 | 泰迪云课堂 |
第二课作业 | 个人pc | |
在线答疑 | 微信群 | |
第三课 机器学习实战 | ||
9月21日 18:00 - 22:00 | 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量python实现 3 回归分析(regressionanalysis) 3.1 线性回归基本形式 3.2 线性回归模型的python实现 3.3 波士顿房价预测的python实现 3.4 逻辑回归介绍 3.5 研究生入学录取预测的python实现 4 聚类分析(clusteranalysis) 4.1 聚类分析概述 4.2 相似性度量 4.3 k-means聚类分析算法介绍 4.4 利用k-means算法对鸢尾花进行聚类 4.5 聚类结果的性能度量 4.6 调用sklearn实现聚类分析 | 泰迪云课堂 |
第三课作业 | 个人pc | |
在线答疑 | 微信群 | |
第四课 深度学习实战案例 | ||
9月22日 18:00 - 22:00 | 市财政收入分析预测 1 背景与案例目标 1.1 财政收入预测背景介绍 1.2 数据基本情况介绍 1.3 分析目标解读 1.4 项目流程介绍 2 相关系数分析 2.1 求解person相关系数 2.2 person相关系数解读 3 lasso回归特征提取 3.1 了解lasso回归方法 3.2 lasso回归选取关键特征的实现 3.3 lasso回归数据写出及相应解读 4 灰色预测模型 4.1 关键特征数据读取及准备 4.2 gm11特征值预测 4.3 gm11特征数据整理及写出 5 模型训练及预测 5.1 数据标准化 5.2 模型训练及预测 5.3 结果可视化 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第五课 文本挖掘实战 | ||
9月24日 18:00 - 22:00 | 1 自然语言处理简介 2 开源中文nlp系统介绍 3 中文分词介绍 4 机械分词法 5 机器学习算法分词 6 nlp概率图介绍 7 jieba分词演示 8 文本的one-hot表达 9 tf-idf权值策略实现 10 文本的tf-idf表达 11 模型训练与预测 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第六课 文本分类案例 | ||
9月25日 18:00 - 22:00 | 垃圾自动识别 1 背景与目标 2 数据探索 2.1 数据读取 2.2 数据抽取 3 数据预处理 3.1 去除短信中的x序列 3.2 结巴分词 3.3 去除停用词 3.4 数据预处理函数封装 3.5 垃圾短信的词频统计 3.6 词云图绘制 4 文本向量的表示 4.1 文本数据的向量化表达 4.2 获取训练样本的tf-idf权值向量 4.3 获取测试样本的tf-idf权值向量 5 模型训练及评价 6 小结 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
第七课 综合实战 | ||
9月26日 09:00 - 12:00 14:00 - 17:00 19:00 - 21:00 | 电商智能推荐:优惠券使用预测 1 背景与目标 2 数据说明 2.1 线下训练集数据介绍 2.2 线上训练集数据介绍 2.3 测试数据介绍 2.4 项目流程介绍 3 数据预处理 3.1 构建正样本 3.2 构建负样本 3.3 构建样本标签 4 特征构建 4.1 特征构建介绍 4.2 处理discount_rate列 4.3 特征1-折扣率 4.4 特征2-商户与用户之间的距离 5 模型训练 5.1 建模前数据准备 5.2 初级模型构建 5.3 roc曲线与auc值 5.4 模型性能评估 5.5 训练函数封装 5.6 模型预测 5.7 预测函数封装 6 特征完善 6.1 特征3-优惠券流行度 6.2 特征4-用户在商家中的消费次数 6.3 如何进行特征拼接 6.4 拼接训练集的特征3&4 6.5 拼接测试集的特征3&4 7 预测 7.1 模型训练 7.2 预测 7.3 代码整理 7.4 结果提交 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
自行安排 | 拓展自学 python爬虫助力疫情数据追踪 1 明确项目需求与目标 2 环境准备 3 获取疫情数据(全球、中国各省及各地区数据) 4 疫情数据分析 5 疫情数据可视化 6 完成分析报告 | 泰迪云课堂 |
第八课 tensorflow2实战 | ||
9月27日 09:00 - 12:00 14:00 - 17:00 19:00 - 21:00 | 1 任务1:构建一个线性模型 1.1 tensorflow介绍 1.2 tensorflow2常用数据类型和操作 1.3 初始化模型 1.4 构建损失函数 1.5 模型训练及可视化 1.6 使用高阶api-keras 2 任务2:mnist手写数字识别 2.1 数据读取及探索 2.2 交叉熵 2.3 模型构建及训练 2.4 调用保存好的模型对新样本进行预测 3 作业-鸢尾花分类 | 泰迪云课堂 |
操作演练 | 个人pc | |
在线答疑 | 微信群 | |
自行安排 | 拓展自学 用循环神经网络(rnn)对文本进行分类 1 明确项目需求与目标 2 环境准备 3 数据预处理 4 加载模型、构建读取接口 5 确定训练策略 6 配置参数 7 确定任务,开始训练 8 性能评估及总结 | |
第九课 在线考试 | ||
9月28日 19:00 - 21:30 | 大数据技术应用职业技术在线考试 | 泰迪云课堂 |
五、课程主讲师资介绍
张敏广东泰迪智能科技股份有限公司高级、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通python、r语言、matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省python与深度学习技术师资培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织并参与编写《》、《》、《r语言编程基础》等。 | |
杨惠广东泰迪智能科技股份有限公司高级,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如ppv商业培训、泰迪大数据师资培训、珠海城职院数据分析培训等。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络rnn,熟悉常用机器学习算法原理及应用,如神经网络、svm、决策树、贝叶斯等算法;精通r、python、matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。 |
六、证书颁发
学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。
七、报名材料及费用说明
1. 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色证件照 电子版(要求背景:白色,格式:jpg,大小:14-20k)。
2. 培训费用:1980 元/人,包含(报名费、学习费、资料费、证书费)。
3. 课程全程内容共计70课时,课程视频内容六个月内面向学员免费开放,可以反复学习。
4. 参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程线下课程)。
5. 本次由广东泰迪智能科技股份有限公司收取费用并开具发票。
八、威斯尼斯人0907官方网站的联系方式
联 系 人:曾老师 手 机:13246821827
微 信:antonia602501 q q:804954701
邮 箱:zengaizhi@tipdm.com
机构网址:威尼斯5139手机版-威斯尼斯人0907官方网站
附件一:
全国高校python数据分析与机器学习实战师资研修班报名申请表
单位名称 | ||||||||
部门/院系 | ||||||||
通讯地址 | 邮 编: | |||||||
发票抬头 | 发票内容: | |||||||
纳税号 | 电子发票 接收邮箱: | |||||||
联系人 | 电话: | 邮 箱: | ||||||
姓名 | 性别 | 学历 | 毕业院校 | 职务 | 身份证号 | 手机号 | 电子邮箱 | |
样书申请 | 1.《excel数据获取与处理》、2.《excel数据分析与可视化》、3.《powerbi数据分析与化》、 4.《》、5.《数据数学基础(r语言描述)》、6.《大数据数学基础(python语言描述)》、7.《r语言编程基础》、8.《》、9.《》、10.《》、11.《》、 12.《》 | |||||||
样书申请说明:以上教材均由泰迪科技公司相关专家参与主编,人民邮电出版社出版,每位报名参加培训的学员可申请以上教材中的一本样本。 | ||||||||
费用威斯尼斯人0907官方网站的支付方式 | 1 电汇到制定账号 2 扫码支付(报名后联系工作人员索要支付码) 3 付款时请备注“姓名 单位名称”字样,方便查账备案 | |||||||
帐户信息 | 账户名:广东泰迪智能科技股份有限公司 开户行:中国工商银行广州花城支行 账号号:3602 0285 0920 1663 221 | |||||||
备注 | 请将报名表发送至招生办公室,报名邮箱:zengaizhi@tipdm.com 联系人: 曾老师 13246821827 |