2020年第七期全国高校大数据与人工智能师资研修班-威尼斯5139手机版

2020-10-20 泰迪智能科技 837
分享到:
主办单位:泰迪杯数据挖掘挑战赛组委会
承办单位:
广东泰迪智能科技股份有限公司
协办单位:人民邮电出版社有限公司

北京泰迪云智信息技术研究院


当今世界,科技进步日新月异,互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。针对目前高校在人工智能专业建设过程中出现的师资不足、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等问题,进一步提升教学能力和科研能力,泰迪杯数据挖掘挑战赛组委会姜联合推出全国高校大数据与人工智能师资研修班,每年联合各大院校在全国范围内定期开展八期师资课程,截止目前已在全国巡回举办30余场,参训教师近3000人次。

2020年第七期全国高校大数据与人工智能师资研修班将开设三大专题方向:“数据分析与挖掘实战、深度学习技术实战、人工智能项目实训营”,本次研修班采用线上以云课堂形式举办,现将有关详细安排通知如下:


专题一  数据分析与挖掘实战

一、课程介绍

本次培训采用“云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅。讲解数据分析与挖掘项目实训的模型理论和项目代码实战,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。

二、课程目标级收获

1、本课程配套有基础知识内容,可使零基础学员快速入门,带领学员迅速掌握python编程,了解机器学习基本概念及相关实现,使得学员能使用python编写程序并实现机器学习常见任务。系统梳理python基础与机器学习的学习路线,全程强调动手实操,内容以代码落地为主,助力python机器学习快速入门。

2、课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

3、全面实践商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线解答疑难优质服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

4、无论是前置学习篇还是案例集训篇,相关代码、源数据、ppt、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

5、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。


三、课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台

正式培训前

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 python文件读取操作

5.1 python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 python方法与函数对比介绍

7.2 python面向对象示例

7.3 python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 python工作路径说明

8.2 模块命令集存放路径的注意事项

8.3 结语

泰迪云课堂
课程篇
时间课程内容学习平台
第一课

11月18日

19:00 - 21:30

1 python数据分析概述

1.1 认识数据分析

1.2 熟悉python数据分析的工具

1.3 安装python3的anaconda发行版

1.4 掌握jupyter notebook常用功能

2 numpy数值计算基础

2.1 认识numpy数组对象ndarray

2.2 认识numpy矩阵与通用函数

2.3 利用numpy进行统计分析

3 matplotlib数据可视化基础

3.1 了解绘图基础语法与常用参数

3.2 分析特征间的关系

3.3 分析特征内部数据分布与分散状况

4 pandas统计分析基础

4.1 读写不同数据源的数据

4.2 掌握dataframe的常用操作

4.3 转换与处理时间序列数据

4.4 使用分组聚合进行组内计算

4.5 创建透视表与交叉表

5 使用pandas进行数据预处理

5.1 合并数据

5.2 清洗数据

5.3 标准化数据

5.4 转换数据

6 使用scikit-learn构建模型

6.1 使用sklearn转换器处理数据

6.2 构建并评价聚类模型

6.3 构建并评价分类模型

6.4 构建并评价回归模型

泰迪云课堂
第一课作业个人pc
在线答疑微信群
第二课 python数据分析实训

11月19日

19:00 - 21:30

1 探索iris鸢尾花数据

1.1 将数据集存成变量iris创建数据框的列名称['sepal_length', 'sepal_width', 'petal_length',

 'petal_width', 'calss']

1.2 数据框中有缺失值吗?

1.3 将列petal_length的第10到19行设置为缺失值

1.4 将petal_length缺失值全部替换为1.0

1.5 删除列class

1.6 将数据框前三行设置为缺失值

1.7 删除有缺失值的行

1.8 重新设置索引

2 探索chipotle快餐数据

2.1 将数据集存入一个名为chipo的数据框内

2.2 查看前10行内容

2.3 数据集中有多少个列(columns)

2.4 打印出全部的列名称

2.5 数据集的索引是怎样的?

2.6 被下单数最多商品(item)是什么?

2.7 在item_name这一列中,一共有多少种商品被下单?

2.8 一共有多少个商品被下单?

2.9 将item_price转换为浮点数

2.10 在该数据集对应的时期内,收入(revenue)是多少?

2.11 在该数据集对应的时期内,一共有多少订单?       t

2.12 每一单(order)对应的平均总价是多少?

3 探索apple公司股价数据

3.1 读取"apple_1980_2014.csv"数据并存为一个名叫apple的数据框

3.2 查看每一列的数据类型

3.3 将date这个列转换为datetime类型

3.4 将date设置为索引

3.5 有重复的日期吗?

3.6 将index设置为升序

3.7 找到每个月的最后一个交易日(businessday)

3.8 数据集中最早的日期和最晚的日期相差多少天?

3.9 在数据中一共有多少个月?

3.10 按照时间顺序可视化adj close值

泰迪云课堂
第二课作业个人pc
在线答疑微信群
第三课 机器学习实战

11月20日

19:00 - 21:30

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量python实现

3 回归分析(regressionanalysis)

3.1 线性回归基本形式

3.2 线性回归模型的python实现

3.3 波士顿房价预测的python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的python实现

4 聚类分析(clusteranalysis)

4.1 聚类分析概述

4.2 相似性度量

4.3 k-means聚类分析算法介绍

4.4 利用k-means算法对鸢尾花进行聚类

4.5 聚类结果的性能度量

4.6 调用sklearn实现聚类分析

泰迪云课堂
第三课作业个人pc
在线答疑微信群
第四课 机器学习实战案例

11月21日

19:00 - 21:30

市财政收入分析预测

1 背景与案例目标

1.1 财政收入预测背景介绍

1.2 数据基本情况介绍

1.3 分析目标解读

1.4 项目流程介绍

2 相关系数分析

2.1 求解person相关系数

2.2 person相关系数解读

3 lasso回归特征提取

3.1 了解lasso回归方法

3.2 lasso回归选取关键特征的实现

3.3 lasso回归数据写出及相应解读

4 灰色预测模型

4.1 关键特征数据读取及准备

4.2 gm11特征值预测

4.3 gm11特征数据整理及写出

5 模型训练及预测

5.1 数据标准化

5.2 模型训练及预测

5.3 结果可视化

泰迪云课堂
操作演练个人pc
在线答疑微信群
第五课 文本挖掘实战

11月22日

19:00 - 21:30

1 自然语言处理简介

2 开源中文nlp系统介绍

3 中文分词介绍

4 机械分词法

5 机器学习算法分词

6 nlp概率图介绍

7 jieba分词演示

8 文本的one-hot表达

9 tf-idf权值策略实现

10 文本的tf-idf表达

11 模型训练与预测

泰迪云课堂
操作演练个人pc
在线答疑微信群
第六课 文本分类案例

11月23日

19:00-21:30

垃圾自动识别

1 背景与目标

2 数据探索

2.1 数据读取

2.2 数据抽取

3 数据预处理

3.1 去除短信中的x序列

3.2 结巴分词

3.3 去除停用词

3.4 数据预处理函数封装

3.5 垃圾短信的词频统计

3.6 词云图绘制

4 文本向量的表示

4.1 文本数据的向量化表示

4.2 获取训练样本的tf-idf权值向量

4.3 获取测试样本的tf-idf权值向量

5 模型训练及评价

6 小结

泰迪云课堂
操作演练个人pc
在线答疑微信群
第七课 综合实战

11月24日

14:00-18:00

电商智能推荐:优惠券使用预测

1 背景与目标

2 数据说明

2.1 线下训练集数据介绍

2.2 线上训练集数据介绍

2.3 测试数据介绍

2.4 项目流程介绍

3 数据预处理

3.1 构建正样本

3.2 构建负样本

3.3 构建样本标签

4 特征构建

4.1 特征构建介绍

4.2 处理discount_rate列

4.3 特征 1 -折扣率

4.4 特征 2 -商户与用户之间的距离

5 模型训练

5.1 建模前数据准备

5.2 初级模型构建

5.3 roc曲线与auc值

5.4 模型性能评估

5.5 训练函数封装

5.6 模型预测

5.7 预测函数封装

6 特征完善

6.1 特征 3 -优惠券流行度

6.2 特征 4 -用户在商家中的消费次数

6.3 如何进行特征拼接

6.4 拼接训练集的特征 3&4

6.5 拼接测试集的特征 3&4

7 预测

7.1 模型训练

7.2 预测

7.3 代码整理

7.4 结果提交

泰迪云课堂
操作演练个人pc
在线答疑微信群
自行安排

拓展自学

python爬虫助力疫情数据追踪

1 明确项目需求与目标

2 环境准备

3 获取疫情数据(全球、中国各省及各地区数据)

4 疫情数据分析

5 疫情数据可视化

6 完成分析报告

泰迪云课堂
第八课 在线考试

11月25日

19:00 - 21:30

python技术应用工程师职业技术在线考试

泰迪云课堂

注:所有学员自备笔记本电脑(windows7 或以上操作系统(64位)、4g 内存)、按照项目要求完成各项目任务


部分实操结果展示:

四、证书认证

学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。


专题二  深度学习核心技术实战

一、课程介绍

本次培训采用“云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅。讲解机器学习与深度学习实训的模型理论和项目代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。

二、课程目标及收获

1、零基础快速入门,带领学员迅速掌握python编程,了解机器学习基本概念及相关实现,使得学员能使用python编写程序并实现机器学习常见任务。视频制作精良,讲师真人出镜,系统梳理python基础与机器学习的学习路线,全程强调动手实操,内容以代码落地为主,助力python机器学习快速入门。

2、核心课程内容讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。

3、全面实践商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线解答疑难等优质服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

4、无论是前置学习篇还是案例集训篇,相关代码、源数据、ppt、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

5、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。


三、课程大纲

基础篇(报名成功后即可开始学习)
时间课程内容学习平台
正式培训前

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串的常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 python文件读取操作

5.1 python读取文件

5.2 练习3:统计小说中的单词频次

6 函数

6.1 python函数自定义

6.2 练习4:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 python方法与函数对比介绍

7.2 python面向对象示例

7.3 python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

泰迪云课堂

1 python数据分析概述

1.1 认识数据分析

1.2 熟悉python数据分析的工具

1.3 安装python3的anaconda发行版

1.4 掌握jupyter notebook常用功能

2 numpy数值计算基础

2.1 认识numpy数组对象ndarray

2.2 认识numpy矩阵与通用函数

2.3 利用numpy进行统计分析

3 matplotlib数据可视化基础

3.1 了解绘图基础语法与常用参数

3.2 分析特征间的关系

3.3 分析特征内部数据分布与分散状况

4 pandas统计分析基础

4.1 读写不同数据源的数据

4.2 掌握dataframe的常用操作

4.3 转换与处理使劲按序列数据

4.4 使用分组聚合进行组内计算

4.5 创建透视表与交叉表

5 使用pandas进行数据预处理

5.1 合并数据

5.2 清洗数据

5.3 标准化数据

5.4 转换数据

python机器学习实战

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量python实现

3 回归分析(regressionanalasis)

3.1 线性回归基本形式

3.2 线性回归模型的python实现

3.3 波士顿房价预测的python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的python实现

课程篇
时间课程内容学习平台
第一课  深度学习基础-人工神经网络

11月27日

19:00-21:30

1 单个神经元介绍

2 经典网络结构介绍

3 神经网络工作流程演示

4 如何修正网络参数、梯度下降

5 网络工作原理推导

6 网络搭建准备

7 样本从输入层到隐层传输的python实现

8 网络输出的python实现

9 单样本网络训练的python实现

10 全样本网络训练的python实现

11 网络性能评价

12 调用sklearn实现神经网络算法

泰迪云课堂
操作演练
个人pc
在线答疑微信群
第二课  tensorflow2实战

11月28日

19:00-21:30

1 任务一:构建一个线性模型

1.1 tensorflow介绍

1.2 tensorflow2常用数据类型和操作

1.3 初始化模型

1.4 构建损失函数

1.5 模型训练及可视化

1.6 使用高阶api-keras

2 任务二:mnist手写数字识别

2.1 数据读取及探索

2.2 交叉熵

2.3 模型构建及训练

2.4 调用保存好的模型对新样本进行预测

3 作业:鸢尾花分类

泰迪云课堂
操作演练个人pc
在线答疑微信群
第三课  人工智能核心课:深度神经网络

11月29日

19:00-21:30

1 深度神经网络-引言

2 卷积神经网络cnn

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

3 循环神经网络rnn

3.1 循环神经网络简介

3.2 循环神经网路的常见结构

4 长短时记忆网络lstm

4.1 lstm的三个门

4.2 lstm三个门的计算示例

4.3 利用rnn&lstm实现mnist手写数字识别

泰迪云课堂
操作演练个人pc
在线答疑微信群
第四课  利用循环神经网络(rnn)对文本进行分类

11月30日

19:00-21:30

1 明确项目需求与目标

2 环境准备

3 数据预处理

4 加载模型、构建读取接口

5 确定训练策略

6 配置参数

7 确定任务,开始训练

8 性能评估及总结

泰迪云课堂

操作演练

个人pc
在线答疑微信群
第五课  搭建一个属于自己的聊天机器人

12月1日

19:00-21:30

1 项目背景与目标

2 语料库预处理

3 seq2seq模型计算图搭建--文件读取

4 seq2seq模型计算图搭建--encoder

5 seq2seq模型计算图搭建--decoder

6 seq2seq模型计算图搭建--seq3seq

7 模型训练

8 模型测试

9 注意力机制

泰迪云课堂
操作演练个人pc
在线答疑微信群
第六课  综合实战:搭建一个智能车牌识别系统

12月2日

19:00-21:30

1 明确项目目标

2 准备数据

3 照片预处理

4 定位车牌信息

5 分割车牌字符

6 搭建车牌识别网络

7 进行模型训练

8 模型结果与评估

泰迪云课堂
操作演练个人pc
在线答疑微信群
实战项目介绍:基于深度学习的车牌识别系统项目

技能点:深度学习实战、tensorflow框架、图像处理技术、opencv应用、实际项目搭建与应用。

1 明确项目目标

2 准备数据

3 照片预处理

4 定位车牌信息

5 分割车牌字符

6 搭建车牌识别网络

7 进行模型训练

8 模型结果与评估

第七课  工信部认证考试

12月3日

19:00-21:30

在线考试泰迪云课堂


部分实操原理及结果展示

四、证书认证

学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。


专题三  人工智能项目实训营


一、课程介绍

1、项目名称:基于深度学习的推荐系统受众性别预测

2、项目背景:随着互联网和移动互联网迅猛发展,越来越多的用户数据涌向不同的线上平台,如何从海量数据中探究规律、挖掘价值,已经成为各大互联网公司重点关注的事情,个性化推荐系统便是其中一个引人瞩目的产出物。

在各类个性化推荐系统中,用户的年龄、性别、学历、职业等基础属性是重要输入特征,其中的逻辑是在大部分情况下,用户对广告的偏好会随着年龄、性别等自身情况的不同而产生区别,这一逻辑也在许多行业的实践中得到过验证。如果能够得到用户基本属性并将其输入个性化推荐系统中,则能大大提高系统的推荐准确率。

所以,对于缺乏用户基础属性的公司而言,基于用户交互数据来推断用户基础属性,是一件极有价值的事情。

3、项目目标:通过分析挖掘用户在广告系统中的交互行为数据来得到各用户的基础属性--性别

本次培训采用“云课堂线上精讲 专家技术在线答疑指导 学员群内实操答疑 助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅。讲解数据分析与挖掘、机器学习与深度学习、人工智能项目实训的模型理论和项目代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。

二、课程目标及收获

1、全程强调动手实操:内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。

2、核心课程部分:讲师手把手一起进行实操演练,咋案例场景中全面掌握相关技能,进一步提升专项能力,助力实际案例实训教学工作、实际动手的能力。

3、讲师将在线上对项目进行深入剖析和演示,可以与课程讲师以及学习该课程的其他老师直接进行沟通研讨,快速提升专项能力!

4、无论是前置学习篇还是案例集训篇,相关代码、源数据、ppt、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。

5、同时,参加线上课程学习的学员,如后续本人参加线下课程继续深圳,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。


三、课程大纲

基础篇实训营配套课程(报名成功后即可开始学习)

1 准备工作

2 列表操作

3 程序流程控制语句

4 字符串操作

4.1 字符串及其索引&切片

4.2 字符串娥常见方法

4.3 字典的创建及索引

4.4 字典常用操作

4.5 字典推导式

5 python文件读取操作

5.1 python读取文件

5.2 练习:统计小说中的单词频次

6 函数

6.1 python函数自定义

6.2 练习:自定义求序列偶数个数的函数

7 面向对象与模块

7.1 python方法与函数对比介绍

7.2 python面向对象示例

7.3 python模块使用

7.4 第三方库的安装与调用

8 注意事项

8.1 python工作路径说明

8.2 模块命名及存放路径的注意事项

8.3 结语

1 python数据分析概述

1.1 数据分析概述

1.2 熟悉python数据分析的工具

1.3 安装python的anaconda发行版

1.4 掌握jupyter notebook常用功能

2 numpy数值计算基础

2.1 掌握numpy数组对象

2.2 掌握numpy矩阵与通用函数

2.3 利用numpy进行统计分析

3 matplotlib数据可视化基础

3.1 掌握绘图基础语法与常用参数

3.2 分析特征间关系

3.3 分析特征内部数据分布与分散情况

4 pandas统计分析基础

4.1 读写不同数据源的数据

4.2 掌握dataframe的常用操作

4.3 转换与处理时间序列数据

4.4 使用分组聚合进行组内计算

4.5 创建透视表与交叉表

5 使用pandas进行数据预处理

5.1 合并数据

5.2 清洗数据

5.3 标准化数据

5.4 转换数据

python机器学习实战

深度学习基础-人工神经网络

1 机器学习绪论

1.1 引言

1.2 基本术语

1.3 假设空间&归纳偏好

2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.3 性能度量

2.4 性能度量python实现

3 回归分析(regressionanalysis)

3.1 线性回归基本形成

3.2 线性回归模型的python实现

3.3 波士顿房价预测的python实现

3.4 逻辑回归介绍

3.5 研究生入学录取预测的python实现

1 单个神经元介绍

2 经典网络结构介绍

3 神经网络工作流程演示

4 如何修正网络参数、梯度下降

5 网络工作原理推导

6 网络搭建准备

7 样本从输入层到隐层传输的python实现

8 网络输出的python实现

9 单样本网络训练的python实现

10 全样本网络训练的python实现

11 网络性能评价

12 调用sklearn实现神经网络算法


tensorflow2实战
人工智能核心课-深度神经网络

1 任务1:构建一个线性模型

1.1 tensorflow介绍

1.2 tensorflow2常用数据类型和操作

1.3 初始化模型

1.4 构建损失函数

1.5 模型训练及可视化

1.6 使用高阶api-keras

2 任务2:mnist手写数字识别

2.1 数据读取及探索

2.2 交叉熵

2.3 模型构建及训练

2.4 调用保存好的模型对新样本进行预测

3 作业-鸢尾花分类

1.1 深度神经网络-引言

2 卷积神经网络cnn

2.1 浅层神经网络的局限

2.2 卷积操作

2.3 卷积操作的优势

2.4 池化及全连接

2.5 高维输入及多filter卷积

2.6 实现卷积操作

2.7 实现池化操作

3 循环神经网络rnn

3.1 循环神经网络简介

3.2 循环神经网络的常见结构

4 长短时记忆网络lstm

4.1 lstm的三个门

4.2 lstm三个门的计算示例

4.3 利用rnn&lstm实现mnist手写数字识别

案例:用循环神经网络(rnn)对文本进行分类

1 明确项目需求与目标

2 环境准备

3 数据预处理

4 加载模型、构建读取接口

5 确定训练策略

6 配置参数

7 确定任务,开始训练

8 性能评估及总结

实训营项目任务安排

时间任务安排学习平台

12月5日

19:00-21:30

电商网站进行商品推荐时,如果事先知道用户的基本属性,如用户性别、用户年龄等,推荐的可靠性将大大增加。但是存在缺乏用户基础属性的公司,因此根据用户行为数据(点击行为)来推断用户基础属性(性别)是很有必要的。

第一天了解项目背景与目标,并对项目数据有一定的了解。

1 了解项目背景及目标

2 获取及认识数据

个人pc
线上直播:项目介绍及思路梳理企业微信
在线答疑微信群

12月6日

19:00-21:30

对数据进行探索分析,对数据情况有一定了解后尝试对用户操作数据进行单击流分析。

3 探索整理数据

3.1 读取数据并查看数据规模

3.2 缺失值探索分析

4 获取用户相应单及流数据

4.1 理解用户单击流相关概念

4.2 获取用户的各单击流数据

4.3 查看单击流的长度分布,并进行可视化

个人pc
任务讲解与分析泰迪云课堂
在线答疑微信群

12月7日

19:00-21:30

为后续构建深度学习分类模型,需要将单击流的向量数据映射到二维,故进行词嵌入(word embedding)操作。

5 实现词嵌入(word embedding)操作

5.1 对用户单击流数据进行预处理

5.2 进行词向量训练(如获取素材id所有词的词向量矩阵)

5.3 对用户的单击流进行编码及padding操作

5.4 将词向量矩阵做相应排序并储存

5.5 将单击流数据转化为二维样本数据并储存

个人pc
任务讲解及分析泰迪云课堂
在线答疑微信群

12月8日

19:00-21:30

将单击流数据考虑为文本数据进行分类模型构建时,可以采用自然语言处理中常用的循环神经网络分类模型进行性别分类预测。

6 构建循环神经网络(rnn)序列模型

6.1 搭建网络

6.2 模型训练并储存

6.3 加载模型并预测

个人pc
任务讲解及分析泰迪云课堂
在线答疑微信群

12月9日

19:00-21:30

做完词嵌入后的单击流数据的二维数据,将其考虑为图像数据可参考计算机视觉中常用的卷积神经网络分类模型构建另一个与前一天一样的性别分类预测模型,两个模型进行比较。

7 构建卷积神经网络(cnn)模型

7.1 搭建网络

7.2 模型训练并储存

7.3 加载模型并预测

个人pc
任务讲解及分析泰迪云课堂
在线答疑微信群

12月10日

19:00-21:30

对前两天的模型进行优化处理,注意优化手段是构建并行网络结构,将循环神经网络与卷积神经网络结合,提高性别预测正确率。

8 构建并行网络结构,多特征并行叠加

8.1 搭建网络

8.2 模型训练并储存

8.3 加载模型并预测

9 模型调优


任务讲解及分析

泰迪云课堂
在线答疑微信群
12月11日 19:00-21:30工信部教育与考试中心人工智能应用工程师职业技术认证-在线考试泰迪云课堂


四、证书认证

学员经在线培训并考试合格后,可以获得本期培训对应专题职业技术证书。


课程主讲师资介绍

张敏广东泰迪智能科技股份有限公司高级、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通python、r语言、matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省python与深度学习技术师资培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织并参与编写《》、《》、《r语言编程基础》等。

杨惠广东泰迪智能科技股份有限公司高级,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如ppv商业培训、泰迪大数据师资培训、珠海城职院数据分析培训等。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络rnn,熟悉常用机器学习算法原理及应用,如神经网络、svm、决策树、贝叶斯等算法;精通r、python、matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。

报名须知与威斯尼斯人0907官方网站的联系方式

报名须知

专题时长开课日期费用(元)
课程安排
数据分析与挖掘实战8天共70课时2020年11月18日-25日1980
深度学习核心技术实战7天共70课时2020年11月27日-12月3日2480
人工智能项目实训7天共75课时2020年12月5日-11日2980

1 费用:包含报名费、学习费、资料费、证书费等

2 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底、.jpg格式、14-40k文件大小)

3 本次由广东泰迪智能科技股份有限公司收取费用并开具发票

4 参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)

5 本期研修班两专题及以上联报者可享受九折优惠

威斯尼斯人0907官方网站的联系方式

联 系 人:曾老师                                手   机:13246821827
微      信:antonia602501                 q   q:804954701
邮      箱:zengaizhi@tipdm.com
机构网址:www.tipdm.com

附件一: 


2020年全国高校大数据与人工智能骨干师资研修班
报名申请表

单位名称
部门/院系
通讯地址

邮   编:
发票抬头

发票内容:


纳税号

电子发票

接收邮箱:


联系人

电话:
 邮   箱:
姓名性别学历
毕业院校职务身份证号手机号电子邮箱








































样书申请
1.《excel数据获取与处理》、2.《excel数据分析与可视化》、3.《powerbi数据分析与可视化》、4.《》、5.《数据数学基础(r语言描述)》、6.《大数据数学基础(python语言描述)》、7.《r语言编程基础》、8.《》、9.《》、10.《》、11.《》、12《》                

样书申请说明:以上教材均由泰迪科技公司相关专家参与主编,人民邮电出版社出版,每位报名参加培训的学员可申请以上教材中的一本样本。
费用威斯尼斯人0907官方网站的支付方式

1、电汇到制定账号

2、扫码支付(报名后联系工作人员索要支付码)。

3、付款时请备注“姓名 单位名称”字样,方便查账备案。

账号信息

账户名:广东泰迪智能科技股份有限公司

开户行:中国工商银行广州花城支行

账号名:3602 0285 0920 1663 221

备注

 请将报名表发送至招生办公室,报名邮箱:zengaizhi@tipdm.com        

 联系人: 曾老师     13246821827             微信:antonia602501




网站地图