51CTO Python数据分析系列视频课程–玩转文本挖掘
适合人群:
希望能够成为Python编程和数据分析的跨界人才,目前尚未成功,但仍然在不断努力的人。
你将会学到:
从基本的分词、词袋模型、分布式表示等概念开始,多面深入学习文本挖掘技术的各个方面。
课程简介:
请至PC端网页下载本课程代码课件及数据。
文本挖掘(TM),又称自然语言处理(NLP),是AI时代炙手可热的数据分析挖掘前沿领域,其所涉及的人机对话系统,推荐算法,文本分类等技术在BAT等企业中都得到广泛应用。
本课程将使用经典武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学。
本次课程将会从基本的分词、词袋模型、分布式表示等概念开始,多面介绍文本挖掘技术的各个方面,特别会针对目前最热的word2vec,gensim 等结合实际案例进行学习,帮助学员直接升级至业界技术前沿。
学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。
资源目录
/计算机教程BTDLG/17-51CTO/120-Python数据分析系列视频课程玩转文本挖掘/
Python数据分析系列视频课程玩转文本挖掘
TM10-01.pdf 684.72kb
TM11-01.pdf 339.54kb
TM12n-01.pdf 783.83kb
TM2-01.pdf 876.99kb
TM3-01.pdf 1.07M
TM4-01.pdf 1.23M
TM5-01.pdf 767.66kb
TM6-01.pdf 721.23kb
TM7-01.pdf 829.94kb
TM8-01.pdf 961.02kb
TM9-01.pdf 635.82kb
TMData1801101-01.zip 7.19M
TMData190320-01.zip 7.27M
TM浣滀笟10-01.pdf 122.79kb
TM浣滀笟11-01.pdf 113.64kb
TM浣滀笟12-01.pdf 136.56kb
TM浣滀笟5-01.pdf 109.51kb
TM浣滀笟6-01.pdf 125.58kb
TM浣滀笟7-01.pdf 122.44kb
TM浣滀笟8-01.pdf 117.65kb
TM浣滀笟9-01.pdf 117.64kb
浣滀笟2-01.pdf 116.40kb
浣滀笟3-01.pdf 114.65kb
浣滀笟4-01.pdf 117.18kb
1-1 什么是文本挖掘.mp4 32.39M
1-2 文本挖掘的基本流程和任务.mp4 24.26M
1-3 文本挖掘的基本思路.mp4 21.74M
1-4 语料数据化时需要考虑的工作.mp4 26.11M
10-1 情感分析概述.mp4 66.84M
10-2 情感分析的词袋模型实现.mp4 35.64M
10-3 情感分析的分布式表达实现.mp4 47.16M
11-1 自动摘要的基本原理.mp4 24.56M
11-2 自动摘要的效果评价.mp4 18.19M
11-3 自动摘要的python实现.mp4 38.16M
12-1 RNN的基本原理.mp4 23.30M
12-2 LSTM的基本原理.mp4 22.81M
12-3 Keras+TensorFlow组合的优势.mp4 9.88M
12-4 Keras+TensorFlow组合的安装.mp4 9.35M
12-5 案例1:数据准备.mp4 36.45M
12-6 案例1:模型拟合.mp4 31.85M
12-7 案例2:数据准备.mp4 37.53M
12-8 案例2:模型拟合.mp4 26.76M
2-1 Python常用IDE简介.mp4 32.15M
2-2 Anaconda的安装与配置.mp4 31.21M
2-3 Jupyter Notebook的基本操作.mp4 25.51M
2-4 NLTK的安装与配置.mp4 30.69M
2-5 什么是语料库.mp4 60.50M
2-6 准备《射雕》语料库.mp4 59.96M
3-1 分词原理简介.mp4 32.60M
3-2 结巴分词的基本用法.mp4 33.28M
3-3 使用自定义词典和搜狗细胞词库.mp4 45.46M
3-4 去除停用词.mp4 52.25M
3-5 词性标注及其他.mp4 30.82M
4-1 词频统计.mp4 38.46M
4-2 词云概述.mp4 22.00M
4-3 wordcloud包的安装.mp4 37.31M
4-4 绘制词云.mp4 66.21M
4-5 设置词云背景模板.mp4 45.61M
4-6 修改词云颜色.mp4 53.05M
5-1 词袋模型.mp4 33.47M
5-2 词袋模型的gensim实现.mp4 56.38M
5-3 用Pandas生成文档词条矩阵.mp4 56.58M
5-4 用sklearns生成文档-词条矩阵.mp4 57.52M
5-5 从词袋模型到N-gram模型.mp4 27.33M
5-6 文本信息的分布式表示.mp4 29.78M
5-7 共现矩阵.mp4 23.38M
5-8 NNLM模型的突破.mp4 23.37M
5-9 word2vec一出,满座皆惊.mp4 53.30M
6-1 关键词提取的基本思路.mp4 24.67M
6-2 TF-IDF 算法.mp4 25.96M
6-3 TF-IDF算法的jieba实现.mp4 52.75M
6-4 TF-IDF算法的sklearn实现.mp4 27.91M
6-5 TF-IDF算法的gensim实现.mp4 27.38M
6-6 TextRank算法.mp4 41.64M
7-1 主题模型概述.mp4 48.98M
7-2 主题模型的sklearn实现.mp4 76.04M
7-3 主题模型的gensim实现.mp4 95.95M
8-1 基本概念.mp4 29.22M
8-2 词条相似度:word2vec训练.mp4 47.75M
8-3 词条相似度:word2vec应用.mp4 42.71M
8-4 文档相似度的词袋模型实现.mp4 42.60M
8-5 doc2vec.mp4 48.04M
8-6 文档聚类.mp4 41.86M
9-1 文本分类概述.mp4 40.29M
9-2 朴素贝叶斯算法.mp4 31.99M
9-3 算法的sklearn实现.mp4 49.09M
9-4 算法的NLTK实现.mp4 33.69M