NLP 中文文本聚类之无监督学习

栏目: 编程工具 · 发布时间: 6年前

内容简介:在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。你将主要学习到如下内容:阅读全文:

在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。

你将主要学习到如下内容:

  1. 无监督学习的研究现状。
  2. K-means 方法原理。
  3. DBSCAN 方法原理。
  4. NMF 方法原理。
  5. PCA 降维的原理及步骤。
  6. 实战 TF-IDF 的中文文本 K-means 聚类。
  7. 实战 Word2Vec 的中文文本 K-means 聚类。
  8. 聚类结果的可视化。

阅读全文: http://gitbook.cn/gitchat/activity/5b15556785040e095b60d67a

一场场看太麻烦?订阅GitChat体验卡,畅享300场chat文章!更有CSDN下载、CSDN学院等超划算会员权益!点击查看


以上所述就是小编给大家介绍的《NLP 中文文本聚类之无监督学习》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Node.js开发指南

Node.js开发指南

郭家寶(BYVoid) / 人民邮电出版社 / 2012-7 / 45.00元

Node.js是一种方兴未艾的新技术,诞生于2009年。经过两年的快速变化,Node.js生态圈已经逐渐走向稳定。Node.js采用了以往类似语言和框架中非常罕见的技术,总结为关键词就是:非阻塞式控制流、异步I/O、单线程消息循环。不少开发者在入门时总要经历一个痛苦的思维转变过程,给学习带来巨大的障碍。 而本书的目的就是帮助读者扫清这些障碍,学会使用Node.js进行Web后端开发,同时掌握事件驱......一起来看看 《Node.js开发指南》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具