- 授权协议: GPLv3
- 开发语言: Java C/C++ Python
- 操作系统: 跨平台
- 软件首页: http://webgraph.dsi.unimi.it/
- 软件文档: http://webgraph.dsi.unimi.it/docs/index.html
软件介绍
WebGraph 是一个用来学习Web图形的框架,提供简单的方法和先进的压缩技术用来管理大量的图形。WebGraph 提供了 C++、Python 和 MATLAB 以及 Java 语言的版本。
解密搜索引擎技术实战
罗刚 / 2011-6 / 69.80元
《解密搜索引擎技术实战-Lucene&Java精华版(附盘)》,本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节,同时对文档排重、文本分类、自动聚类、句法分析树......一起来看看 《解密搜索引擎技术实战》 这本书的介绍吧!
