Nutch搜索引擎

收录时间:2013-12-21
资源分类:Java 工具:MATLAB 7.6 (R2008a)

著名的Nutch搜索引擎源代码,非常有参考价值。这里是Nutch 1.7版本的源代码。编程语言:Java。

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然 不利于广大Internet用户.
Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码 搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, 而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的 费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有 动机去扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.

 

Search engine source code Nutch

Search engine source code Nutch

文件下载列表
附件内容(只显示776中的10个)
AbstractFetchSchedule.java  AdaptiveFetchSchedule.java  Crawl.java  CrawlDatum.java  CrawlDb.java  CrawlDbFilter.java  CrawlDbMerger.java  CrawlDbReader.java  CrawlDbReducer.java  DefaultFetchSchedule.java  
标签: Nutch搜索引擎 
更多

目前尚无评论

用户反馈   关于我们
Copyright (©) ZHIHUISHI.COM 2013 All Rights Reserved.
京ICP备18060134号-3