WHU Bruisefree分享 http://blog.sciencenet.cn/u/bruisefree Link together

博文

按标题搜索
Indri多索引文件创建、合并及使用
2013-1-28 20:22
在使用 indri 创建大数据集索引时,可能会出现一些异常问题:在不明情况下索引程序崩溃,整体索引时间过长等。在这些情况下,可以使用 Indri 将数据集分成多个子数据集分别创建索引,以便灵活控制。 有两种方法使用这些子索引,一是将这些子索引加入到 index 参数文件中: par ...
个人分类: lemur Indri|4733 次阅读|没有评论
Indri的dumpdoc, dumpterm, and dumpindex命令
2013-1-26 23:17
翻译自:http://sourceforge.net/p/lemur/wiki/dumpdoc,%20dumpterm,%20and%20dumpindex/ "dumpindex"工具一般可以使用户可以导出索引文件的内容、索引词项或者索引的常用统计。 注意:这些工具只在Indri索引上使用。 dumpindex dumpindex 工具对于多种索引功能来说,多多少少有些像“瑞士军 ...
个人分类: lemur Indri|5796 次阅读|没有评论
Indri的IndriBuildIndex索引命令
2013-1-26 17:24
参数文件: parameters memory1024m/memory indexE:/index/x/index stemmer namekrovtz/name /stemmer corpus &n ...
个人分类: lemur Indri|6099 次阅读|没有评论
Indri检索评价命令
2013-1-14 21:03
即:检索评价 ( Retrieval Evaluation Application ) 来源网页: http://www.lemurproject.org/doxygen/lemur/html/RetEval.html RetEval 命令用于执行检索实验(无论包含还是不包含相关反馈),来评价不同的检索模型,以及不同参数设置下的模型。 “文档评分”,要么是 ...
个人分类: lemur Indri|5646 次阅读|没有评论
Lemur查询语言模型评价命令
2013-1-11 12:35
即: Query Model Evaluation Application ,翻译得有些拗口,请见谅。 来源网页: http://www.lemurproject.org/doxygen/lemur/html/QueryModelEval.html 该命令为 QueryModelEval ,加载一个扩展的查询语言模型(例如通过 GenerateQueryModel 计算得到的查 ...
个人分类: lemur Indri|4292 次阅读|没有评论
Lemur查询语言模型生成命令
2013-1-9 20:48
该命令为 KL 距离检索模型( KL-divergence )计算基于相关反馈文档的扩展查询模型和初始查询模型,可视为语言模型检索方法的一次反馈过程。初始查询模型可以在初始的查询文本基础上计算 (这时, initQuery 参数未设置,或设置为空字符串),也可以在先前保存的查询模型基础上计算(这时,由 initQuery 参数给定查询 ...
个人分类: lemur Indri|4268 次阅读|没有评论
Lemur 平滑支撑文件生成命令(GenerateSmoothSupport)
2013-1-6 21:11
该命令是 GenerateSmoothSupport ,为语言模型检索方法生成两个支撑文件。两个文件都包含一些预计算的数值,用于加速检索过程。一个文件是平滑一元语言模型检索时用到的,其名字由参数 smoothSupportFile 提供。如果运行基于 Markov 链查询模型,则另一个文件则是需要的,并带有后缀 "tt ...
个人分类: lemur Indri|3427 次阅读|没有评论
Indri查询命令(Indri Query Retrieval)及JAVA调用
2013-1-5 16:59
原文地址: http://www.lemurproject.org/doxygen/lemur/html/IndriRunQuery.html 1 基本命令 查询参数 index Indri 索引库路径。在参数文件中像 index/path/to/repository/index 这样指定,在命令行中像 -index=/ ...
个人分类: lemur Indri|5763 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 02:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部