北京暴雨科网博文搜索问题
2012-7-24 01:29
阅读:4134
标签:网站, 北京暴雨, 北京大, 搜索问题
北京暴雨已经过去几天,科学网上很多博主对此话题进行了热烈的讨论。对大家的意见进行归类是一种值得期待的做法。对于网站来说,要进行搜索归类,虽然有一些简单的程序可以使用,但是由于涉及到具体内容,同样也要采用手工的方式来干预。我观察了一下,科网博客首页中的“博文专题”,应该就是做这方面的工作。只是要将所有的博文归类在一起,工作量很大。对于科学网有限的编辑力量来说,这样的工作是否要去做,是必须仔细考虑一下的。然而博主自己如果对此有兴趣,则可以自行归类。简单的方式就是进行手工归类。充分利用好博客中的“分享博文”的功能,每看到一篇相关文章,就分享一下。最后将自己博客主页的分享栏目中的链接复制粘贴到Word文档中就可以了。如果时间紧迫,无法一一查看博文,则建议采用搜索引擎来完成这一工作。我尝试了一下,大概一个小时之内就可以完成。
搜索引擎来完成这一工作效率是比较高的,因为任何网站自身的检索能力都远远逊于搜索引擎。举个很简单的例子,我们如果要检索自己电脑中的文档,可以使用微软在“我的电脑”中提供的搜索功能。然而这一功能不如搜索引擎提供的硬盘搜索程序。
我利用google搜索了一下科学网中有关北京暴雨的博文,利用其提供的高级搜索功能,将搜索结果限制到blog.sciencenet.cn中,精确匹配“北京暴雨”,获得了六百多条结果,删除掉了2天以前的博文,还剩下一百多条结果。最后按作者排序,将那些与北京暴雨无关的博文删除,获得57条结果。
同手工检索相比,结果少了很多条。这并不奇怪,因为机器确实技不如人。特别是像闵应骅老师的“从721北京大暴雨所想到的(120723)”就没有搜索到,这是因为闵老师用的词语是“北京大暴雨”,无法与“北京暴雨”精确匹配。这反映出机器搜索的局限性。不过机器搜索还是有优点的,如果能够将机器和人工搜索的两个结果合并,应该可以获得绝大部分相关的博文。
从这里可以看出,对于涉及到具体内容的检索,计算机程序也还只是处于一个辅助的层次,人工干预是不可缺少的。而是否确实需要人工干预,人工干预到什么程度,则要视乎问题的复杂性和重要性来定。
附:利用搜索引擎获得的结果(按作者排序)
博文标题 |
作者 |
曹聪 |
|
陈昌春 |
|
陈昌春 |
|
陈龙珠 |
|
陈龙珠 |
|
迟菲 |
|
迟菲 |
|
方锦清 |
|
黄安年 |
|
黄安年 |
|
黄安年 |
|
黄安年 |
|
黄安年 |
|
嵇少丞 |
|
嵇少丞 |
|
贾绍凤 |
|
蔣勁松 |
|
匡耀求 |
|
李杰 |
|
李睿蛟 |
|
李睿蛟 |
|
李维 |
|
李子欣 |
|
刘超 |
|
刘广志 |
|
刘强 |
|
吕喆 |
|
毛克彪 |
|
潘学峰 |
|
石应江 |
|
王亶文 |
|
王涵 |
|
肖重发 |
|
许培扬 |
|
许培扬 |
|
许培扬 |
|
许培扬 |
|
许培扬 |
|
许培扬 |
|
许培扬 |
|
杨学祥 |
|
杨学祥 |
|
杨学祥 |
|
杨学祥 |
|
杨学祥 |
|
杨学祥 |
|
杨永田 |
|
袁海涛 |
|
张海霞 |
|
张学文 |
|
张学文 |
|
赵建民 |
|
赵明 |
|
赵明 |
|
赵燕 |
|
周永胜 |
|
周忠浩 |
转载本文请联系原作者获取授权,同时请注明本文来自程智科学网博客。
链接地址:https://wap.sciencenet.cn/blog-361477-595129.html?mobile=1
收藏
当前推荐数:5
推荐到博客首页
网友评论4 条评论