气宇轩分享 http://blog.sciencenet.cn/u/yufree

博文

小议搜索引擎应用

已有 4096 次阅读 2010-8-12 21:29 |个人分类:科搜研手册|系统分类:教学心得| google, 搜索引擎, 知识管理

今天看推,有人提到了Google的时光隧道,由于一直用鸟文版我一下还没反应过来,后来跟实际对上号才想起来原来曾经想写篇介绍的,今天就结合最近比较热门的一些搜索词写个搜索示例。主要目的就是想说明搜索引擎除了布尔逻辑等看起来比较难用的搜索语法以外也有一些由服务方提供的一些搜索产品,这些产品在知识管理上用起来很方便。

1、实时搜索

看新闻(就不告诉你是神马类型的新闻)应该是众多网民的一大主要上网借口,但很多人会有这样的感叹:不都说网上有吗,怎么我找(或者百度)不到?这些新闻跟报纸上也差不多嘛!XX(某门户)网上都没有,是不是压根就没有这事?我发的文章怎么搜不到捏?如果你有过类似感觉那么恭喜你,我下面说的对你可能就不是废话了。首先来说上面的感觉表明web2.0始终木有走向最广大的网民,而且也说明一些网络公关做得不错,还说明有网民有这样的需要。那么怎样找呢?包括度娘在内的主流搜索引擎都会把新闻(有时候也叫咨询)单独作为一个板块来进行搜索,但实时性还是不令人满意,在我看来就好象是对新闻类网站做了个聚合搜索,重复性强不说被公关的也很快,点进去就不存在或404的情况很常见(别说我XE,老搜些被HX的东西,我只是想从多个角度看问题而不是人云亦云)。这样,几大搜索引擎为了满足用户需要(或者说广告需要)就陆续推出了实时搜索类产品。度娘是没有的,在天朝出这玩意儿需要勇气,作为目前国内首推的(再次说明白,baidu跟国产不沾边,去看看李宏彦跟谁要的风投就知道了)度娘要是搞这个政府新闻学学者及学生会很不高兴的。google的实时搜索集成到了搜索百宝箱里,而且很重要的是从这里可以搜到twitter的实时更新的。有道的实时搜索目前出于测试期(不许联想)而且曾经用这一功能搞过世界杯赛事直播。bing的实时搜索藏得比较深,要在资讯里选最新结果(其实这个位置还是比较讲究的)但可以订阅。其实这一块要独立于新闻版块说主要是因为这一功能会更多关注微博这一类其实不算新鲜(没说错,07年我就接触过饭否)的web2.0产品,更有意思的是其实时性会让人感到事情就在发生这种参与感。与之相匹配的时间轴相信对于社科类研究者来说是一个很好的素材。那么这里会有一个基本问题:实时搜索究竟比新闻强多少?我有必要用吗?好,新闻的写作一般是由新闻工作者来完成的,但目前天朝新闻工作者(可以认为是极少数啊极少数)在面对真相时发生脑瘫与常识不足的状况是比较常见的,其第三方的角度在被质疑的情况下需要另外的第三方或当事人的说法来佐证。而实时更新除了实时性极强外(当然这也取决于其算法且由于实时性也有相当的保真度)会给信息搜集者一个对当下关注领域状况的基本了解,国外不少研究人员是会在twitter或个人blog、SNS主页(这种也会被收录)上发布自己最最新的感想与发现的。此外实时更新也会帮助你去找到新闻一般不关注的领域,我曾经很XE的去搜一些邀请码或注册码,效果不错。总之,利用实时搜索你可以找到不少共鸣而不是认为网上信息也有限,也落后。

2、时间轴搜索

讲这个玩意就有点进入信息整理了,面对一个关键词,它在时间这个维度上是如何被关注的可以帮助我们去发现一些信息背后的东西。这些东西包括一些网络公关的操作痕迹、某物这些年来被关注的趋势、某物在网络的生命周期等等。那么Google的这个产品就叫做时光隧道,别的可以通过一些搜索语法实现,因为很多引擎都提供了时间排序(默认应该是相关度排序,度娘的竞价排序跟相关度不是一回事)。其实这个功能比较小众,但用来追踪一些曾经的热点是非常有效的,一些明显的人为倾向被以点击量的形式客观记录,而其背后的真相需要有研究兴趣的人来慢慢挖掘。

3、相关性搜索

在某些时候会有这样的感觉,我只知道一个关键词,但我更想知道与之相关的内容,这时候相应的搜索产品就是联想输入一类的东西。这个玩意很XE,你选个搜索引擎打上关键词后再打个空格就可以看到了。但这对知识管理来说太粗了,我们更需要的是经过一些聚类分析后类似思维导图的东西。那么google就把它独立了出来叫做神奇罗盘,这就有点像我曾经提到过isi引文分析的东西,而这个罗盘很容易帮你在制作思维导图时找到新思路。除了google外很多网站也提供类似标签云之类的功能,也有类似的网站提供更漂亮的搜索结果可视化产品(有的3D化后非常直观)。这类相关性搜索的产品会很大程度的满足好奇心,当我们把它用在某个人(例如郭德纲等突然遇到争议的人物)身上时你会发现更多东西,它很大程度上帮助我们了解某关键词的热点相关词(那冷点相关什么意义我就不多说了)。

今天就写这些,其实除了Google,有道的努力也是有目共睹的,在搜索产品上很多搜索引擎都有其特殊的一面,仔细发掘为我所用才是真正会上网搜集管理信息。我在这篇文章中没给出任何链接,但相信有兴趣的人已经明白从哪里来寻找自己所要了,当然如果你发现某个关键词出现了敏感词效应那就请你双掌合十,心中默默感谢我们伟大光明正义的郭嘉吧(解决方法请自行搜索)。

最后给出引起我讨论半天的那张隧道图。

 





https://wap.sciencenet.cn/blog-430956-352416.html

上一篇:浅议公开课
下一篇:软件&网络服务发展展望——用户角度
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 10:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部