武夷山
论文评审意见再一则(2016)
2024-5-2 08:18
阅读:1168

论文评审意见再一则(2016

武夷山

 

    选题很有意思。

1.      领域分类部分叙述得不清楚。领域训练语料来自哪里?每个类的名称是怎么确定的?

2.      生物学的排序靠后,但为什么选择这个领域呢?作者没有交代。选中的另外几个领域都是排序靠前的。

3.      科学松鼠会不是个人,必须从样本中剔除。

4.      3的跨学科高影响力用户都符合作者“两个Top100”的定义吗?我表示怀疑。直觉上感到,符合作者定义的跨学科高影响力用户没有那么多。

5.      举例说,有些博文,用作者的方法去分类也许判定为生命科学,但仔细读内容才看出其实是讨论科技政策的,应归入科技政策类。希望作者将跨学科高影响力用户排名前10 的用户取出来,随机抽取一些他们的博文,进行人工分类,以作为参照,看看机器分类的误差有多大。希望作者在“讨论”部分明确指出机器分类的误差及对研究结论的影响。目前的做法,实质上是假定,作者的贝叶斯分类结论一定正确。

 

    建议修改后发表。另外,我对贝叶斯方法不熟,最好找熟悉贝叶斯分类器的学者就本文的方法部分再审一审。

转载本文请联系原作者获取授权,同时请注明本文来自武夷山科学网博客。

链接地址:https://wap.sciencenet.cn/blog-1557-1432342.html?mobile=1

收藏

分享到:

当前推荐数:4
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?