科学网

 找回密码
  注册
【语义计算沙龙:语序自由度之辩】
热度 1 李维 2016-8-18 00:10
刘: WMT2016上有一篇文章,讨论了语言的语序自由度,结论很有趣,见附图。根据这篇论文统计,汉语和英语之间语序关系是最稳定的(注意:语序关系稳定与语序一致不是一回事),比其他语言稳定度都高出许多。日语虽然是粘着语,但跟英语的语序关系也是相当稳定的。相反,德语虽然跟英语亲缘关系很近,但其相对语序的自由(不 ...
个人分类: 立委科普|4635 次阅读|1 个评论 热度 1
科普小品:从汉语Topic句式谈起
热度 2 李维 2016-8-16 05:32
再谈汉语的 Topic 句式,这玩意儿说到底就是句法偷懒:不求甚解,凡是句首看上去像个实词的,贴个discourse意味上的标签 Topic 完事儿。管它逻辑语义上究竟是扮演什么角色,怎样达成深度的理解。说得难听一点儿,这就是汉语文法“耍流氓”。 宋老师的例子: “吃苦他在前”-- Topic【吃苦】Subj【他】Pred【在前】 ...
个人分类: 立委科普|4696 次阅读|2 个评论 热度 2
On Hand-crafted Myth of Knowledge Bottleneck
李维 2016-8-8 04:39
In my article “ Pride and Prejudice of Main Stream “, the first myth listed as top 10 misconceptions in NLP is as follows: Rule-based system faces a knowledge bottleneck of hand-crafted development while a machine learning system involves automatic training (implying no knowledge b ...
个人分类: 立委科普|4297 次阅读|没有评论
On Recall of Rule-based Systems
李维 2016-8-1 13:34
After I showed the benchmarking results of SyntaxNet and our rule system based on grammar engineering, many people seem to be surprised by the fact that the rule system beats the newest deep-learning based parser in data quality . I then got asked many questions, one question is: Q: We kn ...
个人分类: 立委科普|4279 次阅读|没有评论
Google SyntaxNet is NOT the “world’s most accurate parser"
热度 1 李维 2016-7-25 18:02
As we all know, natural language parsing is fairly complex but instrumental in Natural Language Understanding (NLU) and its applications . We also know that a breakthrough to 90%+ accuracy for parsing is close to human performance and is indeed an achievement to be proud of. Neverth ...
个人分类: 立委科普|6029 次阅读|1 个评论 热度 1
【deep parsing,deep learning 以及在对话和问答系统中的应用】
热度 2 李维 2016-7-6 07:00
如何把deep parsing的东西系统地用到对话系统中来? 这个以前多次零星讨论过,再梳理一下。 1. 先说 deep parsing 与 deep learning 的结合 两种结合方式,一种是内在的,一种是外在的。 1.1. 内在的结合 问题可以反过来看,绝大多数对话系统是不用 deep parsing 的,这就是没有代入结构的 baseline。如果不代入结构就 ...
个人分类: 立委科普|5460 次阅读|2 个评论 热度 2
【泥沙龙笔记:吃科学的饭,还是技术的饭?】
热度 7 李维 2016-7-3 04:21
我: 我虽然被封了个小公司 Chief Scientist 的职称,实在不敢称科学家了,因为早已脱离 academia,也没真正靠科学吃饭:这个金饭碗太沉,端不起。这倒不是谦虚,也不是自我矮化,因为科学家和技术人在我心中难分高低。作为一线技术人,并没觉得自己比一流科学家逊色。 不说生物,说说NLP。可重复性是科学的根本,否则算 ...
个人分类: 立委科普|5108 次阅读|5 个评论 热度 7
冯志伟老师以及机器翻译历史的一些事儿
热度 1 李维 2016-6-28 06:50
有群友问,冯志伟老师还好吗?联想到一些MT的历史,随笔记下。 冯老师的微博还很热闹啊( 冯志伟文化博客的微博_微博 ),他四处讲学 著作等身 看照片神采奕奕的样子。学问的高峰虽已过,游离于主流非主流一线之外 但老当益壮 勤于笔耕 教书育人 传播科学。 中国机器翻译(MT)历史上 有冯老师的一页 他凭着多语言的天赋 ...
个人分类: 立委科普|6221 次阅读|2 个评论 热度 1
说吃荞麦面
热度 4 李维 2016-6-26 20:52
说吃荞麦面 作者: mirror (*) 日期: 2016/06/24 21:45:02 《舌尖上的日本》-日式料理之寻面之旅——日本信州荞麦面 的照片很是漂亮。比起大陆店铺的“土豪”装饰,这些荞麦面馆的装修很是到位,很有几分品味。 镜某很赞同“一切抛开原料讲美食都是空谈”的提法,甚至主张“抛开原料讲美食的都是瞎谈”。遗憾的很 ...
个人分类: 镜子大全|4560 次阅读|4 个评论 热度 4
【语义计算沙龙:坐而论道谈“的”“地”】
热度 2 李维 2016-6-26 14:44
【立委按】 以前在语言学圈子里有些高雅的沙龙,譬如在冯志伟老师回忆 中津津乐道过的语言学沙龙,每周一次,通常在北大,参与的圈子很小,都是精英之精英,朱德熙(语言学大家,北大副校长)、陆俭明(汉语语法学家)、马希文(计算语言学家,传奇人才,白老师的导师)、冯志伟(计算语言学家)等。坐而论道,雅致之极, ...
个人分类: 立委科普|3823 次阅读|2 个评论 热度 2

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-15 07:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部