科学网

 找回密码
  注册
【Parsing 的命根子是 subcat,逻辑的和语言的】
热度 1 李维 2016-12-21 08:29
细说起来有两类句型分类:一类是逻辑上的,一类是语言上的。二者相互呼应,前者是内容(output 目标,也隐含了语义条件),后者是形式(input 的句法条件)。 逻辑上说,一个谓词需要几个 arguments,是由这个谓词的意义决定的,譬如 “哭/笑” 这样的谓词概念,需要一个施事 argument 来表达谁哭了笑了,所谓不及物谓词 ...
个人分类: 立委科普|2644 次阅读|1 个评论 热度 1
【从V个P到抓取邮电地址看 clear patterns 如何抵御 sparse data
李维 2016-12-21 08:18
从 前几天的例子:V个P (挣个毛、挣个求、挣个妹,等) P={P,屁,头,鸟,吊,jiba,妹,鬼,......} 可以看到,小数据为依据的规则系统,有时候比大数据训练的系统,可能更加有效:更精准,更能对抗 sparse data 从而提高 recall(具有 clear patterns 性质的语言现象,可以一网打尽,完全没有 sparse data 的困扰), ...
个人分类: 立委科普|2783 次阅读|没有评论
【语言学家妄论深度学习和AI,旨在 invite questions】
李维 2016-12-10 07:27
与董老师调侃AI泡沫,不过泡沫归泡沫,这次ai热让我们看清了几点: 第一是 大数据里面有名堂 不全是虚的。 第二是 长远一点看 ai 和 nlp 在领域里可以解决实际问题 譬如 我们做的客户情报产品 虽然发现市场没有预想的那么大 但价值是确认了 第三是 深度神经是技术突破 真东西 虽然目前被神话了。至少在 nmt 中 我们看到 ...
个人分类: 立委科普|3207 次阅读|没有评论
【李白对话录之九:语义破格的出口】
李维 2016-11-18 09:01
白: “国内大把的钱想出逃” 钱不会“想”。但是“出逃”只有一个坑,除了“钱”没有其他候选。这种情况下句法优先,语义的不匹配,到语用(pragmatics)层面找辙。一个语用出口是拟人、人格化,把钱人格化。另一个语用出口是延展使动用法,钱的主人“想”使钱出逃。 李: 出口的问题也许不必存在。句法搞定的东西 默 ...
个人分类: 立委科普|3945 次阅读|没有评论
Did Trump's Gettysburg speech enable support rate to soar?
李维 2016-10-29 08:58
Last few days have seen tons of reports on Trump's Gettysburg speech and its impact on his support rate, which is claimed by some of his campaign media to soar due to this powerful speech. We would love to verify this and uncover the true picture based on big data mining from the social m ...
个人分类: 社媒挖掘|4267 次阅读|没有评论
Newest GNMT: time to witness the miracle of Google Translate
李维 2016-10-4 09:22
Wei: Recently, the microblogging (wechat) community is full of hot discussions and testing on the newest annoucement of the Google Translate breakthrough in its NMT (neural network-based machine translation) offering, claimed to have achieved significant progress in data quality and readability. ...
个人分类: 立委科普|6079 次阅读|没有评论
Wei's Introduction to NLP Architecture Translated by Google
李维 2016-10-2 11:37
Introduction to NLP Architecture by Dr. Wei Li (fully automatically translated by Google Translate) The automatic speech generation of this science blog of mine is attached here, it is amazingly clear and understandable, if you are an NLP student, you can listen to it as a lecture note fr ...
个人分类: 立委科普|4731 次阅读|没有评论
【一日一parsing:科普一哈,也得瑟一哈】
热度 1 李维 2016-9-25 14:37
白: “那些林彪说过的话” 看看复数指示词(det)是如何跳过单数NP找到自己的中心语的。 我: 何难之有? 看着最后这句出来,不禁有些惶恐:这样下去,机器超越造机器的人,不是不可能的。内行看门道,自不必说,可今天还是对后学做个科普吧:为什么说此句的 deep parsing 牛得达到了语言学专家的水平,已经 ...
个人分类: 立委科普|2936 次阅读|1 个评论 热度 1

本页有 2 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 18:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部