||
##生物多样性信息学研究及应用
##跨越“朦胧期”的云计算
吴朱华
关键词:云计算 大数据 虚拟化
虚拟机: Xen vs. VMware
OpenStack的生态环境
Hadoop生态圈的完善
数据流支持的Pig
用于结构化查询语言解析的Hive
用于日志收集的Flume
用于数据提取、转换和加载的Scribe
用于实时分析的Impala
NewSQL的兴起
MapReduce
-- BigTable
-- Percolator
-- Megastore 和F1 Spanner
-- Dremel
##国际机器学习大会
徐旻捷 朱军
关键词:ICML 机器学习
第三十届国际机器学习大会(International Conference on Machine Learning, ICML)
3个特邀报告,每个时长90分钟,内容涉及大规模机器学习、高维采样算法及深度学习在语音识别中应用
这3个报告的关键字是“大、高、深”,
-- GraphLab
-- 理论计算机(尤其是算法设计与分析)领域对于高维空间采样的最新研究成果
-- 深度学习在语音识别尤其是声学建模中的成功应用
最佳论文: 第一篇论文来源于离散组合优化,另一篇则来源于代数几何
有8场教学报告会。报告会的主题分别涉及机器学习中的次模态、深度学习、张量分解用于隐变量模型的参数估计、多目标预测、拓扑分析、多视角数据的多聚类问题、机器学习中的连接函数以及应用机器学习进行音乐
信息处理等[8]
##MobiSys 2013国际会议介绍
——关注车辆通信系统设计降低能耗及定位追踪
张苏 王新兵
关键词:创新 应用
- MobiSys: The International Conference on Mobile Systems, Applications, and Services, MobiSys
MobiSys 重点讨论系统研究问题,特别重视在设计、建构和使用移动系统、移动应用与移动服务
方面取得创新的优异成果
##系统能力培养初探
袁春风 王帅
关键词:系统能力培养 教学改革 计算机系统
软、硬件协同设计的软硬件贯通人才
图1 描述了计算机系统抽象层的转换
表1 给出了相关课程基本教学情况的对比总结
学生用电子设计自动化(electronic design automation, EDA) 方式设计具有相对完整流水线的CPU
##计算机科学各领域产出与影响力之辩
-- 如何理解计算机科学领域研究者的评价标准
关键词:论文产出 引用率
通过认真思考这些问题,就能发现现有理论的不足,最终会找到解决办法,并有收获。
- Modelica: 一种开放、面向对象的以方程为基础的语言,可跨越不同领域,方便实现复杂物理系统的建模,包括:机械、电子、电力、液压、热、控制及面向过程的子系统模型。越来越多的行业开始使用Modelica语言进行模型开发。尤其是汽车领域,例如:Audi,BMW,Daimler,Ford,Toyota,VW 等世界知名公司都在使用Modelica来开发节能汽车、改善车辆空调系统等.
- SciLab软件也有开源的Modelica编译器,但目前只是选择性地支持Modelica,以为Scilab提供与Modelica的接口
##CPS行为建模及其仿真验证
杨刚 杜承烈 王宇英 杨亚磊
关键词:CPS 行为建模 仿真验证 一体化建模平台
CPS 的仿真反馈流程可简化为图3
AADL 和UML2.0/SysML
##形式化验证:从混成系统到CPS
卜磊
关键词:形式化验证 混成系统 CPS
##深度学习——机器学习领域的新热点
胡晓林 朱军
关键词:深度学习
1 深度学习的前世今生
A 多层感知机
感知机(perceptron) -> 一个线性分类器
把单层感知机堆成多层(称为多层感知机,如图1 所示),是可以求解线性不可分问题
反向传播(back propagation, BP) 算法
- 支持向量机(support vector machine,SVM): 是一个特殊两层神经网络,但因其
具有高效的学习算法,且没有局部最优的问题
B. 深度信念网络 (deep belief network)
深度信念网络 vs. 传统的多层感知机
唯一不同的是这个网络在做有监督学习前要先做非监督学习,然后将非监督学习学到的权
值当作有监督学习的初值进行训练
概率图模型
C. 深度学习
2 繁华背后的思考
机器学习国际会议(the International Conference on Machine Learning, ICML)、神经信息处
理系统会议(Neural Information Processing System, NIPS) 以及《IEEE 模式分析与机器智能学报》(IEEE
Transactions on Pattern Analysis and Machine Intelligence, IEEE Trans. PAMI )
***
第9卷 第6期 2013年6月
##做有用的学问
——从学术到企业的一个支点
胡事民
清华大学
关键词:做有用的学问 与企业合作
做有用的学问
几年的经历给我打下了深刻的烙印,一定要做有用的学问,选题一定要选有实际应用价值的。所
以在我的个人主页上,文章面向全世界公开,尽量将实验数据、代码公开。我曾经开发了一个算法,
代码全部公开,大概超过800 个单位在使用,而且一年多被引用了将近200 次,并用于腾讯公司的相
关产品中。
与企业的合作
企业要做的是有用的技术,我申请欧姆龙公司的项目的时候,
欧姆龙只要求我讲4件事情:项目介绍、相关工作、准备怎么做、时间表。
中期检查就说4 件事情,项目介绍,关键问题是什么,进展怎样,接下来的3 个
月做什么。项目半年就验收了,很简单。企业要的是真正实用的技术。
通过与腾讯的合作,我有几点感受,
第一是我们需要改变在大学里的观念。选题一定要有实际应用价值。
如果写出来的文章没人看,没人引用,产业界也不关心,那就是没用的学问。
第二是如何看技术转移。我们以前都是将自己的研究成果束之高阁,其实一点用都没有。
##学术与产业 研究与创新
李凯
普林斯顿大学
关键词:研究 创新途径
关于研究与创新有很多种定义,我最喜欢杰弗里·尼科尔森(Geoffrey Nicholson) 博士的定义:
*研究是把钱转化成知识,创新是把知识转化成钱*。
我的建议是:如果一个学者要从事产业转化(创新),最好的方法是,把研究与创新分开。如果想创
新,那你就离开高校去创业;如果你在创业的同时还想继续从事研究的话,就好像脚踏两条船,虽然
声势很大,但是状态不稳定,结果往往也不会理想。
对研究者的建议
论文用**h index**(h 因子)评价比较好。如果用发多少篇论文来衡量恐怕会束缚住研究者的“手脚”,
会让研究者不敢去研究对行业有影响的难题。
对创新者的建议
对于创新,我最希望的是做*颠覆性创新*。克莱顿·克里斯坦森(Clayton M. Christensen) 写过一本书
叫《创新者的困境》(The innovation’s Dilemma)。他在书中提到,创新的产品在短期内的质量和性能或许不是最好的,但是它拥有客户和市场。颠覆性技术可以使产品在很短的时间内达到最苛刻的使用要求。
实现创新的正确途径
以Data Domain 公司为例,分享实现创新的正确途径:
第一,只做用户必须有的产品。这里不仅指产品,也指产品的功能。
第二,技术是由市场来推动的。不是先有技术,再找市场。
第三,与最好的VC 公司合作。
当时Data Domain 考虑的是如果VC 公司对Data Domain 的产品不感兴趣的话,Data
Domain 公司就不办了。
第四,初创的团队必须有非常高的标准。
不仅团队带头人在各方面要有比较强的能力,团队的其他人也都需要有各自的特点和较
强的能力。
第五,要通力合作。不要过于主观和强调自我,确保最终的决定是团队内最好的想法。
Data Domain 公司成功的秘诀有4 点:
第一,选择最好的人。
第二,必须对市场有很好的了解,要有一个好的产品路线图。
第三,对技术的长期发展趋势要有准确的判断。
第四,要想创业成功,就要开发一个新的产品市场。
##软件定义网络: 如果我们重新设计互联网
磨刀不误砍柴工,我对刚入学的研究生的要求是首先把基础打好。我常开玩笑说“欲练神
功,先练内功”。
我要求学生在学习专业课程的基础上,旁听数学专业的研究生基础课程。这样做的原因是,目前许多科研方向已不满足于简单地改进现有成果,而是需要一定的超前思想和创新。这些都离不开严密的数学推理和证明,好的数学与统计基础是当前工程学科科研的重要基石。
例如无线通信网络这一研究领域,就对数学基础有较高要求。在我的指导下读研究生是很辛苦的,他们不仅要具备数学专业的基础,还要具备无线通信网络领域的专业知识,更重要的是要参与科研讨论的全过程。我的每一位学生每周至少要和我讨论一次,汇报科研进展,分析下一步的工作内容。
“work hard, play hard”
刘璘
- 反射模型描述运行态系统与环境,并与系统保持同步关联,
- 监控器通过实时采集到的系统和环境状态更新反射模型。
- 分析器对反射模型进行分析,判断当前系统是否满足预期目标,做出是否
触发自适应过程的决策。分析器的工作逻辑在评估模型中描述,主要定义对反射模型进行分析时
用到的约束条件。
I think: reflect mechanism 我对比Java Fx
除了接口和结构,演化还表现在协议方面,包括组件间的组合模式和流程。
I think:作者此处没有说清
- Supporting the dynamic evolution of web service protocols in service-oriented
architectures
==========
***
##2013年第5期(总第87期)
本期专题是互联网时代的中文言语信息处理。
##言语链:言语生成、感知及其交互
党建武1 刘宝林1 李爱军2
1天津大学
2中国社会科学院语言研究所
**关键词**:言语生成 言语感知 言语链
“言语链”(speech chain)[2],如图1所示
- 多通道感知,即同一感觉之间的相互影响或不同感觉之间的相互联系。
##从语音识别到言语识别
柯登峰 徐 波
中国科学院自动化研究所
**关键词**:语音识别 言语识别 类人听觉信息处理
##语音识别的发展历史
- 研究大致可以概括为5个发展过程,其中形成了6 种关键技术和4 个重要模型。
###五个发展过程
- 音素识别、音节识别和单词识别主要集中在20 世纪50 年代
- 1970 年以后,研究的热点主要集中在孤立词识别和连接词识别[3,4]
- 隐马尔科夫模型(hidden makov model,HMM) [8]
###六种关键技术
- 声学特征提取技术
- 区别特征提取技术
- 区分度模型训练技术
- 大规模声学模型训练技术
- 大规模语言模型训练技术
- 大规模解码技术
###四个重要模型
- 隐马尔科夫模型
- 多元文法模型
- 加权有限状态机
- 深度神经网络
##言语识别与互联网环境
> 很好入门综述,若深入,可参考该文文献
##面向互联网的多言语机器翻译
黄河燕
北京理工大学
**关键词** :机器翻译方法 互联网言语信息 互联网机器翻译
- 典型的机器翻译方法
- 应用文法规则知识的基于规则的机器翻译 - 应用实例知识的基于实例的机器翻译
- 应用统计知识的基于统计的机器翻译
- 综合应用多种知识及方法的多策略机器翻译
###基于规则的机器翻译(rule-based MT, RBMT)
依据转换规则,该方法所表达知识的层次可分为语法型、语义型、知识型及智能型,其分类结构如图1所示。
语法型系统[3]由分析模块、语法层转换模块、生成模块及知识库构成
> 类似于DSL(Domain Specific Language)转换器
###基于实例的机器翻译(example-based MT,EBMT)
- 长尾真(Makoto Nagao): 提出基于实例的机器翻译方法[7,8]
- 核心思想: 基于已有的经验和知识,利用类比原理进行翻译
> 对比迁移学习呢?
- ref
- [7] Nagao M, Tsujii J, Nakamura J.
The Japanese government project for machine translation[J]. Computational Linguistics, 1985, 11(2-3): 91~110
- [8] SatoS, NagaoM. Toward memory-based translation[C]//Proceedings of the 13th conference on Computational linguistics- Vol 3. Association for Computational Linguistics, 1990: 247~252
##CCF 2012海外杰出贡献奖获得者华云生教授
**关键词** :科研 教学
###问 :您在海外从事科研这么多年,对于国外的科研方式您有什么可以分享的?
华云生:
- 科学研究工作是一个不断提出问题和
解决问题的过程。**选题**是科研工作的起点。因为有价值、有吸引力的课题会激发研究人员去思考、去学习、去研究。可以说,**问题**是未知世界最早的拓荒者。
- 然而,选题的目标并不是随意地选取一个研究问题,而是要选择有价值有意义而被别人**忽略**的科学问题。因此,提出一个重要而别人未研究过的科研问题往往比研究一个已被别人多次研究的题目更有**挑战**。
- 因为想找到一个有价值有创造性的课题,要有相当丰富的学习背景、学术知识和研究经验,既要懂得课题的来源,又要有一定的科学素养;既要理解选题的价值及意义,又要富有想象力。此外,对选题也要有浓厚的兴趣。在一个受欢迎选题的基础上做出改进固然有意义,但是提出一个真正原创的、对社会有意义但被其他人忽略的研究问题则更显价值。
- “种豆南山下,草盛豆苗稀。晨兴理荒秽,带月荷锄归。”在大多数情况下,要找到合适的选题需要多次的尝试和改进,甚至可能会占据总研究时间的 90%。虽说选题需要多次尝试和改进,但是好的研究侧重于对问题的关键性理解和根本性分析,而不是无休止的实验。实验只是验证假设的工具。同时,产出研究成果是研究的手段,而不是研究的最终目的。科研质量比科研成果的数量更重要。科研工作应该较少强调定量的度量标准,而应更多强调科研成果给社会带来的影响。
##对斯坦福MOOC的思考
斯蒂夫·库珀(Steve Cooper),麦赫润·撒哈米(Mehran Sahami)
译者:孙志岗 蒋泽清
- 本文译自Communications of the ACM 2013, 56(2), 28~30的"Reflections on Stanford's MOOCs"一文。
**关键词** :MOOC
> 在线教育的新希望创造了新挑战。
- 大规模开放在线课程 (massive open online course,MOOC,中文简称“慕课”)
- 成本问题 vs. 远程学生
- “斯坦福公开课”(Stanford Engineering Everywhere,SEE)
- 麻省理工学院开放课程 (OpenCourseWare)
- MOOC三重唱——人工智能、数据库和机器学习
- 个人创业项目 :Coursera和Uda-city
###认定原创和防止抄袭
###认证
###更丰富的评分手段
###个性化教育
###混合教育
##特色办会 注重品质
——中国数据库学术会议经验介绍
孟小峰
中国人民大学
- 中国数据库学术会议 (CCF NDBC) 始于 1977 年
- 从制度做起,规范流程
- 严把论文评审,端正学术风气
- 双匿名网上评审
- 精心筹划程序,丰富会议内容
- 设立奖励环节,提升品牌意识
- 采取“双向匿名+三级筛评+现场考察+必要回避”原则
#===============
***
##互联网编程语言
陈雨亭 周憬宇 赵建军
关键词:客户端 服务器端 编程语言
- 互联网编程语言 -> 通信技术、互联网技术、产业界需要及人类生活方式改变
- examples: JavaScript,PHP, Ruby,Dart和Go等
- 互联网编程模型
- 互联网编程模型主要包括客户端/服务器端(client/server,C/S)架构和浏览器/服务器端
(browser/server,B/S)架构
- C/S架构: 一种通用网络编程模型,描述两个程序之间如何进行网络通信交互
- 客户端程序是指发送请求的程序,服务器端程序是指响应请求的程序
- 常见远程过程调用(remote procedure call,RPC)采用就是C/S架构
- 对等网络(peer-to-peer,P2P)则是C/S架构的进一步扩充
- 参照编程模型,可将相关编程语言简单分为超文本传输协议(hypertext transfer protocol,HTTP)客户端语言和HTTP服务器端语言
- 客户端语言
- 描述文档结构和内容的标记语言: HTML
- 样式语言: CSS和XSL
- 客户端脚本语言: JavaScript和VBScript
- 服务器端语言
- HTTP服务器包括ApacheServer和IIS等
- 服务器端语言: PHP和Ruby
- 数据库访问SQL语言: 如Oracle PL/SQL
###客户端语言
- JavaScript: 作为一种在浏览器中运行的轻量级脚本语言
- JavaScript vs. Java语言区别包括
(1)JavaScript程序由浏览器解释执行,不需要事先编译;
(2)JavaScript是弱类型语言,变量无须使用前声明,解释器会根据变量使用情况隐式定义或转换变量类型;
(3)JavaScript采用基于函数原型的继承方式,而非类继承。
AJAX(asynchronous JavaScript and XML,异步JavaScript)
如图2所示,页面无需重新加载,仅通过局部动态刷新,就可以给用户提供反馈信息,从而使用户与页面的交互过程更加平滑和顺畅。
- JavaScript -> NodeJS[4] -> 服务器端 + 客户端
- JavaScript语言成为一种通用编程语言。编写一次,就可在客户端、桌面和服务器端运行相同的代码,成为该语言的一大优势。同时,JavaScript 语言还具有简单、灵活特性,一定程度上降低编写服
务器端和桌面应用的难度。
###服务器端脚本语言
ASP.NET,JSP,Perl,PHP,Python和Ruby是六种可在服务器端使用的语言。这些编程语言都是在HTML中嵌入程序片段,由语言引擎解释执行程序,产生包含执行结果的新HTML页
- ASP.NET: 微软公司提供的Web应用编程解决方案
- JSP: 基于Java技术、跨平台的Web开发解决方案
- Struts框架
- Perl
- Catalyst和Mojolicious
- PHP
- Smarty框架
- FaceBook的Hiphop可将PHP和Python程序编译成C++程序
- Python
- Django框架
- Ruby: Rails 框架 -> MVC(模式- 视图- 控制器结构)
###新兴的互联网编程语言
- 新型编程语言,包括Chapel,X10,Clojure,Fantom,Go,Zimbu,Dart和Opa
- 支持客户端或服务器端编程
- 客户端和服务器端使用相同的语言,也为互联网编程提供了特有的优势
- 支持互联网计算
- 支持云计算的分布式/并行编程语言成为研究的热点
- X10:基于Java的扩展语言,具有诸如异步、本地化、原子性和顺序性等并行特征
- Clojure语言: 软件事务存储(software transactional memory,STM)
###互联网编程语言的发展趋势
相关论文:
##LBS的数据处理技术
陆 锋 段滢滢 袁 文
第6 卷 第 6 期 2010 年 6 月 CCF通讯
用三角测量交会原理确定移动目标的位置,如图2所示
志愿者地理空间信息(Volunteered Geographic Information,VGI),或称为众包(Crowdsourcing)
OpenStreetMap(http://www.openstreetmaps.org)是志愿者地理空间信息和众包的一个典型实
例。OpenStreetMap是一个可供公众自由编辑和上传下载的世界地图数据库
***
第9卷 第1期 2013年1月
##视频会议中基于延迟感应的丢包隐藏
华云生
- 模型检测器(model checker): SPIN[6]、TLC[7]、NuSMV[8]和CBMC[9]等
- 模型检测器 + 分布式系统 -> difficulties:
- 绝大多数的模型检测器不能直接处理C、C++、C#等编程语言的源代码。
- 即使用户能够为分布式系统建模,模型检测器验证的也只是系统模型而非最终实现的版本
- 分布式系统之间差异较大,建模工作很难复用。
- 状态空间爆炸的问题在分布式系统中尤为突出
- 将模型检测技术应用于分布式系统的首要难题: 如何建立系统的模型和规范
- C、C++、C#等编程语言和PROMELA这种建模语言并无本质区别,前者的编程语言功能更强大,但欠缺精确性和时序逻辑的表达能力
图1展示了MODIST的工作流程
图2展示了MODIST的系统架构。
###动作建模
- API
- MODIST挑选所有提供线程交互的API
###模型检测
- 模型检测就是一个状态空间遍历的过程。
图3显示了MODIST模型检测过程的伪代码
###状态空间的约简
- MODIST采用了多种手段应对状态空间爆炸的问题
- 首先,MODIST将两个系统API之间代码划归为一个动作的做法体现了偏序归约[16]思想
- 其次,MODIST实现了动态偏序归约(dynamic partial order reduction)的算法[17]
- MODIST提出并实现一种全新归约算法——动态接口归约(dynamic interface reduction, DIR)[18]。
###后续工作
- 故障注入
神经信息处理系统国际会议(the Neural Information Processing Systems,NIPS)
***
##场景引擎:下一代推荐系统的核心模块
龚亮 刘译璟 郭志金
关键词:推荐系统 场景引擎 用户意图
意图 -> 反映用户的行为目的 -> 场景
question: 用户意图如何计算、用户需求目标如何改变、场景又如何控制?
tools: 逻辑回归和贝叶斯
##方兴未艾的计算广告学
刘铁岩
关键词:互联网广告 显示广告 搜索广告
互联网广告生态环境中,网页出版商、广告主、广告平台和互联网用户之间是既竞争又合作的关系(如图2所示)。
##移动互联网广告的机遇和挑战
张中峰 元张毅 糜万军
关键词:移动互联网广告
##《现代软件工程》教学心得
邹 欣
实用教学!
2013 ACM网络搜索与数据挖掘国际会议
The Sixth ACM International Conference on Web Search and Data Mining, WSDM 2013
Duncan Watts:The Virtual Lab -〉虚拟网络对社会科学研究的影响
Catherine Tucker:信息技术对于人类商业行为的影响。她的演讲主题是数字化时代的个人隐私保护
杨强的“Big Data, Lifelong Machine Learning and Transfer Learning”。
大数据洪流带来两个挑战:一方面,如何能够有效地消除噪音,从大数据中挖掘到我们想
要的知识;另一方面,当数据发生变化时,已有方法能否自动调整
WSDM 2013 最佳论文“Optimized Interleaving for Online Retrieval Evaluation”
新的交叉评估(interleaved evaluation) 框架。
交叉评估是在线评估的主要方法之一。
交叉评估算法是指将同一查询下的两个排序结果以某种方式组合在一起,通过跟踪用户在交叉排序列表上的点击表现来评估排序方法的好坏。交叉算法包括排序组合算法和点击评分机制两部分。
##我最爱的十篇“实用理论”论文*
* 本文译自ACM SIGCOMM Computer Communication Review,My Ten Favorite "Practical Theory" Papers,
2008,38(2), 43~45一文。
关键词:协议 路由 优化 测量 调度
read in free time
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-28 22:48
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社