科学生活新知分享 http://blog.sciencenet.cn/u/allen 学校和科研几乎是我的全部,愿与同道分享科学生活新知。

博文

我的专业经历

已有 5747 次阅读 2009-10-28 10:53 |个人分类:生活点滴|系统分类:科研笔记| 音频内容分析

            本科是学的电子工程,硕士学图像处理,博士主要是学音频语音信号处理。好在中华文化具有兼收并包的优良特性,总称为多媒体信号处理,也算科班出身。
    留大学工作后,主要也是一直围绕语音、音频、视频相关信息处理打转。前期80%的工作都与编码器有关,主要是各种平台的优化实现,也做一些系统,AAC,MP3,G.723.1,G.729;Linux,C54,C55,DM642,C6713,自由组合吧,几乎都整过。先是自己做,后来指导学生做。期间真正做的有成果有意义的,看得见的,就一件事情,国内的AVS音频标准P3编写的主要执笔者和组织者。
    08年到日本做客座研究,开始涉足内容分析,主要是看文献,因为有充足的时间,所以对这方面的前沿技术有了一定的了解,特别是音频视频内容检索的经典算法。当然也知道了自己的差距,国内应用系统做的太多了,利弊怎样,实在不好说。有一点毋庸置疑,我所在专业,水平和企业之间没有太大的差距。
   09年回国后,最初准备做物体识别的方向,也准备把TRECVID引进到中心,无赖产业情景不明,组织了4次研讨会吧,无疾而终。现在在做一个移动平台的音频指纹提取与检索项目,也是一个从论文到工业应用的过程。也极具挑战性,Hash及其衍生技术是其中的一项关键技术,这个月底交货吧。
    期待能和业界的同仁有更多的交流。


https://wap.sciencenet.cn/blog-38719-265604.html


下一篇:从近邻传播(AP)聚类算法看论文写作的时效性
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-7 04:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部