fuzzywanglixin的个人博客分享 http://blog.sciencenet.cn/u/fuzzywanglixin

博文

用盖楼的方式构建深度模糊模型:从盲人摸象开始 精选

已有 7511 次阅读 2018-12-18 12:39 |系统分类:论文交流

  在上一篇博《痛苦,又荒废了一年》http://blog.sciencenet.cn/blog-2999994-1130279.html 中,面对沉重的家庭负担,在极其艰苦的科研环境下,用刘欢的歌给自己打气(心若在、梦就在,只不过是从头再来),让自己振作起来。结果呢?非常有效!三个月来,发奋图强(见下图),完成了两篇自己觉得还不错的论文,在这里和大家分享。

  第一篇论文是:“A Fast Training Algorithm for Deep Convolutional Fuzzy Systems with Application to Stock Index Prediction深度卷积模糊系统的快速学习算法及其在股票指数预测中的应用)”,在本篇博文做简单介绍。第二篇论文是:“Hierarchical Fuzzy Opinion Networks Top-Down for Social Organizations and Bottom-Up for Election(等级模糊舆情网络:自上而下的社会机构及自下而上的选举制度)”,在下一篇博文《从群众中来,到群众中去:等级制度的多层模糊舆情网络模型》:http://blog.sciencenet.cn/blog-2999994-1152188.html 再做介绍。

一、历史回顾

  多层模糊系统(hierarchical fuzzy systems)1991年由Raju, Zhou和Kisner提出,而LeCun提出多层卷积神经网络(deep convolutional neural networks --支撑当下AI泡沫的主力模型)是在1990年,两者几乎同时。在之后的十几年中,两者的命运差不多:一直有人在做,但形成不了主流。Raju的原始论文在google scholar上至今只有451次引用,LeCun的原始论文在最初的十几年也很少被引用。直到2006年Hinton的新算法发表,人们才对多层神经网络深入探讨,结果一发不可收拾,形成了现在的AI泡沫。

  1992年我发表由数据产生模糊规则的WM方法(这篇原始论文在google scholar上被引用3300多次,与Raju原始论文的451次引用形成鲜明对比),由于规则的个数随输入空间的维数指数增长,很难用于高维问题,于是我借助于多层模糊系统来解决这个问题。1998年发表多层模糊系统的万能逼近定理,1999年发表多层模糊系统的BP学习算法(两篇论文加起来在google scholar上只有506次引用),如果接下去继续做,就应该是本篇博文介绍的多层模糊系统的快速学习算法。可惜啊,二十年过去了。从2000年开始,我转去研究股票市场,一发而不可收拾,把模糊领域丢在一边。直到今年年中,看到 IEEE TFS 要发一期深度模糊模型专刊,才提醒我应该在这方面再做些工作,于是有了这两篇论文。

二、方法简介

  博文题目中一会儿“盖楼的方式”,一会儿“盲人摸象”,让人摸不着头脑。其实,思路很简单:对于高维的输入空间(想象成一头大象),我们采取盲人摸象的方式,每个模糊子系统相当于一个盲人,在高维空间中只选择少数几个输入变量作为其输入,然后将其输出(盲人对大象的理解)交给第二层的盲人(模糊子系统),这样第一层盲人的任务就完成了;第二层盲人的工作方式和第一层的盲人一样:每个第二层盲人选择少数几个第一层盲人的输出作为其输入,对其进行总结归纳,形成自己的输出(对大象的理解),交给第三层的盲人,这样第二层盲人的任务也就完成了;以此类推,想建多少层就建多少层,直到最后一层(单个盲人),给出最终的结论。

  这里的关键是:每一层模糊子系统建好以后就不再改变了,像盖楼一样,第一层盖好后就不变了,在其上面盖第二层,建造方法和第一层一样;第二层盖好后也就不变了,在其上面盖第三层,用同样的建造方法;…;以此类推。由于每个模糊子系统只有少数几个输入变量,可以用WM方法快速设计,整个深度模糊系统也就快速的建成了。

三、与深度神经网络比较

  大家知道,支撑当下AI泡沫的深度神经网络有两大缺陷:(1)计算量庞大,因为有大量的参数需要循环迭代,不知道算多久才能收敛,所以将训练好的模型封装到用户端还可以,但如果有新的数据需要学习,用户端的简单设备就做不到了;(2)模型不可解释,知其然不知其所以然,用起来心里没谱;对于像自动驾驶这样人命关天的应用场景,出事不可怕,可怕的是不知道如何改进,保证下一次不犯同样的错误,因为模型不可解释,谁也不知道问题出在哪里。

  本文的深度模糊系统及其快速学习算法恰恰克服了这两大缺陷:(1)由于WM方法只需要数据一次过,不用循环迭代,计算量很小,十几层的深度模糊系统,构建起来非常迅速,在用户端的简单设备上(比如手机)也可以进行新数据的不断学习;(2)深度模糊系统由简单的模糊子系统串联而成,每个模糊子系统就是一些简单的IF-THEN规则,所以深度模糊系统就是这些简单IF-THEN规则的首尾相接,一环套一环,非常容易理解,可解释性很强;如果系统出错,可以很容易查出是哪一条IF-THEN规则链出了问题,予以修正。

四、应用于恒生指数的预测

  还是那句话:赚钱是硬道理!下图中的红线是基于这套深度模糊模型及其快速学习算法的基金三年来(2015年8月31日至2018年8月31日;我从今年9月份开始做这套模型与算法,所以数据取到8月31日)的价值曲线,蓝线是香港恒生指数基金同一时期的价值曲线 --- 嗅到钱的铜臭味了吧:比指数基金回报高出一倍!


  这只是模型和算法的初步尝试,只用了四只股票作为辅助变量,以后将大数据用上,将模型的深度加深,实现真正的深度模糊,打出醉拳的最高境界,又一台印钞机就这样横空出世了!

  具体细节见论文:A Fast Training Algorithm for Deep Convolutional Fuzzy Systems with Application to Stock Index Prediction(深度卷积模糊系统的快速学习算法及其在股票指数预测中的应用)”。



http://wap.sciencenet.cn/blog-2999994-1152181.html

上一篇:痛苦,又荒废了一年!
下一篇:一头大牛与一群大牛的故事:arXiv计算机学科38位moderator(大牛)5篇代表作被引用统计

8 杨正瓴 谢力 陈德旺 薛亮 朱豫才 马德义 高江勇 王安良

该博文允许注册用户评论 请点击登录 评论 (16 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-7-29 23:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部