||
“大数据、大模型和机器学习与管理理论之间的隔阂、融合与共赢”会议记录
一、会议主题
大数据、大模型和机器学习与管理理论之间的隔阂、融合与共赢
二、会议背景
近年来,大数据、大模型、机器学习容易受到人文社科学者关注,如何将大数据分析、大模型和机器学习分析的结果和管理理论相结合,成为目前研究者非常关注的问题。如何跨越大数据分析、大模型和机器学习与管理理论之间的鸿沟或者隔阂成为了目前的一个需要直面的问题。基于此,发起此次学术讨论。
三、会议内容
讨论一下大数据分析的结果与其可解释性的问题。最近,学习发现机器学习的结果像实验报告,没法和管理的理论问题联系起来,这非常重要。如果我们只是分类或者回归,然后就缺乏了解释力和理论贡献,虽然实践上有所发现,但是衍化不了好的理论论文。
四、会议性质
公开讨论(记录及整理:王少楠等)
五、会议时间
2024年6月17日:19:30开始
六、会议形式
腾讯会议
七、会议主持人
刘超、姚伟(联合主持人)
八、参会人员
刘超、姚伟、林建衡、代文彬、周鹏、张佶、石梦茹、王少楠、刘翠、谭新月、王瑞华等。
九、会议内容总结
本次会议围绕“大数据、大模型和机器学习与管理理论之间的隔阂、融合与共赢”的主题展开深入讨论,会议由刘超和姚伟两位老师联合主持,参与者包括多位学者和研究生。会议的核心议题是探索如何将大数据分析、大模型和机器学习的最新成果与管理理论相融合,解决当前研究中存在的理论与实践脱节问题。
会议中,刘超老师分享了近期指导一名专硕研究生的项目,该研究旨在利用机器学习技术预测生鲜电商平台的消费者行为模式,特别是服务质量的迭代策略,最终用机器学习为领域相关的数学建模、理论推导等内容进行动态赋能。研究生运用了主题模型挖掘、K均值聚类和多层感知机(MDL)神经网络进行数据分析,但因数据来源有限,尤其是缺少实际的消费者行为数据,导致研究结果的解释力和理论贡献不足。刘超老师对此表达了数据获取难度的担忧,认为数据来源受限是数据结果未达人意的可能原因,并就结果未达到预期效果原因和结果优化途径提出疑问,基于此,参会者展开激烈讨论。
林建衡老师从论文撰写角度提供了意见,他指出研究生论文的撰写需要更加全面,尤其是在理论创新和深度上需要加强。林建衡老师建议研究生应扩大参考文献范围,同时考虑到已有研究成果,避免重复研究,寻找创新的视角。他也指出了研究生论文的不足,即缺乏深入的理论支撑和明确的研究目标,这可能是由于研究生对研究领域的不熟悉和方法掌握上的不成熟所致。同时,林建衡老师强调了理论与实践结合的重要性,认为理论模型的构建应当基于数据的实证发现,并建议刘超老师可以考虑在理论假定上做些改动,以适应新的研究问题。
代文彬老师也参与了讨论,他认同刘超老师试图通过机器学习丰富理论假定,进而构建新理论模型的思路。针对研究中存在的问题,他建议应明确研究变量,如价格与购买量之间的关系,以及考虑情境因素对消费者行为的影响,确保机器学习模型能准确提取具有情境含义的特征变量。
姚伟老师对刘超老师想法给予了正面评价,同时指出研究在理论基础和数据处理方面的不足。他认为,虽然机器学习方法应用得当,但在数据预处理环节,如停用词过滤未得到妥善处理,影响了数据的纯净度和分析质量。此外,姚伟老师强调了理论深度和研究哲学转换的重要性,鼓励刘超老师及其团队在研究中融入诠释主义视角,结合实验主义方法,形成独特的理论与实践相结合的研究路径。他提出,通过调整和优化现有研究,可以分别撰写理论性和实证性两篇论文,形成学术研究的新范式。
除此之外,姚伟老师团队的研究生积极参与了本次讨论,向刘超老师建议从理论深化、方法优化与质量提升等方面入手探索突破口,促进研究方法的创新与理论框架的构建以实现大数据、大模型和机器学习与管理理论之间的隔阂消除与深度融合。
会议最后,与会者一致认为,尽管目前的研究面临挑战,如数据不足、理论基础薄弱及结果解释力不强等,但通过不断迭代优化模型、深化理论基础、加强理论与实践的结合,以及跨学科的合作,可以逐步克服这些障碍。刘超老师的探索性研究虽在起步阶段遭遇困难,但其创新精神、开放性思想与前瞻性思维得到了大家的高度认可,有望在后续研究中取得突破,最终推动管理理论与大数据、大模型、机器学习技术的深度整合,实现研究领域的创新与跨越。
十、会议思想与科研启迪
1、关于跨学科交融方面
跨学科思想的交融是当今学术研究领域的重要趋势,它打破了传统学科之间的界限,将不同领域的知识与方法进行整合,以应对复杂问题的挑战。在“大数据、大模型和机器学习与管理理论之间的隔阂、融合与共赢”会议中,学者们深入探讨了如何将大数据分析、机器学习技术与管理理论相结合,以构建理论与实践的桥梁。刘超老师的探索性研究,尝试利用机器学习技术预测生鲜电商平台的消费者行为模式,这标志着跨学科思想在实践中的应用,既是对传统管理理论的补充,也是对新兴技术在管理领域应用潜力的探索。然而跨学科思想的实践,要求研究者不仅要精通本领域知识,还需掌握并应用其他领域的理论与工具,以促进创新思维,开辟解决问题的新途径。因此,跨学科思想的实践既要做到边界范围“有度”,又要做到逻辑结构“自洽”。
①跨学科融合的边界范围“有度”
跨学科研究要求研究者从多个角度审视问题,刘超老师将大数据、大模型与管理理论进行交叉渗透,实现复杂化、混合化、逻辑化、系统化和一体化的整合过程。这种跨学科融合不仅拓宽了研究视野,还推动了学术生态系统的开放构建,为促进学科间的对话与合作创造了条件,进一步助力知识的创新与传播,推动科学研究的全面发展。
在跨学科融合的过程中,边界范围的设定至关重要。跨学科融合旨在促进学科间的相互借鉴与发展,要求研究者在维护学科独立性的同时,打破学科壁垒,以开放的心态吸纳其他学科的有益成果,实现创新发展,因此边界划定需基于学科间特性的考量,以实现学科内涵的升华,而非简单拆除学科边界。刘超老师进行的探索性研究,在坚守学科边界的基础上,进行科学的跨学科融合,确保管理理论与大数据、大模型和机器学习之间的融合在必要性和科学性的框架内进行,在保障学科自身的学理性同时兼顾了学科间的规律性。
②跨学科融合的逻辑结构“自洽”
逻辑结构的自洽性是跨学科融合研究成功的关键。跨学科研究需对学科间的逻辑进行深入对比、审视与检验,保持跨学科融合的自信与自洽的高度,以确保研究成果的稳定性和可靠性。在此过程中,应审慎思考跨学科融合的逻辑结构,避免因逻辑不清或结构模糊导致的理论冲突与悖论,关注管理理论与大数据、大模型和机器学习跨学科融合的内在逻辑与限制条件,以确保跨学科融合的切入具备自洽性。这有助于研究者更加精准地聚焦与解答现实问题,为解决复杂问题提供创新视角与解决方案。
总而言之,跨学科思想、方法的交融,不仅促进了学术研究的深度与广度,也为解决实际问题提供了新思路与新工具。通过跨学科融合,研究者能够更好地理解复杂现象,推动学科间的知识创新与传播,在保持边界范围的“有度”同时追逐逻辑结构的“自洽”,是学术研究全面发展的活力源泉。
2、关于学术创新探索方面
①学术创新之基:开放思维与前瞻视野
学术创新的持续进步,离不开开放性思维与前瞻性视野的紧密结合。开放性思维鼓励研究者接纳多元视角与不同观点,勇于探索未知领域与新兴技术;而前瞻性视野则使研究者能够预见未来趋势,提前布局研究方向,确保研究成果的时效性与创新性。刘超老师的研究实践,正是对这两种思维模式的生动诠释。他们不仅关注技术前沿的最新动态,还积极将机器学习等新技术成果应用于管理理论的研究中,从而推动了技术与管理之间的深度融合。这种前瞻性的尝试,即使在起步阶段遭遇困难,也展现了对未来学术领域可能创新点的预见性,为学术研究的持续创新和突破奠定了坚实的基础。
②学术创新之魂:多维探索与逐层深入
多维度、多层次的探索是学术创新的核心路径。刘超老师从技术与管理两个维度出发,深入剖析数据的收集、处理与分析方法,并探究数据背后所蕴含的组织行为、决策逻辑及市场规律。这种跨学科的研究框架构建,能够在不同维度上揭示技术如何影响并重塑管理理论。在此过程中,系统论方法、纵横结合法与点面结合法等研究方法的综合运用,为全面审视技术与管理相互作用提供了新的视角与工具。
③学术创新之源:团队合作与能力培养
团队合作在学术创新中发挥着至关重要的作用。通过汇聚校内外专家的智慧与经验,调动团队成员的积极性与创造力,研究者能够形成合力,共同攻克学术难题。刘超老师在研究中注重团队合作与集体智慧的发挥,通过互学互补、集思广益的方式激发创新思维与灵感。同时,他们还重视培养年轻学者的科研能力与创新精神,为团队提供多元化的探索平台与机会,共同推动管理理论与技术的深度融合与创新。
④学术创新之道:学术研究范式转换
在大数据、大模型和机器学习与管理理论融合的背景下,传统的学术研究范式正经历着转型。一方面,从实验主义向诠释主义的转变,意味着从数据驱动的实证分析转向对数据背后深层意义的探索,要求研究者不仅要关注“是什么”,更要关注“为什么”。这种研究范式的转换,要求重新审视研究问题的选择、数据的处理和理论的构建过程,以更开放和包容的态度接纳不同学科的视角,推动理论与实践的深度整合。另一方面,对研究哲学的深刻理解是构建有深度理论模型的基石。研究哲学的转换,即从实证主义向诠释主义或批判主义的迁移,这意味着更加注重理论的解释力和批判性,鼓励在研究过程中不断反思理论的适用性和局限性。通过理论与哲学的双重深化,最终为研究提供更坚实的理论基础,促进理论与实践的深度结合。
3、关于论文撰写方面
在撰写文章时,应兼顾文章深度与广度,既要体现扎实的理论基础,又要展现丰富的实证分析。如何在学术论文的选题与撰写过程中,采取全面、系统且富有创新性的方法确保论文的高质量与学术价值至关重要,这要求既要确保选题新颖性与价值,又要立足问题本质推动理论与实践的融合。
①拓宽视野,多元融合选题
秉持“内外兼修”原则以确定优质选题。在外部探索上,广泛阅读本学科相关文献,迅速把握学科脉络与前沿动态,从中汲取灵感。同时,紧跟学术期刊的选题热点与国家政策导向,确保研究紧贴时代脉搏,兼具时效性与价值性。在内部挖掘上,强调实践经验与理论反思的结合,培养从日常学习与生活中提炼研究问题的能力,实现“实践出真知”的良性循环。
②多维审视,确保选题价值
选定研究问题后,通过“切己之思”“学理之思”“能力之思”“融合之思”“创新之思”进行五维思考以深化认识,确保选题的科学性与创新性。“切己之思”是评估选题与个人研究兴趣及能力的契合度,避免力所不及的盲目选择;“学理之思”是审视选题的教育研究价值,确保其符合学术规范与需求;“能力之思”是考量自身资源调配与研究条件,确保研究可行;“融合之思”是明确研究所需的理论基础与知识体系,为深入研究奠定坚实基础;“创新之思”是在综合前四项思考的基础上,明确研究旨在解决的具体问题,体现选题的独特贡献与创新点。
③层层剥茧,直击问题本质
确定研究问题后,应进一步确立论文写作的核心支撑点与逻辑起点。对研究问题实施层层递进的深度剖析以凝练核心观点。逐步揭露问题的内在结构,识别并聚焦影响问题的核心要素及其关键方面,进而通过递进式的探索路径准确把握问题的本质。
④论点辐射,构建思辨网络
在确立核心论点之后,学术论文的撰写可以通过论点辐射,围绕中心论点展开多层次、多维度的探讨。以核心论点为圆心,逐步向外扩展,形成一级、二级乃至三级议题网络,确保每一层级均紧密围绕中心论点展开,从而构建起一个逻辑严密、层次分明的研究与写作框架。
⑤事实依托,融合理论实践
在学术论文的创作过程中,应严格遵循“从实践中来,到实践中去”的原则,确保论点既建立在坚实的理论基础之上,又经受得住实践的检验。一方面,进行深入的理论思辨以构建坚实的理论支撑;另一方面,开展严谨的实验验证或案例分析,以避免出现“论而未证”的理论与实践脱节现象。同时,要警惕“独断独白”的倾向,即在论述中保持开放心态,尊重并吸纳多元观点,避免陷入主观臆断;此外,还需注意构建完整、系统的论述体系,防止“论无体系”的随意与散乱,确保论文的每部分都紧密服务于整体论证逻辑。
十一、会议纪实
刘超:这是一个专硕,最近我让他做了一点儿工作。当然他这个工作做的还不太完善,就是做的比较粗,他这个工作好多地方都有待完善只是常识性的。我让他去尝试用机器学习做一点儿工作。试着写。我想让他做一点常识性的工作,但是这个工作呢做的很一般。当然,另外两个这个研究生呢,他也在做这个工作,但是他们现在还没有做出来。就有的时候。这个我我我让他们做一些工作也。这个有的时候他这个想象力就好像是不是特别的,因为这是一种探索性的方法不太容易。另外现在论文发表难度也不小。他这个工作呢,是用机器学习做的这个生鲜的电商消费者行为模式的一个预测。当然他这个题目起的不好。我想呢他就主要是生鲜电商它的这个服务质量的一个研究就是所谓叫迭代策略的研究。那么主要呢,在整个研究体系里边就是不关注生鲜消费者需求端行为的分析。这是我的设想,就是说他的首先从需求端消费模式进行分析。那么下一步呢,在这个基础上我们想用它这个发现出来的东西呢?我们看看能不能跟我们以前做过的一些理论模型深入结合,这是我初步的一个设想。
寒假期间,他去北京专门培训了,参加了培训班,他们三个人参加了培训班这个。他用的这些方法呢是那个陈强老师,山东大学陈强老师给他们做的。这个研究生做出来的用了三个方法,一个是主题模型挖掘,还有一个是K均值聚类,再有一个用了一个神经网络,就是MDL多层感知机进行预测。那么首先他做了一个这个网上评论的一个主题,挖掘用非监督学习的技术。也就是主题词挖掘。这个主题词挖掘之后呢?他构造一个这个聚类的矩阵,然后聚类矩阵通过把这个消费者根据他这个记录之间的相似度构造一个矩阵相关性的矩阵。那么这个相关性的矩阵是属于这个消费者,他要构造这个特征向量,用这个特征向量若干个消费者特征来判断这两个消费者他们的在购买当中近似性。这这是我给他的任务的设想,但实际上呢,这里边就后来就出现了困难,就是说消费者的行为数据那不好找,在这个网上这个没有这种行为数据的来源。因此,在构造特征向量的时候,这个特征向量没有太多行为的数据。那你像这个数据里边信息只涉及消费者购买的这个评论。但是行为数据他找不着这是个困难,从数据来源上我们遇到了难处。那么从哪要行为数据呢?而且有些公司他未必愿意跟我们去分享,因为这是深层次的涉及到他的客户,这里边有一些敏感的信息?这个我现在还在想个办法去看看,如果能够找到这样的公司他愿意跟我们分享一些数据就太好了,问题是没找到。那么这些个从网上获得的这些个数据呢?这个很粗糙不能够准确的刻画出来生鲜消费者在购买行为上的差异。因此它构造的特征向量特征值它就不含有行为的这个特征。首先我们怎么界定这个消费者的行为,我觉得应该是比方说两个消费者在订购这个生鲜品的时候购买时间、购买点击次数、购买网站差异。行为是动态的具有全程性。这些特征值我们没有获取到就把这个忽略掉了。然后他就做了一个聚类,这个根据特征点距离做了聚类分析。通过K均值聚类以后又通过前面的分类数据构造一个多层感知机的预测,通过这个特征,利用神经网络学习预测消费者需求是多少。于是呢把这个数据70%作为训练30%作为测试。它只取了五个特征向量根本就不够但没有办法。然后设置的轮数是做了1000次,经过反向传播的梯度优化,学习率是限定的0.01。加一个模型的参数设定进行训练获得一个结果。首先呢,他从京东生鲜平台上弄到这些数。弄的这些数经过主题词提取,提取的是2024年4月22号起。后边采集了2000条它大致分为主要是蔬菜,水果,肉类,海鲜,禽蛋这么几大类。那么这个蔬菜类采集的有菠菜,生菜。水果只采集了火龙果跟菠萝作为一个典型的评论数据。肉就采集了这个牛排,羊排。海鲜是三文鱼,梭子蟹两种,我觉得这购买频次都不是特别典型,禽蛋的都是鸡蛋,鸭蛋两个。乳品就是鲜奶。由于数据不足一共采集了2万条。剔除重复值之后还剩下1万3000条。所以1万3000这是它构造的词云图,进行主题分析。
姚伟:刘老师非常好,这咱们的交集就出来了。
刘超:这个主题色你要是看不清你随时打断我。
姚伟:不用不用,我们扫眼就明白,因为这个咱正好有交集,为什么这次我积极推,这正好是这个跨团队交流的地方。
刘超:那你正好给我诊断诊断,就是现在遇到这个困惑。
姚伟:对对对。为什么说这个。你讲完了我再说我不打断你,你讲吧!
刘超:这前三轮显著性。这里边有鸡蛋,三文鱼这是?选择主题出现的频率还是总体词频率。然后他这个画了一个主题词大概分布图。当然这个图显示的是什么意思?我大致也对这个不熟悉。大致根据LDA主题分析,然后分类结果归纳整理六个主题。关键词列出来所属的范畴。这个分配合不合理我打个问号。那他所谓就是想反映消费者关心这个重点。通过这些主题词关注重点。那这个合理性保持质疑。紧接着他做了一个细分要预测。他就是只是采用了一些方法,这是K均值聚类。一个聚类就聚出来这三个。提出来之后呢它分为第一类是价格敏感型的,第二类健康敏感型,第三类是便利型这三大类。因为它根据这个数据点的特征。聚类分三大类下一步呢,就是说他还要根据这些特征进行一个预测模型的建立。他就想用神经网络去构造一个预测模型。我输入端以后输入一定的数呢?唉,我给他预测出来。然后又做了一些这个结果出来。这是他全部的这个获得的这些结果。但是呢,这个从获得的这个结果给我的感觉来看呢,现在我们的困难是什么?就是我觉得这样的一个东西。做出来给我觉得这东西对我来说很难和我的这个理论模型去结合起来。你告诉我这个我没法构造。我原来的设想是你必须告诉我一个行为的方式。这个行为的方式之后呢,我有一些新的发现。那么通过这些新的发现。我来构造一个理论模型,或者说我理论模型当中我有依据是吧?比如说我这个购买的频次。消费者购买的频次和他愿意从网上购买是多少频次是吧?我们通过机器学习方法我可以探测出来或者是我能够通过机器学习呢,我能够反映出来消费者对哪一类的商品有哪些个需求的特质。这个特质能体现出来的,我能够提炼出来之后呢。我能够把它变成理论的模型,这样我的理论模型构建出来以后呢,比如说我用game model,我用这个计算的方法,我做一些理论深入的探讨,这些探讨就不是凭空的了,我就跟实际去关联起来了。这样就建立了理论模型结果和机器学习实验结果的对应关系。我是想干这个事儿,我不知道,我表达清楚没有,就说我想干的事呢是把理论模型的部分呢。将机器学习结果作为实验性的结果,作为证据支撑,根据实验结果建立理论模型,就像物理学里边是实验物理学,我获得一个实验的数据,然后我根据这个实验数据,我构造这个理论的模型。这是我的设想,我的设想不见得是正确的。那么社会科学,比如说我们的管理科学领域能不能这么用是吧?这都是一种探索。但是从目前来,反正他要是给我这个东西,我现在做不出来的。他最关键的问题是什么?你看他的这个文章里边。他统计了这一万多条数据没有得到什么,没有得到解释性的效果。
姚伟:对对,你的学术敏感性非常好,咱们是共鸣的刘超老师!咱是共鸣的。
刘超:那就是说我最大的失望的地方就是实验了,当然他研究生自身还在学习当中。
姚伟:对,也不够。
刘超:不是。但是通过他这个工作呢。我至少感觉到离我的理想差的比较远。你看这个是不是主题词,通过聚类分析你看他总结不出什么东西,研究不出什么东西来。
姚伟:对对,说的太对了!
刘超:哈哈。所以这个就不行。你要是这个给我这种。就像做实验一样。但是我怎么跟我的理论东西联系起来?你要是如果说纯从实践角度去看待这件事。我觉得他做的工作是有实践意义。因为可能这个东西,数据给了这个电商平台,对电商平台企业来说,它可能有一定的启发意义。比如说把我的消费者分成了几类?然后呢这几类的特征是什么?然后我要根据这几个特征,我能够对他的未来的消费趋势进行一定的预测。对于公司来说有意义。但是对于我来说意义不大。为什么呢?因为我想要的是把它变成论文。
姚伟:对对对。
刘超:现在这个东西变不成论文,反正我是没想出来这个。
姚伟:可以变可以变。
刘超:怎么给他唉,我就想。跟大伙请教请教给我也出出主意,开拓思路。
姚伟:对对对
刘超:就说像这种是吧,跟我们的以往的这种。理论研究这种结果怎么去结合?这时候也是我最近比较困惑的地。因为这个前期也投入了不少精力,应该说也花了点时间,花了点金钱时间,精力也投入了。但是从目前来看。还没有找到这条路径怎么去在这两者之间架一个桥梁。所谓这个机器学习怎么赋能?怎么赋能我们写论文,我要说别的就是说的有点有点不切实际,其实我现在脑子里的最大疑问。就是我想用机器学习来赋能我的这个模型,现在没法赋能,其实就这么回事。所以请那个老师和同学们就是帮着我也是出出主意,然后看看怎么有一些好的办法,或者建议大家帮着分析分析。这就是我想跟大家交流的一个事。
姚伟:行刘老师。
刘超:你是专家,你多提。
姚伟:对。不,我不是专家,咱今天呢咱19个人刨除咱俩17人正好可以咱小班讨论,因为我就按照这个顺序。第一个是eric老师,这个我有点熟悉,但是我记得您好像有点熟。我对不上号就是这个老师您能跟刘老师,可以沟通一下子吗?或者有什么需要大家挨个来17个人足可以了,我最后我再说刘老师因为咱们有交集。
刘超:好的。
姚伟:机会太难得了,就是跟你这样的大咖沟通太难得了。
刘超:不可能,不是大咖。
姚伟:就eric老师您那边方便吗?Eric老师可能他没听见是吧,下面这个我就按这个走了。下面那个建衡老师?建衡老师你有什么想法吗?
林建衡:我觉得刘超老师说这块儿的话,我特别能够体会他意思。而且就是我作为一个什么呢?我作为一个就是对这块也没有深入研究,这个论文我感觉意犹未尽。就是咱们现在学生论文的时候呢,我就感觉后边的这个部分特别少。另外一个刘超老师的话,这个论文我想问一下刘超老师,您这个学生这个论文是跟哪个期刊风格应该是差不多的,是中国管理科学吗?
刘超:他现在倒不是说他想瞄准什么期刊。因为他是一个专硕写的。这是一种尝试,就是说他这个水平我觉得他这个文章要是发表期刊这个。我觉得还没写完这个东西。
林建衡:对,因为就是我觉得有一个东西就是比如说就是学生来说哈,但是我能力也有限。
刘超:这个差的还比较远。
林建衡:就是我们一般情况下写东西的时候呢?可能有的时候就是就是可能达不到那种,就是理论创新的时候呢,可能我们更多的是模仿。模仿的话呢就是。就是我不知道刘老师就他这个参考文献,他参考的是哪些?就是他参考文献的话,跟他这个就是跟他这个论文那个style可能比较相似吧,或者说他有借鉴模仿这一块。刚开始吧,因为他还可能还不是这方面的,这个特别深度的专家。就是他参考文献或者他内心,他想的是往往这个哪种类型的期刊上去走。因为你看就是刘老师就是您发的这个文章,包括您这个国外这个期刊的话,对吧?其实您的参考文献的话就是您的文章和其实它的参考文献这个风格特别像。其实要是看,另外就是姚老师,实际上他的这种相关的这种期刊的话,跟这种期刊的话呢,就是姚老师他的这个理论创新吧,或者说他里面跟他的这个主题它其实也很像。另外一个,您这里边说机器学习,另外这个是生鲜电商这块,那么那么这个里边它是和哪些期刊,它是大概其实匹配的。就是咱的模仿对象是谁?如果说咱模仿对象是他们这些期刊的话,那么这些期刊里面咱就说中文的英文的话。咱先说中文就是那么这个中文期刊它相类似的最后他达到一个什么程度?我觉得这样一比较的时候,可能咱们就最起码在国内这块就能比较出来了,我感觉因为做这块,可能这个题目已经有人在做了。而且在做的时候还做到一个什么程度?这块我觉得可以去比较一下,然后一比较的话可能就看到了,反正这是我有的时候就是比如说看咱们同学们写东西的时候,他肯定会比较某个期刊,或者说这个期刊里面。他是哪一类的,这个东西比较的话,最起码如果咱们不去说这个东西的话,就让学生自己去比较的时候,就是说你做这个东西,离他正式发表这个期刊里边的这个专题,人家做出来的还有什么差距。反正我感觉就是您看您前面这个工作量。可能也不少了。后面那块我感觉意犹未尽,就刚才您说的解释那块。
刘超:对,谢谢林老师。
林建衡:另外刘老师你让我看这个文献。看看他参考啥文献?对。参考文献咱基本上就看他这哪块的东西了。
刘超:对,但是比较乱他这。
林建衡:参考文献是这种。
刘超:对他这个。
林建衡:那底下底下还有吗?
刘超:没了。
林建衡:没了。
刘超:他这是个专硕。另外他所做的工作呢,也是一种探索性的工作,他的目的不是为了发表?
林建衡:我明白。其实刘老师我不知道我说的对不对,我就瞎说哈。其实他这一块现在做的时候呢。我觉得他可以把这些文献可以再扩充一下。另外一个他那个文献我看里边有这个。就是有的这个文献里面,我感觉是在管科里面已经做了好久了。另外我觉得可能我没这种深度,可能我觉得什么呢?我觉得可能还得再创新一下。
刘超:对,他肯定是这样。
林建衡:就是人家做过的东西,咱们在做的话。就是你想人家那个人家那个自科或啥的,人家那一个学院或一个大团队来弄。咱这就是一个同学来弄的话,我觉得咱应该变道,咱不应该在已经很拥挤那个道走。刘老师我就瞎说的,我说的未必对刘老师。
刘超:没有没有,您说的挺好的。
林建衡:我有时候就什么呢,你看咱以前聊的时候就是管理科学那块吧,对吧,管理科学那块,后来我看您那块我也去看人家的文章,你比方说天大办的中国管理科学,人家那一期才几篇文章。
刘超:谢谢你!
林建衡:我就感觉人家那个团队时间特别长了,我觉得咱跟他道不能一样。因为咱兵力有限。刘老师我就说这么多。
刘超:好好好,谢谢谢谢!谢谢林老师!他是这样,我想回答林老师的疑问。他这个同学呢?他不是学硕?所以他的论文呢并不是为了发表因为他专硕的话,他也不是为了发表高级别的期刊上。我只是让他们做一种尝试。就是说因为我有一个想法。因为以往的这个我的论文风格呢。是纯数理的模型。它这个纯数理模型呢?我们做的这个东西呢?说实话,他缺乏现实的这种应用的场景和布局支撑。那么我就想做一种新的探索。因此呢,他这个就是关于生鲜消费者用机器学习的这个方式去做这个消费者的学习行为模式。我也自己也查了一下这个相关文献确实还不是特别多,目前。无论是英文的还是中文的。不是太多。倒是有好多机器学习的,它是纯机器学习,也就是说它在计算机领域。它并不是管理。所以用机器学习研究管理行为。说实话,这种文献不是特别多,有一些,但是不是特别多?所以对于研究生来说,这也是有一定难度的。因为它可找文献也不太多。同时自身对这个问题的理解呢,它也有一定的限制。这一上来因为他只接触了这么几个月。我想干的事儿呢,就是说我想。并不是说把这他这个文章发在哪个Top期刊上。因为我没抱这个希望。他这个文章水平的话。顶多也就是个一般刊物,连个核心都费劲,从目前来看。它这个目的不在于什么呢?在于我想让他给我探索一个新的方式出来。就说我现在的文章跟我现在的这个风格的。不太一样的地方,因为现在我们做的我给林老师看一下,我现在做的研究。大致能够跟林老师解释清楚。你比如说现在这是一个我们正在投的一篇文章,这是?我们现在做的一个功能。这是我们的文章的风格。您可以看到他的这个,我们就是纯理论的模型。那么这种纯数理模型呢?我也能得出一些结论。通过这些模型的结论呢最后归结为一些定理或者是一些命题。这是我现在文章的风格。就是以往我们发表的文章都是这一类的。但是这种风格的文章呢?它有一个弊病。就是说我研究出来这些东西。都是一个纯理论发现。它和现实当中,它隔着一道沟没法用。你比如说我做出来这个定理。当然,这个公式的背后,它有一定的管理意义。但是有管理意义,它描述了一些管理现象规律。但是说这些规律行为就是说它怎么跟现实应用去衔接起来,这个我们做不到。因此呢,我想做的事儿呢,首先在我的这个理论模型的构建前期的阶段,就是在设想的阶段,我至少就能够让他有这个现实依据和支撑。就不是说纯理论的这种推导。在这个支撑的基础上。我就能把这个理论呢,就跟现实之间我就能搭建一个桥梁就能用上了。现在是用不上所以我想干的事是这个事。于是呢,我就让这个研究生呢?想让他们做一些探索。用机器学习方法呢搭建理论模型跟这个现实模型之间的一个桥梁。这是我的一个设想,脑子里设想是这么想这么干,但实际上呢,这不是初步一干呢就发现问题了。这个事儿不好干,因为出来的东西解释性不强。这个就像林老师刚才说的。后期深度挖掘不够,他就是挖掘不出来。当然,这个数据是受限是一个客观原因。就是消费者的行为数据我不好弄,这确实是。但是行为数据不好弄,即使是弄来了,反映出来的结果就是这个。我接着怎么干呢,我想不出来了现在。所以现在我这个困惑就在这个地方,我倒不是说期待他发什么高档次论文,其实他也发不了这个,我倒没期望他做这个事,就想做一个实验性的东西。我不知道解释清楚了没有,林老师。
林建衡:刘老师我觉得你说的特别好,这个我就理解什么呢。刚才您做那个特别漂亮,就那个公式什么的,我觉得就是您把这个研究变得更有趣了。怎么说呢,就是从原来的这种就是模型这块,然后现在呢,咱们就有这种叙事的色彩了。而且呢,其实您看咱们国内现在文献现在也在做国外那边,他就把这个题目它变得特别有趣,您像您这个题目的话,我觉得哈就是什么了吗?基于机器学习的什么的探索。唉,这样的话给一个悖论,完了以后呢,大家带着兴趣一看。我觉得就很有趣。
刘超:对对对,您说的很对!
林建衡:挺好,刘老师我学到好多东西,真是谢谢刘老师
刘超:应该有趣,谢谢您!谢谢林老师!
姚伟:行。这个专硕已经非常不错了,咱再顺着走一遍,然后刘翠看看有什么跟着刘老师请教或沟通的有没有?就说没有也没事,就是因为机会太难得了。
刘翠:诶,老师我想再听听,我现在还没有太理解。
姚伟:行,好嘞。
刘翠:完了。
姚伟:后面那个乾乾老师呢,因为我对不上号,咱就按学术会议,咱们都小班讨论一下。乾乾老师看看有没有想跟沟通的?要没有咱就往下面石梦茹看看有没有跟刘超老师这个交流和沟通的。
石梦茹:哦,有一点点。刘超老师好,我最近也在看人工智能方便的一些文章,他也有去讨论解释性的这个问题。
刘超:唉,你好唉。
石梦茹:他说就是在这个方面去,比方说对他分析的结果去进行解释的话,它可能就是对他,就是你已经挖掘了这个事实,他相关的事件这个属性或者这一类的决定,他们为什么发生的解释?就是可以从这个里面去和您现在研究的这个领域相关的理论,或者是去结合就是来和领域知识去结合更有用一些。就比如说。他那个词云图?好像还有一部分是他做分类了,就是您说他做了那几类。
刘超:对,他分了几类。
石梦茹:对,老师就这样,这可能就可以用。就是我也没有什么经验,就是可以用您这个领域知识可以给他。归纳的更专业学术性一点,他现在是看不出什么东西来的,就是仅从它归纳出来的这几个范畴。对,是没有办法进行下一步的。
刘超:它比较表浅,它这些东西。
石梦茹:可能需要在。根据领域知识再去挖掘一下。所以大概就是我的想法,老师就没有了
刘超:谢谢谢谢!这也是给我们一个启发。就是说从他这个词是吧,这个分类词这个范畴里是吧?再挖掘挖掘。这也是一个新的就是。给我们提供一个新的思路。
姚伟:行,后面那个谭新月?看看跟刘超老师有什么沟通的吗?
谭新月:老师好。
刘超:唉,你好。
谭新月:我觉得他这个研究,比如说这个LDA它的主题在分类了之后。就是他得出来的这些个结论,像是新鲜便利,就是可能像老师平时说我们的文章就是他是比较我们平时可能就能想到的一些词,比如说我们去超市或者是购买一些东西,就会看这些东西。但是那这个文章它可以探讨。他得分类了之后他目的是什么?就是应该说深入的。具体是从哪些个理论层面,我这个目前还不太没有想好,但是我觉得他可以通过这些分析数据的结果深入的看一下他具体就是你想要研究的目的是什么?我觉得这个文章它可能只是先进行了数据的一些分析,但是分析之后它的应用没有具体。
刘超:对。你说的很对。就是他没有深入的这个,把这个问题抽象出来。
谭新月:但是这个。
刘超:就是他的管理科学问题没提炼出来。确实是这样,没错。
谭新月:但是这个具体应该怎么用的话,可能还是得看一些文章,所以我不太了解这个该怎么用。
刘超:对,你说的很对。
谭新月:这就是我的想法。
刘超:对对对,你说的很对。他这个就是问题没提炼出来?就是管理问题。没有体现出来,他想原本我的设想呢?我是想获得一些个关于消费者行为数据。根据消费者的类型,根据他在电商这个购买行为进行分类。而不是说他根据这些个评论呢?这个我想他可能肯定没法分类,就不他所获得的这些东西。我也觉得他并没有告诉我消费者就怎么买的,买完了怎么办?这都没有,这都没有是吧,他只是说这个消费者买了什么东西了,然后怎么给了一个反馈?因为他这个数据确实。就是那个行为数据他获得不了。因为他在那个网上。他说他爬吧,数据可能是后台的,公司后台的数据?比如说这个消费者,比如说某一个地点就是地理位置,然后这个地理位置消费者他经常在网上买,但是他什么时候买?是早上下订单还是晚上下订单,频次是多少,这个东西他他弄不来就。所以确实是这个可能挑战性比较大,这个数据他确实是这个问题,你说的很对。我非常同意你的看法。因为你说的没错,就是他很表浅。就这个我的困惑就是你这个没法用,对我来说没啥用。姚伟:刘超刘超老师很开放很谦虚,其实是咱们跟刘超老师学习。行,看看那个谁后面那个王瑞华跟刘超老师还有什么沟通的吗?
王瑞华:刘超老师好,就是因为我当时选您那个供应链课时候,我的结课论文就是写的人工智能和供应链的结合,我当时看了就是因为按您给的那个参考文献的那个标准,然后我看到了不少。就是两者结合的一些论文,我感觉还是可以去参考一下,就是因为它有很多的那个人工智能学习的方法,我看咱们这个文章是不是用的方法就是有点单薄,是吧?
刘超:方法是也在吗?
王瑞华:对,他那个可能选的人工智能的方法。可以换一下别的方法试一下,而且这个数据的话。我感觉人工智能最主要的就是训练数据,数据的话还是挺主要的,就是这个方向,我觉得还是挺好的,要是刘超老师想做这个方向的话,还是比较值得去弄一下数据这个问题的。其他的没有了,就是因为数据确实,因为我听到他们就是做人工智能方面的人,对,都说这个数据挺基础挺重要的。
刘超:对,数据现在就是来源。
王瑞华:对,看看能不能就是跟一些公司合作,因为他们做人工智能的有很多都是跟公司合作,就是直接拿到一些数据。
刘超:对,就是缺乏这个。但是有些东西你从网上公共的数据,它肯定不行。
王瑞华:对,一般公布的那些现成的数据都是没有太大的价值吧。
刘超:反映不出来。
王瑞华:还是得需要?其他的没有了老师。
刘超:好,谢谢谢谢!好。
姚伟:好的,后面那个谁?王少楠看看跟刘超老师有什么需要交流的吗?
王少楠:好的。刘超老师好!
刘超:唉,你好。
王少楠:就是我刚刚就是也听了一下刘老师说的这个文章,就是他就是也是给我一个感觉,就是到最后就是好像突然戛然而止的感觉就是。也是刘老师刚刚说的那个?可能没有达到老师要的那个结果,那我想这个东西,因为刚刚其实新月也提了一点,就是说他只是说了一些基本场景的一些东西,那从这些基本场景完了以后就没有了。就是那是否可以从这些基本场景来抽象到一个理论高度,然后再从理论高度再去看。整体的一个宏观场景,然后来提升老师说的一个理论性就是。我觉得可以考虑一下,从这方面去入手一下,因为我其实之前看过一篇文章是,它也是刚开始是做了一个模型,完了以后,它是做了一个比较宏观的场景应用,就是会给人感觉层次会更丰满一点。是这个的话,就包括我刚刚看了一下,就说老师就是刚刚展示的这个论文的一个结论部分,就是我会觉得。他好像就是它的理论性的一些东西好像没有出来。就是给我一种这个感觉。那是否能够把现在的一些基本场景就是得出的一些模型什么的,去抽象到它的理论高度,然后再从理论高度的方面去探索它的宏观上场景的东西。是我的一个想法吧,我也不知道能不能和老师的这个方向是不是契合起来。
刘超:对对对,你说的对。没错。他就是理论深度没有。
王少楠:对。
刘超:这个它理论深度没有。他就是说,唉,就是你说的原因就是一个是他这个用的方法比较简单。再有一个呢,他这个。就是也没有把这个科学问题提炼出来。那个确实是这样,他就是提炼出来呢,就是你的问题呢就是说。我觉得呢,就是说和我原来的这个。你你是说先有一个理论模型,然后我再用这个机器学习去去学。还是说。从这个机器学习的发现里头我去把它提炼成了一个模型。
王少楠:我感觉的话其实从发现里面提模型可能更有一个依据。
刘超:对,就是我原来就是想这么干。对对对你,你说的挺好的,你说的挺对。他确实是这样。
王少楠:好,那我就没什么说的了,老师。
刘超:好的,谢谢谢谢!
王少楠:好好好,谢谢老师!
姚伟:行张佶看看跟刘超老师有没有交流的。
张佶:好的老师,我和刘老师交流一下,就是非常感谢刘老师,姚老师,林老师给这个机会。然后就是我想跟刘老师多交流点。因为第一次我在研一的时候汇报我当时那篇论文的时候,当时刘老师就在现场。当时他还提过相关的问题,那个问题其实就是这个研究方向相关的一个问题,因为当时我用到一个方法,就是用了这个相关方法。然后当时那个就是自然语言处理。就是做这个情感值,还有LDA这个相关的东西。所以一看到这个文章的时候,其实就像姚老师看到那个词云图的时候就感觉产生了联系。产生联系的话,这个有大概两个问题吧,一个是这个文章的本身。他其实写的是不太够的,就是发表到比较好的期刊。是不太够的那如何解决这个问题呢?一个是让那个学生应该在结论那块,大家都提到了,多多去提升一下,因为他自己做这个东西,他自己感受是非常深刻的,那一定让他这个过程中做的非常好的,让他把那个结论。提升一下总结一下,理论上他自己再去提升一下,这个他应该是完成度更高一点才好。然后还有一个就是因为他是完成这个机器学习过程的,然后他也是刘超老师的学生,因为他也接触过这个数学建模,这些相关的数学相关的,所以他能够把这个机器学习跟数学建模有他自己的感悟在。因为我其实对机器学习这个东西是有能有一定感悟的,然后对我的编码或者是我们这个研究方向,其实也有一定的感悟,但是对于刘超老师,这个数学建模推导这个我其实了解的不是特别多。这个还有一个就是刘超老师想要研究消费者行为,然后正好个周师兄他也在这里,就是他最新在研究的就是消费者。相关的东西这个也可以进一步交流。然后还有就是至于这个文章。文章内容这个地方的话。就像刚刚提到了,在分类那里其实是可以进行一个理论上提升的,并且如这样的水果质量,这样的内容是不是可以到数学相关的?因为我有印象,就是刘超老师之前讲的那个什么就是。水果这种因为生鲜水果它的保存的相关的问题,这个是不是能够在这方面产生一定的联系?然后还有就是自然语言处理方面肯定是和情感相关的联系起来的,然后。我共享一下屏幕吧。
刘超:好的。我先把我这个结束。
张佶:行,刘老师就是。我看一下就是我之前也不太成熟的论文。就是当时正好您那次在我研一的时候,就是这个,当时是情感。情感忽视视角下这个知识动员。就是当时也是在挖取这个情感值,然后我就会把它的主题词归到我的那个动员相关的内容上。然后再通过?通过相关的主题构建一下这个理论模型。然后再也有这个情感值的内容。当时那个大概的方法吧,因为这个方法其实是非常成熟了,这个自然语言处理就是我在听会的时候,简单的就是收集了一下。如这个你看这个就是在一篇C括上吧就用了这个LDA,然后生鲜还是京东这个东西?然后就可以看一下来提升这个文章。可以就是从跟你相关的理论上,如你看它会加入一些SOR这种理论基础,这样的话显得你这个文章肯定是更有深度一些的。然后再还有就是我刚刚提到的就是。因为这个启发是非常好的,机器学习和我们姚老师这边的研究方向的话,肯定是可以,你像这个和编码就联系的非常紧密了。就是这个开放式编码,选择式编码,理论式编码,那就是这个理论的内容,那和这个LDA包括这个生鲜,这篇文章就把大家的这种研究方向好像就比较有这种聚集的感觉。对,然后包括他的研究结论,因为我没有仔细看,就是在这个过程中,我就是找了一下这个文章。他解释性不强,其实和他这个自己写的这个就是理论性是有关系的,就是他可能就是重点,因为时间有限,那重点就在于操作过程了,他没有去阅读过相关的这个话题的理论性的文章,因为这个理论性不是这种,就是套路下来就能够完成的。他需要阅读相关的文献,就是阅读大量的文献,并且有有很多时候,可能他某一个观点,他都需要再去阅读大量的相关文献,然后才能够把自己的这篇文章就是润色一下。所以他只是就是操作的这个过程还需要的进一步的阅读,然后把这个文章给提升。像刘超老师这个想法是特别好,就是做机器学习相关的。还有个观点就是因为我本科毕业论文的时候,我们同组的人也搞过生鲜的相关。然后我觉得也可以让研究生放手去做这个事情,积极学习这个相关的,如果要是用机器学习相关做好的话,加上就是我刚刚说的,把理论性提升的话,也可以以生鲜这种为主题直接去发文章。这个一个是文章本身质量,还有一个就是怎么赋能到数学推导上。这个因为我没有做过这个数字推导,就像我刚刚就是提到那只能说从它归类的一些词,如果LDA的话只能是从这个方便了。然后情感的话我不知道刘超老师那边是不是涉及到情感感知相关的东西,因为机器学习自然语言处理这块好多都是做情感分析的,如果刘超老师那边数学那块有需要用感知价值情绪这些东西可以凑一下自然语言处理情感分析方面的。然后,其实数据的话因为我不知道刘超老师想要写大概是什么样的吧,因为我觉得购买评论这些里面,它其实也是一种行为,数据,就是可能不像刘超老师说的那样特别的具像化吧,但是它其实也是消费者行为的。然后我根据这次会议,结合一下自己之前做过的一些内容触发一些感悟,那刘超老师有什么需要交流的吗?
刘超:好好好,谢谢谢谢。你说的挺详细的。对,他这个理论性呢,肯定是不行,因为首先他没有一个理论的这个深度,他这个一是文献阅读的也不是太多,再一个就是他这一上来这个抽象的提炼挺费劲,他也不完全是这个,有的时候让他一上来去提炼这个东西,他有时候就比较难。就是因为我的想法比较个性化,就是说我来尝试一些新的研究方法,我想做一种新的探索,不是想学别人,而是想跟我自己这个研究方法去结合,所以这对研究生来说呢,如果让他自己去独立完成这个工作,就像你说的,让他们去帮我把这个数学模型和研究创新性结合起来,这可能对专硕来说,这个比较难的,对学硕来说都不太容易,恐怕这个工作还得我帮着他们去做。但是他理论性肯定是差,所以这方面呢,就是说将来再看看怎么提升,但是你说的挺好,给我们一个新的启示。
张佶:对,我就是想说这个学生不是说非要把它完成好,就是让他写一下他的感悟或者他的看法,然后和老师之间有一个交流或者相互启发的这个过程,我觉得可以更好说这个。就像我们现在这种会议一样,我们大家就是聊聊天,因为理论性的文章必须要多交流,多启发,因为机器学习它可能都是固定的套路了,但是我们一些主题相关的研究内容,研究热点是需要交流的,就像姚老师也总提到刘超老师有一些启发在对于这个相关的研究内容上多交流。
刘超:好好,谢谢谢谢!
姚伟:那就我跟刘老师就沟通了。这个机会挺难得的,包括林老师和后面几个跟刘超老师沟通的。刘超老师在群里发的,我非常高兴,就是刘超老师他是追求自我革新的,他本身做研究在学院里面是我这个一直佩服的就是说。周虽旧邦其命维新,他做科研,他一直是属于航空母舰级的,但他自我革新。那今天呢,他跟着这个王少楠沟通的时候,她说是从数据里出还是什么,当时我还怕王少楠说错了,结果王少楠没说错,就是从数据里说不要假设。其实刘超老师之前在做实验主义的,后来他直接就转到了诠释主义,非常难能可贵,因为实验主义转到诠释主义它是有研究哲学和方法论的转变,所以他这是本身从研究当中自然呈现出来的,这一点是让我特别感动的地方,他搞实验主义已经搞得非常成熟了,可以出系列文章,但是呢,他又追求是自我革新。其实看到这篇文章的时候呢,我也特别震撼,这是咱们专硕做的,刚开始我还以为学硕了,后来刘超老师说专硕,专硕要做到这个水平,咱们的这个专硕就指日可待了,因为之前我跟林老师给专硕讲课的时候,专硕对咱们的硬件环境和软件环境都有些不满,但是要做到这个程度已经是非常不错的了。
首先优点方面确实是非常突出的,他拿机器学习去做这些方面,所以刘超老师在方法上面有它的前沿。但是他这个文章咱就落实到文章里来,就是这个孩子收集了两千条数据,非常不错。他做这个词云和提取这个主题词,2000条记录收集的很丰富。但第一个图就暴露出来他的分析不足,第一个图就是他这13000多条记录。因为它后面所有的理论基础都围绕这个聚类、归类和词汇切词走的。所以,假设后面做的非常好,但前面他理论的基础就有些问题就就有些太薄弱了。所以就像你第一级台阶,可能前面台阶就钢筋混凝土的第一台阶,你分析的数据友好性达不到,可能就相当于纸糊的一样。这一个图他停用词没处理,他直接是用现成算法做的,现成算法做的好处是可以省事,但是现成算法做的时候和你的研究目标和研究问题非常不匹配。所以导致了他数据很丰富,但是通过词云显示不出来,反而暴露出来了,就是说他这个算法的问题。好多软件现成的算法是经过多轮迭代出来,就是比python做来的还漂亮,所以这个图暴露出来的就是停用词没做处理,导致数据的丰富性极大地给稀释掉了。
刘超老师你再往后走,就LDA那个点状图。现在他是做行为研究,现在教学当中有行动研究,它是一个现成的研究方法,然后有的人把它引入过来。行为研究首先一点,刘超老师他非常明白,就你做新闻研究的时候,现在咱是诠释主义,从数据当中出发,举个例子,切三文鱼,三文鱼它是商品,那三文鱼和行动之间你可以代表什么?另外一点他看不来是什么季节,什么时间,采购人是谁?所以这里面就导致这个三文鱼背后的情景行动,它得需要背后的情境,所以单独从这里情境就脱离了关键词。最主要就是它和情景一旦脱离,它很难独立存在。举个例子,就像苹果,我抽取出来苹果了,你不知道这个词是什么意思,到底是手机,还是咱们吃的苹果,或者还有一种衣服品牌也叫苹果,所以抽离出来了。他这个可以再考虑把情境给加进去,就是机器加不了情境,人也得把情境给他,在解释的时候给他加进去就更好一些了,但是专硕已经非常不错了。就这个主题字可视化,行动研究的测量维度没有有效的展示出来,所以这些都是可以调的。
还有因为他是归类,就是所处的范畴,刘超老师也看出来了,正常来说得需要你的理论功底、理论敏感性,或者就是说你本身的这个理论积淀的,刘超老师是肯定有的。学生因为跟他读的相关书可能有关,还有他毕竟才上了一年。所以,你这个要是交到审稿的那里去,当然刘老师说这个不是发表式的探索,后面他会肯定转向学术性的,这一点是可喜可贺的地方。所以这一点再给他提升一下理论性、学术性就更好一些。例如“新鲜”用“感知权变”都可以,因为“新鲜”这个词是可以用感知来代替,可能意义就不一样了。
我就说后面这么去做,然后再生成的模型,因为刘超老师得要拿那个模型,其实我特别庆幸刘超老师可以做两步,这一篇文章可以出两篇文章,诠释主义出一篇理论性的文章,再拿实验主义去做一篇。就是实验性的,就做这个,你做仿真做模拟都可以再出一篇文章,两篇文章是一气呵成的。你要做出来这个在国内来说是独此一家了,就是你拿诠释主义做这个理论,构建你这个做的方法。再拿你的这个实验主义去给他做一下解释等等这样更好,理论性再提升,后面就更好一些。
他现在一个是换,还有一个就是这个聚类,这个问题就是他这个聚类出来之后。这个聚类不太友好的地方就三个聚类的说这个消费者聚类到什么程度?这是以地区区还是以性别还是以爱好?所以它聚类的那个小点的标题和整个聚类的标题,它没有有效地展现出来。这个图就是因为聚类他要是单独地以消费者聚类或者商品聚类或者以消费者的消费习惯聚类,他要把这个给它更详尽地加进来。当然这个图还可以做二次图,拿多个图对比一下可能效果会更好一些,目前来看这个有些单一,可以再多给它叠加一下子做二次处理,图片可能更好一些。再往后走,这个整体的形式是可以的,这是他开始出数据了,但是出数据没问题,这些数都可以符合量化或实证,或者是咱们做这个实验都可以,但是问题是它这个数出来是全面的聚类。它和聚类和切词出来的,它前面的聚类和切词一旦出现比较薄弱或者聚类的不太友好的地方就等同于以错推错了。他这里没有任何问题,他就按照流程走。但前面出了问题,整个后面都出了问题,相当于你现在做巧克力,你前面输的是面粉,可能巧克力出来它不是巧克力,可能是黑色面粉。所以是这样的,它后面的流程都可以再往后走。
刘超老师,再往后走一下,这都是他加的这个释义了,加的这个可以更好一点,它就是把清晰集加进去,但是模糊集没体现出来,就是参数的取类。再往后走,这是他评价的指标,评价指标这个特别好的地方是什么呢?你把这个拿过来,它完全是这个研究方法的一个手册。这篇文章它的优势是重分析,但是,你要转变成学术性文章,重分析的背后就是轻结论,他过于重分析、流程化和公式化,这个占了极大篇幅,而结果的诠释和结果的解释没有展现出来。前面可能写了一万多字,写了十多页,最后结论才占了一段,最后结论要写成两页的话就更好,他现在很多的公式加进来很多的这个过程性的分析加进来,其实可以压缩成理论模型的构建,他这个只是把研究过程给交代一下,有点和摘要重复了。他结论的理论贡献在哪里,只是研究结果的一个解释,我怎么做的,这个研究过程的一个展示。就像刘超老师说的,他理论贡献在哪里,结论没有清晰的给出来,所以他到第三章,第三小节之后就戛然而止了。他应该把他的这个举个例子就是消费行为模型在哪里展现出来,出一个模型,后面做实证主义也可以,做实验主义也可以,应该是更好的一个铺垫和一个起笔,那样的话就一气呵成,整个研究方法就打通了,诠释主义、实证主义和实验主义,一切就打通了。刘超老师整个团队的再升级,它本身现在就在一个高的阶段再升级。那就是所向披靡了,因为你掌握都是最新的。刘老师,这是我浅显的看法。
刘超:受益匪浅,因为你这个评价非常到位,你说的这个问题非常对,他就是理论性从一开始就比较单薄,就导致后边儿再怎么分析也很难分析出来深刻的道理。就是我看完了他这个写的东西吧,我感觉像个实验报告。我就觉得你说的比较精准。我说你这个不是论文,你这是实验报告,是用这个三个机器学习方法做了一个实验,然后写了个实验报告给我。论文首先咱们要围绕一个管理科学的问题,所以可能他一开始这个也提炼不出来,他这一开始就有问题,这因为我不懂,所以我没看出这个问题,你说这个很对,他可能问题出在这,他前面一开始就不对。
姚伟:对,你其实我跟你说,后面你想调整方向,把将来新来的学硕,你让他用这方法绝对可以,你这方法就第一人了,起码咱们学校你肯定是第一人。
刘超:我不是第一人,我现在我跟你实话实说,现在这是我的设想,我不知道我这个设想对不对,我是想把我的这个模型和机器学习给它结合起来,但是这个结合现在遇到了困惑,现在我就是找不着这个桥。我这个理论在文章当中,比如说我要做一些假定,就是假设条件,比方说需求函数的形式,包括这个消费者他的效用函数的形式。这些假定没有什么依据,我为什么做这个假定呢,无非是根据已有的这种研究,以前的研究,比如说他这么用过,我就给他继承下来。另外就是比如说以前做过一些时政文章,然后我就根据这个时政文章的结论做一些调整和假定,但是这样的假定实际上我能够变动的部分很少。
刘超:我不知道你理解不理解我这意思,比如说需求函数,它跟价格相关,跟这个质量相关,但是那我需求函数的形式就很单一。我就不能够构建出来更复杂的形式和更具有解释力的函数形式。唉,我就没法用。如果说我用机器学习方法,我能够从这个机器学习当中获得一些新的信息,我就能够构建出更具有解释力的这个模型出来。我想要的是这个结果。结果呢,他呢?给我做出来这东西,这个根本就达不到我要的那个效果,所以来讲这个问题你说的对,他这个问题可能就出在一开始这了,这就不对,是吧。
姚伟:对,这个有点简单了,他把那个2000多条评论,13000多条数据的丰富性极大的给矮化了,他应该在这里是丰富的展现,但是他在这一下子就给矮化了。
刘超:他把信息都切没了。
姚伟:不是,是算法的问题,算法他没调,因为我们往常我们得调算法,但他没动,就调节停用词,他没动。它直接生成的,直接生成一不太友好,都需要人工的去干涉。
刘超:你看就是说他好像是丢失了很多信息,是吧?
姚伟:你像这里面“非常”、“不错”这词,这是肯定不能出现的,还有“很快”就是虚词肯定不能出现,还有“一直”、“会”,这些是不能出现的,但是因为他学的时间短,他没有学词汇云分析,所以导致了他出了图,但是他不知道这个图是怎么处理,也不赖他。这个他稍微的去处理一下停用词,就非常漂亮。你看他12000多个词,但是刘老师您从这里看看这个词,显然它是不饱和的,不饱满的。
刘超:他没提这啥词出来,是吧?
姚伟:对对,这个词应该是很密集的密集综合症那种感觉,但是它没出来那种感觉。
刘超:他可能这个就导致他后边就分析不出什么内容。
姚伟:对对对,所以这个让他调一下,调一下子效果就好点,这个东西必须得人工干预。
刘超:就是让他调一下停用词是吧?
姚伟:您这个方法和思路,我告诉你绝对是可以用,绝对是没问题,你的思路是绝对没问题,但是你现在不是探索吗?探索没事,它可以再调整。
刘超:能不能调一下停用词?
姚伟:你跟他说一下,算法上可以调的,这绝对可以用算法调的。
刘超:好,这个建议非常好。
姚伟:这块别让人挑出毛病来,后面就挑不出来,懂这意思吗?就是你这地方要给它糊上,用铁板给它糊上,懂了吧,再贴上年画,别人后面就找不到问题,就没事了。这个地方只要一改,再把那个编码,就是那个范畴那块再给它升华一下子,就马上上一个台阶。
刘超:因为我也没用过这个方法,所以我也提不出来你的意见,所以我也搞不懂,但是我就知道他没达到我的效果。
姚伟:你有这个弹性的认知,你直接有这种认知,挺好的,我们也学习了。
刘超:这个非常非常好,你提的这个建议非常好,然后那个下一步我让他再进一步调调这个,看看再做做,深入的做,如果达到我设想的那个结果,那是再好不过了。等于是说白了就是跟你说的就是开创了一种新的领域了。
姚伟:一定要这么去做,你只有这样去做,咱才能蒸蒸日上。
刘超:就得开拓这个,因为你要是不探索这种新的领域的话,老的方法就慢慢就陈旧了。
姚伟:你看你现在已经有了方法论的意识和新的方法论的转变了。
刘超:我一直是比较比较追新潮的。你看我的那个,我们现在虽然不是做模型,最常用的是那种静态用法,做这个静态的优化。我打早我就改了,就改成动态优化。现在就是说会我这动态优化的,在我这供应链管理领域里头人都不太多,他们还没太开始用。但是我现在已经转了,我已经从这个现有的我熟知的这个方法上,融合机器学习,尝试着做探索性的结合了。现在遇到点麻烦,所以这个探索看来不老顺利。
姚伟:没关系。只要出来,后面多出几个就可以了。
刘超这一点点来吧,就是现在这只是我初步的一个想法。就就发现那么个问题,它的这个解释性不老好的,这个解释性不好,那我就达不到我所设想的那个目的。解释性不好,你一眼就看出来了,他这第一步可能就出现问题了。问题是我没有办法改进我这个理论的那个数学模型,我折腾半天,我不白折腾。
姚伟:你没问题,问题在他这块就入口这块稍微得需要一改动,问题出在他这了。
刘超:问题是我没看出来,你能看出来。
姚伟:不是,咱们每个人都擅长不同的方法,你有你的优势,你的优势我们是小白。
刘超:我想干什么,比如说像我们这种理论前面的部分,比方说需求函数形式。它有一定的现实意义,需求这个价格有关系,跟这个质量有关系。但是呢,我这个形式是非常单一的,我不敢大改,因为你大改就没有依据了。我想干的事呢,就是说我通过机器学习方法,我丰富一下我这个现实的数据支撑。如果是有现实依据的话,我在依据当中我提炼出来假设,后边就就很丰满了,而且不是我瞎说的。那么他的现在的这个,显然他这个工作呢,不能让我达到这个目的,等于第一次尝试失败了。
姚伟:没失败他这个,其实是一个很好的引路者,他是专硕,你让你的学硕再铺起来,这条路就打通了,他毕竟是专硕,基础不牢。
刘超:你提我的学硕还不如这个,到现在还没做出来呢。
姚伟:你太谦虚了,你太谦虚了。我就说刘老师这个思路你别犹豫,我在学术上我从来不跟你开玩笑,对吧?你这个你一定要继续下去。
刘超:你这一鼓励我还有点信心,他前几天给我看这个。我确实看完他这写的我都没信心了。
姚伟:没关系,我从16年到现在弄这方面,你们才刚搞,有六个月对吧,很不错了,可以机器学习,它可以加速这个进程,就相当于我是走着去北京,你们直接动车到北京。在方法上面步子大一些没问题的,咱身边还有讨论的人呢,刘老师你并不孤单的。
刘超:这个他们弄不出来了,我就把你请过来,然后给给大伙儿校对校对。
姚伟:可以可以,我们就随叫随到。
刘超:得把把关。反正也不能怨他们,因为他的时间确实很短。他学完了那个,我派他们三个学,讲了四次,然后又去北京学了一次,到现在为止才不到六个月时间,也就是六个月,然后赶紧的就是让这个学生再去迭代它,把这个方法给它固化。别说是国内做这个,你看国际上的我都没见着。
姚伟:你做生鲜的做供应链,你这块确实是非常有名,你去年把赵婷婷老师请过来讲机器学习,你又投钱又投人力物力,然后你现在又出来了这个。别管怎么说,它是一个理论探索一个雏形,你出来了,出来咱再不断的优化它不就行了吗?
刘超:希望如此!
姚伟:一定要干,千万别前功尽弃,前面投资都是零了。
刘超:因为是探索性的工作。
姚伟:我完全要告诉你这个路径是可行的,就学术上面确实是可行的。
刘超:就像刚才那个老师和同学们说的。这个应该多参考一些现成发表的,这说实话,我这个设想到现在,现成发表的都没有。
姚伟:对,我赞同你这个,因为我们一直不太参考,做方法论的时候,就是说想自己独创。所以你这个看参考文献,参考的可能不多,相应的给加上去。不参考也没关系,就根据期刊的要求,但是呢?你现在参考文献少,恰恰是你创新的地方。
刘超:他深入度也不够,他学术上来讲他深入度不够,一点一点点来。
姚伟:没关系,咱可以一点点来孵化对吧,孵化它。
刘超:你鼓励我,我这还有点儿信心。
姚伟:你想我这些年你在你的领域一直努力,我在我的领域我也没躺平。我是拿我这些年呢,我至少从从10年到现在。我拍着胸脯跟你说这些话的,就学术上我绝对不给你打框。趁着其他人还没意识到的时候,你可行的。
刘超:行,你这个专家一鼓励我就行,我就接着弄吧。
姚伟:对,走吧,别别浪费了,因为你的功夫在这,而且你的思路都已经看见胎儿了,现在胎儿都已经出来了。
刘超:他这个是,这是怪胎,这个不行。
姚伟:你再慢慢的给它修,跟艺术品一样的冰雕,刚开始是粗糙的,后面那它肯定出成品对吧?艺术家庭,跟那个邵逸夫电影一样。
刘超:那不敢当,顶多就是有点新意,让人家看着,说这个最好玩,是吧?
姚伟:你让代老师看看,我跟你说他肯定能感兴趣,
代文彬:刚上来实在不好,已经睡到现在了。
刘超:那个我们讨论的很热烈,而且大伙儿也提了不少好的建议。你也给我们把把关,
我们也是做一个新的尝试。我也跟代老师汇报一下,去年年底你不是热情的参与了我们三次那个讨论吗?就是那机器学习那赵婷婷赵老师给我们培训了三回。培训完我就一点也没停,然后我就让三个研究生去北京学习了,又学习了一个星期跟那个山东大学那个陈强老师,学习机器学习,唉,我就派他们三个,我说你们带着任务去吧!我说那个必须得学会。然后呢,他们三个就去学了,寒假期间我说你得给我写点东西出来,不能白学。赵老师培训了三回,然后又跟陈强老师学了四天呢,我说你得给我干点活吧!做一种探索性的研究,于是呢?这是我们第一个出的结果,这是一个专硕写的。写的是这个就是基于机器学习生鲜行为模式的分析与预测。当然这个专硕他水平不行,他做了一个初步的研究,根据这个消费者,京东电商这个消费者收集的数据,做了一个聚类。然后还做了一个就是消费预测,他获得了一些这个这个东西。看了之后呢,就跟我的预想这个差距比较大。这个我预想的呢?想把这个理论,通过这种机器学习方法,让他在实践当中搭一个桥梁,就是这个机器学习发现一些东西,能够改进我这个理论模型。我是想做这个事儿,所以因此要求他这个结果得有一定的解释性。结果他给我算了半天,就算出来这东西没啥解释性,也就是说他说明不了什么问题,就是给我消费者分了这么几类。
所以我就说这能行吗?经过大伙儿的这个给我提的建议呢,给我指了一条道路,说这个可能还行,存在这几方面的问题,所以下一步我们再看看能不能够改进,就这么回事。
刘超:他这机器学习,因为他算了半天,没有总结出来的这种分析性的结果,就像做了他这个像个实验报告。
代文彬:就它主要是一种描述,消费者的类别,然后呢?按聚类分析均值什么,就是他和你原来的设想这个差距比较大。
刘超:我是想说,你看我原来的这个,我们一般手稿里边都有这个,前面都有假定部分,比如说我举个具体例子,比如说我需求函数的形式,它有假定,这些假定呢,只是依据于既往的发表过的论文或者是有一些时政的文章。我们做一些假设条件,因为在我们的这个理论模型当中,这个假设条件是非常重要的,如果是假定要是不成立,那后边的所有结论都是不成,所以来讲呢,就是说我想丰富一下我的假定,让他通过机器学习,得到一些发现的结果,这样我就可以构造出来新的理论模型。就相当于把我的理论研究的结果跟现实之间搭了一个桥梁,我想构建这样一种思路。
代文彬:就是你希望他能够通过这个机器学习来提出这个新的假设是吧?
刘超:能够帮助我构建新的理论模型假定。那这样的话呢,只要我这个假定构建是新的,我后边得出来结论,就都是新的了。他就是都是新的了。我就不用受这个限制,现在我受很大的局限在于我这个假定条件,我不太敢动。为什么不太敢动呢?因为那就没有依据了。你不能瞎假定?是吧,你比如说咱们需求,它和价格是需求量跟价格是成反比的是吧,价格越高,需求量就越低,这是通常自己的对吧?
刘超:但是这是基于什么呢?基于以往的它那个就是经济学的常识,经济学的理论基础是吧?还有以往的这个实证的研究发现。
代文彬:文献。
刘超:但是。如果我想研究一个新问题。我就得把这个假定条件做一些改动和变化。那我想改动,我现在一改动人家这个审稿人就不同意。你要有瞎改动不行是吧?
代文彬:刘老师,那就是说你事先能不能通过这个大数据,通过这个机器学习来提出这个,来提出这种假设,是吧?那么这种假设可能是已有的文献。这个研究成果它没有的是不是?唉,或者说它,它在什么样特定的条件之下,那么它会呈现那个特定的一种结果,对不对?
刘超:就是这个意思。
代文彬:是吧,假如说你说这个价格和需求量,是吧?那么它一般是反比的关系,那么在什么样的情况之下,在价格到什么时间,这个价格从什么区间,它可能是正比的关系,对吧?他可能就是说这样,提出一个新的假设来。
刘超:完全正确,你理解的非常对!就是这个意思。但是他这个机器学习呢,学习了半天。他学习不出来,比如说消费者,我想让他研究这个消费者购买行为。比如说他购买的频次。比如说他从网上购买这个生鲜产品。它的频率有没有变化?在什么情况下,或者是购买的时间有没有变化,或者频率有没有变化?你得到这样的东西是吧,我就能够从我理论模型当中,我可能就发现新的这个响应条件。但是他的研究呢,他研究了半天。他根本就得不出来这样。
代文彬:他这个就是大数据的话,就是那个他是不是还得定向对吧,就是说他还应该先有那个变量是吧,假如说这种价格和这个购买量是吧,他们之间的关系。
刘超:对,就是特征,它得提取那个特征变量。
代文彬:就是那个标签一定要提,就是要能够提取是吧?
刘超:得能提取出来。
代文彬:提取出来才行,就他必须定向才行,他不能够那个盲目的去做这种机器学习对吧?
刘超:对。这个它取决于它的这个数据来源也是个限制。就是说他有一方面呢,他确实。有些个数据呢,我们现在没有这个渠道获得数据,这一般都是后台的数据。
代文彬:后台。
刘超:对吧,你看电商呢,他比方说他这个用户订货的这个时点,然后像频次这些数据它是比较敏感的,他可能就是没有这些后台数据。这是他从网上爬的那个数据。这爬出来的它都是公用的,它就不太好用。这个确实是客观存在的。同时呢,刚才姚老师眼睛很敏锐。他说这有看出了一些问题,他说你这他这个做了半天,他这第一步有问题。这也是客观存在的,它这个词其实它提取数据量不小,1万3000多条。但是呢,它这个词儿好像没用停用词,所以导致他这个词,这就看出来他丢失了好多信息。
代文彬:丢失了相关的信息。
刘超:对,都丢了。这也是有可能存在的,就是比方说它这里好多关键信息都没了,都让它切没了,切没了之后呢,1万3000多条就切这么几个字出来。是吧,所以他这个软件操作上也有一点问题。然后这些问题,他后续它在聚类一样有问题,它前面都错了,那后边可不就错了吗?那这可能是有点问题。
代文彬:唉,所以说。就是我觉得他这种数据的这么一个处理,首先还是应该说在乎他的这么一个概念的基础是吧,就是他有没有这么一个关于这种事实的那个多方面属性的认知,是吧,他不仅说是非常、京东、喜欢是吧,他还没有其他的属性,对不对,他有没有这种基础对吧?
刘超:他在方法掌握上还是幼稚一些,欠缺一些理论的思考。
代文彬:理论的思考就这样,所以就是那个淘汰了很多属性,这个数据的话,就把它很多属性它给那个忽略了,对吧,淘汰了。
刘超:对,他没提炼出来。这也是一个原因,所以他就没有获得这个有价值的结果。就是刚才跟大伙儿这个给我们分析呢,提了好多好多建议。
代文彬:他就是那应该怎么弄呢?那应该就是这么多数据,那我怎么样才能够去做这种?就是怎么样来提取它的这个相关的属性呢?
刘超:那个刚才姚老师说他得调一下那个软件,他有一个停用词没调。在这一看就没调。所以它就产生不出有用的信息,它因为它这个图就看出来了。这里边你看这个很稀疏,就这个矩阵很稀疏,1万3000多字词才出那么几个词,而且有些词都是这什么非常这个词,这都扯淡,这形容词就没啥意义。他没做处理,没做处理的话他就可能按频率分吧,我理解“非常”出现的次数多,那当然“非常”次数多了,那频率的,那但是“非常”这俩字没有意义。
代文彬:哈哈哈。“非常”那肯定是频次,他可能是假如说购买频次。
姚伟:对,刘老师理解的对,我跟你说,你一点就到。
刘超:是吧。我理解对吧。对,因为你这个词应该给它剔除出去,这种是无效的词。对吧,“非常”这有什么用,“新鲜”“非常”,这个“新鲜”可能还好点,但是“非常”没啥意义。
姚伟:对,它是副词形容词。
刘超:“非常”没什么用。
姚伟:对,“新鲜”可以。
刘超:对吧。这显然是个没有用的信息,他等于把有用的信息都给掩盖去了。那你要按频次来讲,“非常”“可能”说的最多。
代文彬:“非常”它就是一个程度。
姚伟:有一个副词,对对,非常好吃,它非常鲜艳,它是形容或副词。这都没用,这个没实质用处,“不错”或者“很快”这都没什么用。
刘超:他把有用的信息都掩盖了。
姚伟:对。刘老师你懂的,你理解非常深刻,就是你这个意思。
刘超:我理解是这意思,所以这个东西得给它用一个软件方法得把这些词给踢出去。
姚伟:就是这意思。
刘超:关键词提取对不对?你等于最关键的,我关心那个事,什么购买频率,这里边都可能给淹没了。
姚伟:对。他都没提出来,正常提那些词,提行为相关的他没提出来。
刘超:对吧,你看这。
刘超:所以他这前面一错,那后面两步他再聚类,不是也错一样了。这聚了半天也聚不出啥来,你“非常”能聚出啥来?
代文彬:唉,那个就是姚老师和刘老师,他就是那个他只有1万3260条数据,是不是?然后他是用什么样的软件来进行分析呢?
刘超:他用这个就是机器学习。它这叫LDA主题分析。
姚伟:唉对,他用python再导进去做主题分析。
代文彬:做主题分析这样的。
姚伟:他不有分词工具,但他用了分词那不?
代文彬:对分词。
姚伟:你看他后面有停用词表吗?但是那个提供资料他用的是人家。他没自己处理,他用的是现成的。
刘超:对,常用的表不对。
姚伟:常用就不行,因为你是个性化的。
代文彬;进行主题学习。唉,这个觉得我没有做过,但是我就是听你这么说,我还真是有所启发,就是说这种数据的这么一个分析。
姚伟对,你等那个刘老师,他们团队出来之后,就给他逐字逐句的读。刘老师花了好多钱,咱们这边一读他文章不就读过来了吗?偷师学艺。
刘超:我还花钱都打水漂了这钱。
姚伟:偷学。
代文彬:词云图。
姚伟:对,挺好的这个学习,谢谢!辛苦了!
代文彬:对,我觉得对,我觉得现在就是有一个基础,现在只是说在这基础之上怎么样,就是说我们进一步,关键就是说怎么样进行这个提炼是吧,这个相关的这种我们叫什么?我们需要这种属性。是吧,唉,就是我们或者面向我们这种假设这些属性呢?我们怎么样提炼这一块对吧。
姚伟:对。代老师有了数据科学的思维了。
代文彬:我就是向两位老师学习,我是完全不懂这个,没有做过这个。
刘超:你说的挺对的。
代文彬:没有做过这个。
刘超:是不是他就是有特征没提炼出来?
代文彬:我在想就是说那个我们在这种数据分析之前,就是说像我们假如做这种专业理论做什么呢?就是我们希望就是说应该是一个空白,对吧,唉,就是一张白纸。那个就是姚老师像你们做这种,假如说我事先有没有一些假设,假如说我们应该有一些意向,想研究它的这个购买频次和价格和什么因素之间的关系。我先有一个大概的一个方向。那就是有个大概方向,然后呢再帮助我来进行这么一个数据各种属性的分析,应不应该这样呢?
姚伟:刚才我们讨论了,刘超老师之前他做实验主义,现在他是完全想做诠释主义。它就是从数据当中处理的模型,然后呢,因为有实际的支持,所以这里面他没有预设,但是他有理论功底,理论功底和预设是完全不一样的,所以做这个东西他必须得有理论功底。预设可以悬置,理论功底可不能空白,这个学生在理论功底一上来这一篇文章就都出来了。
代文彬:没错,他有理论功底的话,他就会非常敏感,是吧。他就是看一条数据,他就知道这个数据是说明什么?变量和什么变量之间的关系,是吧?或者说它说明的是一个什么样的属性,是吧?它就比较深入了,对吧。
姚伟:对刘老师,他现在想进行方法论的这个更新。所以这是他写这篇文章的初衷。他现在这篇文章基本上也算是符合他的初衷,他是拿诠释主义来做的。
代文彬:所以我觉得就是说这种数据的分析这个事,我觉得还是刘老师亲自来。
刘超:问题是我没参加培训,他们三个参加培训,然后没培训我。所以我要现在这玩意儿我太亏了。我是培训了半天,给他们安排了三场讲座,然后再加四天送北京专门培训,培训完之后做成这样。再说我也不会这个。
代文彬:所以我觉得这种还真是。唉,姚老师像他们这种就是说,能不能刘老师对他们这些研究生进行数据分析当中做一种指导,那就像我们假如说我们加一个编码本或者什么的,就是能不能对他们进行这个有效的指导。
刘超:编码本?
代文彬:对吧。这个固定的这种方法。就是像我们做这种扎根理论,因为我们在做这种数据编码的时候,为了统一,对吧,那么我们就有一些概念,那么这些概念它应该有这个明确的含义,对吧?假如说工作满意度,那个这是我们常用的一个词汇,对不对?假如说那个我们的这个离职倾向和心理压力?
刘超:我明白了。那个机器学习恐怕没有。
代文彬:对,就是这个机器学习他没有。
刘超:因为机器学习它是大数据。你那个比如说用的量表数据。那量表它是带有目的性,你比如说调研什么的对吧?我的理解那个量表,它可以,比如说调研专门这个问题,这一个问题反映在五个维度里头。那么对应于五个小问题,那这个是有针对性。而这个机器学习它是没有针对性。机器学习的是监督学习也好,非监督学习也好,他总之。是没有办法去给他这个非常明确的这个问出这些问题。你除非有这么一个特殊的网站,这个网站呢,就是收集这个调研问题,利用这个网站进行调研问题。它数据比较大,自动进行提取这个可以。对吧。你想机器学习的数据基本上都是来自日常交易的数据。
代文彬:明白,你看像那个“非常”这两个字,这种出现的频率特别多,是不是?
刘超:对吧。那当然了,他肯定你看评论那里头“非常”就很多,咱们平常就打字的“非常”“好吃”俩字,这肯定没用。
代文彬:对,明白。“京东”还真是。机器学习不是那么智能是吧。
刘超:他不可能智能,你这个得靠人工去调,你得找有用的信息。
代文彬:然后调。
刘超:机器学习不就是这个意思。就是说这种既定的这种道路肯定是没有。
代文彬:那应该怎么调呢?就是说像刘老师目前这么一个状况的话,大家就是怎么样进一步调呢?怎么弄呢?
刘超:他们应该有那个姚老师他不经常调吗?他人家有一个软件,就是说它这个停用词组,它应该能给停用的意思,我理解就是把这个词给踢出去,对不对?
姚伟:对对对,也可以,可以调,可以加进去,这都可以做。非常简单,就跟杀病毒一样,你把这病毒放进去,它就把这当病毒给你杀了,你就把它当成病毒库就行了,它把这个东西就当病毒,它不会让你出现了。他把其他有用信息出现了,没用的信息就不让出现了。这个刘超老师说对,他有些部分必须得人为干预,不干预不行,机器没那么智能,因为中国话它得有情境和语境。
刘超:他这个说明他掌握的这个,因为他也没有什么目的性,一开始,所以他可能没想到这么深刻的问题。是吧,他这是试验的,然后回头调一下吧,调一下再重新看看。
代文彬:停用词是吧这种。
刘超:对,停用词。
姚伟:对。
刘超:另外,他用的方法也不见得是最优的这种方法。就是跟我想达到的这个目的呢?我觉得也不太吻合。我不是派了三人去吗?那不是还有俩?那俩现在也没给我弄出来。
姚伟:不错,这出来一个了,三个里面出来一个不错了,那俩也许出来更好了。
代文彬:他们是专硕,我觉得还是挺不错的是吧?
刘超:那俩人是学术。
姚伟:对,专硕相当不错了,咱们这你可以排到第一去了。
代文彬:对。我专硕的学生,我觉得他能够做这个事,我觉得相当不容易。
姚伟:对,连天大南开都未必,但是说天大那个论文我也看过,也未必达到这样的。
代文彬:对,没错没错没错!
姚伟:可以,刘老师,就下面再让学生再好好把这方法给优化就可以了。
代文彬:有基础。
姚伟:行,挺好的。
刘超:感谢感谢。
姚伟:好嘞,谢谢谢谢!
跨学科思想、方法等交融:与会者普遍认为,跨学科合作是未来研究的趋势,特别是在大数据、大模型和机器学习与管理理论的结合上。刘超老师尝试通过引入机器学习方法来预测消费者行为,尝试在理论模型与实践数据之间搭建桥梁,这本身就是跨学科思想的体现。姚伟老师鼓励将诠释主义视角与实验主义方法相结合,进一步促进了理论与实证研究的融合。
学术创新思维:学术创新要求研究者敢于跳出传统框架,刘超老师的探索性研究就是一个例证,他尝试用机器学习丰富理论假定,构建新的理论模型,尽管遇到数据不足等挑战,但这种尝试本身就是创新思维的体现。林建衡老师建议研究生扩大文献阅读范围,避免重复研究,寻找创新视角,强调了在已有成果基础上深入挖掘和创新的重要性。
文章内容与风格:文章内容上,与会者强调了理论深度和实证发现的结合,提出理论模型构建应基于数据的实证基础,且理论文章应有深度,能提出具有理论贡献的新观点。风格上,鼓励结合叙事元素,使理论研究更具趣味性和可读性,同时,文章应包含明确的研究目标和充分的理论支撑。
学术研究范式:姚伟老师提出,通过调整和优化现有研究,可探索撰写理论性和实证性两篇论文的新范式,分别侧重理论推导和数据实证,形成理论与实践的深度整合,这体现了学术研究范式的转变,即从单一的理论推导或数据分析转向二者结合的综合研究路径。
理论与实践的桥梁:会议中讨论的焦点之一是如何利用机器学习等技术,提取具有情境含义的特征变量,如消费者行为数据,使之与管理理论相结合,形成理论与实践的桥梁。通过这种方法,理论模型不再仅停留于抽象概念,而是能够与现实世界的现象和数据相连接,增强理论的应用价值。
理论深度和研究哲学转换:姚伟老师强调了研究哲学的转换,鼓励研究者在研究过程中融入诠释主义视角,这要求研究者在方法论上更加开放,不仅依赖于数据的统计分析,还要深入理解和解释数据背后的行为逻辑和情境因素,提升理论深度和解释力。
学术探究中的开放性思想与前瞻性思维:刘超老师和团队展现了开放性思想,愿意尝试新的研究方法,即使在面对数据获取难题和理论基础薄弱的情况下,仍然积极探索机器学习与管理理论的结合路径。这种前瞻性的尝试,即使在起步阶段遭遇困难,也展现了对未来学术领域可能创新点的预见性。
大数据、大模型和机器学习与管理理论之间的隔阂消除与深度融合:会议讨论了如何克服数据不足、理论基础薄弱等问题,通过不断迭代优化模型、深化理论基础、加强理论与实践结合,以及跨学科合作,逐步消除了大数据、大模型和机器学习与管理理论之间的隔阂。例如,通过明确研究变量、改善数据预处理、融入情境因素分析等方法,提高模型的解释力和理论贡献,最终实现了两者的深度融合,推动了管理理论与现代技术的创新整合。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 20:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社