||
为了鼓励和宣传高质量的学术研究,Mathematics (ISSN 2227-7390) 设立了最佳论文奖。今年年初,期刊根据文章的科学严谨性、对相关领域的贡献度,以及新颖性等评估指标,由期刊编委团队组成评审委员会评选2022年发表在Mathematics期刊上的高质量学术文章并予以嘉奖。在此我们谨代表Mathematics评审委员会和编辑部对获奖团队的出色工作表示祝贺。
本期人物专访,Mathematics非常荣幸地邀请到了2022年最佳论文奖获奖者——波尔图大学Álvaro Figueira教授和波尔图大学Bruno Vaz博士。在本次访谈中,两位学者与我们分享了其从事的主要科研工作、研究领域的创新突破以及对Mathematics期刊和开放获取出版的看法及态度。
获奖论文
Survey on Synthetic Data Generation, Evaluation Methods and GANs
Álvaro Figueira and Bruno Vaz
获奖者简介
Álvaro Figueira 教授
波尔图大学理学院
先进计算系统研究中心
研究领域:计算机科学、生成对抗网络、合成数据生成、虚假信息检测和大语言模型。
Bruno Vaz 博士
波尔图大学理学院
现任职于 DareData
研究领域:大语言模型、代理系统和生成对抗网络。
采访内容
Q1.请您介绍一下您本人的研究方向和最新进展。
Bruno Vaz:我毕业于波尔图大学理学院。我目前作为人工智能工程师在一家致力于定制人工智能解决方案的公司工作。我的主要研方向是生成式人工智能系统,比如聊天机器人。
Álvaro Figueira:我于1995年在波尔图大学理学院获得了应用数学和计算机科学的学位,于1997年获得伦敦帝国理工学院高级信息技术硕士学位,2004年获得波尔图大学计算机科学博士学位。目前,我是波尔图大学理学院的终身助理教授。我的研究重点是虚假信息检测、社交媒体分析和数据可视化。作为系统与计算机工程、技术与科学研究所先进计算系统中心 (CRACS/INESCTEC) 部门的一员,我与德克萨斯大学奥斯汀分校、科英布拉大学和阿威罗大学等机构合作,领导了国际项目,专注于使用机器学习和人工智能技术从社交网络中提取信息。
Álvaro Figueira教授分享科研成果
Q2.能否简单介绍一下获奖论文的主要内容?
Álvaro Figueira与Bruno Vaz:文章的主要目的是对合成数据生成技术进行广泛的回顾,重点是生成对抗网络 (GANs)。本文探讨了实现合成数据的需求条件,特别是在真实数据稀缺、质量差或涉及隐私问题的情况下,如医疗或金融数据。我们介绍了各种生成合成数据的方法,包括传统方法和基于深度学习的方法。生成对抗网络是核心要点,其在生成真实数据样本方面具有最优性能。
Q3.您能描述一下合成数据生成和生成对抗网络领域领域当下的难点和突破性创新吗?
Álvaro Figueira与Bruno Vaz:合成数据生成和生成对抗网络领域面临几个关键挑战,包括训练不稳定性、模式崩溃以及难以生成多样化高质量的数据,特别是表格数据集。评估合成数据的质量十分困难,因为不同的应用程序需要不同的度量标准,而且超参数调试会很复杂,需要大量数据源。此外,合成数据的生成过程中有可能泄露原始数据集导致敏感信息外泄,隐私问题也会随之而来。
Álvaro Figueira教授分享科研成果
尽管面临这些难点与挑战,一些突破性的创新成果提高了生成对抗网络的性能和稳定性。Wasserstein GAN (WGAN) 和Progressive Growing GAN (ProGAN) 等技术增强了训练稳定性和图像分辨率,而TGAN、CTGAN和TabFairGAN等架构则使生成对抗网络能够生成高质量的表格数据。这些创新显著优化了合成数据生成的适用性和鲁棒性。
Q4.请问是什么吸引了您提交这一学术研究论文? 在Mathematics期刊投稿的感受可以分享一下吗?
Álvaro Figueira与Bruno Vaz:Mathematics 期刊非常具有吸引力,其以高效率和标准的审查过程而闻名。Mathematics期刊确保在稿件提交后积极调动并确保审稿人参与稿件评审的活跃度,即使在学术任务繁忙的时期也能保证一个稳定快速的稿件处理时间——通常从一周到一个月不等,最大限度地减少了延误,使整个流程进展顺利。
友好便捷的提交系统也是我们非常欣赏的一点,该系统在各个处理阶段都非常清晰明了。特别值得一提的是,盲审过程中的沟通清晰有效,让我们能够迅速了解并处理审稿人的反馈意见。除此之外,该期刊的影响因子和分区一直很好,期刊开设“数学与计算机科学”栏目,一直以来的高质量发文坚定了我们投稿给Mathematics期刊决心。
Q5.您认为在未来几年,哪些研究课题会引起研究界的广泛关注呢?
Bruno Vaz:在过去的几个月里,大语言模型 (LLMs) 获得了越来越多的关注,不仅仅是在自然语言任务方面,在视觉和音频方面的应用也越来越普遍。尽管进步惊人,但这些模型仍然存在幻觉问题-——反馈给用户的结果虽然很好,但不一定与事实相符。这毫无疑问是未来几年研究的一个核心主题。此外,随着人工智能系统自主性的提高,有关道德决策、问责制和透明度的问题将会愈演愈烈。因此,我相信未来关于人工智能公平性、减轻偏见和可解释性的研究会越来越多。
Álvaro Figueira:我还想强调的是,未来LLMs可能会在特定领域或针对个人用户进行专业化,也就是人们俗称的个性化LLMs。这种专业化可以显著提高人工智能交互的相关性和有效性。同事,随着LLMs越来越适合个人需求,我们可以预期不同LLMs之间的互动将会增加,为LLMs及其用户提供互利交流的新可能性。这种演变可能会带来未来更动态、更个性化、更富有成效的人工智能驱动型对话。
Q6.请问您有什么建议可以给到数学领域有抱负的年轻研究学者吗?
Bruno Vaz:我越来越频繁地听到FOMO (Fear of Missing Out,害怕错过)。随着生成式人工智能的进步,你很容易觉得自己错过了什么。我对这一点有切身的体验,所以我的建议是JOMO (Joy of Missing Out,错过的喜悦)。如果一个人能专注于一件具体的事情,并把它做好,我相信前路漫漫,未来可期。
Bruno Vaz博士
Álvaro Figueira:当今世界的科学发展日新月异,紧跟最新的发展前沿可能是一个艰巨的任务。为了在这个复杂的环境中摸索前进,不计其数的科学出版物是我们赖以前进的基石,这些出版物与当前先进的大型语言模型结合,为我们描绘出眼下真实的知识形态。然而,超越这些界限仍然需要我们的不懈努力、创造力、敏感性和洞察力。虽然这些工具可以协助我们前进,但最终推动创新,实现每一次意义非凡的前进的,还是我们作为人类个体独特的人文素养。
Q7.作为这个奖项的获得者,能否分享一下您的感受,有哪些是您想感谢的呢?
Bruno Vaz:就像牛顿曾经写过的:“如果我看得更远,那是因为我站在巨人的肩膀上”。如果我能写出这篇论文,那是因为我生命中的巨人。所以,我要感谢我的父母,Albino和Natércia,还有我的女朋友Rita,你们是我生命中的支柱。同时,还要特别感谢Álvaro Figueira教授,是他指导我完成了这篇论文,如果没有他的帮助,我可能像一块浮木在水面沉浮不定,找不到方向。
Álvaro Figueira:在虚假新闻识别方法的研究过程中,我创建了合成数据 (用于平衡数据集)。这是我最初的重点,但与Bruno的合作大大扩展了研究的范围,超出了我最初设立的目标。我衷心地感谢他对这个项目的付出和宝贵贡献。
Q8.您对开放获取出版模式有什么看法?
Álvaro Figueira与Bruno Vaz:开放获取出版可以取消付费订阅的壁垒,允许任何有互联网资源的人阅读已发表的文章。这对低收入或资源不足的机构的研究人员、学生和专业人员尤其有益,不用负担昂贵的期刊订阅费用。此外,开放获取平台通常提供更快的出版途径,使研究结果可以得到及时传播,这在医学、气候科学和技术等快速发展的领域至关重要。
Mathematics 期刊介绍:https://www.mdpi.com/journal/mathematics
主编:Francisco Chiclana, School of Computer Science and Informatics, De Montfort University, UK
期刊主题涵盖纯数学和应用数学所有领域,重点发表代数、几何和拓扑、函数插值、差分和微分方程、计算和应用数学、概率与统计、数学物理、动力系统、工程数学、数学和计算机科学、数学生物学、网络科学、金融数学、以及模糊集、系统和决策等相关领域的文章现已被 SCIE (Web of Science)、Scopus 等重要数据库收录,JCR category rank: 21/489 (Q1)。
2023 Impact Factor:2.3 (Q1*)
2023 CiteScore:4.0
Time to First Decision:17.1 Days
Acceptance to Publication:2.5 Days
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-26 11:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社