|
自然科学研究是一个系统化的闭环流程:始于文献调研提出科学问题,经过试验设计与数据采集,通过数据清洗和统计分析确保数据质量,然后运用统计模型或机器学习等方法进行建模分析与假设验证,最终通过科研绘图将结果可视化,并撰写论文或基金完成成果发表与项目申请。
本次内容聚焦生物、地球、农业、气象、生态、环境、GIS科学领域,通过大量真实案例,系统详解AI大模型在自然科学研究全流程中的应用。内容涵盖:从数据清洗、统计分析到经典统计模型(回归模型、混合效应模型、结构方程模型、Meta分析),从优化算法(最小二乘法、遗传算法、贝叶斯优化、MCMC)到机器/深度学习,从大模型二次开发到科研绘图,从时空大数据分析到概念图绘制。每个专题均结合数据、文本、图片、代码、语音、视频等多模态形式,通过Python和R语言代码辅助编写与大模型API二次开发技术,实现案例的完整落地。
专题一 开启自然科学研究新范式
案例1 开启大模型科研新范式
案例2 大模型助力自然科学的经典案例分析
案例3 经典高效的提问模板,提升模型效率
专题二 数据清洗与特征工程
①R语言和Python基础(能看懂即可)
②数据清洗方法(重复值、缺失值处理、异常值检验、标准化、归一化、数据长宽转换,数据分组聚合)
案例1 随机生成数据
案例2 读取各种类型的数据
案例3 进行原始数据进行清洗、切片、筛选、整合
案例4 对农业气象数据进行预处理
案例5 对生态数据进行预处理
专题三 统计分析与模型诊断
①统计假设检验
②统计学三大常用检验及其应用场景
③方差分析、相关分析、回归分析
案例1 对生态环境数据进行正态性检验、方差齐性检验
案例2 进行t检验、F检验和卡方检验
案例3 对生态环境数据进行方差分析、相关分析及回归分析
专题四 经典统计模型(混合效应模型、结构方程模型、Meta分析)构建
案例1 混合线性模型在生态学中应用
案例2 全球尺度Meta分析、诊断及绘图
案例3 生态环境数据结构方程模型构建
专题五 优化算法
案例1 最小二乘法对光合作用模型参数优化
案例2 遗传算法、差分进化算法对光合作用模型参数优化
案例3 贝叶斯定理和贝叶斯优化算法对机理模型参数优化
案例4 蒙特拉罗马尔科夫链MCMC对动力学模型进行参数优化
专题六 机器学习与深度学习
①机器/深度学习
②线性代数基础、特征值和特征向量
③机器学习监督学习(回归、分类)、非监督学习(降维、聚类)
④特征工程、数据分割、目标函数、参数优化、交叉验证、超参数寻优
⑤主成分分析、LDA、NMS、T-SNE、UMAP、Kmeans、Agglomerative、DBSCAN
⑥支持向量机、决策树、随机森林、XGBoost、AdaBoost、LightGBM、高斯过程
⑦深度学习算法(神经网络、激活函数、交叉熵、优化器)
⑧AI大模型的底层逻辑和算法结构(GPT1-GPT4)
⑨卷积神经网络、长短期记忆网络(LSTM)
案例1 回归模型(多元线性回归、随机森林、XGBoost、LightGBM等)
案例2 分类模型(支持向量机、XGBoost等)
案例3 构建降维模型
案例4 构建聚类模型
案例5 卷积神经网络进行图像识别
案例6 LSTM模型进行气象环境时序预测
专题七 科研绘图 数据可视化
案例1 大模型科研绘图指定全集
案例2 使用大模型指令绘制柱状图(误差线)、散点图、相关网络图、热图、小提琴图、箱型图、雷达图、玫瑰图、气泡图、森林图、三元图、三维图等各类科研图
案例3 对图形进行修改
案例4 对任务一类科研绘图的制作流程
专题八 时空大数据分析
①R语言和Python空间数据处理主要方法
②降尺度模型
③处理矢量、栅格数据
④处理多时相netCDF4数据
案例1 矢量、栅格等时空大数据进行处理
案例2 处理NASA气象多时相NC数据
案例3 绘制全球植被类型分布图
案例4 栅格数据并绘制全球植被生物量图
案例5 遥感数据并进行时间序列分析
案例6 使用不同插值方法对气象数据进行空间插值
案例7 机器学习聚类分析及气候空间分区
案例8 构建机器学习模型进行大尺度空间预测
图像识别、生成图像指令合集、生成概念图、生成地球氮循环概念图、生成土壤概念图、生成病毒、植物、动物细胞结构图、生成图片素材,从此不再缺图片素材
关 注【科研充电吧】公 众 号,获取海量教程和资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-5 01:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社