博文

基于DIKWP框架的算法偏见解析

已有 569 次阅读 2023-10-5 16:34 |系统分类:论文交流

基于DIKWP框架的算法偏见解析

段玉聪（Yucong Duan）

DIKWP-AC人工意识实验室

AGI-AIGC-GPT评测DIKWP（全球）实验室

DIKWP research group, 海南大学

duanyucong@hotmail.com

1. 引言

随着算法在多个领域的广泛应用，人们开始关注其可能带来的偏见。为了深入了解这一问题，我们选择使用DIKWP（Data, Information, Knowledge, Wisdom, Purpose）框架对“每个算法都有偏见”这一观点进行解析。

2. 数据（Data）

2.1 数据来源的问题

算法的训练基于大量的数据。这些数据的来源、选择和质量决定了算法的初步表现。如若数据源存在偏见或不平衡，则算法可能继承这些偏见。

2.2 数据的代表性

数据集是否能代表全体或是否存在样本偏差是决定算法是否有偏见的关键。例如，如果一个人脸识别算法主要使用某一种族的数据进行训练，其在其他种族上的表现可能会受到影响。

3. 信息（Information）

3.1 信息提取与转换

从原始数据中提取和转换信息时，可能会忽略某些重要特征或过于强调其他特征，导致信息失真或偏见。

3.2 信息的完整性

在转化数据为信息时，如若丢失关键信息或仅选取部分特征，算法可能在特定场景中的决策存在偏见。

4. 知识（Knowledge）

4.1 算法的训练

算法通过数据学习并形成知识。训练过程中，如何调整参数、选择模型等决策可能影响算法的公正性。

4.2 知识的迁移

在某些应用中，算法可能需要将在一个领域中学到的知识应用到另一个领域。此过程中可能出现的失真和误解会导致偏见。

5. 智慧（Wisdom）

5.1 深度理解与反思

算法缺乏对自身决策的深度理解和反思，因此无法主动纠正偏见。它只能基于给定的数据和训练方式“思考”。

5.2 偏见的长期影响

不纠正算法的偏见可能导致长期的社会不公和歧视。智慧需要我们意识到这些潜在的问题并采取措施进行纠正。

6. 目的（Purpose）

6.1 算法的目标

算法的目标和优化准则决定了其决策倾向。例如，一个旨在最大化利润的算法可能忽略公平性因素。

6.2 人的干预

算法的设计者和用户的目的也可能影响算法的偏见。人们可能有意或无意地使算法满足某种预期的输出。

7. DIKWP与算法偏见

DIKWP框架为我们提供了一个全面了解算法偏见的方法。从数据选择到信息转换，再到知识获取和目的设定，每一步都可能产生偏见。只有全面审查和反思，我们才能确保算法的公正性。

8. 总结

“每个算法都有偏见”这一观点在某种程度上确实有根据，因为算法是基于不完美的数据和有限的知识进行训练的。通过DIKWP框架，我们可以深入了解偏见的来源，并采取措施进行纠正。为了创建公正、透明和无偏见的算法，我们需要持续的努力和深度的反思。

段玉聪，海南大学计算机科学与技术学院教授，博士生导师，第一批入选海南省南海名家计划、海南省领军人才，2006年毕业于中国科学院软件研究所，先后在清华大学、首都医科大学、韩国浦项工科大学、法国国家科学院、捷克布拉格查理大学、意大利米兰比克卡大学、美国密苏里州立大学等工作与访学。现任海南大学计算机科学与技术学院学术委员会委员、海南大学数据、信息、知识、智慧、意图DIKWP创新团队负责人、兼重庆警察学院特聘研究员、海南省委双百人才团队负责人、海南省发明协会副会长、海南省知识产权协会副会长、海南省低碳经济发展促进会副会长、海南省农产品加工企业协会副会长、美国中密西根大学客座研究员及意大利摩德纳大学的博士指导委员会委员等职务。自2012年作为D类人才引进海南大学以来，累计发表论文260余篇，SCI收录100余次，ESI高被引11篇,引用统计超过4300次。面向多行业、多领域设计了241件（含15件PCT发明专利）系列化中国国家及国际发明专利，已获授权第1发明人中国国家发明专利及国际发明专利共85件。2020年获吴文俊人工智能技术发明三等奖；2021年作为程序委员会主席独立发起首届国际数据、信息、知识与智慧大会-IEEE DIKW 2021；2022年担任IEEE DIKW 2022大会指导委员会主席；同年获评海南省最美科技工作者（并被推全国）；同年10月入选美国斯坦福大学发布的全球前2%顶尖科学家的“终身科学影响力排行榜”榜单。参与研制IEEE金融知识图谱国际标准2项、行业知识图谱标准4项。2023年发起并共同举办首届世界人工意识大会（Artificial Consciousness 2023, AC2023)。

转载本文请联系原作者获取授权，同时请注明本文来自段玉聪科学网博客。
链接地址：https://wap.sciencenet.cn/blog-3429562-1404765.html

上一篇：GPT-4在二型糖尿病诊疗背景下的行为透明性：基于DIKWP框架的解析
下一篇：基于DIKWP框架对GPT-4算法偏见的解析

收藏 IP: 112.67.110.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

段玉聪

扫一扫，分享此博文

YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

基于DIKWP框架的算法偏见解析

基于DIKWP框架的算法偏见解析

段玉聪（Yucong Duan）

1. 引言

2. 数据（Data）

3. 信息（Information）

4. 知识（Knowledge）

5. 智慧（Wisdom）

6. 目的（Purpose）

7. DIKWP与算法偏见

8. 总结

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

段玉聪

全部作者的其他最新博文

全部精选博文导读

YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

基于DIKWP框架的算法偏见解析

基于DIKWP框架的算法偏见解析

段玉聪（Yucong Duan）

1. 引言

2. 数据（Data）

3. 信息（Information）

4. 知识（Knowledge）

5. 智慧（Wisdom）

6. 目的（Purpose）

7. DIKWP与算法偏见

8. 总结

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

段玉聪

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)