热线电话
  • 010-88558925010-88558943
  • 010-88558955010-88558948
CMIC专家更多

中国半导体行业协会副

3月21日,SEMI产业创新投资论坛在上...更多>>

赛迪研究院未来产业研

近日,工业和信息化部、科技部、交通运输部...更多>>

中国市场情报中心 > CMIC研究 > 特别关注
CMIC:认知大数据的两种不同“心理模型”

发布时间:2017-08-08 14:19:00

来源:赛迪-中国软件评测中心

作者:赛迪-中国软件评测中心

【打印】 【进入博客】 【推荐给朋友】

  【CMIC讯】大数据将给企业和私人生活带来变化,因此产生的许多期望和承诺已经在科学研究中进行了讨论。但是,大数据究竟是我们观察到的范式转变,还是简单的对已知方法的概念补充,比如,机器学习或是统计?我们提供了一个理论和认识论的观点来检查大数据的破坏性,并为其应用程序的分类开发了几个标准(见图1)。

图

图1:认知大数据的双重模型

 

  一、超越各个V获得对潜在数据的深度理解
 
  Floridi认为,大数据的真正认识论挑战是在数据源中找到小模式。在他看来,扩展数据处理系统只是得到了更多的数据,并不能解决大数据处理的挑战,而是放大了挑战。找到数据之间的模式和连接的可能性会随着可用数据量的增加而增加,但分析中实际考虑的数据量的增加,并不一定会增加识别数据集中的模式的可能性。事实上,模式可以在数据子集或大数据集中被识别。为了识别可以通过分析和解释变成知识的更先进的模式,识别和决定数据的哪些部分是相关的,哪些部分可以忽略是非常重要的。
 
  二、两种不同的“心理模型”——机器相关和人类因果
 
  Anderson把相关关系相对于因果关系的优先性直接称作“理论的终结”,如大数据可以用来测试“野外(in the field)”的假设,并从过去的模式中预测未来的事件,而不需要因果理论解释为什么事情应该发生。但洛维尔集团董事长帕特里克•沃尔(Patrick W. Gross)反驳说,“在实践中,理论和数据相互加强”。杂乱相关的高可能性经常被提及为大数据的认识论问题。
 
  然而,我们如何判断相关性是否是虚假的?Simon在“伪造相关”中解释说,我们需要依赖两种演绎假设:逻辑假设,例如前面的事件不能由后期事件引起,以及假设其他环境变量不会干扰将要接受测试的相关性。Simon认为,这些假设是先验的,因为它们不是统计数据,而是经验性的,当然也不是任意的。然而,我们不能依赖于先前的经验来判断相关性的因果关系,这限制了我们在分析和决策中的作用。
 
  在大数据中,基于因果关系的证据,将相关性区分为虚假和真实类型可能是有意义的,但不如基于它们对某一目的的可行性,“可行性”是Glasersfeld定义的术语。因此,我们只会区分可行和不可行的相关性。这些术语的缺点是它们没有绝对的真值。相关性是否可行只能在特定目的的背景下决定。这样的背景可能是要将观察结果纳入更大的模型或要达到的目标。
 
  三、双重认知大数据模型
 
  认知大数据的概念意味着双重模式:一方面,它将支持人们对数据的理解和不同数据点之间的联系;另一方面也涉及向学习机的转移,以及能够学习、理解和感知人类意图的IT系统。这些机器最终将能够理解人类的认知过程,并将其用于将数据转化为可感知的资产。
 
  其中一些想法回到了认知计算机科学的概念,人类的认知是通过智能算法来模拟的,并用以协助人类。因此,我们今天就大数据讨论的所有问题将转向“理解自然并改善人类状况,[和]结构化和非结构化的数据海洋[仅仅是]基础”。信息系统研究需要考虑这些趋势,并通过新的可能性来支持公司内部的知识创造过程,特别是添加机器智能和机器支持系统。另外需要关注视觉数据分析和可视化,以减轻人类理解数据的认知负担。
 
  我们把人类和机器看作两个相对应的实体。两者都在构建模型和观察现象:
 
  •相关性模型(机器):机器主要通过将算法应用于数据空间来实现对世界的理解,并通过计算模型对环境数字化,以丰富数据空间,创造因果解释不是唯一目标;
 
  •因果模型(人类):人类主要通过将观察转化为他们思想体验空间的资产,以此来寻求对世界的了解。原则上,观察通过因果模型中过去的经验得到验证,过滤和匹配。
 
  我们强烈推荐通过学习其他的作品以了解人类的心灵。我们还想说,机器能够计算因果模型,例如贝叶斯网络。在这篇文章中,我们假设人类主要寻求建立因果模型,而机器则应用计算方法,因而对使用当前可用技术进行因果解释没有固有的“愿望”。

责任编辑:拂晓晨风

相关报道
  • --

联系我们:8610-8855 8955 zhouhl@staff.ccidnet.com

广告发布: 8610-88558925

方案、案例展示: 8610-88558925

Copyright 2000-2011 CCIDnet.All rights reserved.

京ICP000080号 网站-3