欢迎光临112期刊网!
网站首页 > 论文范文 > 经济论文 > 其他经济 > 大数据挖掘风险评估研究

大数据挖掘风险评估研究

日期:2023-01-08 阅读量:0 所属栏目:其他经济


  摘要:随着网络数据体量的增加,AI图景中隐含的风险因素增多,加重了AI图景的使用风险,威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则,当数据体量不断上涨时,其风险等级评估结果严重脱离实际,因此研究AI图景下,基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘,获取风险因素动态关联规则;利用云模型,粒化AI图景;根据评估矩阵,评估AI图景的使用风险。实验证实数据体量不断增长条件下,此次研究方法的风险评估结果,与给定结果一致。可见此次研究的风险评估方法,可用来测量AI图景的使用风险。

  

  关键词:AI图景;大数据挖掘;风险评估;动态关联规则

  

  现阶段我国提出“新一代人工智能发展规划”,并在第十三届全国人大一次会议政府工作报告中指出,“做大做强新兴产业集群,实施大数据发展行动,加强新一代人工智能研发应用”。可见在网络科技创新发展背景下,人工智能技术的发展越来越受到国家的关注。人工智能技术全称为ArtificialIntelligence,是根据人脑思维模式创建的一项机器智能技术,但随着人工智能技术的不断优化升级,AI图景下,各行各业都将该技术应用到企业发展中,通过提升高工作效率、降低决策成本等,进一步调整企业生产与项目管理。但AI图景发挥强大功能的同时,也带来了巨大的风险,例如人工智能技术构建AI图景时,需要智能采集基本数据,侵害了企业的数据产权;黑盒疏漏打破了大数据平衡等等[1]。因此针对现阶段的问题,传统方法根据文献[2]中的部分内容,将风险程度分为无风险、一般风险、中度风险以及重度风险,结合贝叶斯网络,建立了基于多状态贝叶斯决策树的风险评估模型,用来评估AI图景下的风险因素[2]。但随着网络信息体量的不断增加,该评估方法出现了不适用的问题,因此在AI图景下,研究基于大数据挖掘的风险评估方法。大数据挖掘就是从大规模异构或多源数据中,找出其中隐藏的风险因素,或识别风险因素之间的关联特征,再通过计算评估风险程度,为目前海量的网络数据,提供更加可靠的评价结果。

  

  1AI图景下基于大数据挖掘的风险评估方法

  

  1.1基于大数据挖掘获取风险因素动态关联规则

  

  一般意义上来说,风险因素关联规则是静态的和永恒有效的,但是当前社会的大环境在变化,人们的需求也在不断改变,风险因素的静态关联规则,已经是过去的风险评估基本条件,此次研究根据目前的变化特征,引入支持度向量和置信度向量,通过大数据挖掘结果,描述规则在时间变化下的动态特性。大数据挖掘算法,将动态关联规则进行定义:现阶段的风险因素动态关联规则,是描述AI图景数据自身特性随时间变化而改变特性的关联规则。因此假设在t时间段内,AI图景下基于大数据挖掘的风险评估研究王伟(河南工业贸易职业学院信息工程系,河南郑州,451191)摘要:随着网络数据体量的增加,AI图景中隐含的风险因素增多,加重了AI图景的使用风险,威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则,当数据体量不断上涨时,其风险等级评估结果严重脱离实际,因此研究AI图景下,基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘,获取风险因素动态关联规则;利用云模型,粒化AI图景;根据评估矩阵,评估AI图景的使用风险。实验证实数据体量不断增长条件下,此次研究方法的风险评估结果,与给定结果一致。可见此次研究的风险评估方法,可用来测量AI图景的使用风险。关键词:AI图景;大数据挖掘;风险评估;动态关联规则获得事务数据集A,然后根据需要,将时间段t分割为n个不相交的时间序列,即{}12,,,nt=ttt,用{}12,,,mI=iii,表示项的集合。再将数据集A划分为n个不相交的数据子集,即{}12,,,nA=AAA,此时可以说数据子集(1,2,,)iAi∈n的数据,是在(1,2,,)iti∈n时间段内收集到的。假设X、Y表示非空项集,且X、Y均属于集合项的集合I,则关联规则可用X⇒Y表示。该规则同时具有支持度和置信度[3]。令支持度()Ac=PX∪Y,表示两个项集在A中同时出现的概率;令置信度(|)As=PYX,表示项集X在A中某一事务集出现的情况下,该事务集同时也出现项集Y的概率。根据上述参数,确定风险因素动态关联规则的表达式为X⇒Y(C,S,c,s),其中C表示支持度向量;S表示置信度向量。则该规则的频数向量计算表达式,如下所示:在数据子集(1,2,,)iAi∈n中出现的频数。因此大数据挖掘算法,按照下列步骤挖掘整个动态关联规则:找出频繁项集F,并计算其相应的频数向量H;根据频繁项集F,再次扫描AI图景生成数据库,产生动态规则,且根据H产生向量C和向量S。由于大数据的特征之一就是价值密度低,因此大数据挖掘算法通过两阶段挖掘的形式,计算节点间的动态负载均衡,以此实现对风险因素动态关联规则的挖掘。

  

  1.2粒化AI图景

  

  云模型是大数据挖掘中一个计算型模型,可以揭示风险因素的模糊性与随机性之间的关联,因此通过云模型粒化AI图景。假设定量论域用D表示,G是定量论域的定性概念,若定量值α∈D,且α是定性概念的一次随机实现,那么α对G的确定度为λ(α)∈0,1,表示有稳定倾向的随机数,即λ:D→0,1,∀α∈D,α→λ(α),此时在论域D上的分布,就是云模型,每一个α为一个云滴。利用期望Eα、熵En以及超熵Ge的特征,反映定性概念G整体上的定量特征。使用云模型粒化AI图景,就是使用逆向云发生器,从数据集中得到反映定性概念的数字特征集,该集合可表示为{(Eα,En,Ge)},利用该集合将图景划分为n个粒。利用云模型分割具有不同风险AI图景,得到每个图景对应的一个粒,根据该粒以推广的方式,评估风险指数。1.3风险评估根据粒化后的AI图景,建立判断矩阵,进行AI图景使用稳定性风险评估。该判断矩阵的部分参数,K表示图景使用稳定性风险;U1、U2、U3、U4分别表示机制风险、社会用户风险、图景生成风险、环境影响风险;uij表示指标Ui比指标Uj重要的程度量化值。该判断矩阵中,uii=1;uji=1/uij,且uij>0。根据上表1中的数据,制定所有影响AI图景的风险因素的判断矩阵,并计算所有判断矩阵的最大特征值和对应的特征向量,通过归一化得到判断矩阵的权重向量,该权重用ijω表示。假设最大特征值为maxϕ,则一致性指标的计算结果为:由于风险因素具有多样性、复杂性等特征,因此只依靠上述指标,判断图景使用稳定性风险K时,还具有一定的片面性,因此利用平均随机一致性指标RI,来弥补一致性指标的不足。用一致性指标CI比上平均随机一致性指标RI,得到的一致性比率用CR表示。当CR<0.1时,则判断矩阵通过一致性检验;当CR≥0.1时,说明判断矩阵未通过一致性检验,需要重新调整判断矩阵。根据确定的评估矩阵,执行评估工作。至此在AI图景下,实现基于大数据挖掘的风险评估。

  

  2对比实验

  

  设置此次研究的风险评估方法,为实验组;传统方法为对照组。搭建仿真实验平台,利用仿真测试软件,模拟海量信息生成的AI图景存在的风险程度。分别利用上述两个测试组,测试数据体量动态变化下,AI图景中隐含的风险指数,结果如图1所示。根据图中的风险评估结果可知,当数据体量在100GB时,两种方法的风险评估结果极为相近。当数据体量分别为5000GB、10000GB以及100000GB时,实验组的风险评估结果,与表3中给定的数据近似;而对照组对含有3组海量信息的图景,其风险评估结果均在0.3~0.4之间,当数据体量增加到10000GB、100000GB时,风险评估结果的变化非常微弱。表1为两个测试组的风险等级评估结果。根据表中的数据可知,虽然实验组的风险指数评估结果,没能与给定结果完全一致,但高度近似的评估结果,可以认为实验组方法评估可靠,其得到的风险等级,也与给定数据一致。而对照组的风险指数评估结果,只有前两组与给定结果近似,后两组评估结果完全失真,因此最终得到的风险等级,也完全错误。可见实验组评估结果更加贴合实际。

  

  3结束语

  

  此次研究的风险评估方法,经过实验论证后,得到了较高的评价,但受个人能力以及研究经验限制,还存在一些不足之处,今后的风险研究工作中,可以对大数据挖掘算法进行改进,进一步优化关联规则获取方式,使得到的评估数据,更能体现AI图景基本现状,为国家AI技术的发展与应用,提供性能更好的评估方法。

  

  参考文献

  

  [1]蒋洁.AI图景下大数据挖掘的风险评估与应对策略[J].现代情报,2018,38(05):147-151.

  

  [2]杨建华,周震宇,奚洪磊,等.基于数据挖掘的继电保护系统风险评估模型[J].信息技术,2018,42(07):60-64.

  

  [3]李珏,李世杰.基于文本挖掘的高处坠落事故致因及关联规则分析[J].长沙理工大学学报(自然科学版),2020,17(02):61-67+74.

  

  作者:王伟 单位:河南工业贸易职业学院信息工程

本文链接:http://www.qk112.com/lwfw/jingjilunwen/qitajingji/126825.html

论文中心更多

发表指导
期刊知识
职称指导
论文百科
写作指导
论文指导
论文格式 论文题目 论文开题 参考文献 论文致谢 论文前言
教育论文
美术教育 小学教育 学前教育 高等教育 职业教育 体育教育 英语教育 数学教育 初等教育 音乐教育 幼儿园教育 中教教育 教育理论 教育管理 中等教育 教育教学 成人教育 艺术教育 影视教育 特殊教育 心理学教育 师范教育 语文教育 研究生论文 化学教育 图书馆论文 文教资料 其他教育
医学论文
医学护理 医学检验 药学论文 畜牧兽医 中医学 临床医学 外科学 内科学 生物制药 基础医学 预防卫生 肿瘤论文 儿科学论文 妇产科 遗传学 其他医学
经济论文
国际贸易 市场营销 财政金融 农业经济 工业经济 财务审计 产业经济 交通运输 房地产经济 微观经济学 政治经济学 宏观经济学 西方经济学 其他经济 发展战略论文 国际经济 行业经济 证券投资论文 保险经济论文
法学论文
民法 国际法 刑法 行政法 经济法 宪法 司法制度 法学理论 其他法学
计算机论文
计算机网络 软件技术 计算机应用 信息安全 信息管理 智能科技 应用电子技术 通讯论文
会计论文
预算会计 财务会计 成本会计 会计电算化 管理会计 国际会计 会计理论 会计控制 审计会计
文学论文
中国哲学 艺术理论 心理学 伦理学 新闻 美学 逻辑学 音乐舞蹈 喜剧表演 广告学 电视电影 哲学理论 世界哲学 文史论文 美术论文
管理论文
行政管理论文 工商管理论文 市场营销论文 企业管理论文 成本管理论文 人力资源论文 项目管理论文 旅游管理论文 电子商务管理论文 公共管理论文 质量管理论文 物流管理论文 经济管理论文 财务管理论文 管理学论文 秘书文秘 档案管理
社科论文
三农问题 环境保护 伦理道德 城镇建设 人口生育 资本主义 科技论文 社会论文 工程论文 环境科学