基于北京留学机构SparkGraphX企业信息族谱分析
作者:樊继慧 谌颃
来源:《电脑知识与技术》2018年第21
        摘要:互联网的高速发展让大数据应用有了更多用武之地,有关大数据的各类应用开始赢得市场。数据挖掘以及人工智能的市场越来越大,本文探讨并实现了基于戚薇徐正曦Spark GraphX的企业信息族谱,通过对图计算的深入分析和应用,帮助用户实时查询企业相关的基本信息、股权结构、投资族谱、企业图谱、疑似关系等信息,同时快速了解企业信息、企业经营和人员投资状况,提供全面、可靠、透明的数据信息。
李小璐薛之谦        关键词:大数据;企业信息族谱;图计算
        中图分类号:上海堡垒导演TP311 李谷一文献标识码:A 文章编号:1009-3044201821-0083-02
        数据挖掘技术在近几年发展蓬勃,云计算和人工智能一时间涌入大众的视野,各企业也纷纷引入新技术促进发展,新工科背景下很多高校开始设立数据科学与大数据技术专业,专门学习数据挖掘技术。数据挖掘是大数据中最重要也是最关键的工作[1]
李小璐床震39分在线观看
        本文基于数据挖掘技术完成企业信息族谱的分析,进行深度商业关系梳理,以数据为切入点,以关系为最终产品,通过对企业数据的分析,帮助用户查询企业相关信息、投资图谱、股权结构、企业图谱等信息,快速上午了解企业信息、企业经营和人员投资状况,提供全面、可靠、透明的数据信息。在企业信息图谱的实现中,我们引入了图计算的经典算法Spark GraphX[2],并利用图谱分析时的广度优先搜索方法,实现了企业图谱[3]的实时动态显示。
        1 Spark GraphX简介
        Spark GraphX是一个分布式图处理框架[4],它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。图的分布式或者并行处理其实是把图拆分成很多的子图,然后分别对这些子图进行计算,计算的时候可以分别迭代进行分阶段的计算,即对图进行并行计算。