AppDNA:基于图深度学习的APP行为分析

栏目: 数据库 · 发布时间: 5年前

内容简介:有两方面的原因,说明如下:本论文的方法和逻辑是:这个研究是:APPDNA——基于图深度学习的APP行为分析(画像)。 这个研究的关键词:APPDNA框架(作者自创),图编码算法(作者自创),深度学习,基于代码级别APP行为分析 这个研究的结果集:

论文:《AppDNA: App Behavior Profiling via Graph-based Deep Learning》阅读笔记。

1 为什么做这个研究?

有两方面的原因,说明如下:

  • 一方面, 数以百万级APP引出的挑战性和有价值的问题
  • APP的分类组织和管理
  • APP恶意性检测
  • APP的剽窃性检测
  • APP的个性化推荐和服务
  • 另一方面, 当前研究现状梳理
  • 基于代码级别的分析,主要研究方法,市面上已经陆续有一些针对特定任务 (比方说敏感信息泄露,权限滥用,剽窃等)的APP分析工具,方法的局限性就是 通用性不强,开销大。
  • 基于预先定义特征的机器学习方法,主要研究方法,可以表示为:预先定义特征集+机器学习算法(SVM,NB,DBN, RNN),方法的局限性是不能全面地描述APP的行为,标签数据昂贵,应用场景有限。

怎么做这个研究?

本论文的方法和逻辑是: 设计和实现APPDNA框架并且做多方面的应用实证与分析 。具体实施步骤如下:

  • 第一步:提取APP函数调用图(FCG),利用市面上工具Soot和FlowDroid从APP中提取函数调用图。
  • 第二步:函数调用图编码,这是本论文的创新点,论文作者通过设计和实现一个图编码算法把函数调用图转换成一个向量。(笔者认为,这是可以继续思考和挖掘的点)。
  • 第三步:利用无监督深度学习做特征表示学习,采用无监督的深度自编码器从图编码后的向量中学习到一个64维的紧凑表示,作为表示学习到的特征集。
  • 第四步:基于表示学习的特征集进行多方面应用实证和分析,包括恶意性程序检测(二元分类问题),应用程序功能分类(多分类问题),APP版本检测(基于距离相似度分析)等多应用场景实证。

这个研究是什么?

这个研究是:APPDNA——基于图深度学习的APP行为分析(画像)。 这个研究的关键词:APPDNA框架(作者自创),图编码算法(作者自创),深度学习,基于代码级别APP行为分析 这个研究的结果集:

  • APP恶意检测:针对4024个样本时5.06秒和准确度93.07%
  • APP恶意程序类型分类:针对570个恶意样本分类21种类型,耗时0.83秒,准确度是82.3%
  • APP功能分类:针对9730个样本分类7种类型,准确度是33.3%

这个研究的启发?

阅读本文,笔者有两点启发: 1 图结构的编码,可以深入研究和跟踪 利用图数据结构,描述事物或者对象的关系和属性,如何设计一种合适的图编码算法以实现图数据结构的向量化,同时,又要最大程度地保持图中描述的关系和属性。 2 相比较人为特征设计或者针对特定问题的而预先定义的特征集,如何实现特征的自动学习和表示,利用深度学习的方法来实现,根据是否存有标签,选择无监督和有监督的深度学习算法。 3 通过这篇论文做的研究,引起了我思考一个问题, 如何对APP市场进行更好地和更有效地管理? (欢迎感兴趣的朋友交流和探讨)

5 论文阅读思维导图

AppDNA:基于图深度学习的APP行为分析

论文下载链接: https://pan.baidu.com/s/1FBUZStdNyaWn5Z3igySlgg

您有什么想法,请留言。

版权声明: 作者保留权利。文章为作者独立观点,不代表数据人网立场。严禁修改,转载请注明原文链接:http://shujuren.org/article/774.html

数据人网: 数据人学习,交流和分享的平台,诚邀您创造和分享数据知识,共建和共享数据智库。


以上所述就是小编给大家介绍的《AppDNA:基于图深度学习的APP行为分析》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

鲜活的数据

鲜活的数据

[美] Nathan Yau / 向怡宁 / 人民邮电出版社 / 2012-10-1 / 69.00元

在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。Nath an Yau是这一创新领域的先锋。在本书中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)......一起来看看 《鲜活的数据》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换