查看原文
其他

影响因子波动率对一篇论文的影响:对11639种期刊的综合分析 | 网络科学论文速递27篇

ComplexLY 集智俱乐部 2021-02-09


核心速递



  • 影响因子波动率对一篇论文的影响:对11639种期刊的综合分析;

  • 基于可信度的虚假新闻检测;
  • 蝴蝶结中心性:一种新的具有内在节点性质的有向加权网络测度;
  • 波兰语Twitter数据的情感分析模型;
  • 人类交际动力学行为的整体规律性与个体变异性;
  • 使用阿拉伯语推文来了解非法药品销售行为;
  • 通过情感轨迹研究英国钻头音乐;
  • 带注释的超图:模型和应用程序;
  • 在线用户交互的情感行为分析:在线支持团体比Twitter更有治疗效果吗?;
  • FAIRY:一个理解用户行为及其社交资讯之间关系的框架;
  • 用于动态群落检测的约束谱聚类方法;
  • 通过LSTM历史跟踪进行动态图嵌入;
  • 出口的商品构成的恩格尔定律;
  • 复杂网络社区检测的对抗性增强;
  • ColluEagle:利用马尔科夫随机字段检测垃圾邮件;
  • 集群强化学习;
  • 基于距离的网络划分;
  • 网络连接的统计特性:全球海运网络航线调查;
  • 中国城市空气质量模式与相关性;
  • 物理学的乐趣:量化人类参与活动的动力学;
  • 局部统计、半定规划与社区检测;
  • 传染病突变的最小渗流集;
  • 人类冲突伤亡分布的统一认识;
  • 基于点击率量化在线社交网络使用目标兴趣的最佳选择;
  • weg2vec:含时网络事件嵌入;
  • 收入不平等的尺度及其动力学来源;
  • 评估空中交通网络交互的新中心性和因果性指标;




影响因子波动率对一篇论文的

影响:对11639种期刊的综合分析


原文标题:
Impact Factor volatility to a single paper: A comprehensive analysis of 11639 journals
地址:
http://arxiv.org/abs/1911.02533
作者: 
Manolis Antonoyiannakis
摘要:我们研究了一篇论文如何影响影响因子(IF),通过分析来自Clarivate Analytics 的2017年期刊引用报告11639份期刊上发表的3,088,511篇论文的数据。我们发现影响因子是高度易变的。例如,381种期刊中被引频次最高的论文使其IF值增加了0.5分以上,而818种期刊的相对增幅超过了25%。每10份期刊中就有一份期刊的前三名论文被引用的几率增加了50%以上。由于单篇论文对中频的影响与期刊的大小成反比,高被引论文在小型期刊比大型期刊中获得更大的奖励,而低被引论文的中频更大,尤其是中频高的论文。这种倾斜的奖励机制激励着高质量的期刊——如果它们保持规模,保持在排名上的竞争力。我们讨论发表在著名期刊上的突破性论文的应用。我们质疑中频排名的可靠性,因为它对数千种期刊的几篇论文具有很高的中频敏感性。


基于可信度的虚假新闻检测


原文标题:
Credibility-based Fake News Detection
地址: 
http://arxiv.org/abs/1911.00643
作者:
Niraj Sitaula, Chilukuri K. Mohan, Jennifer Grygiel, Xinyi Zhou, Reza Zafarani

摘要:虚假新闻可能意味着对那些经常依赖网络资源和社交媒体获取信息的人的错误信息。目前对虚假新闻检测的研究主要集中在分析虚假新闻内容及其如何在用户网络上传播。本文通过对虚假新闻公信力的评估,强调对虚假新闻的检测。通过分析公开的虚假新闻数据,我们发现新闻来源(和作者)的信息可以成为一个强有力的可信度指标。研究结果表明,作者与虚假新闻的交往史,以及新闻文章的作者数量,对发现虚假新闻具有重要作用。我们的方法可以帮助改进传统的虚假新闻检测方法,其中内容特征经常被用来检测虚假新闻。



蝴蝶结中心性:

一种新的具有内在节点

性质的有向加权网络测度


原文标题:
The Bow-Tie Centrality: A Novel Measure for Directed and Weighted Networks with an Intrinsic Node Property
地址: 
http://arxiv.org/abs/1911.00924
作者: 
James B Glattfelder

摘要:今天,存在许多用于评估网络中节点重要性的中心性度量,它们作为位置和底层拓扑的函数。其中一类度量方法是建立在特征向量中心性的基础上的,并从其相邻节点的重要性导出的。对于有向和加权的复杂网络,当节点可以携带一些内在的属性值时,有人提出了中心性度量方法,这是特征向量中心性的变体。然而,这些表达方式都有缺点。在这里,提出了这种中心性措施的一种扩展,用以补救以前遇到的所有问题。虽然已经提出了类似的改进中心性度量作为算法,但本文提出的新数量是一个纯解析表达式,仅利用邻接矩阵和节点值向量。详细地推导了新的中心度测度。具体地说,中心性本身对于显示蝴蝶结拓扑的有向和加权网络(具有节点属性)的分析是理想的。然后,对来自经济学的一组独特的、广泛的现实世界数据计算新的蝴蝶结中心度。研究表明,在网络中存在循环的情况下,蝴蝶结中心性与其他特征向量中心性度量方法一样评估节点的相关性,而不受其缺点的影响。



波兰语Twitter数据的情感分析模型


原文标题:
Sentiment analysis model for Twitter data in Polish language
地址:
http://arxiv.org/abs/1911.00985
作者:
Karol Chlasta

摘要:本文基于2015年5月10日波兰总统大选期间收集的推文数据进行文本挖掘分析。该项目包括实现从Twitter检索信息的引擎、构建文档语料库、语料库清理和创建术语文档矩阵。每篇来自文本语料库的推文都根据其情感得分分配一个类别。分数是使用每个文档中的正或负表情符号和波兰语单词的数量计算的。结果数据集用于训练和测试四个机器学习分类器,以选择提供最准确的自动推文分类结果的分类器。朴素贝叶斯和最大熵算法分别达到71.76%和77.32%的最佳精度。所有的实现任务都是用R语言完成的。



人类交际动力学行为的

整体规律性与个体变异性


原文标题:
Global Regularity and Individual Variability in Dynamic Behaviors of Human Communication
地址:
http://arxiv.org/abs/1911.01264
作者: 
Jonathan J. H. Zhu, Tai-Quan Peng

摘要:最近提出了一个新的模型,称为“人类动力学”,即个体根据任务的感知优先级执行活动,其特征是连续任务之间等待时间服从幂律分布。这种幂律分布已经存在于不同的人类行为中,例如邮件通信、电子邮件通信、网页浏览、视频点播和移动电话呼叫。然而,这种模式是在全球(即聚合)层面上观察到的,没有考虑个体差异。为了防范生态谬误,有必要在个体层面对模型进行检验。本研究旨在解决以下问题:个人行为的分布是否具有统一的幂律?我们以近4000名互联网用户的网络浏览行为的客户端日志文件和230万名用户的文件共享行为的服务器日志文件为例对这些问题在P2P系统中进行了研究。研究结果证实了在网页浏览和P2P使用行为的聚合层次上的人的动力学模型。我们还发现,在幂律分布的衰减率(即指数Ã)中,个体之间存在可检测的可变性,其遵循众所周知的分布(即高斯分布、韦伯分布和对数正态分布)。



使用阿拉伯语推文

来了解非法药品销售行为


原文标题:
Using Arabic Tweets to Understand Drug Selling Behaviors
地址:
http://arxiv.org/abs/1911.01275
作者: 
Wesam Alruwaili, Bradley Protano, Tejasvi Sirigiriraju, Hamed Alhoori

摘要:Twitter是阿拉伯地区一个受欢迎的电子商务平台,包括非法商品和服务的销售。非法药品的销售和使用、合法药品的假药以及无处方销售的合法药品被认为是一种公共卫生风险,这是一个被社会媒体反映和推动的普遍问题。为保护病人的安全,建议采取各种措施。我们使用阿拉伯语关键字收集数据集。然后,我们使用四种机器学习分类器对数据进行分类。在比较各自结果的基础上,我们评估了每个分类器在分析药物在社交媒体上的可用程度时预测两个重要因素的准确性:对出售药物的引用和所宣传药物的合法性/非法性。在预测推特售卖药品方面,支持向量机的准确率最高(96%),而在预测广告药品的合法性方面,支持向量机的准确率最高(96%),朴素贝叶斯分类器的准确率最高(85%)。



通过情感轨迹研究英国钻头音乐


原文标题:
Examining UK drill music through sentiment trajectory analysis
地址:
http://arxiv.org/abs/1911.01324
作者: 
Bennett Kleinberg, Paul McFarlane

摘要:本文介绍了自然语言处理技术在英国如何被用来检测与帮派相关的钻头音乐的情感轨迹。这项工作是重要的。因此,本文探讨了情感轨迹在群体性操练音乐歌词中的作用。研究结果表明,两种不同的情绪使用模式和统计分析显示,带有明显积极语气的歌词在YouTube上比消极歌词吸引更多的浏览量和参与度。我们的工作为伦敦钻乐的语言使用提供了第一次实证研究,因此,它可以用于未来的研究和并帮助政策制定者理解所谓的钻刚关系。



带注释的超图:模型和应用程序


原文标题:
Annotated Hypergraphs: Models and Applications
地址: 
http://arxiv.org/abs/1911.01331
作者: 
Philip Chodrow, Andrew Mellor

摘要: 超图为研究实体集之间的多元交互作用提供了自然的建模语言。许多多元交互是不对称的,节点扮演独特的角色。例如,在一个学术协作网络中,一篇论文的作者的顺序通常反映了他们对已完成工作的贡献的性质。为了对这些网络进行建模,我们引入了带注释的超图作为有向图的自然多矢推广。为了方便使用带注释的超图进行数据分析,我们构造了这些结构的角色感知配置空模型,并证明了一种有效的马尔科夫链蒙特卡罗抽样方案。接下来,我们将阐述用于分析带注释超图的几个指标和算法。其中的几个,如协调性和模块化,很自然地泛化了二元对应。其他指标,如局部角色密度,对于带注释的超图的设置是惟一的。我们在六个数字社会网络中使用我们的技术,并提出了一个详细的案例研究电子邮件数据集。



在线用户交互的

情感行为分析:在线支持

团体比Twitter更有治疗效果吗?


原文标题:
Affective Behaviour Analysis of On-line User Interactions: Are On-line Support Groups more Therapeutic than Twitter?
地址:
http://arxiv.org/abs/1911.01371
作者:
Giuliano Tortoreto, Evgeny A. Stepanov, Alessandra Cervone, Mateusz Dubiel, Giuseppe Riccardi

摘要:随着心理健康问题患病率的增加,与健康相关的社交网站也变得越来越流行。不管在线支持组(OSGs)的治疗潜力如何,它们也会对患者产生负面影响。在这项工作中,我们提出了一种新的方法,利用自然语言处理(NLP)技术自动验证社交网站中治疗因素的存在。该方法是通过从OSG和Twitter收集的在线同步多党对话进行评估的。分析结果表明,治疗因素在OSG对话中比在Twitter对话中出现得更频繁。此外,对OSG会话的分析表明,该平台的用户是支持的,交互可能会导致他们情绪状态的改善。我们相信,我们的方法为在线平台用户情绪状态的自动分析提供了一个跳板。该方法的可能应用包括提供准则,强调使用此类平台对用户心理健康的潜在影响,并/或支持分析其对特定个人的影响。


FAIRY:一个理解用户行为

及其社交资讯之间关系的框架


原文标题:
FAIRY: A Framework for Understanding Relationships between Users’ Actions and their Social Feeds
地址:
http://arxiv.org/abs/1908.03109
作者:
Azin Ghazimatin, Rishiraj Saha Roy, Gerhard Weikum

摘要:用户越来越依赖社交媒体来获取日常信息。咨询中的内容,如新闻、问题、歌曲等,通常是由用户的社交联系、兴趣和在平台上的行为相互作用的结果。用户自己的行为和接收到的提要之间的关系常常令人困惑,许多用户希望对为什么向他们显示某些条目有一个清楚的解释。透明度和非公开性是当今世界认知超载、过滤气泡、用户跟踪和隐私风险的关键问题。本文提出了一个框架,该框架系统地发现、排列和解释用户的行为和他们的社交媒体咨询中的条目之间的关系。我们模型用户的本地社区平台作为一种交互图,构造一种异构信息网络完全从用户可以很容易地获取信息,有关我们在这个互动假设路径图连接用户和她的提要条目可以作为为用户相关的解释。这些路径通过一个获取相关性的学习排名模型进行评分。在两个社交平台上的用户研究证明了FAIRY方法的实际可行性和用户收益。



用于动态群落检测的约束谱聚类方法


原文标题:
Constrained Spectral Clustering for Dynamic Community Detection
地址:
http://arxiv.org/abs/1911.01475
作者:
Abdullah Karaaslanli, Selin Aviyente

摘要:网络是许多具有相互作用实体的系统的有用表示,如社会、生物和物理系统。描述中尺度组织即社区结构,是网络科学中的一个重要问题。社区检测的目的是将网络划分为节点集,这些节点集在内部紧密相连,但与其他密集节点集的连接很稀疏。目前的社区检测工作多集中在静态网络工作上。然而,许多现实世界的网络是动态的。它们的结构和性质随时间而变化,需要动态的群落检测方法。在本文中,我们提出了一种新的随机块模型(SBM)来模拟社区成员的演化。与现有的SBMs不同,所提出的模型允许每个社区以不同的速度发展。在此基础上,提出了一种基于约束谱聚类的最大后验估计。特别地,在每个时间点上每个共同体修改图邻接矩阵的转移概率。该公式为动态网络的统计网络移情和谱聚类提供了一种关系。最后,本文对所提出的方法进行了仿真和仿真验证。



通过LSTM历史跟踪进行动态图嵌入


原文标题:
Dynamic Graph Embedding via LSTM History Tracking
地址:
http://arxiv.org/abs/1911.01551
作者:
Shima Khoshraftar, Sedigheh Mahdavi, Aijun An, Yonggang Hu, Junfeng Liu

摘要:许多真实世界的网络非常大,并且随着时间不断变化。这些动态网络存在于社会网络、交通网络和生物交互等各个领域。为了处理诸如链路预测和异常检测等下游应用中的大型动态网络,将这些网络转移到低维空间是非常必要的。近年来,将大图转换为低维表示的网络嵌入技术因其在保留网络结构方面的优势而越来越受欢迎。在本文中,我们提出了一种动态网络嵌入方法,将节点随时间的变化历史集成到节点的当前状态。我们工作的主要贡献是(1)生成动态网络嵌入结合动态和静态节点信息(2)追踪历史的邻居节点使用LSTM(3)大大减少时间和内存,通过训练使用时间游走的自动编码的LSTM模型,而不是图的邻接矩阵是常见的做法。我们评估了我们的方法在多个领域的应用,如异常检测、链接预测和来自不同领域的数据集中的节点分类。



出口的商品构成的恩格尔定律


原文标题:
Engel’s law in the commodity composition of exports
地址:
http://arxiv.org/abs/1911.01568
作者:
Sung-Gook Choi, Deok-Sun Lee

摘要:不同商品部门在生产、贸易和消费中的不同份额说明了资源和资本是如何分配和投资的。经济进步被认为改变了普遍的份额分配,例如恩格尔家庭支出定律和三部门模式从初级到制造业和服务业的转变。为了寻找这种相关性的大规模定量证据,我们分析了1962年至2000年间基于标准国际贸易分类(SITC)的国内生产总值(GDP)和国际贸易数据。在SITC的十个类别中,有三个类别的出口份额在国家和时间上与GDP显著相关;机械类为正相关,食品与原材料类为负相关。一国商品类别的出口份额与GDP之间存在幂律关系,指数表征了一国出口份额的GDP弹性。衡量两国在出口组合方面的距离,是为了确定1962年和2000年共有类似组合的几个国家集群。我们指出,在这段时期内,国内生产总值显著增长的国家很可能会转向在机械类中占有较大份额的集群。



复杂网络社区检测的对抗性增强


原文标题:
Adversarial Enhancement for Community Detection in Complex Networks
地址:
http://arxiv.org/abs/1911.01670
作者:
Jiajun Zhou, Zhi Chen, Min Du, Lihong Chen, Shanqing Yu, Feifei Li, Guanrong Chen, Qi Xuan

摘要:社区检测在网络分析中起着重要的作用。然而,它也面临着许多挑战,如对抗性攻击。如何进一步提高真实网络中社区检测的性能和鲁棒性成为人们关注的问题。在本文中,我们提出一个敌对的增强社区检测的概念,并提出两个敌对的增强算法:一个是叫对抗增强通过遗传算法(AE-GA),模块化和集群的数量被用来设计一个适应度函数来解决分辨率限制问题;另一种是基于顶点相似度的对抗增强算法(AE-VS),该算法综合了不同顶点相似度所捕获的群落结构的多种信息,在大规模网络中具有良好的可扩展性。这两种算法与六种现有的社区检测算法一起在四个真实的网络上进行了测试。综合实验结果表明,与两种传统的增强方法相比,我们的方法帮助六个社区检测算法实现更重要的性能改进此外,相应的对抗网络实验表明,我们的方法可以重建网络结构在一定程度上被敌对的攻击,实现更强的防御社区检测的欺骗。



ColluEagle:利用

马尔科夫随机字段检测垃圾邮件


原文标题:
ColluEagle: Collusive review spammer detection using Markov random fields
地址:
http://arxiv.org/abs/1911.01690
作者: 
Zhuo Wang, Runlong Hu, Qian Chen, Pei Gao, Xiaowei Xu

摘要:产品评论对于在线购物者提供购买决策是非常有价值的。在巨大的利润激励下,欺诈者故意编造不真实的评论,以扭曲网络产品的声誉。随着在线评论变得越来越重要,群发垃圾信息,即在美国,一群诈骗犯联手攻击一系列目标产品,成为了一种新的时尚。以前的作品使用审查网络效应,即审查者、审查者和产品之间的关系,来检测虚假审查或审查垃圾邮件发送者,但忽略了时间效应,这是刻画群体垃圾邮件的关键。在这篇论文中,我们提出了一种新的基于马尔可夫随机域(MRF)的方法(ColluEagle)来检测串谋审查垃圾邮件发送者,以及审查垃圾邮件运动,同时考虑了网络效应和时间效应。首先,我们确定共同评审对,一个评审现象发生在两个评审员之间,他们以相似的方式评审一个共同的产品,然后将评审员和他们的共同评审对建模为成对的mrf,并使用重复的信念支持来评估评审员的可疑性。我们进一步为ColluEagle设计了高质量但易于计算的节点先验,通过它可以识别垃圾评论组。实验表明,ColluEagle不仅可以以极高的精确度侦测合谋的滥发讯息者,其表现远超FraudEagle和SpEagle,但亦能找出高度可疑的垃圾邮件发送者活动。



集群强化学习


原文标题:
Learning to flock through reinforcement
地址:
http://arxiv.org/abs/1911.01697
作者: 
Mihir Durve, Fernando Peruani, Antonio Celani

摘要:成群的鸟、成群的鱼、成群的昆虫,都是一个群体的协调运动的例子,它是由许多个体的行为自发地产生的。在此,我们从多因素强化学习的角度来研究群体行为。在这种情况下,学习主体试图保持与群体的联系,利用其邻居的速度作为感官输入。每个学习个体通过对自己的运动方向施加有限的控制来实现这一目标。通过标准的强化学习算法我们表明:(1)学习主体接触到一群老师,即天生的植绒主体,跟着他们学习(2)在没有老师的情况下,一群独立学习主体的发展对一个国家每个主体知道如何聚集的地方。在两个场景(1)和(2)中,紧急策略(或导航策略)都对应于众所周知的Vicsek模型的极坐标速度对准机制。这些结果表明(a)这样的速度自然对齐可能进化适应性行为,旨在最小化的邻居损失和(b)证明该联合不仅支持(本地)极性顺序,但最好对应政策/战略保持集团凝聚力感官输入时仅限于邻近主体的速度。简而言之,要想呆在一起,就得一起掌舵。



基于距离的网络划分


原文标题:
Distance-Based Network Partitioning
地址:
http://arxiv.org/abs/1911.01775
作者:
Paulo J. P. de Souza, Cesar H. Comin, Luciano da F. Costa

摘要:本文提出了一种新的网络社区识别方法。参考节点是根据网络的先验信息选择的,还是根据相关节点的测量结果选择的,以指示假定的群落。然后,每个网络节点与参考节点之间的距离向量被用来定义一个坐标系统,该坐标系统表示网络在许多不同尺度上的社区结构。对于模块化网络,节点在这个空间的分布常常导致一个良好分离的集群结构,每个集群对应于社区。关于社区发现的报告方法的一个有趣的特性是,由种子定义的坐标系统允许对每个节点相对于考虑的社区的情况进行直观和直接的解释。该方法在社区检测基准、空间网络模型和城市街道网络方面的潜力得到了很好的说明。



网络连接的统计特性:

全球海运网络航线调查


原文标题:
Statistical Properties of Links of Network: A Survey on the Shipping Lines of Worldwide Marine Transport Network
地址: 
http://arxiv.org/abs/1911.01834
作者:
Wenjun Zhang, Weibing Deng, Wei Li

摘要:近几十年来,网络的节点属性和节点重要性识别得到了广泛的研究。在本文中,我们以全球海运网络(WMTN)为例,分析了网络的链路特性。首先,通过定义航线的饱和度来研究航线的循环特性。结果表明,随着线路长度的增加,线路的饱和性呈指数衰减。其次,为了检测航运线路的地理群落结构,采用了流压缩的标签传播算法(LPAF)和多维尺度变换(MDS)方法,得到了较为一致的群落结构。最后,为了分析不同船舶公司航线的冗余特性,将不同船舶公司的航线进行合并,构建多层网络。观察到拓扑量,如平均度、平均聚类系数等等,增加顺利当海洋公司合并是随机(随机选择两家海运公司,然后合并在一起的航运公司),而相对熵减少当合并序列是由詹森 - 香农距离(选择两个海洋公司时公司是最低的)之间的距离。这说明不同海运公司之间的航线冗余度较低。



中国城市空气质量模式与相关性


原文标题:
Chinese cities’ air quality pattern and correlation
地址:
http://arxiv.org/abs/1911.01845
作者: 
Wenjun Zhang, Zhanpeng Guan, Jianyao Li, Zhu Su, Weibing Deng, Wei Li

摘要:空气质量影响人们的健康和日常生活,影响敏感的生态系统,甚至限制一个国家的发展。通过收集和处理空气质量指数的时间序列数据(AQI)中国363个城市从2015年1月到2019年3月,我们致力于描述通用模式,空气质量的聚类和关联不同的城市利用复杂网络的方法和时间序列分析。主要研究结果如下:(1)利用平面最大过滤图(PMFG)法构建了中国空气质量网络(AQNC)。通过对不同城市的地理距离对空气质量相关性的研究,发现100公里是强相关性的临界距离。(2)本文用中国空气质量网络检测到七个社区,并对其模式进行分析,考虑到赫斯特指数和气候环境。研究表明,七个社区是合理的,他们明显受到气候因素的影响,如季风降水、地理区域等。(3)七个社区的空气质量时间系列的主题调查了可见性图表,一些社区,这些基序的进化模式比较稳定,并且有长期的记忆效应,而对另一些人来说,没有稳定的模式。



物理学的乐趣:

量化人类参与活动的动力学


原文标题:
The Physics of Fun: Quantifying Human Engagement into Playful Activities
地址:
http://arxiv.org/abs/1911.01864
作者: 
David Reguera, Pol Colomer-de-Simón, Iván Encinas, Manel Sort, Jan Wedekind, Marián Boguñá

摘要:从事好玩的活动,如演奏乐器、学习语言或进行有规律的运动,是人类生活的一个基本方面。我们提出了一个定量的经验分析的参与活动的动力学。通过分析数百万休闲电子游戏玩家的行为,我们发现了一个控制用户参与动态的比例法则。这种幂律-行为是乘性的表示,即“快乐-GET-快乐”。本文以一组关键指数为特征的参与机制。我们还发现,根据临界指数,在所有个体最终退出活动的标准情况和少数个体从不放弃活动的另一个阶段之间存在一个相变。我们在这项研究中发现的行为可能不仅仅局限于人类与电子游戏的互动。相反,我们认为它反映了人类如何参与具有内在回报的挑战性活动的更普遍和更深刻的行为。



局部统计、半定规划与社区检测


原文标题:
Local Statistics, Semidefinite Programming, and Community Detection
地址: 
http://arxiv.org/abs/1911.01960
作者: 
Jess Banks, Sidhanth Mohanty, Prasad Raghavendra

摘要:我们提出了一种新的半定规划松弛的层次结构来解决推理问题,该结构是由最近的平方和文献中出现的伪称化思想所激发的。作为一个测试用例,我们考虑了在一个随机规则图的分布中进行群体检测的问题。我们决定有高概率图是否来自这个模型或均匀分布在正则图推测进行计算相变点称为Kesten-Stigum (KS)阈值。研究显示,(i)层次结构的足够高的常量级别可以执行任意接近这一点的检测;(ii)我们的算法对于复杂度为o (n)的扰动是健壮的;(iii)在Kesten-Stigum之下,没有任何水平的恒定水平可以做到这一点。在研究较多的(不规则)随机块模型中,我们知道有效的算法一直存在到这个阈值,尽管当平均次数很小时,没有一种算法对图的对抗扰动具有鲁棒性。更重要的是,几乎没有复杂理论的证据表明,在Kesten-Stigum之下很难进行检测。在包含两个以上组的DRBM中,据我们所知,还没有证据证明任何算法成功达到KS阈值,更不用说有人可以稳健地做到这一点,而且在这一点以下也同样缺乏硬度的证据。我们的SDP层次是非常普遍的,适用于广泛的假设检验问题。



传染病突变的最小渗流集


原文标题:
Minimal percolating sets for mutating infectious diseases
地址:
http://arxiv.org/abs/1911.01988
作者: 
Yuyuan Luo, Laura P. Schaposnik

摘要:本文致力于研究动力系统与渗透模型之间的相互作用,以期对病毒感染的研究有所帮助。回想一下,r-bootstrap渗透描述了一个确定性的过程,在这个过程中,对于每个图的顶点,一旦其邻居被感染,它就会被感染。我们通过引入F(t)推广这个模型——这是一个依赖于时间的过程,在此过程中,需要感染的相邻顶点的数量由每次t时的渗透函数F(t)决定。对于一些基本性能的模型,我们考虑最小渗透集和构造一个算法复杂度为多项式级别的算法F(t)-bootstrap来找到一个最小渗流集。



人类冲突伤亡分布的统一认识


原文标题:
Toward a Unified Understanding of Casualty Distributions in Human Conflict
地址:
http://arxiv.org/abs/1911.01994
作者:
Michael Spagat, Stijn van Weezel, Minzhang Zheng, Neil F. Johnson

摘要:我们能够把文献中各种不同的主张和结果统一起来,而这些主张和结果妨碍了对人类冲突的统一描述和理解。首先,我们提供了整个战争和单一战争中死亡分布的数值不同指数值的调和。其次,我们解释了忽略冲突数据集如何编译的细节,如何从幂律分布拟合产生错误的负面评估。第三,我们解释了人类冲突的生成理论是如何能够提供一个定量的解释,大多数观察到的分布是如何遵循近似幂律的,以及它们是如何和为什么偏离它的。特别是,它提供了一个统一的机械论解释的起源,这些权力的法律偏差在动态过程的冲突。综合起来,我们的发现强化了一个统一的框架可以用来理解和定量描述人类冲突的概念。



基于点击率量化在线社交

网络使用目标兴趣的最佳选择


原文标题:
Click Maximization in Online Social Networks Using Optimal Choice of Targeted Interests
地址: 
http://arxiv.org/abs/1911.02061
作者:
Nathaniel Hudson, Hana Khamfroush, Brent Harrison, Adam Craig

摘要:在线社交网络平台广告投放的点击率预测是优化广告投放的重要手段。之前的工作建立了机器学习模型,在培训方面采用以用户为中心的方法——主要使用用户数据来分类用户是否会点击广告。虽然这种方法已被证明是有效的,但它对大多数实体都是不可访问的,并且严重依赖于用户数据。为了适应这一点,我们首先考虑Facebook上的一组大型广告数据,并使用自然语言处理(NLP)来提取我们称为概念节点的关键概念。为了预测概念节点组合的CTR值,我们使用广告数据来训练四种机器学习(ML)模型。然后,我们将寻找概念节点的最优组合的问题转化为一个优化问题。给定一定的预算k,我们感兴趣的是找到概念节点的最佳组合,使CTR最大化。本文讨论了优化问题的硬度和可能的np硬度。然后,我们提出一个贪心算法和一个遗传算法来寻找多项式时间内概念节点的近最优组合,遗传算法几乎匹配最优解。我们观察到决策树回归器和随机森林回归器表现出最高的Pearson相关系数w.r.t.点击预测和实际点击值。此外,我们发现“政治”、“名人”和“组织”等概念节点的影响力明显大于其他概念节点。



weg2vec:含时网络事件嵌入


原文标题:
weg2vec: Event embedding for temporal networks
地址:
http://arxiv.org/abs/1911.02425
作者: 
Maddalena Torricelli, Márton Karsai, Laetitia Gauvin

摘要:网络嵌入技术可以很好地捕捉网络中的结构规律,并识别其局部结构之间的相似性。然而,传统的网络嵌入模型是针对静态结构建立的,通常只考虑节点,当网络随时间变化时,模型受到了严重的挑战。含时网络在描述真实系统时可能具有优势,但它编码的信息更复杂,迄今为止只能用少数几种方法有效地表示。在此,我们提出一种新的时间网络事件嵌入方法,称为weg2vec,它建立在事件的时间和结构相似性的基础上,以学习时间网络的低维表示。该投影成功地捕捉了不同时间内涉及不同节点的事件之间的潜在结构和相似性,并为预测在时间结构上展开的传播过程的最终结果提供了方法。



收入不平等的尺度及其动力学来源


原文标题:
Scaling in Income Inequalities and its Dynamical Origin
地址:
http://arxiv.org/abs/1911.02449
作者:
Zoltan Neda, Istvan Gere, Tamas S. Biro, Geza Toth, Noemi Derzsy

摘要:本文对罗马尼亚(克鲁日县)连续几年的个人收入和详尽的收入数据进行了分析。当适当地考虑正常收入时,收入分配在主曲线上崩溃。贝塔最优分布适合于崩溃的数据。基于增长和重置项的主方程的动态模型成功地以自洽的方式解释了所观察到的分布,即增长和重置率是由相同的个体水平的数据来评估的。其他国家的收入分配也出现了类似的趋势。然而,主曲线的崩溃并不是完美的,这表明为了建立更现实的模型,还必须考虑特定的社会经济特征。



评估空中交通网络交互

的新中心性和因果性指标


原文标题: 
New centrality and causality metrics assessing air traffic network interactions
地址:
http://arxiv.org/abs/1911.02487
作者:
Piero Mazzarisi, Silvia Zaoli, Fabrizio Lillo, Luis Delgado, Gérald Gurtner

摘要:在ATM系统中,大量的交互实体使得很难预测创新可能产生的系统范围的影响。在这里,我们将基于基于主体的建模和复杂的网络科学,介绍Domino项目提出的方法,以评估和确定创新可能为不同的利益相关者带来的影响。通过调查美国航班的数据集,我们首先发现现有的中心性和因果性指标不适合描述系统中延误的影响。然后,我们提出适用于ATM应用程序的此类度量的概括。然后,我们将主体模型用于Domino模型场景,以此反映不同的系统创新,并改变主体的行动和行为。最后,我们专注于相关航班到达的协调模式的具体创新和突破,显示出其在通过应用所提出的新指标所获得的网络级影响。




来源:网络科学研究速递

审校:赵子鸣

编辑:张爽



声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。


近期网络科学论文速递


图半监督分类的相变和优化算法:从信念传播到卷积神经网络 | 网络科学论文速递23篇

图神经网络的鲁棒性 | 网络科学论文速递23篇

使用Chung-Lu随机图模型生成大规模无标度网络 | 网络科学论文速递20篇

网络模块性控制了信息扩散速度 | 网络科学论文速递20篇

利用网络科学量化区域投入产出网络的经济扰动 | 网络科学论文速递25篇
Network2Vec基于网络空间映射学习节点表示 | 网络科学论文速递25篇
加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存