• Cox比例风险模型(cox proportional-hazards model),简称Cox模型是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为应变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型Cox模型的基本假设为:
  • 我在简书的文章写这个包的初衷就是不想频繁的点击浏览器下载,而且能够批量下载和保存。既然写了包我又想让包的使用更简单一些,这样只要有R,装好包就能用起来。能不能更简单一点呢?我思考了很久,想要偷懒的人勤奋地码起了代码。因为自己常用TCGA数据,大部分人也是如此,所以我最近首先尝试解决这个问题。Xena服务器上存储的文件虽然有一些规律,但在取名上非常混乱,我不得不寻找规律利用正则表达式进行匹配和解析并调试确保输入输出正确,并扔掉了。如果你想要看看,不妨
  • TIOBE 最新发布的 9 月编程语言排行榜中,Python 凭 4.67% 的增速以 0.26% 的优势力压 C++,逆袭成功进入 Top 3。而近一年势头不灭的 Python 在数据分析领域,是专家们的必备技能。随着 IT 行业的增长,对有经验的数据科学家的需求也水涨船高,而 Python 也一跃而成最受欢迎的语言。本文旨在介绍分析数据的基本知识,并利用 Python 创建一些漂亮的数据可视化。
  • 蛋白研究过程中,一般认为氨基酸的序列决定了蛋白的结构,结构决定功能(一般指蛋白的三维结构)。然而,近50年的研究中,有一种没有特定三维结构的蛋白不断被研究人员发现,由于这类蛋白无法折叠成稳定的三维结构而称为固有无序蛋白(intrinsically disordered regions,IDRs)。这类蛋白虽然缺乏稳定结构且高度可变,但是研究却发现他们在生物体内行驶着重要的生物学功能。尤其是最近IDRs的存在,使得蛋白更容易形成液滴状,诱发相变生成和调控的发生。还在做经典生物调控的你,如果能关联下
  • 量子霸权的实现,将是量子计算发展的一座重要里程碑,代表「量子计算的超强计算能力」自 37 年前提出以来首次从理论走进实验,标志一个新的计算能力飞跃时代的开始。近年来,随着「实现量子霸权」的日益临近,「称霸标准」成为量子计算领域最重要的科学问题之一。我国科学家最早开启了「称霸标准」问题的研究。最近,《国家科学评论》(National Science Review)以「A Benchmark Test of Boson Sampling on Tianhe-2 Supercomputer」为题正式发表了国防科
  • 整理下最近看的生存分析的资料生存分析是研究生存时间的分布规律,以及生存时间和相关因素之间关系的一种统计分析方法其主要应用领域:
  • 最近在coursera上学习R语言,本博客主要是记录本人的从作业中收获到的一些内容,希望对R语言初学者有帮助。另:因为本人也是初学,博客中难免出现错误,希望各位批评指正。这篇是关于function的一些介绍,有几个平时我没注意到的知识点在这里强调一下。[TOC]
  • 前 言在计算机视觉领域,卷积神经网络(CNN)已经成为最主流的方法,比如最近的GoogLenet,VGG-19,Incepetion等模型。CNN史上的一个里程碑事件是ResNet模型的出现,ResNet可以训练出更深的CNN模型,从而实现更高的准确度。ResNet模型的核心是通过建立前面层与后面层之间的“短路连接”(shortcuts,skip connection),这有助于训练过程中梯度的反向传播,从而能训练出更深的CNN网络。今天我们要介绍的是DenseNet模型,它的基本思路与ResNet一致,
  • 大数据文摘出品编译:Hope、臻臻、CoolBoy
  • S3泛型函数和方法在统一各个模型的使用方式上是最有用的。比如我们可以创建一个线性模型,以不同角度查看模型信息:线性模型本质上是由模型拟合产生的数据字段构成的列表,所以甚至没有明确调用S3泛型函数时,S3方法分派也会自动进行。如果我们输入
  • 除了shiny包,RStudio还开发了一个shinydashboard扩展包,它呈现数据的方式就是专门用于概览或检测数据。接下来的例子意在说明创建一个简易的仪表板非常简单,这个仪表盘可以按每周和每月的时间刻度显示CRAN上下载量最多的最受欢迎的R扩展包。数据源由