从零开始学统计 06 | 样本容量和有效样本容量

一、样本容量

mark

研究不同个体的表达量,样本容量(Sample size):N=3

mark

研究不同个体的表达量,样本容量(Sample size):N=3

技术重复只能告诉我们该测量基因表达的方法准确性,并不会反应个体间的区别。

mark

研究一个方法的准确性,样本容量(Sample size):N=4

二、有效样本容量

mark

假设,蓝色小人是一对双胞胎,他们有着高度相似的基因组,但很明显又是两个不同的个体。那么现在不能简单的用样本容量,需要用到有效样本容量来评价。

假设,双胞胎的相关性为0.7,有效样本容量公式:

mark

代入数值,发现相关性高,有效样本容量就会很小,也就是说,两个高相似度的样本更能看做是一个样本:

mark

计算上面的样本容量:N=3.18

假设一个很低的相关性 0.1,代入计算,会发现更接近2,更像两个样本:

mark

这种情况下,样本容量:N=3.82

致谢:

https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw

白墨石 CSDN认证博客专家 生物信息学 CSDN博客专家 知乎专栏作家
生物信息学在读博士,主要研究生信流程自动化,生物序列分析,web应用及数据库搭建。
联系方式在左栏,欢迎学习交流,咨询提问 ^.^
已标记关键词 清除标记
相关推荐
©️2020 CSDN 皮肤主题: 成长之路 设计师:Amelia_0503 返回首页