样本含量,就是在一项调查或研究中,被纳入的个体数,有时称其为受试对象的个数或样本大小。在一项具体的调查或实验研究中,究竟应该用多大的样本含量合适呢?一般来说,若从严格定义的总体中随机抽样,样本含量越大越好。但事实上,这样做是行不通的。因为样本越大,所需的精力、人力和物力都会很大,需要的时间很长。样本含量过小,也不妥当。因为人们研究的问题往往比较复杂,观测的指标常带有变异性。要想反映带有变异性的指标(常称其为随机变量)的变化规律性,必须在相同的实验条件下进行多次独立地重复实验,才有可能使随机变量的规律性真实地显露出来。 如何确定合适的样本含量 很多临床医师经常问这样的问题:开展一项临床研究,应选择多少病例合适?面对这个貌似“简单问题”,任何一个统计学家都将瞠目结舌,因为这是一个无法准确回答的问题。估计合适的样本含量,需涉及以下方面: ①拟开展研究的类型。通常分为调查研究、实验研究或临床试验研究;②研究中将涉及到的因素的个数及其水平数的多少。一般来说,单因素研究中样本含量估计相对容易,多因素研究中样本含量估计较难,有时甚至无法估计;③观测的效应指标的性质。若效应指标为定量的(如比较平均值),则所需样本含量较小;若效应指标为定性的(如比较率或比例),则所需样本含量较大;④必不可少的前提条件。如研究者需提出某些精确度要求,并提供某些先验知识,方可进行估计。所谓精确度要求,通常指事先规定允许犯假阳性(有时称为Ⅰ型)错误的概率α、检验功效或把握度1-β[这里β为允许犯假阴性(即Ⅱ型)错误的概率]。α定得越小,1-β定得越大,所需样本含量就越大。所谓先验知识,就是根据专业知识、文献资料或预试验结果获得的由样本推断总体的一些信息,如:已知δ(最大容许误差或有临床意义的差值,δ越小,所需样本含量就越大)、σ(标准差,标准差越大,所需样本含量就越大)等;⑤研究结果将应用的范围。假定要制定临床上某定量指标的正常值范围,若此正常值范围仅用于一个较小的人群(如某城市),则所需要的样本含量就可以小一些,若此正常值范围将用于一个很大的人群(如全国),则所需要的样本含量就相当大,否则,其代表性就很差。 样本含量不足实例解析 实例某研究者为了证明A(HP-1000型超声诊断仪)、B(研究者自制的成像系统)两台仪器测定的结果无差别,作了如下的实验设计:选1名健康人作为受试对象,用A、B两台仪器前后2次(间隔为1个月)对此人分别重复测定4次,观测的定量指标分别是:①二尖瓣前叶EC幅度(E峰至C峰间距);②左室后壁运动幅度;③R-R间期。数据处理方法是:每个指标下有4组数据,既作了方差齐性检验,又作了配对比较的t检验,P值均大于0.1。结论:两台仪器的测定结果无差别,可用自制的成像系统取代费用很高的同类进口仪器。 差错辨析与释疑:要得出2台仪器测定结果的差别无统计学意义的结论,仅凭对1个健康受试者4次重复测定数据进行比较,证据不足。因为在实际操作中,每台仪器每天要测定多个受试者,由于不同受试者之间存在的个体差异,2台仪器对某1个人的测定结果差别无统计学意义,并不能推出在多数人身上测定的结果差别也一定无统计学意义。这是用“个案”取代一般规律的生动实例。 该研究涉及3个因素,其中1个是实验因素(即仪器),另外2个是区组因素(即测定时间和受试对象),故应选用交叉设计安排实验。若重复测定的结果之间变异度较小,样本含量n=6~8即可。反之,n应取10例或更多一些为宜。若从文献上查到交叉设计样本含量估计公式,按公式计算出n值,则更为妥当。 组间样本含量相差悬殊 实例解析 实例原文题目:健康儿童血清透明质酸(HA)水平。原作者系统观察了0~7岁健康儿童HA与年龄的关系,得出健康儿童血清HA含量与年龄之间呈密切负相关(r=-0.8169,P<0.01)。资料见表。 差错辨析与释疑:该研究虽然样本含量较大,共有668名,但在各个分组中,各组样本含量差异很大,7岁健康儿童数是新生儿的7倍,违反了实验设计的均衡性原则。 该研究应使各年龄组的例数基本达到均衡状态,严格遵循实验设计的均衡原则会加大研究结果的可靠性。另外,是否有理由保证除“年龄”因素外,没有其他因素对“指标HA”有影响?若不能保证,年龄大的儿童有较多机会接触其他某些因素,可能也导致“指标HA数值的降低”,这样,组间的不均衡性可能更大。在对数据进行统计处理时,还应使用原始数据直接进行统计分析,不应对资料进行分组后再做分析,这样会丢失很多有用的信息。
表668名健康儿童血清HA水平
年龄例数(男/女) HA(x±s,ng/ml) 新生儿37(20/17) 778±170 1个月41(21/20) 554±120 3个月47(22/25) 483±88 6个月55(25/30) 365±79 1岁- 56(31/25) 282±76 3岁- 79(42/37) 215±46 5岁- 111(57/54) 115±46 7岁242(122/120) 89.4±45.8 军事医学科学院生物医学统计咨询中心胡良平 摘自《中国医学论坛报网》 !-- content_end> |