抽样技术_陕西兰德趋势市场调研咨询有限公司

兰德趋势根据多年市场研究经验的积累，总是能够为客户选择出最有效和最经济的抽样方法，并保证抽样的科学性与操作可行性最大限度的结合。

兰德趋势采用严格的抽样程序，在充分研究客户调研需求、确定访问技术个圈定调查对象的基础上，制定科学的抽样方法。根据抽样理论，兰德趋势通常采用的抽样方法包括概率抽样方法和非概率抽样方法。

兰德趋势公司经过十余年的积累，已经拥有了不同领域、不同专业、不同级别的抽样样本框，这些样本框为提高抽样准确性和有效性奠定了基础。

抽样概念

抽样是市场调查执行中重要的环节，抽样方法选择的正确与否直接决定着调查数据的可靠程度，同时也就决定了调查的成败。因此，兰德趋势总是把抽样作为调查中十分重要的环节对待，力争最大限度保证抽样的合理性和科学性。

正确的抽样必须来自对抽样概念的正确理解，下面简单介绍与抽样相关的基本术语，同时也便于我们尊敬客户的理解。

1、总体与全域

总体或全域，是指在市场调查中能提供所需信息的个人或者群体的全体。通常，在调查之前分析人员的首要任务是定义同质总体，并常常涉及到与之密切相关的产品和服务目标市场的界定。

为总体下定义是抽样调查中关键的一步，为达到市场研究目的，我们在定义调查"总体"时常常基于已有的和潜在的顾客特征。

2、抽样与普查

普查这一概念用于描述获取总体中每个成员的信息。市场调研中并不经常用到普查，因为其同质总体一般情况下包括成千上万的个体，这样大规模地进行普查在成本和时间上的耗费都是巨大的，以致于在通常情况下是不可行的。

统计学理论证明：一个相对较小、但精心选择的样本群能准确地反映出被抽查总体的特征，一个样本是总体所有成员的一个子集，从子集获得的有关信息，可以用来估测总体特征，这种方法就是抽样调查。

抽样步骤

兰德趋势如果需要完成一个具有可操作性的抽样计划大致需要下列步骤，如下所示。

1、定义总体（全域）

为了满足市场研究目标，确定可提供信息或与所需信息有关的个体或实体（所具有的特性是十分重要的。抽样总体可以从以下几方面特征进行描述：地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。在调查中，从调查问卷开始部分的过滤性问题，可以看出某个体是否属于总体。在实际应用中，即使有总体和样本清单，但仍有必要使用过滤性问题识别合格的被访问者。

另外，为了确定总体，通常情况下，还需要确定那些应排除在外的被访问者的特征。例如，大部分商业市场调查就因为一些所谓的安全性问题而排除某些个体。通常，调查问卷上的第一个问题就是询问采访对象或其家庭成员是否从事市场调查、广告或生产与调查内容有关产品的工作，如果采访对象指出他们从事其中某项工作，那么就不必要去采访他了，这就是所说的安全性问题，因为这样的采访对象不保险。他们也许是竞争对手或为竞争对手服务的。

2、选择调查方法

正如调查方法部分所描述的那样，资料收集方式对抽样过程有重要影响。例如，电话采访有一种内在优势，购物中心拦截顾客有着自身的劣势。

3、选择抽样框

兰德趋势把抽样框定义为被调查总体的数据清单（数据库或者数据仓），从抽样框中可以抽出适合访问的样本单位。兰德趋势经过多年的积累，已经拥有了适合不同调查领域的抽样框，这些抽样框，可以部分地满足一些常规性调查的需要。众所周知，一些抽样框原来根本是不存在的，因此，在调查的初期还要建立符合需要的抽样框。

4、选择抽样方法

制定抽样计划的第四步是选择抽样方法。选择哪种抽样方法取决于研究目的、研究经费、时间限制、需调查问题的性质等。可供选择的重要抽样方法可以分为两大类：概率抽样与非概率抽样，每大类中又有许多可供选择的具体方法。

5、确定样本量

一旦选定抽样方法，下一步就要确定合适的样本量。样本量的确定方法将在样本量确定单元中给出。

6、制定抽样计划

无论使用概率或非概率抽样，在一个研究项目的资料收集阶段必须指定和明确选择样本单位的操作程序。对于成功的概率抽样的来说，这个程序更为重要，必须详细、清晰。若不能知道合适的选择样本单位的操作程序，则整个抽样程序会陷入困境。

7、抽样计划的实施

在实施适于操作的抽样计划前，应先对其进行讨论研究。这一步很重要，它包括检查、确定是否要根据拟好的详细程序来实施计划。

样本量确定

确定样本的数量是抽样调查中的重要环节，在充分满足调查内容要求情况下合理的确定样本量不能不说是摆在每个调查公司面前的重要课题，过多的样本量设计只会给客户增加经济负担，对兰德趋势来讲，我们确定样本量的原则是：一是达到调查目的，二是为客户节省经费。

概率抽样的基本原则是：样本量越大，抽样误差就越小，而样本量越大，成本就越高。根据数理统计规律，样本量增加呈直线递增的情况下（样本量增加一倍，成本也增加一倍），而抽样误差只是样本量相对增长速度的平方根递减。因此，样本量的设计并不是越大越好，通常会受到经济条件的制约。

通常，在概率抽样的情况下，兰德趋势在确定样本量时会遇到如下情况：

预算：预算的多少直接影响着调查样本量的设计，通常某一项调查为满足调查要求必须有一个最低的预算指标。如果低于这个指标的预算，不能满足调查最低精度的话，兰德趋势建议要放弃这项调查任务。

经验：一些客户会经常要求调查公司完成200、300、400等特定的样本量。这种样本量确定的方法一方面可能考虑了调查误差，另一方面也可能是凭着以前的调查经验。在这种情况下，如果兰德趋势认为样本量的设计不能满足精度要求的时候，我们的项目经理会建议所需要增加的样本量，否则调查的结果会出现偏差。

子群分析：在任何样本量确定的过程中，都必须考虑被调查样本的子群数。也就是说，当被调查样本群子群数比较多的时候，样本量就必须相应扩大。如：某一项调查400个样本量是基本满足要求的，但如果将这些样本量划分为男和女各占50%的话，那么，每个子群只有200个样本。如果进一步按年龄组细分的话，假设是两个年龄组，那每一个子群只有100个样本，这样的样本量就不能满足最初设计的要求了，因此必须按照子群要求设计样本量则是最合理的。

统计分析：兰德趋势在确定样本量时通常在考虑上述具体情况下，会考虑如下统计方面的因素，即：总体调查标准差；抽样允许的误差和预期置信度。

样本量确定公式：在充分考虑所有统计因素基础上，兰德趋势通常采用的简单随机抽样（特别是估计平均值时）的公式为：

在解决"比例"方面的调查问题时，兰德趋势所采用的抽样公式为：

概率抽样方法

概率抽样概念

定量市场调查中的概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。在实际应用中，概率抽样方法是兰德趋势最常用的方法之一。

简单随机抽样

简单随机抽样是一种广为使用的概率抽样方法。是最完全的概率抽样。如前面提到的，随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。

在简单随机抽样条件下，抽样概率公式为：

抽样概率＝样本单位数ㄍ总体单位数

例如，如果总体单位数为10000，样本单位数为400，那么抽样概率为4%。

等距抽样

在定量抽样调查中，等距抽样常常代替简单随机抽样。由于该抽样方法简单实用，所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。

等距抽样的基本做法是，将总体中的各单元先按一定的顺序排列、编号，然后决定一个间隔，并在此间隔基础上选择被调查的单位个体。

样本距离可通过下面公式确定：

样本距离=总体单位数ㄍ样本单位数

例如，假设你使用本地电话本并确定样本距离为100，那么100个中取1个组成样本。这个公式保证了整个列表的完整性。

等距抽样方式随意用一个起点，例如，如果你把一本电话本作为抽样框，必须随意取出一个号码决定从该页开始翻阅。假设从第5页开始，在该页上再另选一个数决定从该行开始。假定选择从第3行开始，这就决定了实际开始的位置。

分层抽样

定量调查中的分层抽样是一种卓越的概率抽样方式，在兰德趋势以往的调查中经常被使用。

分层抽样的具体程序是：把总体各单位分成两个或两个以上的相互独立的完全的组（如男性和女性），从两个或两个以上的组中进行简单随机抽样，样本相互独立。

分层抽样与简单随机抽样相比，我们往往选择分层抽样，因为它有显著的潜在统计效果。也就是说，如果我们从相同的总体中抽取两个样本，一个是分层样本，另一个是简单随机抽样样本，那么相对来说，分层样本的误差更小些。另一方面，如果目标是获得一个确定的抽样误差水平，那么更小的分层样本将达到这一目标。

整群抽样

以上各种抽样类型全部是按单位抽取的，即按样本单位数，分别一个单位一个单位地抽取。在整群抽样中，样本是一组单位一组单位地抽取。

整群抽样有两个关键步骤：

» 同质总体被分为相互独立的完全的较小子集。

» 随机抽选子集构成样本。

如果调查者在抽中的子集中观察全部单位，我们就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位观察，我们就有了二级整群样本。分层和整群抽样都要将总体分为相互独立的完全子集。它们的区别是，分层抽样的样本是从每个子集中抽取，而整群抽样则是抽取部分子集。

地理区域抽样是整群抽样的典型方式。挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域，较集中地访查一些群体，大量减少访问时间和经费。整群抽样被认为是概率抽样技术，因为它随机抽出群和随机抽出单位。值得注意的是，在整群抽样下，我们假定群中单位与总体一样存在异质性。如果一群中单位的特征非常相似，如果由于共同环境使群内差异小而群与群之间差异大。一般来说，要解决这个问题可以扩大群数，然后从各群中抽取少量单位数，以保证样本的代表性。

非概率抽样方法

非概率抽样的概念

非概率抽样也是市场调查中比较常采用的手段之一，如配额抽样等。非概率抽样是指从总体中非随机地选择特定地要素（单位）。有目的的非随机抽样可能会系统地排除或过分强调总体的某些部分特征。

在实际工作中，我们经常使用的非概率抽样方法包括四类：方便抽样、判断抽样、配额抽样和滚雪球抽样。

方便抽样

方便抽样是根据调查者的方便性，以无目标、随意的方式进行的抽样调查活动。例如，常见的无限制的街头拦访和随意的入户访问就是方便抽样的常见形式。在某些调查测试中，方便抽样会取得快速有效的结果。在进行探索性调研时，即缺乏经验而又急需真实数据的近似值时，这种方法也很实用。

判断抽样

判断抽样适用于调查员或者调查专家基于选择标准或者条件抽取典型样本的情况。一般商业机构进行的市场或产品测试调查基本上都属于判断抽样的范围。在进行探索性调研时，如抽取深度访谈样本的情况下，就可以采用这种方法。

配额抽样

配额抽样是根据一定标志对总体分层或分类后，从各层或各类中主观地选取一定比例的调查单位的方法。所谓"配额"是指对划分出的总体各类型都分配给一定的数量而组成调查样本。因而，配额抽样较之判断抽样加强了对样本结构与总体结构在"量"的方面的质量控制，能够保证样本有较高的代表性。配额抽样类似于随机抽样中的分层抽样。不过，有两点重要的区别：首先，配额抽样的被调查者不是按随机原则抽出来的，而分层抽样必须遵守随机原则。其次，在分层抽样中，用于分类的标志，应联系研究目标来选择，而配额抽样无此要求。

滚雪球抽样

滚雪球抽样是指先对随机选择的一些被调查者实施访问，然后再请他们推荐属于研究目标总体特征的调查对象。这种方法用于低发生率或少见的总体中进行抽样，因为要找到这些少见的个体，代价是很大的，使得调查人员因为费用的原因不得不使用类似滚雪球这样的抽样技巧。

抽样误差

首先，任何调查所获信息（调查数据）质量都存在误差，而这种误差在评估调查质量时都是必须的，作为调查管理者必须判断这些结果的精度范围。因此，这就需要仔细研究所使用的调研方法可能导致的误差类型。

综合市场调查理论和实践经验，兰德趋势对调查中出现的误差做如下的概况。

1、抽样误差

抽样过程中主要存在着以下两类误差：随机误差和系统误差。有时也称为偏差。调查中通常试图对目标总体中具有代表性的一个侧面进行调查而获得信息。它旨在根据抽取样本的调查结果而推测总体的情况。因此，即使样本选择过程是适当的，调查结果仍不免因偶然性而产生一定的误差（随机误差或随机抽样误差），这种误差是不可避免的，它只能随着抽样规模的增加而减小。通常在样本量设计时，我们可以以一定的置信水平来估计随机抽样的误差。

2、系统误差

系统误差或偏差是指因调研设计或实施抽样设计中的错误或问题而产生的误差。如果抽样的结果与我们根据被调查对象的真实值所做的估计值总是有一定的偏差（固定的偏高或偏低），则抽样结果便很有可能存在系统误差。系统误差包括除随机抽样之外所有可能产生的误差。因此，有时系统误差又被称为非抽样误差，从系统上影响抽样调研的结果。非抽样误差分为样本设计误差和测量误差。样本设计误差是因样本设计或样本抽选过程而产生的误差。

样本设计误差的产生有多种原因：

抽样框误差——抽样框是指对于某一类人口类型和成员的一个总体清单。样本将从这个总体清单中加以选取。抽样框误差便是因不准确或不完整的抽样框而引起的误差。问题是，从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标的实际情况，这就存在抽样框误差。举个例子，以电话号码薄作为抽样框，在对某地区所有住户进行的某种意向调查时，就存在着抽样框误差。

调研对象范围误差——调研对象范围误差是因为对调研对象范围限定的不准确而引起的误差。例如将某项研究对象限定在35岁以上，后来发现不少35岁以下的年轻人也应该包含在这个研究之中，即当初的限定范围是不正确的，这样的抽样便产生了误差。

选样误差——即使抽样框的组建与调研对象范围的确定都没有什么问题，抽样误差也有可能发生。抽选误差是因为不完整或不恰当的抽选过程，或者正确的抽选过程未得以恰当的执行而产生的误差。例如在入户调查时，访问员会因为不同的原因绕开被认为是"不友好的"住户，这样的话便会产生选样误差。特别是在非随机抽样中，选样误差是一个更为严重的问题。

3、测量误差

测量误差对于抽样调查的准确性来说，比随机误差更具危害性。在许多调查报告中，包括媒介上发布公众意向调查，都会给出一个误差指数。对很多调研报告使用者来说，一般认为这个指数是针对总体误差而言，其实并非如此。这个数字仅代表随机抽样误差，它并不包括样本设计误差，也没有涉及调研结果中的测量误差。

测量误差是指所获得的原始信息（实际价值）与经测量处理的信息之间的差异。在信息处理过程中会因多种因素而产生测量误差。

替代信息误差——是指实际所需的信息与调研者所收集信息之间的差距而产生的误差。这种误差与调研设计的主要问题有关，特别是对一些问题不恰当定义而产生的。

调研员误差——是指因调研员与被调研者之间的相互作用而引起的误差。调研员有时会自觉或不自觉地影响被调研者，使之给出不真实或不准确的回答。

测量工具误差——测量工具误差是指因测量工具或问卷而产生的误差。这种误差是由于所提出的问题或问卷设计中的某些因素而导致回答的偏差或者使回答时容易产生错误。这种类型的错误能够通过细致的问卷修改和在实地调研前进行充分的试调查而加以避免。

数据处理误差——主要是指调研资料或调研数据在向计算机输入过程中所产生的误差。例如，在计算机辅助电话访谈中，访问员可能错误地输入某个问题的答案。这类错误可以通过在数据录入以及调研结果处理过程中严格的质量控制加以避免。

拒访误差——如果从某个特定群体中抽选400个样本，理想的情况是对这400个样本都进行调查。而在实际中，这是很难实现的。比如在邮寄调研中，回答率一般在5%左右，甚至更低。因这种差异而引起的误差被称为"拒访误差"。很明显，回答率越高，拒访误差的影响便越小，因为拒访者在总体中占的比例减小了。

拒访误差在以下三种情况下发生：①在特定时间无法联系到被访者；②虽然得到了默许，但在当时的环境下不能或不愿意接受访谈；③虽然能够联系到被访者，但被访者拒绝接受访问。其中，最后一种情况最为严重。因为，前两种情况都有重新进行调研的可能。现在，拒访率已经达到了前所未有的水平，大约近40%。好在大部分人并非在所有情况下都拒绝访问。

回答误差——如果被访问者在某一特定问题的回答中有特定的偏向，则产生回答误差。回答误差的产生有两种基本的形式：有意错误与无意错误。有意错误的产生是因为被调查者故意对所提问题做出不真实回答；无意错误是指回答者希望能够做出真实、准确的回答，但却给出了不正确的答案。这种类型的误差可能是由于问题的格式、内容或其他原因造成的。

调研方法