涵化研究的两个十年:—一个总体评估和元分析?
采集数据的日期(一些研究报告数据的收集历经多年)。然后,我们对每项研究中测量电视收视的情形予以编码。我们对资料收集方式也进行编码(通常是电话访问、调查表,或者个体访谈)。编码也可以是结论所要求的因变量、自变量以及受访人群(如果有的话)。?
我们记录每一个研究结果的随机度和(或)样本量。数据报告中的自相矛盾迫使我们去评估这些情况。只要能作出合理的评估(从该研究的其他信息中),我们都尽可能去做了。在一些案例中,没有足够的信息去做这些评估。我们也记录了每一项研究结果的意义(虽然Hunter和Schmidt不认为意义是十分重要的,1990),对意义的评估级别通常只是用结论表格中的星标来注明。?
同样地,我们将样本来源的国家及样本的一般特性进行编码。例如,这使我们能够区别容易采集的大学生的样本和成人的国家概率样本,并且标明从资料中显现出的样本的理解程度和年龄段。?
在积累数据期间,当我们从每一个纳入的研究中选取结果并且进一步浓缩数据库时,我们不断地互文以使数据登录的质量更为可信。因为解释涵化结果要求较高的类型化特性,所以对自主性过强的编码员不予采用。虽然在这一层面出现编码偏见的可能性很小,我们依然认为这样做有助于使人相信更为精确的数据设置。说明这一点是重要的,这与其说是数据编码操作,还不如说是一个改写、改编的过程。不仅如此,就像亨特(Hunter)和施密特(Schmidt)(1990)提醒我们的那样,“众所周知,元分析不制造误差”(第262页)。??
涵化研究的两个十年:—一个总体评估和元分析?(第4页)
结果?
涵化结果的元分析?
就像我们曾经提到的,涵化研究在数据的独立性表述方面存在困难。虽然我们的整个数据设置包括了5,633篇有关涵化的信息,我们的元分析仍然较多地运用简化和平均的数据设置,目的是符合标准的元分析程序(通常依照Hunter和Schmidt,1990;以及Mullen,1989)。?①?
我们第一步分析选择的所有结果是:(a)“总体”结果(涉及一个整体的数据设置);(b)与暴力、性别角色、政治倾向相关的3个从属领域之一;(c)类似Pearsonrs(或者像gamma转换到rs)的测量。由此产生出52个独立样本(来自稍小一点的实际“研究”的数字,其中有些运用了多重样本),可以用来作我们的总的元分析。?
来自每一个样本的所有的系数,在转换到公制之后,被衡量并且平均以便生出一个单个的适合那个样本的r。于是这些平均系数被权衡、平均到每一个样本(有些来自单个的一组样本的研究发现有着不同的样本量),并且再一次被平均以便产生出对于平均效果的评估。?
我们的分析显示,各项涵化研究的平均总体效果大小是r=.091,k=52。这证实了大多数研究者的假设:涵化效果倾向于微乎其微。表1.2显示了这一点及我们所有的元分析结果。?
亨特和施密特(1990)认为,如果75%以上的平均效果的可见变化跨越了可被归咎于样本误差的研究,或者说如果平均效果大小至少是在零以上的两个标准偏差,那么无论何种类型的单个研究能够建议什么,“真实”效果就可以被假设“总是肯定的”。就我们的数据来看,依照他们的公式,可望只从样本误差(.000926)得出的变动是实际观察到的变动(.002321)的将近40%。这样一来,一桩讨论涵化中的变化和可重复性的好事便化为幻影——被报告的跨越了不同研究者、不同地区、不同方法的涵化差异中,大约有40%可以被去除掉,因为他们仅仅反映了样本的误差。?
这是一个“露骨的”元分析结果。假如效果测量可以被因为测量的不可信以及范围受限而修正的话(例如,一些比其他样本的视野分布较为狭隘的样本),那么这个数字还会高于40%。遗憾的是,在公开出版的文章中,几乎从来没有提供过作出这些判断所要求的信息。因此,我们可以说40%是一个保守的估计:涵化数据中被报告的变异里,至少40%是由于样本误差引起的。?
由此我们仍然不能推断涵化结果是“永远确定”的。总体的平均效果值(.091)非常接近但不完全是标准偏差的两倍(SD=.048;加倍后等于.096)。我们也不具备一个“同质的”研究结果的数据设置,就像穆伦(Mullen)建议的chi-square方法所显示的那样(1989;鳘 2=127.5,df=51,p<.001=。调节变量似乎在整个涵化中起作用,才引出了如此庞杂异类的结果。我们其余的分析都致力于从理论上探索意味深长的调节架构。?
我们对具有理论意义的、在跨越各研究的涵化结果中获得的可能产生任何差异的变量的分散数据 《涵化研究的两个十年:—一个总体评估和元分析?(第4页)》
本文链接地址:http://www.oyaya.net/fanwen/view/148946.html
我们记录每一个研究结果的随机度和(或)样本量。数据报告中的自相矛盾迫使我们去评估这些情况。只要能作出合理的评估(从该研究的其他信息中),我们都尽可能去做了。在一些案例中,没有足够的信息去做这些评估。我们也记录了每一项研究结果的意义(虽然Hunter和Schmidt不认为意义是十分重要的,1990),对意义的评估级别通常只是用结论表格中的星标来注明。?
同样地,我们将样本来源的国家及样本的一般特性进行编码。例如,这使我们能够区别容易采集的大学生的样本和成人的国家概率样本,并且标明从资料中显现出的样本的理解程度和年龄段。?
在积累数据期间,当我们从每一个纳入的研究中选取结果并且进一步浓缩数据库时,我们不断地互文以使数据登录的质量更为可信。因为解释涵化结果要求较高的类型化特性,所以对自主性过强的编码员不予采用。虽然在这一层面出现编码偏见的可能性很小,我们依然认为这样做有助于使人相信更为精确的数据设置。说明这一点是重要的,这与其说是数据编码操作,还不如说是一个改写、改编的过程。不仅如此,就像亨特(Hunter)和施密特(Schmidt)(1990)提醒我们的那样,“众所周知,元分析不制造误差”(第262页)。??
涵化研究的两个十年:—一个总体评估和元分析?(第4页)
结果?
涵化结果的元分析?
就像我们曾经提到的,涵化研究在数据的独立性表述方面存在困难。虽然我们的整个数据设置包括了5,633篇有关涵化的信息,我们的元分析仍然较多地运用简化和平均的数据设置,目的是符合标准的元分析程序(通常依照Hunter和Schmidt,1990;以及Mullen,1989)。?①?
我们第一步分析选择的所有结果是:(a)“总体”结果(涉及一个整体的数据设置);(b)与暴力、性别角色、政治倾向相关的3个从属领域之一;(c)类似Pearsonrs(或者像gamma转换到rs)的测量。由此产生出52个独立样本(来自稍小一点的实际“研究”的数字,其中有些运用了多重样本),可以用来作我们的总的元分析。?
来自每一个样本的所有的系数,在转换到公制之后,被衡量并且平均以便生出一个单个的适合那个样本的r。于是这些平均系数被权衡、平均到每一个样本(有些来自单个的一组样本的研究发现有着不同的样本量),并且再一次被平均以便产生出对于平均效果的评估。?
我们的分析显示,各项涵化研究的平均总体效果大小是r=.091,k=52。这证实了大多数研究者的假设:涵化效果倾向于微乎其微。表1.2显示了这一点及我们所有的元分析结果。?
亨特和施密特(1990)认为,如果75%以上的平均效果的可见变化跨越了可被归咎于样本误差的研究,或者说如果平均效果大小至少是在零以上的两个标准偏差,那么无论何种类型的单个研究能够建议什么,“真实”效果就可以被假设“总是肯定的”。就我们的数据来看,依照他们的公式,可望只从样本误差(.000926)得出的变动是实际观察到的变动(.002321)的将近40%。这样一来,一桩讨论涵化中的变化和可重复性的好事便化为幻影——被报告的跨越了不同研究者、不同地区、不同方法的涵化差异中,大约有40%可以被去除掉,因为他们仅仅反映了样本的误差。?
这是一个“露骨的”元分析结果。假如效果测量可以被因为测量的不可信以及范围受限而修正的话(例如,一些比其他样本的视野分布较为狭隘的样本),那么这个数字还会高于40%。遗憾的是,在公开出版的文章中,几乎从来没有提供过作出这些判断所要求的信息。因此,我们可以说40%是一个保守的估计:涵化数据中被报告的变异里,至少40%是由于样本误差引起的。?
由此我们仍然不能推断涵化结果是“永远确定”的。总体的平均效果值(.091)非常接近但不完全是标准偏差的两倍(SD=.048;加倍后等于.096)。我们也不具备一个“同质的”研究结果的数据设置,就像穆伦(Mullen)建议的chi-square方法所显示的那样(1989;鳘 2=127.5,df=51,p<.001=。调节变量似乎在整个涵化中起作用,才引出了如此庞杂异类的结果。我们其余的分析都致力于从理论上探索意味深长的调节架构。?
我们对具有理论意义的、在跨越各研究的涵化结果中获得的可能产生任何差异的变量的分散数据 《涵化研究的两个十年:—一个总体评估和元分析?(第4页)》