1、流行病学第一章 绪论1.流行病学(epidemiology):是研究人群中疾病与健康状况的分布及其影响因素 ,并研究防制 疾病及促进健康的策略和措施的科学。2.流行病学定义的诠释:三个层次:疾病、伤害、健康 ;三个阶段:揭示现象 、找出原因 、提供措施 ;三 个范畴:描述、分析、实验 ;三种方法:观察法、实验法、数理法 ;三大要素:原理、 方法、应用。3.流行病学的基本原理:疾病与健康在人群中的分布 ,包括疾病的流行现象 ;疾病的发病过程 ,其中涵盖了 机体的感染过程和传染病的流行过程;人与环境的关系,即疾病的生态学;病因论,特 别是多因论;病因推断原则;疾病防制的原则和策略,包括疾病的三级预
2、防;疾病发 展的数学模型。4.流行病学的实际应用【2021 论述】:疾病预防和健康促进 ;疾病的监测 ;疾病病因和危险因素的研究 ;疾病的自然 史 ;疾病防治的效果评价。5.流行病学的特征:群体的特征;对比的特征(核心);概率论和数理统计学的特征;社会心理的特征;预防为主的特征 ;发展的特征。6.流行病学的研究方法【2021 论述】:观察法描述流行病学现况研究、监测、生态学研究产生假设分析流行病学病例对照研究(产生、检验假设)、队列研究检验假设实验法实验流行病学临床试验、现场试验(个体、社区)验证假设数理法理论流行病学第二章 疾病的分布第一节 疾病频率测量指标一、发病频率测量指标1.发病率(i
3、ncidence rate):是指一定期间内 ,一定范围人群中某病新发生病例出现的频率。 发病率=一定时期内某人群中某病新病例数/同期该人群暴露人口数K计算发病率需要考虑的因素:新发病例数 ;暴露人口数 ;观察时间。 分母中不包括具有免疫力和现患病而不会发病的人。2.罹患率(attack rate): 也是测量某人群某病新病例发生频率的指标 ,通常指在某一局限范围 短时间内的发病率 ,如食物中毒。罹患率=观察期间某病新病例数/同期暴露人口数K3.续发率/二代发病率(secondary attack rate,SAR):指某些传染病最短潜伏期到最长潜伏期之 间 ,易感接触者中发病人数占所有易感接
4、触者总数的百分比 。【2021 名词解释】续发率=潜伏期内易感接触者中发病人数/易感接触者总人数100% 二、患病频率测量指标1.患病率/现患率(prevalence):是指某特定时间内总人口中某病新旧病例所占的比例。 时点患病率=某一时点某人群中某病新旧病例数/该时点人口数K期间患病率=某观察时间某人群中某病新旧病例数/同期的平均人口数K患病率增加:新病例增加 ;诊疗水平提高 ,病人免于死亡 ,但未痊愈 ,病程延长 ; 未治愈者的寿命延长;病例迁入;健康者迁出;易感者迁入;诊断水平提高; 报告率提高。1患病率减少:新病例减少 ;病死率增高 ;病程缩短 ;治愈率提高 ;健康者迁 入 ;病例迁出
5、。发病率与患病率的区别分类发病率患病率资料来源疾病报告、疾病监测、队列研究现况调查、筛检等计算分子观察期间新发病例数观察期间新发病例和现患病例之和计算分母暴露人口数或平均人口数调查人数(时点) 、平均人口数(期间)观察时间一般为 1 年 ,或更长时间较短 ,一般为 1 个月或几个月适用疾病种类各种疾病慢性病或病程较长疾病特点动态描述静态描述用途疾病流行强度疾病现患状况或慢性病流行情况影响因素相对少,疾病流行情况、诊断水 平、疾病报告质量等较多 ,影响发病率变动的因素 ,病后结局 及病人病程等当某地某病的发病率和该病的病程在相当长时间内保持稳定时:患病率=发病率病程。 2.感染率(prevale
6、nce of infection): 是指在某时间内被检人群中某病原体现有感染者人数所占 的比例 。为估计某病的流行态势和制定防制措施提供依据 。传染病。感染率=受检者中感染人数/受检人数100%三、死亡与生存频率测量指标1.死亡率(mortality rate): 表示在一定期间内 ,某人群中总死亡人数在该人群中所占的比例, 是测量人群死亡危险最常用的指标 。还可作为疾病发生风险的指标。死亡率=某人群中某年总死亡人数/该人群同年平均人口数K2.病死率(case fatality rate):表示一定时期内因某病死亡者占该病病人的比例,表示某病病人 因该病死亡的危险性 。说明疾病对人群生命威胁
7、程度的指标。病死率=某时期内因某病死亡人数/同期某病的病人数100% 死亡率与病死率的区别死亡率病死率分子某人群某年总死亡人数某时期内因某病死亡人数分母该人群同年平均人口数(病人和非病人)同期某病的病人数(所研究疾病病人)性质频率比例3.生存率(survival rate): 指接受某种治疗的病人或某病病人中 ,经 n 年随访尚存活的病人数 所占的比例。生存率=随访满 n 年尚存活的病例数/随访满 n 年的病例数100% 各指标的专率和标准化率:2直接法的计算:以年龄别人口数作标准时:以年龄别人口构成比作标准时:是期望死亡N 为标准年龄别人口数 , D 为实际年龄别死亡率 , N 为标准人口总
8、数,数 。W为标准化死亡比(SAR)。标准总死亡率 与 SMR 的乘积即得间接法的标准化死亡率。间接法的计算:以年龄别死亡率作标准: 为标准总死亡率 , r 为实际总死亡数 , n 为实际年龄别人口数 , P 为标准年龄别死 亡率。四、疾病负担指标1.潜在减寿年数(potential years of life lost ,PYLL): 是某病某年龄组人群死亡者的期望寿命与 实际死亡年龄之差的总和 , 即死亡所造成的寿命损失。式中: e 为预期寿命(岁) ; i 为年龄组(通常计算其年龄组中值) ; a 为剩余年龄 ,a.=e-(i+0.5) ; d 为某年龄组的死亡人数。2.伤残调整寿命年(
9、disability adjusted life year ,DALY): 是指从发病到死亡所损失的全部健康 寿命年 ,包括因早死所致的寿命损失年(YLL)和疾病所致伤残引起的健康寿命损失年(YLD) 两部分。第二节 疾病流行强度1.散发(sporadic): 指发病率呈历年的一般水平 ,各病例间在发病时间和地点上无明显联系, 表现为散在发生 。确定散发时多与当地近三年该病的发病率进行比较。散发常见于如下情况:病后免疫力持久的疾病,或因预防接种使人群维持一定免疫水平的疾病常呈散发,如麻疹。 有些以隐性感染为主的疾病 ,常以散发形式存在 ,如脊髓灰质炎、乙型脑炎等。有些传播机制不容易实现的传染病
10、也可出现散发 ,如斑疹伤寒、炭疽等。 某些长潜伏期传染病也以散发形式存在 ,如麻风。2.暴发(outbreak):是指局部地区或集体单位 ,短时间内突然发生很多症状相同病人的现象。 多有相同的传染源或传播途径 。大多数病人常同时出现在该病的最短和最长潜伏期之间。3.流行(epidemic):是指在某地区某病的发病率显著超过该病历年发病率水平。流行出现时各 病例之间呈现明显的时间和空间联系 。存在共同的传播因素。4.大流行(pandemic): 某病发病率显著超过该病历年发病率水平 ,疾病蔓延迅速 ,涉及地区 广 ,在短期内跨越省界、国界甚至洲界形成世界性流行。第三节 疾病的分布疾病分布是流行病
11、学研究中重要的内容 ,是描述性研究和核心 ,是分析性研究的基础, 是制定疾病防制策略和措施的依据。一、人群分布年龄、性别、职业、种族和民族、婚姻与家庭、行为生活方式、流动人口、宗教信仰 。 1.横断面分析(cross-sectional analysis):主要分析同一时期不同年龄组或不同年代各年龄组的 发病率、患病率或死亡率的变化 ,多用于某时期传染病或潜伏期较短疾病的年龄分布分析。 不同年代相同年龄组人群的发病率不同 ; 同一时期各年龄组人群肺癌的发病率不同。2.出生队列分析(birth cohort analysis): 同一时期出生的一组人群称为出生队列 ,随访若干年, 观察发病情况
12、。利用出生队列资料将疾病年龄分布和时间分布结合起来描述称出生队列分 析。在评价疾病的年龄分布长期变化趋势及提供病因线索等方面有很大意义。明确呈现致病 因子与年龄的关系 ,有助于探明年龄、所处时代暴露特点及经历在疾病频率变化中的作用。P23 、24 页 ,横断面分析和出生队列分析 。【2019 论述】3二、地区分布国家间及国家内不同地区的分布、城乡分布、地区聚集性(地方性、输入性疾病)、地方性 疾病。1.地方性:统计地方性 ;自然地方性 ;自然疫源性。2.输入性/外来性疾病:凡本国或本地区不存在或已消灭的传染病,从国外货其他地区传入时, 称为输入性疾病。3.判断一种疾病是否属于地方性疾病的依据:
13、该地区的居民发病率高 ;其他地区居住的人群发病率低 ,甚至不发病 ;迁入该地 区一段时间后,其发病率和当地居民一致;迁出该地区后,发病率下降,患病症状减轻或 自愈 ;当地的易感动物也可发生同样的疾病。三、时间分布1.短期波动(rapid fluctuation):一般是指持续几天、几周或几个月的疾病流行或疫情暴发,是 疾病的特殊存在方式 。暴发常用于少量人群 ,而短期波动常用于较大数量的人群。2.季节性(seasonal variatio ,seasonality):疾病在一定季节内呈现发病率增高的现象。季节性有以下两种表现形式:严格的季节性: 流行性乙型脑炎 ;季节性升高:肠道 传染病 ,夏
14、秋季。3.周期性(cyclic variation,periodicity):指疾病频率按照一定的时间间隔,有规律的起伏波动, 每隔若干年出现一个流行高峰的现象。影响疾病周期性及间隔时间的常见原因:人口密集、交通拥挤和卫生条件差等因素利于疾病的传播。当有传染源和足够数量的易感 者存在 ,又无有效的预防措施时 ,其流行特征呈现一定的周期性。传播机制容易实现的疾病,当易感者积累到足够数量便可迅速传播。而疾病流行后,新的 易感者积累的速度,特别是新生儿的增加,影响疾病周期间隔的时间,累积速度越快,间隔 越短。病后可形成稳固免疫的疾病,一度流行后发病率可迅速下降,流行后人群免疫水平持续时 间越久 ,周
15、期间隔越长。病原体变异及其变异的速度 ,是影响疾病周期性间隔时间的重要因素。4.长期趋势/变异/变动(secular trend,secular change):是指在一个比较长的时间内,通常为几 年或几十年 ,疾病的临床特征、分布状态、流行强度等方面所发生的变化。长期趋势的出现主要原因有:病因或致病因素的变化 ;病原体的变异 ;机体免疫 状况的改变 ;医疗和防制水平的提高 ;报告及登记制度完善程度。四、疾病的人群、地区、时间分布的综合描述移民流行病学(migrant epidemiology): 是进行疾病人群、地区和时间分布综合描述的一个 典型,是探讨疾病病因的一种方法。它是通过观察疾病在
16、移民、移居地当地居民及原居地人 群间的发病率或死亡率的差异,从而探讨疾病的发生与遗传因素或环境因素的关系。常用于 肿瘤、慢性病及某些遗传病的病因和流行因素的探讨。移民流行病学应遵循的原则:(1)若某病发病率或死亡率的差别主要是环境因素作用的结果,则该病在移民人群中的发病率 或死亡率与原住国(地区)人群不同 ,而接近移居国(地区)当地人群的发病率或死亡率。(2)若该病发病率或死亡率的差别主要与遗传因素有关,则移民人群与原住国(地区)人群的发 病率或死亡率近似 ,而不同于移居国(地区)当地人群。4第三章 描述性研究第一节 概述1.描述性研究(Descriptive Study):是指利用常规监测记
17、录或通过专门调查获得的数据资料(包 括实验室检查结果) ,按照不同地区 、不同时间及不同人群特征分组 ,描述人群中有关疾病 或健康状态以及有关特征和暴露因素的分布情况,在此基础上进行比较分析,获得疾病三间 (人群、地区和时间)分布的特征 ,进而获得病因线索 ,提出病因假设。2.种类:现况研究;病例报告:罕见病;病例系列分析:一组相同疾病;个案研究: 发病现场 ;历史资料分析 ;随访研究 ;生态学研究。3.特点:描述性研究以观察为主要研究手段,不对研究对象采取任何干预措施 。描述性 研究中,其暴露因素的分配不是随机的,且在研究开始时一般不设立对照组。暴露与结局 的时序关系无法确定,对于暴露与结局
18、间关系的因果推断存在一定的局限性,仅可做一些初 步的比较性分析 ,但可为后续的分析性或实验研究提供线索。4.用途:描述疾病或者健康状况的分布及发生发展的规律。获得病因线索 ,提出病因假设。第二节 现况研究1.现况研究:是通过对特定时点(或期间)和特定范围内人群中的疾病或健康状况与有关因素 的分布状况的资料收集、描述,从而为进一步的研究提供病因线索。从时间上来说,现况研 究收集的是某特定的时间断面的资料,故又叫横断面研究(cross-sectional study)。从观察分析 指标来说,由于这种研究所得到的频率指标一般为特定时间内调查群体的患病率,故称之为 患病率研究(prevalence s
19、tudy)。2.特点:现况研究一般在设计阶段不设对照组;现况研究的特定时间;现况研究在确 定因果联系时受到限制;对研究对象固有的暴露因素可以作因果推断;现况研究用现在 的暴露(特征)来替代或估计过去情况的条件 ;现况研究定期重复进行可获得发病率资料 。 3.类型:(1)普查/全面调查(census): 是指在特定时点或时期内、特定范围内的全部人群(总体)作为研 究对象的调查。目的:早期发现 、早期诊断和早期治疗病人 ;了解慢性病的患病及急性传染性疾病 的疫情分布 ;了解当地居民健康水平 ;了解人体各类生理生化指标的正常值范围。优点:调查对象为全体目标人群 ,不存在抽样误差 ;可以同时调查目标人
20、群中多种 疾病或健康状况的分布情况;能发现目标人群中的全部病例,在实现“三早 ”预防的同时, 全面地描述疾病的分布与特征 ,为病因分析研究提供线索。缺点:不适用于患病率低且无简便易行诊断手段的疾病;工作量大,因此不易细致, 难免存在漏查;调查工作人员涉及面广,掌握调查技术和检查方法的熟练程度不一,对调 查项目的理解往往很难统一和标准化,较难保证调查质量;耗费的人力、物力资源一般较 大 ,费用往往较高。(2)抽样调查(sampling survey):指通过随机抽样的方法,对特定时点、特定范围人群的一个代 表性样本进行调查,以样本的统计量来估计总体参数所在范围,即通过对样本中的研究对象 的调查研
21、究来推论其所在总体的情况。优点:节省时间、人力和物力资源 ;由于调查范围小 ,调查工作易于做得细致。缺点:抽样调查的设计 、实施与资料分析均比普查要复杂 ;资料的重复或遗漏不易 被发现;对于变异过大的研究对象或因素和需要普查普治的疾病则不适合用抽样调查; 患病率低的疾病也同样不适合用抽样调查 , 因为需要很大的样本量。4.用途:掌握目前群体中疾病或健康状况的分布;提供疾病病因研究的线索;确定高 危人群 ;评价疾病监测、预防接种等防治措施的效果。55.设计与实施:(1)确定研究目的 ;(2)明确研究的类型 ;(3)确定研究对象 ;(4)确定样本量和抽样方法 ;(5) 资料收集 ;(6)数据整理与
22、分析。决定现况研究的样本量大小的因素:预期现患率(p);容许误差(d);显著性水平(); 资料的性质 ,定量还是定性资料 ;抽样方法。定性资料,d=0.1p,=0.05,Z1-/2=1.962,n p5 时,n=400q/p;n p5 时,Poisson 分布。计量资料 ,n=4s/d。q=1-p ,Z1-/2 为显著性检验的统计量 ,n 为样本量。抽样误差:整群抽样单纯随机抽样系统抽样多阶段抽样分层抽样1)单纯/简单随机抽样(simple random sampling): 是最简单 、最基本的抽样方法 。从总体 N 个 对象中 ,利用抽签或其他随机方法(如随机数字)抽取 n 个 ,构成一个
23、样本 。它的重要原则是 总体中每个对象被抽到的概率相等(均为 n/N)。优点:简便易行。缺点:往往由于总体数量大,编号、臭氧麻烦以及抽到个体分散二导致资料收集困难等。 2)系统/机械抽样(systematic sampling): 是按照一定顺序 ,机械地每隔若干单位抽取一个单位 的抽样方法。设总体单位数为 N,需要调查的样本数 n,则抽样比为 n/N,抽样间隔为 K=N/n。 每 K 个单位为一组 ,然后用单纯随机方法在第一组中确定一个起始号 ,从此起始点开始 , 每隔 K 个单位抽取一个作为研究对象。优点:可以在不知道总体单位数的情况下进行抽样 ;在现场人群中较易进行 ;样本是从 分布在总
24、体内部的各部分的单元中抽取的 ,分布比较均匀 ,代表性较好。缺点:假如总体各单位的分布有周期性趋势,而抽取的间隔恰好与此周期或其倍数吻合, 则可能使样本产生偏性。3)分层抽样(stratified sampling): 是指先将总体按某种特征分为若干次级总体(层) ,然后再从 每一层内进行单纯随机抽样,组成一个样本。分类:按比例分配分层随机抽样:各层内抽 样比例相同 ;最优分配分层随机抽样:各层抽样比例不同 , 内部变异小的层抽样比例小, 内部变异大的层抽样比例大 ,此时获得的样本均属或样本率的方差最小。优点:每一层内个体变异越小越好 ,层间变异则越大越好 ;能保证总体中每一层都有个 体被抽到
25、 ,能估计总体的参数值 ,还可以分别估计各个层内的情况 ;抽样误差小。4)整群抽样(cluster sampling):是将总体分成若干群组,抽取其中部分群组作为观察单位组成 样本。特点:易于组织 、实施方便 ,可以节省人力 、物力 ;群间变异越小 ,抽取的群越多 ,则 精确度越高 ;抽样误差较大 ,故通常在单纯随机抽样样本量估算的基础上再增加 1/2。5)多阶段抽样(multistage sampling): 是指将抽样过程分阶段进行 ,每个阶段使用的抽样方法 往往不同 , 即将以上抽样方法结合使用 ,其在大型流行病学调查中常用。优点:可以充分利用各种抽样方法的优势 ,并能节省人力、物力。缺
26、点:在抽样之前要掌握各级调查单位的人口资料及特点。6.现况研究的优缺点【2020 论述】:优点:常用抽样调查 ,研究结果有较强的推广意义 ;有来自同一群体自然形成的同 期对照组 ,使结果具有可比性 ;一次调查可同时观察多种因素。缺点:难以确定先因后果的时相关系 ;不能获得发病率资料 ;研究对象中一些人 正处在所研究疾病的潜伏期或临床前期 ,则其极有可能会被误定为正常人。67.常见偏倚及其控制偏倚(bias):是指从研究设计与实施到数据处理和分析的各个环节中产生的系统误差 ,以 及结果解释、推论中的片面性导致的研究结果与真实情况之间出现的倾向性的差异,进而导 致对暴露与疾病之间联系的错误描述。偏
27、倚产生的原因:主观选择研究对象 ;任意变换抽样方法 ;无应答偏倚 ;幸存 者偏倚 ;报告偏倚 , 回忆偏倚 ;调查偏倚 ;测量偏倚 。(前 4 个属于选择偏倚 ,后 4 个属于信息偏倚)偏倚的控制:严格遵照抽样方法要求 ,确保抽样过程中随机化原则的切实实施 ;提 高研究对象的依从性和受检率;正确选择测量工具和检测方法,包括调查表的编制等; 组织好研究工作,调查员移动要经过培训,统一标准和认识;做好资料的复查 、复核等工 作选择正确的统计分析方法 ,注意辨析混杂因素及其影响。第四节 生态学研究1.生态学/相关性研究(ecological study):是描述性研究的一种类型,它是在群体的水平上研
28、究 某种因素与疾病之间的关系,以群体为观察和分析的单位,通过描述不同人群中某因素的暴 露状况与疾病的频率 ,分析该暴露因素与疾病之间的关系。2.特点:最基本的特征:以群体为单位;描述不同人群中某因素的暴露情况与疾病的平 吕来分析该因素与疾病的关系 ;无法得知个体的暴露与效应(疾病)间的因果关系 ;是从 许多因素中探索病因线索的一种常用方法。3.用途:提供病因线索 ,产生病因假设 ;评估人群干预措施的效果。4.类型:(1)生态比较研究(ecological comparison study):最简单的方法是观察不同人群或地区某种疾病 的分布 ,然后根据疾病分布的差异 ,提出病因假设。(2)生态趋
29、势研究(ecological trend study): 是连续观察人群中某因素平均暴露水平的改变与某 种疾病的发病率、死亡率变化的关系,了解其变化趋势;通过比较暴露水平变化前后疾病频 率的变化情况 ,来判断某因素与某疾病的联系。5.生态学研究的优缺点:优点:生态学研究可应用常规资料或现成资料(如数据库)来进行研究 , 因而节省时间、 人力和物力;生态学研究对病因未明的疾病可提供病因线索供深入研究;对于个体的暴 露剂量无法测量的情况,生态学研究是唯一可供选择的方法;生态学研究适用于对人群干 预措施的评价 ;在疾病监测工作中 ,应用生态趋势研究可估计某种疾病发展的趋势。局限性:生态学谬误;混杂因
30、素往往难以控制;难以确定两变量之间的因果联系。生态学谬误 (ecological fallacy): 是生态学研究最主要的缺点 ,它是由于生态学研究以各 个不同情况的个体“集合 ”而成的群体(组)为观察和分析单位 , 以及存在的混杂因素等原因 而造成研究结果与真实情况不符。生态学谬误产生原因:缺乏暴露与结局联合分布的资料;无法控制可疑的混杂因素; 暴露水平只是近似值或平均水平 ,并不是个体的真实暴露情况。7第四章 队列研究第一节 概述1.暴露(exposure): 是指研究对象昂接触过某种待研究的物质(如重金属)或具有某种待研究的 特征(如年龄、性别及遗传性状等)或行为(如吸烟)。队列(coh
31、ort):是指具有某种共同暴露或特征的一个特定的研究人群组。分为固定队列和 动态队列。危险因素(risk factor):泛指能引起某特定不良结局(如疾病)发生 ,或使其发生的概率增加 的因子 ,包括个人行为、生活方式、环境和遗传等多方面的因素。2.基本原理:是在一个特定人群中选择所需的研究对象,根据目前或过去某个时刻是否暴露 于某个待研究因素(危险因素或保护因素),或其不同的暴露水平而将研究对象分成不同的组, 如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记比 较各组人群待研究的预期结局的发生情况(如疾病 、死亡、或其他健康状况) , 比较各组结局 的发生率 ,
32、从而评价和检验研究因素与结局的关系。3.基本特点:属于观察法;设立对照组;由因到果,符合时间顺序;检验暴露与结 局的因果联系能力较强。4.研究目的:检验病因假设;评价预防措施效果;研究疾病的自然史;新药的上市 后监测。5.研究类型:(1)前瞻性队列研究(prospective cohort study): 研究队列的确定是现在 ;根据研究对象现在的 暴露分组 ;需要随访 ;结局在将来某时刻出现 。发病率或死亡率5。优点:时间顺序增强了病因推断的可信度 ;直接获得暴露与结局资料 ,结果可信; 能获得发病率。缺点:所需样本量大 ,花费大 ,时间长 ;影响可行性。(2)历史性/回顾性队列研究(his
33、torical cohort study):根据研究开始时研究者掌握的有关研究对 象在过去某时刻的暴露情况的历史材料分组 ;不需要随访 ,研究开始时结局已出现。优点:短期内完成资料的收集和分析 ;时间顺序仍是由因到果 ;省时 、省力 、出 结果快。缺点:资料积累时未受到研究者的控制 , 内容上未必符合要求 ;需要足够完整可靠 的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料。(3)双向性队列研究(ambispective cohort study):研究队列的确定是过去;根据研究对象过去某 时刻的暴露情况分组 ;需要随访 ;部分结局可能已出现。应用: 当基本具备进行历史性队列研究的条
34、件下 ,如果从暴露到现在的观察时间还不能 满足研究的要求(人时不够 ,未满足效应期) ,还需继续前瞻性观察一段时间时。第二节 设计与实施步骤:(1)确定研究因素;(2)确定研究结局;(3)确定研究现场与研究人群;(4)确定样本量; (5)资料的收集与随访 ;(6)质量控制。1.研究人群:未患所研究疾病。暴露人群选择:职业人群 ;特殊暴露人群 ;一般人群 ;有组织的人群团体。对照人群选择:内对照;外对照;总人口对照;多重对照 。(保护因素作为对照) 2.确定样本量计算样本量时需考虑的问题:抽样方法 ;暴露组与对照组的比例 ;失访率。影响样本量的因素:一般(对照)人群中所研究疾病的发病率(P0);
35、暴露组与对照组人 群发病率之差(d) ;要求的显著性水平; 效力/把握度 1-。83.观察终点(end-point): 就是指研究对象出现了预期的结果 ,达到了这个观察终点 ,就不再 对该研究对象继续随访。4.观察终止时间 ,随访间隔。第三节 资料的整理与分析病例非病例合计累积发病率暴露组aba+b=n1a/n1对照组cdc+d=n0c/n0合计a+c=m1b+d=m2a+b+c+d=t1.人时(person time): 观察人数与观察时间的乘积。计算方法:以个人为单位/精确法:逐日相加。近似法:年头和年尾人数之和除以 2。 寿命表法: 当年内进入或退出队列的个人均作 1/2 人年计算。Lx
36、=Ix+1/2(Nx-Dx-Wx)进入 ,死亡 ,失访。2.率的计算(1)累积发病率 (cumulative incidence):CI=观察期内发病(或死亡)人数/观察开始时的人口数。变化范围:0-1 。适用条件:样本大 ,人口稳定 ,整齐的资料(固定队列) 。报告时必须注 明时间长短。(2)发病密度 (incidence density):IC=观察期内发病(或死亡)人数/观察人时数。变化范围:0- 。适用条件:观察时间长 ,人口不稳定 ,存在失访。(3)标化死亡比(standardized mortality ratio ,SMR):SMR=研究人群中观察发病(死亡)数/标准人口(全人口
37、)预期发病(死亡)数。 预期发病(死亡)数的计算:全人口某病的发病(死亡)率观察人口数。变化范围:0- 。适用条件:结局事件发生率低,不宜直接计算率时 ,以全人群为对照。 SMR 的意义:被研究人群发生(死于)某病的危险性是标准人群的多少倍。SMR=1 ,研究人群某病发病(死亡)危险=标准人群。SMR1 ,研究人群某病发病(死亡)危险标准人群 ,是标准人群的 SMR 倍。 SMR1 ,研究人群某病发病(死亡)危险标准人群。(4)标化比例死亡比(standardized proportional mortality ratio, SPMR):SPMR=实际死亡数/预期死亡数 全人口中某病因死亡数
38、/全部死亡数 预期死亡数=某病因死亡占全部死亡的比例某单位实际全部死亡数。变化范围:0- 。适用条件:不能得到历年人口资料(无分母) ,仅有死亡人数、原因、 日期和年龄。(5)显著性检验:U 检验: 当研究样本量较大,p 和 1-p 都不太小 ;直接概率法:率比较 低 ,样本量较小时 ;二项分布 ;泊松分布检验 ;卡方检验:居中 ;计分检验。3.效应的估计(1)相对危险度(relative risk ,RR):通常包括了危险度比或率比。意义:暴露组发病或死亡的危险是对照组的多少倍 。RR 值越大 ,暴露的效应越大 ,暴 露与结局关联强度越大 。Ie、I0:暴露组率、对照组率。RR 的 95%C
39、I:Woolf 法/Miettinen 法 。反自然对数即为 RR 的 95%CI。9(2)归因危险度 (attributable risk, AR):意义:暴露人群与非暴露人群比较 ,所增加的疾病发生数量 。AR 值越大 ,暴露因素消 除后在暴露人群中所减少的疾病数量越多。RR 具有病因学意义 ;AR 具有疾病预防和公共卫生学意义。(3)归因危险度百分比:AR% or 病因分值(etiologic fraction ,EF):意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。 (4)人群归因危险度(population attributable risk, PAR):PA
40、R =Ir-lo t、 lo :总人群率、非暴露组率意义:暴露导致一般人群所增加的疾病发生率的大小 。PAR 值越大 ,暴露因素消除后在 总人群中所减少的疾病数量越多。(5)人群归因危险度百分比 PAR%:Pe :总人群的暴露比例/人群中有某种暴露者的比例意义:PAR 占总人群全部发病(或死亡)的百分比。(6)剂量效应关系的分析分析方法:先列出不同暴露水平下的发病率 ,然后以最低暴露水平组为对照 ,计算各暴 露水平的 RR 和 AR。必要时 ,应对危险度(或率)的变化作趋势性检验。第四节 常见偏倚及其控制1.选择偏倚(selection bias):是由于研究对象的选择不当,如缺乏代表性(暴露
41、组不能代表暴露 人群 ,对照组不能代表非暴露人群)和暴露组与对照组没有可比性等 ,而导致的研究结果偏 离真实的情况。控制:重在预防 。首先要有一个正确的抽样方法 ,尽可能遵循随机化的原则 ;严格按 规定的标准选择对象 。尽量提高研究对象的应答率和依从性。失访偏倚(follow-up bias):研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察 而退出队列所引起的偏倚。控制:设计:选择便于随访的人群 ,在计算的研究样本的基础上扩大 10% 。实施: 加强对随访员的管理,制定随访计划和监测措施,期中分析。整理资料:对于有缺项或漏 项的对象进行补查。2.信息偏倚(information bia
42、s):在获取暴露、结局或其他信息时所出现的系统误差或偏差。控制:选择精确稳定的测量方法 、调准仪器 、严格实验操作规程 、同等地对待每个研 究对象、提高临床诊断技术 、明确各项标准、严格按规定执行等。还应认真做好调查员培 训 ,提高询问调查技巧 ,统一标准。3.混杂偏倚(confounding bias):是由于第三个变量的作用,致使研究因素与结果的联系被歪曲, 这个第三变量就叫混杂变量/因子。控制:在研究设计阶段:可对研究对象作某种限制 ,匹配 。在资料分析阶段:采用 分层分析、标准化或多因素分析的方法。1 0第五章 病例对照研究(case-control study)第一节 概述1.基本原
43、理:是以当前已经确诊的患有某特定疾病的一组病人作为病例组 ,以不患有该病但 具有可比性的一组个体作为对照组,通过询问、实验室检查或复查病史,搜集研究对象既往 对各种可能的危险因素的暴露史,测量并采用统计学检验,比较病例组与对照组各因素暴露 比例的差异是否具有统计学意义。然后评估各种偏倚对研究结果的影响,并借助病因推断技 术,判断某个或某些暴露因素是否为疾病的危险因素,从而达到探索和检验病因假说的目的。 2.基本特点:观察性研究 ;研究对象分为病例组和对照组 ;由“果 ”溯“ 因 ” ;因 果联系的论证强度相对较弱。3.研究类型:(1)非匹配病例对照研究 ;(2)匹配病例对照研究 ;(3)衍生的
44、集中主要研究类型: 1)巢式病例对照研究:是一种在队列研究基础上的病例对照研究 , 即在队列研究的基础上 , 当所研究疾病的新发病例累积到一定数量,则可将全部病例集中组成“病例组 ”;在每个病 理发病当时,从同意队列的未发病者中,按一定匹配条件随机选择对照,集中组成“对照组 ”, 然后按匹配病例对照研究的方法进行资料的统计分析 。【2019 名词解释】和病例对照研究的区别:前瞻性 ;因果关系的印证强度相对较强。2)病例-队列研究: 队列研究开始时 ,在队列中按一定比例随机抽样选出一个有代表性的样 本作为对照组;观察结束时,将队列中出现的所研究疾病的全部病例作为病例组,与上述随 机抽取的对照组进
45、行比较 。【2019 名词解释】病例-队列研究与巢式病例对照研究的不同之处:前者的对照是从基线纳入的全部队列 成员中随机选取;而后者的对照是与病理按个体匹配的。前者的对照组可作为多种疾病结局的共用对照组 ;而在后者中 ,不同疾病结局的研究 ,对照组不同。3)病例-病例研究:对一种疾病的两个亚型进行对比研究。4)病例交叉研究: 以每个病例发病之前的一个或多个时间段作为“对照 ”时间段。4.用途:用于疾病病因或危险因素的研究;用于健康相关事件影响因素的研究;用于 疾病预后因素的研究 ;用于临床疗效影响因素的研究。第二节 研究设计与实施步骤:(1)确定研究目的 ;(2)明确研究类型 ;(3)确定研究
46、对象 ;(4)确定样本量 ;(5)确定研 究因素 ;(6)资料收集方法。1.病例的选择(1)病例的定义:诊断明确、统一 ,尽量使用金标准。(2)病例的类型:新发病例 ;现患病例 ;死亡病例。首选新发病例:代表性好;回忆偏倚少;病历资料易获得;被调查因素改变少。 (3)病例的来源:医院:可节省费用 ,合作性好 ,资料容易得到 ,而且信息较完整、准确; 但代表性较差 。社区人群:代表性好 ,但调查工作比较困难 ,且耗费人力物力较多。2.对照的选择【2019 论述】(1)选择对照的原则:对照应能够代表产生病例的源人群。(2)对照的来源:同一个或多个医疗机构中诊断的其他疾病的病人;社区人群或团体人群 中非该病病例或健康人 ;病例的邻居(社会经济地位)或同一住宅区内的健康人或非该病病 例病例的配偶(生活方式和个人习惯因素) 、同胞(早期环境因素和遗传因素) 、亲戚 、同学 或同事等。11(3)选择对照的方法:非匹配、匹配。1)匹配(matching):是要求对照在某些特征或因素上与病例保持一致,以保证对照与病例具有 可比性。匹配的目的主要是提高研究效率