【讨论帖】药物的临床研究

查看完整版本请点击这里:
【讨论帖】药物的临床研究

相关疾病:
一直很想总结一些东西,但一直懒,而且惴惴不安,因为:
1、这些东西其实都不是我的,我只是学习了而已
2、我也不敢确认这些东西是否一定正确
3、对于高手,这些东西都是很基础的毛毛雨似的东西,不值得一提
4、我还在学习的路上,自己还需要加强学习
所以一直没有像样的开什么帖子。
前一段时间提出申请版主和转正申请,自己内心其实非常惭愧,因为没有做过什么事情。犹豫再三,还是开了这个主题帖子,总结一下一段时间以来自己的学习所得,也欢迎大家留言探讨。
记得轻狂时曾经被一个大佬问过一句:
你觉得临床研究什么最重要?
我愕然,许久后惴惴说:很多东西都重要,样本量在很大程度上决定了I类和II类误差,入排条件框出了对象人群,统计学方法也很重要......
他摇头说:研究目的最重要,目的以及在目的基础上形成的假设,是临床研究设计中最核心的,其他的内容,可以说都是围绕这个而展开的。
首先介绍一下新药临床研究/开发的流程。
大家都知道,传统意义上,新药的临床研究分为I/II/III期,后来II期有分成IIa和IIb(很大程度上是因为肿瘤药物研究),接着出现了0期研究的概念(很大程度上也是因为肿瘤药物的研发)。然后又有人提出,0/I期为早期临床研究,IIa为中期临床研究,IIb和III期为晚期临床研究。
这种分类,其实我觉得在两个方面对我们愿意研究临床研究设计的人来说,是很重要的:
1、分期是和研究目的相关的,不同的目的,可以分到不同时期/阶段的
2、不同时期/阶段的临床研究,往往对应于一定的研究框架设计(交叉研究,平行对照,单臂,终点选择等等)
所以,理解不同时期/阶段的临床研究,其意义已经超出了知道有这样的分法本身。分期的一头是研究目的,另一头是对应的设计框架(当然也只是粗略的框架,很多问题,要根据疾病、药物等来确定),理解分期,有助于我们了解,一个研究目的,大体上有哪些设计方法和思路,大体上可以如何去处理;为什么该如此进行,各种设计的优缺点在哪里。
所以,我们先看一下不同阶段的研究目的:
0期:目的是在满足一定的统计学要求的前提下,在有限的样本量(通常不超过20)、有限的时间内(每个患者的治疗期常不超过数周),初步判断一个研究药物是否有效、某个剂量是否有效,是否应继续开发下去,附带看一下某些疗效判断方法是否可行。从目的角度,0期研究也是初步判断药物的效果,类似II期(尤其是IIa),所以0期的设计,在某些方面类似IIa的单臂研究,但是由于样本量小、又要满足一定的统计学要求,所以也有其特点,设计起来其实可能更为复杂。
I期:通常是摸索剂量(dose finding, dose-ranging),药代(PK)和药动(PD),样本量也不大(一般不超过20,或者20左右)。尤其是PD,通常会使用交叉研究。因为交叉研究有其特点,适合此类设计目的。交叉研究中,每个患者都是其自己的对照(在不同阶段,分别扮演研究组和对照组的角色),而且交叉研究的variance一般小于平行对照(因为每个人是其自己的对照,所以inter-personal variance基本没有),所以在利用样本方面,交叉研究的效率远高于平行对照,交叉研究如果纳入20例患者,平行对照50例都不一定能获得相似的Power。但是交叉对照也有很多限制,例如脱落和失访对交叉研究的影响远大于平行对照研究;同一个人,不同时期接受不同治疗、中间隔以洗脱期,导致后遗效应,以及治疗-时间相互作用等等。所以在后期临床研发中,很少看到有用交叉对照的(有,但远少于平行对照)。
0期和1期,由于其样本量都少,又可以引出另一个题目——small clinical trials怎么做?
II期是初步判断疗效的和安全性的(其实安全性贯穿研发始终),所以一般称为safety & activity研究(SA研究)。有多种做法,根据不同的临床疾病环境,以及既往数据等,可以采取单臂,平行对照的RCT等,终点一般选择surrogate,而不是clinical outcome。如果分IIa和IIb,则IIa往往是单臂,样本量一般不会过百;IIb则往往是平行RCT。
III期,是严格的验证药物效果的验证性临床研究。很多会议上介绍临床研究,往往以此类研究为模版进行介绍,在假设检验的框架下进行介绍。
这是第一帖,希望我能有勇气和毅力继续写下去。
查看完整版本请点击这里:
【讨论帖】药物的临床研究

我也来说两句 查看全部回复

最新回复

  • 生物迷 (2015-11-14 11:33:48)


    0期的临床研究,主要见于肿瘤药物。
    一个原因是,在公司开发化合物时,往往针对同一个靶点,得到同一个母核,但在不同位点用不同基团修饰,得到一系列化合物。不可能所有的化合物都去进行一系列临床开发,那样的话肯定是投入很大而产出未必能match自己的投入。临床前研究虽然能对筛选化合物有所帮助,但毕竟完全不能代替人体的临床研究。
    另一个原因是,新药研发越来越难,投入越来越大,尤其是肿瘤领域,研发的成功率可能还要低些。这样,在研发时的一个策略就是,不断筛选、停止开发肯定/基本没有什么希望的药物,只把认为可能/很可能有效的药物投入下一期的临床研发。没有办法,整个药物研发的大头是在临床研发这一块,投入实在太大。
    还有一个原因是,现在的化疗药物,越来越多的是靶向性的,总体上,其安全性高于细胞毒类药物。安全性也是一个开展0期的重要考虑。因为0期前,对于药物在人体的疗效知道的很少,所以对于参加0期研究的患者,很少能说可以提供什么疗效,如果已知安全性还有问题,那这样的化合物能否开展0期研究,恐怕需要仔细考虑。
    0期的挑战,是如何在满足一定统计学要求的前提下,利用少的样本、短的时间,判断出药物是否值得继续开发。因为0期,对药物的临床疗效知道的很少(包括是否会有效,那个剂量可能有效),投入很多去做临床是不合适的。小样本,10+例,不可能套用传统的研究思路。
    在0期时,往往会基于动物研究的结果,先设定要探索的剂量(可能会分几个剂量水平),每个剂量水平可能只有数个患者。这么少的患者,variance的相对影响会比较大,因此需要结合药物的作用机制和靶点,选择灵敏的、能反映药物作用机制(是否对人体也有这样的作用机制)的biomarker作为终点。
    通常会选择相同的biomarker,但在两个不同的组织/细胞中进行检测,一个是肿瘤的活检组织(基本上一定会用,只要活检在临床上可行),一个是外周血单个核细胞(PBMCs,常用,但具体是否该用,还需结合药物的机制)。
    PBMCs抽血即可得,可以在不同时间多次抽取和检测分析(但是又可能会引出一个重复测定值如何分析、包括如何处理variance的问题——来自同一个患者的不同时期的检测值,可能不是互相独立的,而是彼此相关的,因此不应象完全独立的数据那样处理——因为是来自同一个人的检测),治疗前,治疗后都多次测。
    肿瘤活检会麻烦些,反复做不可行(相对于抽血,穿刺活检毕竟风险难度等都要大不少),所以一般可以的话,穿两次,一次是基线,一次是治疗后的某个时点,通常这个治疗后的时点是,从临床前研究得出的治疗后盖biomarker变化最显著的时点,这样可以使治疗前后的差异尽可能达到最大,能体现效果。
    指标有了,可能要在两个水平定义患者对药物的应答:
    1、单个患者的水平,治疗前后biomarker的变化达到什么程度(PBMCs和肿瘤组织要分别定义),为有response(一般PBMCs和肿瘤组织中一个满足定义,就可以视为有response)
    2、在一个剂量水平上,所有接受治疗的患者(单臂研究),多少患者出现1描述的response,视为该剂量的研究药物有效?
    前者在很大程度上来源于对该biomarker的前期研究和理解,而后者更多的是基于统计学(二项式变量)的Power、I类误差等的考虑
    最后的结论,可能不外乎3个:
    1、达到统计学要求,可以进行下一步开发;
    2、有一定希望,但未满足统计学要求,可能是回去修改化合物(修饰),或者换用其他基团修饰的化合物(如果手上有系列化合物的话)再来进行0期研究
    3、肯定没有效果,放弃同一系列的化合物,不再开发
  • 生物迷 (2015-11-14 11:34:07)

    变量分类以及变量转换
    本来该接着写I期的,但想想,先写这个吧,也算是一个基本概念了。
    变量是统计学中常用的一个定义,这里就不详述了。
    变量可以分类,但具体分哪些类,不同的人可能有不同的观点。
    有人分成以下几类(下面这个应该是分类最多的,其他人可能分的类会少,但不会比下面这个多了):
    1、数学变量(包括连续变量和离散变量)。所谓连续变量,可能是指如果我的测量工具精度是无限的,我得出的测量结果也是个无限小数,或者说,其测定值在可能在范围内的任何一点。而离散变量,我只能打比方了,例如人数,他不可能是小数,而一定是整数,这种一定是整数的变量,就是离散变量的典型代表。
    数学变量:
    有大小
    其大小是有意义的,例如血压140mmHg高于130mmHg,这个就是有意义的
    该变量两个测定值的差异也是有意义的,相同的差异含义相同;例如140mmHg-130mmHg=10mmHg,这个10mmHg是有意义的,而且它的含义和130mmHg-120mmHg=10mmHg是一样的意义
    2、等级变量(ordering)
    在临床研究中,我们常看到,0:无症状;1:轻度;2:中度;3:重度。这种变量就是等级变量。
    等级变量:
    有大小
    大小是有意义的(例如3>2,代表3更严重)
    两个测定值的差异是没有意义的,也不必去理相同差异的含义(重度和中度差1,中度和轻度也差1,但重度~中度之间的距离,不一定是中度~轻度之间的距离,所以不必去理会差异)
    3、分类变量
    类似于字符一样,只是用数字进行归类而已,例如0代表无,1代表有;或者0代表男,1代表女。
    分类变量大小没有意义。
    分类变量中,有/无这种,就是广泛使用的二项式(分类变量)
    还有一类变量,不知道该如何描述,姑且称为时间吧,出现在生存研究/time-to-event研究中,只有这类研究才有。即发生某个event的时间。非常特殊。
    变量可以转换,当然必须是有意义的转换。
    例如血压,治疗前后的血压差异,是个连续的数学变量;如果入选的都是高血压的患者,定义治疗后血压恢复正常为有效,则就把它转换为有/无效果的二项式变量了。
    有人将等级变量和分类变量合并在一起,统称为分类变量,因为在统计处理上,往往采用类似的方法(用百分比等来描述)。
    不同的变量,采用不同的方法来进行统计描述,和统计分析。
    连续变量,往往是mean+SD,等来描述;统计学方法包括t检验、z检验等
    等级变量和分类变量,往往用百分比(阳性百分比,男性百分比)描述,统计上使用卡方等
    时间变量,那只有生存分析来进行比较了
    通常,连续变量的灵敏度高(容易体现出差异),而分类变量的灵敏度低(不容易体现出差异)。所以,如果能以血压差异来作为疗效判断标准,就最好不要用血压恢复正常者的比例来作为疗效标准(但现在,越来越取决于相应指南,不能如自己的愿了)
    对于生存分析,和对应的分类变量相比,灵敏度高(易于体现差异)。
  • 生物迷 (2015-11-14 11:34:25)


    相关疾病:
    早期临床研发:合适剂量
    最合适的剂量,有以下几种可能。
    1、疗效达到某种程度的最低剂量(例如,使90%的患者血压下降10mmHg的最小剂量;使90%的患者疼痛消失的最小剂量),而这个程度,需要结合药物和疾病,来判断
    2、最大无毒性剂量,一般见于认为药物有量效关系(剂量越大越好)的非细胞毒类(也没有其他已知的严重不良反应的)药物,无毒性不是说没有人发生SAE,而是说发生可能与药物相关的SAE的受试者比例在一个可以接受(且事先规定的)低水平(如不超过5%)
    3、最大耐受剂量,常用于细胞毒类药物,认为此种药物有一定毒性,但剂量越大疗效越好,所以规定一个多少比例的受试者发生SAE的上限,达到这个上限的剂量即为最大耐受剂量。例如,规定30%(常用30%作为标准)的受试者出现严重(但可以恢复)的可能与药物相关的SAE的剂量,为最大耐受剂量。
    4、最可能有效的剂量,适用于非细胞毒类抗肿瘤药物,例如某个受体抑制剂,通过现代技术,定义90%的患者中,肿瘤组织的受体被抑制达到95%以上(这些具体数字仅供参考,不同药物可能不同),为最可能有效的剂量
    5、最适合的联合使用剂量,用于联合治疗的药物,定义和设计非常复杂。
    光一个合适剂量,就有这么多定义和标准,不同的药物,选择不同的标准。
  • 生物迷 (2015-11-14 11:34:45)


    相关疾病:
    临床研究:指标的判定标准,软指标和硬指标
    临床研究中,会用到不同的疗效判定指标(更准确的说法似乎是终点,endpoint)。
    判断一个指标/终点的意义和价值的标准包括:
    1、临床上的重要性
    2、是否有较好的工具/手段进行测量(或者说测量的可行性)
    3、是否可以较好的反应药物的疗效
    4、可靠性和准确性(出现测定误差的可能性大吗?重复测量的结果吻合度如何?)
    5、敏感性(能否灵敏的体系疗效差异?)
    6、特异性(不易受其他因素影响)
    在临床研究中,指标的“软”和“硬”,可能指的往往是
    1、临床重要性
    2、可靠性和准确性
    最硬的指标,就是生存/死亡的判定,最有临床意义(能延长生命的,意义肯定是非常大的),也几乎不可能出错。
    排在这个指标之后的,可能有疾病复发/进展,临床意义也很大,但可能需要一定的辅助检查,而辅助检查又牵涉到仪器和检查者的水平,所以虽然也比较“硬”,但“软”于生/死。
    接下来的,可能是实验室指标、病理检查等。也比较可靠和准确,但临床意义可能弱于前者。
    再下来,体检(如血压等)。
    后面可能是QOL或其他类似的系统化了的、有临床意义的问卷,虽然有临床意义,但客观性弱。
    最软的可能是非系统化的问卷,例如疼痛程度,瘙痒程度等。
    问卷和非问卷的症状,往往又称为PRO(patient reported outcome)。
    但是临床研究的终点,不是越硬越好,必须首先考虑临床研究的目的,药物的治疗目的。
    例如,对于肿瘤治疗药物(化疗药物等),生/死是最硬的,其次是疾病进展/复发等。
    但是对于治疗癌性疼痛的,可能PRO中的疼痛程度才是最合适的终点指标。
  • 生物迷 (2015-11-14 11:35:03)


    相关疾病:
    普通感冒  阿尔茨海默病

    对照
    其实这个东西,ICH-E10有专门的描述,如果有兴趣,建议大家阅读ICH-E10去。
    曾经见过一个单臂试验的synopsis(方案摘要),说是研究药物的有效性和安全性,没有control,没有比较,用描述性统计分析,可怕,完全没有临床研究的概念。
    当我们谈到药物有效无效的时候,就需要比较。就好像俗话说,没有坏,怎能说好。
    比较就需要对照。
    对照分两大类:
    (同期)内部对照,也就是说,研究里有个对照组,属于研究“内”的对照。
    外部对照,包括历史数据对照,基线对照(同组治疗前后比较)等。
    历史数据对照有它的问题,例如辅助治疗的进步,诊断治疗水平的提高等等,都可能使得历史数据不能反映当前的实际情况,此时用历史数据作为对照,可能夸大研究药物的效果。
    基线对照也有其问题。有些疾病有自愈的倾向(例如感冒),这时基线对照可能就没有太多意义。有的疾病,现有的手段只能延缓,却不能改变疾病的进展方向。例如阿尔茨海默病,现有手段只能延缓认知功能减退的情况,却不能在一个较长期的水平上提高或至少维持其不变,此时如果用基线对照,绝大多数情况下,药物会显得没有效果。还有些疾病,受心理暗示的影响比较大,如一些心身疾病/神经官能性疾病,哪怕给患者一些没有活性的安慰剂,很多患者的症状也会减轻(很典型的安慰剂效应),此时使用基线对照也会有问题。
    外部对照通常用于探索性或者初步看疗效的单臂临床研究(如前面谈到的0期就使用基线对照,肿瘤的IIa,如果有较好的历史数据,也可以使用历史对照)。但并不是所有的疾病,或者所有的药物,都适合用单臂试验来初步看临床效果。
  • 生物迷 (2015-11-14 11:35:56)


    bias和随机误差
    bias其实也属于误差,即以前大家常说的系统误差。
    有些人喜欢用信号来表示临床研究。打个比方,收音机把,播音员真实的声音是我们想检测的疗效,杂音就是误差。而我们要做的,就是将杂音和播音员的声音区分开来,听清楚播音员说的是什么。
    随机误差几乎永远存在,患者的病情波动,仪器准确度的波动(没有坏,但其准确度可能还是有细微的波动)等等。但随机误差有个特点:没有方向,也就是说,所有的随机误差汇总的话,其预期净值是0(当然这是理想的情况)。由于样本量、患者个体差异等等,随机误差不会完全消除,但样本量增大、观察时间延长会降低随机误差。总体上,如果样本量大,设计严格,随机误差不是个大问题。
    bias(系统误差)就很可怕
    它可以大量产生,虽然看起来比较散,但其实有一个共同的方向
    少数情况下我们可以分析出bias甚至通过统计学方法给它定量,以消除其对疗效判断的影响,但多数情况下,我们难以分析和定量;虽然它有一个方向,但其方向和强弱我们通常难以预期和分析
    有时它甚至会掩盖真实的治疗效果/信号
    如果没有检测分析到,不能采取相应的纠正措施,则重复试验时它依然会存在
    有人将疗效称为信号,将随机误差称为背景杂音,而bias就是对信号的扭曲(不是杂音)。
    临床研究中常见的bias有:
    1 selection bias:虽然方案没有规定,但研究者有选择的将具有某种特点的患者分到某个治疗组(可能是因为他相信具有这种特点的人对该组治疗更能获益),这样会导致该组患者在很大程度上具有不同的特点,继而影响疗效结论
    2 procedure bias:研究方案设定等导致某种患者接受某种治疗,结果导致两组患者不一样。例如一个研究比较手术和化疗对某种肿瘤的生存有无差异。但是,能够手术的患者往往状态较好、而且很可能没有转移(否则恐怕无法手术治疗),这种研究设定,可能直接导致两组患者是不同的,最后如果手术组效果好,生存长,我们也不知道是因为手术治疗更好,还是因为手术组患者的病情和整体状况优于化疗组的关系。
    3 observational bias:开放研究,用主观性较强的指标时常出现。当研究者或者患者对某个治疗抱有期望,认为它很有可能有效时,这会反映到指标变化上面(这个治疗,症状改善更明显等),甚至一些相对客观、但需要人来判断的辅助检查,也可能出现(例如病理检查等)
    4 postentry exclusion:在患者已经入组后,带有一定目的的排除某些患者,如排除对治疗没有应答或者出现不良事件等的患者
    5 confounders(混淆因素):多见于没有随机和内部对照的研究(但RCT里可能也会出现),因为存在一些同时和治疗及预后/outcome相关的混淆因素所导致的。例如COPD的患者,吸烟是个很重要的因素,如果不同组患者的吸烟情况不同,那结果的分析就可能出问题。
    6 数据丢失(患者退出失访、或者中间不按时随访等):有些丢失是随机的,有些丢失则可能和治疗有关。例如和对照相比,某个治疗的不良反应更多更大,此时可能该治疗组患者退出更多
    7 事后(方案未规定的)亚组分析:这些结论只具有启示性,但还需要进一步验证,因为(1)存在反复检验导致I类误差膨胀的可能;(2)可能是有选择的、根据数据结果挑选亚组进行分析的。
    8 因为获得阳性/阴性结果提前终止研究,可能出现统计学的bias(对疗效的估计发生偏差)
    bias一旦产生,往往很难分析、将其和疗效判断区分开来(有可能,但希望不大)。所以,首先要做的是预防,在方案和执行过程中预防和消除bias。
    1、随机,充分的随机可以消除selection bias。block和分层随机有助于消除confounders的影响,尽可能确保两组患者在已知的confounders因素上是具有可比性的
    2、设计的合理性,确保两组患者来自同一人群
    3、好的盲法,可以消除observational bias
    4、ITT原则,尽可能不要在入选后排除患者,中途退出的也要纳入分析
    5、在研究许可的范围内,尽可能采用客观性强的终点
    6、按照方案随访,尽可能不要发生数据丢失
  • nn255 (2015-11-14 11:36:25)

    由于全新靶点药物失败率太高,现在有人提出一期和IIa的重点应从耐受性转移到药理验证(Developing drug prototypes: pharmacology replaces safety and tolerability? Nat. Rev. Drug discov.)。礼来把早期的临床实验的目标定位为truth finding (http://people.icoserver.com/users/eric/hbr_NPD.pdf, Harvard Business Rev.)。其观点是利用首次上人的机会来验证药理和生物标记是否和动物实验一致,是否和模型预测相符。如果人体药理指标和整个项目的假设一致再去做更昂贵的疗效/安全性实验。
    对于喜欢批判思考药物疗效的人,这个博客是由非常专业的医生们所写:
    http://www.sciencebasedmedicine.org/
  • 生物迷 (2015-11-14 11:36:51)

    我没有看到全文,看到的是摘要,所以不敢说太多。
    确实存在这种情况,细胞和动物种属的差异,还有人体是非常复杂的一个系统,体外细胞层面的结果,放到这个系统,未必能得到类似的结果。有可能临床前研究得出不错的结果,明确的靶点机制,到了人体,情况变了。
    首先I~III/IV本身可以看成是一个筛选的过程,看耐受性,看安全性,看初步的疗效,行再往下走,不行就停掉。所以我们看到,每个时期目的样本量、以及相应的花费都是不同的,总体而言是一个规模逐渐增大、费用也增加的过程。这样做,目的就是——如果药物没有希望,尽可能早期发现早期停止,减少损失。这个理念一直是存在的。
    至于验证临床前研究所得的机制,在人体是否也存在,这是典型的0期的目的。0期的概念源自肿瘤药物,但并不是说这个概念不可以推广到其他类型的药物。
    0期,以前有人称为转化研究(translational study),现在称0期的多。它就是临床前研究和I~III期临床研究之间的桥梁研究(bridging study),主要目的是:
    用很少的样本量(一般不超过20),在满足一定统计学要求的前提下,验证临床前研究所得的药物治疗机制,在人体是否存在
    另外,它也可以获得一定的药物ADME或者药动学(PD)的数据,还可以验证一下,检验药物作用机制的方法的可靠性(是否可以通过检测某个受体的变化来验证此类药物在人体的机制等)。
    0期目前还主要用于肿瘤研究,一方面是因为肿瘤药物的失败率更高(曾有人分析过,10年中,从提交IND到获得NDA批准,肿瘤药物获批的成功率是平均水平的一半),需要尽早筛选;另一方面是可行性比较高,肿瘤组织可以穿刺活检,而且临床上此种操作比较成熟。
    而其他类的药物,进行0期研究,可能方法学上有一定困难。如何用一个方法来验证,药物可以结合某个部位的某个受体、发挥抑制作用?例如,期望药物能进入中枢神经系统、抑制某个受体,我们该如何操作?动物我们可以进行有创的一些检查、取脑部组织、脑脊液等,人体呢?
    所以,个人浅以为,这个概念其实已经有了,只是具体问题执行时,可能存在一定的困难,肿瘤药物相对可行,所以这个概念目前较多用在肿瘤领域。
  • nn255 (2015-11-14 11:37:14)

    广泛地讲,临床前研究可看做-1期临床。0期的目的的确是为了确证机理,但是其剂量很小,所以和治疗剂量的药理可能不同。另外纯研究的临床实验在某些情况下可能有伦理问题。礼来的观点是渐进的,非***的,只是说在早期的临床实验(二期以前)比现在的普遍做法应更偏重项目假设验证。
    最早的几个0期好像都是NCI出的钱,可见药厂的态度。
  • 生物迷 (2015-11-14 11:37:34)


    相关疾病:
    冠心病阿尔茨海默病
    ITT和PP
    Intention to treat (ITT)是一个原则,或者说一个分析集,Per protocol (PP)是另一个分析集。
    ITT要求:all subjects are compared in the treatment groups to which they were originally randomized, regardless of any treatment that they subsequently received。所有中途退出/失访等的,也需要按照其当初的治疗分配纳入相应组进行分析。
    PP集则主要纳入符合方案(可能需要在方案中规定何为“符合方案”)的受试者进行分析。
    PP集反映的其实是药物最大疗效。
    ITT相对于PP,有其优势:
    1、更好的反映了实际治疗中发生的问题。患者退出、失访、依从性不佳等,都要纳入,反映在疗效结果上,其实比起PP,更能反映临床治疗中发生的情况。
    2、ITT使用的是来自几乎所有患者的数据,因而可以进行中期分析;而PP不同,不到最后,不知道哪些该纳入PP集,因此,PP不太允许中期分析
    3、ITT能反映临床实践中出现的一些问题。例如一些严重的冠心病(CAD)患者,一组择期搭桥,一组急诊冠脉成形(PTCA),PP集可能只比较完成搭桥手术的人群和完成PTCA人群的结果。但临床实践中,择期搭桥可能意味着要完善术前检查,从签署ICF到手术可能有一段时间,如果患者在这段时间内死亡,PP集一般是不纳入的,而ITT集可能会纳入,这样,ITT集的结果更贴近临床。
    但是ITT有个假设,即不依从、包括脱落退出等,是在不同治疗组随机分布的、比较均衡的,如果这个假设前提不存在,则ITT也可能出问题。
    虽然ICH-E9把ITT的结果放在第一位,但其实ITT和PP应该综合来看。
    ITT和PP结果大体一致,都有显著性或者都无显著性,则提示结果比较可靠。
    如果PP的显著性明显高于ITT的,提示可能不依从的现象较多,稀释了ITT的显著性。
    如果ITT的结果是显著性的,而PP结果是非显著性的,可能存在bias或者confounders,最常见的是ITT的假设(不依从是在不同治疗组随机分布)不成立,而且伴随其他纠正措施不充分或者不正确。例如,在阿尔茨海默症的临床研究中,我们知道,目前药物只能延缓认知功能的衰退,但无法逆转疾病的进展方向。如果A为研究药物,C为对照药物,A组很多患者中途退出(因为安全性或者别的原因),如果将LOCF(末次随访结果)计为最终结果,则A组患者最后的认知功能会好于C组,这样可能出现PP集无显著差异而ITT集有显著差异的情况。
    PP集是显著性的,而ITT集是不显著的。一方面可能是不依从的情况非常多,还需要注意switch的情况,即患者中途从治疗C转换为治疗A,这样按照ITT的原则,发生了此种转换的患者,其最终结果应纳入C组,而PP集可能剔除这些患者,只纳入那些没有转换的患者。如果A治疗是优于C治疗的,一旦swicth的患者多,可能出现PP集有显著性,而ITT集无显著性的情况。
    Switch是非常麻烦的。在E9正式颁布的时候,对于如何处理Switch,统计学届还没有提出比较好的方法。目前已经有了进展,但可能还在发展中。
    虽然我们倾向于将ITT集的结果放在第一位,但内心也应保持一定的警惕,应注意ITT和PP的结果是否一致,不一致首先怀疑是否有bias。
  • 生物迷 (2015-11-14 11:38:11)


    完整的临床研究方案应有的内容:
    1、封面页(研究项目名称,PI的姓名和联系方式,申办者的名称和联系方式,方案的版本号)
    2、目录
    3、方案摘要(Synopsis)
    4、研究背景介绍
    5、研究药物介绍(毒副反应,药理、分布等)
    6、研究目的(主要目的,次要目的,主要和次要终点)
    7、研究方案
    (1)分组和治疗方案
    (2)入排条件
    (3)筛选期
    (4)随机方法和随机流程
    (5)治疗流程(盲法,详细的治疗方案,随访次数,每次随访进行哪些检查,特殊的如主要终点相关的检查如何操作等)
    (6)列出图表表明研究的流程,便于理解和记忆
    (7)出现AE时如何调整药物剂量/治疗方案
    8、药物的提供、储存和分发
    9、临床研究中的药物安全监测和不良事件报告
    10、数据收集、记录,Query等相关内容(如说明会收集数据,核对,可能和研究者联系要求澄清数据等)
    10、统计方案
    11、沟通和数据/研究论文发表
    12、参考文献
    13、附录(如疾病的诊断标准、病情评价标准,乃至产品或者研究中使用的已上市的对照品说明书等)
    14、PI和申办方代表签字
  • 生物迷 (2015-11-14 11:39:46)


    最简单的dose ranging设计:3个一组爬坡
    多见于肿瘤药物。
    在进行这样的设计之前,先要确定:
    1、用于人体的起始剂量(在参照临床前动物研究的基础上制定,要求有足够的安全空间)
    2、剂量增/减规则(如果一个剂量是安全的,下一步要增加剂量,如何加?如果一个剂量是不安全的,下一步要减剂量,如何减)
    3、哪些是剂量限制性毒性反应
    可以看到,上面这些内容,很多都带有相当的主观色彩,没有办法。
    然后,起始剂量组3个受试者,进行研究:
    (1)如果没有人出现剂量限制性毒性反应,认为这个剂量是安全的,另换一组受试者进行下一个更高剂量水平(剂量上调)的研究;
    (2)如果有2个或更多的受试者出现剂量限制性毒性反应,认为这个剂量是不安全的,另换一组受试者进行下一个更低剂量(剂量下调)水平的研究;
    (3)如果有且只有1个受试者出现剂量限制性毒性反应;该剂量水平上追加3个受试者;追加的3个受试者中没有人出现剂量限制性毒性反应,就按照(1)走;追加的3个受试者中2个或更多的受试者出现剂量限制性毒性反应,就按照(2)走;追加的3个受试者还是只有1个受试者出现剂量限制性毒性反应,认为该剂量是合适剂量,停止研究。
    只是这种方法得出的合适剂量,往往是偏低的。
  • 生物迷 (2015-11-14 11:40:05)



    我也没有办法再写早期临床开发,尤其是剂量探索,因为从没接触过。
    所以,我可能从II期开始。
    II期分为IIa和IIb,但这主要见于肿瘤药物,对于其他药物,不一定适用。可能是因为肿瘤药物的失败率更高,所以需要多一次筛选(IIa)
    一般而言,肿瘤的IIa研究,多采用单臂试验,根据药物的特点,选择相应的终点(细胞毒就用tumor response,非细胞毒的靶向药物就用无进展生存Progression Free Survival)。采用time-to-event的设计。
    单臂试验采用外部对照,往往是历史数据。
    单臂试验的样本量计算,有多种方法,但往往是两个原则选择其一:
    1、一个原则是类似于假设检验,如果有比较好的历史对照数据,要求研究药物和对照之间有多少差异,是优效或者非劣效等,即大家在III期玩得比较多的那套计算样本量的方法;只是IIa不是III期,I类误差通常是0.1而非0.05,II类误差通常也是0.1而非0.15或者0.2。
    2、另一个原则是,看数据准确度,即要求最后的variance到多少,或者95%可信区间位于什么水平,举例,如果做出来研究治疗的PFS点估计值是5个月,规定这个点估计值的95%可信区间位于该点估计值的80%~120%之间,即该PFS的95%可信区间应在[4,6]个月内。通过对这种variance的规定,可以估算出单臂试验所需要的样本量是多少。
    第二种方法可能大家在实际临床试验中使用的不多,但确实也是用于计算单臂试验样本量的方法之一。
    IIa做完,如果觉得结果不错,可能就拍板进IIb了,IIb往往是双盲RCT了,对于肿瘤药物来说,往往也是相同/相似终点的time-TO-event设计。
    除了肿瘤药物外,IIa的概念在其他类型的药物中使用的不多,但II期使用单臂试验或者非RCT,也见于很多其他种类的药物。例如乙肝药物,可以单臂,看治疗前后病毒载量的变化情况。II期不是确认临床疗效的III期,不一定非得RCT。
    也不是所有的药物都适合做单臂研究。一些心身疾病或者精神疾病,如果单臂的话,由于安慰剂效应,往往难以较准确的判断药物是否真的有效,此时可能需要双盲RCT了。
  • yayya (2015-11-14 11:40:39)


    学习了。 单臂研究是什么意思? 是单盲吗?
  • 生物迷 (2015-11-14 11:40:56)

    QUOTE:

    原帖由 yayya 于 2015-11-14 11:40 发表

    学习了。 单臂研究是什么意思? 是单盲吗?
    单组,没有内对照。
  • iii_ii (2015-11-14 11:41:17)


    PK-PD,是药动-药效的意思吧
    非第一段中:PK(药代)-PD(药动)
  • 刘白白 (2015-11-14 11:41:51)


    等级变量和分类变量,往往用百分比(阳性百分比,男性百分比)描述,统计上使用卡方等
    时间变量,那只有生存分析来进行比较了
    ----这2句话建议推敲一下
  • 刘白白 (2015-11-14 11:42:15)


    “曾经见过一个单臂试验的synopsis(方案摘要),说是研究药物的有效性和安全性,没有control,没有比较,用描述性统计分析,可怕,完全没有临床研究的概念。”----这句话又讲得太绝对了。应该怎样讲,你修饰一下
  • 刘白白 (2015-11-14 11:42:33)

    完整的临床研究方案应有的内容:
    1、封面页(研究项目名称,PI的姓名和联系方式,申办者的名称和联系方式,方案的版本号)
    2、目录
    3、方案摘要(Synopsis)
    4、研究背景介绍
    5、研究药物介绍(毒副反应,药理、分布等)
    6、研究目的(主要目的,次要目的,主要和次要终点)
    7、研究方案
    (1)分组和治疗方案
    (2)入排条件
    (3)筛选期
    (4)随机方法和随机流程
    (5)治疗流程(盲法,详细的治疗方案,随访次数,每次随访进行哪些检查,特殊的如主要终点相关的检查如何操作等)
    (6)列出图表表明研究的流程,便于理解和记忆
    (7)出现AE时如何调整药物剂量/治疗方案
    8、药物的提供、储存和分发
    9、临床研究中的药物安全监测和不良事件报告
    10、数据收集、记录,Query等相关内容(如说明会收集数据,核对,可能和研究者联系要求澄清数据等)
    10、统计方案
    11、沟通和数据/研究论文发表
    12、参考文献
    13、附录(如疾病的诊断标准、病情评价标准,乃至产品或者研究中使用的已上市的对照品说明书等)
    14、PI和申办方代表签字
    ......

    ===========================================================================================================

    这个不算完整。是一个大致的完整。因此题目“完整的临床研究方案应有的内容”就应再斟酌一下。如果这是我写的东西,你会否又说是“.....”呢?
  • 刘白白 (2015-11-14 11:42:49)


    “6、按照方案随访,尽可能不要发生数据丢失 ”----如果有数据丢失呢?
查看完整回复请点击这里:
【讨论帖】药物的临床研究