查看完整版本请点击这里:
【讨论帖】药物的临床研究
【讨论帖】药物的临床研究
相关疾病:
一直很想总结一些东西,但一直懒,而且惴惴不安,因为:
1、这些东西其实都不是我的,我只是学习了而已
2、我也不敢确认这些东西是否一定正确
3、对于高手,这些东西都是很基础的毛毛雨似的东西,不值得一提
4、我还在学习的路上,自己还需要加强学习
所以一直没有像样的开什么帖子。
前一段时间提出申请版主和转正申请,自己内心其实非常惭愧,因为没有做过什么事情。犹豫再三,还是开了这个主题帖子,总结一下一段时间以来自己的学习所得,也欢迎大家留言探讨。
记得轻狂时曾经被一个大佬问过一句:
你觉得临床研究什么最重要?
我愕然,许久后惴惴说:很多东西都重要,样本量在很大程度上决定了I类和II类误差,入排条件框出了对象人群,统计学方法也很重要......
他摇头说:研究目的最重要,目的以及在目的基础上形成的假设,是临床研究设计中最核心的,其他的内容,可以说都是围绕这个而展开的。
首先介绍一下新药临床研究/开发的流程。
大家都知道,传统意义上,新药的临床研究分为I/II/III期,后来II期有分成IIa和IIb(很大程度上是因为肿瘤药物研究),接着出现了0期研究的概念(很大程度上也是因为肿瘤药物的研发)。然后又有人提出,0/I期为早期临床研究,IIa为中期临床研究,IIb和III期为晚期临床研究。
这种分类,其实我觉得在两个方面对我们愿意研究临床研究设计的人来说,是很重要的:
1、分期是和研究目的相关的,不同的目的,可以分到不同时期/阶段的
2、不同时期/阶段的临床研究,往往对应于一定的研究框架设计(交叉研究,平行对照,单臂,终点选择等等)
所以,理解不同时期/阶段的临床研究,其意义已经超出了知道有这样的分法本身。分期的一头是研究目的,另一头是对应的设计框架(当然也只是粗略的框架,很多问题,要根据疾病、药物等来确定),理解分期,有助于我们了解,一个研究目的,大体上有哪些设计方法和思路,大体上可以如何去处理;为什么该如此进行,各种设计的优缺点在哪里。
所以,我们先看一下不同阶段的研究目的:
0期:目的是在满足一定的统计学要求的前提下,在有限的样本量(通常不超过20)、有限的时间内(每个患者的治疗期常不超过数周),初步判断一个研究药物是否有效、某个剂量是否有效,是否应继续开发下去,附带看一下某些疗效判断方法是否可行。从目的角度,0期研究也是初步判断药物的效果,类似II期(尤其是IIa),所以0期的设计,在某些方面类似IIa的单臂研究,但是由于样本量小、又要满足一定的统计学要求,所以也有其特点,设计起来其实可能更为复杂。
I期:通常是摸索剂量(dose finding, dose-ranging),药代(PK)和药动(PD),样本量也不大(一般不超过20,或者20左右)。尤其是PD,通常会使用交叉研究。因为交叉研究有其特点,适合此类设计目的。交叉研究中,每个患者都是其自己的对照(在不同阶段,分别扮演研究组和对照组的角色),而且交叉研究的variance一般小于平行对照(因为每个人是其自己的对照,所以inter-personal variance基本没有),所以在利用样本方面,交叉研究的效率远高于平行对照,交叉研究如果纳入20例患者,平行对照50例都不一定能获得相似的Power。但是交叉对照也有很多限制,例如脱落和失访对交叉研究的影响远大于平行对照研究;同一个人,不同时期接受不同治疗、中间隔以洗脱期,导致后遗效应,以及治疗-时间相互作用等等。所以在后期临床研发中,很少看到有用交叉对照的(有,但远少于平行对照)。
0期和1期,由于其样本量都少,又可以引出另一个题目——small clinical trials怎么做?
II期是初步判断疗效的和安全性的(其实安全性贯穿研发始终),所以一般称为safety & activity研究(SA研究)。有多种做法,根据不同的临床疾病环境,以及既往数据等,可以采取单臂,平行对照的RCT等,终点一般选择surrogate,而不是clinical outcome。如果分IIa和IIb,则IIa往往是单臂,样本量一般不会过百;IIb则往往是平行RCT。
III期,是严格的验证药物效果的验证性临床研究。很多会议上介绍临床研究,往往以此类研究为模版进行介绍,在假设检验的框架下进行介绍。
这是第一帖,希望我能有勇气和毅力继续写下去。
查看完整版本请点击这里:
【讨论帖】药物的临床研究
【讨论帖】药物的临床研究
最新回复
生物迷 (2015-11-14 11:33:48)
0期的临床研究,主要见于肿瘤药物。
一个原因是,在公司开发化合物时,往往针对同一个靶点,得到同一个母核,但在不同位点用不同基团修饰,得到一系列化合物。不可能所有的化合物都去进行一系列临床开发,那样的话肯定是投入很大而产出未必能match自己的投入。临床前研究虽然能对筛选化合物有所帮助,但毕竟完全不能代替人体的临床研究。
另一个原因是,新药研发越来越难,投入越来越大,尤其是肿瘤领域,研发的成功率可能还要低些。这样,在研发时的一个策略就是,不断筛选、停止开发肯定/基本没有什么希望的药物,只把认为可能/很可能有效的药物投入下一期的临床研发。没有办法,整个药物研发的大头是在临床研发这一块,投入实在太大。
还有一个原因是,现在的化疗药物,越来越多的是靶向性的,总体上,其安全性高于细胞毒类药物。安全性也是一个开展0期的重要考虑。因为0期前,对于药物在人体的疗效知道的很少,所以对于参加0期研究的患者,很少能说可以提供什么疗效,如果已知安全性还有问题,那这样的化合物能否开展0期研究,恐怕需要仔细考虑。
0期的挑战,是如何在满足一定统计学要求的前提下,利用少的样本、短的时间,判断出药物是否值得继续开发。因为0期,对药物的临床疗效知道的很少(包括是否会有效,那个剂量可能有效),投入很多去做临床是不合适的。小样本,10+例,不可能套用传统的研究思路。
在0期时,往往会基于动物研究的结果,先设定要探索的剂量(可能会分几个剂量水平),每个剂量水平可能只有数个患者。这么少的患者,variance的相对影响会比较大,因此需要结合药物的作用机制和靶点,选择灵敏的、能反映药物作用机制(是否对人体也有这样的作用机制)的biomarker作为终点。
通常会选择相同的biomarker,但在两个不同的组织/细胞中进行检测,一个是肿瘤的活检组织(基本上一定会用,只要活检在临床上可行),一个是外周血单个核细胞(PBMCs,常用,但具体是否该用,还需结合药物的机制)。
PBMCs抽血即可得,可以在不同时间多次抽取和检测分析(但是又可能会引出一个重复测定值如何分析、包括如何处理variance的问题——来自同一个患者的不同时期的检测值,可能不是互相独立的,而是彼此相关的,因此不应象完全独立的数据那样处理——因为是来自同一个人的检测),治疗前,治疗后都多次测。
肿瘤活检会麻烦些,反复做不可行(相对于抽血,穿刺活检毕竟风险难度等都要大不少),所以一般可以的话,穿两次,一次是基线,一次是治疗后的某个时点,通常这个治疗后的时点是,从临床前研究得出的治疗后盖biomarker变化最显著的时点,这样可以使治疗前后的差异尽可能达到最大,能体现效果。
指标有了,可能要在两个水平定义患者对药物的应答:
1、单个患者的水平,治疗前后biomarker的变化达到什么程度(PBMCs和肿瘤组织要分别定义),为有response(一般PBMCs和肿瘤组织中一个满足定义,就可以视为有response)
2、在一个剂量水平上,所有接受治疗的患者(单臂研究),多少患者出现1描述的response,视为该剂量的研究药物有效?
前者在很大程度上来源于对该biomarker的前期研究和理解,而后者更多的是基于统计学(二项式变量)的Power、I类误差等的考虑
最后的结论,可能不外乎3个:
1、达到统计学要求,可以进行下一步开发;
2、有一定希望,但未满足统计学要求,可能是回去修改化合物(修饰),或者换用其他基团修饰的化合物(如果手上有系列化合物的话)再来进行0期研究
3、肯定没有效果,放弃同一系列的化合物,不再开发
生物迷 (2015-11-14 11:34:07)
本来该接着写I期的,但想想,先写这个吧,也算是一个基本概念了。
变量是统计学中常用的一个定义,这里就不详述了。
变量可以分类,但具体分哪些类,不同的人可能有不同的观点。
有人分成以下几类(下面这个应该是分类最多的,其他人可能分的类会少,但不会比下面这个多了):
1、数学变量(包括连续变量和离散变量)。所谓连续变量,可能是指如果我的测量工具精度是无限的,我得出的测量结果也是个无限小数,或者说,其测定值在可能在范围内的任何一点。而离散变量,我只能打比方了,例如人数,他不可能是小数,而一定是整数,这种一定是整数的变量,就是离散变量的典型代表。
数学变量:
有大小
其大小是有意义的,例如血压140mmHg高于130mmHg,这个就是有意义的
该变量两个测定值的差异也是有意义的,相同的差异含义相同;例如140mmHg-130mmHg=10mmHg,这个10mmHg是有意义的,而且它的含义和130mmHg-120mmHg=10mmHg是一样的意义
2、等级变量(ordering)
在临床研究中,我们常看到,0:无症状;1:轻度;2:中度;3:重度。这种变量就是等级变量。
等级变量:
有大小
大小是有意义的(例如3>2,代表3更严重)
两个测定值的差异是没有意义的,也不必去理相同差异的含义(重度和中度差1,中度和轻度也差1,但重度~中度之间的距离,不一定是中度~轻度之间的距离,所以不必去理会差异)
3、分类变量
类似于字符一样,只是用数字进行归类而已,例如0代表无,1代表有;或者0代表男,1代表女。
分类变量大小没有意义。
分类变量中,有/无这种,就是广泛使用的二项式(分类变量)
还有一类变量,不知道该如何描述,姑且称为时间吧,出现在生存研究/time-to-event研究中,只有这类研究才有。即发生某个event的时间。非常特殊。
变量可以转换,当然必须是有意义的转换。
例如血压,治疗前后的血压差异,是个连续的数学变量;如果入选的都是高血压的患者,定义治疗后血压恢复正常为有效,则就把它转换为有/无效果的二项式变量了。
有人将等级变量和分类变量合并在一起,统称为分类变量,因为在统计处理上,往往采用类似的方法(用百分比等来描述)。
不同的变量,采用不同的方法来进行统计描述,和统计分析。
连续变量,往往是mean+SD,等来描述;统计学方法包括t检验、z检验等
等级变量和分类变量,往往用百分比(阳性百分比,男性百分比)描述,统计上使用卡方等
时间变量,那只有生存分析来进行比较了
通常,连续变量的灵敏度高(容易体现出差异),而分类变量的灵敏度低(不容易体现出差异)。所以,如果能以血压差异来作为疗效判断标准,就最好不要用血压恢复正常者的比例来作为疗效标准(但现在,越来越取决于相应指南,不能如自己的愿了)
对于生存分析,和对应的分类变量相比,灵敏度高(易于体现差异)。
生物迷 (2015-11-14 11:34:25)
相关疾病:
早期临床研发:合适剂量
最合适的剂量,有以下几种可能。
1、疗效达到某种程度的最低剂量(例如,使90%的患者血压下降10mmHg的最小剂量;使90%的患者疼痛消失的最小剂量),而这个程度,需要结合药物和疾病,来判断
2、最大无毒性剂量,一般见于认为药物有量效关系(剂量越大越好)的非细胞毒类(也没有其他已知的严重不良反应的)药物,无毒性不是说没有人发生SAE,而是说发生可能与药物相关的SAE的受试者比例在一个可以接受(且事先规定的)低水平(如不超过5%)
3、最大耐受剂量,常用于细胞毒类药物,认为此种药物有一定毒性,但剂量越大疗效越好,所以规定一个多少比例的受试者发生SAE的上限,达到这个上限的剂量即为最大耐受剂量。例如,规定30%(常用30%作为标准)的受试者出现严重(但可以恢复)的可能与药物相关的SAE的剂量,为最大耐受剂量。
4、最可能有效的剂量,适用于非细胞毒类抗肿瘤药物,例如某个受体抑制剂,通过现代技术,定义90%的患者中,肿瘤组织的受体被抑制达到95%以上(这些具体数字仅供参考,不同药物可能不同),为最可能有效的剂量
5、最适合的联合使用剂量,用于联合治疗的药物,定义和设计非常复杂。
光一个合适剂量,就有这么多定义和标准,不同的药物,选择不同的标准。
生物迷 (2015-11-14 11:34:45)
相关疾病:
临床研究:指标的判定标准,软指标和硬指标
临床研究中,会用到不同的疗效判定指标(更准确的说法似乎是终点,endpoint)。
判断一个指标/终点的意义和价值的标准包括:
1、临床上的重要性
2、是否有较好的工具/手段进行测量(或者说测量的可行性)
3、是否可以较好的反应药物的疗效
4、可靠性和准确性(出现测定误差的可能性大吗?重复测量的结果吻合度如何?)
5、敏感性(能否灵敏的体系疗效差异?)
6、特异性(不易受其他因素影响)
在临床研究中,指标的“软”和“硬”,可能指的往往是
1、临床重要性
2、可靠性和准确性
最硬的指标,就是生存/死亡的判定,最有临床意义(能延长生命的,意义肯定是非常大的),也几乎不可能出错。
排在这个指标之后的,可能有疾病复发/进展,临床意义也很大,但可能需要一定的辅助检查,而辅助检查又牵涉到仪器和检查者的水平,所以虽然也比较“硬”,但“软”于生/死。
接下来的,可能是实验室指标、病理检查等。也比较可靠和准确,但临床意义可能弱于前者。
再下来,体检(如血压等)。
后面可能是QOL或其他类似的系统化了的、有临床意义的问卷,虽然有临床意义,但客观性弱。
最软的可能是非系统化的问卷,例如疼痛程度,瘙痒程度等。
问卷和非问卷的症状,往往又称为PRO(patient reported outcome)。
但是临床研究的终点,不是越硬越好,必须首先考虑临床研究的目的,药物的治疗目的。
例如,对于肿瘤治疗药物(化疗药物等),生/死是最硬的,其次是疾病进展/复发等。
但是对于治疗癌性疼痛的,可能PRO中的疼痛程度才是最合适的终点指标。
生物迷 (2015-11-14 11:35:03)
相关疾病:
普通感冒 阿尔茨海默病
对照
其实这个东西,ICH-E10有专门的描述,如果有兴趣,建议大家阅读ICH-E10去。
曾经见过一个单臂试验的synopsis(方案摘要),说是研究药物的有效性和安全性,没有control,没有比较,用描述性统计分析,可怕,完全没有临床研究的概念。
当我们谈到药物有效无效的时候,就需要比较。就好像俗话说,没有坏,怎能说好。
比较就需要对照。
对照分两大类:
(同期)内部对照,也就是说,研究里有个对照组,属于研究“内”的对照。
外部对照,包括历史数据对照,基线对照(同组治疗前后比较)等。
历史数据对照有它的问题,例如辅助治疗的进步,诊断治疗水平的提高等等,都可能使得历史数据不能反映当前的实际情况,此时用历史数据作为对照,可能夸大研究药物的效果。
基线对照也有其问题。有些疾病有自愈的倾向(例如感冒),这时基线对照可能就没有太多意义。有的疾病,现有的手段只能延缓,却不能改变疾病的进展方向。例如阿尔茨海默病,现有手段只能延缓认知功能减退的情况,却不能在一个较长期的水平上提高或至少维持其不变,此时如果用基线对照,绝大多数情况下,药物会显得没有效果。还有些疾病,受心理暗示的影响比较大,如一些心身疾病/神经官能性疾病,哪怕给患者一些没有活性的安慰剂,很多患者的症状也会减轻(很典型的安慰剂效应),此时使用基线对照也会有问题。
外部对照通常用于探索性或者初步看疗效的单臂临床研究(如前面谈到的0期就使用基线对照,肿瘤的IIa,如果有较好的历史数据,也可以使用历史对照)。但并不是所有的疾病,或者所有的药物,都适合用单臂试验来初步看临床效果。
生物迷 (2015-11-14 11:35:56)
bias和随机误差
bias其实也属于误差,即以前大家常说的系统误差。
有些人喜欢用信号来表示临床研究。打个比方,收音机把,播音员真实的声音是我们想检测的疗效,杂音就是误差。而我们要做的,就是将杂音和播音员的声音区分开来,听清楚播音员说的是什么。
随机误差几乎永远存在,患者的病情波动,仪器准确度的波动(没有坏,但其准确度可能还是有细微的波动)等等。但随机误差有个特点:没有方向,也就是说,所有的随机误差汇总的话,其预期净值是0(当然这是理想的情况)。由于样本量、患者个体差异等等,随机误差不会完全消除,但样本量增大、观察时间延长会降低随机误差。总体上,如果样本量大,设计严格,随机误差不是个大问题。
bias(系统误差)就很可怕
它可以大量产生,虽然看起来比较散,但其实有一个共同的方向
少数情况下我们可以分析出bias甚至通过统计学方法给它定量,以消除其对疗效判断的影响,但多数情况下,我们难以分析和定量;虽然它有一个方向,但其方向和强弱我们通常难以预期和分析
有时它甚至会掩盖真实的治疗效果/信号
如果没有检测分析到,不能采取相应的纠正措施,则重复试验时它依然会存在
有人将疗效称为信号,将随机误差称为背景杂音,而bias就是对信号的扭曲(不是杂音)。
临床研究中常见的bias有:
1 selection bias:虽然方案没有规定,但研究者有选择的将具有某种特点的患者分到某个治疗组(可能是因为他相信具有这种特点的人对该组治疗更能获益),这样会导致该组患者在很大程度上具有不同的特点,继而影响疗效结论
2 procedure bias:研究方案设定等导致某种患者接受某种治疗,结果导致两组患者不一样。例如一个研究比较手术和化疗对某种肿瘤的生存有无差异。但是,能够手术的患者往往状态较好、而且很可能没有转移(否则恐怕无法手术治疗),这种研究设定,可能直接导致两组患者是不同的,最后如果手术组效果好,生存长,我们也不知道是因为手术治疗更好,还是因为手术组患者的病情和整体状况优于化疗组的关系。
3 observational bias:开放研究,用主观性较强的指标时常出现。当研究者或者患者对某个治疗抱有期望,认为它很有可能有效时,这会反映到指标变化上面(这个治疗,症状改善更明显等),甚至一些相对客观、但需要人来判断的辅助检查,也可能出现(例如病理检查等)
4 postentry exclusion:在患者已经入组后,带有一定目的的排除某些患者,如排除对治疗没有应答或者出现不良事件等的患者
5 confounders(混淆因素):多见于没有随机和内部对照的研究(但RCT里可能也会出现),因为存在一些同时和治疗及预后/outcome相关的混淆因素所导致的。例如COPD的患者,吸烟是个很重要的因素,如果不同组患者的吸烟情况不同,那结果的分析就可能出问题。
6 数据丢失(患者退出失访、或者中间不按时随访等):有些丢失是随机的,有些丢失则可能和治疗有关。例如和对照相比,某个治疗的不良反应更多更大,此时可能该治疗组患者退出更多
7 事后(方案未规定的)亚组分析:这些结论只具有启示性,但还需要进一步验证,因为(1)存在反复检验导致I类误差膨胀的可能;(2)可能是有选择的、根据数据结果挑选亚组进行分析的。
8 因为获得阳性/阴性结果提前终止研究,可能出现统计学的bias(对疗效的估计发生偏差)
bias一旦产生,往往很难分析、将其和疗效判断区分开来(有可能,但希望不大)。所以,首先要做的是预防,在方案和执行过程中预防和消除bias。
1、随机,充分的随机可以消除selection bias。block和分层随机有助于消除confounders的影响,尽可能确保两组患者在已知的confounders因素上是具有可比性的
2、设计的合理性,确保两组患者来自同一人群
3、好的盲法,可以消除observational bias
4、ITT原则,尽可能不要在入选后排除患者,中途退出的也要纳入分析
5、在研究许可的范围内,尽可能采用客观性强的终点
6、按照方案随访,尽可能不要发生数据丢失
nn255 (2015-11-14 11:36:25)
对于喜欢批判思考药物疗效的人,这个博客是由非常专业的医生们所写:
http://www.sciencebasedmedicine.org/
生物迷 (2015-11-14 11:36:51)
确实存在这种情况,细胞和动物种属的差异,还有人体是非常复杂的一个系统,体外细胞层面的结果,放到这个系统,未必能得到类似的结果。有可能临床前研究得出不错的结果,明确的靶点机制,到了人体,情况变了。
首先I~III/IV本身可以看成是一个筛选的过程,看耐受性,看安全性,看初步的疗效,行再往下走,不行就停掉。所以我们看到,每个时期目的样本量、以及相应的花费都是不同的,总体而言是一个规模逐渐增大、费用也增加的过程。这样做,目的就是——如果药物没有希望,尽可能早期发现早期停止,减少损失。这个理念一直是存在的。
至于验证临床前研究所得的机制,在人体是否也存在,这是典型的0期的目的。0期的概念源自肿瘤药物,但并不是说这个概念不可以推广到其他类型的药物。
0期,以前有人称为转化研究(translational study),现在称0期的多。它就是临床前研究和I~III期临床研究之间的桥梁研究(bridging study),主要目的是:
用很少的样本量(一般不超过20),在满足一定统计学要求的前提下,验证临床前研究所得的药物治疗机制,在人体是否存在
另外,它也可以获得一定的药物ADME或者药动学(PD)的数据,还可以验证一下,检验药物作用机制的方法的可靠性(是否可以通过检测某个受体的变化来验证此类药物在人体的机制等)。
0期目前还主要用于肿瘤研究,一方面是因为肿瘤药物的失败率更高(曾有人分析过,10年中,从提交IND到获得NDA批准,肿瘤药物获批的成功率是平均水平的一半),需要尽早筛选;另一方面是可行性比较高,肿瘤组织可以穿刺活检,而且临床上此种操作比较成熟。
而其他类的药物,进行0期研究,可能方法学上有一定困难。如何用一个方法来验证,药物可以结合某个部位的某个受体、发挥抑制作用?例如,期望药物能进入中枢神经系统、抑制某个受体,我们该如何操作?动物我们可以进行有创的一些检查、取脑部组织、脑脊液等,人体呢?
所以,个人浅以为,这个概念其实已经有了,只是具体问题执行时,可能存在一定的困难,肿瘤药物相对可行,所以这个概念目前较多用在肿瘤领域。
nn255 (2015-11-14 11:37:14)
最早的几个0期好像都是NCI出的钱,可见药厂的态度。
生物迷 (2015-11-14 11:37:34)
相关疾病:
冠心病阿尔茨海默病
ITT和PP
Intention to treat (ITT)是一个原则,或者说一个分析集,Per protocol (PP)是另一个分析集。
ITT要求:all subjects are compared in the treatment groups to which they were originally randomized, regardless of any treatment that they subsequently received。所有中途退出/失访等的,也需要按照其当初的治疗分配纳入相应组进行分析。
PP集则主要纳入符合方案(可能需要在方案中规定何为“符合方案”)的受试者进行分析。
PP集反映的其实是药物最大疗效。
ITT相对于PP,有其优势:
1、更好的反映了实际治疗中发生的问题。患者退出、失访、依从性不佳等,都要纳入,反映在疗效结果上,其实比起PP,更能反映临床治疗中发生的情况。
2、ITT使用的是来自几乎所有患者的数据,因而可以进行中期分析;而PP不同,不到最后,不知道哪些该纳入PP集,因此,PP不太允许中期分析
3、ITT能反映临床实践中出现的一些问题。例如一些严重的冠心病(CAD)患者,一组择期搭桥,一组急诊冠脉成形(PTCA),PP集可能只比较完成搭桥手术的人群和完成PTCA人群的结果。但临床实践中,择期搭桥可能意味着要完善术前检查,从签署ICF到手术可能有一段时间,如果患者在这段时间内死亡,PP集一般是不纳入的,而ITT集可能会纳入,这样,ITT集的结果更贴近临床。
但是ITT有个假设,即不依从、包括脱落退出等,是在不同治疗组随机分布的、比较均衡的,如果这个假设前提不存在,则ITT也可能出问题。
虽然ICH-E9把ITT的结果放在第一位,但其实ITT和PP应该综合来看。
ITT和PP结果大体一致,都有显著性或者都无显著性,则提示结果比较可靠。
如果PP的显著性明显高于ITT的,提示可能不依从的现象较多,稀释了ITT的显著性。
如果ITT的结果是显著性的,而PP结果是非显著性的,可能存在bias或者confounders,最常见的是ITT的假设(不依从是在不同治疗组随机分布)不成立,而且伴随其他纠正措施不充分或者不正确。例如,在阿尔茨海默症的临床研究中,我们知道,目前药物只能延缓认知功能的衰退,但无法逆转疾病的进展方向。如果A为研究药物,C为对照药物,A组很多患者中途退出(因为安全性或者别的原因),如果将LOCF(末次随访结果)计为最终结果,则A组患者最后的认知功能会好于C组,这样可能出现PP集无显著差异而ITT集有显著差异的情况。
PP集是显著性的,而ITT集是不显著的。一方面可能是不依从的情况非常多,还需要注意switch的情况,即患者中途从治疗C转换为治疗A,这样按照ITT的原则,发生了此种转换的患者,其最终结果应纳入C组,而PP集可能剔除这些患者,只纳入那些没有转换的患者。如果A治疗是优于C治疗的,一旦swicth的患者多,可能出现PP集有显著性,而ITT集无显著性的情况。
Switch是非常麻烦的。在E9正式颁布的时候,对于如何处理Switch,统计学届还没有提出比较好的方法。目前已经有了进展,但可能还在发展中。
虽然我们倾向于将ITT集的结果放在第一位,但内心也应保持一定的警惕,应注意ITT和PP的结果是否一致,不一致首先怀疑是否有bias。
生物迷 (2015-11-14 11:38:11)
完整的临床研究方案应有的内容:
1、封面页(研究项目名称,PI的姓名和联系方式,申办者的名称和联系方式,方案的版本号)
2、目录
3、方案摘要(Synopsis)
4、研究背景介绍
5、研究药物介绍(毒副反应,药理、分布等)
6、研究目的(主要目的,次要目的,主要和次要终点)
7、研究方案
(1)分组和治疗方案
(2)入排条件
(3)筛选期
(4)随机方法和随机流程
(5)治疗流程(盲法,详细的治疗方案,随访次数,每次随访进行哪些检查,特殊的如主要终点相关的检查如何操作等)
(6)列出图表表明研究的流程,便于理解和记忆
(7)出现AE时如何调整药物剂量/治疗方案
8、药物的提供、储存和分发
9、临床研究中的药物安全监测和不良事件报告
10、数据收集、记录,Query等相关内容(如说明会收集数据,核对,可能和研究者联系要求澄清数据等)
10、统计方案
11、沟通和数据/研究论文发表
12、参考文献
13、附录(如疾病的诊断标准、病情评价标准,乃至产品或者研究中使用的已上市的对照品说明书等)
14、PI和申办方代表签字
生物迷 (2015-11-14 11:39:46)
最简单的dose ranging设计:3个一组爬坡
多见于肿瘤药物。
在进行这样的设计之前,先要确定:
1、用于人体的起始剂量(在参照临床前动物研究的基础上制定,要求有足够的安全空间)
2、剂量增/减规则(如果一个剂量是安全的,下一步要增加剂量,如何加?如果一个剂量是不安全的,下一步要减剂量,如何减)
3、哪些是剂量限制性毒性反应
可以看到,上面这些内容,很多都带有相当的主观色彩,没有办法。
然后,起始剂量组3个受试者,进行研究:
(1)如果没有人出现剂量限制性毒性反应,认为这个剂量是安全的,另换一组受试者进行下一个更高剂量水平(剂量上调)的研究;
(2)如果有2个或更多的受试者出现剂量限制性毒性反应,认为这个剂量是不安全的,另换一组受试者进行下一个更低剂量(剂量下调)水平的研究;
(3)如果有且只有1个受试者出现剂量限制性毒性反应;该剂量水平上追加3个受试者;追加的3个受试者中没有人出现剂量限制性毒性反应,就按照(1)走;追加的3个受试者中2个或更多的受试者出现剂量限制性毒性反应,就按照(2)走;追加的3个受试者还是只有1个受试者出现剂量限制性毒性反应,认为该剂量是合适剂量,停止研究。
只是这种方法得出的合适剂量,往往是偏低的。
生物迷 (2015-11-14 11:40:05)
我也没有办法再写早期临床开发,尤其是剂量探索,因为从没接触过。
所以,我可能从II期开始。
II期分为IIa和IIb,但这主要见于肿瘤药物,对于其他药物,不一定适用。可能是因为肿瘤药物的失败率更高,所以需要多一次筛选(IIa)
一般而言,肿瘤的IIa研究,多采用单臂试验,根据药物的特点,选择相应的终点(细胞毒就用tumor response,非细胞毒的靶向药物就用无进展生存Progression Free Survival)。采用time-to-event的设计。
单臂试验采用外部对照,往往是历史数据。
单臂试验的样本量计算,有多种方法,但往往是两个原则选择其一:
1、一个原则是类似于假设检验,如果有比较好的历史对照数据,要求研究药物和对照之间有多少差异,是优效或者非劣效等,即大家在III期玩得比较多的那套计算样本量的方法;只是IIa不是III期,I类误差通常是0.1而非0.05,II类误差通常也是0.1而非0.15或者0.2。
2、另一个原则是,看数据准确度,即要求最后的variance到多少,或者95%可信区间位于什么水平,举例,如果做出来研究治疗的PFS点估计值是5个月,规定这个点估计值的95%可信区间位于该点估计值的80%~120%之间,即该PFS的95%可信区间应在[4,6]个月内。通过对这种variance的规定,可以估算出单臂试验所需要的样本量是多少。
第二种方法可能大家在实际临床试验中使用的不多,但确实也是用于计算单臂试验样本量的方法之一。
IIa做完,如果觉得结果不错,可能就拍板进IIb了,IIb往往是双盲RCT了,对于肿瘤药物来说,往往也是相同/相似终点的time-TO-event设计。
除了肿瘤药物外,IIa的概念在其他类型的药物中使用的不多,但II期使用单臂试验或者非RCT,也见于很多其他种类的药物。例如乙肝药物,可以单臂,看治疗前后病毒载量的变化情况。II期不是确认临床疗效的III期,不一定非得RCT。
也不是所有的药物都适合做单臂研究。一些心身疾病或者精神疾病,如果单臂的话,由于安慰剂效应,往往难以较准确的判断药物是否真的有效,此时可能需要双盲RCT了。
yayya (2015-11-14 11:40:39)
学习了。 单臂研究是什么意思? 是单盲吗?
生物迷 (2015-11-14 11:40:56)
QUOTE:
单组,没有内对照。iii_ii (2015-11-14 11:41:17)
PK-PD,是药动-药效的意思吧
非第一段中:PK(药代)-PD(药动)
刘白白 (2015-11-14 11:41:51)
等级变量和分类变量,往往用百分比(阳性百分比,男性百分比)描述,统计上使用卡方等
时间变量,那只有生存分析来进行比较了
----这2句话建议推敲一下
刘白白 (2015-11-14 11:42:15)
“曾经见过一个单臂试验的synopsis(方案摘要),说是研究药物的有效性和安全性,没有control,没有比较,用描述性统计分析,可怕,完全没有临床研究的概念。”----这句话又讲得太绝对了。应该怎样讲,你修饰一下
刘白白 (2015-11-14 11:42:33)
1、封面页(研究项目名称,PI的姓名和联系方式,申办者的名称和联系方式,方案的版本号)
2、目录
3、方案摘要(Synopsis)
4、研究背景介绍
5、研究药物介绍(毒副反应,药理、分布等)
6、研究目的(主要目的,次要目的,主要和次要终点)
7、研究方案
(1)分组和治疗方案
(2)入排条件
(3)筛选期
(4)随机方法和随机流程
(5)治疗流程(盲法,详细的治疗方案,随访次数,每次随访进行哪些检查,特殊的如主要终点相关的检查如何操作等)
(6)列出图表表明研究的流程,便于理解和记忆
(7)出现AE时如何调整药物剂量/治疗方案
8、药物的提供、储存和分发
9、临床研究中的药物安全监测和不良事件报告
10、数据收集、记录,Query等相关内容(如说明会收集数据,核对,可能和研究者联系要求澄清数据等)
10、统计方案
11、沟通和数据/研究论文发表
12、参考文献
13、附录(如疾病的诊断标准、病情评价标准,乃至产品或者研究中使用的已上市的对照品说明书等)
14、PI和申办方代表签字
......
===========================================================================================================
这个不算完整。是一个大致的完整。因此题目“完整的临床研究方案应有的内容”就应再斟酌一下。如果这是我写的东西,你会否又说是“.....”呢?
刘白白 (2015-11-14 11:42:49)
“6、按照方案随访,尽可能不要发生数据丢失 ”----如果有数据丢失呢?
【讨论帖】药物的临床研究