简介
有关急性中枢神经系统(CNS)损伤的生化学反应的实验室研究发现为进一步干预和治疗提供了有希望的靶点。已有大量的工作致力于将这些研究发现转化为人体研究。据我们所知,只有两种治疗方法已证实有效:组织纤溶酶原激活物和低体温治疗(用于出生窒息和院外心室纤颤性心脏骤停)。这些发现的局限性在于患者人群相对较小。
目前研究仍在继续对旧观念进行探索,回避一些新概念。而这种状态不同于15年前的情况,那时候当许多新颖的干预治疗正在临床研究中。急性CNS损伤的复杂性显然是被低估了。增加对病理生物学机制的理解将会提高成功的机会。然而,也出现了一种模式认为临床前研究的治疗等同于临床试验的成功。这种模式对于促进临床治疗有一定的意义。本文回顾了提供治疗干预措施的临床前研究设计的演化过程。
代谢性干预
在药理学方面降低脑代谢率可增加对缺血的耐受性。在犬类中,通过硫喷妥钠预处理可减弱因全脑缺血诱导的三磷酸腺苷损耗,但只有当皮层持续性电活动受到抑制时才存在。
一些实验发现巴比妥酸盐对局灶性缺血的疗效。在猴子中,硫喷妥钠可改善短期全脑缺血功能性预后,但只有在再灌注后15分钟内给药才有效果。这些数据鼓励在昏迷的心脏骤停幸存者中进行硫喷妥钠的研究,然而没有观察到疗效。值得注意的是,只有15%的患者在恢复自然循环的15分钟内接受了硫喷妥钠的治疗。在灵长类动物中又进行了一次研究但不能复制之前报告的结果。
谷氨酸
二十世纪80年代增加了对急性CNS损伤的细胞和分子反应的理解。急性CNS损伤中谷氨酸浓度失调的发现使得出现了协调兴奋性神经毒性和钙超载的概念。两种谷氨酸拮抗剂,selfotel以及gavestinel进入到临床试验中。
Selfotel
7项临床前研究被认为是进行卒中临床试验的正当理由;只有4项研究是针对卒中的。没有一项研究是随机化盲法进行的,也没有一项研究考虑了对大脑温度的影响。研究中最长的恢复间期是4天。没有一项研究对行为方面预后进行了评估。
只有在缺血发作前或发生后5分钟内开始治疗才能观察到组织学获益。在一项临床试验中,开始治疗的平均时间为4.5小时,在发作后90天进行预后的评估。治疗剂量(1.5mg/kg体重)因拟精神病药样作用而效果受限,远远少于达到临床前疗效所需的剂量。由于selfotel治疗组患者死亡率更高,该研究被提前终止了。
Selfotel在人体创伤性脑损伤 (TBI)中也产生相似的效果。在损伤后8小时内开始治疗,在6个月之间评估患者的预后。由于可能增加死亡和大脑相关的不良事件,selfotel研究过早地被终止了。只进行了2项临床前TBI研究。两项研究的治疗方法都是在几分钟内给予的,但均没有进行功能性预后的评估,恢复仅限于不到4小时内。
Gavestinel
Gavestinel是一种竞争性甘氨酸识别位点拮抗剂,没有拟精神病药样作用。有2项Gavestinel的临床研究。可用于证明人体研究正当性的临床前研究数据较少。
主要一项研究表明在大鼠永久性大脑中动脉闭塞后6小时开始治疗可减少梗塞面积的大小。没有对神经系统功能进行评估,尽管这是用来定义临床疗效的指标。最长的恢复间隔期为7天,与临床试验中3个月预后评估结果不一致。没有对大脑温度进行控制。研究既不是随机的也不是盲法的。Gavestinel能否穿过血脑屏障也尚不明确。
出现了一种用于启动巴比妥酸盐和谷氨酸拮抗剂进行人体研究的模式。临床研究援引临床前研究证明其正当性的理由很少或没有与正在进行的特异性研究相关的临床前证据。来自于各种形式的CNS损伤收集的证据被认为是足够的,无论其实验设计质量如何。临床前证据水平尚不充分,这表明需要一种更复杂的临床前证据体系针对特定的损伤,以便能够建立临床研究设计和证明其正当性。
低温疗法
有关大鼠和狗类中全脑严重缺血后进行适度的低温诱导治疗的报道引起了极大的兴趣。当前的考虑已集中于作为急性CNS损伤最常见机制,包括兴奋性毒性作用和氧化应激。适度的低温可减缓这些途径的过程,在创伤性脑损伤,心脏骤停,围产期窒息,脑动脉瘤手术等临床疾病中可发挥神经保护作用。在每个领域开始进行的研究都伴有不同程度的临床前准备。临床疗效和临床前试验质量之间存在相关性。
对于创伤性脑损伤,14项临床前研究特别对预后进行了评估。其中,7项研究中功能恢复超过1周,并且只有3项发现有改善。在所有明确有持续性疗效的报道中,是在实施影响后5-15分钟内进行的降温治疗。即使是仅有短期的改善,低温必须在15-60分钟内进行诱导才是有效的,延迟至90 - 120分钟没有任何获益。
在创伤性脑损伤主要的临床试验中,在住院数小时后才得以实施治疗性低温诱导。回顾来看,随后进行的临床前数据预测了临床研究的失败,令人想起成人心脏骤停后硫喷妥钠的治疗经验。
对于脑动脉瘤手术,进行动脉瘤夹闭的患者被随机分为适度的低体温治疗组或保持正常体温组。低温治疗和复温仅仅限于在手术过程中进行。低体温对三个月的预后没有影响。低体温可能是无效的;然而,据我们所知,目前还没有进行针对于蛛网膜下腔出血低温治疗的临床前研究。
因此,达到疗效所需的低温冷却的深度和持续时间是未知的。鉴于该项临床研究的失败,不太可能重复进行足够有力的研究,不管有无有力的临床前数据;因为悲观的前景以及另一项研究的成本。任何针对这种高危手术的低温治疗可能的效应已经失去了可预见的未来。
对创伤性脑损伤和动脉瘤手术数据的结论可能是适度的低温疗法没有潜在的获益。然而,适度的低温治疗可以改变急性CNS损伤的预后;这更似乎可归因于缺乏临床前准备,需要针对这些失败进一步协调临床研究设计。
2002年,独立的研究报告心室纤颤性心脏骤停的患者可从适度的低温治疗中获益。尽管需要治疗的患者数量只有6例,这些数据仍然被作为推荐的实践而被人广为接受。针对这种干预的临床前研发过程仍在继续。
实验室研究表明在全脑缺血后进行适度的低温治疗可以减少脑损伤。这些确凿的数据激发了对临床试验的热情。然而,这些临床前研究中没有一项研究其生存时间间隔大于1周,只有一项研究对行为学进行了评估,没有一项研究冷却时间超过5小时。幸运的是,不久实验室发现短期缺血后低温治疗未能改善长期预后,至少冷却12小时对于产生长期的功能性获益是必要的。
这个发现证明对指导人体心脏骤停研究是很关键的,有两项研究证实了持续冷却的疗效。前一项研究对人体研究中达到低温治疗深度的必要性提出了争议。与后来从一个真正的心脏骤停模型中获得的动物数据相一致。研究表明36.0°C可能就足够了。从心脏骤停使用低温治疗研究中获得的教训对于临床前研究的转化是很重要的。首次在临床前研究中定义了临床试验设计的关键元素。
这种情况对于出生窒息的治疗更引人注目,在这方面的临床试验也证明了适度低温疗法的疗效,其使用已被广泛推荐。在这种情况下,临床前的研发是很有力的。独立的实验室使用临床相关的模型。采用较大的物种来优化人体大脑低温研究的实验方案。在新生大鼠中定义了最佳治疗时间和长期功能性疗效。
对于新生儿窒息性脑病,低温治疗临床试验的效果能够足够强大而不管临床前开发的质量如何吗?新生儿中治疗所需的例数是6例,治疗效应量相对较小。更可能的是恰当的临床前研发以及与临床前发现一致的临床研究设计能够解释这种显著的临床成功。
一个新的开始
在1999年,很明显出现了更多系统性的方法表明临床前开发对转化为在患者中实施的神经疗法是必要的。这种需求在卒中治疗学术工业圆桌会(STAIR)声明出现时达到高峰。STAIR声明推荐关注疗效强度和临床相关性的定义,包括药物动力学、治疗窗、相关动物模型、生理监测、预后评估、性别差异以及与其他药物的相互作用等。
STAIR推荐对于药物开发来说是一个受欢迎的的蓝图,尽管还没有被验证。一种抗自由基的硝酮化合物, NXY – 059,是针对缺血性卒中的,其正在开发中。11项同行评议的研究报道了临床疗效。 总的来说,这方面的证据是为了符合STAIR推荐并证明临床研究正当性而提出的。在卒中患者剂量升级分析后,进行了2项随机、双盲临床研究。临床卒中的患者在卒中发病或临床诊断后的6小时内接受NXY- 059或安慰剂治疗72小时。
在第一项研究中, NXY – 059能够改善发病后90天改良Rakin评分。然而,对死亡率,NIHSS得分,或Barthel指数等均没有影响。第二项研究纳入了更大的样本量人群以便严格复制第一次研究。尽管几乎是差不多的实验设计,但结果显示NXY-059对预后没有任何影响。
NXY- 059尸检研究
NXY- 059的失败减少了对卒中药物干预研究的热情。评论称该失败不仅是NXY – 059的失败,而且是STAIR标准的失败。 大多数评论是质疑那些满足这些标准的数据的质量。Macleod等对声称NXY – 059具有疗效的临床前研究进行了评估。九项同行评议研究报道了脑梗死的大小。对这些研究进行了评分,最高评分为10分。
即使是评分最高(8分)的研究都只是在大脑中动脉闭塞再灌注1小时后评估治疗。余下的研究也有重大缺陷,包括缺乏随机化(6 项研究),没有计算样本量(7 项研究),没有进行盲法的结果评估(5项研究),也没有关于利益冲突的说明(9项研究)。没有研究涉及到糖尿病动物,只有一项研究是在高血压动物中进行的,这些疾病在临床研究中都是很普遍的。这些因素对结论有重要的影响。
在随机研究中,梗死面积减少了20%。在非随机化研究中,病灶大小减少了53%。当采用非盲法进行病灶大小评估以及在正常血压大鼠和高血压大水对比研究中也可看到类似的效应值差异。
Bath等对所有临床前NXY -059数据进行了一项荟萃分析。分析发现对局灶性缺血性卒中预后有中等程度的积极作用。然而,研究设计缺陷被认为是高估治疗效果大小的来源。此外,他们提议说NXY – 059缺乏临床效果的一个可能原因是“临床前研究结果太简单,与人体不相关。”而这一点一直是转化神经科学的一个关注点。
当然,也存在种族间差异。然而,种族间众多相似之处也应该使得临床前试验对临床疗效有提示作用。许多现象是在实验室被首次发现,后来才在人体研究中得以证实(表)。该发现进一步表明缺乏临床前数据和对临床试验设计数据的重视更有可能是临床试验不能成功的原因。
表.首次在实验室报道其后在人体中证实的现象
现象 | 临床前报道:种族,年份 | 临床报道:疾病,年份 |
对脑代谢率的影响 低温 麻醉 |
犬类,1954 犬类,1963 |
手术,1986 健康人,1964 |
延迟低灌注 | 兔子,1968 | 心脏骤停,1996 |
血脑屏障破坏 | 松鼠猴,1970 | 缺血性卒中,1975 |
缺血半暗带 | 狒狒,1977 | 缺血性卒中,1983 |
高血糖增加缺血性脑损伤 | 猴子,1977 | 缺血性卒中,1988 |
氧自由基 | 猫类,1978 | 创伤性脑损伤,1990 |
延迟神经元坏死 | 沙鼠,1982 | 心脏骤停,1987 |
谷氨酸聚集 | 大鼠,1984 | 脑积水,1985 |
离子平衡破坏伴突触末端去极化 | 大鼠,1984 | 人脑切片,1998 |
炎性因子 | 大鼠,1985 | 创伤性脑损伤,1987 |
组织型凝血酶原激活物的作用 | 兔子,1985 | 缺血性卒中,1995 |
即刻早期基因表达 | 小鼠,1988 | 缺血性卒中,1993 |
预适应 | 沙鼠,1990 | 缺血性卒中,1999 |
凋亡 | 大鼠,1991 | 心脏骤停,1997 |
基质金属蛋白酶激活 | 大鼠,1992 | 缺血性卒中,1997 |
自发性皮层去极化 | 大鼠,1993 | 创伤性颅脑损伤,1996 缺血性卒中,2008 蛛网膜下腔出血,2013 |
P-选择蛋白/细胞间黏附分子-1 | 狒狒,1994 | 缺血性卒中,1996 |
缺血后低温神经保护 | 沙鼠,1994 | 心脏骤停,2002 |
转录因子结合活性(如核因子-κB) | 大鼠,1995 | 缺血性卒中,1996 |
PARP激活 | 小鼠,1997 | 心脏骤停,1998 |
高含量氧复苏的不良反应 | 犬类,1998 | 心脏骤停,2011 |
神经发生 | 沙鼠,1998 | 缺血性卒中,2006 |
抑制素在缺血性卒中中作用 | 小鼠,1998 | 颈动脉内膜切除术,2013 缺血性卒中,2013 |
水通道蛋白4感应现象 | 大鼠,2000 | 缺血性卒中,2003 |
高迁移率族蛋白B1 | 小鼠,2002 | 缺血性卒中,2006 |
未折叠蛋白反应 | 大鼠,2003 | 缺血性卒中,2010 |
这一发现也进一步被van der Worp等人进行的对21项临床卒中研究的临床前数据评估结果所证实。没有一项研究被认为有足够的临床前数据来证明临床研究的正当性。类似的结果也出现在肌萎缩侧索硬化的研究中。
ALIAS研究
白蛋白急性卒中(ALIAS)试验研究了白蛋白作为神经保护干预措施的作用。先进行了一项人体中试验性的安全性研究,随后进行了2项随机化疗效研究。
虽然试验性研究没有发现副作用,但第一项比较生理盐水和静脉注射白蛋白的随机试验中止了,是由于白蛋白治疗组患者死亡人数增加,其最有可能是由于血管容量超负荷所致。第二次试验根据患者的体重对白蛋白的使用剂量进行了校正。 从2009年2月27日开始招募患者。在纳入841名患者后,这项研究被中止,因为分析显示治疗无效。
虽然没有说打算满足STAIR标准,对支持ALIAS研究的临床前研究进行了回顾。通过一系列结果分析明确了9项研究。缺少的标准包括缺乏长期预后分析(大部分研究只评估了为期3天的恢复,2研究评估了7天),缺乏性别效应的研究,以及没有考虑与溶栓药物的相互作用。只有2项研究采用了随机化和盲法原则。然而,只是独立的实验室明确了疗效,并且在多物种中进行的研究。
与巴比妥酸盐应用于心脏骤停和创伤性脑损伤低温治疗研究相比,ALIAS研究中至少68%的患者开始治疗的时间是在临床前研究规定的4小时时间窗内的。虽然总体临床前研究已几乎接近满足STAIR的标准,但这些研究的证据尚不足以证实进行临床试验的正当性。
大多数研究中未能证明白蛋白的疗效可持续超过7天。大量的临床前研究已表明,对急性脑损伤的治疗干预的明显疗效不能持续,或者是持续的疗效只是在特定的情况下才出现。因此,临床前白蛋白治疗评估缺血性卒中3-7天的预后可预测90天疗效仅仅只是一个假设。值得注意的是,68%的患者还同时接受了阿替普酶治疗。没有一项临床前研究定义了白蛋白和阿替普酶之间潜在的相互作用。
最后,只有22%的临床前研究采用了随机化分组和盲法评估。很可能用来证明人体白蛋白试验正当性的临床前疗效大小被高估了,临床前疗效可能不足以在不同的人体卒中人群中进行疗效研究。在STAIR指南发表约十年后,很多同行评审小组参与建立NIH资助这个项目。这个临床序列研究的成本超过2700万美元。
再次,ALIAS试验并没有打算满足STAIR指南。然而,即使是几乎接近满足STAIR标准,研究也失败了。这次的经验以及NXY– 059的经验表明STAIR标准的重要性,按照目前的情况,并没有提供足够的指南指导建立足够的临床前研究数据库以便证明临床研究实施正当性。STAIR指南的一个关键性弱点可能在于将设计差的研究纳入标准的可能性(如采用非随机,非盲法或者效力不足的研究来定义种族间或实验室之间研究的强度)。
更多的指南
在医学界对从实验室到临床转化研究失败的担忧无处不在。已有大量的共识推荐。在卒中研究中,主要的卒中研究杂志均已支持对良好实验室规范的推荐。一个国家卫生研究院小组提出了指南以加强在方案提交申请基金时初步数据的质量和实验设计。其他机构也对临床前研究发布了一些总体原则,有一些推荐需要在报告实验方法时更加详细(例如,动物研究:体内实验报告[ARRIVE]),目前已得到数以百计的生物医学研究杂志的支持。Henderson等明确了26项已发表的指南,并对它们推荐的共性进行了分析。
最常见的共性是进行一个先验效力分析,随机分配治疗以及实验前在动物模型中考虑到疾病亚型特征。主要期刊发表的声明也反映了这些共性。但似乎缺乏特别赞同指南的期刊的依从性方面数据。
Baker等人进行了一项研究,对ARRIVE共识发表前和发表后2年2本主要期刊2年内有关实验性自身免疫性脑炎相关的所有文章进行了评估。ARRIVE共识对使用盲法 (21%)、随机化(< 10%),或效力分析(7%)等均没有影响。因此,指南的发布和支持对转化神经科学研究的质量几乎没有影响。只有当期刊和资助机构真正需要严格临床前设计和执行时,他们才会把他们已经认可的指南付诸实践。
这些指南中几乎没有新的概念性元素。推荐的临床前实验设计元素包括一个多世纪以前就认识到的基本的统计原则。特别地,在1993年对卒中研究的实验设计的关键元素进行了推荐。目前还不清楚为什么这些原则一直被违反。付出的代价就是对急性中枢神经系统损伤研究的阻碍是不可估量的,以下是真实世界的例子。
一家创业制药公司合成了一种小分子能够放大缺血性卒中已知的在体发挥重要作用的神经修复机制。知识产权是商业开发安全的和保鲜的必要条件。该分子可通过血脑屏障,且通过不同独立的学术实验室证明在啮齿类动物卒中模型中是有效的。有功能性疗效,且在分析长期功能预后时对永久性和短暂性大脑中动脉闭塞进行缺血前生理因素的控制,包括性别,老龄动物以及与治疗延误相关的临床因素等。除了研究是在非人体灵长类动物体内进行以及没有定义与其他卒中药物相互作用之外,均满足了STAIR标准。
已完成临床实验新药授权的毒理学分析。良好生产过程——认为分子没有重大的毒性作用,且配方简单。该分子目前正在进行临床试验寻求非CNS领域的适应症。至今为止的研发是由国家卫生研究院资助。但公司没有进一步发展的资源。在大型制药药物开发发布会中正在寻求合作伙伴。但对于卒中的适应症没有人表达对该分子的兴趣,该药物和公司的生存面临着危险。
下一步
呼吁改善临床前实验设计可能带来更确凿的疗效证据,以及使得成功转化进行人体研究。然而,鉴于目前的依从性,这种方法可能是不够的。许多治疗靶点和候选药物的开发是来自学术机构及其附属的生物技术公司,经常面临财务受限的环境,妨碍了全面和严格的临床疗效分析。
小型实验室通常雇佣学校的实习生进行实验方案的操作,而不是优先使用高级研究员,且没有内部或外部验证。这样的研究可能会由于手术不足,结果评估,或统计学分析能力等而出现结果的偏倚,尽管这些仍然是研发最重要的部分。已成立的商业公司也可能面临着类似的局限性。
现在已提倡采用另外的方法,包括在临床前研究和开始决定进行人体研究之间的一个中间步骤。. Bath等以及其他研究者提出多机构的III期临床前研究以建立临床前研究发现的重复性和可靠性。从本质上说,决策是集中在如何挑选主要的候选分子。挑选的分子在不同的机构之间应该遵从相同的实验方案 (图1)或分布到不同的实验室中在不同物种中验证疗效的可靠性(图2)。
图1. III期临床前研究方案1
图2. III期临床前研究方案2
这些严格的疗效测试将会结合实验设计的基本原则(如随机化和盲法),标准化的损伤和结果评估以及独立的数据分析。据推测,这种系统将最小化偏倚,确保临床相关的模型和剂量策略,并确定效应值大小是否足以转化到异质性的人体群体中。
这个概念有利有弊。进行III期临床前研究对于转化研究的时间和金钱都是一个障碍,但是只有药物具有足够的疗效可靠性才能使其进入临床试验中。与失败的人体研究花费相比,这一中间步骤的费用可以忽略不计。同时进行许多药物开发的创业公司可能没有资源来支持这样的研究。可能需要政府的支持,尽管会涉及到化合物选择的变化。
目前为止,进行临床前III期试验可能不是必需的,因为这个过程尚未经检验。然而,这样的一个模板可以提供了一个标准,为实验设计和建立足够的临床前样本库以证实人体研究正当性提供了更系统性的方法。
另一个概念也被提出来了。在患者入组之前要进行临床研究的注册,以预先呈现计划的主要预后变量,入排标准,实验设计以及样本量大小(如clinicaltrials.gov)。
临床前研究也应该进行类似的注册吗?这种方法使得发表的结果必须符合预先的实验设计和分析,可能会鼓励研究人员使用更严格的试验方案。但有一个问题是临床前试验的保密性,这对相应的知识产权的拥有者是一个重要的问题,他们可能不愿将研发的情况公诸于众。
不管什么样的机制,如果临床前研发项目不佳,而进行临床研究的患者招募是存在伦理方面的问题的。临床前研究决策应该至少像临床研究那样严格。这需要实验室和同行评议人员中一个重大的转变。
结论
临床前研究的不足会导致(1)可能被用于更好更有前途的干预措施的资源浪费;(2) 可能使患者置于不必要的风险中;(3)在治疗策略的早期研发中产生过分悲观的情绪。现在已有越来越多的指南赞同基础研究的原则,但遵从这些指南的依从性并不好。
急性中枢神经系统损伤的治疗方法的临床前研发演化过程为更有效的人体转化研究提供了机会。这个机会刚刚好,因为我们对于疾病神经生物学的理解已有很大的进步,这将使得更有可能明确真正有机会改善预后的干预措施。如果不能很好的转化这些机会将是灾难性的,正如临床前研发的例证已表明忽视实验设计和实施的基本宗旨的后果。