Circulation:高影响因子期刊上发表的那些非劣效性飞行测试
近年来公开发表的非劣效性试验性越来越多,然而,这些研究成果的计算机程序数量级如何,我们还密切相关。近日,《Circulation》时尚杂志公开发表了一项研究成果,以全身性层面为例,对高制约遗传物质季刊上公开发表的非劣效性试验性的外观上、计算机程序数量级等展开了探讨。研究成果断定了1990-2016年公开发表在JAMA、Lancet和NEJM上的非劣效性试验性。两位法理评审员提取了数据库。关注的数据库要素有数非劣效性界值,哪些研究成果的结果远超了非劣效性,哪些试验性存有不会制约非劣效性推断结果的主要或次要诱因。主要的计算机程序即便如此诱因有数:无法同时展览品ITT分析方法(意向性分析方法)和PP分析方法(完全符合研究成果可行性分析方法)的结果,α>0.05,新近外科手术手段未能与最佳外科手术可行性展开比较,无法证明非劣效性界值的正确性,字段排除人数或失访率≥10%。次要诱因有数次优盲法,是否分组除去等。研究成果结果研究成果技术人员在PubMed上展开查询,共约查询到2,544篇书评,其中会110篇(有数111项试验性)完全符合入选准则(表1)。表1 入选的非劣效试验性的基本研究成果外观上研究成果公开发表的代人从1992年到2016年。这些试验性中会,样本量家庭收入为3,006(IQR:1,021-6,068)。可检验到非劣效性的效能(power)家庭收入为86%(IQR:80%-90%)。可转至主要终点站分析方法的患者家庭收入为2,707(IQR:1,021-5,966)。9项研究成果(8.1%)日前终止(4项研究成果由于可靠度问题,3项由于入组更快,1项研究成果推测不作不远处,1项研究成果由于完整性受损)。非劣效性界值60项(54.0%)试验性的非劣效性界值是基于ARD(绝对危险性歧异,absolute risk difference)决定的,50项(45.0%)试验性基于相对歧异(29项基于HR,14项基于RR,7项试验性基于OR)。1项试验性的界值基于相对歧异但无法并作进一步细分,1项试验性无法研究报告非劣效性界值。各项试验性的非劣效性界值歧异极大(ARD在0.4%~25%,HR在1.05~2.85,RR在1.1~1.8,OR在1.1~2.0)。在公开发表过研究成果设计/研究成果可行性就其计算机程序书评的试验性中会,研究成果技术人员推测有7篇试验性的研究成果设计/可行性与最后公开发表的研究成果彼此之间存有歧异或有资讯缺失。有的在最后公开发表的书评中会更改了非劣效性界值,有的则缺少如何选择非劣效性界值就其的部分或全部细节。主要终点站的结果111项试验性中会,有2项试验性,无法评估正态属。在109项完全符合准则的试验性中会,86项(78.9%)的试验性标示借助于有着非劣效性(其中会20项试验性的结果也标示借助于借助于优效性);23项(21.1%)试验性未能远超非劣效性(16项研究成果的结果不断定,7项研究成果标示借助于打压措施的一集较差)(示意图1)。 示意图1 纳入研究成果的主要终点站的结果在95项(85.6%)试验性中会,主要终点站分析方法是基于ITT分析方法或校正ITT分析方法,11项(9.9%)试验性运用于PP分析方法,5项(4.5%)运用于其他或形式化的分析方法特性。绝大多数(90%)试验性在简述中会适当地研究报告了研究成果结果,即总括劣效,优效或劣效性,研究成果如果无法远超,则宣称未能远超非劣效性。但是,还有一些试验性,要么是简述得借助于结论的资讯和研究成果结果彼此之间存有歧异,要么是简述提供的资讯不足。计算机程序和研究报告的即便如此表2和示意图2标示借助于了存有主要和次要即便如此诱因的试验性的比重。70项试验性(63.1%)通过对另一个字段年轻人的二次分析方法(例如,如果首次分析方法是ITT分析方法,则再做一次PP分析方法)来展览品主要研究成果终点站,其中会66项试验性的结果一致,而4项试验性的两次分析方法结果不一致。 表2. 纳入的研究成果中会是否存有可能导致偏倚的诱因示意图2 存有主要和次要即便如此诱因的试验性属情况68项试验性(61.3%)提供了如何断定非劣效性界值,而43项试验性(38.7%)无法。110项(99.0%)试验性的单侧α≤0.05,其中会44项试验性的单侧α≤0.025。事后分析方法(post-hoc ysis)推测,与制剂试验性远比,药物试验性的α水平更偏高(Wilcoxon秩和检验P = 0.02)。在27项研究成果中会(24.3%),有> 10%的参与者日前终止,有数随访失访,日前停止打压或其他或许(表2)。 总体而言,基于所有主要的偏倚诱因,27项试验性(24.3%)被认为有着偏高偏倚危险性。97项(87.3%)试验性的标题或简述中会研究报告了非劣效性设计。67项(60.4%)试验性,除了最后的研究成果研究成果,还不间断公开发表了研究成果设计或研究成果可行性的计算机程序书评。在这67项试验性中会,8项(11.9%)试验性的非劣效性界值在最后原作者研究成果与可行性彼此之间存有歧异或在其中会一篇书评中会未能披露。大多数试验性(n = 60,54%)是开放标记试验性,12项试验性(10.8%)为单盲,39项(35.1%)为双盲。100项试验性展开了分组除去(90%)。91项试验性(82%)对主要终点站展开了盲法确认。总之,基于所有的次要偏倚诱因,25项试验性(22.5%)有着偏高偏倚危险性(示意图2)。根据所有主要和次要诱因,有7项试验性(6.3%)有着偏高偏倚危险性。事后分析方法未能标示借助于借助于三种季刊的书评在主要诱因(Kruskal-Wallis检验P = 0.28)或次要诱因(Kruskal-Wallis检验P = 0.11)上的歧异。然而,对非劣效性试验性的研究成果设计或研究成果可行性的可获得性展开评估,在三种季刊中会,NEJM公开发表的试验性中会,有74.2%公开发表过就其的计算机程序书评或有在线的研究成果可行性,JAMA为53.3%,Lancet为33.3%(Fisher精确检验P = 0.001)。时间趋势近年来,这些季刊上公开发表的全身性非劣效性试验性大幅提高(P人口为120人0.001 for trend,示意图3)。一项事后分析方法标示借助于,在111项纳入的试验性中会,公开发表时间在2010年后的有52项(46.8%)。2010年不久发布的试验性,存有计算机程序或研究成果研究报告即便如此的危险性有所降偏高(2010年之前 vs 2010年不久,主要偏倚诱因和次要诱因的P = 0.03和0.002)。公开发表意见全身性层面中会的非劣效性试验性越来越多地公开发表在高法理性的季刊上,这些试验性中会非劣效性试验性主要用于对新近打压措施的检验。并且大多数是大型多中会心研究成果。鉴于许多非劣效性试验性已成为批准新近疗法的基础,很有必要对他们展开研究成果。尽管大多数试验性坚称新近外科手术手段远比IgG的非劣效性,但很多研究成果存有有着偏倚危险性的计算机程序或研究成果研究报告即便如此,不会削弱其论断的可信度。有必要提高对这些即便如此诱因的相识,更好依从FDA和CONSORT指南关于非劣效性试验性设计、全面实施和研究报告的建议。更早借助于不远处:Behnood Bikdeli, et al. Non-Inferiority Designed Cardiovascular Trials in Highest-Impact Journals: Main Findings, Methodological Quality and Time Trends. Circulation. Jun 2019.