几种基于超声检查的分层系统(如甲状腺影像学报告和数据系统/TIRADS)可能有助于预测结节的恶性肿瘤风险,在许多情况下可能消除对活检的依赖。然而,对于大结节或可疑结节,需要在细针穿刺活检后进行细胞学评估,以便准确分类。在细胞学检查产生不确定结果的情况下,其他工具(如分子检测)可以帮助指导管理计划。
手术不再是有症状或恶性结节的唯一治疗方法:积极监测或局部消融治疗可能对适当选择的患者有益。为加强临床医生与患者的互动和关于诊断选择的讨论,已经开发共享决策工具。个体化的、基于风险的方案可促进高质量的照护,同时最大限度地降低成本和不必要的检查。
甲状腺结节:诊断和管理
编/译:陈康
要点
甲状腺结节很常见,在一般人群中的患病率为 ~25%,根据年龄、性别和危险因素的不同,患病率差异很大。
美国预防服务工作组建议不要在一般无症状的成年人群中进行甲状腺癌的筛查,因为这种筛查会导致危害超过潜在获益。
如果怀疑甲状腺结节,第一步是进行专门的超声检查;超声检查风险分层系统可以对结节恶性肿瘤的可能性进行分类和评估。
如果确认需要进一步评估,通常进行细针穿刺活检;细胞学结果通常根据标准的细胞学报告系统进行分类。
在初步诊断和风险分层程序结束时,会发现超过 90% 的结节是良性且无症状;患者甲状腺功能正常,无需特殊治疗。
介绍
甲状腺结节是甲状腺内的离散病变,可以使用敏感的成像技术与周围的甲状腺组织区分开来。这些成像技术的使用导致甲状腺结节的检出率的增加,否则这些结节的存在将不为人知,这些检测同时也引起了对不必要的亚临床甲状腺疾病诊断的担忧【Ann. Endocrinol. 83, 378–379 (2022); Eur.Thyroid J. 12, e230067 (2023)/这些指南强调了需要成本效益高、以患者为中心的方法;值得注意的是,大多数病变是良性的,无症状的,因此不需要治疗】。大多数甲状腺结节(高达 90%)通常是非癌性的(包括甲状腺滤泡结节性疾病/以前称为多结节性甲状腺肿、滤泡性腺瘤和嗜酸细胞腺瘤)【J. Clin. Endocrinol. Metab. 105, 2869–2883(2020); Front. Endocrinol. 14, 1113977 (2023).】,因此,临床检查的主要目标是排除恶性肿瘤(从组织学角度来看,恶性肿瘤可能包括乳头状癌、滤泡癌、嗜酸细胞癌、髓样癌和未分化甲状腺癌)。甲状腺结节的诊断过程应在确定其临床意义和不必要的过度诊断以及因此导致的过度治疗之间取得平衡。
据报道,在大多数高收入国家,甲状腺癌的发病率一直在上升,这主要是由于低风险亚临床乳头状甲状腺癌(PTC)的检出率增加【N. Engl. J. Med. 375,614–617 (2016); Lancet Diabetes Endocrinol. 8, 468–470 (2020).】。高达 53.6% 的甲状腺癌很小且局限于甲状腺内【Thyroid 31, 264–271 (2021)】。这些癌症具有惰性,可以保守地安全地管理【J. Surg. Oncol. 121, 958–963 (2020)】。对甲状腺结节采取明智和保守的方法可以帮助确定需要立即或广泛治疗的少数病例,同时最大限度地减少对大多数患者而言与治疗相关的问题,如甲状腺功能减退症、手术并发症和经济负担。在所有癌症类型中,甲状腺癌尤其会给患者带来沉重的经济负担,与其他癌症类型的幸存者相比,甲状腺癌幸存者报告的破产率更高【Head Neck Surg. 148, 568–575 (2022); Front.Endocrinol. 14, 1113977 (2023)】。
基于这些前提,越来越有必要为甲状腺结节患者提供诊断和治疗方案概述。在做出决定时,应考虑患者的年龄、病史和预期寿命,以及肿瘤相关症状的风险。本文旨在概述过去10年中诊断和治疗方案的变化。具体而言,讨论所有结节的实验室和放射线检查,以及针对有症状、功能和/或恶性甲状腺结节的不同管理策略。
甲状腺结节和甲状腺癌的流行病学和诊断
性别和年龄【Contrast Media Mol. Imaging 2022, 2913405 (2022)】
碘缺乏【Biol. Trace Elem. Res. 199, 3181–3189 (2021)】
相当大比例的结节是无症状的,即使在选定的转诊手术患者中也是如此。2022 年进行的一项多中心分析调查了 1,328 名接受甲状腺手术的患者的甲状腺结节检测方法,结果发现 448 名(34%)发现甲状腺结节是由于甲状腺相关症状,184 名(14%)表现出其他内分泌疾病的症状,而 542 名(41%)完全无症状【JAMA Otolaryngol. Head Neck Surg. 148, 811–818(2022)】。其余154个结节(12%)的检测模式未知。613例(占总数的 46%)被诊断为甲状腺癌,其中 310 例(51%)未出现任何甲状腺相关症状。有症状组癌症的中位大小为 2.6 cm(范围 0.2-10.5),而无症状患者的中位大小为 1.7 cm(范围 0.05-8.80)【JAMA Otolaryngol. HeadNeck Surg. 148, 811–818 (2022)/这项对甲状腺癌症病例的回顾性分析显示,大多数患者没有甲状腺相关症状;平均而言,这些癌症比出现症状的患者要小】。
超声
自 2017 年以来,美国预防服务工作组(USPSTF)建议不要在一般无症状的成年人群中筛查甲状腺癌,因为潜在风险(例如,活检风险(血肿、针道播种)和手术风险(甲状腺功能减退症、甲状旁腺功能减退症、喉返神经麻痹)(图 1)【J. Clin. Epidemiol. 64,401–406 (2011);JAMA 317, 1882(2017)】。这一建议也受到一些临床医生的质疑【Endocrinol. Metab. 38, 72–74 (2023)】。
该图概述了管理甲状腺结节的临床医生必须经历的主要阶段,从检测甲状腺结节到做出治疗决定。证据质量来自文本相应部分所包含和讨论的参考文献。证据质量根据 GRADE 指南被评为高(进一步的研究不太可能改变对效果估计的信心)、中等(进一步的研究可能会对效果估计的信心产生重要影响,并可能改变估计值)、低(进一步的研究很可能对效果估计的信心产生重要影响,并可能改变估计值)、或非常低(对估计值非常不确定)【J. Clin. Epidemiol. 64, 401–406 (2011)】。
a低风险结节如果已经扩大到产生占位效应的程度,并且符合治疗条件,则可能适合进行细胞学检查。
b对未接受过手术的患者的长期随访研究仍然缺乏。
c分子检测的性价比仍然是一个有争议的问题,并且在不同地区存在差异【J. Otolaryngol. Head Neck Surg. 51, 46 (2022);Thyroid 29, 1237–1243 (2019);Ont. Health Technol. Assess. Ser. 22, 1–111(2022)】。
例如,一项针对 12 项研究的系统评价和荟萃分析表明,与非偶然的甲状腺癌(由于临床体征或症状而发现)相比,通过影像学方法偶然/意外发现的甲状腺癌较小,侵袭性组织学、淋巴结转移和远处转移的发生率更低。与非偶然性甲状腺癌患者相比,这些病理特征的差异导致偶发性甲状腺癌患者的复发率低约 60%,甲状腺癌特异性死亡率低约 70%【Endocrinol. Metab. 38, 93–103 (2023)】。然而,这些类型的研究容易受到提前时间偏倚(通过筛查发现疾病与其通常临床表现之间的时间)的影响:即使疾病的正常病程没有变化,较早的诊断时间也可以使筛查看起来可以提高生存率。此外,所谓的长度-时间偏倚可以使筛查检测到的肿瘤与惰性肿瘤富集,从而显著提高生存率【Curr. Probl. Cancer 41, 71–79 (2017)】。
因暴露于电离辐射的情况(在儿童时期,作为放射性尘埃情况;在医学治疗期间,作为良性疾病的低剂量放疗或恶性肿瘤的高剂量辐射)
然而,即使在这些情况下,目前的证据也不支持基于超声检查的筛查计划,因为获益的证据并不符合世卫组织关于适当筛查计划的所有标准(BOX 1)【Lancet DiabetesEndocrinol. 8, 81–88 (2020);Wilson,J. M. G. & Jungner, G. Principles and Practice of Screening for Disease.WHO 1968】。对这些个体进行颈部触诊可以在超声检查的高敏感度和完全不筛查的局限性之间提供一种实际的折衷方案。然而,需要注意的是,在可触及结节中发现的甲状腺癌可能具有临床意义,提示存在高风险肿瘤。
对确诊为分化型甲状腺癌的个体的看似健康的亲属进行超声筛查,可能会发现结节患病率高,癌症患病率低【Curr. Probl. Cancer 41, 71–79 (2017)】,并且成本高【Wilson, J. M. G. & Jungner, G. Principles and Practice of Screeningfor Disease. WHO 1968】。然而,在至少有三名家庭成员受甲状腺癌影响的亲属中检测到的癌症患病率高于筛查前有一两个病例的家系亲属,这表明在这些病例中可能需要更密切的监测【J. Endocrinol. Invest. 46, 2327–2330 (2023);Thyroid 32, 1392–1401 (2022)】。
该病症应为重要的健康问题。
对于该公认疾病的患者,应该有一种公认的治疗方法。
应具备诊疗设施。
应有可识别的潜伏期或早期症状期。
应有适当的检测或检查。
测试应为人群所接受。
应充分了解该病症的自然病程,包括从潜伏疾病发展到已宣布的疾病。
应该有一个商定的政策,关于谁作为病人接受治疗/应对谁应被视为病人有一致的政策。
病例发现成本(包括对确诊病人的诊断和治疗)应与整个医疗保健可能支出相权衡。
个案调查应该是一个持续的过程,而不是一个“一劳永逸”/一次性的项目。
专用甲状腺超声检查
结节回声
成分(实心、囊性或混合性)
形状
边缘
结节内是否存在钙化或其他高回声病灶;
结节特征,如固体成分、明显的低回声、边缘不规则或浸润、点状高回声病灶、甲状腺外延伸(结节组织延伸到甲状腺边缘以外)以及可疑局部淋巴结的存在始终与恶性肿瘤相关【J. Clin. Endocrinol. Metab. 108, e816–e822(2023)】。
然而,其他特征的临床意义,如高宽比、轻度低回声或包膜接触(结节与甲状腺囊/包膜相邻),也是一个讨论问题【WorldJ. Surg. 44, 2669–2674 (2020)】。图 2 描绘了许多可能提示甲状腺结节恶性肿瘤的超声检查特征,并附有如何识别和描述这些特征的指导。
美国临床内分泌专家协会、美国内分泌学会和意大利内分泌学家协会(Associazione Medici Endocrinologi)系统【Endocr. Pract. 22, 1–60 (2016)】;
美国影像学会甲状腺影像报告和数据系统(ACR TIRADS)【J. Am. Coll. Radiol.14, 587–595 (2017)】;
美国甲状腺协会RSS【Thyroid 26, 1–133 (2016)】;
欧洲甲状腺影像学报告和数据系统(EU-TIRADS),欧洲甲状腺协会认可【Eur.Thyroid J. 6, 225–237 (2017)】;
韩国甲状腺影像学报告和数据系统(K-TIRADS),韩国甲状腺协会和韩国甲状腺放射学会认可【Korean J. Radiol. 17, 370 (2016)】;
ACRTIRADS在通过超声检查排除甲状腺癌方面具有最高的诊断性能【AJR Am. J. Roentgenol. 220, 791–803 (2023)】。值得注意的是,其中两个系统(EU-TIRADS 和 K-TIRADS)已经从荟萃分析的版本进行了升级【Korean J. Radiol. 24, 22–30 (2023); KoreanJ. Radiol. 22, 2094–2123 (2021); Eur. Thyroid J. 12,e230067 (2023).】。此外,其他广泛使用的分类系统,如中国甲状腺影像学报告和数据系统,未纳入研究【Endocrine 70, 256–279 (2020)】。BOX 2总结其中的五个系统【Front. Endocrinol. 10, 907 (2020)】。这五种方法都使用算法(流程)方法来识别与特定恶性肿瘤风险相关的超声检查特征组。ACR TIRADS 的不同之处在于它根据述职评分单独评估并评定结节的五个主要超声特征:五个分数的总和决定了分配给结节的风险等级。
BOX2 | 国际实践指南提出或认可的
AACE,美国临床内分泌学家协会;ACE,美国内分泌学会;AME, 美第奇内分泌学协会;ATA,美国甲状腺协会;C-TIRADS,中国甲状腺影像学报告和数据系统;EU-TIRADS,欧洲甲状腺影像学报告和数据系统;FNA, 细针穿刺;K-TIRADS,韩国甲状腺成像报告和数据系统;ROM,恶性肿瘤风险。
a美国放射学会甲状腺影像学报告和数据系统未包含在表中,因为与此处报告的超声评分系统相比,它使用不同的方法来评估恶性肿瘤风险。虽然此处的评分系统可识别具有特定风险的超声检查特征组,但美国放射学会甲状腺成像报告和数据系统会单独评估超声检查特征,并根据其风险级别分配数字分数。然后通过对每个单独特征的分数求和来计算结节的总风险。
b结节生长,高风险病史,手术或局部治疗前。
c根据存在一个或多个可疑发现。
dFNA 推荐用于以下结节:囊下或气管旁病变;可疑淋巴结或甲状腺外扩散;甲状腺癌阳性个人史或家族史;头颈部照射史;并存可疑的临床表现(例如,发音困难)。
e提示甲状腺外扩展的超声检查特征不包括在 EU-TIRADS 的主要特征中;但是,无论 EU-TIRADS 分数如何,他们都应该指征 FNA。
f对于具有高风险特征的小(>5 mm)高度怀疑(K-TIRADS 5)结节(靠近气管或喉返神经路线的后内侧囊),建议进行活检。对于无高风险特征的小(>5 mm 和 ≤10 mm)K-TIRADS 5 结节,可考虑进行活检,以决定成人的治疗计划。
g多发性结节,邻近气管或喉返神经。
许多不同的 RSS 的存在可能会令人困惑,并减慢其实际应用的速度【Thyroid 32, 675–681 (2022)】。在结节特征的定义、分配给它们的相对权重以及用于 FNA 活检建议的大小阈值方面,RSS 之间存在一定程度的异质性。每个系统在临床实践中的性能也可能根据特定的特征定义而有所不同。例如,高大于宽度的形状(或非平行方向)有不同的定义,并且在主观评估时容易被高估【Eur. Radiol. 31, 7605–7613 (2021);Eur. Thyroid J. 9, 85–91 (2020);J. Clin. Endocrinol. Metab. 108, e816–e822(2023)】;回声的程度也难以标准化,经验不足的操作人员可能在区分不同种类的高回声点时遇到困难。此外,一些超声检查特征正在成为关键的风险改变因素,但目前尚未包含在 RSS 中(例如,结节在腺体内的位置【Ultrasonography38, 231–235 (2019);Thyroid 30,401–407 (2020);Thyroid 30, 349–350 (2020)】)。此外,与患者相关的特征(如年龄)已被提议作为恶性肿瘤超声风险的潜在影响因素【Curr. Opin. Endocrinol. Diabetes Obes. 29, 483–491 (2022);Cancers 12, 2458 (2020);Eur. Thyroid J. 11, e220039 (2022);Eur. J.Endocrinol. 189, 584–589 (2023)】。
为了解决这些问题,2018 年成立了一个国际多学科专家组(国际甲状腺结节超声工作组),旨在开发一个国际统一的系统,暂称为国际甲状腺影像学报告和数据系统(I-TIRADS)。该小组有两个目标:提出甲状腺结节超声检查描述符的词典和图谱,并开发一种新的RSS来计算恶性肿瘤风险。该项目初期的成果于 2023 年发布,其中包括为甲状腺结节超声创建一个通用词汇【Radiology 309, e231481 (2023)/一个由19名具有甲状腺超声专业知识的医生组成的国际多学科小组成立了,目的是开发一个词典和图谱,使描述甲状腺结节的术语标准化】。
用于甲状腺结节初步评估的人工智能
人工智能包含多种计算机科学方法,包括机器学习和深度学习,前者是计算机从人类提供的数据中学习,后者使用复制大脑功能的神经网络来分析数据。已经开发了几种人工智能系统,用于使用甲状腺结节的超声图像对恶性肿瘤的风险进行分析和分层,其中四个平台已经获得 FDA的批准【Thyroid 33, 150–158 (2023)】。
两项荟萃分析探讨了使用人工智能评估甲状腺结节的当前证据。一篇对 25 项研究(包括 17,429 张甲状腺结节超声图像)的荟萃分析显示,人工智能辅助工具对甲状腺结节的良性或恶性二元分类具有良好的诊断准确性,敏感性为 88%(95% CI 0.85–0.90),特异性为 81%(95% CI 0.74–0.86)【Int. J. Endocrinol. 2022, 9492056 (2022)】。另一项荟萃分析得出的结论是,在这种临床背景下,人工智能的表现与影像医生的表现相当【Eur. Arch. Otorhinolaryngol. 279, 5363–5373(2022)】。在某些情况下,人工智能已被证明超过了一些经验不足的医生的表现,并且可以用作培训工具和决策支持工具【J. Ultrasound 23, 169–174 (2020);J. Clin. Endocrinol. Metab. 109, 527–535(2024)/描述了一种基于深度学习的人工智能模型,该模型有可能提高癌症诊断的诊断性能和观察者之间的一致性】。
在颈部淋巴结和细胞病理学标本的评估中,还探索了人工智能的使用。然而,人工智能在甲状腺疾病评估中的临床采用将要求开发人员证明他们的软件是有效的、在现实世界环境中可用且具有性价比的【Thyroid 33, 150–158 (2023)】。
实验室检测
TSH的检测
在对所有甲状腺结节患者进行初步评估时,建议检测血清促甲状腺激素(TSH)水平,以确定结节是否为功能亢进(结节生长和产生甲状腺激素,非依赖于 TSH)。大多数专家小组一致认为,只有在血清 TSH 水平低于正常水平时,才应进行进一步的检查(包括测量血清游离四碘甲状腺原氨酸/甲状腺素水平以及总三碘甲状腺原氨酸或游离三碘甲状腺原氨酸水平,然后进行放射性核素扫描以评估放射性碘的摄取)【Thyroid 26, 1–133 (2016);Eur. Thyroid J. 12, e230067 (2023).】。TSH 水平低于正常水平可能表明肿瘤正在产生过多的甲状腺激素。然而,甲状腺自主性与TSH水平之间的关系受碘充足程度的影响,并且在地区范围内差异很大【Eur. J. Nucl. Med. Mol. Imaging 46, 2514–2525(2019)】。因此,一些团体主张使用放射性核素扫描,而不考虑TSH水平【Langenbecks Arch. Surg.396, 639–649 (2011)】或无需考虑特定地理区域的碘供应(例如,当TSH<碘缺乏地区的TSH为1.0-1.5 mUI/l)【Eur. J. Nucl. Med. Mol. Imaging 46, 2514–2525(2019);Endocr. Pract. 22, 1–60(2016).】。“热”结节表明放射性核素扫描中示踪剂摄取增加的区域。热甲状腺结节在组织学上几乎总是良性腺瘤,对恶性肿瘤的阴性预测值为 96-99%【Best Pract. Res. Clin.Endocrinol. Metab. 28, 507–518 (2014)】。
肿瘤标志物
关于肿瘤标志物,不建议常规测量血清甲状腺球蛋白水平以评估结节,因为甲状腺球蛋白可通常由良性和恶性甲状腺细胞产生;因此,当甲状腺仍然存在时,它在术前环境中的预测性能是有限的。然而,甲状腺球蛋白被用作甲状腺全切除术后的标准肿瘤标志物,水平升高可能表明癌症复发或转移。
检测血清降钙素水平是诊断甲状腺髓样癌(MTC)的最可靠检测指标【Endocrine 81, 183–193 (2023)】,甲状腺髓样癌起源于产生降钙素的甲状腺滤泡旁细胞(C 细胞),可及早发现这种罕见的癌症,从而改善结果【J. Clin. Endocrinol. Metab. 89, 163–168(2004)】。基础降钙素水平为 >100 pg/ml 对于 MTC 的诊断非常可疑,而 10 - 100 pg/ml 之间的值是不确定的【Nat. Clin. Pract. Endocrinol. Metab. 5, 35–44(2009)】。这种灰色地带受到许多因素的影响,包括患者的性别(男性的正常值高于女性)【J. Endocrinol. Invest. 44, 587–597
(2021)】。然而,该检测的特异性和对所有结节进行普遍降钙素筛查的性价比存在一些问题,因此并非所有专家都同意在甲状腺结节的初步检查中常规检测降钙素【Eur. Thyroid J. 12, e230067 (2023).】。应考虑到超声检查特征(和 RSS)对于诊断 MTC 不可靠,并且细胞学检查显示检测 MTC66 的敏感性差(~50%)。在某些情况下,MTC被误诊为嗜酸细胞癌或滤泡性甲状腺癌【Clin.Endocrinol. 82, 280–285 (2015)】;因此,如果细胞学检查产生不确定的结果,则进行降钙素检测可能有用。
细胞学
Ali, S. Z. et al. The 2023 Bethesda system forreporting thyroid cytopathology. J. Am. Soc. Cytopathol. 12, 319–325 (2023)/ 本研究概述了纳入BSRTC第三版的新功能,BSRTC是一个标准化的、基于类别的甲状腺细针穿刺报告系统.
Pradeep, I., Joshi, A., Rath, A., Bharti, J. N.& Nigam, J. S. Overview of updates in new The Bethesda System for Reportingof Thyroid Cytopathology using the latest WHO thyroid tumor classificationterminology. Endocr. Pract. 29, 1020–1022 (2023).
Nardi, F. et al. Italian consensus for theclassification and reporting of thyroid cytology.
Hirokawa, M. et al. The Japanese reportingsystem for thyroid aspiration cytology 2019 (JRSTAC2019). Gland. Surg. 9, 1653–1662 (2020).
The Royal College of Pathologists ofAustralasia. Thyroid Cytology Structured Reporting Protocol 2nd Ed (RCPA,2019).
表1显示了不同报告系统中每一类恶性肿瘤的预期发生率。每个类别都与特定的细胞学特征模式相关,恶性肿瘤的风险已通过回顾性或前瞻性验证研究确定。实际恶性肿瘤发生率受地区(机构)恶性肿瘤患病率、细胞学样本质量和病理专家经验的影响。
表 1 | 标准化甲状腺细胞学报告系统概述
报告系统类别
描述
ROM(%)或预期 ROM(%)a
贝塞斯达甲状腺细胞学报告系统(2023)b
【J. Am. Soc. Cytopathol. 12, 319–325 (2023)】
非诊断性
13(5–20)
II
良性
4(2–7)
III
意义未定的异型性
22(13–30)
IV
滤泡性肿瘤
30(23–34)
怀疑恶性肿瘤
74(67–83)
VI
恶性
97(97–100)
英国皇家病理学家学院(2022)
【The Royal College of Pathologists. Guidance on the Reporting ofThyroid Cytology Specimens】
thy1
非诊断性
12(5−22)
thy1c
非诊断性囊性病变
NA
thy2
非肿瘤性
5(3−9)
thy2c
非肿瘤性囊性病变
NA
thy3a
存在非典型特征
25(20−31)
Thy3f
怀疑滤泡性肿瘤
31(24−39)
thy4
怀疑恶性肿瘤
79(70–87)
thy5
恶性
98(97−99)
意大利甲状腺细胞学分类和报告共识(SIAPEC-IAP2014)
【J. Endocrinol. Invest. 37, 593–599 (2014)】
TIR1
非诊断性
NA
TIR1c
非诊断性囊性病变
NA
TIR3a
低风险不确定病变
<10
TIR3b
高危不确定病变
15-30
TIR4
怀疑恶性肿瘤
60-80
TIR5
恶性
>95
日本内分泌外科学会和日本甲状腺病理学会(2019)c
【Gland. Surg. 9, 1653–1662 (2020)】
NA
不满意(取材)
5,6
NA
囊肿液
0.2–2
NA
良性
1.2
NA
未确定的意义
13,1
NA
滤泡性肿瘤
11,4
NA
怀疑恶性肿瘤
95.8–98.8%
NA
恶性
99.2–99.3%
澳大拉西亚皇家病理学家学院(2020)
【The Royal College of Pathologists of Australasia. Thyroid CytologyStructured Reporting Protocol 2nd Ed (RCPA, 2019)】
非诊断性
NA
良性
NA
意义不确定或意义不明的滤泡性病变
NA
提示滤泡性肿瘤
NA
怀疑恶性肿瘤
NA
恶性
NA
NA,不可用;ROM,恶性肿瘤风险。
aBethesda 系统和意大利共识的预期 ROM。
b适用于成人,包括具有乳头状核特征的非浸润性滤泡性肿瘤。
然而,一些潜在的诊断陷阱可能会导致假阳性、假阴性、不确定或非诊断结果。特别是,细胞学不能可靠地区分滤泡模式增生结节、滤泡腺瘤、滤泡癌和PTC的某些滤泡亚型。因此,在 BSRTC 中,这些病变被报告为不确定的,并被归类为 Bethesda III 类(“意义未明的非典型性”)或 IV 类(“滤泡性肿瘤”)。在所有甲状腺细胞学中,~15-25% 报告了这些发现,并且与预期的恶性肿瘤发生率分别为 13-30% 和 23-34% 相关【J. Am. Soc. Cytopathol.12, 319–325 (2023)/本研究概述了纳入BSRTC第三版的新功能,BSRTC是一个标准化的、基于类别的甲状腺细针穿刺报告系统】。
有几种策略可用于处理不确定的诊断。传统方法是在建议诊断性手术之前重复进行细胞学评估(对于贝塞斯达 III 类病例和一些特殊的 IV 类病例)【Eur. J. Surg. Oncol. 46, 252–257 (2020)】。重复 FNA 有助于对结节进行明确诊断,将其分类为良性或恶性。然而,如果结节被确认为细胞学上不确定的,不加选择地使用诊断性手术将导致大量可避免的干预措施。鉴于恶性肿瘤的恶性率低于30%,大约70%的患者会接受不必要的手术。因此,处理不确定诊断的更现代的方法涉及对细胞学样本进行分子检测,主要是为了减少对诊断性手术的需求(见下文;图1)。此外,美国和欧洲的最新声明和实践指南支持将简单的超声监测作为一种可行的手术替代方法【J. Am. Soc. Cytopathol. 12, 319–325 (2023);Ann. Endocrinol. 83, 378–379 (2022).】,其依据是与某些超声模式相关的已确定风险。根据BSRTC分类为不确定细胞学的甲状腺结节(III类和IV类)以及根据验证过的RSSs估计恶性风险低于5%的结节,在组织学检查中很可能是良性的。与这些结节相关的唯一潜在风险是体积增长。因此,可以考虑将疾病纳入积极监测计划,目的是确定在初步评估和监测生长过程中可能遗漏的任何潜在恶性肿瘤【Endocrine 57, 256–261 (2017)】。其他选择包括使用辅助技术,例如弹性成像【Front. Oncol. 12, 845549 (2022); Eur. Radiol. 30, 6624–6634 (2020)】和对比增强超声成像【Radiol. Med. 125, 406–415 (2020)】,它们分别旨在评估组织硬度和微血管分布;然而,这些技术和其他技术很难标准化,并且仍在开发中。
分子检测
甲状腺肿瘤的综合分子分析导致了辅助分子检测的进展,这些检测可以补充临床、超声和细胞学评估,以对细胞学不确定的甲状腺结节的恶性肿瘤风险进行分层。在这种情况下,主要目的是减少对诊断性手术的需求。然而,正如后面所讨论的,甲状腺 FNA 样本的分子检查还可用于识别预后生物标志物(从而可能指导手术范围)或已诊断为甲状腺癌的患者的预测生物标志物,以评估患者对治疗产生积极反应的机会。
用于诊断
市售的检测可以分析多种分子特征,包括体细胞突变、基因表达水平和 microRNA 分类器【Front. Endocrinol. 14,1101410(2023); Curr. Opin. Otolaryngol. Head Neck Surg. 29, 107–112 (2021)】。两种最常用的检测方法是 ThyroSeq v3 基因组分类器和 Afirma 基因组测序分类器(GSC)。ThyroSeq v3 使用下一代测序检查 112 个甲状腺癌相关基因的突变、基因融合、拷贝数变化或异常基因表达【Cancer 124, 1682–1690 (2018)】。根据癌症的概率,结果由独特的基因组分类器分类为阳性(恶性肿瘤风险/ROM 30-100%)、所有测试的改变为阴性(ROM 3%),或由于存在低风险或低水平改变而当前阴性(ROM <10%)。一项针对不确定甲状腺结节的临床验证研究表明,敏感性为 94%,阴性预测值(NPV)为 97%。因此,该研究的作者得出结论,高达 61% 的患者可以避免诊断性手术【JAMAOncol. 5, 204 (2019)】。
最新版本的 Afirma GSC 采用 RNA 测序方法,具有 12 个分类器,包括 10,196 个基因。根据癌症的可能性,Afirma 结果分为良性(ROM 4%)或可疑(ROM 50%)。与上一版本(基因表达分类器)相比,新版本在将更多不确定结节正确分类为良性结节方面有所改进,从而减少了不必要的手术数量【Cancer Cytopathol. 129, 182–189 (2021)】。该测试的敏感度为91.1%,其NPV为96.1%【JAMA Surg. 153, 817–824 (2018)】。AfirmaGSC 结果可疑或细胞学可疑或恶性结节的不确定甲状腺结节可以进一步受益于 Afirma XpressionAtlas,可识别 593 个基因的表达变异和基因融合【J. Clin. Endocrinol. Metab. 106, 2198–2207(2021)】。Afirma Xpression Atlas 阳性结果与 Afirma GSC 可疑结节恶性肿瘤的高风险相关。这一结果可能会为个体化患者管理提供信息。然而,需要注意的是,Afirma GSC可疑,但 Afirma Xpression Atlas 结果为阴性的结节仍然具有相当大的恶性风险【Am. J. Clin. Pathol. 161, 463–468 (2024)】。
一项随机临床试验比较了 ThyroSeq v3 和 Afirma GSC 的诊断性能,发现在敏感性(分别为 97% vs 100%)或特异性(分别为 85% vs 80%)方面没有统计学显著差异【JAMA Oncol. 7, 70–77 (2021)】。这些检测方法使 49% 的不确定结节患者避免了诊断性手术。目前,ThyroSeq 和 Afirma 检测都具有 NPV,使其适用于排除性检测。应该注意的是,在临床验证研究中的测试性能是在手术切除的结节中评估的。因此,获得的 NPV 和良性检出率(细胞学不确定的病例后来导致“良性”或“阴性”分子诊断的百分比【Cancer Cytopathol. 127, 161–168 (2019)】)的真正临床影响仍有待通过对未接受过手术的“检测阴性”结节患者的长期随访来确定。
在选择分子检测时,可能会考虑诊断性能以外的因素。这些因素包括成本、处理时间、采样率以及提供可能有助于指导最佳管理策略的进一步预后信息的能力。大多数(但不是全部)商业分子检测的高成本是公平获得的主要障碍。分子检测的性价比仍然是一个有争议的问题【Thyroid 29, 1237–1243 (2019); J.Otolaryngol. Head Neck Surg. 51, 46 (2022)】。在比较诊断性手术与分子检测治疗不确定结节时,发现两种主要的分子方法比诊断性叶切除术更具性价比。还发现 ThyroSeq v3 比 Afirma GSC 更具性价比【Thyroid 29, 1237–1243 (2019)】。然而,这些分析中的大多数都是基于模拟建模的,结果可能会根据实际测试性能参数、恶性肿瘤发生率、假设的外科手术和估计的并发症发生率而有所不同。所有这些变量在机构和国家之间可能存在很大差异。在特定的公共、单一付款人系统中,与诊断性叶切除术相比,以当前标价进行的分子检测不太可能具有性价比(例如,这一结论是在加拿大安大略省进行的卫生技术评估分析的结果)【Ont. Health Technol. Assess. Ser. 22, 1–111(2022)】。
值得注意的是,2024 年进行的一项分析报告称,美国分子检测的使用增加未能影响甲状腺切除术率【Thyroid 34, 388–398 (2024)】。为了克服这一结果,分子检测可以整合到包括临床、形态学和超声数据在内的跨学科诊断途径中【Thyroid 34, 290–291 (2024)】。使用这种方法的少数研究表明,在超声检查低度或中度怀疑的甲状腺结节中,分子检测在排除恶性肿瘤方面比在超声检查高度怀疑的结节中表现更好,但这些结果仍有争议【Thyroid 33, 1423–1433 (2023); Thyroid 32,905–916 (2022)】。
适当选择样本进行分子检测至关重要【Eur. Thyroid J. 6, 115–129 (2017); Ont.Health Technol. Assess. Ser. 22, 1–111 (2022)】。重复FNA细胞学可以指导选择需要分子检测的细胞学不确定的甲状腺结节。在重复FNA上被归类为良性的非典型不确定性或滤泡性肿瘤类别的结节,癌症或具有乳头状核特征的非侵袭性滤泡性肿瘤的风险非常低,不太可能从分子检测中受益【Cancer Cytopathol. 131, 313–324 (2023)】。仅在确认细胞学不确定的结节中进行分子检测将进一步减少组织学良性结节的诊断手术率,同时只遗漏极少数低风险肿瘤【Thyroid 31, 1253–1263 (2021)】。
用于预后和治疗
对于贝塞斯达III类和IV类甲状腺结节患者,分子检测的主要临床目标是避免诊断性手术。然而,从检测中获得的分子细节也能为III类至VI类结节的管理提供预后信息。2023年进行的一项多中心研究表明,细胞学类别与分子谱(根据癌症基因组图谱研究分类的BRAF样或RAS样)相关联。具体而言,RAS样改变的结节较不具侵袭性,更常见于贝塞斯达III和IV类病例中,而BRAF样改变的结节更有可能在贝塞斯达V和VI类中发现【J. Clin. Endocrinol. Metab. 108, 2999–3008(2023)/Bethesda III-VI甲状腺结节的分子分析可以防止对很大一部分患者进行不必要的手术干预,同时为需要的患者提供预后和治疗信息】。RAS 样改变仍然被认为在分子上对癌症不确定,但数据表明,具有 RAS 样突变的结节可以通过额外的分子检测【Thyroid32, 1362–1371 (2022).】或通过在诊断途径中增加超声检查、细胞学和临床评估来进一步进行风险分层,以避免对良性结节的过度治疗【Thyroid 33, 1423–1433 (2023).】。对于BRAF 样结节,分子检测可能在手术前提供有用的信息,以更好地确定肿瘤的风险和所需的手术干预程度。在研究中6% 的病例中,在分子检测过程中发现了高风险分子改变(例如,TERT 启动子突变,通常被认为是晚期事件),这可能表明存在侵袭性肿瘤【J. Clin. Endocrinol. Metab. 108, 2999–3008(2023)】。这些患者可能会得到及时的治疗和广泛的手术。然而,目前尚不清楚这些分子特征是否以及在多大程度上影响实际的患者结局。在所有情况下,在治疗高危患者时都应考虑其他因素,例如结节大小和超声检查外观。
全面的分子分析可以为未来的治疗选择提供有价值的信息,例如在更晚期的癌症中选择分子靶向药物。对于使用 BRAF V600E 的癌症,可以采用 BRAF 加 MEK 抑制剂联合策略(达拉非尼+ 曲美替尼)。靶向 RET 的选择性抑制剂(selpercatinib 或 pralsetinib)可用于治疗 RET 改变的甲状腺癌,而神经营养性酪氨酸受体激酶(NTRK)抑制剂(entrectinib或larotrectinib)可用于具有 NTRK 融合的癌症【JAMA 331, 425 (2024)】。
长期管理和治疗
一旦诊断性病情检查完成,甲状腺结节可能需要治疗或根据其超声和细胞学分类定期重新评估,如下所述。
超声或细胞学良性结节
超过90%的结节在初次发现后在超声或细胞学上是良性的、无症状的;患者是甲状腺功能正常,不需要任何特殊治疗。通常建议进行长期随访,以发现初次评估时遗漏的任何恶性肿瘤,并排除压迫症状或导致甲状腺功能亢进症的“毒性”结节的发展(通过产生过多的甲状腺激素)【Ann. Endocrinol. 83, 407–414 (2022)】。然而,这些事件总体上是罕见的。最初在 FNA 活检中被归类为良性结节的恶性肿瘤的残余风险为 ~4%(2-7%)【J. Am. Soc. Cytopathol.12, 319–325 (2023)/本研究概述了纳入BSRTC第三版的新功能,BSRTC是一个标准化的、基于类别的甲状腺细针穿刺报告系统】,一项长期队列研究中报告的比率低至 1.1%【Eur. Thyroid J. 11,e220027 (2022)】。在~15%的超声或细胞学良性结节患者中观察到结节快速生长【J. Clin. Endocrinol. Metab.108, e458–e463 (2023); JAMA 313, 926–935 (2015)/一项前瞻性、多中心、观察性研究,检查良性甲状腺结节大小变化的频率、幅度和相关因素】。结节快速生长的预测因素包括存在多个结节、主结节体积 >0.2 ml 和男性。通过考虑自初次评估以来 3 年随访中计算的生长率,可以预测结节的未来行为【J. Clin. Endocrinol. Metab.108, e458–e463 (2023)】。据报道,~10%的患者会出现新结节,但这些结节中只有 3-6% 需要按照RSSs 的建议进行活检【Thyroid 28, 1190–1197 (2018).】。
这些考虑因素中的每一种都支持重新评估当前的随访策略,并在处理超声或细胞学良性伴无症状结节时减少随访频率。然而,仍然缺乏基于证据的指导。一项范围审查试图比较良性甲状腺结节患者不同的超声随访间隔,发现几乎没有强力证据来确定具有低风险超声模式和/或良性细胞学检查的甲状腺结节的最佳超声随访方案【Thyroid33, 420–427 (2023)】。临床指南主要基于专家意见,建议此类大于 1 cm 的结节应在 3-5 年后重新评估,并有可能重新分类。这种重新评估将允许重新评估监测间隔,甚至停止进一步的随访【Eur. Thyroid J. 12, e230067 (2023)】。如果未观察到任何变化,并且初始增长率缓慢(小于0.2mm/年),则评估的频率随后可能会减少。应考虑其他临床特征,如年龄和合并症。
由于恶性【53,56】和体积增长【JAMA 313, 926–935 (2015)/一项前瞻性、多中心、观察性研究,检查良性甲状腺结节大小变化的频率、幅度和相关因素】的风险都随着年龄的增长而降低,因此可能建议在高龄(例如,超过 65 岁)停止长期随访。
在没有甲状腺功能减退症的情况下,不鼓励使用甲状腺激素治疗来治疗良性甲状腺结节,因为其在缩小结节大小方面缺乏疗效,并且由于与此类治疗相关的潜在风险(增加并发症发生率和死亡率)【Eur. Thyroid J. 12, e230067 (2023).】。
引起症状的细胞学良性结节
甲状腺激素分泌的变化。
如果血清 TSH 水平高于参考范围,应评估游离甲状腺素和抗甲状腺过氧化物酶抗体水平,以量化甲状腺功能减退的程度并探讨是否存在自身免疫性甲状腺炎。如果确诊为甲状腺功能减退症,甲状腺激素治疗是合适的。导致甲状腺功能亢进症的热的“有毒”结节有指征接受放射性碘治疗【Endocr. Rev. 33, 920–980 (2012)】。该疗法在75-95% 的孤立性毒性结节或毒性多结节性甲状腺肿患者中实现甲状腺功能正常,并在 2-5 年后将多结节性甲状腺肿的体积减少 ~50-60%。然而,个体反应随甲状腺体积的变化而变化,并且难以预测。如果需要进一步缩小甲状腺肿,可以重复治疗【Endocr. Rev. 33, 920–980 (2012)】。
压迫症状。
经皮乙醇注射(用于囊性病变)
热消融(例如,激光消融、射频消融和微波消融)【J. Clin. Endocrinol. Metab. 105, 2869–2883(2020).】
非侵入性、高强度聚焦超声【Am. J. Otolaryngol. 44, 103999 (2023)/本研究评估了高强度聚焦超声治疗良性甲状腺结节的有效性和安全性】。
这些技术在适应症、副作用和相关成本方面有所不同【J. Clin. Endocrinol. Metab. 105, 2869–2883(2020)】。
治疗这些细胞学良性但压迫性结节的主要作用是避免不必要的手术及其相关并发症(甲状腺功能减退、术后出血、声音改变或喉返神经麻痹)。2023 年进行的一项荟萃分析发现,对于甲状腺结节良性患者,超声引导射频和微波消融术比传统手术或观察等待更有效、更安全;这些治疗导致症状更好地缓解,提高美容评分,降低并发症发生率,缩短住院时间并减少手术时间【Ultrasound Q. 39, 61–68 (2023)】。
根据支持使用这些方法的累积证据,国际科学学会发布了几项共识声明,规范了这些程序的适当使用,并描述了可以从这些治疗方式中受益的结节概况【Head Neck 44, 633–660 (2022)/本共识声明旨在为射频消融和相关超声引导消融技术在治疗良性和恶性甲状腺疾病中的使用提供全面和循证的指导;Eur. Thyroid J. 9, 172–185 (2020);Thyroid 33, 1150–1170 (2023)/该声明强调了采用标准化消融程序协议的重要性,以确保不同医疗机构的一致性和质量;Endocr. Pract. 28, 433–448 (2022)/经验丰富的医生已经证明,用于治疗良性和恶性甲状腺病变的微创技术是有效和安全的】。根据这些建议,这些技术的使用应仅限于引起局部压力或美容问题的良性病变,这些病变通常是单个或边界明确的主要结节≥30 mm,并在超声检查随访中确认增长【Eur. Thyroid J. 9, 172–185 (2020).】。当面对甲状腺肿大、毒性多结节性甲状腺肿或多发性甲状腺结节引起症状的患者时,手术仍然是首选【Ann. Surg. 271, e21–e93 (2020)】。
恶性可疑结节
此内容适用于细胞学检查不确定的结节(Bethesda III 级和 IV 级),这些结节具有可疑的超声检查模式或阳性或高风险分子检测,或 Bethesda V 级或 VI 级细胞学检查的结节。并非所有这些结节都需要手术切除:对于经过慎重判断的低危癌症患者,可考虑将主动监测作为立即手术的替代方法。这些病例包括大小在 10-15mm 以下、没有甲状腺外扩展的怀疑,没有转移扩散的证据,也没有与肿瘤侵袭性相关的令人担忧的细胞学特征的 PTC【J. Surg. Oncol. 121,958–963 (2020)】。
主动监测。
2003年发表的日本Kuma医院首次主动监测研究结果表明,超过 70% 的 microPTC(最大10 mm)在观察期间保持稳定,扩散到局部区域淋巴结的风险可以忽略不计(10 年内为 ~4%)【Thyroid 13, 381–387 (2003)】。此外,与肿瘤稳定的患者相比,表现出恶性肿瘤进展或生长并随后接受手术的患者的并发症发生率或死亡率没有增加。随后的几项研究也获得了类似的结果,现在一些实践指南支持主动监测的选择【Ann. Oncol. 30, 1856–1883 (2019);Thyroid 26, 1–133 (2016); Eur. Thyroid J. 12, e230067(2023)】。一项非随机对照试验表明,类似的方法对于高达 20 mm 的低风险 PTC 是可行的【JAMA Oncol. 8, 1588–1596 (2022)】。
主动监测包括每 6 个月定期进行颈部超声评估,直至确认稳定性(2 年无进展证据)。然后,颈部超声评估的频率减少到每 1-2年一次。仅当 PTC 进展时才建议手术:例如,如果 PTC 变大(增加 >3 mm)或出现可疑淋巴结。对于疾病进展率较低的老年患者,主动监测可能是一个特别合适的选择。如上所述,同样的情况也可以用热烧蚀技术治疗【Eur. Thyroid J. 10, 185–197 (2021)】。手术和热消融已被证明在 5 年的随访中具有相似的结果,但热消融技术比手术具有更低的并发症发生率和更好的生活质量【JAMA Surg. 159, 51–58 (2024);Thyroid 31, 1662–1672 (2021)】。虽然热消融术临床上有用的证据越来越多,但这种治疗仍然不是低风险甲状腺癌的治疗标准,这些甲状腺癌通常需要接受监测或手术治疗。
相反,对于具有高风险特征的肿瘤(例如,诊断时有临床转移、侵犯喉返神经或气管的体征或症状,以及细胞学检查显示高度恶性肿瘤)或涉及关键解剖区域的肿瘤患者(靠近气管或位于喉返神经途径中),积极监测或非手术治疗(如热消融)是不恰当的【Thyroid 26, 144–149 (2016)】。在这些情况下,建议进行手术治疗。
手术。
首先,它可能消除了大约一半患者终生左旋甲状腺素替代疗法的需要,因为剩余的甲状腺可以合成足够量的甲状腺激素。
对于结节为 1-4cm 的患者,叶切除术或甲状腺全切除术都是可以接受的。然而,对于那些结节较大或怀疑甲状腺外扩展或转移(局部或远处)的患者,甲状腺全切除术是首选方法【Ann. Surg. 271, e21–e93 (2020)】。对于结节不确定且分子学检测阳性的患者,通常提倡叶切除术联合峡部结节切除术。然而,对于存在较大不确定结节(≥3-4 cm)、进行性肿大、令人担忧的超声检查特征、高风险分子改变、辐射暴露或有甲状腺癌家族史的患者,可能需要进行甲状腺切除术。本文并不涉及局部浸润性或晚期甲状腺癌的进一步治疗;这些内容可以参阅其他综述【Ann. Oncol. 33, 674–684 (2022);JAMA 331, 425 (2024)】。
患者意愿和决策工具
鉴于临床情况和可用的选择的多样性,患者有时会寻求第二医疗意见,以确保自己选择正确的治疗方案。一项回顾性研究发现,最初的治疗医生提出的建议中约有35%与第二医学意见不完全一致【Am.J. Otolaryngol. 44, 103732 (2023)】。患者和医生对治疗甲状腺结节的意愿以及这些不同人群接受某些风险的意愿可能会有所不同【Head Neck Surg. 149, 803–810 (2023);Head Neck 45, 1772–1781 (2023)/一项横断面调查的结果表明,与积极监测和半甲状腺切除术相关的现实生活风险要么与个人愿意接受的风险相当,要么低于个人愿意承受的风险】。由于这些原因,已经开发了一些共享决策工具,以改善临床医生与患者的互动以及关于甲状腺结节诊断和治疗方案的讨论【Clin. Endocrinol. 96, 627–636 (2022)】。这些工具可能会提高对诊断和治疗选择的认识,并使患者更容易表达意愿,这对患者和临床医生都很有用【Endocrine 80, 124–133 (2023);Endocrine 83, 449–458 (2024)】。
结论
大多数甲状腺结节是良性的或推测为良性。通过使用包括超声检查在内的诊断方法,以及必要时进行 FNA 活检和分子检测,可以实现个体化、基于风险的方案,促进高质量的诊治并最大限度地降低成本和不必要的检查和治疗。超声检查风险评估仍然存在一些挑战。观察者之间的差异限制了一致性,但人工智能驱动的工具有望改进这种情况。此外,世界许多地区需要更广泛地获得分子检测。最后,更广泛地采用主动监测和微创方法将受益于未来更有力的证据,证明其长期优势。