精神依赖的神经生物学基础
药物成瘾的核心特征是强迫性寻药。了解强迫性寻药的机制将有助于我们更准确地理解药物成瘾的神经生物学基础。
(一)精神依赖相关的神经核团和神经回路
精神活性物质引起的精神依赖涉及多个核团和脑区,* * *共同构成了皮层-纹状体-丘脑环路(彩图3-3),其中奖赏环路和学习记忆相关环路起着重要作用。
第三,精神依赖的神经生物学基础
图3-3与药物成瘾相关的皮质-纹状体-丘脑回路
?红色箭头:多巴胺能投射;蓝色箭头:GABA能投射;黑箭头:谷氨酸可以投射。
1.中脑奖赏回路。
精神活性物质可引起精神依赖,这与其特殊的精神活性功能密切相关,包括愉悦、兴奋、增加觉醒程度、改善情绪和运动、增加探索行为,甚至产生幻觉,其中最重要的是奖励。
奖励主要有两个作用:一是激活行为,立即改变行为的方向和活跃度;
另一个功能是强化,它可以通过学习和记忆的过程改变未来的行为。
大脑中的奖赏系统主要由中脑边缘的多巴胺系统组成。
多巴胺能神经元位于VTA,神经纤维投射到NAc、PFC、海马、终纹床核、隔核、嗅结节和杏仁核。
其中,VTA-NAc环被认为是编码成瘾药物急性奖赏效应的主要神经环路,与药物引起的奖赏效应密切相关。
此外,该环路中的VTA还受PFC、杏仁核和海马中的谷氨酸投射和NAc中的GABA投射的调节。NAc不仅接受来自VTA的多巴胺能投射,还受来自PFC、杏仁核和海马的谷氨酸盐投射的调节。
NAc是腹侧纹状体的主要成分,是信息汇聚和整合的关键核团。NAc分为外壳和内核。壳区主要介导药物的奖赏效应,核区主要介导条件性强化。
几乎所有成瘾物质都能直接或间接增加NAc细胞外的多巴胺浓度,NAc编码的个体获得欣快感(奖励),并有再次体验这种欣快感的欲望(动机)。
因此,VTA-NAc的多巴胺能奖赏回路与成瘾启动的通路相同。
服药初期,精神活性物质激活了中脑边缘多巴胺系统的功能,使NAc区多巴胺水平显著升高,从而产生欣快感;
长期用药后,导致中脑边缘多巴胺系统相关核团或神经元突触的持续适应性变化。
虽然药物的奖赏效应会随着服药时间的延长而逐渐减弱(奖赏耐受),但会对毒品相关线索敏感化,这是导致渴求和复吸的主要因素。
与此同时,多巴胺的作用变得更加广泛,从简单地产生欣快感,到突出新的和不寻常的信号的意义,预测奖励因素是否到来,产生驱动力(动机),促进相关性学习。
2.学习和记忆相关回路
药物成瘾是异常学习建立起来的一种顽固的刺激-反应习惯,与学习和记忆有关的神经回路被证明在成瘾行为的形成和维持中起着重要作用。
研究表明,参与正常习惯学习和记忆的背侧纹状体(dStr)可能在强迫性寻药行为中发挥特殊作用。
规则服药向强迫服药转变的行为基础是有目的行为向习惯行为的转变,其神经生物学结构是NAc向dStr功能的迁移。
DStr可分为背外侧纹状体(dlStr)和背内侧纹状体(dmStr)两个亚区。
DmStr接受PFC投射形成的环路(功能类似于NAc核区),主要参与行为-结果耦合学习,影响有目的的行为,与规律用药有关;感觉运动皮层与dlStr相关,dlStr主要参与刺激-反应耦合学习,影响习惯性行为,可能与强迫性服药有关。大鼠可卡因自身给药模型建立初期,NAc壳核释放的多巴胺量显著增加,NAc功能的干预影响了用药和寻药行为。随着用药时间的延长,dStr取代NAc主导成瘾行为的调节。
经过45天的可卡因自我给药训练后,大鼠dlStr中DA(而非NAc)的释放显著增加。失活的dlStr可以恢复目标导向的可卡因寻药行为,但抑制强迫寻药行为。此外,使用正电子发射断层扫描(PET)发现,在可卡因自我给药训练仅5天后,恒河猴大脑中葡萄糖利用率的变化仅限于NAc,但在给药100天后,这些变化已经扩展到尾壳核的大部分区域(相当于啮齿动物的dStr)。
临床研究还发现,可卡因成瘾者dStr(而非腹侧纹状体)的多巴胺功能与线索诱发的渴求呈正相关。
因此,纹状体腹侧和背侧功能的转换是强迫性觅药行为的重要原因之一。这一转换过程由前额叶皮层不同脑区的谷氨酸盐能量调节。
在从规则用药向强迫用药发展的过程中,NAC和dStr的功能并不是孤立存在的,而是通过纹状体-黑质-纹状体(SNS)的螺旋环形成功能联系,NAc和DSTR的级联可能参与了强迫用药的觅药行为的发展。
此外,作为情绪记忆的关键核团,杏仁核在成瘾行为中也起着重要作用。中央杏仁核主要参与强迫性寻药行为,外侧杏仁核在药物相关条件线索相关学习记忆和诱发复吸中起关键作用。
海马作为记忆中枢,在情境线索相关的学习记忆和诱发复发中起着重要作用。
上述皮层下结构在成瘾和病理性学习记忆的形成中非常重要,虽然不是全部要素,但却是必不可少的前提条件。
最有力的生物学证据是,线虫也可以对精神活性物质成瘾,形成一些相对简单的记忆行为,而线虫并没有复杂的中枢脑结构。
因此,有必要重视上述研究成果,充分考虑其在成瘾干预中的价值和意义。
3.前额叶皮层对成瘾行为的广泛调节作用。
PFC也是药物成瘾的关键脑区,参与药物成瘾的许多方面,包括渴求、动机和决策。
目前认为PFC的中前额叶皮质(mPFC)、眶额皮质(OFC)和前扣带回皮质(ACC)与强迫性药物使用密切相关。
吸毒者往往表现出注意偏向、决策障碍、冲动抑制缺陷等认知功能障碍。对毒品和毒品相关的刺激,从而导致强迫性的寻药行为。
主要原因是PFC的结构和功能发生了变化。
PFC接收来自VTA的多巴胺能投射和来自海马和基底外侧杏仁核的谷氨酸能投射,发出谷氨酸能纤维支配VTA、NAc、海马和基底外侧杏仁核。
mPFC投射到NAc的谷氨酸环功能的适应性改变导致控制功能缺陷和对药物相关刺激的敏感化。
MPFC包括背内侧前额叶皮质(PrL)和腹内侧前额叶皮质(IL),其中PrL主要投射到NAc核,IL主要投射到NAc壳。PrL-NAc核投射主要调控寻药动机,IL-NAc壳投射主要调控寻药行为的表达。
长期大量使用成瘾药物,导致PrL向NAc的投射功能减弱,促进强迫性觅药行为的形成。
OFC通过与外侧基底杏仁核和NAc的神经连接来预测事件,并通过比较价值和预期来指导决策。
OFC受损后,会导致对反应结果的错误判断,导致强迫反应的出现。长期吸毒导致的OFC功能下调,使成瘾者出现决策障碍,引起强迫性寻药行为。
此外,破坏ACC会破坏选择注意和区分不同条件信号的能力,这些能力的丧失会导致无法提供及时准确的信息以启动行为抑制机制。
总之,长期用药导致的PFC认知功能障碍是强迫性用药的另一个重要原因。另外
PFC还通过增强刺激的价值凸显和动机意义来参与药物成瘾行为。
4.与复发相关的神经回路
即使在长期戒断后,涉毒线索和环境,小剂量的毒品点燃和应激都可以诱发复吸,这也是戒毒治疗的难点。
卡利瓦斯经过大量研究,提出了复吸的神经回路(彩图3-4)。VTA到外侧基底杏仁核再到PFC的投射是诱发复吸的药物相关线索通路;
扩展杏仁核(包括中央杏仁核、终纹床核和NAc壳)向VTA再向PFC的投射是应激诱发复发的通路。
PFC向NAc核再向腹侧苍白球的投射是应激、毒品相关线索或毒品诱发复吸的同一通路。
与多巴胺相比,谷氨酸系统在复发中占主导地位。
?图3-4复发的神经回路
?红色:药物、线索或压力诱发复吸;
?绿色:线索诱发复发的途径
蓝色:压力导致复发的途径
(2)与精神依赖相关的神经递质系统
神经递质是实现神经回路功能的物质基础。根据现有的研究结果,几乎所有已知的中枢神经递质都不同程度地参与了药物成瘾。
其中,多巴胺和谷氨酸神经递质系统是研究最多的,也是最重要的。
1.多巴胺系统
VTA-NAc多巴胺能神经通路介导的奖赏效应是成瘾启动的第一步。几乎所有精神活性物质都可以直接或间接激活这种多巴胺能神经通路,但它们最初的作用机制是不同的。
阿片类药物通过激活VTA GABA能中间神经元上的μ阿片受体抑制GABA能神经元的活动,从而解除GABA能神经元对VTA多巴胺能神经元的抑制,增加投射靶区NAc释放的多巴胺量,激活NAc内GABA能投射神经元,实现奖赏效应的编码;
可卡因和苯丙胺类兴奋剂作用于NAc的多巴胺能神经末梢,可卡因通过抑制质膜多巴胺转运体阻断多巴胺重摄取;
苯丙胺类兴奋剂不仅可以抑制质膜多巴胺转运体阻断多巴胺重摄取,还可以通过逆转囊泡单胺转运体2和质膜单胺转运体的功能,促进多巴胺逆向转运,增加细胞外多巴胺含量,从而上调VTA-NAc中多巴胺通路的功能。
大麻可以通过激活GABA能神经元和谷氨酸能神经元上的CB1受体来增加VTA多巴胺能神经元的放电和NAc中的多巴胺浓度。
尼古丁可激活位于VTA多巴胺能神经元的α4β2烟碱乙酰胆碱受体,从而增加VTA多巴胺能神经元在NAc中的多巴胺释放。
乙醇通过作用于GABAA受体和NMDA受体,以某种间接方式增加NAc的多巴胺释放。
早期认为多巴胺是奖赏(欣快感)的物质基础,但近年来发现多巴胺还介导奖赏期望误差和奖赏相关的关联性学习。
Schultz等人系统地研究了VTA多巴胺能神经元对奖赏刺激的反应。
在恒河猴经典条件反射训练的实验模型中,他们发现自然奖赏(如果汁和食物)刺激引起VTA脑区多巴胺能神经元的时相放电频率增加,而非自然奖赏刺激不能引起多巴胺能神经元的时相放电频率增加,提示多巴胺能神经元可以据此区分奖赏刺激和非奖赏刺激;
进一步的研究表明,对于不同的自然奖赏刺激,上述多巴胺能神经元的放电模式没有显著差异,提示多巴胺能神经元不能区分自然奖赏的性质。
此外,多巴胺能神经元也参与了奖赏的学习,这说明在对奖赏刺激的反应中可以建立巴甫洛夫条件反射。当声或光信号与原始奖赏(果汁)反复配对时,单一条件刺激(声或光信号)也能引起多巴胺能神经元的相放电频率增加,说明多巴胺不仅对奖赏本身(果汁)有反应,而且对奖赏的预期(条件刺激)也有反应。
这种对奖励和配对条件刺激的反应是随着配对训练次数的增加而逐渐变化的。在训练开始时,只有原始的奖赏能引起多巴胺能神经元的放电频率增加;训练中期,奖赏和条件刺激均可引起多巴胺能神经元放电频率增加;经过训练(条件刺激和奖赏之间的联系已经牢固建立),只有条件刺激才能引起多巴胺能神经元的放电频率增加。
这说明多巴胺能神经元对原始奖赏的反应可以通过关联学习转移到与奖赏相关的条件刺激上。当不给予条件刺激时,实验动物无法预测自己可能获得奖励(奖励不可预测),给予奖励刺激可引起多巴胺能神经元放电频率增加;当给予条件刺激,使实验动物可以期望得到奖赏(奖赏被预测),给予奖赏刺激(奖赏与期望一致),条件刺激可以增加多巴胺能神经元的放电频率,但奖赏本身并不改变多巴胺能神经元的放电频率;当给予条件刺激而没有奖励(奖励预测误差)时,条件刺激导致放电频率增加,而没有出现的奖励导致放电频率减少。这些结果表明,多巴胺能神经元并不对所有的奖励做出反应,而只对实际奖励和预期奖励之间的差异做出反应,即只对奖励的预期误差做出反应。
。当奖励好于预期或意外外出时,多巴胺能神经元反应积极,而当奖励差于预期或没有在预期时间出现时,多巴胺能神经元反应消极。
精神活性物质使突触间隙多巴胺水平过度持续上升,使大脑误以为毒品的回报比预期的好,从而使毒品的价值凸显,诱发寻药行为。
由于药物诱导的多巴胺释放比食物等自然奖励诱导的更高、更持久,一方面药物相关刺激与奖励的相关性更强烈,另一方面自然奖励目标被贬值。
此外,多巴胺还介导行为-结果相关学习和习惯学习(刺激-反应相关学习)。
细胞外多巴胺通过激活多巴胺受体发挥作用。多巴胺受体分为五个亚型,如D1 ~ D5。D1和D5亚型与Gs蛋白偶联,统称为D1样多巴胺受体,主要分布于突触后膜;亚型D2、D3和D4与Gi/o蛋白偶联,统称为D2样受体,分布于突触前膜和突触后膜。D1样受体和D2样受体介导的功能及其在成瘾不同阶段的作用是不同的。D1样受体主要介导成瘾药物的奖赏和动机敏化,在药物使用初期中枢神经系统的代偿性适应中起主导作用;而D2样受体可能更多参与条件性强化和强迫性觅药行为,在用药后期中枢神经系统的代偿性适应中起主导作用。在药物成瘾者和动物模型中,纹状体中D2/D3受体的密度均降低。用光遗传学技术抑制小鼠NAc中D2受体阳性的中度棘状GABA神经元,小鼠出现强迫性觅药行为。高冲动大鼠(D2受体密度低)更容易形成强迫性觅药,但有研究表明,高冲动大鼠在二次强化训练中延缓了觅药的习惯。这些研究表明,在成瘾发展的后期,D2受体及其神经元的通路比D1受体起着更重要的作用,D2受体介导的间接通路主导了强迫性寻药行为的调节,但确切的调节方式尚不清楚。此外,D2受体密度也可能是成瘾易感性的生物学标志。高冲动性大鼠在可卡因自我给药训练过程中的用药频率更高,高冲动性人格的人更倾向于滥用成瘾药物。高冲动背后的分子基础可能是D2受体密度降低:高冲动大鼠的NAc和VTA中D2受体mRNA明显低于低冲动大鼠,高冲动大鼠腹侧纹状体中D2/D3受体密度更低。
2.谷氨酸系统
如上所述,多巴胺系统主要介导药物的强化,在奖赏相关的关联学习中起重要作用,但对长时关联记忆影响不大。
谷氨酸系统不是。虽然谷氨酸也参与奖励相关的关联学习,但它与长时关联记忆关系最密切,起着关键作用。
因此,多巴胺系统的参与在成瘾的启动和形成中是必要的。
;在成瘾的维持和复发过程中,谷氨酸系统的参与是必不可少的。
大量证据表明,药物诱导的欣快感和成瘾的启动需要释放NAc中的多巴胺,随着药物的反复使用,PFC及其投射到NAc和其他核团的谷氨酸能神经元也参与其中。因此有学者提出,从偶然用药到规律用药,从规律用药模式复吸到强迫用药模式复吸的发展,经历了从中脑边缘皮层多巴胺系统到前额叶皮层谷氨酸系统,再到皮层纹状体谷氨酸系统的转变。
在药物成瘾过程中,谷氨酸直接或间接调节多巴胺系统的功能;同样,多巴胺也可以通过中脑边缘皮层的投射影响谷氨酸的功能。
VTA的多巴胺能神经元活动受来自PFC、杏仁核和海马的谷氨酸能神经投射支配。
一方面,引入VTA的谷氨酸能神经纤维支配多巴胺能神经元细胞,提高了多巴胺能神经元细胞的兴奋性,促进了NAc中多巴胺的释放;
另一方面,传入NAc的谷氨酸能神经纤维支配多巴胺能神经元的末梢,并通过突触前机制促进NAc内多巴胺的释放。
NAc中具有GABA能量的中度棘状神经元的树突棘同时与多巴胺能终末和谷氨酸能终末形成突触联系,其活动受这两种神经递质调节。
因此,谷氨酸也可以调节依赖于中脑边缘多巴胺系统的行为敏化。
行为敏化的形成需要暂时增加VTA的谷氨酸释放,从而激活VTA的多巴胺能神经元并增强其放电,这又导致该回路中多巴胺释放的增加。
VTA内微量注射谷氨酸受体阻滞剂可阻断精神活性物质引起的敏化作用。
。与NAc类似,背侧纹状体也接受多巴胺能投射和谷氨酸盐投射来控制其功能,因此谷氨酸盐系统也参与了强迫性觅药行为的调节。
一般来说,在用药初期,谷氨酸系统没有发生适应性变化。随着用药时间的延长和剂量的增加,PFC对NAc的谷氨酸优势减弱,使皮质纹状体功能增强,产生强迫性用药和强迫性寻药。
在寻药范式的训练中,大鼠在NAc核内微量注射AMPA受体/KA受体阻断剂后的寻药行为明显减少,提示NAc的谷氨酸系统参与了在用药初期对寻药行为的调节。然而,经过45天的可卡因自我给药训练后,dlStr内微量注射AMPA受体/KA受体阻断剂(而非NAc)显著减少了大鼠的觅药行为,提示背侧纹状体内的谷氨酸系统可能通过更稳定的神经适应性变化参与强迫性觅药行为。
因为长期戒断后复吸的根本原因是极其顽固的成瘾记忆,而谷氨酸及其受体是介导长期记忆的关键,所以对复吸起决定性作用的是谷氨酸而不是多巴胺。
将AMPA微量注射到可卡因自我给药大鼠的NAc内,可重建觅药行为(即复吸);有学者认为,AMPA诱导的觅药行为重建可能与局部多巴胺释放增加有关,但使用多巴胺受体阻滞剂不能阻断AMPA的重建作用,说明复吸原因是NAc谷氨酸系统激活。
此外,通过电刺激可卡因自我给药大鼠的腹侧下海马,通过图3-4描述的“复发环”重构了觅药行为,但对富含多巴胺能纤维的中间前脑束刺激无效。
从PFC到NAc的谷氨酸投射被认为是药物相关线索、低剂量药物和应激诱发的复发的共同回路。谷氨酸系统稳态的减弱通过影响神经可塑性产生持久的行为改变,导致复发。
长期用药降低了负责维持谷氨酸基础水平的谷氨酸-半胱氨酸交换体的密度,降低了NAc核内谷氨酸的基础水平。
基础谷氨酸水平降低削弱了代谢型谷氨酸受体mGluR2/3介导的突触前负反馈的调节能力。在回归训练期连续给予N-乙酰半胱氨酸,通过促进谷氨酸-半胱氨酸交换增加细胞外基础谷氨酸水平,从而恢复mGluR2/3的突触前调节能力,防止线索或药物点燃引起的谷氨酸水平急剧升高,从而抑制觅药行为的重建。
更重要的是,在消退期持续给予N-乙酰半胱氨酸可以逆转长期用药引起的NAc核内突触可塑性变化,因此即使停药20天以上也能抑制cue或药物诱导的复发。其他恢复谷氨酸稳态的手段,如阻断突触后NMDA受体和mGluR5,增加谷氨酸转运体1的表达,也可以防止复发。谷氨酸及其受体是突触传递可塑性的基础,在成瘾的长时记忆中起重要作用,这将在下一部分详细介绍。
3.其他神经递质系统
除多巴胺和谷氨酸外,阿片肽、GABA和5-羟色胺等内源性神经递质通过与多巴胺和谷氨酸系统相互作用参与药物成瘾过程。
比如内源性阿片肽和5-羟色胺调节多巴胺系统的功能,GABA不仅调节多巴胺系统的功能,还调节谷氨酸系统的功能。
GABA是大脑中最重要的抑制性神经递质,它与兴奋性神经递质协调大脑的正常功能。
GABA受体分为GABAA、GABAB和GABAC三种亚型,其中GABAA和GABAC属于递质门控离子通道,GABAB受体为G蛋白偶联受体。VTA多巴胺能神经元的活动受γ-氨基丁酸能神经元的抑制,γ-氨基丁酸能神经元上有μ阿片受体。阿片类药物可抑制GABA能神经元的功能,减少GABA的释放,从而解除多巴胺能神经元的紧张抑制,增加释放到NAc区的多巴胺含量。酒精可以作用于GABAA受体和NMDA受体,从而以某种间接方式增加多巴胺能神经元的活性。GABA能神经元对VTA多巴胺能神经元的调节是由GABAA受体和GABAB受体介导的,GABA受体的激活可以抑制精神活性物质的奖赏和强化效应。海马、杏仁核和PFC中的GABA神经递质系统也通过影响谷氨酸能锥体神经元的功能参与精神活性物质相关的场景和线索相关的记忆及其认知功能障碍。另外,作为奖赏和动机核心的NAc,以及强迫性用药行为的关键核dStr,它们自身的输出神经元都是GABA能神经元。
因此,GABA系统通过调节中脑边缘皮质通路和皮质纹状体通路的功能参与药物成瘾。
内源性阿片肽包括脑啡肽家族、内啡肽家族、强啡肽家族以及后来分离出的许多新的阿片肽,其中最重要的成员包括β-内啡肽、脑啡肽和强啡肽,其受体分别为μ、δ和κ阿片受体。内源性阿片肽及其受体广泛分布于中枢神经系统,尤其是在VTANAc等奖赏和动机回路中。
如上所述,外源性阿片可激活分布在VTA GABA能中间神经元上的μ阿片受体,解除GABA能神经元对多巴胺能神经元的抑制,增加NAc内多巴胺的释放;然而,在NAc的多巴胺能神经元的轴突末梢也存在κ阿片受体,κ阿片受体的激活抑制了多巴胺的释放。因此,μ阿片受体和κ阿片受体* * *都调节NAc中多巴胺的释放。
。同时,外源性阿片类药物还可以通过作用于NAc中中度棘神经元上的μ阿片受体和δ阿片受体,调节以多巴胺能神经元为主的棘神经元的功能。许多非阿片类精神活性物质也能作用于内源性阿片肽系统。临床前研究表明,酒精、可卡因和苯丙胺类兴奋剂可增加大鼠NAc的内啡肽水平,并参与调节NAc的细胞外多巴胺水平。
此外,苯丙胺的急性治疗可以调节纹状体中阿片受体mRNA的表达。长期饮酒会增加μ阿片受体和δ阿片受体的密度。因此,内源性阿片肽系统通过影响NAc内多巴胺的释放,参与调节多种成瘾物质的奖赏效应。内源性阿片肽系统不仅介导奖赏效应,还介导药物戒断后的戒断综合征。维持内源性阿片肽系统的功能稳定是药物成瘾的治疗策略之一。