Дофамин способствует пластичности направления головы во время ориентировочных движений.

Nature, том 612, страницы 316–322 (2022 г.) Процитировать эту статью

12 тысяч доступов

5 цитат

35 Альтметрика

Подробности о метриках

Авторская поправка к этой статье была опубликована 24 мая 2023 г.

Эта статья обновлена

В нейронных сетях, хранящих информацию в весах соединений, существует компромисс между чувствительностью и стабильностью1,2. Связи должны быть пластичными, чтобы включать новую информацию, но если они слишком пластичны, сохраненная информация может быть повреждена. Потенциальное решение состоит в том, чтобы обеспечить пластичность только в те периоды, когда информация по конкретной задаче богата, на основе сигнала «когда учиться»3. Мы пришли к выводу, что дофамин дает сигнал о том, когда учиться, который позволяет пространственным картам мозга обновляться, когда доступна новая пространственная информация, то есть когда животное движется. Здесь мы показываем, что дофаминовые нейроны, иннервирующие сеть направления головы дрозофилы, особенно активны, когда муха поворачивается, чтобы изменить направление головы. Более того, их активность масштабируется с ежесекундными колебаниями скорости вращения. Сочетание высвобождения дофамина со зрительным сигналом постоянно усиливает влияние сигнала на клетки направления головы. И наоборот, ингибирование этих дофаминовых нейронов снижает влияние сигнала. Этот механизм должен ускорить обучение в моменты, когда ориентирующие движения обеспечивают богатый поток информации о направлении головы, позволяя снизить скорость обучения в другое время для защиты сохраненной информации. Наши результаты показывают, как пространственное обучение в мозге можно сжать в отдельные периоды, в которых высокие темпы обучения соответствуют высоким темпам поступления информации.

В искусственных нейронных сетях обучение обычно ограничивается определенными эпохами, когда сети предоставляется богатый источник обучающих данных; затем соединения замораживаются вне этих эпох, чтобы предотвратить потерю хранимой информации4. Напротив, в биологических нейронных сетях обучение часто считается непрерывным и не ограничивается конкретными эпохами5. Однако во время биологического обучения с вознаграждением дофаминовые нейроны избирательно активируются из-за ошибок прогнозирования вознаграждения, и высвобождение дофамина способствует обучению с вознаграждением в ответ на эти ошибки6. Таким образом, дофамин сжимает вознаграждение за обучение в определенные эпохи, когда информация для конкретной задачи богата. Однако неясно, управляет ли аналогичный сигнал о том, когда учиться, другими формами обучения, такими как пространственное обучение без присмотра.

Во время пространственного обучения информация, соответствующая задаче, поступает от движения в пространстве, что может служить полезным сигналом о том, когда следует учиться. Действительно, некоторые дофаминовые нейроны привязаны по времени к движению7,8,9,10,11,12,13,14 и даже к определенным кинематическим переменным, таким как ускорение тела вперед или скорость вращения головы15,16,17. , 18. Активность блокировки движения также была отмечена в некоторых дофаминовых нейронах мозга Drosophila melanogaster19,20,21,22,23. К ним относятся нейроны ExR222, которые обеспечивают дофаминергический вход24,25,26 клеткам направления головы27, также известным как нейроны EPG (рис. 1a и расширенные данные, рис. 1). Нейроны EPG могут быстро изучать новые конфигурации визуальных сигналов, когда муха попадает в новую среду, вероятно, благодаря пластичности Хебба в синапсах от нейронов зрительного ER к нейронам EPG28,29; однако этот тип пространственного обучения следует разрешать только тогда, когда муха активно меняет направление головы, чтобы избежать создания смещений в карте направления головы, когда взгляд мухи неподвижен - по сути, чтобы избежать «переобучения» любого конкретного снимка. визуальной сцены29. Мы задались вопросом, являются ли нейроны ExR2 избирательно активными, когда муха меняет направление головы, и если да, то способствуют ли эти дофаминовые нейроны ассоциациям между зрительными сигналами и направлениями головы.

а, Схема карты направления головы. б — Визуализация jGCaMP7f в нейронах ExR2 при измерении скорости вращения и скорости ходьбы вперед. в — среднее значение ExR2 ΔF/F в зависимости от скорости вращения (одна линия на муху, n = 13 мух). Серая заливка обозначает переходы между отдыхом и движением; вне этого диапазона ΔF/F и скорость вращения связаны линейно. d, Среднее значение ExR2 ΔF/F, распределенное по скорости вращения и скорости движения, агрегированное по 13 полетам и усредненное по временным точкам. Серые контейнеры пусты. е, объяснение дисперсии (скорректированный R2) для моделей линейной регрессии, которые используют скорость для прогнозирования активности ExR2. Каждая пара точек — это одна муха (n = 13). Модели подгонялись отдельно для каждой мухи. Одна только скорость вращения обеспечивала высокий R2; добавление скорости движения вперед привело к небольшому дополнительному увеличению (***P = 5,3 × 10−5, двусторонний парный t-критерий). е — реакция ExR2 на зрительный поток. Неподвижная вертикальная решетка начинает вращаться, и начало оптического потока приводит к устойчивому увеличению активности ExR2 (среднее значение ± sem для мух; ΔF/F значительно отличается от нуля с P = 0,0012, двусторонний одновыборочный t-критерий Стьюдента). , n = 13 мух). Здесь мы анализировали только опыты, когда муха стояла на месте. g. Пример данных, используемых в качестве входных данных модели. Мухи ходили в виртуальной среде с визуальным указанием направления головы. h, Схема подключения ER к EPG. Соседние нейроны ЭР на схеме имеют соседние рецептивные поля в азимутальном пространстве. Веса соединений обозначены размерами кружков. Веса инициализируются случайным образом, а затем развиваются за счет пластичности Хебба. i, Веса из типичного прогона модели. j — средняя круговая корреляция между средним вектором совокупности выходных весов ER и входных весов EPG; среднее значение (n = 117 симуляций, обученных на перетасованных данных) ± 95% доверительный интервал. В конце моделирования корреляция выше со скоростью адаптивного обучения (P = 6,2 × 10-21, двусторонний критерий рангов знаков Уилкоксона).

10 min; Fig. 3c,d). This result indicates that a burst of dopamine neuron activity can persistently strengthen the influence of a visual cue on head direction neurons. We also observed that ExR2 activation increased the bump amplitude, although this effect was more transient (Fig. 3e,f), mirroring the relatively transient increase we observed in single-cell visual response amplitude (Fig. 2e,f). None of these effects occurred in control experiments in which ATP was washed into the bath but ExR2 neurons did not express P2X2 receptors (Fig. 3c–f)./p>

1 M NaCl) in the exact same manner that ATP or dopamine solutions were normally delivered. The first deviation in current signal measured by the electrode was used to estimate the entry of the new solution. For data display, measurements are plotted relative to the earliest time when the drug (ATP or dopamine) entered the recording chamber (t = 0)./p> 0.05; *P < 0.05; **P < 0.01; ***P < 0.0005./p>15° s−1 or forward speed >2 mm s−1) were included in the analysis. The plots in Extended Data Fig. 3b were generated using data from two different 5-min epochs during a single recording, with a 5-min gap between them. The correlation between rotational speed and ExR2 activity was calculated as described above, and the resulting coefficients were smoothed with a 2D Gaussian kernel (σ = 1.5) and manually thresholded to show only the pixels with the strongest positive and negative correlations. Background (greyscale) images in Extended Data Fig. 3b show trial-averaged fluorescence from these same five imaging planes./p>10 mV) and a stereotyped time course. They are followed by a prolonged period of depolarization when the variance of the voltage trace is also diminished. These inhibitory events interfered with visual tuning measurements, and so for Fig. 2 and Extended Data Figs. 6–8, if an event occurred it was clipped out. Such clipping was required for 12% of trials. For one cell (fly 543, cell 1), the first 12 s of the first baseline trial had too much holding current applied. Those 12 s were also excluded from the analysis./p>

0 in blue and R < 0 in red, with stronger absolute correlations having more saturated color values. Correlation values are only shown for the pixels with the strongest correlations (top 15% of absolute correlation values). Note that many pixels have consistent tuning across the two trials. Pixels with positive and negative correlations are likely to arise from the right and left copies of ExR2, respectively. This analysis demonstrates that the direction-selectivity we see in the LAL arbors is preserved in the EB and BU arbors of these cells. If dopamine release from each ExR2 neuron is proportional to the fly's ipsilateral rotational velocity, then total (summed) dopamine release in the EB should be proportional to the fly's rotational speed./p>30°/sec), with one data point per fly. In the epochs with the visual cue, slopes were significantly smaller and intercepts were larger, compared to epochs of darkness in the same experiments (slope: p = 6.3 × 10−5, intercept: p = 0.0004, two-sided paired t-tests with Bonferroni correction, n = 29 flies). This indicates that the visual cue boosts ExR2 activity for low rotational speeds; however, the magnitude of this effect is very small. These results are consistent with the fact that ExR2 neurons respond to optic flow (Fig. 1f), and the movements of the cue produce a small amount of optic flow. b) We also tested the effect of jumping the visual cue by 90° during these closed-loop epochs; we found that this produced a very small and transient ExR2 response, which is likely due to the small transient increase in optic flow that the cue jump produces (compare with Fig. 1f). Shown here is the average response from a typical example fly (mean of 11 trials ± SEM). To assess the effect of the cue jump, we analyzed only those trials where the fly happened to be standing immobile for several seconds before and after the jump, in order to avoid confounds associated with jump-induced behaviors. c) Here we compare epochs of walking in darkness with epochs of open-loop cue rotation at constant velocity (with the same cue velocity used in Figs. 2, 3, and 4, i.e. ~18°/s). Left: mean ExR2 ΔF/F versus the fly's rotational speed for 8 example flies. Data are binned by rotational speed and averaged across time points. Right: slope and y-intercept of lines fit to the data for each fly in the linear portion of the curves (rotational speeds >30°/s). Visual cue rotation at constant velocity had no significant effect on the relationship between ExR2 activity and the fly's rotational speed (slope: p = 0.87, y-intercept: p = 0.15, two-sided paired t-tests with Bonferroni correction, n = 11 flies). However, this data set shows a small trend in the same direction as what we observed in the closed-loop case; because there are fewer replicates here, there is less statistical power. The main result of this experiment is simply that we find no evidence that open-loop cue movement produces any larger response than closed-loop cue movement does. The flies in this panel are the same as those shown in Fig. 1c–f./p> 0.05 criterion for significance). Changes in preferred cue position tuning were assessed using parametric Watson-Williams multi-sample tests with Bonferroni correction./p>