Дофамин способствует пластичности направления головы во время ориентировочных движений.
Nature, том 612, страницы 316–322 (2022 г.) Процитировать эту статью
12 тысяч доступов
5 цитат
35 Альтметрика
Подробности о метриках
Авторская поправка к этой статье была опубликована 24 мая 2023 г.
Эта статья обновлена
В нейронных сетях, хранящих информацию в весах соединений, существует компромисс между чувствительностью и стабильностью1,2. Связи должны быть пластичными, чтобы включать новую информацию, но если они слишком пластичны, сохраненная информация может быть повреждена. Потенциальное решение состоит в том, чтобы обеспечить пластичность только в те периоды, когда информация по конкретной задаче богата, на основе сигнала «когда учиться»3. Мы пришли к выводу, что дофамин дает сигнал о том, когда учиться, который позволяет пространственным картам мозга обновляться, когда доступна новая пространственная информация, то есть когда животное движется. Здесь мы показываем, что дофаминовые нейроны, иннервирующие сеть направления головы дрозофилы, особенно активны, когда муха поворачивается, чтобы изменить направление головы. Более того, их активность масштабируется с ежесекундными колебаниями скорости вращения. Сочетание высвобождения дофамина со зрительным сигналом постоянно усиливает влияние сигнала на клетки направления головы. И наоборот, ингибирование этих дофаминовых нейронов снижает влияние сигнала. Этот механизм должен ускорить обучение в моменты, когда ориентирующие движения обеспечивают богатый поток информации о направлении головы, позволяя снизить скорость обучения в другое время для защиты сохраненной информации. Наши результаты показывают, как пространственное обучение в мозге можно сжать в отдельные периоды, в которых высокие темпы обучения соответствуют высоким темпам поступления информации.
В искусственных нейронных сетях обучение обычно ограничивается определенными эпохами, когда сети предоставляется богатый источник обучающих данных; затем соединения замораживаются вне этих эпох, чтобы предотвратить потерю хранимой информации4. Напротив, в биологических нейронных сетях обучение часто считается непрерывным и не ограничивается конкретными эпохами5. Однако во время биологического обучения с вознаграждением дофаминовые нейроны избирательно активируются из-за ошибок прогнозирования вознаграждения, и высвобождение дофамина способствует обучению с вознаграждением в ответ на эти ошибки6. Таким образом, дофамин сжимает вознаграждение за обучение в определенные эпохи, когда информация для конкретной задачи богата. Однако неясно, управляет ли аналогичный сигнал о том, когда учиться, другими формами обучения, такими как пространственное обучение без присмотра.
Во время пространственного обучения информация, соответствующая задаче, поступает от движения в пространстве, что может служить полезным сигналом о том, когда следует учиться. Действительно, некоторые дофаминовые нейроны привязаны по времени к движению7,8,9,10,11,12,13,14 и даже к определенным кинематическим переменным, таким как ускорение тела вперед или скорость вращения головы15,16,17. , 18. Активность блокировки движения также была отмечена в некоторых дофаминовых нейронах мозга Drosophila melanogaster19,20,21,22,23. К ним относятся нейроны ExR222, которые обеспечивают дофаминергический вход24,25,26 клеткам направления головы27, также известным как нейроны EPG (рис. 1a и расширенные данные, рис. 1). Нейроны EPG могут быстро изучать новые конфигурации визуальных сигналов, когда муха попадает в новую среду, вероятно, благодаря пластичности Хебба в синапсах от нейронов зрительного ER к нейронам EPG28,29; однако этот тип пространственного обучения следует разрешать только тогда, когда муха активно меняет направление головы, чтобы избежать создания смещений в карте направления головы, когда взгляд мухи неподвижен - по сути, чтобы избежать «переобучения» любого конкретного снимка. визуальной сцены29. Мы задались вопросом, являются ли нейроны ExR2 избирательно активными, когда муха меняет направление головы, и если да, то способствуют ли эти дофаминовые нейроны ассоциациям между зрительными сигналами и направлениями головы.
а, Схема карты направления головы. б — Визуализация jGCaMP7f в нейронах ExR2 при измерении скорости вращения и скорости ходьбы вперед. в — среднее значение ExR2 ΔF/F в зависимости от скорости вращения (одна линия на муху, n = 13 мух). Серая заливка обозначает переходы между отдыхом и движением; вне этого диапазона ΔF/F и скорость вращения связаны линейно. d, Среднее значение ExR2 ΔF/F, распределенное по скорости вращения и скорости движения, агрегированное по 13 полетам и усредненное по временным точкам. Серые контейнеры пусты. е, объяснение дисперсии (скорректированный R2) для моделей линейной регрессии, которые используют скорость для прогнозирования активности ExR2. Каждая пара точек — это одна муха (n = 13). Модели подгонялись отдельно для каждой мухи. Одна только скорость вращения обеспечивала высокий R2; добавление скорости движения вперед привело к небольшому дополнительному увеличению (***P = 5,3 × 10−5, двусторонний парный t-критерий). е — реакция ExR2 на зрительный поток. Неподвижная вертикальная решетка начинает вращаться, и начало оптического потока приводит к устойчивому увеличению активности ExR2 (среднее значение ± sem для мух; ΔF/F значительно отличается от нуля с P = 0,0012, двусторонний одновыборочный t-критерий Стьюдента). , n = 13 мух). Здесь мы анализировали только опыты, когда муха стояла на месте. g. Пример данных, используемых в качестве входных данных модели. Мухи ходили в виртуальной среде с визуальным указанием направления головы. h, Схема подключения ER к EPG. Соседние нейроны ЭР на схеме имеют соседние рецептивные поля в азимутальном пространстве. Веса соединений обозначены размерами кружков. Веса инициализируются случайным образом, а затем развиваются за счет пластичности Хебба. i, Веса из типичного прогона модели. j — средняя круговая корреляция между средним вектором совокупности выходных весов ER и входных весов EPG; среднее значение (n = 117 симуляций, обученных на перетасованных данных) ± 95% доверительный интервал. В конце моделирования корреляция выше со скоростью адаптивного обучения (P = 6,2 × 10-21, двусторонний критерий рангов знаков Уилкоксона).