Аннотация
На базе результатов работы Herpin, Lancelot & Vadlamudi, Pratik & Mahawa, Rukam & Troftgruben, Mark & Hua, Joanna & Dine, C. & Hashikawa, Andrew. (2026). A Student-Centered Approach Towards Implementing Large Language Models (LLMs) in Medical Education, представлен аналитический обзор современных тенденций внедрения генеративных нейросетей на основе больших языковых моделей (LLM) в профессиональную подготовку врачей и клиническую деятельность. На основе данных cross-секционного опроса студентов двух медицинских школ США (n=103) показана прямая корреляция между частотой использования LLM, уровнем самооценки цифровой компетентности и способностью критически оценивать достоверность генерируемой информации. Обоснована необходимость формирования системного подхода к развитию алгоритмической грамотности, включая обучение валидации выходных данных и соблюдению этико-правовых норм. Предложена трехуровневая модель внедрения LLM в образовательный континуум, учитывающая дифференциацию обучающихся по степени вовлеченности в работу с ИИ-инструментами [i].
Введение
Стремительное распространение генеративных языковых моделей (ChatGPT, Claude, Perplexity и др.) в академической и клинической среде ставит перед системой медицинского образования новые вызовы. Студенты-медики и практикующие врачи уже активно применяют эти инструменты для поиска информации, составления дифференциальных диагнозов и систематизации литературных данных, однако подобная активность зачастую носит стихийный характер, не подкрепляясь формальным обучением. Существующие рамочные концепции цифрового здоровья (включая DECODE и перечень из 27 ИИ-компетенций) лишь контурно обозначают необходимые навыки, но не предлагают конкретных механизмов внедрения.
Цель настоящего аналитического обзора — на основе анализа реальной практики использования LLM студентами-медиками, представленной в публикации, определить приоритетные направления для разработки учебных программ и организационных решений, обеспечивающих безопасную и эффективную интеграцию ИИ в медицину.
Материалы и методы
В основе работы лежит анализ данных, полученных в ходе анонимного анкетирования студентов двух крупных академических центров США (Университет Пенсильвании и Мичиганский университет). Опросник включал 30 вопросов, охватывающих частоту и контексты использования LLM, воспринимаемую полезность, выявляемые ограничения и ожидания от будущего внедрения. Статистическая обработка проведена с использованием непараметрических критериев (Краскела–Уоллиса с пост-хок тестом Данна), кластеризации k-средних для выделения групп с разной интенсивностью использования и порядковой логистической регрессии. Для оценки внутренней согласованности шкалы знаний применялся коэффициент альфа Кронбаха (α=0.94).
Результаты и их обсуждение
1. Структура текущего использования LLM
Выявлено три кластера респондентов: низкоактивные (эпизодическое или нулевое использование), умеренно активные и высокоактивные пользователи. Последние демонстрируют статистически значимо более высокую самооценку знаний о возможностях и ограничениях LLM (3.46 против 2.40 по 5-балльной шкале, p<0.001), а также большую уверенность в различении HIPAA-совместимых и несовместимых сервисов (p=0.016). Примечательно, что именно высокоактивные пользователи чаще отмечают проблему галлюцинаций — генерации фактически неверной информации (p=0.024), что свидетельствует о формировании критического восприятия по мере накопления опыта.
Наиболее востребованные сценарии: экспресс-поиск фактологических данных (71.8% респондентов), автоматическое резюмирование литературы (56.3%) и помощь в построении дифференциального диагноза (52.4%). Наименьшую полезность участники приписывают генерации флэш-карточек и клинических виньеток. Интересно, что 86.4% опрошенных высказались за обязательное формальное обучение работе с LLM, причем приоритетными темами названы:
- критическая оценка рекомендаций, сгенерированных ИИ;
- этические и юридические аспекты (конфиденциальность, безопасность данных);
- интеграция выводов LLM в клиническое суждение.
2. Дифференциация по уровню цифровой грамотности как педагогическая проблема
Установлено, что принадлежность к определенному учебному заведению не влияет на вероятность использования LLM по инициативе преподавателей (p=0.714), тогда как индивидуальная интенсивность использования является значимым предиктором (p=0.007). Это указывает на то, что цифровой разрыв между студентами одной когорты может усиливаться без целенаправленного педагогического вмешательства. Студенты с низкой грамотностью не только реже применяют LLM, но и демонстрируют завышенное доверие к их выводам, что создает риски при переходе к реальной клинической работе.
3. Прогнозируемые области применения в клинике
Респонденты выделили три макро-категории, где LLM, по их мнению, будут наиболее полезны:
- – Административно-документационная (составление заметок, обработка счетов, 84.5% и 78.6% соответственно),
- – Поддержка принятия решений (анализ литературы, генерация дифференциального диагноза — 70.9% и 53.4%),
- – Коммуникация с пациентами (создание учебных материалов, ответы на сообщения — 63.1% и 41.7%).
При этом высказаны опасения относительно чрезмерной автоматизации, ведущей к атрофии базовых клинических навыков (85.4% опрошенных). Особую группу риска составляют студенты с умеренной частотой использования, которые, как правило, менее критичны к точности ответов LLM по сравнению с высокоактивными пользователями.
Практические рекомендации по построению учебного курса
На основе полученных данных и сопоставления с существующими программами (MIT Media Lab, Гарвардский центр преподавания и обучения) предлагается трехуровневая модель:
- Базовый уровень (все студенты)
- Оценка исходной ИИ-грамотности через кейс-задания: разработка промптов, верификация источников, выявление предвзятостей.
- Формирование понятийного аппарата: принципы работы LLM, типы ошибок, различие между статистической корреляцией и причинно-следственной связью.
- Продвинутый уровень (для высокоактивных пользователей и по выбору)
- Техники критического анализа генерируемого контента (cross-checking с первичными базами данных).
- Юридические аспекты: ответственность за решения, принятые с помощью ИИ, документирование использования.
- Интегративный уровень (клинические ротации)
- Симуляции с использованием утвержденных HIPAA-совместимых LLM.
- Анализ кейсов, где неверный вывод модели мог бы привести к вреду для пациента.
Важно создать и публично поддерживать утвержденный перечень LLM-инструментов, допустимых в учебной и клинической практике, с четкой маркировкой их ограничений.
Ограничения исследования
Необходимо признать, что работа основана на данных самоотчетов студентов всего двух вузов с невысоким процентом отклика (5–7%), что может вносить систематическую ошибку отбора. Также не рассматривались долгосрочные эффекты использования LLM на академическую успеваемость и клинические исходы. Воспроизведение исследования на расширенной выборке с прямым мониторингом цифрового следа является ближайшей задачей.
Заключение
Большие языковые модели уже стали неотъемлемым элементом информационной среды будущих врачей, однако отсутствие системной подготовки ведет к неравенству в компетенциях и потенциально опасному перекосу доверия. Внедрение структурированного курса по ИИ-грамотности, включающего оценку точности, этико-правовые аспекты и практикум на симуляторах, способно не только повысить эффективность обучения, но и обеспечить безопасность будущей клинической работы. Предложенная трехкомпонентная модель может служить отправной точкой для формирования национальных и международных стандартов в этой области.
[i] . Herpin, Lancelot & Vadlamudi, Pratik & Mahawa, Rukam & Troftgruben, Mark & Hua, Joanna & Dine, C. & Hashikawa, Andrew. (2026). A Student-Centered Approach Towards Implementing Large Language Models (LLMs) in Medical Education. Medical Science Educator. 10.1007/s40670-026-02675-x


