Нейросеть и рентген грудной клетки
23.04.2023
Решение использует современные модели машинного зрения и компьютерной лингвистики, в том числе GPT-3 small, которая предшествовала столь популярным сейчас GPT-3.5 и GPT-4, доступные через чатбота ChatGPT. «Обычные модели просто классифицируют, а наша нейросеть благодаря использованию современных моделей машинного зрения и моделей компьютерной лингвистики учится автоматически описывать рентгеновские снимки», — поясняет один из авторов исследования, научный сотрудник Сколтеха Олег Рогов.
Нейросеть обучена на парах «изображение — текст». «Мы специально составили свой радиологический словарь, чтобы повысить точность с точки зрения именно радиологических терминов, правил их использования в тексте. И, конечно, мы сформировали большую сводную базу рентгеновских снимков для использования в качестве обучающих данных», — рассказывает Рогов, подчеркивая, что нейросеть «знает» лишь те диагнозы, указания на которые действительно можно найти именно на рентгенограмме легких. Обучающую выборку сбалансировали по разным болезням.
Возможные варианты развития системы — применить ее к МРТ- и КТ-снимкам, а также внедрить активное обучение, то есть позволить модели совершенствоваться с учетом вносимых врачом в текст корректировок. Также можно совместить предложенное решение с другой нейросетью, подсвечивающей на рентгене подозрительные области, о которых идет речь в сгенерированном тексте.
Нейросеть и рентген грудной клетки
Ученые из Сколтеха обучили нейросеть обнаруживать и описывать словами патологии на рентгеновских снимках легких.
Сейчас эту задачу выполняет врач, который рассматривает снимок и описывает его в небольшом тексте.
По словам создателей решения, оно сокращает время работы с одним снимком с нескольких минут до примерно 30 секунд, если не требуется значительная корректировка текста. В большинстве случаев специалисту остается лишь подтвердить предложенный машиной диагноз (например, фиброз, увеличенное сердце или подозрение на злокачественную опухоль) или то, что признаков патологий не обнаружено. Об исследовании рассказала пресс-служба Сколтеха.
Решение использует современные модели машинного зрения и компьютерной лингвистики, в том числе GPT-3 small, которая предшествовала столь популярным сейчас GPT-3.5 и GPT-4, доступные через чатбота ChatGPT. «Обычные модели просто классифицируют, а наша нейросеть благодаря использованию современных моделей машинного зрения и моделей компьютерной лингвистики учится автоматически описывать рентгеновские снимки», — поясняет один из авторов исследования, научный сотрудник Сколтеха Олег Рогов.
Нейросеть обучена на парах «изображение — текст». «Мы специально составили свой радиологический словарь, чтобы повысить точность с точки зрения именно радиологических терминов, правил их использования в тексте. И, конечно, мы сформировали большую сводную базу рентгеновских снимков для использования в качестве обучающих данных», — рассказывает Рогов, подчеркивая, что нейросеть «знает» лишь те диагнозы, указания на которые действительно можно найти именно на рентгенограмме легких. Обучающую выборку сбалансировали по разным болезням.
Возможные варианты развития системы — применить ее к МРТ- и КТ-снимкам, а также внедрить активное обучение, то есть позволить модели совершенствоваться с учетом вносимых врачом в текст корректировок. Также можно совместить предложенное решение с другой нейросетью, подсвечивающей на рентгене подозрительные области, о которых идет речь в сгенерированном тексте.