Blog

Анализ звука легких на основе глубокого обучения для интеллектуального стетоскопа |Военно-медицинские исследования |Полный текст

Аускультация имеет решающее значение для диагностики заболеваний органов дыхания.Однако традиционные стетоскопы имеют присущие ограничения, такие как вариативность и субъективность среди слушателей, и они не могут записывать звуки дыхания для автономной / ретроспективной диагностики или удаленных назначений в телемедицине.Появление цифровых стетоскопов преодолело эти ограничения, позволив врачам хранить и передавать звуки дыхания для консультаций и обучения.На этой основе машинное обучение, особенно глубокое обучение, позволяет полностью автоматически анализировать звуки легких, что может проложить путь к интеллектуальным стетоскопам.Таким образом, цель этого обзора — предоставить всесторонний обзор алгоритмов глубокого обучения, используемых для анализа звуков легких, чтобы подчеркнуть важность искусственного интеллекта (ИИ) в этой области.Мы фокусируемся на каждом компоненте систем анализа звука легких на основе глубокого обучения, включая категории задач, общедоступные наборы данных, методы шумоподавления и, что наиболее важно, существующие методы глубокого обучения, то есть современные подходы к преобразованию легких звуки в двумерные (2D) спектрограммы и использовать сверточные нейронные сети для сквозного распознавания респираторных заболеваний или аномальных звуков легких.Кроме того, в этом обзоре освещаются текущие проблемы в этой области, включая разнообразие устройств, чувствительность к шуму и плохую интерпретируемость глубоких моделей.Чтобы решить проблему плохой воспроизводимости и разнообразия глубокого обучения в этой области, в этом обзоре также представлена ​​масштабируемая и гибкая среда с открытым исходным кодом, целью которой является стандартизация алгоритмического рабочего процесса и обеспечение прочной основы для репликации и будущего расширения: https://github. com/contactless-healthcare/Глубокое обучение для анализа звука легких.

Совсем недавно были предложены модели, основанные на глубоком обучении, для обнаружения закономерностей, связанных с заболеваниями легких, и различения аномальных звуков в легких от нормальных, и они показали многообещающую эффективность [22].По сравнению с поверхностным машинным обучением, большинство методов, основанных на глубоком обучении, используют подход сквозного обучения, позволяющий автоматически изучать представление звуков легких на основе необработанных акустических сигналов без необходимости ручного проектирования функций.Они также могут использовать трансферное обучение для повышения адаптивности изученных моделей в новых средах, что снижает объем данных, необходимых для обучения [23, 24].Это важно для клинического применения из-за сложности сбора большого количества данных о пациентах.Фам и др.[25] применили сверточные нейронные сети (CNN) для изучения частотно-временной информации из спектрограмм и достигли специфичности 89% и чувствительности 82% при классификации нормальных и аномальных звуков легких.Перна и др.[26] использовали рекуррентные нейронные сети (RNN) для анализа контекстной информации о звуках легких с течением времени, получив точность 99% при распознавании пациентов с ХОБЛ.Кроме того, Алтан и др.[27] предложили модель, основанную на сети глубоких убеждений, в сочетании с трехмерным (3D) графиком различий второго порядка звуковых сигналов легких, чтобы различать тяжесть пациентов с ХОБЛ.Эти методы демонстрируют возможность внедрения интеллектуальных стетоскопов на основе глубокого обучения, которые могут автоматизировать выявление легочных заболеваний и их тяжести.Более того, количественные результаты, основанные на глубоком обучении, преодолевают недостатки субъективной аускультационной диагностики, вызванные различиями между слушателями и необходимостью клинической квалификации, тем самым поддерживая медицинскую диагностику и лечение.Таким образом, подходы, основанные на глубоком обучении, могут значительно улучшить качество здравоохранения в слаборазвитых странах с ограниченными клиническими ресурсами;примеры их применения включают выявление внебольничной пневмонии и лечение ХОБЛ на дому. Разрушитель взрывных устройств

Анализ звука легких на основе глубокого обучения для интеллектуального стетоскопа |Военно-медицинские исследования |Полный текст

Здесь мы сосредоточимся на цифровых стетоскопах, которые использовались в качестве клинических устройств, включая 3 M LITTMAN 3200, цифровой стетоскоп Thinklabs и цифровой стетоскоп Clinicloud, как показано на рис. 3c–e.

Чтобы решить эти проблемы, будущие исследования должны быть сосредоточены на внедрении недорогих и высоконадежных цифровых стетоскопов.В частности, разработка каждого компонента устройства может способствовать достижению этой цели.Например, дорогую коммерческую диафрагму можно заменить материалами, напечатанными на 3D-принтере [73].Для передачи сигнала звуковой сигнал легких может передаваться с помощью зрелых технологий, таких как Bluetooth Low Energy [74] и Zigbee [75], что позволяет стетоскопам стать частью Интернета медицинских вещей для обеспечения более полной оценки здоровья легких [76]. .Кроме того, развитие носимых устройств также способствует всепогодному мониторингу здоровья легких.Между тем, надежность и интеллектуальные возможности цифровых стетоскопов необходимо повысить за счет внедрения новых технологий, касающихся батареи, процессора и встроенных алгоритмов, позволяющих справляться с медицинскими ситуациями в регионах с низким уровнем ресурсов.

Основанная на глубоком обучении структура для анализа звука легких.Для двух разных медицинских задач (ASD и RDR) обучающий набор используется для построения модели, включая этапы предварительной обработки, извлечения признаков и выбора модели.Наконец, набор тестов используется для оценки производительности модели.Полносвязная нейронная сеть FNN, сверточная нейронная сеть CNN, рекуррентная нейронная сеть RNN, хроническая обструктивная болезнь легких ХОБЛ

В последнее время появилось много новых наборов данных для анализа звука легких.Фрайван и др.[85] собрали 112 звукозаписей легких от 112 субъектов, которые были здоровы или у которых была диагностирована астма, пневмония, ХОБЛ, бронхит, сердечная недостаточность, фиброз легких и плевральный выпот.Каждая запись была аннотирована в соответствии с различными звуковыми событиями в легких, включая нормальный, вдох, выдох, крепитацию, хрипы и хрипы.Сюй и др.[86] предложили новый набор данных под названием HF_Lung_V1, который состоит из 9765 записей звука легких длительностью 15 с от 261 субъекта.Эти записи были собраны с использованием одноканального устройства (3 М ЛИТТМАН 3200) и многоканального устройства (индивидуально настраиваемое устройство HF-Type-1).HF_Lung_V1 отмечено 34 095 сегментов вдоха, 18 349 сегментов выдоха, 13 883 непрерывных дополнительных звуковых сегмента и 15 606 прерывистых дополнительных звуковых сегментов.Более того, Сюй и др.[87] собрали звуки легких у 42 новых субъектов, чтобы расширить HF_Lung_V1 в новый набор данных, а именно HF_Lung_V2.Более подробная информация об этих общедоступных наборах данных представлена ​​в Таблице 2.

Кроме того, необходимость лечения хронических заболеваний легких, таких как ХОБЛ, также постепенно привлекла внимание клиницистов и исследователей [89], где оценка тяжести заболевания является предпосылкой для определения медицинского вмешательства [90].Алтан и др.[88] выпустили набор данных под названием RespiratoryDatabase@TR, в котором собраны звуки легких пациентов с диагнозом астма, бронхит и ХОБЛ различной степени тяжести (0–5).В ходе исследования каждый субъект прошел рентгенологическое исследование грудной клетки, PFT и сердечно-легочную аускультацию.Полученный набор данных состоит из 77 записей от 77 субъектов, каждая запись сделана с частотой 4000 Гц и содержит 4 канала тонов сердца и 12 каналов тонов легких.Для аннотации два пульмонолога проверили и пометили звуковые записи как шум, потрескивание или хрипы со ссылкой на золотые стандарты рентгенографии грудной клетки и PFT.RespiratoryDatabase@TR широко используется для оценки тяжести ХОБЛ [27, 91, 92].

Методы снижения внешнего шума обычно основаны на трех различных технологиях.(1) На основе фильтров: эта технология позволяет быстро обрабатывать большие объемы данных, но трудно удалить шум, поскольку частотная информация перекрывается со звуками легких [94,95,96];(2) На основе вейвлета: он может разлагать смешанный сигнал на основе его частотно-временной информации для получения сигнала с шумоподавлением;однако на его эффект шумоподавления легко влияет выбор базисной вейвлет-функции и пороговой функции [97,98,99];(3) На основе эмпирической модовой декомпозиции (EMD): это устраняет различные типы шума в аудиосигнале, но требует высокой вычислительной сложности и разумного выбора параметров [100, 101].Например, Мэн и др.[102] разложили зашумленный сигнал на семь субсигналов, используя вейвлет-разложение, и определили положение легочного звука в каждом субсигнале, используя коэффициенты автокорреляции, чтобы извлечь эффективные компоненты легочного звука.Хайдер и др.[103] использовали EMD для разложения зашумленного сигнала и интегрированный анализ Херста для выбора функции внутреннего режима (IMF) для уменьшения шума при записи звука легких.Основываясь на предшествующих знаниях о звуковых сигналах легких, Emmanouilidou et al.[11] обработали шумный сигнал в коротких временных окнах и использовали информацию о соотношении сигнал-шум текущего кадра для динамического извлечения интересующих компонентов звука легких.

Для разделения звука легких и звука сердца были предложены различные методы, основанные на слепом разделении источников (BSS), такие как методы на основе фильтров, анализ независимых компонентов (ICA), методы на основе вейвлетов и факторизация неотрицательной матрицы (NMF). ) [104,105,106,107,108,109].Гроби и др.[110] представили метод на основе NMF, который разделяет необработанный звук на тон сердца и звук легких.Хотя эти методы показали свою эффективность, результаты разделения на основе ICA различаются из-за выбора количества итераций и критериев сходимости, что приводит к неопределенностям в фазе, амплитуде или порядке ранжирования разделенных сигналов.В методе, основанном на NMF, спектрограмма смешанных сигналов разлагается на две неотрицательные матрицы, минимизируя разницу между произведением двух неотрицательных матриц и исходной матрицей.Поскольку процесс минимизации включает невыпуклую оптимизацию, разложенный сигнал легко ограничивается локальным оптимальным решением, что приводит к плохому снижению шума.Кроме того, периодичность тонов сердца применялась для дифференциации тонов сердца от тонов легких [111, 112].Например, Гадери и др.[113] применили сингулярный спектральный анализ для обнаружения и разделения различных тенденций тонов сердца и легких.

Процедура проектирования моделей глубокого обучения.FNN делает прогнозы на основе одномерных статистических характеристик, извлеченных из нескольких окон, а RNN прогнозирует состояние здоровья на основе двумерных функций каждого окна.CNN изучает глубокие особенности входных двумерных спектрограмм, чтобы прогнозировать состояние здоровья.1D одномерный, 2D двумерный

Традиционные функции, созданные вручную, имеют количественные характеристики аудиосигналов, которые можно использовать для различения различных звуков, которые можно подразделить следующим образом: (1) функции во временной области, которые собирают информацию, связанную с изменениями звука легких во времени, например, пересечение нуля. скорость, среднеквадратичное значение и огибающая сигнала;(2) характеристики частотной области, которые предоставляют информацию о распределении энергии по различным частотным диапазонам, например, спектральный центроид, спектральный спад и спектральный поток.Мел-частотные кепстральные коэффициенты (MFCC) являются широко используемой функцией при анализе легочного звука, полученной на основе преобразования Фурье, которая может фиксировать распределение энергии в различных диапазонах частот [115, 116];и (3) характеристики частотно-временной области, которые фиксируют распределение энергии по различным частотным диапазонам во времени, обеспечивая ценную информацию о нестационарной и переходной природе звуков легких, таких как вейвлет-преобразование и спектрограмма [117,118,119].Исследователи обычно используют комбинацию многодоменных функций, созданных вручную, в качестве представления для анализа звука легких [120].Среди них статистический признак представляет собой широко используемое комбинированное представление, полученное из короткого временного скользящего окна, которое делит сигнал на несколько сегментов для извлечения многодоменных признаков.В качестве представления рассчитываются статистические значения каждого признака в нескольких сегментах, такие как среднее значение, дисперсия, асимметрия и эксцесс.Извлечение признаков на основе глубокого обучения — это подход, основанный на данных, при котором функции изучаются непосредственно из необработанных данных без необходимости проектирования функций вручную [121,122,123].CNN с входными данными спектрограммы обычно используется для захвата сложных и иерархических шаблонов в данных и может изучать более различительные и надежные представления.Фам и др.[124] исследовали влияние различных типов спектрограмм и спектрально-временного разрешения на обнаружение заболеваний легких на основе глубокого обучения.Длинная краткосрочная память (LSTM) — еще один важный метод извлечения признаков на основе необработанных данных или признаков частотной области.Фрайван и др.[125] использовали CNN для извлечения частотно-временной информации из нескольких окон из необработанного сигнала, затем использовали LSTM для анализа непрерывной информации об изменении частоты и времени для распознавания легочных заболеваний.

Таким образом, традиционные функции, созданные вручную, разрабатываются вручную на основе человеческого понимания аудиосигналов, которые подчеркивают различные характеристики звуков легких в разных целевых областях.Эти созданные вручную функции обычно легко интерпретируются и эффективны в вычислительном отношении.Первоначально созданные вручную 1D-функции в сочетании с полностью подключенными нейронными сетями (FNN) часто использовались для анализа звука легких путем проецирования векторов признаков в указанное пространство задач [117].Однако созданные вручную функции более чувствительны к шуму и страдают от снижения качества при возникновении неожиданных событий (например, разговора, шагов и кашля) [93].В отличие от функций, созданных вручную, извлечение функций на основе глубокого обучения не полностью зависит от человеческого понимания акустики или аудиоконтента, а автоматически изучает важные для задачи функции из большого количества данных о звуках легких.Здесь CNN в сочетании с вводом представления двумерной спектрограммы является наиболее часто используемым методом, при котором спектрограмма записывает необработанную информацию о сигнале в частотно-временной области, а сверточное ядро ​​используется для интеграции функций частотной и временной области для генерации высоких значений. -уровневые семантические представления.Функции, изучаемые моделью глубокого обучения, имеют явное преимущество: высокую сложность и размерность;однако им не хватает интерпретируемости, поскольку процедура оптимизации сети (например, обратное распространение ошибки) непрозрачна.Кроме того, этот подход требует больше вычислительных ресурсов.

Построение конкретной модели глубокого обучения основано на структуре входных данных, как показано на рис. 6. FNN можно использовать для извлечения информации из одномерного представления, например одномерных статистических характеристик данных звука легких.Для RNN звуки легких будут разделены на непрерывные временные окна, а акустические характеристики будут извлечены из каждого окна для формирования двухмерного представления звука легких.Затем RNN использует скрытый слой для изучения временных изменений звуков легких для классификации заболеваний.CNN больше подходят для представления 2D-данных, таких как изображения (например, 2D-спектрограммы звука легких).Следовательно, построение глубокого обучения может осуществляться на основе выбора конкретной модели глубокого обучения в соответствии с ее входной структурой.Базовые модели можно найти в [33, 126, 127].Предпочтительно, чтобы модель подвергалась некоторой адаптации или настройке своей структуры на основе задачи классификации и стратегии оптимизации [24, 128, 129].Например, метод на основе FNN преобразует легочный звук в комбинационное представление акустических характеристик, а затем передает его в FNN для идентификации аномального звука [18].Чарльстон-Виллалобос и др.[118] извлекли спектральную плотность мощности как представление звука легких, затем использовали FNN, чтобы различать здоровых субъектов и пациентов с интерстициальным заболеванием легких (ИЗЛ), достигнув средней точности 84% с помощью самостоятельно собранного набора данных.Метод на основе RNN анализирует временную динамику легочных звуков, что позволяет понять прогрессирование респираторных заболеваний с течением времени [127].Перна и др.[26] использовали временную информацию о звуках легких, используя RNN для распознавания аномальных звуков легких, достигнув специфичности 85% и чувствительности 62%.Метод, основанный на CNN, изучает частотно-временные характеристики из двумерной спектрограммы звуков легких, чтобы обнаружить аномальные закономерности и сделать вывод о состоянии здоровья [33, 121].На основе набора данных ICBHI 2017 Yu et al.[130] извлекли глобальные и локальные характеристики из мел-спектрограммы с помощью CNN для распознавания нормальных звуков в легких, хрипов, хрипов и того и другого, достигнув специфичности 84,9% и чувствительности 84,5%.

Распознавание аномальных звуков легких в нескольких классах.Это используется для различения конкретных аномальных звуков, включая хрипы, хрипы и хрипы, причем количество классов зависит от количества типов аномальных звуков.Сенгупта и др.[132] извлекли статистические характеристики на основе MFCC для звука легких, а затем использовали FNN, чтобы различать нормальные звуки, хрипы и потрескивания.Их эксперимент был проведен на 30 испытуемых и показал, что статистические функции, основанные на MFCC, превосходят функции, основанные на вейвлетах, при обнаружении аномальных звуков.Барду и др.[33] расширили типы аномальных звуков легких, включив в них нормальный, грубый хрип, мелкий хрип, монофонический хрип, полифонический хрип, визг и стридор, а затем использовали CNN на основе спектрограмм для идентификации этих типов.Гживальский и др.[133] провели клиническое испытание, чтобы сравнить точность обнаружения аномального звука в легких между алгоритмом искусственного интеллекта (ИИ) и врачами, в ходе которого CNN была обучена обнаруживать четыре типа звука в легких: хрипы, хрипы, а также мелкие и грубые хрипы.Это исследование показало, что обнаружение аномальных звуков в легких на основе CNN является более точным, чем у врачей, в отношении показателей чувствительности и показателя F1.С выпуском набора данных ICBHI 2017 количество исследований РАС по обнаружению нормального звука, хрипов, хрипов, а также хрипов и хрипов резко возросло [23, 130, 134, 135].Роча и др.[136] отдельно обучили классификатор для обнаружения потрескивания, обнаружения хрипа и обнаружения смеси (треск, хрип и другие) и использовали четыре различных метода машинного обучения для оценки его эффективности (например, усиленные деревья, SVM и CNN).Гайрола и др.[72] предложили дополнение на основе конкатенации для решения проблемы несбалансированного класса и использовали блок ResNet для обнаружения аномального звука легких.Для ограниченной обучающей выборки Song et al.[22] предложили метод обнаружения аномальных звуков в легких, который способствует внутриклассовой компактности и межклассовому разделению путем сравнения образцов из разных классов на этапе обучения.Чтобы изучить временную и частотную информацию о звуке легких, Petmezas et al.[137] объединили CNN и RNN для обнаружения аномальных звуков легких, где первый извлекает глубокие временно-частотные характеристики из спектрограмм, а второй использует глубокие функции для анализа изменения звука легких с течением времени.

Распознавание 3-х классов хронических респираторных заболеваний.Это делит популяции на три группы: здоровые люди, хронические пациенты (например, пациенты с ХОБЛ, бронхоэктазами и астмой) и нехронические пациенты (например, люди с инфекцией верхних и нижних дыхательных путей, пневмонией и бронхиолитом).Гарсиа-Ордас и др.[139] преобразовали звуки легких в представления Mel-спектрограмм, чтобы обучить CNN распознавать респираторные патологии, одновременно используя вариационные автоэнкодеры для генерации новых образцов для классов меньшинств для решения проблем несбалансированных данных.Шуво и др.[140] разложили предварительно обработанный сигнал с помощью EMD для получения сигнала IMF, который имел высокую корреляцию с сигналом звука легких, затем применили непрерывное вейвлет-преобразование для извлечения дискриминационного представления для обучения облегченной модели CNN.Предложенный ими метод был оценен на ICBHI 2017 и превзошел другие легкие модели.Ши и др.[141] исследовали частотно-временную информацию различных масштабов с помощью модуля двойного вейвлет-анализа и использовали модуль внимания для извлечения существенной информации о различиях для распознавания хронических респираторных заболеваний.

Распознавание тяжести респираторных заболеваний при нескольких курсах.Целью данной задачи является выделение степени тяжести заболеваний органов дыхания, число классов которых в целом зависит от медицинского определения течения заболевания.Морилло и др.[158] использовали анализ главных компонентов и FNN для определения того, усугубляется ли пневмония у пациентов с ХОБЛ, с чувствительностью и специфичностью 72,0% и 81,8% соответственно.На основе набора данных RespiratoryDatabase@TR Altan et al.[27] предложили метод использования трехмерного графика разницы второго порядка для анализа звуковых сигналов легких, а затем использования предварительно обученных сетей глубокого убеждения, чтобы отличить уровень риска от внутреннего уровня для пациентов с ХОБЛ.Этот подход продемонстрировал эффективность предварительно обученных архитектур глубокого обучения в RDR.Хуанг и др.[10] предложили гибридную модель, основанную на предварительно обученных сетях VGGish и BiLSTM, для определения тяжести внебольничной пневмонии среди детей, включая подтверждение пневмонии, спонтанное разрешение и выздоровление.Алтан и др.[143] применили методы квантования на основе кубоида и октанта для извлечения характерных отклонений из трехмерного графика разностей второго порядка, а затем использовали машинный классификатор с глубоким экстремальным обучением для разделения пяти степеней тяжести ХОБЛ.Ю и др.[144] исследовали способность нескольких методов (SVM, дерево решений и сеть глубоких убеждений) определять тяжесть ХОБЛ, при этом сеть глубоких убеждений достигла точности 93,67% при различении пациентов с легкой, умеренной и тяжелой ХОБЛ.

Совсем недавно в некоторых исследованиях были предложены методы глубокого обучения, которые можно использовать как для РДР, так и для РАС [25, 124, 145], как показано в Таблице 3. Perna et al.[26] извлекли MFCC многооконных сигналов из звуковых сигналов легких для создания представлений, а затем использовали модель на основе RNN.Ли и др.[128] предложили метод, основанный на дистилляции знаний, который переносит веса CNN, полученные из нескольких центров, в нечеткое дерево решений, которое обеспечивает интерпретируемую модель для обнаружения аномального звука в легких и хронического RDR.Нгуен и др.[24] представили различные методы адаптации предварительно обученной модели к новой среде, включая тонкую настройку, совместную настройку, стохастическую нормализацию и их комбинацию для ASD и RDR.В своих экспериментах авторы отметили, что разная производительность вызвана различиями в оборудовании, и для решения этой проблемы ввели коррекцию спектра [159].

В таблице 3 обобщены современные подходы к глубокому обучению для РАС и РДР.Он показывает, что большинство методов используют специфичность, чувствительность и смешанный индекс между ними для РАС, в то время как оценочные показатели (например, точность, прецизионность, отзыв и F1) добавляются на основе показателей оценки РАС для РДР.С точки зрения модели, CNN с вводом спектрограммы и Mel-спектрограммы в настоящее время является наиболее широко используемым методом для обеих задач, достигая специфичности более 80% и чувствительности 60% в наборе данных ICBHI 2017 для РАС и имея более 90% точность, отзыв, точность и F1 для RDR.Кроме того, в большинстве методов недавно использовалась структура, которая применяет CNN для извлечения глубоких функций из нескольких последовательных временных окон, а затем использует глубокие функции последовательных окон в качестве входных данных RNN для изучения контекстной информации для RDR.В Таблице 3 показано, что глубокое обучение добилось прогресса в решении медицинских задач, основанных на звуках легких, продемонстрировав способность идентифицировать различные аномальные звуки, легочные заболевания и тяжесть заболеваний.Однако клиническое применение анализа звука легких на основе глубокого обучения все еще сталкивается с некоторыми проблемами, о которых говорится ниже.

Другая проблема заключается в том, что анализу звука легких на основе глубокого обучения при некоторых условиях не хватает надежности.(1) Чувствительность к шуму: производительность большинства методов ухудшается из-за повышенного уровня шума [136], что означает, что надежность методов глубокого обучения будет скомпрометирована при диагностике заболеваний из-за искажений, что приведет к ошибочному диагнозу и пропущенному диагнозу;(2) Разница в устройствах: из-за различий между устройствами в отношении датчиков, тембра и качества звука производительность модели, обученной на одном устройстве, будет колебаться или падать при тестировании на других устройствах [23, 24];(3) Физиологическая диверсификация: Fernandes et al.[146] сообщили, что физиологические различия между пациентами, включая возраст, пол и индекс массы тела, вызывают отклонения в эффективности моделей РАС.Для решения этой проблемы можно использовать трансферное обучение, которое позволяет выявить инвариантные характеристики при различных факторах (например, шуме, устройствах и физиологических различиях) для анализа звука легких.Он может отображать данные с различиями в выровненные распределения данных для улучшения обобщаемости [164, 165].Более того, эффективными могут быть модели с несколькими входами, которые принимают эти различия в качестве входных данных и заставляют модель динамически корректировать свой вес на основе входных данных для улучшения обобщаемости.

Из-за плохой воспроизводимости, вызванной разнообразием методов глубокого обучения, была выпущена платформа с открытым исходным кодом, предназначенная для создания прочной основы для репликации и расширения, чтобы способствовать прогрессу в этой области.Эта структура предоставляет широко используемые методы (например, FNN с вводом акустических характеристик и CNN с вводом спектрограмм) и демонстрирует их на наборе данных ICBHI 2017 в качестве примера сравнительного анализа.Кроме того, платформа разбивает алгоритм на четыре основных модуля: предварительная обработка для сегментации и снижения шума, извлечение признаков для представления входных данных, метрики оценки для оценки производительности и разработка классификатора для обучения и тестирования.Таким образом, исследователи могут сосредоточиться на улучшении конкретных шагов, сохраняя при этом остальные идентичными, что может значительно повысить эффективность и согласованность эталонных показателей.Этот фреймворк был разработан на основе PyTorch, и каждый модуль содержит основную функцию, вызываемую для выполнения соответствующей задачи.

Модуль извлечения признаков преобразует 1D звуковой сигнал в представление, подходящее для входных данных модели.Для FNN и RNN методы анализа звука легких используют статистические характеристики, извлеченные из сегментации, в качестве представления для обучения и тестирования модели.Этот фреймворк выполняет извлечение с использованием pyAudioAnaанализа [174].Для CNN ввод на основе спектрограмм обычно используется для обучения и тестирования, где платформа использует библиотеку Librosa для извлечения различных спектрограмм, включая спектрограмму Mel.

Модуль проектирования классификатора основан на PyTorch и предназначен для автоматизации анализа звука легких, в который загружается обучающий и тестовый набор на основе различных стратегий разделения набора данных.Этот модуль состоит из проектирования модели, показателей оценки, функции обучения и тестирования, а также функции записи.Для проектирования модели реализуется обычно используемая базовая модель (например, FNN, CNN и RNN).В качестве показателей оценки применяются специфичность, чувствительность и показатель ICBHI (среднее значение специфичности и чувствительности) для оценки эффективности модели в соответствии с предыдущими исследованиями [84].Функция записи применяется для визуализации обучающей информации, включая потери, специфичность и чувствительность.

Статья CAS PubMed PubMed Central Google Scholar

У Ю, Ван Х, Ли Х, Сун Л, Ю С, Фан З и др.Общие вариации мтДНК C5178a и A249d/T6392C/G10310A снижают риск тяжелого течения COVID-19 у ханьцев из Центрального Китая.Мил Мед Рес.2021;8(1):1–10.

Статья PubMed PubMed Central Google Scholar

Миллс Г.А., Нкетия Т.А., Оппонг И.А., Кауфманн Э.Э.Беспроводной цифровой стетоскоп, использующий технологию Bluetooth.Стажер J Eng Sci Technol.2012;4(8):3961–9.

Статья PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Хиросава Т., Харада Ю., Икеноя К., Какимото С., Айзава Ю. и др.Полезность удаленной аускультации в реальном времени с использованием электронного стетоскопа, подключенного по Bluetooth: открытое рандомизированное контролируемое пилотное исследование.JMIR Mhealth Uздоровье.2021;9(7):e23109.

Статья PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Сен И, Сараклар М, Кахья Ю.П.Сравнение конфигураций классификаторов на основе SVM и GMM для диагностической классификации легочных звуков.IEEE Trans Biomed Eng.2015;62(7):1768–76.

Статья PubMed PubMed Central Google Scholar

Ачарья Дж., Басу А. Глубокая нейронная сеть для классификации дыхательных звуков в носимых устройствах с помощью настройки модели для конкретного пациента.IEEE Trans Biomed Circuits Syst.2020;14(3):535–44.

Статья PubMed PubMed Central Google Scholar

Хаком С., Маркес А. Компьютеризированные звуки дыхания у пациентов с ХОБЛ: систематический обзор.J Chronic Obstr Pulm Dis.2015;12(1):104–12.

Статья PubMed PubMed Central Google Scholar

Пастеркамп Х., Краман С.С., Водицка Г.Р.Дыхательные шумы: выступают за пределы стетоскопа.Am J Respir Crit Care Med.1997;156(3):974–87.

Статья PubMed PubMed Central Google Scholar

Статья CAS PubMed PubMed Central Google Scholar

Статья CAS PubMed PubMed Central Google Scholar

Статья CAS PubMed PubMed Central Google Scholar

Мерфи Р., Вышедский А. Акустические данные у пациента с радиационным пневмонитом.N Engl J Med.2010;363(20):e31.

Статья CAS PubMed PubMed Central Google Scholar

Статья CAS PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Скраффорд С., Баснет С., Ансари И., Шреста Л., Шреста С., Гимир Р. и др.Оценка цифровой аускультации для диагностики пневмонии у детей в возрасте от 2 до 35 месяцев в клинических условиях Катманду, Непал: проспективное исследование «случай-контроль».J Pediatr Infect Dis.2016;11(2):28–36.

Статья CAS PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Мемон С., Сутар К.К., Мемон К.А., Магси А.Х., Лагари А.А., Аббас М., Уль Айн Н. Разработка беспроводной портативной системы мониторинга электрокардиографа на основе ZigBee.Одобренная EAI Trans Scalable Inf Syst.2020;7(28):e6.

Статья CAS PubMed PubMed Central Google Scholar

Статья CAS PubMed PubMed Central Google Scholar

Сюй Ф.С., Хуан С.Р., Хуан К.В., Хуан С.Дж., Ченг Ю.Р., Чен К.С. и др.Сравнительный анализ восьми рекуррентных вариантов нейронной сети для определения фазы дыхания и обнаружения посторонних звуков в самостоятельно разработанной базе данных звуков легких с открытым доступом - HF_Lung_V1.ПЛОС Один.2021;16(7):e0254134.

Статья CAS PubMed PubMed Central Google Scholar

Сюй Ф.С., Хуан С.Р., Хуан К.В., Ченг Ю.Р., Чен С.С., Сяо Дж. и др.Обновление постепенно расширяемой базы данных для автоматического анализа звука легких.arXiv.2021. https://arxiv.org/abs/2102.04062.

Алтан Г., Кутлу Ю., Гарби Ю., Пекмецчи А.О., Нурал С. Мультимедийная база данных по респираторным заболеваниям (RespiratoryDatabase@TR): звуки аускультации и рентгенография грудной клетки.Nat Eng Sci.2017;2(3):59–72.

Всемирная организация здравоохранения.Мировая статистика здравоохранения 2017: мониторинг здоровья для достижения ЦУР и целей устойчивого развития.https://api.semanticscholar.org/CorpusID:203489275?utm_source=wikipedia.По состоянию на 8 мая 2018 г.

Руководство P, Copd T. Глобальная инициатива по хронической обструктивной болезни легких. Руководство для медицинских работников. Глобальная инициатива по хронической обструктивной болезни легких.Glob Initiative Chronic Obstr Lung Dis.2010;22(4):1–30.

Алтан Г., Кутлу Ю. Хессенберг Ядро автокодировщика Elm для глубокого обучения.J Eng Technol Appl Sci.2018;3(2):141–51.

Статья PubMed PubMed Central Google Scholar

Хан ТЭА, Виджаякумар П. Отделение звука сердца от звука легких с помощью labVIEW.Int J Comput Electr Eng.2010;2(3):524–33.

Статья PubMed PubMed Central Google Scholar

Чарльстон-Вильялобос С., Мартинес-Эрнандес Г., Гонсалес-Камарена Р., Чи-Лем Г., Каррильо Дж.Г., Альджама-Корралес Т. Оценка параметризации многоканальных звуков легких для двухклассовой классификации у пациентов с интерстициальными заболеваниями легких.Компьютерная Биол Мед.2011;41(7):473–82.

Фам Л., Фан Х., Паланиаппан Р., Мертинс А., Маклафлин И. Система, основанная на CNN-MoE, для классификации респираторных аномалий и выявления заболеваний легких.IEEE J Biomed Health Информ.2021;25(8):2938–47.

Фрайван М., Фрайван Л., Алходари М., Хассанин О. Распознавание легочных заболеваний по звукам легких с использованием сверточных нейронных сетей и долговременной кратковременной памяти.J Ambient Intell Humaniz Comput.2022;13(10):4759–71.

Ли Дж., Ван С., Чен Дж., Чжан Х., Дай Ю., Ван Л. и др.Объяснимая CNN с нечеткой древовидной регуляризацией для анализа дыхательных звуков.IEEE Trans Fuzzy Syst.2022;30(6):1516–28.

Статья PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Статья PubMed PubMed Central Google Scholar

Шуво С.Б., Али С.Н., Свапнил С.И., Хасан Т., Бхуян М.И.Х.Облегченная модель CNN для выявления респираторных заболеваний по звукам аускультации легких с использованием гибридной скалограммы на основе EMD-CWT.IEEE J Biomed Health Информ.2021;25(7):2595–603.

Ши Л., Чжан Й., Чжан Дж. Метод распознавания легких звуков, основанный на улучшении вейвлет-характеристик и частотно-временном синхронном моделировании.IEEE J Biomed Health Информ.2023;27(1):308–18.

Статья PubMed PubMed Central Google Scholar

Алтан Г., Кутлу Ю., Гекчен А. Анализ тяжести хронической обструктивной болезни легких с использованием глубокого обучения на многоканальных звуках легких.Turk J Elec Eng Co. 2020;28(5):2979–96.