Автоматизация выявления вреда, связанного с наркотиками, в социальных сетях: Механизм машинного обучения
Отличительной чертой нерегулируемого рынка наркотиков является его непредсказуемость и постоянное развитие за счет появления новых веществ. Люди, употребляющие наркотики, и работники здравоохранения зачастую не знают о появлении на нерегулируемом рынке новых наркотиков, их типе, безопасной дозировке и возможных побочных эффектах. Это повышает риски для потребителей наркотиков, включая риск употребления неизвестного вещества и непреднамеренного отравления наркотиками. Системы раннего предупреждения (EWS) могут помочь отслеживать ситуацию с появлением новых наркотиков в конкретном сообществе путем сбора и отслеживания актуальной информации и определения тенденций. Однако в настоящее время в Канаде существует мало способов систематического мониторинга появления и отслеживания вреда, наносимого новыми наркотиками, на нерегулируемом рынке.
Цель: Цель данной работы — изучить, как искусственный интеллект может помочь в выявлении закономерностей рисков и вреда, связанных с наркотиками, путем мониторинга активности групп общественного здравоохранения и правоохранительных органов в социальных сетях. Эта информация полезна в виде EWS, поскольку может быть использована для выявления новых и возникающих наркотических тенденций в различных сообществах.
Методы: Для сбора данных для настоящего исследования были вручную определены 145 соответствующих учетных записей в Twitter в Квебеке (n=33), Онтарио (n=78) и Британской Колумбии (n=34). Твиты, опубликованные в период с 23 августа по 21 декабря 2021 г., были собраны с помощью интерфейса прикладного программирования, разработанного компанией Twitter, и составили в общей сложности 40 393 твита. Далее профильные эксперты (1) разработали фильтры по ключевым словам, которые позволили сократить набор данных до 3746 твитов, и (2) вручную определили релевантные твиты для мониторинга и раннего предупреждения — всего 464 твита. На основе этой информации к твитам, полученным на этапе 1, был применен классификатор с нулевым результатом, содержащий набор меток «сохранить» (арест за наркотики, обнаружение наркотиков, сообщение о наркотиках) и «не сохранить» (поддержка наркозависимых, сообщение об общественной безопасности и другие), чтобы проверить, насколько точно он сможет извлечь твиты, определенные на этапе 2.
Результаты: Если рассматривать точность определения релевантных сообщений, то система извлекла в общей сложности 584 твита и совпала с экспертами в 392 случаях из 477 (специфичность ~84,5%). И наоборот, система выявила 3162 нерелевантных твита, а их совпадение с экспертами составило 3090 (чувствительность ~94,1%).
Выводы: Данное исследование демонстрирует преимущества использования искусственного интеллекта для помощи в поиске релевантных твитов для EWS. Результаты показали, что ИИ может достаточно точно отфильтровывать нерелевантную информацию, что значительно сокращает объем ручной работы. Хотя точность удержания релевантной информации оказалась ниже, анализ показал, что классификация меток может существенно влиять на результаты, поэтому в будущем их можно будет доработать. Тем не менее, результаты работы являются многообещающими и демонстрируют целесообразность применения искусственного интеллекта в данной области.
Полностью прочитать эту статью можно по ЭТОЙ ССЫЛКЕ.