Чи можна довіряти ШІ у лікуванні інсульту

Зараз все більше людей з медичними питаннями звертаються до штучного інтелекту. Міжнародне дослідження, проведене Національним тайванським університетом та Гарвардською школою громадського здоров’я Т.Х. Чана, показало, що сучасні моделі ШІ, такі як ChatGPT-4o, Claude 3 Sonnet і Gemini Ultra 1.0, не здатні надавати клінічно надійні рекомендації щодо лікування інсульту. Результати, опубліковані в журналі Digital Medicine NPJ.

Вчені перевіряли, які поради дає ШІ з профілактики, діагностики, лікування гострого мозкового порушення, що призводить до ішемії тканин мозку або крововиливу в них. А також — відновлення після інсульту. Для цього задавали прості питання, які люди зазвичай ставлять лікарям. Програми тестували трьома способами: просто запитували, просили подумати перед відповіддю або пояснити свої думки. У оцінюванні приймали участь чотири досвідчених лікарів, які враховували декілька критеріїв: точність, правдивість, чіткість, доброзичливість та корисність відповіді. Кожна відповідь ШІ, як і відповідь лікаря на кваліфікаційному іспиті в Тайвані, отримувала від 0 до 100 балів. Прохідний бар’єр складав 60 балів.

Але більшість відповідей набирали від 48 до 56 балів. Найкраще ШІ справлявся з порадами по профілактиці та відновленню після інсульту. Якщо його просили пояснити свої ствердження, іноді оцінка відповіді по цим темам доходила до 60. Але в складних ситуаціях, які стосувалися лікування під час інсульту, ШІ часто помилявся.

«Ці програми можуть бути корисними, але ще не готові самостійно допомагати, особливо коли справа доходить до серйозних проблем, як інсульт», — сказав Джон Таю Лі з Тайванського університету.

Винсент Чен-Шен Лі, співавтор дослідження, додав, що чіткі запитання підвищують правильність надаваємої інформації, але поки що рекомендації самого ШІ не можна вважати безпечними. Діагностика, лікування інсульту та реабілітація після нього має проходити тільки під контролем лікарів.

Автор: Ольга Михайлова

Зараз обговорюють

Читайте також