
В ходе исследования была выполнена оценка эффективности основных LLM — GPT-4, GPT-4o, Google Gemini и DeepSeek — в прогнозировании результатов лечения при обучении без ознакомления. Это означает, что модели не проходили предварительное обучение работе с данными о раке печени.
Точность прогнозирования при использовании модели Gemini-GPT соответствовала уровню врачей с опытом работы не менее 15 лет. Данная модель неизменно давала стабильные результаты при различных методах лечения и стадиях заболевания. Она характеризовалась особой надежностью при выявлении пациентов, у которых лечение с определенной долей вероятности окажется эффективным. При выявлении данной категории пациентов модель давала более высокую согласованность результатов, чем врачи.
Внедрение простых логических стратегий позволило еще больше увеличить практическую применимость модели в клинических условиях.