Supraventrik�ler Ta�ikardi ile �lgili Sorulara Yapay Zeka Chatbotlar�n Yan�tlar�n�n De�erlendirilmesi

�etin, Tu�ba; Pay, Levent; Dereli, Seyda; Y�ceda�, Furkan Fatih; Hay�ro�lu, Mert

Supraventrik�ler Ta�ikardi ile �lgili Sorulara Yapay Zeka Chatbotlar�n Yan�tlar�n�n De�erlendirilmesi [Haydarpasa Numune Med J]

Haydarpasa Numune Med J. Bask�daki Makaleler: HNHJ-26429

Supraventrik�ler Ta�ikardi ile �lgili Sorulara Yapay Zeka Chatbotlar�n Yan�tlar�n�n De�erlendirilmesi

Tu�ba �etin¹, Levent Pay², Seyda Dereli³, Furkan Fatih Y�ceda�³, Mert Hay�ro�lu³
¹Tekirda� �orlu Devlet Hastanesi, Kardiyoloji Ana Bilim Dal�, Istanbul
²Istanbul Haseki E�itim Ve Ara�t�rma Hastanesi, Kardiyoloji Ana Bilim Dal�, Istanbul
³Dr. Siyami Ersek G��s Kalp Ve Damar Cerrahisi Hastanesi, Kardiyoloji Ana Bilim Dal�, Istanbul

G�R�� ve AMA�: Supraventrik�ler ta�ikardi (SVT), gen� yeti�kinler aras�nda en yayg�n g�r�len ritim bozuklu�udur. Yapay zeka teknolojilerinin h�zla ilerlemesiyle birlikte, ChatGPT, Gemini ve Bing Chat gibi do�al dil i�leme modelleri (NLPM) t�p alan�nda giderek daha yayg�n hale gelmektedir. Bu �al��mada, ChatGPT-4o, Gemini ve Bing Chat taraf�ndan SVT ile ilgili s�k�a sorulan sorulara verilen yan�tlar�n do�rulu�unu ve tutarl�l��n� de�erlendirmeyi ama�l�yoruz.
Y�NTEM ve GERE�LER: SVT ile ilgili elli yayg�n soru, bir hafta arayla iki kez ChatGPT-4o, Gemini ve Bing Chat'e soruldu. Her bir do�al dil i�leme modelinden (NLPM) al�nan yan�tlar, birbirlerinin de�erlendirmelerinden habersiz olan iki kardiyolog taraf�ndan de�erlendirildi. ��erik, a�a��daki �l�ek kullan�larak puanland�: tamamen do�ru [1], eksik [2] ve yanl�� [3].
BULGULAR: T�m modellerin verdi�i yan�tlar�n �o�u �tamamen do�ru�, �eksik� veya �yanl�� olarak de�erlendirildi. ChatGPT-4o hi�bir �yanl�� yan�t �retmezken, Bing Chat ve Gemini baz� yanl�� yan�tlar verdi. Yan�tlar�n do�rulu�u a��s�ndan ChatGPT-4o %92, Gemini %70 ve Bing Chat %58 do�ruluk oran�na ula�t�. ChatGPT-4o, %90 ile en y�ksek �tekrarlanabilirlik� skorunu elde ederken, onu %86 ile Gemini ve %72 ile Bing Chat takip etti.
TARTI�MA ve SONU�: �al��mam�z, ChatGPT-4o'nun SVT ile ilgili hasta sorular�na de�erli yan�tlar �retebildi�ini ortaya koymu�tur. �zellikle ChatGPT-4o olmak �zere do�al dil i�leme modelleri (NLPM) geli�meye devam ettik�e, SVT gibi kronik hastal�klar�n y�netiminde b�y�k bir potansiyele sahip olabilirler.

Anahtar Kelimeler: Bing Chat, ChatGPT, dijital sa�l�k, do�al dil i�leme sohbet botlar�, Gemini, supraventrik�ler ta�ikardi, yapay zeka

Assessment of Artificial Intelligence Chatbots in Responding to Supraventricular Tachycardia Related Questions

Tu�ba �etin¹, Levent Pay², Seyda Dereli³, Furkan Fatih Y�ceda�³, Mert Hay�ro�lu³
¹Department Of Cardiology, Tekirda� �orlu State Hospital, Turkey
²Department Of Cardiology, Istanbul Haseki Training And Research Hospital, Istanbul, Turkey
³Department Of Cardiology, Dr Siyami Ersek Thoracic And Cardiovascular Surgery Training Hospital, Istanbul, Turkey

INTRODUCTION: Supraventricular tachycardia (SVT) is the most prevalent among young adults. With the rapid advancement of artificial intelligence technologies, natural language processing models (NLPM) such as ChatGPT, Gemini and Bing Chat are becoming increasingly widespread in the field of medicine. We aim to assess the precision and consistency of responses produced by ChatGPT-4o, Gemini, and Bing Chat, to frequently asked questions regarding SVT.
METHODS: A list of fifty commonly asked questions regarding SVT were inquired twice, with a one-week interval, to ChatGPT 4o, Gemini, and Bing Chat. Two cardiologists assessed the responses from each NLPM, without knowledge of each other�s evaluations. The content was rated using the following scale: completely correct [1], incomplete [2] and incorrect [3].
RESULTS: Most of the responses from all models were rated as either �totally correct�, �incomplete�or �incorrect�. Even though ChatGPT-4o did not generate any �incorrect� answers, Bing Chat and Gemini produced some incorrect responses. Regarding the accuracy of responses, ChatGPT achieved a score of 92%, Gemini obtained 70%, and Bing Chat reached 58%. ChatGPT 4o achieved the highest �reproducible� score at 90%, followed by Gemini at 86% and Bing Chat at 72%.
DISCUSSION AND CONCLUSION: Our study highlighted that ChatGPT-4o is capable of generating valuable answers to patients� questions related to SVT. As NLPMs especially ChatGPT-4o continue to improve, they hold great potential for the management of chronic conditions like SVT.

Keywords: Artificial intelligence, Bing Chat, ChatGPT, digital health, Gemini, natural language processing chatbots, supraventricular tachycardia

Sorumlu Yazar: Tu�ba �etin, T�rkiye
Makale Dili: �ngilizce

ATIF KOPYALA

At�f dosyas� indir RIS EndNote BibTex Medlars Procite Reference Manager Yazara e-posta g�nder Benzer makaleler PubMed Google Scholar