Google’ın Yeni Chatbot’u ABD Tıp Sınavını Geçti (Ama Sadece) : ScienceAlert


Google’ın yapay zeka destekli tıbbi sohbet robotu, zorlu bir ABD tıbbi lisanslama sınavında geçer not aldı, ancak Çarşamba günü yapılan hakemli bir araştırmaya göre, yanıtlar hala insan doktorlardan yetersiz kalıyor.

Geçen yıl, OpenAI geliştiricisi Google’ın rakibi Microsoft tarafından desteklenen ChatGPT’nin piyasaya sürülmesi, gelişen yapay zeka alanında teknoloji devleri arasında bir yarış başlattı.

AI’nın gelecekteki olasılıkları ve tehlikeleri hakkında çok şey yapılmış olsa da, sağlık, teknolojinin halihazırda somut ilerleme gösterdiği bir alandır; algoritmalar, belirli tıbbi taramaları insanların yanı sıra okuyabilir.

Google ilk olarak tıbbi soruları yanıtlamak için AI aracını tanıttı. Med-PaLMiçinde Aralık ayında ön baskı çalışması. ChatGPT’den farklı olarak, halka açıklanmamıştır.

ABD teknoloji devi Med-PaLM’nin ABD Tıbbi Lisanslama Sınavını (USMLE) geçmek için büyük miktarda insan yapımı metin üzerinde eğitilmiş bir yapay zeka tekniği olan ilk büyük dil modeli olduğunu söylüyor.

Amerika Birleşik Devletleri’nde tıp öğrencileri ve stajyer hekimlerin girdiği sınavda geçme notu yüzde 60 civarında.

​Şubat ayında yapılan bir araştırma, ChatGPT’nin geçer veya geçmeye yakın sonuçlar elde ettiğini söyledi.

Hakemli bir çalışmada dergide yayınlandı Doğa Çarşamba günü, Google araştırmacıları Med-PaLM’nin USMLE tarzı çoktan seçmeli sorularda yüzde 67,6’ya ulaştığını söyledi.

Çalışma, “Med-PaLM cesaret verici bir performans sergiliyor, ancak klinisyenlerden daha düşük seviyede kalıyor” dedi.

Google, “halüsinasyonları” (AI modellerinin yanlış bilgi sunduğu durumlara verilen ad) belirlemek ve azaltmak için yeni bir değerlendirme ölçütü geliştirdiğini söyledi.

Bir Google araştırmacısı ve yeni çalışmanın baş yazarı olan Karan Singhal, AFP’ye ekibin karşılaştırmayı modellerinin daha yeni bir sürümünü “süper heyecan verici” sonuçlarla test etmek için kullandığını söyledi.

Med-PaLM 2, USMLE sınavında yüzde 86,5’e ulaşarak, önceki sürümü yaklaşık yüzde 20 geride bırakarak, Mayıs ayında yayınlanan ve hakem denetiminden geçmemiş bir ön baskı çalışmasına göre.

Odadaki fil

Birleşik Krallık’taki Bath Üniversitesi’nde araştırmaya dahil olmayan bir bilgisayar bilimcisi olan James Davenport, yapay zeka destekli bu tıbbi sohbet robotları için “odada bir fil var” dedi.

Gerçek sağlık sorunlarının teşhis ve tedavisini içeren “tıbbi soruları yanıtlamakla gerçek tıp” arasında büyük bir fark var” dedi.

Birleşik Krallık’taki Leeds Üniversitesi’nde yapay zeka uzmanı olan Anthony Cohn, halüsinasyonların istatistiksel doğaları nedeniyle bu tür büyük dil modelleri için muhtemelen her zaman bir sorun olacağını söyledi.

Cohn, bu nedenle, bu modellerin “nihai karar vericiler yerine her zaman yardımcılar olarak görülmesi gerektiğini” söyledi.

​Singhal, gelecekte Med-PaLM’nin doktorları başka türlü düşünülemeyecek alternatifler sunma konusunda desteklemek için kullanılabileceğini söyledi.

Wall Street Journal, bu haftanın başlarında Med-PaLM 2’nin Nisan ayından bu yana prestijli ABD Mayo Clinic araştırma hastanesinde test edildiğini bildirdi.

Singhal, belirli ortaklıklar hakkında konuşamayacağını söyledi.

Ancak herhangi bir testin “klinik veya hastaya dönük veya hastalara zarar verebilecek” olmayacağını vurguladı.

Bunun yerine, “düşük risklerle nispeten kolayca otomatikleştirilebilen daha fazla idari görevler” için olacağını da sözlerine ekledi.

© Agence France-Presse



Kaynak : https://www.sciencealert.com/googles-new-chatbot-passed-the-us-medical-exam-but-only-just

Yorum yapın

SMM Panel PDF Kitap indir