“What Makes an LLM Trust Your Source?” başlıklı bildirimizin, IEEE Xplore üzerinde yayınlandığını paylaşmaktan mutluluk duyuyorum!
🚀 📌 Çalışmamız Ne Anlatıyor?
Günümüzde bilgiye erişim, geleneksel arama motorlarından ChatGPT ve Perplexity gibi üretken yapay zeka sistemlerine (LLM) doğru evriliyor. Bu durum, GEO (Generative Engine Optimization) kavramını hayati hale getirdi. Biz de bu çalışmada, GPT-4o modelinin hangi dilsel özellikleri (NLP features) taşıyan kaynakları daha sık referans gösterdiğini (cite ettiğini) 5.000 kontrollü gözlemle inceledik. 📉 Ezber Bozan Bulgularımız:Akademik ve geleneksel inanışın aksine, yoğun sayısal veri/istatistik içeren (V1) ve bol kaynak gösteren (V4) metinlerin LLM’ler tarafından seçilme olasılığı önemli ölçüde düşüyor. Buna karşın, Soru-Cevap (FAQ) yapısındaki ve yalın dille yazılmış içerikler en yüksek atıf oranlarına ulaşıyor. GEE model analizimiz, sayısal yoğunluğun ve resmi kaynak işaretçilerinin atıf olasılığını negatif etkilediğini doğruladı. Çalışmamız, mevcut GEO pratiklerinin ve içerik stratejilerinin yeniden gözden geçirilmesi gerektiğini gösteriyor.
Çalışmanın detaylarına ve tam metnine buradan ulaşabilirsiniz:https://ieeexplore.ieee.org/document/11537057
I am thrilled to share that our paper titled “What Makes an LLM Trust Your Source?”, co-authored with my esteemed advisor @Muhammet Baykara, has been published in IEEE Xplore! 🚀
📌 What is our study about? Information access practices are fundamentally shifting from traditional search engines toward generative AI systems (LLMs) like ChatGPT and Perplexity. This evolution makes Generative Engine Optimization (GEO) increasingly crucial. In this study, we investigated which linguistic features (NLP features) influence GPT-4o’s source citation choices across 5,000 controlled observations.
📉 Our Counter-Intuitive Findings:
Contrary to conventional wisdom and traditional academic beliefs, statistics-dense content (V1) and citation-rich texts (V4) significantly decrease the likelihood of being cited by LLMs.
On the other hand, FAQ-structured content and plain prose achieve the highest citation rates.
Our GEE model analysis confirmed that numeric density and explicit source citation markers negatively affect citation probability.
Our findings suggest that current GEO practices and content optimization strategies need to be thoroughly reconsidered.
You can access the full paper and check out the details here:
🔗 https://ieeexplore.ieee.org/document/11537057
Muhammet Baykara Fırat Üniversitesi
#ICHORA #IEEEXplore #GenerativeEngineOptimization #GEO #LLM #NLP #FiratUniversity #ArtificialIntelligence #YapayZeka #InformationRetrieval #NaturalLanguageProcessing
GEO, LLM, NLP, IEEE, xplore, ichora, sempozyum, AI, Yapay zekâ, Doğal dil işleme,
İlk Yorumu Siz Yapın