Yapay zekâ, gazetecilik dilini giderek daha tekrarlayıcı ve tahmin edilebilir hale getiriyor; bu ise hepimiz için önemli bir sorun yaratıyor. Basında, internette ve sosyal medyada yayımlanan metinlerin giderek daha büyük bir bölümünün makineler tarafından yazılması, yalnızca gazetecilik mesleğini değil, aynı zamanda gerçekliği anlamak, tanımlamak ve tartışmak için kullandığımız dilin zenginliğini de etkiliyor.

Tarihsel olarak basın, kamusal dilin geliştiği ve zenginleştiği başlıca alanlardan biri olmuştur. Elbette dilsel dönüşümün tek belirleyicisi değildir; ancak yeni kelimelerin, deyimlerin ve olayları anlatma biçimlerinin toplum içinde dolaşıma girdiği önemli mecralardan biridir.

Gazetecilik dili ve yeni sözcükler üzerine yapılan çalışmalar, özellikle toplumsal olayların, teknolojik gelişmelerin ve sosyal değişimlerin geniş kitlelere aktarılması sürecinde gazetelerin yeni kelime dağarcığının oluşumu ve yayılması açısından önemli bir rol oynadığını açıkça göstermektedir.

Ancak gazetecilik üretiminin önemli bir kısmı üretken yapay zekâya devredildiğinde, bu rol giderek zayıflamaktadır. Büyük dil modelleri (LLM’ler), genellikle bir metindeki sonraki kelimeyi ya da “token”ı tahmin ederek çalışır. Bu yöntem, akıcı ve ikna edici metinler üretmelerini sağlar; ancak aynı zamanda yerleşik kalıplara, yaygın ifadelere ve istatistiksel düzenliliklere öncelik verme eğilimini de beraberinde getirir.

Bu durum tek başına dili değersizleştirmez. Sorun, bu mantığın kamusal alandaki yazılı üretime hâkim olmaya başlamasıyla ortaya çıkar.

Yapay zekâ geri bildirim döngüsü

Riskler, yapay zekâ sistemlerinin daha önce yine yapay zekâ tarafından üretilmiş metinlerle eğitilmeye başlamasıyla daha da büyür. Birçok araştırmanın “model çökmesi” olarak tanımladığı bu süreçte, bir model tarafından üretilen içerikler sonraki modellerin eğitim verilerini kirletir ve dejeneratif bir döngü oluşur.

Basitçe söylemek gerekirse, yapay zekâ sistemleri giderek daha fazla sentetik metinden öğrenmeye başlar. Eğer bu metinler çevrimiçi ve çevrimdışı kamusal alanı yoğun biçimde doldurursa, gelecekteki eğitim süreçlerinde kullanılacak sözel ekosistem çok daha sınırlı hâle gelir.

Yapay metinlerin yaygınlaşması, insan diline özgü sosyal çeşitlilikle temasın azalması anlamına gelir. Bu durum ise pek çok alanda dilsel gerilemeye yol açabilir.

Ayrıca mevcut önyargılar ve kalıplaşmış düşünceler de güçlenebilir. Veri çeşitliliği azaldığında ve yerleşik kalıplar baskın hâle geldiğinde, eğitim materyallerindeki önyargılar düzeltilmek yerine yeniden üretilir ve pekiştirilir. LLM önyargılarının evrimi üzerine yapılan çalışmalar, tekrar eden süreçlerin bakış açılarını genişletmek yerine mevcut önyargıları büyütebildiği konusunda uyarıda bulunmaktadır.

Bunun yanında yazı dili de giderek daha homojen ve tekrarlayıcı bir yapıya bürünmektedir. Sözdizimsel kalıplar sürekli yinelenmekte; nötr ton, klişeleşmiş ifadeler ve tahmin edilebilir paragraf yapıları öne çıkmaktadır. Bu durum özellikle gazetecilik açısından önemlidir. Çünkü basın yalnızca bilgi aktaran bir alan değildir; aynı zamanda uzmanlık dili ile gündelik dil arasında aracılık yapar, hangi vurgunun öne çıkarılacağını belirler, teknik kavramları anlaşılır hâle getirir ve yeni ifade biçimlerinin dolaşıma girmesini sağlar.

Kamusal dil aşırı derecede tekdüze hâle geldiğinde, gazeteciliğin yeni gelişmelere yanıt olarak dili dönüştürme ve yenileme kapasitesi de sınırlanır.

Dilsel yeniliğin aşınması

Bakan Çiftçi: “Vatandaşlarımızın güvenliği için tüm ekiplerimizle sahadayız”
Bakan Çiftçi: “Vatandaşlarımızın güvenliği için tüm ekiplerimizle sahadayız”
İçeriği Görüntüle

Tüm bunlar; alışılmadık veya özgün kelimelerin, daha az yaygın dil yapılarının ve pragmatik nüansların azalmasına yol açar. İroni, belirsizlik, çok katmanlı anlatım ve farklı bakış açıları gibi unsurlar giderek geri plana itilir.

Yapay zekâ eğitiminde sentetik metin kullanımının artması, performans düşüşü ve insan dilindeki çeşitliliğin daha dar bir çerçevede temsil edilmesiyle de ilişkilendirilmektedir. Başka bir ifadeyle sistem, merkeze daha iyi odaklanırken dilin kenarlarında gelişen yenilikleri gözden kaçırır.

Oysa dildeki birçok yenilik, başlangıçta düzensiz bir sapma, beklenmedik bir kelime kullanımı ya da yeni bir olguyu tanımlamanın yerel bir yolu olarak ortaya çıkar. Sistem sürekli olarak istatistiksel açıdan en olası seçeneği tercih ettiğinde, yeni dil biçimlerinin dolaşıma girmesi ve yerleşmesi için daha az alan kalır.

Bu mesele, insan ile makine arasında soyut bir karşıtlık olarak değil; insan toplumunun rastlantısal ve canlı dil üretimi ile önceden öğrenilmiş düzenliliklerden türetilen metinsel çıktı arasındaki somut fark olarak değerlendirilmelidir.

Bozulan kamusal dil ekosistemi

Sorun yalnızca daha az farklı kelime kullanılması değildir. Asıl mesele, ince ayrımlar yapabilme kapasitesinin zayıflamasıdır. Dil daha belirsiz, daha tahmin edilebilir ve daha tekrarlayıcı hâle geldikçe; toplumların sorunları tanımlamak, görüşleri netleştirmek ve kamusal tartışmalara katılmak için kullandığı araçlar da yoksullaşır.

Daha geniş bir perspektiften bakıldığında mesele, yalnızca bu verilerle eğitilen yapay zekâ modellerinin geleceği değildir. Aynı zamanda kamusal dil ekosisteminin nasıl dönüşeceğiyle ilgilidir. İnternet sentetik metinlerle dolduğunda, okuyucular, gazeteciler ve kurumlar daha az çeşitli bir kamusal dile maruz kalacaktır.

Bazı araştırmalar, sentetik metinlerin çevrimiçi ekosistemi “kirlettiğini” ileri sürmekte; gerçek veriler ile yapay verilerin nasıl ayrıştırıldığı konusunun, daha büyük bir dilsel gerilemeyi önlemek açısından kritik olduğunu göstermektedir.

Yine de tüm tablo karamsar değildir. Araştırmalar, yapay zekânın her kullanımının kaçınılmaz biçimde çöküşe ya da gerilemeye yol açmadığını göstermektedir. Bazı çalışmalar, sentetik verilerin gerçek verilerle tamamen yer değiştirmesi yerine dengeli biçimde harmanlanması durumunda, model çökmesinin aynı ölçüde gerçekleşmediğini ve hata oranlarının kontrol altında tutulabildiğini ortaya koymaktadır.

Başka bir ifadeyle sorun, yapay zekânın sınırlı ve destekleyici biçimde kullanılmasında değildir. Sorun, insan yazısının kitlesel ölçekte ikame edilmesi ve bu yapay üretimin canlı bir dilin yerine geçirilmesinde ortaya çıkmaktadır.

Gazeteciliğin kamusal sorumluluğu

Yapay zekâ gazetecilerin çalışma hayatının giderek daha fazla parçası hâline geliyor ve bu durum üretim süreçlerini hızlandırıyor. Ancak kamusal alanda dolaşan dil daha tekdüze, daha tahmin edilebilir ve yeniliğe daha kapalı hâle geldiğinde, toplumun ne kaybedeceği sorusu önem kazanıyor.

Basın; yalnızca haber yazan değil, aynı zamanda dili dönüştüren, çeviren, yeni kavramları dolaşıma sokan ve topluma yeni ifade biçimleri öğreten bir alandır. Gazeteciliğin bu işlevinden kısmen bile vazgeçmesi, yalnızca gazetecilerin çalışma biçimini değiştirmekle kalmayacak; kamusal dilin kendini yenileyebildiği, zenginleştirebildiği ve geliştirebildiği alanlardan birinin de zayıflamasına yol açacaktır.

Xosé López-García

Periodismo digital, comunicación digital, Universidade de Santiago de Compostela

Cristian Augusto Gonzalez Arias

Investigador, Pontificia Universidad Catolica de Valparaiso; Universidade de Santiago de Compostela

Muhabir: Güven BOĞA