Amaç

Türkçe Ulusal Derlemi (TUD) günümüz Türkçe’sinin dengeli, büyük ölçekli (50 milyon sözcük) ve genel amaçlı bir derlemi olacak biçimde tasarlanmıştır. Bu amaçla, daha önce başka dillerde yapılmış olan derlem oluşturma çabaları ve deneyimlerinden de yararlanılmıştır. Bu bağlamda, TUD’un oluşturulması sırasında, genel olarak Britanya Ulusal Derlemi’nin yapısı örnek alınmış ve Türkçe için gerekli durumlarda değişikliklere gidilmiştir. TUD’un tüm oluşturma aşamalarında çeşitli açık-erişimli araçlar kullanılmış ve oluşturulan Derlemin de araştırmacılara ve ticari olmayan kullanımlara açık ve erişilebilir olması hedeflenmiştir.

TUD Sürüm 3.0 50 milyon sözcükten oluşan, 24 yıllık bir dönemi (1990- 2013) kapsayan, günümüz Türkçesinin çok sayıda farklı alan ve türlerden yazılı ve sözlü örneklerini içeren, geniş kapsamlı, dengeli ve temsil yeterliliğine sahip, genel amaçlı bir referans derlemdir. Kullanıcılar çok çeşitli kısıtlama ölçütleri ile (medya, metin örneklemi, konu alanı, türev metin biçimi, yazar cinsiyeti, hedef okur ve metin türü vb.) sorgularını gerçekleştirebilirler. Ayrıca TUD 3.0 sürümünde kullanıcılar sözcük türüne ve eklere göre de sorgu yapabilmekte; çoksözcüklü birimleri arayabilmektedir. Ayrıca sorgularını düzenli ifadeler olarak da gönderebilmektedir.

TUD v3.0 Yenilikler

1. Derlem metinleri başsözcüklere (lemma) ayrıldı ve sözcük türlerine göre işaretlendi.

2. Sorgulamalarda çeşitlilik sağlandı.

Standart (temel) arama: Sözcükbirimlerin (token) sorgulanması

Biçimbirim arama: Başsözcük yazıp ardından onun ait olduğu sözcük türünü seçerek sorgulama

Biçimbirim arama: Aranacak biçimbirimin Derlemdeki kısalma(larını) kullanarak sorgulama

Benzer yapı arama: Yazılan sözcükbirimin benzerlerini sorgulama

3. Düzenli ifadelerlerle sorgu yapabilme.

4. Çoksözcüklü ifadeleri sorgulayabilme.

5. Bağımlı dizinlerin tümce biçiminde görünümüne ulaşmak.

6. Bağımlı dizinler üstünde bir başka sözcüğü arayabilme.

7. Verinin dışa aktarım olanaklarındaki çeşitlilik.

8. Sözlü veri üzerinde sorgulama yapabilme.

9. Kısa sürede, dinamik ve eşzamanlı sonuç döndürme.